강좌 안내

서울대학교 통계학과 교수와 함께하는 제62차 IDIS 공개강좌

 – 데이터 사이언스의 기초부터 실전까지, 겨울방학을 알차게!

서울대학교 과학데이터혁신연구소(통계상담 교육센터)에서는 2026년 겨울, 62차 공개강좌를 새롭게 개편하여 운영합니다.
데이터 분석의 기초를 탄탄히 다지고, 실전 응용력을 키울 수 있는 이번 프로그램에 많은 관심과 참여 바랍니다
.

 

 

기초강좌1. 통통한 데이터분석(R/Python 1)

 

– 통계학 기반의 탄탄한 기초, 실전 데이터 분석 역량을 한 주 만에! –

제62차 IDIS 공개강좌의 기초강좌는 통계학 기초와 데이터 과학의 입문을 체계적으로 다지고자 하는 분들을 위한 집중형 교육 과정입니다. 통계적 사고를 기반으로 데이터 처리, 시각화, 회귀분석, 통계적 추론, 모델 진단 등 필수 내용을 일주일 동안 밀도 있게 학습하며, R 또는 Python 중 하나를 선택하여 실제 빅데이터를 직접 분석하는 실습을 진행합니다.

이 강좌는 서울대학교 통계학과 교수진의 노하우가 담긴 통일된 강의자료를 기반으로 운영됩니다.

 

(1) 이런 분들께 추천합니다

– 짧은 시간 안에 데이터 분석의 핵심을 배우고 싶은 바쁜 직장인, 대학(원)생, 연구자

– R 또는 Python을 활용한 데이터 분석을 처음 배우는 분

– 이론과 실습을 균형 있게 배우고 싶은 분

– 기계학습 등 심화 강좌 수강 전, 통계 기반 기초를 탄탄히 다지고 싶은 분

– 일주일 집중 공략으로 통계적 데이터 분석 역량을 빠르게 확보하고자 하는 분

 

(2) 운영기간

– 본 강의: 2026년 1월 26일(월)–1월 30일(금), 9:30-12:30(이론), 14:00-17:00(실습)

– 0일차 부트캠프(선택): 1월 24일(토), 13:00–17:00

 

(3) 장소

– 오전 이론 강의: 대형 강의실 (공통)

– 오후 실습 강의: R/Python 분반 실습실

 

(4) 강의 커리큘럼

일차 강의 주제 강의 내용
0일차 R / Python의 기초

RStudio / Anaconda 설치, 기본 문법,

파일 입출력, 데이터 유형, 제어문, 함수 작성

1일차 데이터와 시각화 tidyverse & ggplot / pandas & seaborn
2일차 모델링 I 선형회귀분석/비모수회귀분석
3일차 모델링 II 로지스틱 회귀, CART, 신경망
4일차 추론 추정, 신뢰구간, 가설검정, 붓스트랩
5일차 패턴 탐색 변수선택, 차원축소, 군집분석

 

(5) 강사진

김지수, 신예은, 임채영, 정성규 교수(서울대학교 통계학과)

 

(6) 수강정보
– 수강 방식: R 또는 Python 중 택일

– 수강 조건: 5일 전일 수강 필수(패키지 형태)

– 수료증: 전일 출석 시 수료증 발급

– 노트북 지참 필수

– 0일차 부트캠프: R/Python 완전 초보자는 참석 권장 (무료 제공, 조교 진행)

 

기초강좌2. 처음 만나는 통계학(SPSS)

 

– SPSS로 시작하는 통계학 입문 –

본 강좌는 통계학을 처음 접하는 분들에게 통계학의 기본 원리와 사용자 친화적인 통계소프트웨어인 SPSS(Statistical Package for the Social Sciences)를 활용하여 코딩에 부담을 느끼지 않으면서 통계학의 기본 원리를 데이터분석에 적용할 수 있는 능력을 통합적으로 습득하는 데 중점을 둡니다.

 

(1) 이런 분들께 추천합니다.

  • -데이터 분석을 처음 시작하는 분: 
  •   코딩 없이 통계분석이 가능한 SPSS 사용법부터 기초적인 데이터 분석 원리까지, 쉽고 체계적으로 배우고 싶은 대학(원)생, 직장인
  • -논문/보고서 작성을 앞둔 분: 연구 설계, 설문 데이터 수집 후 직접 통계분석을 수행하여 신뢰성 있는 결과를 도출해야 하는 연구자
  • -직무 역량 강화를 원하는 직장인: 
  •   마케팅, 인사, 기획 등 다양한 분야에서 데이터를 기반으로 의사결정하고, 분석 결과를 보고서에 효과적으로 활용하고 싶은 분

 

(2) 운영기간

– 본 강의: 2026년 2월 9일(월)-2월 13일(금) / 9:30-12:30(이론), 14:00-17:00(실습)

 

(3) 장소

– 오전 이론 강의실 / 오후 실습 강의실

 

(4) 강의 커리큘럼

일차 강의 주제 강의 내용
1일차 통계학입문, 확률, 확률분포

탐색적 자료분석, 확률의 정의, 조건부 확률 및 베이즈 정리, 확률변수 및 확률분포의 정의,

이항분포 및 정규분포

2일차 표본분포 표본추출방법론, 표본분포의 정의, 중심극한 정리
3일차 추정과 검정

점추정 및 구간 추정, 통계적 가설검정 입문,

일표본, 이표본 가설검정 방법

4일차 범주형자료분석, 회귀분석

적합도 검정, 분할표 분석, 최소제곱 추정량 및 추론, 다중회귀분석 입문,

최소제곱 추정량 및 변동의 분해

5일차

분산분석,

설문지 작성 및 분석

분산분석모형 소개, 변동의 분해 및 추론,

설문조사 방법, 신뢰성 분석

(5) 강사진

김용대(서울대학교 통계학과 교수), 한상미(서울대학교 학부대학 교육운영개발센터 강의교수)

 

(6) 수강정보

– 수강 조건: 5일 전일 수강 필수(패키지 형태)

– 수료증: 전일 출석 시 수료증 발급

 

심화강좌1. 기계학습과 딥러닝(Python)

 

– Python을 기반으로 배우는 현대 데이터 과학의 핵심 기술 –

기초강좌 수료자 및 Python 기반 분석 역량을 갖춘 참가자를 대상으로 구성된 본 과정은 기계학습과 딥러닝의 핵심 이론과 실습을 4일간 집중적으로 제공합니다. 분류/회귀, 성능평가, 인공신경망, 딥러닝 모델의 구조와 학습 전략, 생성모형 등을 실제 사례 중심으로 학습하며, Python을 활용한 실습을 통해 실전 응용력을 강화합니다. 본 강좌는 데이터 기반 의사결정과 모델링을 체계적으로 학습하고자 하는 연구자, 대학원생, 산업계 실무자 모두에게 적합합니다.

 

(1) 이런 분들께 추천합니다

– 일주일 집중 공략을 원하는 바쁜 현대인

– Python 기반 데이터 분석 경험이 있는 분

– 기계학습과 딥러닝 이론과 실습을 체계적으로 배우고 싶은 분

– 연구나 업무에서 ML/DL을 직접 활용하고자 하는 분

 

(2) 운영기간

– 본 강의: 2026년 2월 2일(월)–2월 5일(목) / 9:30-12:30(이론), 14:00-17:00(실습)

 

(3) 장소

– 오전 이론 및 실습 강의: Python 전용 강의실

 

(4) 강의 커리큘럼

일차 강의 주제 강의 내용
1일차 기계학습 I 변수선택, 벌점화 회귀모형(Ridge, Lasso 등)
2일차 기계학습 II 의사결정나무, 앙상블, SVM
3일차 딥러닝 I 신경망 기초, 이미지 분석
4일차 딥러닝 II 텍스트 분석, 심층생성모형

(5) 강사진

김용대, 장원 교수(서울대학교 통계학과)

 

(6) 수강정보

– 수강 조건: 전체 패키지 수강(1-4일차 필수)

– 수료증: 전일 출석 시 수료증 발급

– 노트북 지참 필수
– 수강전제 : 기초강좌(Python) 수강자 또는 동등 수준의 Python/기초통계 지식 보유자

  •  

심화강좌2. 보건의료통계강좌(SAS,R)

 

이 강좌는 보건·의료 데이터를 분석하기 위해 필요한 이론, 응용, 그리고 실습을 3일간 집중적으로 제공합니다. 참가자는 연구에 활용할 수 있는 다양한 공공데이터의 종류를 살펴보고, 데이터를 추출하여 분석 가능한 형태로 가공하는 방법을 SAS와 R을 이용하여 학습합니다. 또한, 이분형(binary) 및 time-to-event 결과변수를 다루는 통계 방법(로지스틱 회귀분석, 생존분석)과 기계학습 기법을 배우고, R을 활용하여 실습합니다. 아울러, real-world data 분석의 한계를 보완하기 위한 성향점수분석(propensity score analysis) 방법을 익히고 이를 실제 데이터에 적용해보는 시간을 갖습니다.

 

(1) 이런 분들께 추천합니다.

-보건학, 의학 연구에 자주 쓰이는 통계 모형 및 기계학습 기법을 이해하고 싶은 분

-보건·의료 데이터를 직접 분석하여 연구에 활용하고 싶은 분

-관찰연구자료에 인과추론 기법을 적용하고 싶은 분

-토픽 별로 별도로 등록하여 수강하실 수 있어, 필요한 분야의 최신 분석기법을 최고 전문가에게 전문적으로 배우고 싶은 분

 

(2) 운영기간

-본 강의: 2026년 2월 6일(금), 2월 9일(월), 2월 13일(금) / (오전)9:30-12:30, (오후)14:00-17:00/ 이론, 실습 통합 진행

 

(3) 장소

– R 전용 강의실

 

(4) 강의 커리큘럼

일차 강의 주제 강의 내용
1일차 공공의료정보시스템

공공의료데이터시스템 소개, 국민건강보험공단 빅데이터 DB 구조, 데이터 추출 및 정제,

코호트 구축, R 실습

2일차 의료 데이터를 위한 모델링

로지스틱 회귀분석, 생존분석,

기계학습(Ridge, LASSO, random forest 등)

3일차 성향점수를 이용한 보건의료자료 분석

성향점수, 역확률 가중치(IPW), 매칭, 인과추론,

방향성 비순환 그래프(DAG)

(5) 강사진

이우주(서울대학교 보건대학원 교수), 박서영, 안형미(한국방송통신대학교 통계데이터과학과 교수)

 

(6) 수강정보

– 수강 방식 : 1, 2, 3 개별 선택 가능

– 수강 전제: 기초강좌(R) 수강자 또는 동등 수준의 R/기초통계 지식 보유자

– 노트북 지참 필수

 

※ 강좌별 링크를 클릭하면 해당 수강신청 페이지로 이동합니다.

서울대학교 과학데이터혁신연구소 제62차 기초강좌1 통통한 데이터분석(R/Python 택1) 수강신청

서울대학교 과학데이터혁신연구소 제62차 기초강좌2 처음 만나는 통계학(SPSS) 수강신청

서울대학교 과학데이터혁신연구소 제62차 심화강좌1 기계학습과 딥러닝(Python) 수강신청

서울대학교 과학데이터혁신연구소 제62차 심화강좌2 보건의료통계1(공공의료정보시스템) 수강신청

서울대학교 과학데이터혁신연구소 제62차 심화강좌2 보건의료통계2(의료 데이터를 위한 모델링) 수강신청

서울대학교 과학데이터혁신연구소 제62차 심화강좌2 보건의료통계3(성향점수를 이용한 보건의료자료 분석) 수강신청