일수 | 교육시간 | 교육내용 | 세부사항 |
<1차> 10.23.(수) R 기초 및 데이터 분석 환경 설정 | 13:00~14:00 | R 기초 문법 | R과 RStudio 설치 및 환경 설정 R 기본 문법 (변수, 자료형, 벡터, 리스트, 함수 등) 데이터 구조 (데이터프레임, 매트릭스, 리스트) |
14:00~15:00 | R 데이터 처리 패키지 | dplyr 패키지를 활용한 데이터 조작 (필터링, 정렬, 요약) 데이터프레임 생성 및 조작 데이터 불러오기 및 저장 (CSV, Excel) | |
15:00~16:00 | 데이터 전처리 | 결측치 처리 및 데이터 정리 데이터 변환 및 리코딩 기본 통계량 계산 | |
16:00~17:00 | 실습 | 간단한 데이터셋을 활용한 데이터 전처리 실습 | |
<1차> 10.24.(목) 데이터 분석 및 시각화 | 13:00~14:00 | 데이터 시각화 개요 | ggplot2 패키지 소개 기본적인 그래프 (막대그래프, 선그래프, 히스토그램) 생성 |
14:00~15:00 | 고급 시각화 기법 | 다변량 데이터를 활용한 시각화 (산점도, 상관 관계) 데이터의 분포 파악을 위한 시각화 | |
15:00~16:00 | 실습 | 다양한 데이터셋을 활용한 시각화 실습 시각화를 통해 데이터의 의미 파악하기 | |
16:00~17:00 | 데이터 분석 프로젝트 1 | 데이터셋 선택 및 분석 목표 설정 데이터 전처리 및 시각화 과정 계획 | |
<2차> 11.20.(수) 통계 분석 및 기계 학습 기초 | 13:00~14:00 | 통계 분석 기초 | 기초 통계량 계산 t-검정, 카이제곱 검정 등의 기초 통계 기법 |
14:00~15:00 | 회귀 분석 | 선형 회귀 분석 회귀 분석 결과 해석 모델 성능 평가
| |
15:00~16:00 | 분류 알고리즘 소개 | 로지스틱 회귀 K-최근접 이웃(KNN) 모델 훈련 및 평가 | |
16:00~17:00 | 실습 | 간단한 회귀 및 분류 문제 해결 R을 활용한 예측 모델 구축 및 분석
| |
<2차> 11.21.(목) 고급분석 및 최적화 | 13:00~14:00 | 비지도 학습 (Clustering) | K-평균 군집화 차원 축소 기법(PCA) 소개 및 응용 |
14:00~15:00 | 모델 성능 개선 및 최적화 | 모델 튜닝 (하이퍼파라미터 조정) 교차 검증을 활용한 모델 성능 평가 | |
15:00~16:00 | 실습 | 비지도 학습 및 모델 최적화 실습 최적화된 모델을 사용한 데이터 분석 및 예측 | |
16:00~17:00 | 최종 프로젝트 발표 및 토론 | 각자 선택한 데이터셋으로 최종 분석 결과 발표 결과 피드백 및 개선 방안 논의 |
과정명 | 강사 | 주요 경력 |
R을 활용한 데이터분석 교육 | 나성호 | 한양대학교 일반대학원 경영학과MIS전공 박사과정 수료 헬로데이터사이언스 대표 IGM세계경영연구원 겸임교수 aSSIST MBA객원교수 패스트캠퍼스 전임강사 “나성호의R데이터 분석 입문(골든래빗)”저자 |
구분 | 일정 | 강사 |
R를 활용한 데이터분석 | (1차) 10. 23.(수)~ 10. 24.(목) 13:00~17:00 | 나성호 |
(2차) 11. 20.(수)~ 11. 21.(목) 13:00~17:00 | ||
SPSS를 활용한 데이터분석 | (1차) 11. 4.(월)~ 11. 5.(화) 13:00~17:00 | 임우택 |
(2차) 11. 18.(월)~ 11. 19.(화) 13:00~17:00 | ||
Python를 활용한 데이터분석 | (1차) 11. 6.(수)~ 11. 7.(목) 13:00~17:00 | 김승욱 |
(2차) 11. 11.(월)~ 10. 12.(화) 13:00~17:00 |
사이트맵