3과목(데이터 분석) 3장 데이터 마트(ADsP) 2020
데이터 마트는 모델링을 함에 있어 핵심이 되는 파트이다. 데이터 마트의 질에 따라 모델링의 성패가 나누어 질 수도 있다.
본 과목에서는 데이터 마트에서 가장 중요한 변수인 요약변수와 파생변수의 정의와 예를 이해하고, 데이터 마트를 다루기 위한 R패키지들을 소개한다. reshape 패키지의 melt와 cast함수에서 sqldf, plyr 패키지의 다양한 기능들을 설명한다.
75등록한 수강생
이번 강의에서는
데이터 마트는 모델링을 함에 있어 핵심이 되는 파트이다. 데이터 마트의 질에 따라 모델링의 성패가 나누어 질 수도 있다.
본 과목에서는 데이터 마트에서 가장 중요한 변수인 요약변수와 파생변수의 정의와 예를 이해하고, 데이터 마트를 다루기 위한 R패키지들을 소개한다. reshape 패키지의 melt와 cast함수에서 sqldf, plyr 패키지의 다양한 기능들을 설명한다.
그리고 전처리 단계에서 중요한 결측지와 이상치의 처리방법을 이해하고 중요한 변수를 찾는 변수 선택 방법에 대해서 학습하고 R 프로그램으로 처리 할 수 있다.
강의 커리큘럼
제1절 데이터 변경 및 요약 | |||
1. R reshape를 이용한 데이터 마트 개발 | 00:32:00 | ||
2. reshape 패키지 실습 | 00:21:00 | ||
3. sqldf / plyr / data.table 패키지 실습 | 00:36:00 | ||
제2절 데이터 가공 | |||
1. 데이터 가공 / 변수 중요도 | 00:15:00 | ||
2.변수 구간화 / R 실습 | 00:20:00 | ||
제3절 기초 분석 및 데이터 관리 | |||
1. 결측값 처리 | 00:22:00 | ||
2. R을 활용한 결측값 처리 | 00:15:00 | ||
3. 이상값 처리 | 00:19:00 | ||
4. R을 활용한 이상값 처리 / 예상문제 및 정리하기 | 00:25:00 |
수강 후기
이 강의에 대한 후기가 아직 없습니다.