3과목(데이터 분석) 3장 데이터 마트(ADsP) 2020

데이터 마트는 모델링을 함에 있어 핵심이 되는 파트이다. 데이터 마트의 질에 따라 모델링의 성패가 나누어 질 수도 있다.

본 과목에서는 데이터 마트에서 가장 중요한 변수인 요약변수와 파생변수의 정의와 예를 이해하고, 데이터 마트를 다루기 위한 R패키지들을 소개한다. reshape 패키지의 melt와 cast함수에서 sqldf, plyr 패키지의 다양한 기능들을 설명한다.

69등록한 수강생

이번 강의에서는

데이터 마트는 모델링을 함에 있어 핵심이 되는 파트이다. 데이터 마트의 질에 따라 모델링의 성패가 나누어 질 수도 있다.

본 과목에서는 데이터 마트에서 가장 중요한 변수인 요약변수와 파생변수의 정의와 예를 이해하고, 데이터 마트를 다루기 위한 R패키지들을 소개한다. reshape 패키지의 melt와 cast함수에서 sqldf, plyr 패키지의 다양한 기능들을 설명한다.

그리고 전처리 단계에서 중요한 결측지와 이상치의 처리방법을 이해하고 중요한 변수를 찾는 변수 선택 방법에 대해서 학습하고 R 프로그램으로 처리 할 수 있다.

강의 커리큘럼

제1절 데이터 변경 및 요약
1. R reshape를 이용한 데이터 마트 개발 00:32:00
2. reshape 패키지 실습 00:21:00
3. sqldf / plyr / data.table 패키지 실습 00:36:00
제2절 데이터 가공
1. 데이터 가공 / 변수 중요도 00:15:00
2.변수 구간화 / R 실습 00:20:00
제3절 기초 분석 및 데이터 관리
1. 결측값 처리 00:22:00
2. R을 활용한 결측값 처리 00:15:00
3. 이상값 처리 00:19:00
4. R을 활용한 이상값 처리 / 예상문제 및 정리하기 00:25:00

수강 후기

0

평가
  • 5 별점0
  • 4 별점0
  • 3 별점0
  • 2 별점0
  • 1 별점0

이 강의에 대한 후기가 아직 없습니다.

수강신청하기
  • 55,000 / 60 일
  • 2 개월

ADsP 2021 개정판

빅데이터분석기사

  • 실시간 1:1
    상담톡
  • 도서인증
  • 정오표
Template Design © JSDATA. All rights reserved.
X