2015-06-25 18:24

Spark로 빅데이터 입문, 4주차 노트

4주차. 데이터 품질, 탐헌적 데이터 분석과 머신 러닝
Lecture 7. 데이터 품질
데이터 클리닝
왜곡: 처리과정에서 변질된 표본들
선택편견: 값에 따른 표본의 가능도(likelihood)
좌우검열: 데이터가 무한대일 때 시작...
spark
bigdata
000

댓글