"데이터 전처리"의 두 판 사이의 차이

15번째 줄: 15번째 줄:
* 피벗
* 피벗
* 언피벗
* 언피벗
* 정규화


==같이 보기==
==같이 보기==

2020년 4월 6일 (월) 23:00 판

1 개요

data pre-processing, data preprocessing
data 前處理
데이터 전처리, 전처리
  • 데이터 마이닝 절차에서 중요한 단계
  • 분석에 적합하게 데이터를 가공하는 작업
  • 데이터의 특성을 파악하여 잘못된 부분을 바로잡고 분석에 적합한 데이터로 가공하는 과정
  • 특정 분석이나 처리 업무 시 그 기능을 충분히 발휘하고 안정적인 결과를 확보하기 위해서 앞 단에 자료를 적정한 상태로 준비하거나 처리하는 방법
  • 데이터를 분석할 때 주 처리를 실행하기 전에 현재 주목하고자 하는 부분을 선정하거나 패턴을 정형화하여 불필요한 정보를 분리하는 등 예비적인 조작을 하는 것

2 유형

  • 필터링 (대략 SQL WHERE)
  • 결측치 처리
  • 이상치 처리
  • 피벗
  • 언피벗
  • 정규화

3 같이 보기

4 참고

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}