"데이터 전처리"의 두 판 사이의 차이

15번째 줄: 15번째 줄:
| 행 결합
| 행 결합
| [[R 데이터프레임 행 결합]]
| [[R 데이터프레임 행 결합]]
| [[Pandas 데이터프레임 행 결합]]
| [[Pandas 데이터프레임 행 병합]]
| [[SQL UNION]]
| [[SQL UNION]]
|-
|-
| 열 결합
| 열 결합
| [[R 데이터프레임 열 결합]]
| [[R 데이터프레임 열 병합]]
|
|
|  
|  

2020년 4월 7일 (화) 19:24 판

1 개요

data pre-processing, data preprocessing
data 前處理
데이터 전처리, 전처리
  • 데이터 마이닝 절차에서 중요한 단계
  • 분석에 적합하게 데이터를 가공하는 작업
  • 데이터의 특성을 파악하여 잘못된 부분을 바로잡고 분석에 적합한 데이터로 가공하는 과정
  • 특정 분석이나 처리 업무 시 그 기능을 충분히 발휘하고 안정적인 결과를 확보하기 위해서 앞 단에 자료를 적정한 상태로 준비하거나 처리하는 방법
  • 데이터를 분석할 때 주 처리를 실행하기 전에 현재 주목하고자 하는 부분을 선정하거나 패턴을 정형화하여 불필요한 정보를 분리하는 등 예비적인 조작을 하는 것

2 유형

처리 R 데이터 전처리 Python 데이터 전처리 비고
행 결합 R 데이터프레임 행 결합 Pandas 데이터프레임 행 병합 SQL UNION
열 결합 R 데이터프레임 열 병합
조인(join)
필터링 SQL WHERE
결측치 처리
이상치 처리
피벗
언피벗
정규화
시계열 밀당

3 같이 보기

4 참고

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}