개요
- imputation, data imputation, missing-data imputation
- 算入, data 算入, data 대체
- 산입, 데이터 산입, 대체, 대치, 데이터 대체, 결측값 대체
- 입력데이터에서 누락된 값을 적절히 보충하는 일
- 불완전한 데이터가 있을 때 표준이나, 대표성이 있는 다른 데이터를 활용하여 대체 될 수 있는 값들로 계산하여 입력하는 과정
- 데이터 분석 중, 컴퓨터 프로그램이 죽거나, 치우침을 주는 분석의 오류를 최대한 줄이기 위해, 일종의 가짜 데이터를 산술적으로 집어 넣은 것
사례
- 인구조사 자료 보충
- 손상된 고객 데이터 보총
- 불완전한 환자의 의료 데이터 기록 보충
- (게놈연구) 유전자 서열들중에서 해독이 잘 안되어 빠져 있는 경우, 유전자 변이로 처리를 하기가 어렵기 때문에, 산입을 많이 한다고 한다.