1 개요[ | ]
- 일반화 부족
- 통계모델이 다른 상황에 일반화되지 못하는 것
- 기계학습에서 데이터에 대한 학습이 너무 많이 수행되는 현상
- 통계모델이 과도하게 샘플데이터 맞춤형으로 만들어져 오히려 현실과 맞지 않게 되는 일
- 통계모델에 매개변수가 너무 많은 경우, 샘플데이터 수에 비해 모델이 복잡하고 예측력이 떨어진다.
- 생성된 모델이 훈련 데이터와 지나치게 일치하여, 새 데이터를 올바르게 예측하지 못하는 경우이다.
- 모델이 트레이닝셋에 너무 최적화되어 있어서, 실제모델(현실적으로는 테스트셋)과 맞지 않게 되는 것이다.
- 학습 대상 데이터에 대한 오차는 감소하지만, 실제 사례에 적용할 경우 오차가 증가하는 문제를 수반한다.
2 방지 방법[ | ]
- 더 많은 트레이닝 데이터 확보
- 피쳐 수 감소
- 정규화
3 같이 보기[ | ]
4 참고[ | ]
편집자 Jmnote
로그인하시면 댓글을 쓸 수 있습니다.