과적합

1 개요[편집]

overfitting
과적합, 과잉적합, 과최적화, 오버피팅
  • 통계모델이 다른 상황에 일반화되지 못하는 것
  • 통계모델이 과도하게 샘플데이터 맞춤형으로 만들어져 오히려 현실과 맞지 않게 되는 일
  • 통계모델에 매개변수가 너무 많은 경우, 샘플데이터 수에 비해 모델이 복잡하고 예측력이 떨어짐
  • 모델이 트레이닝셋에 너무 최적화되어 있어서, 실제모델(현실적으로는 테스트셋)과 맞지 않게 되는 것

300px-Overfit.png

300px-Overfitted_Data.png

300px-Overfitting.svg.png

2 방지 방법[편집]

  • 더 많은 트레이닝 데이터 확보
  • 피쳐 수 감소
  • 정규화

3 같이 보기[편집]

4 참고[편집]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}