"과적합"의 두 판 사이의 차이

잔글 (봇: 기계학습을(를) 머신러닝(으)로 분류 대체함)
 
(같은 사용자의 중간 판 12개는 보이지 않습니다)
1번째 줄: 1번째 줄:
==개요==
==개요==
;overfitting
;overfitting
;과적합, 과잉적합, 과최적화, 오버피팅
;[[過]][[適合]]
;과적합, 과적화, 과잉적합, 과최적화, 오버피팅
* [[일반화]] 부족
* 통계모델이 다른 상황에 일반화되지 못하는 것
* 통계모델이 다른 상황에 일반화되지 못하는 것
* 기계학습에서 데이터에 대한 학습이 너무 많이 수행되는 현상
* 통계모델이 과도하게 샘플데이터 맞춤형으로 만들어져 오히려 현실과 맞지 않게 되는 일
* 통계모델이 과도하게 샘플데이터 맞춤형으로 만들어져 오히려 현실과 맞지 않게 되는 일
* 통계모델에 매개변수가 너무 많은 경우, 샘플데이터 수에 비해 '''모델이 복잡하고 예측력이 떨어짐'''
* 통계모델에 매개변수가 너무 많은 경우, 샘플데이터 수에 비해 '''모델이 복잡하고 예측력이 떨어진다'''.
* 모델이 [[트레이닝셋]]에 너무 최적화되어 있어서, 실제모델(현실적으로는 [[테스트셋]])과 맞지 않게 되는
* 생성된 모델이 [[훈련 데이터]]와 지나치게 일치하여, 새 데이터를 올바르게 예측하지 못하는 경우이다.
* 모델이 [[트레이닝셋]]에 너무 최적화되어 있어서, 실제모델(현실적으로는 [[테스트셋]])과 맞지 않게 되는 것이다.
* 학습 대상 데이터에 대한 오차는 감소하지만, 실제 사례에 적용할 경우 오차가 증가하는 문제를 수반한다.


https://upload.wikimedia.org/wikipedia/commons/thumb/5/5d/Overfit.png/300px-Overfit.png
[[파일:Overfit.png|300px]]


https://upload.wikimedia.org/wikipedia/commons/thumb/6/68/Overfitted_Data.png/300px-Overfitted_Data.png
[[파일:Overfitted_Data.png|300px]]


https://upload.wikimedia.org/wikipedia/commons/thumb/1/19/Overfitting.svg/300px-Overfitting.svg.png
[[파일:Overfitting.svg|300px]]


==방지 방법==
==방지 방법==
19번째 줄: 24번째 줄:


==같이 보기==
==같이 보기==
{{z컬럼3|
* [[적합]]
* [[적합도]]
* [[예측력]]
* [[과소적합]]
* [[오컴의 면도날]]
* [[통계 모델 유연성]]
* [[트레이닝셋, 테스트셋]]
* [[트레이닝셋, 테스트셋]]
* [[편향-분산 트레이드오프]]
* [[편향-분산 트레이드오프]]
* [[통계 모델 유연성]]
}}
* [[오컴의 면도날]]
* [[적합도]]


==참고==
==참고==
31번째 줄: 41번째 줄:
[[분류:통계]]
[[분류:통계]]
[[분류:머신러닝]]
[[분류:머신러닝]]
[[분류: 3음절 한자어 명사]]
[[분류: 過]][[분류: 適]][[분류: 合]]

2023년 10월 26일 (목) 13:22 기준 최신판

1 개요[ | ]

overfitting
適合
과적합, 과적화, 과잉적합, 과최적화, 오버피팅
  • 일반화 부족
  • 통계모델이 다른 상황에 일반화되지 못하는 것
  • 기계학습에서 데이터에 대한 학습이 너무 많이 수행되는 현상
  • 통계모델이 과도하게 샘플데이터 맞춤형으로 만들어져 오히려 현실과 맞지 않게 되는 일
  • 통계모델에 매개변수가 너무 많은 경우, 샘플데이터 수에 비해 모델이 복잡하고 예측력이 떨어진다.
  • 생성된 모델이 훈련 데이터와 지나치게 일치하여, 새 데이터를 올바르게 예측하지 못하는 경우이다.
  • 모델이 트레이닝셋에 너무 최적화되어 있어서, 실제모델(현실적으로는 테스트셋)과 맞지 않게 되는 것이다.
  • 학습 대상 데이터에 대한 오차는 감소하지만, 실제 사례에 적용할 경우 오차가 증가하는 문제를 수반한다.

Overfit.png

Overfitted Data.png

Overfitting.svg

2 방지 방법[ | ]

  • 더 많은 트레이닝 데이터 확보
  • 피쳐 수 감소
  • 정규화

3 같이 보기[ | ]

4 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}