9번째 줄: | 9번째 줄: | ||
* 사례 수가 적으면, 테스트셋 선택에 따라 예측력의 차이가 매우 클 수 있다. | * 사례 수가 적으면, 테스트셋 선택에 따라 예측력의 차이가 매우 클 수 있다. | ||
==훈련 | ==훈련/테스트== | ||
[[파일:train_test_detail.png]] | [[파일:train_test_detail.png]] | ||
==훈련/검증/테스트== | |||
[[파일:train_validate_test_detail.png]] | |||
==같이 보기== | ==같이 보기== |
2020년 5월 5일 (화) 12:03 판
1 개요
- 데이터를 '훈련셋+테스트셋' 또는 '훈련셋+검증셋+테스트셋' 등으로 나누는 일
- 훈련셋과 테스트셋의 비율을 어떻게 할지는 정해진 규칙은 없다.
- 일반적으로는 7:3 또는 8:2 정도로 한다.
- 3~5년치 시계열데이터의 경우, 마지막 1개년을 테스트셋으로 하는 경우가 흔하다.
- 사례 수가 적으면, 테스트셋 선택에 따라 예측력의 차이가 매우 클 수 있다.
2 훈련/테스트
3 훈련/검증/테스트
4 같이 보기
5 참고
편집자 Jmnote
로그인하시면 댓글을 쓸 수 있습니다.