"훈련, 검증, 테스트 데이터"의 두 판 사이의 차이

30번째 줄: 30번째 줄:


[[분류: 데이터셋]]
[[분류: 데이터셋]]
[[분류: 머신 러닝]]
[[분류: 머신러닝]]

2020년 5월 5일 (화) 12:10 판

1 개요

훈련, 검증, 테스트 데이터
훈련 데이터 training data, training dataset, training set
검증 데이터 validation data, validation dataset
테스트 데이터 test data, test dataset, holdout dataset

Traintest.svg

2 분할

  • 어떻게 나눌까? 정답은 없음
시계열 데이터의 경우 일반적으로 최근 1년을 테스트셋으로, 나머지를 트레이닝셋으로 함

3 같이 보기

4 참고

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}