범주형 데이터

Jmnote (토론 | 기여)님의 2021년 5월 25일 (화) 02:49 판 (새 문서: ==개요== ;categorical data ;범주형 데이터 * 가능한 값의 불연속 집합을 갖는 특성 * 예를 들어 Tudor, ranch, colonial이라는 3가...)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

1 개요

categorical data
범주형 데이터
  • 가능한 값의 불연속 집합을 갖는 특성
  • 예를 들어 Tudor, ranch, colonial이라는 3가지 가능한 값으로 이루어진 불연속 집합을 갖는 house style이라는 범주형 특성이 있다고 가정해 보자.
  • house style을 범주형 데이터로 표현하면 Tudor, ranch, colonial이 주택 가격에 주는 영향을 모델이 개별적으로 학습할 수 있습니다.
  • 불연속 집합의 값은 상호배타적일 수 있으며, 특정 예에 하나의 값만 적용할 수도 있다.
  • 예를 들어 car maker 범주형 특성은 예마다 하나의 값(Toyota)만 허용할 가능성이 높다.
  • 둘 이상의 값을 적용할 수 있는 경우도 있다.
  • 자동차 하나를 여러 색으로 도색할 수도 있으므로 car color 범주형 특성은 하나의 예가 여러 값(예: red와 white)을 갖도록 할 수 있다.
  • 범주형 특성을 불연속 특성이라고도 한다.
  • 수치 데이터와 대비되는 개념이다.

2 같이 보기

3 참고

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}