범주형 데이터

1 개요[ | ]

categorical data
範疇型 data
범주형 데이터
  • 범주로 분류될 수 있는 관측값
  • 가능한 값의 불연속 집합을 갖는 특성
  • 예를 들어 Tudor, ranch, colonial이라는 3가지 가능한 값으로 이루어진 불연속 집합을 갖는 house style이라는 범주형 특성이 있다고 가정해 보자.
  • house style을 범주형 데이터로 표현하면 Tudor, ranch, colonial이 주택 가격에 주는 영향을 모델이 개별적으로 학습할 수 있습니다.
  • 불연속 집합의 값은 상호배타적일 수 있으며, 특정 예에 하나의 값만 적용할 수도 있다.
  • 예를 들어 car maker 범주형 특성은 예마다 하나의 값(Toyota)만 허용할 가능성이 높다.
  • 둘 이상의 값을 적용할 수 있는 경우도 있다.
  • 자동차 하나를 여러 색으로 도색할 수도 있으므로 car color 범주형 특성은 하나의 예가 여러 값(예: redwhite)을 갖도록 할 수 있다.
  • 범주형 특성을 불연속 특성이라고도 한다.
  • 수치 데이터와 대비되는 개념이다.

2 같이 보기[ | ]

3 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}