원-핫 인코딩

(One-hot encoding에서 넘어옴)

1 개요[ | ]

one-hot enconding
원-핫 인코딩
  • 범주형 변수를 여러 개의 가변수(dummy variables)로 다시 표현하는 것
  • 요소 중 하나가 1로 설정되고 다른 요소는 모두 0으로 설정된는 특징을 가지는 희소 벡터
  • 원-핫 인코딩은 가능한 값의 유한집합을 갖는 문자열 또는 식별자를 표현하는 데 널리 사용된다.
  • 예를 들어 식물학 데이터 세트에 15,000가지 종이 수록되어 있으며 각 종이 고유한 문자열 식별자로 표기되어 있다고 가정해 보자.
특성 추출 시에는 이러한 문자열 식별자를 크기가 15,000인 원-핫 벡터로 인코딩할 수 있다.

MtimFxh.png


  • 다음과 같은 특징을 갖는 희소 벡터이다.
    • 요소 중 하나가 1로 설정된다.
    • 다른 요소는 모두 0으로 설정된다.
  • 원-핫 인코딩은 가능한 값의 유한집합을 갖는 문자열 또는 식별자를 표현하는 데 널리 사용된다.
  • 예를 들어 식물학 데이터 세트에 15,000가지 종이 수록되어 있으며 각 종이 고유한 문자열 식별자로 표기되어 있다고 가정해 보자.
  • 특성 추출 시에는 이러한 문자열 식별자를 크기가 15,000인 원-핫 벡터로 인코딩할 수 있다.

2 같이 보기[ | ]

3 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}