1 개요[ | ]
- one-hot enconding
- 원-핫 인코딩
- 범주형 변수를 여러 개의 가변수(dummy variables)로 다시 표현하는 것
- 요소 중 하나가 1로 설정되고 다른 요소는 모두 0으로 설정된는 특징을 가지는 희소 벡터
- 원-핫 인코딩은 가능한 값의 유한집합을 갖는 문자열 또는 식별자를 표현하는 데 널리 사용된다.
- 예를 들어 식물학 데이터 세트에 15,000가지 종이 수록되어 있으며 각 종이 고유한 문자열 식별자로 표기되어 있다고 가정해 보자.
- 특성 추출 시에는 이러한 문자열 식별자를 크기가 15,000인 원-핫 벡터로 인코딩할 수 있다.
- 다음과 같은 특징을 갖는 희소 벡터이다.
- 요소 중 하나가 1로 설정된다.
- 다른 요소는 모두 0으로 설정된다.
- 원-핫 인코딩은 가능한 값의 유한집합을 갖는 문자열 또는 식별자를 표현하는 데 널리 사용된다.
- 예를 들어 식물학 데이터 세트에 15,000가지 종이 수록되어 있으며 각 종이 고유한 문자열 식별자로 표기되어 있다고 가정해 보자.
- 특성 추출 시에는 이러한 문자열 식별자를 크기가 15,000인 원-핫 벡터로 인코딩할 수 있다.
2 같이 보기[ | ]
3 참고[ | ]
- 대학수학회 수학 용어집에 '정칙화'라고 나와 있네요.
― Jmnote