특성 (머신러닝)

Jmnote (토론 | 기여)님의 2020년 9월 30일 (수) 19:55 판 (→‎참고)
  다른 뜻에 대해서는 특성(特性) 문서를 참조하십시오.
  다른 뜻에 대해서는 특성 (게임) 문서를 참조하십시오.
  다른 뜻에 대해서는 특성 (머신러닝) 문서를 참조하십시오.

1 개요

feature
피처, 피쳐, 특성
  • 입력 변수
  • 독립변수( [math]\displaystyle{ x }[/math] 변수 )
  • 머신러닝과 패턴 인식 용어
  • 데이터를 설명하는 입력 변수([math]\displaystyle{ x_i }[/math])
  • 단순 선형 회귀의 x 변수( [math]\displaystyle{ \{x_1, x_2, \cdots, x_n\} }[/math] )
  • 예측을 수행하는 데 사용되는 입력 변수
  • 간단한 머신러닝 프로젝트에서는 특성 하나를 사용하지만 복잡한 머신러닝 프로젝트에서는 수백만 개의 특성을 사용할 수 있다.
  • 관찰 대상에게서 발견된 개별적이고 측정가능한 경험적(heuristic) 속성을 말한다.
  • 독립적인 변수를 잘 선택하는 것은 패턴 인식 상에서 분류를 위한 성공 요인이라 할 수 있다.
  • 피처들은 일반적으로 수치이나, 그래프와 같은 자료 구조적인 피쳐들도 있다.
  • 피처들의 집합을 피처 벡터(feature vector)라고 한다.
  • 굳이 벡터로 표시하는 이유는 수학적으로 다루기 편하기 때문이다.
  • 피쳐라는 개념을 가져온 것은 선형 회귀와 같은 통계학적인 기법에서이다.
  • 독립 변수와 종속 변수 개념 또한 통계학에서 가져왔다.
  • 구체적이고 수량화 가능한 특성이 좋은 특성이다.

2 예시

스팸 감지 예에는 다음과 같은 특성이 포함될 수 있다.

  • 이메일 텍스트의 단어
  • 보내는 사람의 주소
  • 이메일이 전송된 시간
  • '이상한 속임수 하나'라는 구문이 포함된 이메일

3 같이 보기

4 참고

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}