"Tf–idf"의 두 판 사이의 차이

16번째 줄: 16번째 줄:


{| class="wikitable"
{| class="wikitable"
|+ Document 2
|+ Document 1
! Term
! Term
! | Term Count
! Term Count
|-
|-
| this || 1
| this || 1
25번째 줄: 25번째 줄:
| 1
| 1
|-
|-
| another
| a
| 2
| 2
|-
|-
| example
| sample
| 3
| 1
|}
|}


35번째 줄: 35번째 줄:


{| class="wikitable"
{| class="wikitable"
|+ Document 1
|+ Document 2
! Term
! Term
! Term Count
! | Term Count
|-
|-
| this || 1
| this || 1
44번째 줄: 44번째 줄:
| 1
| 1
|-
|-
| a
| another
| 2
| 2
|-
|-
| sample
| example
| 1
| 3
|}
|}



2022년 1월 24일 (월) 10:20 판

1 개요

tf–idf, TFIDF, term frequency–inverse document frequency
빈도-역빈도 법, 단어 빈도-역문서 빈도
  • 정보 검색과 텍스트 마이닝에서 이용하는 가중치
  • 문서내 단어의 가중치를 구하는 알고리즘
  • 정보검색론의 기본 개념중 하나
  • 문서 간의 유사도 측정
  • 특정 단어의 문서내 중요도 측정
  • 핵심어 추출
  • 검색 랭킹 결정

2 예시

Document 1
Term Term Count
this 1
is 1
a 2
sample 1
Document 2
Term Term Count
this 1
is 1
another 2
example 3

3 같이 보기

4 참고

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}