"Tf–idf"의 두 판 사이의 차이

17번째 줄: 17번째 줄:
{| class="wikitable"
{| class="wikitable"
|+ Document 1
|+ Document 1
! Term
! term
! Term Count
! count
|-
|-
| this || 1
| this || 1
30번째 줄: 30번째 줄:
| sample
| sample
| 1
| 1
|-
! 계
! 5
|}
|}


37번째 줄: 40번째 줄:
|+ Document 2
|+ Document 2
! Term
! Term
! | Term Count
! 개수
|-
|-
| this || 1
| this || 1
49번째 줄: 52번째 줄:
| example
| example
| 3
| 3
|-
! 계
! 7
|}
|}



2022년 1월 24일 (월) 10:21 판

1 개요

tf–idf, TFIDF, term frequency–inverse document frequency
빈도-역빈도 법, 단어 빈도-역문서 빈도
  • 정보 검색과 텍스트 마이닝에서 이용하는 가중치
  • 문서내 단어의 가중치를 구하는 알고리즘
  • 정보검색론의 기본 개념중 하나
  • 문서 간의 유사도 측정
  • 특정 단어의 문서내 중요도 측정
  • 핵심어 추출
  • 검색 랭킹 결정

2 예시

Document 1
term count
this 1
is 1
a 2
sample 1
5
Document 2
Term 개수
this 1
is 1
another 2
example 3
7

3 같이 보기

4 참고

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}