"Tf–idf"의 두 판 사이의 차이

31번째 줄: 31번째 줄:
| 1
| 1
|-
|-
!
|
! 5
| 5
|}
|}


53번째 줄: 53번째 줄:
| 3
| 3
|-
|-
!
|
! 7
| 7
|}
|}



2022년 1월 24일 (월) 10:22 판

1 개요

tf–idf, TFIDF, term frequency–inverse document frequency
빈도-역빈도 법, 단어 빈도-역문서 빈도
  • 정보 검색과 텍스트 마이닝에서 이용하는 가중치
  • 문서내 단어의 가중치를 구하는 알고리즘
  • 정보검색론의 기본 개념중 하나
  • 문서 간의 유사도 측정
  • 특정 단어의 문서내 중요도 측정
  • 핵심어 추출
  • 검색 랭킹 결정

2 예시

Document 1
term count
this 1
is 1
a 2
sample 1
5
Document 2
term count
this 1
is 1
another 2
example 3
7

3 같이 보기

4 참고

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}