tf–idf

Jmnote (토론 | 기여)님의 2022년 1월 24일 (월) 10:21 판 (→‎예시)

1 개요

tf–idf, TFIDF, term frequency–inverse document frequency
빈도-역빈도 법, 단어 빈도-역문서 빈도
  • 정보 검색과 텍스트 마이닝에서 이용하는 가중치
  • 문서내 단어의 가중치를 구하는 알고리즘
  • 정보검색론의 기본 개념중 하나
  • 문서 간의 유사도 측정
  • 특정 단어의 문서내 중요도 측정
  • 핵심어 추출
  • 검색 랭킹 결정

2 예시

Document 1
term count
this 1
is 1
a 2
sample 1
5
Document 2
term count
this 1
is 1
another 2
example 3
7

3 같이 보기

4 참고

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}