지프의 법칙

1 개요[ | ]

Zipf's law
Zipf의 법칙, 지프의 법칙
  • 수학적 통계를 바탕으로 밝혀진 경험적 법칙
  • 영어 단어의 출현 빈도에 관한 성질을 나타내는 법칙
  • 물리, 사회과학 분야의 여러 정보들이 지프 분포에 가까운 경향을 보임
  • 단어를 출현 빈도가 높은 순으로 늘어 세워 순위 번호를 붙이면, ‘순위 번호×출현 빈도=일정’이라는 관계가 성립한다는 경험 법칙
  • 이산 멱법칙 확률분포와 관계된 확률분포의 하나
  • 어떤 자연어 말뭉치 표현에 나타나는 단어들을 사용빈도가 높은 순으로 나열하면, 단어 사용빈도는 단어의 순위에 반비례
예를 들어 2위 단어는 1위 빈도의 1/2, 3위 단어는 1위 빈도의 1/3

2 예시[ | ]

순위 단어 횟수 빈도
1 the 69971건 7.0%
2 of 36411건 3.6%
3 and 28852건 2.9%

3 같이 보기[ | ]

4 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}