"정규화구글거리 NGD"의 두 판 사이의 차이

 
(사용자 2명의 중간 판 13개는 보이지 않습니다)
1번째 줄: 1번째 줄:
==개요==
==개요==
;구글 거리, 정규화된 구글 거리
;Normalized Google distance, Google distance
;Normalized Google distance, Google distance
;정규화된 구글 거리, 정규화 구글 거리, 구글 거리
*구글 검색 결과로부터 계산되는 [[의미 유사성]]
*구글 검색 결과로부터 계산되는 [[의미 유사성]]
:<math>\operatorname{NGD}(x,y) = \frac{\max\{\log f(x), \log f(y)\} - \log f(x,y)}{\log M - \min\{\log f(x), \log f(y)\}}</math>
:<math>\operatorname{NGD}(x,y) = \dfrac{\max\{\log f(x), \log f(y)\} - \log f(x,y)}{\log M - \min\{\log f(x), \log f(y)\}}</math>


==계산 예시==
==계산 예시==
9번째 줄: 9번째 줄:
*rider: f(y) = 12,200,000
*rider: f(y) = 12,200,000
*horse rider: f(x,y) = 2,630,000
*horse rider: f(x,y) = 2,630,000
*M: 8,058,044,651건
*M = 8,058,044,651
<math>NGD=\frac{\max\{\log 46700000, \log 12200000\} - \log 2630000}{\log 8058044651 - \min\{\log 46700000, \log 12200000\}}</math>
<math>NGD=\dfrac{\max(\log 46700000, \log 12200000) - \log 2630000}{\log 8058044651 - \min(\log 46700000, \log 12200000)}</math>
:<math>=\frac{\max(7.669316881, 7.086359831) - 6.419955748}{9.90622967 - \min(7.669316881, 7.086359831)}</math>
:<math>=\dfrac{7.669316881-6.419955748}{9.90622967 - 7.086359831}=0.443056312</math>
:<math>=\frac{7.669316881-6.419955748}{9.90622967 - 7.086359831}=0.443056312</math>
 
==엑셀 예시==
{{엑셀 행| 1 | 2 | 3 | 4 | 5 }}
{{엑셀 열| A | B | C | D }}
{{엑셀 데이터
| {{!}} horse {{!!}} 46700000 {{!!}} log f(x) {{!!}} {{=}}LOG(B1)
| {{!}} rider {{!!}} 12200000 {{!!}} log f(y) {{!!}} {{=}}LOG(B2)
| {{!}} horse + rider {{!!}} 2630000 {{!!}} log f(x,y) {{!!}} {{=}}LOG(B3)
| {{!}} M {{!!}} 8058044651 {{!!}} log M {{!!}} {{=}}LOG(B4)
| {{!}} {{!!}} {{!!}} NGD {{!!}} {{=}}(MAX(D1,D2)-D3)/(D4-MIN(D1,D2))
}}
 
{{엑셀 행| 1 | 2 | 3 | 4 | 5 }}
{{엑셀 열| A | B | C | D }}
{{엑셀 데이터
| {{!}} horse {{!!}} 46700000 {{!!}} log f(x) {{!!}} 7.669316881
| {{!}} rider {{!!}} 12200000 {{!!}} log f(y) {{!!}} 7.086359831
| {{!}} horse + rider {{!!}} 2630000 {{!!}} log f(x,y) {{!!}} 6.419955748
| {{!}} M {{!!}} 8058044651 {{!!}} log M {{!!}} 9.90622967
| {{!}} {{!!}} {{!!}} NGD {{!!}} 0.443056312
}}


==같이 보기==
==같이 보기==
18번째 줄: 38번째 줄:
*[[구글 검색결과 수]]
*[[구글 검색결과 수]]


==참고 자료==
==참고==
*http://en.wikipedia.org/wiki/Normalized_Google_distance
* {{영어위키백과|Normalized Google distance}}
*http://homepages.cwi.nl/~paulv/papers/crc08.pdf
*http://homepages.cwi.nl/~paulv/papers/crc08.pdf


[[분류: 통계]]
[[분류: 구글]]
[[분류: 통계적 거리]]

2020년 5월 4일 (월) 21:17 기준 최신판

1 개요[ | ]

Normalized Google distance, Google distance
정규화된 구글 거리, 정규화 구글 거리, 구글 거리
[math]\displaystyle{ \operatorname{NGD}(x,y) = \dfrac{\max\{\log f(x), \log f(y)\} - \log f(x,y)}{\log M - \min\{\log f(x), \log f(y)\}} }[/math]

2 계산 예시[ | ]

  • horse: f(x) = 46,700,000
  • rider: f(y) = 12,200,000
  • horse rider: f(x,y) = 2,630,000
  • M = 8,058,044,651

[math]\displaystyle{ NGD=\dfrac{\max(\log 46700000, \log 12200000) - \log 2630000}{\log 8058044651 - \min(\log 46700000, \log 12200000)} }[/math]

[math]\displaystyle{ =\dfrac{7.669316881-6.419955748}{9.90622967 - 7.086359831}=0.443056312 }[/math]

3 엑셀 예시[ | ]

1
2
3
4
5
A B C D
horse 46700000 log f(x) =LOG(B1)
rider 12200000 log f(y) =LOG(B2)
horse + rider 2630000 log f(x,y) =LOG(B3)
M 8058044651 log M =LOG(B4)
NGD =(MAX(D1,D2)-D3)/(D4-MIN(D1,D2))
1
2
3
4
5
A B C D
horse 46700000 log f(x) 7.669316881
rider 12200000 log f(y) 7.086359831
horse + rider 2630000 log f(x,y) 6.419955748
M 8058044651 log M 9.90622967
NGD 0.443056312

4 같이 보기[ | ]

5 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}