K-중앙값

1 개요[ | ]

k-median
k-중앙값
  • k-평균과 밀접한 관련이 있는 클러스터링 알고리즘
  • 이 두 알고리즘의 실질적인 차이는 다음과 같다.
    • k-평균 알고리즘에서는 중심이 될 수 있는 위치와 각 예의 위치 사이 거리를 제곱한 값의 합계를 최소화하는 방식으로 중심을 결정한다.
    • k-중앙값 알고리즘에서는 중심이 될 수 있는 위치와 각 예의 위치 사이의 거리 값의 합계를 최소화하는 방식으로 중심을 결정한다.
  • 거리의 정의도 다르다.
    • k-평균 알고리즘에서는 중심에서 예까지의 유클리드 거리를 사용한다.
      • 2차원에서 유클리드 거리는 피타고라스 정리를 사용하여 빗변의 길이를 계산하는 것을 의미한다.
      • 예를 들어 (2,2)와 (5, -2) 사이의 k-평균 거리는 다음과 같다.
      • 유클리드 거리 = [math]\displaystyle{ \sqrt{(2-5)^2 + (2--2)^2}=5 }[/math]
    • k-중앙값 알고리즘에서는 중심에서 예까지의 맨해튼 거리를 사용한다.
      • 이 거리는 각 차원 값 차의 절대값의 합이다.
      • 예를 들어 (2,2)와 (5, -2) 사이의 k-중앙값 거리는 다음과 같다.
      • 맨하탄 거리 = [math]\displaystyle{ | 2 - 5 | + | 2 - - 2 | = 7 }[/math]

2 같이 보기[ | ]

3 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}