Loading [MathJax]/jax/output/CommonHTML/jax.js

Geometric Median

Mathematics 2024. 6. 14. 16:06

Median은 주어진 값들의 중간에 해당하는 값을 의미한다. 1차원 데이터가 주어졌을 때 median은 주어진 데이터를 크기 순서로 정렬을 한 후 중간에 해당하는 값을 취하면 된다.  데이터를 1차원 직선 위에 한 점으로 대응시킬 때 median을 찾는 것은 각 점으로부터 거리의 합이 최소인 데이터 위치를 찾으면 된다. 즉 1차원 median 찾기는 

C(y)=i|xiy|

로 정의되는 비용함수 C(y)를 최소로 만드는 y를 주어진 데이터 속에서 찾는 것으로 바뀐다. 

증명: C(y)=xi<y(yxi)+xi>y(xiy)   dCdy=xi<y1xi>y1=0

이어야 하므로 y=median{xi}임을 알 수 있다.

2차원 이상의 다차원 공간에서도 이 비용함수를 확장하면 다차원 공간에 분포하는 점들의 기하학적인 median을 정의할 수 있다. 

median({xi})=argminyi||xiy||

1차원의 경우는 점들을 크기 순서대로 정렬을 하여 구할 수 있지만, 2차원 이상일 때 닫힌 해는 존재하지 않고, 반복적인 반복을 써서 구할 수 있음이 알려져 있다( Weiszfeld Algorithm). 이는 비용함수에 경사강하법(gradient descent method)을 적용한 알고리즘으로  볼 수 있다. 주어진 단계에서 근사적인 median이 y(t)일 때 다음 단계에서는 median update 식은 

y(t+1)=iwixiiwi,wi=||xiy(t)||

로 계산한다. 이는 비용함수의 극소를 찾기 위해서 경사강하법을 적용할 때 step size (또는 learning rate)을

y(t+1)=y(t)λCλ=1iwi

로 선택한 결과이다. Weiszfeld algorithm에서는 강하 방향과 step size가 닫힌 형태로 계산되므로 일반적인 경사강하 알고리즘보다도 더 빠르게 근사해를 찾을 수 있다.

 

728x90

'Mathematics' 카테고리의 다른 글

Fermat Point  (0) 2024.07.12
Basel Problem  (0) 2024.07.10
삼각형 내부에 외접원의 중심이 포함될 확률은?  (1) 2024.06.03
The Double Bubble Theorem  (0) 2024.05.27
Fourier Interpolation  (0) 2024.03.20
,