Savitzky-Golay 필터는 일차원의 데이터에 대해서 일종의 이동평균을 취하는 경우와 동일하게 동작하는 필터이지만, 추정하는 지점의 주변의 모든 점에 동일한 가중치를 주는 방식(이동평균)을 택하지 않고, 그들을 보간하는 다항식을 최소자승법으로 찾아서 해당 지점의 값을 추정하는 방식을 택한다(frequency domain에서 분석을 하면 Savitzky-Golay 필터의 특성, 예를 들면, 피크의 위치나 등이 잘 유지되는 점등, 좀 더 다양하게 볼 수 있다). 이 필터를 쓰기 위해서는 몇 차의 다항식과 얼마의 윈도우 크기를 사용해야 하는지 설정을 해야 한다. (다항식의 찻수가 정해지면 최소의 윈도우 크기가 정해진다).
동일한 방식으로 이차원에 대해서도 Savitzky-Golay를 적용할 수 있다. 이 경우에는 다항식이 (x,y)의 2변수 함수 (2차원 평면에서의 정의되는 곡면)로 주어질 것이다. 이차원의 경우도 국소적인 필터로 사용하여서 영상의 smoothing 필터로 사용할 수 있지만, 필터의 윈도우를 영상전체로 잡아서, 즉 영상을 구성하는 픽셀값을 전 영역에서 보간하는 곡면을 찾을 수도 있다. 이렇게 찾은 곡면은 만들어진 영상의 배경조명이 균일하지 않는 경우에 이 추정된 곡면을 이용하면, 조명에 의한 효과를 예측할 수 있고, 배경조명이 보정된 영상을 만들어서 영상의 인식에 도움을 받을 수 있다. (문서인식에서 문서를 스캔할 때 생기는 균일하지 않은 배경이나, 2차원 코드 인식에서 배경의 추정등 다양한 부분에서 사용할 수 있다. 물론 간단한 경우에는 배경의 변화를 균일하게 기울어진 평면으로 근사를 하여서 추정할 수 있다)  

간단한 경우가 3차 다항식으로 영상을 보간하는 경우:

I(x, y) = a00
         + a
10*x + a01*y
         + a
20*x2 + a11*x*y + a02*y2
         + a
30*x3 + a21*x2*y + a12*x*y2 + a03*y3 
                                                      (x, y) ∈ image 


다항식은 x = [a00, a10,..., a03]T 의 10개의 필터계수를 추정하면 얻어진다. 추가적으로 Savitzky-Golay을 이용하면 영상의 미분값을 쉽게 구할 수 있다. 로컬버전의 필터인 경우에 필터적용값은 윈도우의 중심인 (x, y) = (0, 0)에서 다항식 값인 a00이다. 이 지점에서 x-방향의 편미분값은 a10, y방향의 편미분 값은 a01, 식으로 미분값을 구할 수 있다.

필터의 계수 x는 최소자승법 적용하면 얻어질 수 있다.  위의 다항식에  N (= width * height) 개의 픽셀로 구성된 영상의 각각의 픽셀에서의 좌표와 픽셀값을 대입하면,  N개의 식을 얻는다. 이것을 행렬식으로 쓰면

A.x = b

A는 N x 10 의 행렬로 각 행은 픽셀의 좌표로 구해진다:

A = [1, x0,  y0,  x02,  x0*y0,  y02,  x03,  x02*y0,  x0*y02,  y03]
     [1, x1,  y1,  x12,  x1*y1,  y12,  x13,  x12*y1,  x1*y12,  y13] 
     [1, x2,  y2,  x22,  x2*y2,  y22,  x23,  x22*y2,  x2*y22,  y23] 
     [1, .....................................................................] 
     [1, .....................................................................] 
                       ......................................
     [1, .....................................................................] 

여기서, 영상을 읽을 때, i-번째의 픽셀 위치가 (xi, yi) 로 주어진 경우다.

b 는 N-(열)벡터로 각각의 픽셀 위치에서 픽셀 값을 나타내는 벡터이다:

b = [ I(x0, y0) ]
     [ I(x1, y1) ] 
     [ I(x2, y2) ] 
     [ ............] 
     [ ............]
      ..............
     [.............]  


최소자승법을 적용하면, 추정된 다항식의 계수벡터 x는 

x = (A
T .A)-1.AT.b

임을 알 수 있다.

이렇게 추정된 2차원 곡면은 영상에서 추정된 배경의 픽셀 값 분포를 의미한다. 문자인식의 예를 들면, 보통의 경우에 흰 배경에 검정색 활자를 인식한다. 스캔된 영상에 검정색 활자들 때문에 추정된 곡명은 일반적으로 주어진 픽셀이 만드는 곡면보다도 낮게 된다. 픽셀 값이 추정된 곡면보다 더 낮은 픽셀들은 보통 검정색 문자들을 의미하므로, 이 차이의 평균값을 구하면, 대략적으로 어떤 픽셀이 배경에 속하는지 (곡면과 차이가 평균보다 작고, 또한 픽셀 값이  곡면의 아래에 놓인 경우), 아니면 문자영역인지(곡면과 차이가 평균보다 크고, 픽셀 값이 곡면의 아래에 놓인 경우)를 구별할 있게 된다.  
이제 이 정보들을 이용해서 추정을 다시 하는데 이번에는 1차 추정에서 글자영역으로 분류된 픽셀을 제외하고 배경을 추정하면 좀 더 정확한 배경을 기술하는 곡면을 얻을 수 있다.

로컬버전 필터로 사용할 때는 1차원에서와 마찬가지로 필터계수를 lookup table로 만들어서 사용할 수 있으나, 전영역을 대상으로 할 때는 행렬의 크기가 매우 커져서 연산도 많아진다. 

""

""

""


Posted by helloktk

댓글을 달아 주세요