'Perspective Transformation'에 해당되는 글 2건

  1. 2012.02.15 Least Square Estimation of Perspective Transformation (4)
  2. 2012.02.14 Perspective Transformation (2)

두 영상 사이의 perspective 변환은 8개의 매개변수(a,b,c,d,e,f,g,h)에 의해서 다음 식처럼 기술이 된다. (see, http://kipl.tistory.com/86)

또는, 

따라서, 매개변수를 찾기 위해서는 두 영상에서 서로 대응하는 점이 4개 이상 주어져 야 한다. 만약에 N개의 대응점들이 주어진 경우에


위의 식을 각각의 대응점에 넣어서 정리하면 아래의 행렬식을 얻을 수 있다.(좌변행렬의 마지막 열은 전부 -부호가 들어가야 한다) 
 

또는 간단히 

로 쓸 수 있다. 그러나 실제 대응점을 찾을 때 들어오는 noise로 인해서 실제 데이터를 이용하는 경우에는 정확히 등호로 주어지지 않는다. 따라서, 좌변과 우변의 차이의 제곱을 최소로 만드는 x를 찾아야 할 것이다.


에 대해서 미분을 하여서,

를 만족시키는 극값 x*을 구하면 된다. 는 8x8의 대칭행렬이어서 대각화가 가능하므로 역행렬을 구할 수 있다 (주어진 점들 중 한 직선 위에 놓이지 않는 점이 4개 이상이 있어야 한다). 따라서, 최소제곱해는 다음과 같이 주어진다:

.

저작자 표시 비영리 변경 금지
신고

'Image Recognition' 카테고리의 다른 글

2차원 Savitzky-Golay Filters 응용  (0) 2012.02.28
webcam용 QR code detector  (0) 2012.02.19
Least Square Estimation of Perspective Transformation  (4) 2012.02.15
Perspective Transformation  (2) 2012.02.14
Integral Image을 이용한 Adaptive Threshold  (0) 2012.02.04
Peak Finder  (1) 2012.02.02
Posted by helloktk

한 평면에서 다른 평면으로 변환 중에서 직선의 직선성을 유지하는 변환은 2차원의 perspective 변환이다. 이 변환의 부분인 어파인 변환은 평행한 두 직선의 평행성을 그대로 유지하면서 변환시킨다. 따라서 이 perspective 변환은 사각형을 사각형으로 변환시키는 특성도 있다. 물론 사각형을 다른 사각형으로 변환시키는 다른 이차원 변환인 bilinear 변환이 있으나 일반적으로 직선의 직선성은 보전하지 못한다. 이 직선성의 보존은 매우 중요한 특성이다. 카메라도 일종의 perspective 변환기로 영상을 맺을 때도 직선은 그대로 직선으로 나타난다.(FOV가 큰 카메라는 렌즈왜곡이 심해서 보존이 안된다) 

평면에서의 변환을 다룰 때는 2x2행렬보다는 3x3 행렬을 이용하는 것이 더 편리하다. 이렇게 하면 평면에서 점의 이동을 행렬의 요소로 넣어서 생각할 수 있다.

(ex) affine 변환:
x = a11 * u + a21 * v + tu 
y = a12 * u + a22 * v + tv;
==> 
[x]   [a11   a21  tu] [u]
[y] = [a12   a22  tv] [v]
[1]   [   0      0   1] [1]

그리고 이것은 perspective 변환이 선형변환임을 명시적으로 보여주어서, 직선성이 보존된다는 사실이 자명해진다. 3x3행렬로 표현할 때, 평면의 좌표는 (x, y ,1)^T 처럼 3번째 좌표의 값은 항상 1로 고정한다( homogeneous coordinate) 
 
카메라로 물체를 촬영할 때, 가까운 거리에서 촬영을 하던, 먼 거리에서 촬영을 하던 두 영상은 크기차이만 있는 동일한 모양의 물체상을 만들어 낸다. perspective 변환은 3차원에 놓인 평면에서 평면으로 변환으로 생각할 수 있는데, 크기의 차이만 있는 경우에 같은 것으로 본다. 3차원에서 행렬변환은 9개의 매개변수에 의해서 기술이 되는데, 전체적인 크기의 차이를 무시하므로 1개 매개변수가 줄어들어서 8개의 매개변수로 표현이 된다.  
perspective 변환을 아래처럼 쓰면 변환된 좌표의 3번쨰 성분은 일반적으로 1이 아니다. 3번째 좌표 w을 구한 후에 이 값으로 x, y를 나누어서 생각하면 된다.

[x]   [ a11  a21 a31 ] [u]
[y] = [ a12  a22 a32 ] [v] 
[w]   [ a13  a23 a33 ] [1]             (a33 = 1)
 
x  = a11 * u +  a21 * v + a31     ==>  x =  x / w;
y  = a12 * u +  a22 * v + a32     ==>  y =  y / w;
w  = a13 * u +  a23 * v + a33  

perspective 변환행렬 [aij]는 4개의 점에 대응하는 출력영상에서의 4개의 점이 주어지면 8개의 방정식을 만들 수 있고, 이것을 이용해서 계수를 구할 수 있다. 그러나, 8차 방정식의 근의 공식이 없는 관계로 일반적으로 수치해석적으로 해결해야 한다. 그리고, 주어진 4점이 (입력 또는 출력) 일직선상에 있으면 답을 구할 수 없고, 그 중에 3개만 일직선상에 있는 경우에는 이 변환은 평행성을 보존하는 affine 변환이 된다.(affine은 6개의 매개변수로 기술되고, 평행이동을 빼면, 4개의 매개변수가 남는데, 4차 방정식의 근의 공식이 있으므로 답을 적을 수 있다)

다행이 정사각형에서 사변형으로 변환은 수치해석에 의존하지 않고도 답을 적을 수 있다.
(0,0) -> (x0, y0);               
(1,0) -> (x1, y1);                         
(1,1) -> (x2, y2);
(0,1) -> (x3, y3);
==>
denom = (x1 - x2) * (y3 - y2) - (x3 - x2) * (y1 - y2);     
a11 = x1 - x0 + a13 * x1 ;
a21 = x3 - x0 + a23 * x3 ;
a31 = x0 ;
a12 = y1 - y0 + a13 * y1;
a22 = y3 - y0 + a23 * y3;
a32 = y0;
a13 = ((x0-x1+x2-x3)*(y3-y2) - (x3-x2)*(y0-y1+y2-y3)) / denom;
a23 = ((x1-x2)*(y0-y1+y2-y3) - (x0-x1+x2-x3)*(y1-y2)) / denom;
a33 = 1.0;


따라서 일반적인 사변형에서 사변형으로의 변환은 

사변형1 --> 정사각형 --> 사변형2


의 2단계 변환의 곱으로 주어진다. 사변형에 정사각형으로 변환은 정사각형에서 사변형으로 변환의 역변환이므로 역행렬을 구해야 하나, 이것 보다는 수치적으로 안정적인 adjoint행렬을 이용하는 것이 낳다(adjoint을 쓰면 determinant로 나누기를 할 필요가 없다). 이것은 perspective변환에서 항상 좌표를 3번째 좌표로 나누어서 사용하기 때문에 가능하다.


 


저작자 표시 비영리 변경 금지
신고

'Image Recognition' 카테고리의 다른 글

webcam용 QR code detector  (0) 2012.02.19
Least Square Estimation of Perspective Transformation  (4) 2012.02.15
Perspective Transformation  (2) 2012.02.14
Integral Image을 이용한 Adaptive Threshold  (0) 2012.02.04
Peak Finder  (1) 2012.02.02
QR-code : decoder  (0) 2012.01.26
Posted by helloktk