이미지 resampling은 센서에서 받은 신호를 sampling 해서 만든 영상을 확대하거나 줄이는 경우, 또는 기하학적인 변환을 걸쳐서 다시 영상을 생성하는 과정이다. 이 과정에서 출력 영상의 픽셀 좌표 (x, y)에 대응하는 입력 영상의 픽셀 좌표 (u, v)가 요구되는데 일반적으로 이 좌표값은 정수로 주어지지 않는다. 따라서 입력 영상에서 픽셀 값을 얻기 위해서는 (u, v)에 가장 가까운 정수에 해당하는 지점의 픽셀 값을 사용하거나(nearest neighbor interpolation), 아니면 (u, v) 주변의 픽셀 값들을 보간하는 함수를 찾아서 필요한 픽셀 값을 추정할 수 있다: bilinear interpolation, bicubic interpolation,...
실제 영상 데이터는 하드웨어적으로 스캔라인 방식으로 접근하므로 resampling 알고리즘도 스캔라인 방식에 맞추어서 수평방향으로 처리하고, 그 결과를 다시 수직방향으로 처리하는 separable 알고리즘이 요구된다. Fant 알고리즘은 스캔라인 방식이어서 하드웨어적으로 구현이 쉽도록 설계되었다.
resampling 중에서도 특히 down sampling을 할 때는 입력 픽셀 정보의 손실로 인해서 나타나는 계단 현상이나 모아레 무늬와 같은 alias를 줄이는 알고리즘이 필요하다. Fant 알고리즘에서는 각각의 입력 픽셀들이 출력 픽셀을 만드는데 얼마나 기여하는지를 고려하여 그 기여만큼 가중치를 주어 합산한다. 이렇게 하면 입력 픽셀의 정보의 손실을 줄어 alias 현상을 억제할 수 있다.
Fant 알고리즘은 일반적으로 출력 영상에 해당하는 입력 픽셀의 좌표가 주어지는 역변환(inverse mapping)에 대해서 사용이 된다. (참고: 이곳에서는 입력 영상에 대응하는 출력 영상의 좌표가 주어지는 정변환(forward mapping)에 대한 Fant 알고리즘의 구현이 있다)
참고:
// dst--->src;
// index ++ ;
// pointer += stride ;
/* stride = horizontal_scan=3; vertical_scan=bytes_per_line;*/
void fant_resample24_inverse(const BYTE src[], const int src_len, const int src_stride,
BYTE dest[], const int dest_len, const int dest_stride,
const float f[/*dest_len+1*/]) /*dest_pixel=>src_pixel map*/
{
float inseg, outseg ;
//dest scanline pixel projects into [0, src_len];
if (f[dest_len] < 0 || f[0] > src_len) return ;
//advance to;
for (int x = 0; f[x] < 0; x++) ;
int xl = x > 0 ? x - 1 : x ;
//
for (x = dest_len; f[x] > src_len; x--) ;
int xr = (x == dest_len) ? dest_len - 1 : x ;
//
float isf = f[xl + 1] - f[xl]; //inverse_size_factor;
if (f[x] < 0) {
inseg = 1;
outseg = isf + f[xl] ;
} else {
inseg = 1 - (f[0] - int(f[0]));
outseg = isf ;
}
//src_initial_pos
int u = f[x] < 0 ? 0 : int(f[xl]) ;
src += u * src_stride ;
int bval = src[0];
int gval = src[1];
int rval = src[2];
src += src_stride ;
u++ ;
//src_next_pos ;
int bnext = src[0];
int gnext = src[1];
int rnext = src[2];
src += src_stride ;
u++;
//dest_inital_pos;
dest += xl * dest_stride ;
float bsum = 0, gsum = 0, rsum = 0;
for (x = xl ; x <= xr; ) {
float binten = inseg * bval + (1 - inseg) * bnext;
float ginten = inseg * gval + (1 - inseg) * gnext;
float rinten = inseg * rval + (1 - inseg) * rnext;
if (inseg < outseg) {
bsum += binten * inseg ;
gsum += ginten * inseg ;
rsum += rinten * inseg ;
//
outseg -= inseg ;
inseg = 1;
//copy pixel values for next use;
bval = bnext ;
gval = gnext ;
rval = rnext ;
if (u < src_len) { //dest를 채우기에 부족한 부분은 마지막에서 계속 반복 사용;
bnext = src[0]; //여기서 끝낼수도 있음;
gnext = src[1];
rnext = src[2];
}
src += src_stride ;
u++ ;
} else {
bsum += binten * outseg ; bsum /= isf ;
gsum += ginten * outseg ; gsum /= isf ;
rsum += rinten * outseg ; rsum /= isf ;
dest[0] = (BYTE)min(max(bsum, 0), 255);
dest[1] = (BYTE)min(max(gsum, 0), 255);
dest[2] = (BYTE)min(max(rsum, 0), 255);
dest += dest_stride ;
//
bsum = gsum = rsum = 0;
inseg -= outseg ;
x++ ;
if (x == dest_len) break ;
isf = f[x + 1] - f[x] ;
outseg = isf ;
}
}
}
'Image Recognition' 카테고리의 다른 글
Gaussian Mixture Model & KMeans (4) | 2010.01.30 |
---|---|
Image Morphing (0) | 2010.01.24 |
Affine Transformation (0) | 2010.01.20 |
Color Counting (0) | 2010.01.18 |
Isometric Transformation (0) | 2010.01.11 |