http://www.lix.polytechnique.fr/~nielsen/tpami04-nn.pdf
Abstract—This paper explores a statistical basis for a process often described in computer vision: image segmentation by region merging following a particular order in the choice of regions. We exhibit a particular blend of algorithmics and statistics whose segmentation error is, as we show, limited from both the qualitative and quantitative standpoints. This approach can be efficiently approximated in linear time/space, leading to a fast segmentation algorithm tailored to processing images described using most common numerical pixel attribute spaces. The conceptual simplicity of the approach makes it simple to modify and cope with hard noise corruption, handle occlusion, authorize the control of the segmentation scale, and process unconventional data such as spherical images. Experiments on gray-level and color images, obtained with a short readily available C-code, display the quality of the segmentations obtained. 

영상를 보면 인간은 비슷한 픽셀값을 모아서 몇 개의 영역으로 쉽게 나누어서 인식을 한다.  역으로, 우리가 보는  실제영상이 여러 개의 균일한 영역으로 나누어진 기본영상에 추가된 랜덤노이즈에 의해서 만들어졌다고 생각해 보자. 기본영상의 균일한 영역에서 랜덤변수는 일정구간(Q)에서 값을 취하여, 영역의 픽셀값과 더해져서 실제영상의 픽셀값 (0, ... g - 1 = 255)을 만든다. 이렇게 만들어진 실제영상에서의 두 영역의 픽셀평균값의 차이와 기본영상에서 랜덤변수에 의한 통계적 기대값의 차이는 주어진 0 < δ < 1 에 다음과 같은 하한을 갖음을 보일 수 있다:

따라서, 이 하한보다 작은 경우에서 두 영역은 하나로 인식될 수 있다.


#region count = 576; 많은 영역이 1픽셀로 구성이 되었있다;
#region count > 1 = 302;
#region count > 2 = 222;
#region count > 3 = 179;
#region count > 4 = 140;



'Image Recognition' 카테고리의 다른 글

RANSAC Ellipse Fitting  (1) 2012.10.07
Autofocus Algorithm  (0) 2012.06.03
Statistical Region Merging  (2) 2012.03.25
Savitzky-Golay Filter의 주파수 특성  (0) 2012.03.03
2차원 Savitzky-Golay Filters 응용  (0) 2012.02.28
webcam용 QR code detector  (0) 2012.02.19
Posted by helloktk

댓글을 달아 주세요

  1. 올림 2013.07.31 01:52  댓글주소  수정/삭제  댓글쓰기

    국내 모 대학에서 석사 공부하고 있는 학생인데...
    최근에 srm 공부하면서 paper 가 잘 이해가 안 되서 인터넷 검색하다가 이 글을 보게 되었습니다. paper 에 보면 Q 가 랜덤 변수이고 구간은 g/Q 라고 되어 있는 것 같은데, 맞는지요?

    위에서 말씀하신 "기본 영상의 균일한 영역에서 랜덤변수는 일정한 구간에서 값을 취하여, 영역의 픽셀 값과 더해져서 실제영상의 픽셀값을 만든다" 이 부분을 자세히 좀 설명해 주실 수 있는지요.

    미리 감사합니다.

    • helloktk 2013.08.01 17:53 신고  댓글주소  수정/삭제

      오래되고 자료도 없고, 요즘은 이 분야에 관심을 둘 여유가 없어서 자세한 답은 할 수가 없군요. Q가 랜덤변수가 아니고 각 영상의 채널을 몇 개의 구간으로 분할 할 것인가에 대한 외부값일 것입니다. Q=1이면 원래의 영상으로 나오겠지요. Q=2이면 [0,127][128,255]두 개의 그레이값의 영역으로 구별이 되고 ([0,127]-->0, [128,255]-->128인 두 기본영역) 실제 이 영상은 이 기본영상에 [0,127]사이의 값을 가지는 랜덤변수가 더해서진 결과로 표현된다는 의미일 것입니다.