728x90

http://www.lix.polytechnique.fr/~nielsen/tpami04-nn.pdf

Abstract—This paper explores a statistical basis for a process often described in computer vision: image segmentation by region merging following a particular order in the choice of regions. We exhibit a particular blend of algorithmics and statistics whose segmentation error is, as we show, limited from both the qualitative and quantitative standpoints. This approach can be efficiently approximated in linear time/space, leading to a fast segmentation algorithm tailored to processing images described using most common numerical pixel attribute spaces. The conceptual simplicity of the approach makes it simple to modify and cope with hard noise corruption, handle occlusion, authorize the control of the segmentation scale, and process unconventional data such as spherical images. Experiments on gray-level and color images, obtained with a short readily available C-code, display the quality of the segmentations obtained. 

인간은 영상을 보면 매우 쉽게 비슷한 픽셀 값을 갖는 영역으로 분리해서 인식을 한다. 우리가 보는 영상이 여러 개의 균일한 영역으로 나누어진 기본 영상에 랜덤 노이즈가 추가되어 만들어졌다고 생각해보자. 영상의 픽셀 값이 기본 영상의 픽셀 값에 일정 구간(Q)에서 값을 취하는 랜덤 변수가 더해져서 만들어졌다고 보면, 영상에서 다른 두 영역($R, R'$)의 픽셀 평균값의 차이 $(\overline{R}-\overline{R'})$와 기본 영상에서 랜덤 변수에 의한 통계적 기댓값의 차이 $(E(\overline{R}-\overline{R'}))$는 주어진 $0 < δ < 1$ 에 다음식을 만족함을 보일 수 있다.

따라서, 두 영역 $R$과 $R'$에 대해서 우변의 값이 이 부등식을 만족하지 않으면 두 영역은 하나로 인식될 수 있다.

 

#region count = 576; 많은 영역이 1픽셀로 구성이 되었있다;
#region count > 1 = 302;
#region count > 2 = 222;
#region count > 3 = 179;
#region count > 4 = 140;

 

 

'Image Recognition' 카테고리의 다른 글

RANSAC Ellipse Fitting  (1) 2012.10.07
Autofocus Algorithm  (0) 2012.06.03
Statistical Region Merging  (2) 2012.03.25
Local Histogram Equalization  (0) 2012.03.10
2차원 Savitzky-Golay Filters 응용  (0) 2012.02.28
webcam용 QR code detector  (0) 2012.02.19
Posted by helloktk

댓글을 달아 주세요

  1. 올림 2013.07.31 01:52  댓글주소  수정/삭제  댓글쓰기

    국내 모 대학에서 석사 공부하고 있는 학생인데...
    최근에 srm 공부하면서 paper 가 잘 이해가 안 되서 인터넷 검색하다가 이 글을 보게 되었습니다. paper 에 보면 Q 가 랜덤 변수이고 구간은 g/Q 라고 되어 있는 것 같은데, 맞는지요?

    위에서 말씀하신 "기본 영상의 균일한 영역에서 랜덤변수는 일정한 구간에서 값을 취하여, 영역의 픽셀 값과 더해져서 실제영상의 픽셀값을 만든다" 이 부분을 자세히 좀 설명해 주실 수 있는지요.

    미리 감사합니다.

    • helloktk 2013.08.01 17:53 신고  댓글주소  수정/삭제

      오래되고 자료도 없고, 요즘은 이 분야에 관심을 둘 여유가 없어서 자세한 답은 할 수가 없군요. Q가 랜덤변수가 아니고 각 영상의 채널을 몇 개의 구간으로 분할 할 것인가에 대한 외부값일 것입니다. Q=1이면 원래의 영상으로 나오겠지요. Q=2이면 [0,127][128,255]두 개의 그레이값의 영역으로 구별이 되고 ([0,127]-->0, [128,255]-->128인 두 기본영역) 실제 이 영상은 이 기본영상에 [0,127]사이의 값을 가지는 랜덤변수가 더해서진 결과로 표현된다는 의미일 것입니다.