郭昕
(西安交通大學電子與信息工程學院,陜西西安710049)
統(tǒng)計區(qū)域合并的彩色圖像分割算法*
郭昕
(西安交通大學電子與信息工程學院,陜西西安710049)
∶針對傳統(tǒng)區(qū)域合并算法中存在的分割復雜度高、分割精度低的問題,提出一種將統(tǒng)計理論應用于區(qū)域合并的彩色圖像分割算法,該算法通過建立圖像生成模型,得到新的合并預測準則,有效地避免合并過程中可能導致的區(qū)域邊界破壞,提高分割精度,降低分割復雜度。在對已有算法分析的基礎上,提出基于古典概率理論的圖像生成模型,重點介紹區(qū)域合并思想與統(tǒng)計理論相結合的合并預測準則,該準則是逐步松弛的,確保在無像素遺漏的同時分割的精度。算法不但考慮了像素的相似性,還考慮了空間上的鄰接性,因此可以有效消除孤立噪聲的干擾。通過與基于連接圖的系統(tǒng)工程分割方法比較發(fā)現(xiàn),文中算法的運算時間具有明顯優(yōu)勢。實驗結果表明,該算法還具有較高的分割精確度和較強的魯棒性,分割尺度可調。
∶彩色圖像分割;觀測圖像;統(tǒng)計區(qū)域;合并預測
在科學研究及應用中,人們往往只關注圖像中的特定部分。這些部分就常被定義為目標或者前景。為了對這些特定部分進行分析研究,往往需要將其從整體圖像中分割提取出來[1]。圖像分割,即一種將圖像分成若干個特定的、具有獨特性質的區(qū)域并提取感興趣目標的技術。提取出的目標可以用于圖像語義識別[1]、圖像搜索等領域[2]。
目前圖像分割法主要有∶基于區(qū)域的分割法,包括區(qū)域生長法和分裂合并法,其分割過程后續(xù)步驟的處理要根據(jù)前面步驟的結果進行判斷而確定;基于邊緣的分割法,是利用不同區(qū)域間象素灰度不連續(xù)的特點檢測出區(qū)域間的邊緣,從而實現(xiàn)圖像分割[3];基于區(qū)域和邊界技術相結合的分割法,它是將基于區(qū)域的方法和邊緣檢測的方法相結合的圖像分割法;基于特定理論的分割法,包括基于數(shù)學形態(tài)學的邊緣檢測方法、基于模糊集理論的方法、基于小波變換的邊緣檢測方法和基于神經(jīng)網(wǎng)絡的分割方法等[4]。
圖像分割算法的研究已有幾十年的歷史,借助各種理論至今已提出了上千種各種類型的分割算法。但由于尚無通用分割理論,因此沒有一種適合于所有圖像的通用的分割算法。
設觀測圖像I有|I|個像素點(其中符號|I|代表基數(shù)),每個像素點包含紅綠藍(RGB)值,它們都屬于集合{1,2,…,m},實際中設m=256.
統(tǒng)計圖像I*將給定待分割圖像的像素點表示為一系列分布族,I*中任意統(tǒng)計區(qū)域內部具有一致性,即對于給定色彩通道∈{RGB},任意統(tǒng)計區(qū)域的像素點均具有相同期望,且在至少一個色彩通道∈{RGB}內,相鄰統(tǒng)計區(qū)域的期望不同。也就是說,統(tǒng)計圖像I*中的每個像素在每個色彩通道,均由一系列N維獨立隨機變量(r.v.)代替,區(qū)域邊界取正值g/N,這樣任何N維獨立隨機變量(r.v.)總和均屬于{1,2,…,m}。
I是未知的統(tǒng)計圖像I*的觀測圖像,是由I*中觀測RGB色彩通道采樣得到的。圖1給出了一幅統(tǒng)計圖像I*(由下文算法得到)以及由該統(tǒng)計圖像生成的觀測圖像I.
考慮到均一性,統(tǒng)計區(qū)域之間的邊界是具有不同色彩期望值的連通像素點,I的理想分割就是基于統(tǒng)計區(qū)域I*邊界,如圖1(a)和圖1(b)所示。
需要注意的是,每個像素的采樣和它的顏色通道應該彼此獨立,這是文中關于統(tǒng)計圖像I*的唯一假設。頻率獨立同分布假設并非充分條件,即在統(tǒng)計區(qū)域內,只要滿足均一性,對應于每個像素的所有分布均可有所不同?;谏鲜黾僭O,引入尺度調節(jié)因子N,使模型更具實用性。N=1會使得對于小區(qū)域的估計可靠性變差,那么,就要考慮增大圖片尺寸圖像來提高統(tǒng)計分割的準確性。參數(shù)N的意義在于量化統(tǒng)計圖像I*的統(tǒng)計復雜度。從實踐的角度來看,調節(jié)N值可以控制分割的精細程度,使得構建多尺度分割成為可能。
圖1 統(tǒng)計圖像及對應的觀測圖像Fig.1 Statistical image and the corresponding observed image
2.1 合并預測
首先陳述合并預測的理論基礎。
設X=(X1,X2,…,Xn)是一組n維獨立隨機變量,Xk的值屬于集合Ak,假定實函數(shù)f滿足|f(x)-f'(x)|≤ck,其中向量x與x'僅在k軸不同。設μ為f(X)的值,則對于任何一個τ≥0,
其中Pr是概率,τ是一個大于零的常量;Ck為f(x)與其倒數(shù)之差。
由以上定理[5],得到推論∶設區(qū)域對(R,R')屬于觀測圖像I,?0<δ≤1有,
其中E(R)是觀測區(qū)域R中所有統(tǒng)計像素的期望,ˉR是觀測區(qū)域R的均值。
綜上,合并預測公式為
將上述合并預測理論應用于彩色圖像(RGB),得到的預測公式如下
2.2 合并順序
判定觀測圖像中任意兩相鄰區(qū)域是否可以合并需要遵循一定的順序[6],為了得到一個合理的順序,下文提出不變量A.
定義A為在任何兩個統(tǒng)計區(qū)域之間進行合并預測計算之前,需要完成在這2個區(qū)域內的所有的合并預測計算。
需要注意的是,不變量A并沒有以統(tǒng)計圖像I*的分割知識為先驗條件。為了說明為何需要滿足不變量A,首先需要明確分割過程中可能遇到的3類分割錯誤[7]。第1,針對于分割結果太粗(欠分割),在該種情況下,一個或多個分割區(qū)域是統(tǒng)計區(qū)域的子區(qū)域;第2,針對于分割結果太細(過分割),在該種情況下,一些分割區(qū)域包含多個統(tǒng)計區(qū)域;第3,針對一種“混合”情況,在該種情況下,一些分割區(qū)域包含多個統(tǒng)計區(qū)域的子區(qū)域。
不變量A可以定量以及定性地控制分割錯誤。下文提出的定理用于說明過分割發(fā)生的概率上限。此定理中,定義s*(I)為觀測圖像I的理想分割區(qū)域集合,s(I)為觀測圖像I的區(qū)域集合。
當概率≥1-O(|I|δ),觀測圖像I滿足不變量A的分割是統(tǒng)計圖像I*的過分割。即?0∈s*(I),?R∈s(I)∶O?R.
對?0<δ<1,且概率≥1-O(|I|δ),
2.3 算法描述
在四連通區(qū)域,存在N<2|I|對連通像素點,設SI為這些像素對的集合,f(p,p')是一個實函數(shù),其自變量是觀測圖像I中的p和p'個像素點。
筆者提出的基于統(tǒng)計區(qū)域合并的彩色圖像分割算法,首先,將SI中的像素利用函數(shù)f(p,p')進行升序排列,然后,單次遍歷這一序列,對現(xiàn)有排布中?(p,p')∈SI且滿足R(p)≠R(p')的像素對,計算其P(R(p),r(p')),若結果為1則合并R (p)與R(p').可見,選擇一個適當?shù)膄(p,p')是至關重要的。
3.1 算法實現(xiàn)結果
由文中提出的圖像生成模型得到的觀測圖像中,任意劃分區(qū)域的內部色彩方差小于區(qū)域之間的色彩方差。因此,先計算像素間局部梯度[8],再代入函數(shù)f(p,p')計算每個通道的最大變化量,即可得到f(p,p')。
對于fa(p,p'),算法為
采用文中提出的圖像分割算法得到的實驗結果,需要說明,實驗中采用的圖片是從北京星聯(lián)圖客科技有限公司“微利圖片庫”購買的110張彩色攝影圖片,未經(jīng)任何處理,分辨率均為300 dpi,格式為“.bmp”,尺寸從1 650*2 482到5 120*3 413不等[9]。
基于這一理論,編程實現(xiàn)算法,圖2(a)、圖2 (b)分別為ipc004.bmp及其分割結果。
圖2 Ipc004.bmp及其分割結果Fig.2 Ipc004.bmp and the segmentation result
另外,表1給出在產(chǎn)生相同區(qū)域數(shù)情況下算法與JSEG算法[10]的耗時對比。表中的ipc004. bmp,ipc005.bmp,ipc072.bmp分別對應圖2,圖4,圖5中原始圖像。
表1 文中算法與jseg算法的耗時對比Tab.1 Time-consum ing of our algorithm and JSEG algorithm s
3.2 算法分割尺度調節(jié)
圖3(a)從左上到右下依次為N值取256,128,64,32,16,8,4,2,1時的統(tǒng)計圖像。圖3(b)為對應的觀測圖像。
從實驗結果可以看出,隨著分割尺度N值的不斷增加,劃分得到的區(qū)域越來越小,而它們往往對應于不同尺度下更小的圖像感知區(qū)域。例如,隨著櫻桃圖像被逐漸分割,它的葉脈以及背景中虛化的葉片等細節(jié)逐漸顯現(xiàn)出來。
圖3 不同尺度下的統(tǒng)計圖像及對應的觀測圖像Fig.3 Different scales statistical images and the corresponding observed image
3.3 算法抗噪性分析
圖4展示了圖片庫中ipc005.bmp加入不同等級的加性高斯白噪聲[11](awgn)后采用文中提出算法進行圖像分割的結果,其中縱列由左到右依次為原始圖像、統(tǒng)計圖像、觀測圖像以及分割結果,橫列由上到下依次對應退化等級由小到大。
3個等級選取的退化參數(shù)[12]分別為0.004,0. 018,0.036(退化參數(shù)增大,對應的退化程度加重)。實驗中采用δ=1/(6(I)2),N=32.
從實驗結果可以看出,對于三個等級的失真,文中提出的算法可以得到比較理想的分割結果,當尺度較小時,依然可以實現(xiàn)有效分割,同時為了對比算法的魯棒性,抗噪性能較為顯著。
圖4 Ipc005.bmp及其三個等級的加性高斯白噪聲時得到的分割結果Fig.4 Ipc005.bmp and the segmentation result of three levels of the additive Gauss white noise
3.4 關于遮擋的討論
圖5 具有遮擋的ipc072.bmp的分割結果Fig.5 Segmentation results of ipc072.bmp picture with shielding
文中算法屬于區(qū)域合并的分割方法。在基于區(qū)域的分割方法中,區(qū)域是一系列具有均勻性的像素的集合,通過不斷合并更小的區(qū)域或像素進行迭代生長。這種方法需要事先進行決定合并區(qū)域的統(tǒng)計測試,隨后進行合并預測,進而建立基于局部決策的分割算法。
將古典概率思想應用于圖像分組問題,將圖像分割視為基于未知的統(tǒng)計圖像的觀測圖像區(qū)域重建,給出了一種全新的圖像生成模型;通過處理由模型生成的觀測圖像,結合區(qū)域合并思想以及2個統(tǒng)計性質,提出了區(qū)域合并預測準則;實現(xiàn)了精確性高、復雜度低的的彩色圖像分割算法,并與其他算法進行比較分析。該算法在實驗中取得了理想的效果,能較好地滿足圖像分割的精確性要求,具有一定的抗噪聲干擾能力,可應用于不同尺度的分割。在未來的研究中,將從實踐應用角度對該算法進行更加深入地分析。
References
[1]李繪卓,范勇,唐駿,等.一種非線性變換的雙直方圖紅外線增強方法[J].計算機工程與應用,2014 (9)∶155-159.
LIHui-zhuo,F(xiàn)AN Yong,TANG Jun,et al.A nonlinear transformation of double histogram infrared enhanced method[J].Computer Engineering and Application,2014(9)∶155-159.
[2]岳改麗,王棟,楊蕊.幾種邊緣檢測算子在紅外圖像處理方面應用研究[J].西安科技大學學報,2012,32(4)∶500-504.
YUE Gai-li,WANG Dong,YANG Rui.Application of several edge detection operator in infrared images processing[J].Journal of Xi’an University of Science and Technology,2012,32(4)∶500-504.
[3]邵明,徐向纮.分水嶺變換和統(tǒng)計區(qū)域合并的圖像分割算法研究[J].中國計量學學報,2012,12(23)∶373-378.
SHAO Ming,XU Xiang-hong.Image watershed transformation and statistical regionmerging image segmentation algorithm[J].Journal of Chinese Measurement,2012,12 (23)∶373-378.
[4]劉海賓,何希勤,劉向東.基于分水嶺和區(qū)域合并的圖像分割算法[J].計算機應用研究,2007,3(9)∶158 -170.
LIU Hai-bin,HE Xi-qin,LIU Xiang-dong.Algorithm for image segmentation based on watershed and region merging[J].Application Research of Computers,2007,3 (9)∶158-170.
[5]McDiarmid C,Habib M,McDiarmid C,et al.Probabilisticmethods for algorithmic discretemath[M].Springer-Verlag Berlin and Heidelberg Gmb H&Co.K,1998.
[6]許元飛.基于紋理的圖像檢索算法[J].西安科技大學學報,2013,33(4)∶470-474.
XU Yuan-fei.The image retrieval algorithm based on texture[J].Journal of Xi’an University of Science and Technology,2013,33(4)∶470-474.
[7]段娜,劉力政.基于最大間隔符號特征的車牌字符分割算法[J].西安科技大學學報,2014,34(5)∶620 -624.
DUAN Na,LIU Li-zheng.Characteristics segmentation of license plate based on the features ofmaximum interval segmentationmethod[J].Journal of Xi’an University of Science and Technology,2014,34(5)∶620-624.
[8]項德良,粟毅,趙凌君,等.一種基于局部梯度比率特征度量SAR圖像相似性的新方法[J].電子學報,2014,42(1)∶9-13.
XIANG De-liang,SU Yi,ZHAO Ling-jun,et al.A local gradient ratio featuremeasurement based on SAR image similaritymethod[J].Acta Electronica Sinica,2014,42 (1)∶9-13.
[9]王秀晚.基于眼動信號的混合失真類型圖像質量主觀數(shù)據(jù)庫的建設研究[D].西安∶西安交通大學,2013.
WANG Xiu-wan.Study on the construction ofmixed eye movement signal distortion type based on image quality subjective database[D].Xi’an∶Xi’an Jiaotong University,2013.
[10]Yining Deng,Manjunath B S.Hyundoo shin,color image segmentation[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition,1999.
[11]張敏.基于邊緣點位置的圖像質量視覺感知模型[D].西安∶西安交通大學,2010.
ZHANG Min.Image quality visual perception model based on the position of edge points[D].Xi’an∶Xi’an Jiaotong University,2010.
[12]張曉光,李蕾蕾,高芳,等.可變碼長的OFCDM系統(tǒng)及其仿真分析[J].西安科技大學學報,2012,32 (2)∶264-268.
ZHANG Xiao-guang,LILei-lei,GAO Fang,et al.Variable code length of OFCDM system and its simulation analysis[J].Journal of Xi’an University of Science and Technology,2012,32(2)∶264-268.
Color image segmentation method of statistical region merging
GUO Xin
(School of Electronic and Information Engineering,Xi’an Jiaotong University,Xi’an 710049,China)
∶Aiming at the traditional region merging segmentation algorithm with the problems of high complexity and low accuracy,an image segmentation method based on statistical region merging is proposed.Through the establishment of image generation model,this paper obtains the new merging prediction criteria which effectively avoids the region boundary damage in the merging process,improves the segmentation accuracy and reduces the segmentation complexity.Based on the analysis of existing algorithm,amodel of image generation is generated using classical probability theory,then themerging prediction criteria as a blend of the region merging and the statistical property is explained in detail.This criteria is gradually relaxed,ensuring segmentation accuracy without pixel omission.This algorithm not only considers the similarity of pixel but also the adjacency space,therefore it can effectively eliminate the interference of isolated noise.By comparison with the Joint Systems Engineering Group Segmentation Method,this algorithm has obvious advantages in computation time.Experimental results show that the algorithm with the adjustable segmentation scale is of high segmentation accuracy and strong robustness.
∶color image segmentation;observed image;statistical region;merging prediction
∶TP 391.4
∶A
00/j.cnki.xakjdxxb.2015.0320
∶1672-9315(2015)03-0392-05
∶2015-02-24責任編輯∶高佳
∶郭昕(1991-),女,陜西西安人,碩士研究生,E-mail∶56185538@qq.com