高 頌,李富棟
(空軍駐錦州地區(qū)軍事代表室,遼寧錦州121000)
圖像邊緣是圖像的一個(gè)屬性區(qū)域和另一個(gè)屬性區(qū)域的交界處,是區(qū)域?qū)傩园l(fā)生突變的地方(如方向、階躍性質(zhì)、形狀等)。邊緣檢測(cè)是圖像分割、目標(biāo)區(qū)域識(shí)別、區(qū)域形狀提取等圖像分析方法的基礎(chǔ)。在目標(biāo)的識(shí)別與跟蹤處理中,目標(biāo)圖像的邊緣提取是一項(xiàng)關(guān)鍵技術(shù)。本文就圖像的邊緣特性、邊緣和區(qū)域的聯(lián)合分割、主動(dòng)輪廓算法等,作進(jìn)一步的研究和探討[1]。
圖像的邊緣特性是沿著邊緣走向的切向方向的像素灰度值變化比較平緩,而沿著邊緣法向方向的像素灰度值變化會(huì)表現(xiàn)得很劇烈。所以找出符合邊緣特性的像素的微分算子也就找到了提取邊緣的合適的算法[2]。
圖1是幾個(gè)包含典型細(xì)節(jié)的簡(jiǎn)單圖像。從圖中可以看出,當(dāng)畫(huà)面由亮變暗逐漸變化時(shí),其灰度的變化是斜坡的;一般來(lái)說(shuō),不時(shí)出現(xiàn)的孤立點(diǎn)就是噪聲,出現(xiàn)孤立點(diǎn)時(shí),可以看到其灰度的變化是一個(gè)突起的尖峰;如果進(jìn)入平緩均勻變化的區(qū)域,那么其灰度變化為一條直線;如果出現(xiàn)一條細(xì)線,則其灰度變化是一個(gè)比孤立點(diǎn)略顯平緩的尖峰;當(dāng)畫(huà)面由黑突然變到亮?xí)r,其灰度變化是一個(gè)階躍。
圖1 圖像的邊緣特性
從導(dǎo)數(shù)含義來(lái)看,“一階導(dǎo)數(shù)”是描述“數(shù)據(jù)的變化率”,“二階導(dǎo)數(shù)”是描述“數(shù)據(jù)變化率的快慢”。對(duì)于圖像細(xì)節(jié)變化的描述,或者說(shuō)檢測(cè),都可以通過(guò)一階或者二階導(dǎo)數(shù)來(lái)實(shí)現(xiàn)。
由于噪聲等影響,基于邊緣的分割算法分割得到的圖像邊緣往往不連續(xù),需要進(jìn)一步進(jìn)行邊緣連接處理;為了克服圖像分割空間不連續(xù)的缺點(diǎn),基于區(qū)域的分割算法得到了一定范圍的應(yīng)用,但由于閾值的選擇常常不甚合理,會(huì)造成對(duì)圖像的過(guò)度分割。而聯(lián)合分割算法是充分利用了圖像的邊緣和區(qū)域兩方面的信息,將兩種算法的優(yōu)點(diǎn)充分加以利用,從而提高圖像分割的總體效能[3]。
例如,Otsu的區(qū)域分割方法。Otsu方法即最大類間方差閾值選擇法,應(yīng)用于圖像直方圖有雙峰但無(wú)明顯波谷或雙峰和波谷都不明顯的情況,最佳閾值選取類間方差最大的灰度值,以得到較好的分割效果。
設(shè)一幅圖像的灰度范圍為[0,L-1],對(duì)應(yīng)灰度級(jí)i的像素?cái)?shù)為ni,則總像素?cái)?shù),各像素值的概率pi=ni/n。把圖像中的像素按灰度值用閾值T分成C1和C2兩類,C1由灰度值在[0T]范圍內(nèi)的像素點(diǎn)組成,C2由灰度值在[T+1L-1]范圍內(nèi)的像素點(diǎn)組成。
C1對(duì)應(yīng)的概率和均值為:
C2對(duì)應(yīng)的概率和均值為:
整幅圖像的均值為:
類間方差為:
圖2 Otsu分割結(jié)果
從圖2可看出基于Otsu的單閾值分割結(jié)果,基本上可以正確得到目標(biāo),但對(duì)于橢球體產(chǎn)生了過(guò)分割現(xiàn)象。
主動(dòng)輪廓模型線就是一個(gè)二維變形曲線,只不過(guò)該曲線的變形行為被內(nèi)部力和外部力所規(guī)范,使其在總能量一定的情況下進(jìn)行演化,內(nèi)部力約束了該曲線形變的連續(xù)性和平滑性,外部力用來(lái)牽引該曲線向著待處理圖像的特征邊緣逼近。通過(guò)對(duì)能量函數(shù)的最小化,輪廓線在內(nèi)、外力的共同作用下,完成了向待處理圖像的目標(biāo)邊緣的演化任務(wù)。能夠把對(duì)圖像的先驗(yàn)知識(shí)和人機(jī)交互融入到主動(dòng)輪廓線的演化過(guò)程,這一點(diǎn)是利用該方法進(jìn)行圖像分割的最根本的好處,這樣,不難理解圖像分割結(jié)果的準(zhǔn)確性將會(huì)得到大大的提高[4]。
因?yàn)橹鲃?dòng)輪廓模型算法所特有的優(yōu)越性,它自從Snake模型被提出以來(lái),改進(jìn)的模型和算法不斷地涌現(xiàn)。在這里把該模型依其曲線表示方法的不同分成為三個(gè)主要類別:
(1)基于離散點(diǎn)的主動(dòng)輪廓模型。預(yù)先設(shè)定的二維曲線是采用有序離散點(diǎn)集來(lái)表示的,也把點(diǎn)集中的元素稱呼為控制點(diǎn)或者蛇點(diǎn)。當(dāng)該模型應(yīng)用在極坐標(biāo)系下時(shí),也被稱為主動(dòng)射線。但對(duì)極坐標(biāo)形式的模型應(yīng)用的不多,因此對(duì)直角坐標(biāo)系下的表達(dá)式進(jìn)行介紹。
(2)參數(shù)化主動(dòng)輪廓模型。模型中采用的參數(shù)是用基本函數(shù)來(lái)表示的。一些常見(jiàn)的曲線,如B樣條曲線、Fourier展開(kāi)式等函數(shù)常在這里被用作基本函數(shù)。
(3)幾何主動(dòng)輪廓模型。在該模型中的平面曲線是用一個(gè)二維的曲面水平集來(lái)表示的。
從分類描述上來(lái)看,基于點(diǎn)的主動(dòng)輪廓模型可以看做是參數(shù)化主動(dòng)輪廓模型的特例情況,而且隨著基函數(shù)個(gè)數(shù)的增加,兩者可以近似地看成一個(gè)模型。
該模型的數(shù)學(xué)描述如下所示:
從前面的論述可以知道,整個(gè)圖像處理的過(guò)程就是通過(guò)求能量函數(shù)Esnake的最小值過(guò)程,這樣迫使輪廓曲線向能量降低的方向進(jìn)行演化。從參數(shù)域s∈[0,1)到圖像表面曲線的映射是由函數(shù)C(s)=C(x(s),y(s))來(lái)表示的。式(5)中Eint是由內(nèi)部力產(chǎn)生的能量,用來(lái)維持演化曲線的連續(xù)性和平滑性,它在這里被定義為:
曲線對(duì)空間參數(shù)的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)都包含在該能量函數(shù)中。其中,一階導(dǎo)數(shù)部分體現(xiàn)了輪廓線的彈性,二階導(dǎo)數(shù)部分體現(xiàn)了輪廓線的剛性,彈性和剛性在內(nèi)部能量中的比重由系數(shù)α(s),β(s)來(lái)調(diào)節(jié)。特殊的,當(dāng)α(s)=0時(shí),表明曲線在該點(diǎn)處是斷開(kāi)的;當(dāng)β(s)=0時(shí),表明曲線在該點(diǎn)處可能是一個(gè)角點(diǎn)。
在式(5)中,Eext是由外部力產(chǎn)生的能量函數(shù),在這里對(duì)它這樣定義:
在式(7)中,Eimage是由圖像力產(chǎn)生的能量,Econ是由約束力產(chǎn)生的能量。目標(biāo)輪廓等圖像特征是用圖像能量Eimage來(lái)表示,它的分量寫(xiě)成以下形式:
在式(8)中,把Eline稱為線能量,把Eedge稱為邊緣能量,把Eterm稱為端點(diǎn)能量;再用wline,wedge,wterm分別來(lái)表示各項(xiàng)的加權(quán)值,這個(gè)權(quán)值起到調(diào)節(jié)各項(xiàng)比重的作用。在Kass等人所構(gòu)建的Snake模型中,wline,wedge,wterm分別被定義為:
在式(11)中,I(x,y)為原圖像I(x,y)的梯度,g(x,y)為經(jīng)過(guò)平滑處理過(guò)的圖像[4]。
隨著主動(dòng)輪廓模型的進(jìn)一步發(fā)展,出現(xiàn)了CV模型圖像分割方法:待處理圖像中每個(gè)同質(zhì)區(qū)域的亮度被假設(shè)為常數(shù),那么把上述的能量函數(shù)進(jìn)行最小化運(yùn)算的目的,就是要探索一個(gè)能使得分割得到的圖像和原圖像之間的相似性達(dá)到最大的最優(yōu)化分。
首先令待處理圖像被演化曲線分成了目標(biāo)和背景兩個(gè)獨(dú)立區(qū)域,那么C-V模型的能量函數(shù)表達(dá)式可以這樣來(lái)描述:
對(duì)于輪廓線C位于兩個(gè)不同質(zhì)區(qū)域時(shí),F(xiàn)(C)不能達(dá)到最小值。所以又提出了另一個(gè)圖像分割的能量函數(shù),表達(dá)式為:
在式(13)中,閉合輪廓線的長(zhǎng)度用L(C)來(lái)表示,C的內(nèi)部區(qū)域面積用S0(C)來(lái)表示,μ,ν≥0,λ是權(quán)重系數(shù)。通過(guò)對(duì)上述表達(dá)式進(jìn)行最優(yōu)化處理,得到了最優(yōu)的圖像分割效果??梢砸罁?jù)初始的輪廓曲線C0構(gòu)造出水平集函數(shù),表示為。有:
從上述的論述可以知道,圖像函數(shù)I(x,y),以及輪廓曲線Ca,Cb都是具有全局特性的參數(shù)變量,從此分析可以看出,C-V模型圖像分割方法的一個(gè)顯著特點(diǎn)就是著眼全局,全面優(yōu)化。
圖3分別給出了利用C-V模型圖像處理方法對(duì)水下目標(biāo)圖像球體進(jìn)行不同次數(shù)的迭代所得到的結(jié)果,從中可以清晰地看到輪廓曲線隨著迭代次數(shù)的增加逐漸逼近待檢測(cè)圖像的邊緣的過(guò)程。經(jīng)過(guò)100次迭代運(yùn)算后,輪廓已經(jīng)很好地逼近球體邊緣。但C-V模型的分隔算法與初始輪廓關(guān)系較大,而初始輪廓的選擇問(wèn)題是C-V模型應(yīng)用于水下圖像分割的關(guān)鍵問(wèn)題。同時(shí)可以看出,在分割過(guò)程中出現(xiàn)了小的空洞,可以通過(guò)二值化后面積標(biāo)記的算法進(jìn)一步去除分割過(guò)程中出現(xiàn)的小空洞。最終得到分割結(jié)果,如圖4所示。
采用邊緣和區(qū)域的聯(lián)合分割和主動(dòng)輪廓算法C-V模型算法,而C-V模型更適用于水下的球體、橢球體邊緣檢測(cè),具有提取的邊緣連續(xù)的優(yōu)點(diǎn)。當(dāng)然,在處理不同的實(shí)際問(wèn)題時(shí),針對(duì)環(huán)境條件和要求的不同,可以選擇適合的算子進(jìn)行圖像邊緣提取[5]。
[1] Li Xiaomao,Tang Yandong,Min Li.Elliptic object detection based on shape preserving and active contour[J].Opto-Electronic Engineering,2008,35(2):79 -84.(in Chinese)
李小毛,唐延?xùn)|,閔莉.基于形狀保持主動(dòng)輪廓的橢圓狀目標(biāo)檢測(cè)[J].光電工程,2008,35(2):79-84.
[2] Li Xiaomao,Wang Zhifeng,Tang Yandong.Long straight bar detection based on shape preserving active contour model[J].Computer Engineering,2008,34(1):53 - 55,58.(in Chinese)
李小毛,王智峰,唐延?xùn)|.基于形狀保持主動(dòng)輪廓模型長(zhǎng)直條的檢測(cè)[J].計(jì)算機(jī)工程,2008,34(1):53 -55,58.
[3] Luo Honggen,Zhu Limin,Ding Han.A survey on image segmentation using active contour and level set method[J].Journal of Image and Graphics,2006,11(3):301 -308.(in Chinese)
羅紅根,朱利民,丁漢.基于主動(dòng)輪廓模型和水平集方法的圖像分割技術(shù)[J].中國(guó)圖象圖形學(xué)報(bào),2006,11(3):301-308.
[4] Wu Jiming,Zhu Xuefeng,Xiong Jianwen,et al.A fast active contourmodel for image segmentanon driven by local region energy[J].Journal of Optoelectronics· Laser,2010,(1):140 -143.(in Chinese)
吳繼明,朱學(xué)峰,熊建文,等.圖像分割中局部能量驅(qū)動(dòng)的快速主動(dòng)輪廓模型[J].光電子·激光,2010(01):140-143.
[5] Zhang Kaihua,Zhou Wengang,Zhang Zhen,et al.Improved C - V active contour model[J].Opto-Electronic Engineering,2008(12):112 -116.(in Chinese)
張開(kāi)華,周文罡,張振,等.一種改進(jìn)的C-V主動(dòng)輪廓模型[J].光電工程,2008(12):112-116.