顏學(xué)穎 焦李成
(西安電子科技大學(xué)智能感知與圖像理解教育部重點實驗室 西安 710071)
圖像分割是將圖像中某些具有不同特殊意義的區(qū)域區(qū)分開來,每個區(qū)域具有某種特性的一致性?;趫D像的目標(biāo)檢測、識別和理解都依賴于前期圖像分割的質(zhì)量[1]。圖像分割在自然圖像處理,SAR圖像處理以及醫(yī)學(xué)圖像處理中有著廣泛地應(yīng)用。門限技術(shù)是一種簡單而有效的圖像分割方法,它利用像素點的灰度信息進(jìn)行分割。在所有的門限分割方法中,由于Otsu方法有著快的計算速度并且在應(yīng)用中有著較好的分割性能被廣泛地使用[2]。1維 Otsu方法無法準(zhǔn)確地排除圖像中與目標(biāo)灰度值相近的噪聲。針對這個問題,2維Otsu方法被提出來進(jìn)行圖像分割。2維Otsu方法不僅考慮了像素點的灰度信息,還考慮了其鄰域灰度的均值信息,利用兩者的相關(guān)性來濾除噪聲[3]。近些年,在文獻(xiàn)[4]中作者引入鄰域灰度中值作為又一特征,提出3維Otsu的圖像分割方法,該算法對濾除高斯噪聲和椒鹽噪聲有著更好的效果,對低信噪比的圖像有著更好的分割效果。
然而,在3維Otsu的鄰域窗口選取中,采用的是局部等權(quán)值的固定尺寸滑窗選取方案。這種傳統(tǒng)的窗口選取方案給圖像的門限分割性能帶來了4點缺陷。首先,在均值計算中,窗口內(nèi)的所有像素被認(rèn)為具有相同的重要性,但實際中越靠近中心點的像素的重要性越高。第二,窗口尺寸在實際操作過程中很難被確定。當(dāng)選擇大的窗口尺寸時,可獲得足夠的數(shù)據(jù)來刻畫局部區(qū)域的特征,但很容易過度平滑小目標(biāo)和邊緣,并將小尺寸目標(biāo)歸為背景。當(dāng)使用小的窗口尺寸時,邊緣和小尺寸的目標(biāo)得以保存。但由于沒有利用充分的數(shù)據(jù)信息,很容易在分割結(jié)果中留有大量的噪聲。第三,實際圖像中存在著大量的方向性結(jié)構(gòu),比如圖像中的邊緣和方向性紋理。傳統(tǒng)各向同性的濾波方案很難有效地捕捉圖像的方向性結(jié)構(gòu),因此造成了處理方向性結(jié)構(gòu)時的性能損失。目前,各向異性處理方法已成功用于 3維醫(yī)學(xué)圖像分割,并有效地解決了密度不均勻造成的處理困難[5]。最后,傳統(tǒng)3維Otsu方法是在局部鄰域內(nèi)計算均值和中值的,該方案中參與計算的樣本有限,并沒有充分利用圖像中普遍存在的模式冗余。針對這些問題,在傳統(tǒng)3D-Otsu方法的基礎(chǔ)上,本文提出了一種基于各向異性自適應(yīng)高斯加權(quán)方向窗的非局部3D-Otsu門限分割方法。結(jié)果表明,提出的門限分割方法比傳統(tǒng)的門限分割方法具有更好的分割性能,并且有著更好的濾噪性能和小目標(biāo)保持性能。
非局部的概念最早由Buades等人[6]在非局部均值(NLM)圖像去噪中提出的,其基本原理是利用兩個圖像塊的相似性程度來計算濾波的權(quán)值,優(yōu)點是增加了計算時的樣本數(shù)量,捕獲圖像中的模式冗余,并可很好地保持圖像的紋理特征。這里,將非局部的思想應(yīng)用到3維Otsu門限分割方法中,發(fā)展出了非局部3維Otsu方法。其基本步驟如下:
(1)對于給定的中心像素點,設(shè)定搜素區(qū)域尺寸;
(2)根據(jù)中心像素點的鄰域局部特征確定相似窗口的尺寸以及各向異性高斯核的尺度以及方向,從而構(gòu)造各向異性高斯加權(quán)方向窗;
(3)基于各向異性高斯加權(quán)方向窗和多方向相似度測量策略,計算搜索區(qū)域內(nèi)所有像素點與中心像素點的相似特征,并根據(jù)相似程度賦予不同的權(quán)值,從而計算加權(quán)均值和加權(quán)中值;
(4)根據(jù)步驟(3)得到的加權(quán)均值和加權(quán)中值,結(jié)合中心像素點的灰度值,構(gòu)建3維直方圖并根據(jù)最大類間方差計算3維門限矢量,從而實現(xiàn)圖像的門限分割。
傳統(tǒng)非局部均值相似性計算時采用各向同性高斯加權(quán)窗策略,沒有考慮到圖像的各向異性性質(zhì),因此直接將基于各向同性高斯濾波的非局部均值算法用于圖像特征計算會使圖像邊緣過度平滑。為了克服這個不足,設(shè)計了各向異性高斯濾波器來代替?zhèn)鹘y(tǒng)各向同性高斯濾波方案。以圖像塊中心為參考點,與圖像方向結(jié)構(gòu)一致的鄰域形成圖像的主方向。在計算相似度時增加主方向像素點的權(quán)重,更準(zhǔn)確地捕捉具有相似結(jié)構(gòu)的圖像塊,從而減少干擾像素點在加權(quán)平均計算時的權(quán)值,避免邊緣以及方向性結(jié)構(gòu)的模糊。這里,設(shè)計的各向異性高斯加權(quán)窗如下:設(shè)G0為各向異性高斯窗的配分常數(shù),σ1和σ2為各向異性高斯窗口的尺度系數(shù)。各向異性高斯方向窗為
其 中d1=ucosθ+vsinθ,d2=ucosθ-vsinθ,θ為濾波方向。圖1給出了6個不同方向并且尺度系數(shù)σ1,σ2變化的各向異性高斯窗的圖示。當(dāng)λ=σ1/σ2=1 時,各向異性高斯濾波器即為傳統(tǒng)的各向同性高斯濾波器。在實際圖像中,不同的邊緣和紋理具有不同的各向異性性質(zhì)。若各向異性高斯濾波器采用固定的尺度濾波,很難獲得最優(yōu)的結(jié)果。因此,相似窗口的尺寸和各向異性高斯濾波器的尺度系數(shù)σ1和σ2隨著實際圖像的局部特征變化,才能最終得到滿意的處理結(jié)果。
相似窗口的最優(yōu)尺寸與圖像的局部性質(zhì)有關(guān)。合適的窗口大小選取問題是目前的一個研究熱點。在這里,采用一種新的自適應(yīng)窗口尺寸的設(shè)計方法[7],該方法根據(jù)當(dāng)前中心點的相似性窗口內(nèi)的同質(zhì)程度和設(shè)定的門限來自適應(yīng)地調(diào)節(jié)下一次計算中的相似窗口尺寸大小。該方案是在同質(zhì)區(qū)域增大窗口尺寸來抑制噪聲的影響,并有效地濾除噪聲;在異質(zhì)區(qū)域減小窗口尺寸從而更好地保護小尺寸目標(biāo)和細(xì)節(jié)邊緣。首先,設(shè)置圖像的第1個像素(x,y)的窗口尺寸為px,y×px,y,此時窗口內(nèi)像素表示為
窗口內(nèi)像素的同質(zhì)程度可以用Ψx,y來刻畫,它為相似窗口內(nèi)像素的方差和均值的比值。
圖1 不同方向和尺度的各向異性高斯窗的圖示
這里,tx,y=(px,y-1)/2。下一個窗口尺寸的自適應(yīng)選擇過程為[7]
這里,θ為設(shè)定的比例因子,令比例因子θ=KT。在確定各向異性自適應(yīng)高斯加權(quán)方向窗的尺度之后,通過計算圖像中的結(jié)構(gòu)方向來確定各向異性自適應(yīng)高斯加權(quán)方向窗的濾波方向。如果圖像的邊緣是直線,則濾波器的長軸方向應(yīng)設(shè)定得與直線方向一致,濾波器在去除噪聲的同時對邊緣的保持最好;然而,當(dāng)圖像的邊緣不是直線時,則設(shè)定濾波器的長軸方向與切線方向相同,處理時考慮了較多的邊緣點,對圖像的邊緣保持有利。因此,通過計算中心像素點的相似窗內(nèi)圖像的結(jié)構(gòu)方向,從而確定濾波器的濾波方向:
對于每一個像素,NLM的輸出是整個搜索圖像區(qū)域像素的加權(quán)平均,并且權(quán)值與兩個像素之間的相似性有關(guān),相似性越高,權(quán)值越大。傳統(tǒng) NLM算法通過每兩個像素的鄰域特征來判斷兩個像素的相似性,并給與合適的權(quán)值,從而進(jìn)行加權(quán)平均計算。而像素選取遍歷整個搜索區(qū)域,與像素的位置無關(guān)。對于固定寬度p,Px,y是以像素(x,y)為中心點的寬度為p的子圖像,則f(x,y)的NLM為
Ωpx,y表示鄰域相似窗口內(nèi)像素以像素(x,y)為原點窗口長度為px,y的坐標(biāo)集合。然而,式(10)僅對圖像中的平移相似性有著很好的捕獲。但是,在大量圖像中不僅僅存在著平移相似性,并且存在著平移旋轉(zhuǎn)相似性[10]。為了更好地捕捉該相似性,并對存在該相似性的像素點賦予更高的權(quán)值,本文提出了一種旋轉(zhuǎn)不變歐式距離測度:
(·)表示對鄰域窗口構(gòu)成的子圖像進(jìn)行旋轉(zhuǎn)角度θk處理,其中θk=(k-1)π/K,k=1,2,…,K。當(dāng)k=1時,表示未進(jìn)行子圖像旋轉(zhuǎn)操作。K取值越大,圖像中的模式冗余捕捉得越好,但計算量也隨之增加。本文折中考慮計算量和性能,將K取為8。非局部算法的本質(zhì)是基于圖像具有重復(fù)結(jié)構(gòu)特征的假設(shè),利用圖像的相似性質(zhì)進(jìn)行統(tǒng)計處理的,這里提出的多方向旋轉(zhuǎn)變換方案可更好地捕捉圖像中的自相似結(jié)構(gòu),能更好地利用圖像中的模式冗余?;诟倪M(jìn)的非局部處理方法,結(jié)合式(8),式(9)和式(11),加權(quán)均值為
加權(quán)中值的表達(dá)式如下[11]:
加權(quán)中值的權(quán)值是根據(jù)搜索窗口內(nèi)的像素點與中心像素點的相似程度來分配的,從而解決了傳統(tǒng)加權(quán)中值濾波方案中權(quán)值難以確定的問題。根據(jù)加權(quán)均值g(x,y)和加權(quán)中值h(x,y),并結(jié)合灰度值f(x,y),經(jīng)動態(tài)區(qū)間歸一化到[0,L-1]后構(gòu)成圖像的3維直方圖。最后利用3維最大類間方差法進(jìn)行門限計算得到門限矢量(s',t',q')[4],并進(jìn)行門限分割,得到最終的門限分割結(jié)果。
本節(jié)將提出的方法與其它幾種方法進(jìn)行性能比較,從而驗證本文方法的有效性。在實驗中,本文提出的基于各向異性自適應(yīng)高斯加權(quán)方向窗的3維Otsu方法(AW-3DOtsu)的鄰域相似窗口尺寸的上限pmax設(shè)為15,下限pmin設(shè)為3。對于自然圖像coins和rice,KT取為10;對于SAR圖像,KT取為16。本節(jié)中將提出的分割方法與 2維 Otsu方法(2DOtsu)、2維最大熵方法(2D-Entropy)和 3維 Otsu方法(3D-Otsu)進(jìn)行比較,其中 2D-Otsu, 2DEntropy和3D-Otsu的窗口長度設(shè)為9。第1幅測試圖像是錢幣圖像coins.png,第2幅圖像為米粒圖像 rice.png, AW-3DOtsu的搜索窗口分別設(shè)置為100×100和60×60。圖 2給出了coins和rice的原始圖像以及理想的參考分割結(jié)果圖。在本組實驗中,對于這兩幅圖像,分別疊加椒鹽噪聲(噪聲水平為0.01)、高斯噪聲(噪聲水平為 0.01)和高斯椒鹽混合噪聲(兩者噪聲水平均為0.01),然后采用2D-Otsu,2D-Entropy[12], 3D-Otsu[4]和本文提出的基于各向異性自適應(yīng)高斯加權(quán)方向窗的 3維 Otsu方法(AW-3DOtsu)對加噪后的圖像進(jìn)行分割。實驗結(jié)果分別如圖3和圖4所示。實驗采用的圖像coins和rice的尺寸分別是246×300和256×256。
圖2 coins圖像和rice圖像原圖和分割參考圖
從圖3和圖4中可以看出,3D-Otsu方法和本文提出的 AW-3DOtsu方法在高斯噪聲和椒鹽噪聲以及高斯椒鹽混合噪聲的抑制能力方面遠(yuǎn)優(yōu)于其它兩種方法;并且相比 3D-Otsu方法,本文提出的AW-3DOtsu方法在噪聲抑制的同時有著更好的小目標(biāo)保持性能方面和圖像模式冗余捕捉性能。為了定量評價各種方法在濾噪和目標(biāo)保持方面的性能,本文將各方法的結(jié)果與參考的理想分割結(jié)果進(jìn)行定量對比。第1個指標(biāo)為各方法分割結(jié)果相對于理想分割結(jié)果的虛警率(False Alarm Rate, FAR)[13],即將背景錯誤分割成目標(biāo)的比率,虛警率越大表示濾噪性能越差;第 2個指標(biāo)為漏檢率(Undetected Error Rate, UER),即目標(biāo)被錯誤分割成背景的比率,漏檢率越大表示目標(biāo)保持性能越差。FAR和UER表示如下:
圖3 coins圖像加高斯噪聲、椒鹽噪聲以及高斯椒鹽混合噪聲的實驗結(jié)果圖
圖4 rice圖像加高斯噪聲、椒鹽噪聲以及高斯椒鹽混合噪聲的實驗結(jié)果圖
表1 4種方法對兩幅測試圖像的虛警率和漏檢率的定量比較(%)
門限分割技術(shù)在SAR圖像水域分割和機場、道路分割方面有著廣泛的應(yīng)用[14]。在第2組實驗中,針對SAR圖像,將AW-3DOtsu方法與其它3種方法進(jìn)行對比,其中 AW-3DOtsu方法的搜索窗口為60×60。處理結(jié)果圖如圖5所示。第1組SAR圖像為星載SAR獲取的日本愛媛縣松山市(Matsuyama)附近的島嶼和海域情況,圖像尺寸為256×256,分辨率約為130 m,通過該圖可測試各種方法在SAR圖像水域分割中的性能;第2組SAR圖像為Ku波段機載 SAR獲取的美國加利福尼亞州中國湖機場(China Lake Airport)的場景,圖像尺寸為256×256,分辨率為3 m,通過該圖可以測試各種方法在機場道路分割中的性能。
從圖5可以看出,對于第1幅SAR圖像,3DOtsu和本文提出的AW-3DOtsu方法在有效水域分割的同時更好地抑制了相干斑噪聲的影響,并且AW-3DOtsu方法的分割性能明顯優(yōu)于其它幾種方法,保留了更多的小尺寸島嶼;同樣,對于第2幅SAR圖像,與其它 3種方法相比,本文提出的AW-3DOtsu方法在更加有效地抑制相干斑噪聲影響的同時,保留了更多的細(xì)節(jié)道路信息。從該組實驗可以看出,AW-3DOtsu方法在SAR圖像分割方面也有著更好的性能,超越了其它幾種門限分割方法。
圖5 兩幅SAR圖像的實驗結(jié)果圖
綜上所述,相比其他幾種算法,本文方法的圖像分割性能最佳,抑制了噪聲對于圖像分割的影響,并且能夠很好地保持圖像中的小尺寸目標(biāo)和細(xì)節(jié)信息。因此,對于具有方向性結(jié)構(gòu)和小目標(biāo)的含噪圖像,本文算法具有優(yōu)勢。原因在于:(1)本文改進(jìn)了3D-Otsu的鄰域窗口設(shè)置方法,利用圖像局部特征自適應(yīng)地確定窗口的尺寸,匹配了圖像不同區(qū)域的均勻特征;(2)各向異性高斯加權(quán)方向窗的引入,優(yōu)化了像素點的權(quán)值分配方案,有效捕捉圖像中普遍存在的方向結(jié)構(gòu)信息;(3)提出了非局部多方向相似度測量方法,更加有效地捕捉了圖像中的模式冗余,對于紋理區(qū)域和噪聲區(qū)域有著更好的平滑效果,獲得了更好的噪聲抑制效果。
本文提出了一種基于各向異性自適應(yīng)高斯加權(quán)方向窗的非局部3維Otsu圖像門限分割的新方法。該方法改進(jìn)了3D-Otsu的鄰域窗口設(shè)置方法,利用局部特征來自適應(yīng)地確定各向異性高斯加權(quán)方向窗口的尺寸、尺度系數(shù)和濾波方向。然后,基于提出的非局部多方向相似度測量來有效捕捉圖像中的模式冗余。最終,構(gòu)建3維直方圖并利用最大類間方差計算門限矢量來進(jìn)行分割。實驗結(jié)果表明:由于各向異性自適應(yīng)高斯加權(quán)方向窗和非局部多方向相似度測量的引入,新方法克服了傳統(tǒng)3維Otsu門限分割方法中的濾噪和小目標(biāo)保持性能,獲得了滿意的圖像分割性能。
[1]焦李成, 張向榮, 侯彪. 智能SAR圖像處理與解譯[M]. 北京:科學(xué)出版社, 2009, 第6章.
Jiao L C, Zhang X R, Hou B. Intelligent SAR Image Processing and Interpretation [M]. Beijing: Science Press,2009, Chapter 6.
[2]Xu X Y, Xu S Z, and Jin L H. Characteristic analysis of Otsu threshold and its applications [J].Pattern Recognition Letters,2011, 32(7): 956-961.
[3]Chen Q, Zhao L, Lu J,et al.. Modified two-dimensional Otsu image segmentation algorithm and fast realisation [J].IET Image Processing, 2012, 6(4): 426-433.
[4]景曉軍, 李劍峰, 劉郁林. 一種基于三維最大類間方差的圖像分割算法[J]. 電子學(xué)報, 2003, 31(9): 1281-1285.
Jing X J, Li J F, and Liu Y L. Image segmentation based on 3-D maximum between-cluster variance [J].Acta Electronica Sinica, 2003, 31(9): 1281-1285.
[5]Nakhjavanlo B B, Ellis T J, Soan P H,et al.. 3D medical image segmentation using level set models and anisotropic diffusion[C]. 2011 Seventh International Conference on Signal Image Technology & Internet-based Systems, Dijon, 2011:403-408.
[6]Buades A, Coll B, and Morel J. A non local algorithm for image denoising[C]. Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition,San Diego CA, 2005: 60-65.
[7]顏學(xué)穎, 焦李成, 王凌霞, 等. 一種提高SAR圖像分割性能的新方法[J]. 電子與信息學(xué)報, 2011, 33(7): 1700-1705.
Yan X Y, Jiao L C, Wang L X,et al.. New method for improving the performance of SAR image segmentation[J].Journal of Electronices&Information Technology, 2011,33(7): 1700-1705.
[8]Wang W, Gao J H, and Li K. Structure-adaptive anisotropic filter with local structure tensors[C]. IEEE Computer Society Second International Symposium on Intelligent Technology Application, Shanghai, 2008, 2: 1005-1010.
[9]Deng G and Gahill L W. An adaptive Gaussian filter for noise reduction and edge detection[C]. Proceedings of IEEE Nuclear Science Symposium and Medical Imaging Conference,San Francisco CA, 1993, 3: 1615-1619.
[10]Sun W F, Peng Y H, and Hwang W L. Modified Similarity metric for non-local means algorithm[J].Electronics Letters,2009, 45(25): 1307-1309.
[11]Bagchi P, Bhattacharjee D, Nasipuri M,et al.. A novel approach for nose tip detection using smoothing by weighted median filtering applied to 3D face images in variant poses[C]. 2012 International Conference on Pattern Recognition,Informatics and Medical Engineering(PRIME), Tamilnadu,2012: 272-277.
[12]Li Q W, Yang S Y, and Zhu S X. Image segmentation based on the 2-D maximum entropy value and improved genetic algorithm[C]. 2011 International Conference on Computer Science and Network Technology(ICCSNT), Harbin, 2011:1403-1406.
[13]Sahoo P K, Wlikins C, and Yeage J. Threshold selection using Renyi's entropy[J].Pattern Recognition, 1997, 30(1):71-84.
[14]安成錦, 牛照東, 李志軍, 等. 典型 Otsu算法閾值比較及其SAR圖像水域分割性能分析[J]. 電子與信息學(xué)報, 2010, 32(9):2215-2219.
An C J, Niu Z D, Li Z J,et al.. Otsu threshold comparison and SAR water segmentation result analysis[J].Journal of Electronics&Information Technology, 2010, 32(9):2215-2219.