馬躍輝 辛月蘭 楊晨曉
(青海師范大學物理與電子信息工程學院 西寧 810000)
圖像分割是指將圖像根據其灰度、顏色和形狀等特征劃分為幾個互不相交的區(qū)域,且這些特征在同一區(qū)域內呈現(xiàn)相似性,而不同的區(qū)域間呈現(xiàn)差異性[1]。目前關于圖像分割的方法可分為直方圖閾值法、特征空間聚類、基于區(qū)域的方法、邊緣檢測、神經網絡等方法,其中關于神經網絡的圖像分割方法如脈沖耦合神經網絡(Pulse Coupled Neural Net?work,PCNN)已經成為近幾年的研究熱點。
脈沖耦合神經網絡[2]起源于Ecklorn等對貓等哺乳動物視覺神經發(fā)放脈沖現(xiàn)象的研究而構造的一種人工神經網絡。目前PCNN模型已涉及到圖像分割、圖像融合、邊緣檢測等領域,特別是在圖像分割中,利用PCNN耦合點火的特性可以很好地判別圖像的目標和背景。綜述以往的研究,文獻[3~4]利用熵準則以確定最佳迭代次數并有效地選取最佳閾值,但是對于目標和背景分布不均的圖像無法較好地將其分割出來且需要設置大量的參數。近年來,為解決上述問題提出了一些改進方法,如:文獻[5]提出的基于模糊C均值的PCNN圖像分割增加了模型的魯棒性;文獻[6]將最大類間方差法融入PCNN的圖像分割有效地分割了相對復雜的圖像。但是上述算法依然需要人為調整參數且存在分割時間過長的問題。為此,一些智能算法如:文獻[7]聯(lián)合蟻群算法和PCNN的腦部MRI圖像分割方法實現(xiàn)了PCNN參數的自適應性。文獻[8]采用細菌覓食優(yōu)化算法搜索最優(yōu)參數的圖像分割算法,避免了人工實驗設定參數的盲目性。文獻[9]結合了遺傳算法和PCNN模型各自的優(yōu)勢,充分發(fā)揮了PCNN的生物視覺特性和遺傳算法的解空間隨機搜索能力,實現(xiàn)關鍵參數的智能尋優(yōu)。文獻[10]結合粒子群優(yōu)化算法和脈沖耦合的特點實現(xiàn)了紅外圖像的快速分割。但是上述算法相對復雜且在參數的訓練上耗費了大量的時間,仍需進一步改進。
為此,本文提出了一種改進的PCNN模型并結合灰度化權值的方法以實現(xiàn)圖像的參數自適應分割。首先,該方法在簡化PCNN模型的基礎上提出雙閾值判別的模型,通過最大類間方差法找出最佳初始閾值和抑制閾值以減少迭代次數及更準確地判別了點火神經元,并采用拉普拉斯算子調整耦合權值系數實現(xiàn)參數的自適應。最后,結合灰度化權值的方法取得了較好的分割結果,與傳統(tǒng)方法相比本文方法節(jié)省了時間,提高了正確率。
PCNN模型是在貓等哺乳動物大腦視覺皮層模型的啟發(fā)下提出的一種反饋型神經網絡。但是傳統(tǒng)的PCNN模型參數設置復雜且對分割結果影響較大,為此,文獻[11]提出了一種簡化的PCNN模型,其結構如圖1所示。
圖1 簡化的PCNN模型
由上圖可知,PCNN的接受域主要是由連接輸入域Lij和反饋輸入域Fij兩部分組成,兩者之間通過突觸連接權值Wijkl與其鄰近神經元進行非線性調制耦合;輸入圖像的像素值Sij作為外部刺激信號輸入F通道中。
其中Fij為第(i,j)個神經元的反饋輸入項;Sij是神經元的激勵信號。Lij[n]是第(i,j)個神經元的耦合連接輸入項;Wijkl為連接系數矩陣。
神經元的內部活動項由連接輸入域和反饋輸入域以非線性耦合調制而成,β為突觸之間的連接強度系數。其內部活動項用數學模型描述如式(3)所示:
當Uij[n]大于動態(tài)閾值Eij[n]時,PCNN產生輸出一次脈沖輸出序列Yij[n]如式(4),否則,Eij[n]根據式(5)進行指數衰減,即:
當脈沖發(fā)生域Yij[n]輸出序列為1時,動態(tài)閾值Eij[n]通過反饋而迅速提高,如式(5)所示:
當Eij[n]>Uij[n]時,Yij[n]輸出脈沖序列為0。此后Eij[n]按照指數規(guī)律迭代遞減,直到神經元再次被激發(fā)。
為了選取最優(yōu)分割結果,本文采用文獻[3]提出的最小叉熵準則判別最優(yōu)迭代次數,由于熵可作為不確定問題的度量,通常交叉熵用于度量兩個概率分布之間信息的差異,是一種下凸函數,而最小交叉熵準則用于圖像分割,則一般是搜索使分割前后圖像信息量差異最小的閾值。
針對上述PCNN模型在圖像分割中存在目標和背景混疊且分割時間過長的問題,本文將提取圖像的RGB彩色信息作為PCNN的輸入通道且針對迭代次數過多而造成分割時間過長的問題提出了一種基于雙閾值判別的改進PCNN模型。改進后的模型圖2所示。
如圖2所示,本文提取彩色圖像中的RGB彩色信息分量作為PCNN輸入信息,摒棄單個動態(tài)閾值指數衰減的方法,提出雙閾值反饋輸出的改進模型,增加了圖像分割的參數自適應性。然后,根據不同通道分割目標和背景的差異大小改變輸出權值的比例以得到最佳分割結果。該方法有效保留了圖像的信息增加了圖像分割的正確率,并且節(jié)省了分割時間。
圖2 改進的PCNN模型
PCNN模型因反饋輸入域和連接輸入域的耦合調整而具有相似神經元同步點火特性。由式(4)可知,一般連接系數β較大時容易引起低亮度的神經元點火;相反,當β較小則會保留更多圖像的細節(jié)部分[12]。由于拉普拉斯能量(Energy of Laplace,EOL)可以很好地反應邊緣信息且為了增強PCNN模型的自適應性,故本文引入拉普拉斯能量計算圖像中各像素的值以調制PCNN模型中各神經元的連接強度。
圖像中任一點(x,y)關于EOL定義如下:
其中,f(x,y)為(x,y)處的像素灰度值;ω為以(x,y)為中心的3×3模板。
由于傳統(tǒng)PCNN模型的初始閾值難以確定且分割時間過長,故本文提出一種雙閾值判別的模型,利用最大類間方差法找出最佳初始閾值和抑制閾值以減少迭代次數及更準確地判別點火神經元。
3.2.1 最大類間方差算法
最大類間方差算法是由OTSU提出來的,又稱大津法[13],其用于圖像分割主要通過衡量待分割圖像目標和背景的差別,進而找到最佳閾值實現(xiàn)圖像分割。
設灰度圖像灰度級為L,灰度值為i像素的個數為n,則灰度圖像一共有像素:N=n0+n1+…+nL-1,將其歸一化為
按灰度級用閾值劃分為兩類:C0=(0,1,2,…t)和C(1t+1,t+2…L-1)。 因此,C0類和C1類出現(xiàn)的頻率及均值如下所示:
由上式所知,當背景與目標圖像的方差達到最大值時,閾值T為兩區(qū)域分割的最佳閾值。
由于OTSU閾值分割法相對簡單且運行速度快,故本文用此方法以粗略判別圖像的目標和背景。
3.2.2 雙閾值判別準則
假設目標類的灰度值相對背景類的灰度值大。首先,本文使用OTSU方法確定圖像的初始閾值L,將圖像的目標與背景分割出來。然后,根據閾值分割的方法,當圖像灰度值大于閾值L為所分割圖像的目標類A,當圖像灰度值小于L為所分割圖像的背景類B。其目標類A中像素灰度值的均值CA如下所示:
上式中A為圖像分割后的目標類,I為目標類中的像素值,CA為目標類中的灰度平均值。本文將目標類A的均值CA作為PCNN的初始動態(tài)閾值,且為了促進迭代過程點火的發(fā)生,本文規(guī)定圖像中大于CA的灰度值均處于點火狀態(tài)。
另外,由于背景類B中所有像素灰度值的均值CB必然小于閾值L,所以本文對小于CB的神經元進行標志,并作為抑制因素加入PCNN的決策機制抑制待分割神經元的點火發(fā)生。
上式中B為圖像分割后的目標類,I為目標類中的像素值,CB為背景類中的灰度平均值。
綜上所述,根據PCNN圖像分割的判斷準則,本文將CA作為初始動態(tài)閾值并進行衰減迭代,當中心神經元周圍存在已點火神經元的時候可促進中心神經元提前點火,若是中心神經元8鄰域內的抑制神經元個數nB大于已點火的神經元個數nA,則對中心神經元不做調制耦合處理。
本文通過計算RGB空間分割后圖像的灰度均方差,來判斷三通道間的目標圖像和背景圖像的差異性來決定各分割圖像的權值[14],其方法如下:
第一步,已分割的R、G、B圖像提取目標圖像O(i,j)和背景圖像 B(i,j),至此初步完成了目標與背景的分類;
第二步,通過式(19)和式(20)分別計算目標區(qū)域和背景區(qū)域的像素灰度均值;
第三步,利用目標灰度平均值CA和背景灰度平均值CB計算各彩色通道中目標區(qū)域和背景區(qū)域間灰度均值差DR、DG和DB;
第四步,本文使用最大類間方差法粗略的判斷圖像在灰度空間的分割閾值TRGB,并利用式(21)計算圖像的灰度均值差DRBG;
第五步,通過計算進行灰度化調整。
利用第三步計算的灰度均值差來確定RGB通道的權值,當某個通道的均值差遠大于其他兩個通道時,表示該通道中目標與背景存在較明顯差異,直接利用該通道信息作為灰度化結果;然后,判斷三個通道間的相似性,若三個通道的均值差較近,則直接合并三個通道的分割結果。如果兩個通道的均差值較近且大于第三個通道,則合并兩個通道的分割結果。
基于上述思路,本文以DR>DG>DB的情況為例,并根據第四步粗略計算圖像灰度均方差DRGB以此判斷三通道之間的關系。
1)如果 DR+DG+DB<DRGB,則三通道相似,RBG三個通道的權值分別取(1,1,1)。
2)如果 DR+DB>2DG,則 B通道和G通道相似,目標圖像RBG通道取值為(1,0,0)。否則,R通道與G通道相似,目標圖像RBG取值為(1,1,0)。
本文算法流程如圖3所示,算法步驟如下。
圖3 圖像分割流程圖
Step1提取待分割圖像的R、G、B彩色信息分量,并依次輸入PCNN分割模型中;
Step2初始化PCNN的參數,令衰減系數α=0.1并采用拉普拉斯算子3×3的模板作為連接權值矩陣;
Step3通過最小交叉熵準則計算出PCNN的迭代次數n;
Step4根據式(19)和式(20)構造雙閾值分割模型;
Step5根據式(4)判斷點火神經元;
Step6判斷n是否迭代完畢,如果是輸出二值圖像,否則根據式(5)衰減動態(tài)閾值,n=n-1,返回Step5;
Step7判斷R、G、B彩色信息分量是否全部分割,如果是進行下一步,否則返回Step2并將待分割的R、G、B彩色信息分量輸入PCNN圖像模型;
Step8利用灰度化權值的方法將已經分割出來的R、G、B二值圖像進行灰度化權值大小的判定;
Step9合成分割圖像并輸出。
實驗在臺式PC上進行,其配置為Microsoft Windows7,4GB內存,顯卡為Radeon HD6310 graph?ics圖形顯示卡;實驗編程環(huán)境為Matlab R2014a,程序用Matlab編寫。為了證明方法的可靠性,本文選取標準圖像庫中的Lena彩色圖像以及Weizmann horse database圖像庫中的horse008圖像、horse109圖像、horse128圖像、horse328圖像、horse320圖像進行分割。
為驗證本文所提方法的有效性,首先采用圖像紋理和細節(jié)較豐富的Lena圖像作為分割圖像并與傳統(tǒng)PCNN[3]圖像分割方法、基于 OTSU[15]閾值分割方法作比較。
圖4 Lena圖像分割結果
由圖4可以看出:1)文獻[3]分割方法的分割結果其帽子邊緣未分割出來,且面部的下唇,鼻子都沒有很清晰地表現(xiàn)出來;2)文獻[15]分割方法的分割結果中,圖像帽子邊緣存在不連貫的現(xiàn)象且與背景分割不是很明顯;3)本文分割方法的分割結果明顯優(yōu)于文獻[3]分割方法,且與文獻[15]分割方法相比,在帽子處明顯將目標與背景分割出來。綜上所述,本文分割方法在細節(jié)分割方面優(yōu)于文獻[3]分割方法和文獻[15]分割方法。
為了更好驗證本方法的優(yōu)越性,本文利用Weizmann horse database圖像庫提供分割的圖像作為分割正確率的評估,如下:
其分割正確率的值越高分割結果越好。
結合圖5和表1分析可知,傳統(tǒng)PCNN圖像分割方法存在欠分割的問題,且對于圖像的背景部分未能很好地識別,但是與基于OTSU閾值分割方法相比,該方法對圖像有較好的平滑作用,且減少了噪聲點的影響。
圖5 分割對比圖
表1 3種方法分割圖像的客觀評價結果
從表1中可以看出其運行時間最長、正確率較低;基于OTSU閾值分割方法未能很好地將圖像的背景和目標圖像分割出來,但其所用時間少,能夠較好地節(jié)省時間。從表1中可以看出其分割正確率最低,所用時間最短;本文方法能夠較好地將圖像的目標和背景分割出來,從圖5可以看出本文方法能夠較好地去除噪聲點,且使圖像分割更加完整。從表1中可以發(fā)現(xiàn)相比傳統(tǒng)PCNN圖像分割方法縮短了時間且與基于OTSU閾值分割方法相比其分割正確率明顯提高。
本文提出了一種結合灰度化權值調整的改進PCNN圖像分割方法,該方法在傳統(tǒng)PCNN模型的基礎上進行改進。為了增強其對邊緣信息反應能力和模型的自適應性,采用拉普拉斯算子作為權值矩陣的連接系數;為了降低圖像的分割時間以及提高對目標神經元的識別,提出基于雙閾值的脈沖輸出設計;為了更好提取圖像的彩色信息,采用彩色圖像R、G、B三分量作為PCNN的輸入信息,并利用灰度化權值的方法融合各彩色分量的分割結果。實驗證明,本文提出的方法能夠取得較優(yōu)的分割結果且與傳統(tǒng)圖像分割方法相比提高了效率。