陳樹(shù)楠 范影樂(lè) 房濤 武薇
輪廓信息作為圖像目標(biāo)的一種低維視覺(jué)特征,不僅將顯著影響到后續(xù)圖像分析和理解的準(zhǔn)確性,而且對(duì)從輸入層級(jí)降低系統(tǒng)的復(fù)雜性也具有重要意義.
以Canny 等算子[1-2]為代表的傳統(tǒng)輪廓檢測(cè)方法,通常關(guān)注于以滑窗為基礎(chǔ)的局部鄰域梯度特征,具有較好的數(shù)學(xué)意義可解釋性以及檢測(cè)效率.但由于其在分離目標(biāo)與背景像素時(shí),忽視了視覺(jué)機(jī)制在空間關(guān)系描述中的重要作用,因此在對(duì)具有紋理背景干擾的圖像目標(biāo)輪廓定位時(shí),尤其是對(duì)于弱對(duì)比度圖像,經(jīng)紋理抑制后將會(huì)丟失大量真實(shí)輪廓信息.
隨著視覺(jué)生理實(shí)驗(yàn)及計(jì)算神經(jīng)的發(fā)展,在視通路對(duì)視覺(jué)信息流的傳遞和處理過(guò)程中,各種視覺(jué)機(jī)制被陸續(xù)得到驗(yàn)證和應(yīng)用.例如有研究考慮視覺(jué)神經(jīng)元非經(jīng)典感受野(non-classical receptive field,nCRF)對(duì)經(jīng)典感受野(Classical receptive field,CRF)的調(diào)節(jié)作用,通過(guò)Gabor 濾波器對(duì)圖像進(jìn)行不同尺度空間的紋理過(guò)濾[3];還有研究根據(jù)還有研究根據(jù)視網(wǎng)膜感受野X-Y 通道特性,分別利用線性與非線性調(diào)制感受野外周區(qū)的側(cè)抑制作用,強(qiáng)化輪廓特征信息[4];但上述方法都僅從單一感受野特性出發(fā),難以區(qū)分主體弱邊緣與背景紋理噪聲;因此有研究進(jìn)一步模擬初級(jí)視通路,例如對(duì)圖像時(shí)空信息和冗余度進(jìn)行編碼,強(qiáng)化輪廓信息并提高檢測(cè)魯棒性[5];也有研究從神經(jīng)脈沖發(fā)放角度出發(fā),對(duì)接收刺激進(jìn)行HH 神經(jīng)元模型編碼,分別經(jīng)ON和OFF 型感受野作用后,選取6 個(gè)方向描述視覺(jué)皮層的方向選擇性,在信號(hào)傳遞過(guò)程中引入突觸的動(dòng)態(tài)可塑性對(duì)刺激響應(yīng)的影響,最終融合得到最優(yōu)方位圖輪廓特征[6];此外還有研究在視覺(jué)系統(tǒng)中引入先驗(yàn)濾波以減少信息傳遞時(shí)間,并利用神經(jīng)元的相關(guān)性以及稀疏編碼去除冗余噪聲信息,提高輪廓檢測(cè)準(zhǔn)確性[7].上述基于視覺(jué)通路的神經(jīng)計(jì)算模型的輪廓提取方法對(duì)視覺(jué)刺激進(jìn)行遞進(jìn)加工,在檢測(cè)效果上得到了明顯的提升,但必須需要指出的是它們通常只考慮視覺(jué)信息流在初級(jí)視通路上的串行層級(jí)傳遞過(guò)程,弱化了在單一節(jié)點(diǎn)上的多級(jí)處理能力,而且忽略或簡(jiǎn)化了前級(jí)節(jié)點(diǎn)對(duì)視皮層區(qū)的跨視區(qū)調(diào)制作用,從而割裂了主體細(xì)節(jié)與顯著特征的關(guān)系.
據(jù)目前的生理實(shí)驗(yàn)證明,初級(jí)視通路各節(jié)點(diǎn)的感受野尺寸以及作用強(qiáng)度等特性并不完全相同[8],而且傳遞過(guò)程中不僅存在著稀疏性處理、視覺(jué)信息整合等多級(jí)加工環(huán)節(jié),還存在分支路徑以保證視覺(jué)信息流的快速感知.因此本文基于視覺(jué)信息流的傳遞路徑,模擬上述主視通路各環(huán)節(jié)對(duì)信息的編碼處理,分別利用暗視覺(jué)適應(yīng)性調(diào)節(jié)、神經(jīng)稀疏性編碼、微動(dòng)響應(yīng)整合、突觸動(dòng)態(tài)傳遞以及視覺(jué)信息流前饋投射傳遞等視覺(jué)機(jī)制,提出了一種新的結(jié)構(gòu)分級(jí)響應(yīng)計(jì)算模型,對(duì)自然場(chǎng)景下的目標(biāo)主體輪廓進(jìn)行獲取.首先模擬視網(wǎng)膜對(duì)視覺(jué)信息的暗視野自適應(yīng)調(diào)節(jié)機(jī)制,利用其對(duì)暗視野的敏銳感知作用加強(qiáng)對(duì)圖像暗邊緣的相對(duì)響應(yīng)強(qiáng)度,并根據(jù)神經(jīng)節(jié)細(xì)胞的經(jīng)典感受野的方向選擇特性獲取初級(jí)輪廓信息;其次參考外側(cè)膝狀體(Lateral geniculate nucleus,LGN)功能,提出一種將非經(jīng)典感受野側(cè)抑制與信息稀疏編碼相結(jié)合的紋理抑制方法,實(shí)現(xiàn)在初級(jí)輪廓響應(yīng)保留更多細(xì)節(jié)的前提下增強(qiáng)對(duì)背景強(qiáng)紋理的抑制效果,并探究其對(duì)微動(dòng)信息的整合作用,隨后采用動(dòng)態(tài)突觸將脈沖響應(yīng)傳遞至V1 區(qū),構(gòu)建成LGN 與初級(jí)視皮層的動(dòng)態(tài)信息關(guān)聯(lián)模型;最后提出一種新的視覺(jué)融合感知方案,利用跨視區(qū)的神經(jīng)響應(yīng)前饋機(jī)制對(duì)初級(jí)輪廓進(jìn)行修正后,將兩者在初級(jí)視皮層區(qū)快速融合實(shí)現(xiàn)顯著輪廓的檢測(cè)與提取.
視網(wǎng)膜是人類直接接受光源的高級(jí)視覺(jué)器官,在其最深處分布著視桿細(xì)胞和視椎細(xì)胞兩種不同類型的感光細(xì)胞,負(fù)責(zé)將光信號(hào)轉(zhuǎn)換成電信號(hào)[9],繼而實(shí)現(xiàn)神經(jīng)脈沖發(fā)放和信息傳遞.研究表明,視桿細(xì)胞作為視覺(jué)通路的前級(jí)單元,可以對(duì)弱光敏銳感知,隨后激勵(lì)信號(hào)沿著視神經(jīng)束傳至中樞神經(jīng)系統(tǒng),完成對(duì)暗視野的視覺(jué)調(diào)節(jié).雖然視桿細(xì)胞在弱光下的較為敏感但分辨能力較差,因此本研究如圖1 暗視野調(diào)節(jié)計(jì)算模型所示,首先引入去中心的高斯函數(shù)對(duì)原圖滑窗處理,描述非線性分布的視桿細(xì)胞對(duì)暗視野的感知作用,具體計(jì)算方法如式(1)~(3)所示.
圖1 暗視野調(diào)節(jié)過(guò)程示意圖Fig.1 The process of dark field adjustment
式中,(x,y)表示視覺(jué)圖像的二維坐標(biāo),(xm,yn)表示圖像局部窗口Sxy(以 (x,y)為中心原點(diǎn),d為窗長(zhǎng),r=(d-1)/2為半徑)內(nèi)的坐標(biāo)位置,σ(x,y)表示自適應(yīng)尺度,I(x,y)表示輸入圖像,Imax和Imin分別為I(x,y)的最大值與最小值;Wrod(x,y)表示暗視野調(diào)節(jié)因子,最后以平方根方式[10]與原圖融合得到暗視野調(diào)節(jié)響應(yīng)Irod(x.y).
考慮亮度信息對(duì)于圖像邊緣輪廓的判斷至關(guān)重要,本研究提出一種基于局部亮度特征的自適應(yīng)尺度計(jì)算模型,實(shí)現(xiàn)在圖像局部亮度較高的區(qū)域,視桿細(xì)胞幾乎無(wú)響應(yīng);在局部亮度較低的區(qū)域,視桿細(xì)胞響應(yīng)增強(qiáng),以此加強(qiáng)圖像暗邊緣區(qū)域的相對(duì)響應(yīng)強(qiáng)度.本文首先采用改進(jìn)的亮度特征計(jì)算方法獲取亮度通道,統(tǒng)計(jì)局部窗口亮度均值并歸一化為L(zhǎng)avg,具體定義如式(4)和式(5)所示.
以中心區(qū)感受野大小為單位,考慮其半徑至少為外周區(qū)的1/2,因此采用經(jīng)修正改進(jìn)的S 形函數(shù)對(duì)Lavg進(jìn)行激活響應(yīng),實(shí)現(xiàn)對(duì)尺度的動(dòng)態(tài)約束,可表示為
在神經(jīng)節(jié)細(xì)胞、LGN 及初級(jí)視皮層V1 區(qū)中,神經(jīng)細(xì)胞都會(huì)對(duì)特定朝向的條狀刺激產(chǎn)生激勵(lì)反應(yīng),稱之為方向選擇性[11-12].本文采用二維高斯導(dǎo)函數(shù)模擬多方向的刺激響應(yīng),如式(8)所示.
在視通路中,更高級(jí)的神經(jīng)元往往會(huì)具有更復(fù)雜且范圍更大的感受野,如LGN 細(xì)胞與神經(jīng)節(jié)細(xì)胞雖結(jié)構(gòu)相似,但前者的感受野尺度更大.此外,初級(jí)視皮層V1 區(qū)存在簡(jiǎn)單細(xì)胞和復(fù)雜細(xì)胞,但對(duì)方向和位置的敏感度兩者并不相同.一系列生理研究表明,視通路對(duì)光反射的刺激傳遞過(guò)程是一個(gè)多尺度、多朝向、高效率等復(fù)雜特性疊加的過(guò)程.本文為表征此特性對(duì)輪廓檢測(cè)的全局作用性,在式(8)基礎(chǔ)上,進(jìn)一步考慮多尺度方位特性,建立多維模型,如式(10)所示.
式中,θi和σj分別表示經(jīng)典感受野的第i個(gè)朝向和第j個(gè)尺度.
信息由視網(wǎng)膜處理經(jīng)視神經(jīng)纖維向兩側(cè)膝狀體投射,之后經(jīng)各類神經(jīng)細(xì)胞將此信號(hào)向初級(jí)視皮層和更高級(jí)的視覺(jué)中樞投射,完成對(duì)顏色、運(yùn)動(dòng)、亮度和其他深度視覺(jué)信息感知.為保留上述多級(jí)感受野的作用,本文使用主成分分析法模擬視通路對(duì)多尺度方位復(fù)雜信號(hào)的投射特性,以及皮層視區(qū)對(duì)視覺(jué)信息的快速理解能力.通過(guò)提取i×j個(gè)成分分量Ps并取最大值,獲得包含不同尺度大小、不同方位敏感特征,構(gòu)造全局輪廓信息檢測(cè)路徑,如式(11)所示.
其中,s表示成分分量的序號(hào),E2(x,y)表示全局輪廓信息.
稀疏表示已被證實(shí)是許多感覺(jué)神經(jīng)系統(tǒng)中的常見(jiàn)現(xiàn)象[13],視神經(jīng)節(jié)細(xì)胞的數(shù)量相比感光細(xì)胞少了近百倍,LGN 相較于前級(jí)在神經(jīng)元數(shù)量級(jí)上也顯著減少,但視覺(jué)信息在視通路上仍然可以進(jìn)行快速高效地傳遞.在神經(jīng)生理實(shí)驗(yàn)中發(fā)現(xiàn),神經(jīng)元集群中一般僅有少部分神經(jīng)元會(huì)伴隨著刺激而產(chǎn)生響應(yīng).因此在視覺(jué)通路上,神經(jīng)元具有響應(yīng)稀疏特性,這也是視覺(jué)系統(tǒng)處理冗余信息的一種有效策略和方法.稀疏編碼也常被用于區(qū)分目標(biāo)與背景[14],例如Alpert[15]等使用了稀疏度量方法,如式(12)所示.
其中,δ2(x,y)和μ(x,y)分別表示Irod(x,y)在局部窗口Sxy內(nèi)的方差和均值,f(x,y)為E1(x,y)強(qiáng)紋理區(qū)域的稀疏表達(dá).前項(xiàng)sparsity(x,y)對(duì)于包含輪廓區(qū)域的邊緣響應(yīng)分布具有高稀疏度,而后項(xiàng)通常可定性刻畫(huà)邊緣區(qū)與平滑區(qū),將兩者結(jié)合能有效地避免輪廓響應(yīng)細(xì)節(jié)信息的丟失以及紋理邊緣受到過(guò)度抑制.
在對(duì)視覺(jué)信息流進(jìn)行稀疏處理后,考慮到非經(jīng)典感受野對(duì)視覺(jué)信號(hào)具有側(cè)抑制作用,本文采用各向同性抑制方法刻畫(huà)LGN 的非經(jīng)典感受野特征,進(jìn)一步減弱紋理邊緣響應(yīng),如式(14)所示.
式中,DoG(x,y)表示高斯差函數(shù),經(jīng)半波整流后得到 DoG+(x,y),b(x,y)表示紋理抑制項(xiàng),由初級(jí)輪廓響應(yīng)E1(x,y)與距離抑制權(quán)重φ(x,y)卷積獲得.
最后根據(jù)式(15)得到經(jīng)協(xié)同紋理抑制后的輪廓信息.
其中,α表示非經(jīng)典感受野抑制強(qiáng)度,resize表示雙線性插值運(yùn)算.
當(dāng)信息流傳遞至LGN 時(shí),視覺(jué)系統(tǒng)能利用感受野對(duì)其進(jìn)行時(shí)空整合,實(shí)現(xiàn)對(duì)有效特征(空間頻率、顏色、視差等)的高效編碼,圖2 為本文動(dòng)態(tài)過(guò)程編碼部分結(jié)果.本文首先采用LIF (Leaky integrate and fire neurons)漏放電積分模型構(gòu)建外膝體環(huán)節(jié)的神經(jīng)元網(wǎng)絡(luò),以某一響應(yīng)周期T內(nèi)神經(jīng)元脈沖發(fā)放頻率對(duì)突觸激勵(lì)響應(yīng)進(jìn)行神經(jīng)編碼,同時(shí)考慮絕對(duì)不應(yīng)期,如式(16)所示.
圖2 動(dòng)態(tài)過(guò)程編碼示意圖Fig.2 Dynamic process coding
式中,cm和g1分別為神經(jīng)元的膜電容和漏電導(dǎo),v是神經(jīng)元膜電壓;Ie表示為式(15)中的C(x,y;α)所對(duì)應(yīng)的激勵(lì)電流.vth為脈沖發(fā)放閾值,vreset為靜態(tài)電勢(shì),ref為絕對(duì)不應(yīng)期,vg為刺激脈沖發(fā)放峰值.在激勵(lì)電流Ie刺激下,當(dāng)膜電壓v達(dá)到閾值vth時(shí)神經(jīng)元將會(huì)瞬間發(fā)放vg大小的脈沖響應(yīng),同時(shí)又將被重置為vreset進(jìn)入絕對(duì)不應(yīng)期,最終得到脈沖激勵(lì)響應(yīng)IFires(x,y).
視通路端到端且按環(huán)節(jié)的傳遞方式,使得前級(jí)視覺(jué)激勵(lì)通常在經(jīng)過(guò)后級(jí)處理后能表達(dá)更為有效的信息,而視覺(jué)系統(tǒng)的初始信息幾乎都源自于人眼固視微動(dòng).微動(dòng)作為視覺(jué)系統(tǒng)最基本的狀態(tài)模式,能夠在視網(wǎng)膜神經(jīng)節(jié)細(xì)胞反應(yīng)能力有限的情況下幫助快速獲取更多的視覺(jué)信息[16].鑒于LGN 環(huán)節(jié)的高效視覺(jué)整合能力,本文引入LGN 神經(jīng)元對(duì)微動(dòng)視覺(jué)特征的整合作用,突出輪廓信息并抑制細(xì)紋理的神經(jīng)脈沖發(fā)放響應(yīng)強(qiáng)度(如圖2(b)),具體操作如式(17)和式(18)所示.
式中,Iθi(x,y)為多方向微動(dòng)的神經(jīng)元響應(yīng),其中θi表示由pi和qi所確定的8 個(gè)微動(dòng)方向,[·]表示向下取整,dx和dy分別代表水平和豎直方向的微動(dòng)尺度,得到經(jīng)整合后的脈沖頻率響應(yīng)Imove(x,y).
信息經(jīng)LGN 傳遞至初級(jí)視皮層的過(guò)程中,突觸將神經(jīng)元間的沖動(dòng)相互聯(lián)系,其連接權(quán)值可針對(duì)突變刺激實(shí)現(xiàn)自適應(yīng)性的改變[17],在一定程度上提高響應(yīng)效率和差異感知能力.本文在編碼過(guò)程中充分考慮感受野內(nèi)神經(jīng)元的空間關(guān)系和激勵(lì)響應(yīng)頻率差異,探究頻域和空域兩方面對(duì)突觸連接強(qiáng)度的影響,具體如式(19)所示.
式中,Wconst表示強(qiáng)度調(diào)節(jié)常量,|P(x,y)-P(xc,yc)|和|Imove(x,y)-Imove(xc,yc)|分別表示群體感受野周邊與中心的空間距離和神經(jīng)元脈沖頻率差異,RFr是神經(jīng)元群體感受野半徑,ΔImove表示群體感受野內(nèi)神經(jīng)元脈沖頻率響應(yīng)的最大差值.
最后通過(guò)動(dòng)態(tài)突觸權(quán)值與微動(dòng)調(diào)節(jié)下的神經(jīng)元脈沖響應(yīng)頻率卷積運(yùn)算,實(shí)現(xiàn)神經(jīng)元的動(dòng)態(tài)傳遞編碼(如圖2(c)),如式(20)所示.
相關(guān)生理研究表明,在視通路中視覺(jué)信息流存在兩條傳遞路徑.第1 條路徑中幾乎所有外界光刺激在視神經(jīng)感知及視交叉作用后,經(jīng)過(guò)外膝體區(qū)后投射至初級(jí)視皮層[18],但存在少數(shù)神經(jīng)響應(yīng)不受外膝體環(huán)節(jié)處理,經(jīng)上丘、丘腦枕后抵達(dá)視覺(jué)皮層構(gòu)成第2 條路徑,這一信息傳遞與處理過(guò)程是一個(gè)涉及復(fù)雜神經(jīng)網(wǎng)絡(luò)的動(dòng)力學(xué)過(guò)程.還有研究發(fā)現(xiàn)外膝體不僅是前后視覺(jué)信息的并行處理和層級(jí)傳遞關(guān)鍵,實(shí)際上視覺(jué)皮層還與其存在反饋神經(jīng)關(guān)聯(lián)[19],使得外膝體能夠獲得來(lái)自V1 區(qū)的投射.此外,視覺(jué)通路中還存在自上向下及自下向上的途徑[20],實(shí)現(xiàn)高級(jí)視皮層對(duì)信息流的快速且高效理解,并對(duì)低級(jí)皮層實(shí)現(xiàn)調(diào)控作用.
綜上所述,視覺(jué)通路上信息同時(shí)存在并行與串行處理方式,而且兼具跨區(qū)域的前饋與反饋機(jī)制,這有利于視皮層對(duì)細(xì)節(jié)信息更高分辨率的感知,強(qiáng)化主體輪廓信息.本文在初級(jí)視皮層V1 區(qū),利用多方向尺度快速投射的全局輪廓信息,對(duì)直接前饋的初級(jí)輪廓響應(yīng)進(jìn)行修正,并與經(jīng)視通路多環(huán)節(jié)處理的動(dòng)態(tài)脈沖響應(yīng)結(jié)果快速點(diǎn)乘融合,加強(qiáng)視覺(jué)系統(tǒng)對(duì)輪廓的顯著性注意作用,具體實(shí)現(xiàn)如式(21)所示.
式中,E1(x,y)表示初級(jí)輪廓響應(yīng),E2(x,y)表示全局輪廓信息,IV1(x,y)表示動(dòng)態(tài)脈沖響應(yīng)結(jié)果,SE(x,y)表示在初級(jí)視皮層輪廓融合歸一化后的結(jié)果.
結(jié)合信息流在視通路中不同環(huán)節(jié)具有不同的處理加工方式特點(diǎn),對(duì)本文輪廓檢測(cè)算法進(jìn)行如下描述:
1)根據(jù)視網(wǎng)膜視桿細(xì)胞的暗視覺(jué)敏感特性,通過(guò)式(4)~(7)所提取的加權(quán)亮度通道構(gòu)建動(dòng)態(tài)尺寸計(jì)算模型,然后按式(1)~(3)模擬對(duì)視覺(jué)信息的暗視野動(dòng)態(tài)調(diào)節(jié).
2)基于經(jīng)典感受野的方向選擇性以及多尺度特性.首先按式(8)和式(9)模擬神經(jīng)節(jié)細(xì)胞對(duì)輪廓的初級(jí)感知,然后考慮不同組織結(jié)構(gòu)的感受野具有不同的尺度大小,按式(10)和式(11)構(gòu)建感受野多方向尺度投射模型(圖3 虛線部分),獲得全局輪廓信息.
3)根據(jù)LGN 細(xì)胞的稀疏傳遞和非經(jīng)典感受野的側(cè)抑制特性,分別按式(12)和式(13)實(shí)現(xiàn)對(duì)初級(jí)輪廓響應(yīng)的強(qiáng)紋理稀疏表達(dá),按式(14)實(shí)現(xiàn)各向同性抑制,隨后按式(15)將兩者以α抑制強(qiáng)度融合,突出主體輪廓信息.
4)基于LGN 對(duì)多視覺(jué)特征的處理能力以及其和主視皮層的動(dòng)態(tài)關(guān)聯(lián)特性,首先按式(16)對(duì)輪廓響應(yīng)進(jìn)行脈沖頻率響應(yīng)編碼,再將編碼結(jié)果按式(17)和式(18)對(duì)微動(dòng)信息進(jìn)行整合處理,最后按式(19)和式(20)模擬LGN 將脈沖響應(yīng)刺激動(dòng)態(tài)傳遞至初級(jí)視皮層.
5)引入視覺(jué)系統(tǒng)的跨視區(qū)多通路前饋機(jī)制,按式(21)將初級(jí)輪廓響應(yīng)經(jīng)全局輪廓信息修正后,與視皮層區(qū)的脈沖響應(yīng)輸出快速融合.再經(jīng)過(guò)非極大值抑制和滯后閾值處理,得到最終的二值輪廓響應(yīng)圖.
本文整體算法流程如圖3 所示.
圖3 算法流程圖Fig.3 Algorithm flowchart
自然場(chǎng)景下的圖像往往具有強(qiáng)噪聲干擾特性,且主體與背景間易發(fā)生輪廓粘連.本文使用了包含40 幅灰度圖像的RuG40 自然場(chǎng)景圖像數(shù)據(jù)庫(kù)(http://www.cs.rug.nl/imaging/),每幅圖像有一張手工繪制的二值基準(zhǔn)輪廓圖,用于評(píng)估本文方法的有效性.
為保證本文后續(xù)算法的可行性,首先用經(jīng)二維高斯導(dǎo)函數(shù)(Gaussian divative,GD)處理,但未經(jīng)視皮層神經(jīng)加工的輪廓響應(yīng)與本文算法對(duì)比;其次選擇文獻(xiàn)[21]中提出的各向同性抑制模型(Isotropic inhibition model,ISO),體現(xiàn)本文紋理抑制方法的優(yōu)越性;然后根據(jù)文獻(xiàn)[22]的方法,除去彩色圖像下的顏色雙拮抗機(jī)制,僅考慮灰度圖像在空間稀疏性約束條件下的輪廓檢測(cè)方法(Spatial sparseness constraint,SSC),突出變異系數(shù)調(diào)制對(duì)紋理稀疏編碼的作用;再選擇文獻(xiàn)[5]中提出的基于初級(jí)視通路編碼模型(Multiple-neural coding,MNC),證明本文紋理抑制方法與分級(jí)結(jié)構(gòu)模型的優(yōu)越性;然后與文獻(xiàn)[23]中的基于多特征抑制的輪廓檢測(cè)模型(Multiple-cue inhibition,MCI)比較;最后以本文算法為基礎(chǔ),去除神經(jīng)元?jiǎng)討B(tài)編碼的模型(No dynamic coding,NDC)比較,驗(yàn)證算法的后續(xù)有效性.本文中二維高斯導(dǎo)尺度σCRF=1.5,(Difference of Gaussians,DOG)中的CRF和nCRF 大小分別為2和8,γ=0.5,共選取Nθ=16個(gè)濾波器朝向,同時(shí)等間隔選取多個(gè)LGN 中的nCRF 抑制強(qiáng)度系數(shù)α=[0.1:0.1:1.0].為將最終輪廓檢測(cè)結(jié)果與二值標(biāo)準(zhǔn)輪廓進(jìn)行定量計(jì)算,需要對(duì)輪廓響應(yīng)進(jìn)行非極大值抑制處理和滯后閾值處理,上限閾值t=[0.05:0.05:1.0].由于GD 方法和SSC方法不考慮α值,僅得到20 組測(cè)試數(shù)據(jù),ISO、MNC、MCI、NDC 以及本文方法可以分別得到200 組數(shù)據(jù).
從圖4 結(jié)果可知,僅采用GD 算法處理提取的輪廓較為完整,但存在過(guò)多的細(xì)紋理導(dǎo)致部分細(xì)節(jié)信息冗余,輪廓模糊.ISO 算法由于引入了非經(jīng)典感受野的側(cè)抑制作用,相較于GD 算法背景紋理得到了較好的抑制,但干擾了部分主體輪廓,造成弱輪廓區(qū)域的信息丟失;SSC 算法通過(guò)構(gòu)建空間稀疏約束模型實(shí)現(xiàn)去除顯著的大紋理區(qū)域,但其未考慮輪廓各區(qū)間的聯(lián)系,檢測(cè)結(jié)果存在較多的邊緣毛刺并且輪廓出現(xiàn)斷裂情況;MNC 算法進(jìn)一步引入了冗余度編碼等方法,一定程度上保留了更多目標(biāo)主體輪廓信息但同時(shí)也產(chǎn)生了新的紋理噪聲;MCI 算法以尺度為指導(dǎo)條件,融合了朝向、亮度、對(duì)比度三種特征,加強(qiáng)了輪廓信息同時(shí)也丟失了較多細(xì)節(jié);NDC 算法由于并未考慮神經(jīng)元突觸之間的相互關(guān)聯(lián)性,在紋理抑制和輪廓加強(qiáng)之間較難均衡,造成輪廓信息割裂;而本文方法將LGN 對(duì)信息的多層級(jí)處理方式和與初級(jí)視皮層的動(dòng)態(tài)關(guān)聯(lián)性相結(jié)合,所獲得的最終輪廓檢測(cè)結(jié)果在保持主體輪廓完整的前提下,紋理相對(duì)較少.其相較于GD、ISO、MNC方法有更強(qiáng)的紋理抑制強(qiáng)度,相對(duì)SSC、MCI、NDC 方法有更加平滑完整的目標(biāo)輪廓.
圖4 RuG40 自然圖像庫(kù)的輪廓檢測(cè)結(jié)果 (第1 行為自然圖像測(cè)試集;第2 行為真實(shí)輪廓圖;第3 行為GD 方法檢測(cè)結(jié)果;第4 行為ISO 方法檢測(cè)結(jié)果;第5 行為SSC 方法檢測(cè)結(jié)果;第6 行為MNC 方法檢測(cè)結(jié)果;第7 行為MCI 方法檢測(cè)結(jié)果;第8 行為NDC 方法檢測(cè)結(jié)果;第9 行為本文方法檢測(cè)結(jié)果)Fig.4 Contour detection results of RuG40 natural image library (the first line is the natural image test sets;the second line is the true contour maps;the third line is the results of GD;the fourth line is the results of ISO;the fifth line is the results of SSC;The sixth line is the results of the MNC;the seventh line is the results of the MCI;the eighth line is the results of NDC;the ninth line is the results of ours method)
由于基于視覺(jué)機(jī)制的輪廓檢測(cè)方法中,不同計(jì)算模型基于不同的機(jī)制,通常設(shè)置相應(yīng)的Sigma 尺度,或者有不同的Weight 權(quán)重,以及一些模型獨(dú)有的參數(shù),所以通常采用最優(yōu)P值及其他性能指標(biāo)去評(píng)價(jià)模型的性能優(yōu)劣.
為更直觀地定量分析輪廓檢測(cè)效果,本文采用Grigorescu 等在文獻(xiàn)[21]中提出的方法進(jìn)行計(jì)算,但最終的輪廓結(jié)果相對(duì)于基準(zhǔn)輪廓圖的像素位置會(huì)存在一定范圍內(nèi)的可控偏差.因此實(shí)驗(yàn)認(rèn)為,若檢測(cè)到某像素出現(xiàn)基準(zhǔn)輪廓像素的5×5 鄰域內(nèi),則認(rèn)為該像素點(diǎn)為檢測(cè)正確.記ED和EGT分別為算法檢測(cè)到的輪廓像素集和基準(zhǔn)輪廓像素集,可得算法所正確檢測(cè)到的像素集E=ED∩(EGT⊕T)(⊕表示為膨脹操作,T為5×5 的結(jié)構(gòu)單元);錯(cuò)檢的像素集為EFP=ED-E;漏檢的像素集為EFN=EGT-(EGT∩(ED⊕T)).據(jù)此,可由式(22)~(24)得評(píng)價(jià)指標(biāo)誤檢率eFP、漏檢率eFN和整體性能指標(biāo)P為
式中,card(C)為集合C中的元素個(gè)數(shù).上述各式表明,誤檢率eFP越小則背景紋理越少,漏檢率eFN越小則對(duì)象輪廓保留的越多,具體計(jì)算結(jié)果如表1 所示.
據(jù)表1 可知,定量計(jì)算結(jié)果與上述定性分析結(jié)果大致相同.GD 算法對(duì)于目標(biāo)突出的自然圖像所提取的輪廓比較完整,漏檢率eFN較小而誤檢率eFP偏大,但對(duì)于如Lions 紋理復(fù)雜的圖像,該算法漏檢率更大,可能因?yàn)橹黧w與背景紋理過(guò)于接近而無(wú)法準(zhǔn)確獲取輪廓信息.SSC 算法在幾幅圖中表現(xiàn)出較高的漏檢率和較低的誤檢率,表明其根據(jù)數(shù)學(xué)空間的稀疏約束方法,雖然加強(qiáng)了紋理噪聲的抑制,但并沒(méi)能準(zhǔn)確地區(qū)分紋理區(qū)和輪廓區(qū),導(dǎo)致伴隨著背景強(qiáng)紋理受到抑制的同時(shí),主體輪廓信息也發(fā)生了丟失.ISO、MNC和MCI 算法都是從視覺(jué)機(jī)制出發(fā),相對(duì)于GD 算法誤檢率有所降低,并且和漏檢率之間保持一定平衡.ISO 算法采用Gabor 濾波器模擬經(jīng)典感受野的朝向特性提取圖像輪廓,再考慮非經(jīng)典感受野的側(cè)抑制作用實(shí)現(xiàn)紋理抑制,其相比GD 算法更穩(wěn)定有效,但卻忽略了視通路層級(jí)傳遞的特性,實(shí)現(xiàn)方法過(guò)于簡(jiǎn)單使得背景紋理抑制強(qiáng)度有限.MNC 算法基于初級(jí)視通路視覺(jué)感知機(jī)制,在ISO 算法基礎(chǔ)上引入了時(shí)空編碼,輻射區(qū)冗余度增強(qiáng)編碼等方法,對(duì)于具有復(fù)雜背景的圖像,檢測(cè)結(jié)果的輪廓信息較為完整,但同時(shí)含有較多的背景紋理導(dǎo)致誤檢率eFP偏高.MCI 算法基于初級(jí)視皮層V1 區(qū)感受野的神經(jīng)元反應(yīng),綜合考慮了多種局部特征以提高輪廓檢測(cè)性能,但由于其通過(guò)組合權(quán)重的方式進(jìn)行圖像融合,最終提取的輪廓不夠精準(zhǔn),部分細(xì)節(jié)存在丟失現(xiàn)象,相較于本文方法誤檢率偏高.NDC 是在本文算法基礎(chǔ)上,去掉神經(jīng)元?jiǎng)討B(tài)編碼后的算法模型,其提取的輪廓在部分區(qū)域存在斷裂情況,驗(yàn)證了神經(jīng)元?jiǎng)討B(tài)編碼過(guò)程由于難以均衡eFP和eFN導(dǎo)致最終P值相比本文算法有所降低,驗(yàn)證了本文算法模型的有效性.總體而言,上述6 種算法P值均劣于本文方法.本文方法將輸入圖像經(jīng)暗視野調(diào)節(jié)后,結(jié)合了稀疏編碼與非經(jīng)典感受野對(duì)紋理的抑制作用以及微動(dòng)視覺(jué)信息整合機(jī)制,充分反映了LGN 對(duì)視覺(jué)特征的高效處理能力,然后引入神經(jīng)元?jiǎng)討B(tài)編碼過(guò)程以及跨視區(qū)前饋融合方法,檢測(cè)結(jié)果在背景紋理得到抑制的同時(shí),輪廓也較完整清晰,對(duì)比上述其他算法具有一定優(yōu)勢(shì).
表1 圖4 中不同算法的參數(shù)設(shè)置與性能評(píng)價(jià)指標(biāo)Table 1 Parameters and performance of the different algorihms in Fig.4
本文為各算法引入FPS (Frames per second)指標(biāo)(即每秒處理的圖像數(shù)量),由于RuG40 數(shù)據(jù)集各圖像較為近似,本文僅以Buffalo 圖像參照說(shuō)明.觀察表1 可知,GD和ISO 算法FPS 較高,但是在檢測(cè)效果上較差,而SSC和MNC 算法能夠較好地均衡了處理速率與檢測(cè)效果,但輪廓檢測(cè)性能有限.通過(guò)NDC、MCI 與本文算法FPS 指標(biāo)相比較可得,本文算法在進(jìn)一步深化視覺(jué)機(jī)制的加工過(guò)程中,在運(yùn)行速度基本保持不變的情況下,實(shí)現(xiàn)檢測(cè)效果和魯棒性能的提升.
上述實(shí)驗(yàn)僅包含部分圖像數(shù)據(jù),因此為驗(yàn)證本文方法針對(duì)整體數(shù)據(jù)集的有效性,需進(jìn)一步定量分析各個(gè)算法在RuG40 圖像庫(kù)上的測(cè)試效果.如圖5所示,其中各算法模型的左柱狀圖表示整個(gè)數(shù)據(jù)集在最優(yōu)參數(shù)下的P值,右柱狀圖表示每幅圖片的最優(yōu)P值的均值,由于不同圖像間存在像素差異,故單幅圖片最優(yōu)平均P值(右柱狀圖)總是更大.由圖5 可知,各算法結(jié)果與上述分析結(jié)果基本一致,且本文方法在整體圖像庫(kù)指標(biāo)和單幅圖片指標(biāo)的表現(xiàn)上均更優(yōu).
圖5 各算法模型在整個(gè)數(shù)據(jù)集的最優(yōu)平均P值和單幅圖片的最優(yōu)均值Fig.5 ThePvalue of each algorithm model in the entire data set and the optimal average value of a single picture
此外,本文在多組參數(shù)條件下,利用輪廓檢測(cè)算法對(duì)其他部分自然圖像進(jìn)行性能測(cè)試,并將結(jié)果P值以箱線圖(圖6)方式統(tǒng)計(jì).圖中箱體頂部表示在排除異常值后的最優(yōu)結(jié)果,箱體中部橫線表示P值中位數(shù).根據(jù)該7 幅圖像的測(cè)試結(jié)果可知,本文算法均有較好的性能.
圖6 部分圖像在多組參數(shù)下檢測(cè)結(jié)果的P值箱線圖(G 表示GD 算法,I 表示ISO 算法,S 表示SSC 算法,M 表示MNC 算法,C 表示MCI 算法,N 表示NDC 算法,O 表示本文算法)Fig.6 P-value box plot of the detection results of some images under multiple sets of parameters (G represents the GD,I represents the ISO,S represents the SSC,M represents the MNC,C represents the MCI,N represents the NDC,and O represents the algorithm in this paper)
為進(jìn)一步突出算法模型的輪廓檢測(cè)效果及其性能,本文另針對(duì)BSDS500 數(shù)據(jù)庫(kù)圖集隨機(jī)選擇5幅圖片進(jìn)行結(jié)果展示以及定量分析,如圖7 與表2所示.其中GD 算法依舊無(wú)法區(qū)分主體對(duì)象輪廓與背景紋理的差異,因此總具有較高的誤檢率eFP,ISO 在此基礎(chǔ)上利用非經(jīng)典感受野的側(cè)抑制特性,有效減弱了圖像強(qiáng)紋理噪聲的響應(yīng),降低了eFP,卻由于割裂了主體與背景的主次關(guān)系導(dǎo)致漏檢率eFN上升;SSC 算法的稀疏約束模型雖然進(jìn)一步弱化了紋理響應(yīng),但也丟失了較多復(fù)雜主體對(duì)象的輪廓信息,例如在第3 幅和第5 幅圖中,部分主體輪廓的丟失導(dǎo)致了漏檢率的升高;MCI、MNC 算法所引入的多特征、多機(jī)制等視覺(jué)結(jié)構(gòu)模型,在對(duì)目標(biāo)的輪廓檢測(cè)結(jié)果上相較于上述算法更為優(yōu)異,但在輪廓細(xì)節(jié)檢測(cè)以及紋理抑制上還存在不足,因此eFP總高于本文算法;NDC 算法利用暗視野調(diào)節(jié)、改進(jìn)的稀疏編碼等方法,更加有效地強(qiáng)化了主體輪廓,抑制了強(qiáng)、弱紋理響應(yīng);本文算法利用所提出的神經(jīng)元?jiǎng)討B(tài)傳遞編碼,更進(jìn)一步提高了P值,降低了eFN和eFP.據(jù)以上分析,本算法在背景紋理抑制,以及輪廓檢測(cè)完整性方面表現(xiàn)更加有效,所提出的相關(guān)實(shí)驗(yàn)步驟對(duì)于圖像顯著輪廓的檢測(cè)和強(qiáng)紋理噪聲的抑制作用也較為明顯,整體表現(xiàn)更為優(yōu)異.
圖7 BSDS500 圖像數(shù)據(jù)集的輪廓檢測(cè)結(jié)果(第1 行為自然圖像測(cè)試集;第2 行為圖像真實(shí)輪廓;第3 行為GD 方法檢測(cè)結(jié)果;第4 行為ISO 方法檢測(cè)結(jié)果;第5 行為SSC 方法檢測(cè)結(jié)果;第6 行為MCI 方法檢測(cè)結(jié)果;第7 行為MNC 方法檢測(cè)結(jié)果;第8 行為NDC 方法檢測(cè)結(jié)果;第9 行為本文方法檢測(cè)結(jié)果)Fig.7 Contour detection results of BSDS500 image library (the first line is the natural image test sets;the second line is the true contour maps;the third line is the results of GD;the fourth line is the results of ISO;the fifth line is the results of SSC;The sixth line is the results of the MNC;the seventh line is the results of the MCI;the eighth line is the results of NDC;the ninth line is the results of ours method)
表2 圖7 中不同算法的參數(shù)設(shè)置與性能評(píng)價(jià)指標(biāo)Table 2 Parameters and performance of the different algorihms in Fig.7
類似地,本文利用上述5 幅圖像的檢測(cè)數(shù)據(jù)構(gòu)建P值箱線圖,并對(duì)BSDS500 驗(yàn)證集中所有圖像進(jìn)行輪廓檢測(cè),統(tǒng)計(jì)各算法模型在整個(gè)數(shù)據(jù)集的最優(yōu)平均P值和單幅圖片的最優(yōu)均值,進(jìn)一步驗(yàn)證本文算法模型的有效性與泛化性,結(jié)果如圖8和圖9 所示.
圖8 BSDS500 部分圖像在多組參數(shù)下檢測(cè)結(jié)果的P值箱線圖(G 表示GD 算法,I 表示ISO 算法,S 表示SSC 算法,C 表示MCI 算法,M 表示MNC 算法,N 表示NDC 算法,O 表示本文算法)Fig.8 P-value box plot of the detection results of some BSDS500 images under multiple sets of parameters(G represents the GD,I represents the ISO,S represents the SSC,C represents the MCI,M represents the MNC,N represents the NDC,and O represents the algorithm in this paper)
圖9 各算法模型在BSDS500 數(shù)據(jù)集的最優(yōu)平均P值和單幅圖片的最優(yōu)均值Fig.9 ThePvalue of each algorithm model in the BSDS500 data set and the optimal average value of a single picture
根據(jù)圖8的P值箱線圖可知,本文算法模型相較于目前其他基于視覺(jué)機(jī)制的輪廓檢測(cè)方法更加優(yōu)異,并具有較好的魯棒性.另外從圖9 數(shù)據(jù)中可得,本文算法在BSDS500 驗(yàn)證集下也有更好的檢測(cè)效果.SSC 算法在RuG40 數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果較差,但是在BSDS500 數(shù)據(jù)集上的整體表現(xiàn)較為突出,其中可能原因是SSC 算法針對(duì)彩色圖像引入了顏色雙拮抗機(jī)制,而RuG40 數(shù)據(jù)集僅包含二值圖像.因此,本文算法模型在針對(duì)彩色復(fù)雜圖像的輪廓檢測(cè)能力上,還有可深入研究的空間.
綜合上述實(shí)驗(yàn)可知,本文所提出的基于主通路結(jié)構(gòu)分級(jí)響應(yīng)模型的輪廓檢測(cè)方法,在RuG40 與BSDS500 數(shù)據(jù)集上均表現(xiàn)較好,檢測(cè)效果具有一定優(yōu)勢(shì)的同時(shí),也存在可改進(jìn)之處.
本文研究基于生物視覺(jué)系統(tǒng),探討了不同組織結(jié)構(gòu)間的生理特性差異,提出了一種不同的視覺(jué)信息傳遞和處理方法.首先根據(jù)視網(wǎng)膜視桿細(xì)胞特性對(duì)灰度自然圖像進(jìn)行暗視野調(diào)節(jié),突出主體目標(biāo).根據(jù)經(jīng)典感受野的方向選擇性和多尺度特性,實(shí)現(xiàn)初級(jí)輪廓感知和全局輪廓信息的提取;其次考慮LGN 細(xì)胞對(duì)信息的稀疏編碼加快響應(yīng)速度,并結(jié)合非經(jīng)典感受野的側(cè)抑制作用,強(qiáng)化輪廓特征抑制背景紋理;然后對(duì)輪廓信息進(jìn)行生理神經(jīng)元編碼,根據(jù)LGN 與初級(jí)視皮層間的層級(jí)關(guān)聯(lián)機(jī)制,提出一種結(jié)合微動(dòng)信息整合的神經(jīng)元?jiǎng)討B(tài)過(guò)程編碼方法,提高了輪廓信息的完整性;最后通過(guò)視覺(jué)系統(tǒng)多路徑加工的特點(diǎn),將初級(jí)輪廓響應(yīng)經(jīng)全局輪廓信息修正后與最終響應(yīng)進(jìn)行快速融合,在提取弱輪廓信息的同時(shí)也抑制了背景紋理噪聲.目前深度學(xué)習(xí)模型對(duì)于高質(zhì)量的樣本具有較高的輪廓檢測(cè)精度,但模型并不具有可解釋性,并嚴(yán)重依賴于海量的訓(xùn)練樣本.而本文所采用的輪廓檢測(cè)模型是一種基于生物視覺(jué)機(jī)制的機(jī)理模型,具有效率高、成本低、無(wú)監(jiān)督的優(yōu)勢(shì),在針對(duì)RuG40、BSDS500 圖像數(shù)據(jù)集的對(duì)比實(shí)驗(yàn)中驗(yàn)證了其有效性,也為后續(xù)視覺(jué)信息在視通路中的傳遞編碼方式提供了新想法.