于 明,邳艷芹
(河北工業(yè)大學(xué) 信息工程學(xué)院,天津 300401)
在視覺(jué)上,人們總是能迅速地把目光集中在自己感興趣的方面[1]。隨著圖像處理技術(shù)的發(fā)展,感興趣區(qū)域的提取是近期圖像處理技術(shù)發(fā)展的熱點(diǎn),在圖像處理中把計(jì)算資源用于處理感興趣區(qū)域,會(huì)提高圖像處理的效率。感興趣區(qū)域(ROI)檢測(cè)將人類的視覺(jué)注意機(jī)制引入到圖像分析過(guò)程中,對(duì)于提高現(xiàn)有圖像分析系統(tǒng)的工作效率有著積極的作用[2],同時(shí)在視頻壓縮及檢索領(lǐng)域也得到了應(yīng)用。
感興趣區(qū)域(ROI)是圖像中可能引起人眼視覺(jué)關(guān)注的區(qū)域。視覺(jué)關(guān)注是人類視覺(jué)系統(tǒng)捕獲場(chǎng)景中有意義部分的一種機(jī)制,通過(guò)對(duì)視覺(jué)關(guān)注的分析能提取圖像中的感興趣區(qū)域。視覺(jué)選擇性注意機(jī)制包括兩種,一是從下至上的注意(數(shù)據(jù)驅(qū)動(dòng)的注意模型),是與任務(wù)無(wú)關(guān)且不受意識(shí)控制的,是基于視覺(jué)輸入景象的顯著性計(jì)算的,屬于低級(jí)認(rèn)知的過(guò)程。目前另一個(gè)是自上而下的注意 (任務(wù)驅(qū)動(dòng)的注意模型),與人的主觀意識(shí)有關(guān)且受意識(shí)控制[3]。其中最具影響力的當(dāng)屬Itti和Koch等人提出的Saliency模型[1],利用人的視覺(jué)感受野、側(cè)抑制神經(jīng)網(wǎng)絡(luò)模擬了人的視覺(jué)注意力機(jī)制。但是該模型最終的顯著區(qū)域的范圍是固定的形狀,并且存在著漏檢測(cè)和檢測(cè)順序不合乎人類視覺(jué)注意特征的情況。
想要全面準(zhǔn)確的描述一幅圖像,就要針對(duì)其各個(gè)方面的視覺(jué)屬性選擇多種簡(jiǎn)單圖像特征。文中基于Itti模型[4-5]的基本方法來(lái)提取圖像的顏色、亮度和方向3個(gè)低層特征來(lái)獲得圖像各個(gè)特征的特征圖。
1)亮度特征圖的提取
設(shè) r(t),g(t)和 b(t)分別表示原始圖像中的紅色、綠色和藍(lán)色通道,其中t表示圖像的尺度,將原始圖像的尺度設(shè)置為0,則亮度特征圖的計(jì)算方法如式(1)所示。
2)方向特征圖的提取
神經(jīng)還原論中提到,視皮層細(xì)胞可以看做是一個(gè)線性空間濾波器,而二維的Gabor函數(shù)剛好有效的描述了哺乳動(dòng)物視皮層簡(jiǎn)單細(xì)胞感受野的刨面。
由于Gabor函數(shù)有很好的方向選擇性,能很好的描述視覺(jué)皮層中具有方向選擇性的簡(jiǎn)單細(xì)胞的感受野。因此用濾波器對(duì)I進(jìn)行卷積以提取方向特征,采用二維Gabor濾波器,取Gabor濾波器 (0,π/4,π/2,3π/4)4 個(gè)方向的輸出作為圖像的方向特征圖。
低層特征提取后,關(guān)鍵問(wèn)題是計(jì)算特征興趣圖。本文對(duì)亮度特征圖4個(gè)方向分量共5個(gè)分量特征圖采用非線性尺度空間表示,中央圖像對(duì)應(yīng)高分辨率下的尺度,外圍圖像對(duì)應(yīng)低分辨率下的尺度,通過(guò)感受野和整合野的中央-外圍的計(jì)算策略計(jì)算特征興趣圖。
1)亮度特征興趣圖(顯著圖)
Itti模型認(rèn)為高分辨率圖像代表感受野的中央?yún)^(qū)域,低分辨率圖像代表感受野的周邊區(qū)域,通過(guò)跨尺度計(jì)算不同分辨率圖像之間的差值來(lái)提取特征圖。
根據(jù)亮度對(duì)比度產(chǎn)生亮度顯著圖,亮度特征計(jì)算如下:
其中c是非線性尺度空間中表示的高分辨率的尺度因子,s是對(duì)應(yīng)的低分辨率下的尺度,通過(guò)高分辨率圖像中的像素減低分辨率圖像中的對(duì)應(yīng)像素來(lái)實(shí)現(xiàn)。
2)顏色特征興趣圖(顯著圖)
顯著區(qū)域即為變化強(qiáng)烈的區(qū)域,也就是頻譜中的高頻成分。由于Itti模型在提取顏色特征時(shí)可能會(huì)出現(xiàn)顯著區(qū)域反轉(zhuǎn)現(xiàn)象,因此,可以通過(guò)過(guò)濾掉圖像中的低頻部分,提取圖像中的高頻部分來(lái)作為圖像的顯著區(qū)域。
這里采用 Achanta等人[6]提出的頻域調(diào)和(Frequencytuned)的顯著性檢測(cè)方法。先將顏色變化到均勻的CIELab顏色空間,再對(duì)變換后的圖像進(jìn)行高斯低通濾波,最后求原圖與濾波后的圖像的差的平方即為顏色的顯著圖記為C(x,y):
其中,Iu為像素值的算術(shù)平均,Iwhc為原始圖像經(jīng)過(guò)高斯模糊得到的。
3)方向特征興趣圖(顯著圖)
通過(guò)局部方向?qū)Ρ榷扔?jì)算方向特征顯著圖,將方向特征圖 O(c,s,θ)編碼成一組:
由于全局加強(qiáng)法沒(méi)有考慮到自然圖像中的信噪比問(wèn)題,并且視皮層的神經(jīng)元是局部互連的,尋找全局極大在生物學(xué)上也是不合理的。因此本文采用局部迭代法對(duì)不同機(jī)理產(chǎn)生特征圖進(jìn)行合并。具體做法是:
首先將各特征圖的特征值歸一化到同一個(gè)范圍,其次引入高斯差分函數(shù)(DOG),最后將歸一化的特征值與高斯差分函數(shù)進(jìn)行卷積。圖1描述了局部迭代法的工作流程。
圖1 局部迭代法流程Fig.1 Local iteration process
局部迭代法是中央自激勵(lì)、范圍內(nèi)抑制的結(jié)構(gòu),很好的促進(jìn)了相鄰顯著點(diǎn)之間的局部競(jìng)爭(zhēng)。迭代次數(shù)是根據(jù)實(shí)驗(yàn)經(jīng)驗(yàn)人為設(shè)定的,一般是到特征圖中大多數(shù)位置的特征值收斂且接近于0時(shí)就停止迭代過(guò)程。
高斯差分函數(shù)就是中央自激勵(lì)、鄰域范圍內(nèi)抑制的結(jié)構(gòu);從生物學(xué)的角度來(lái)講,與人眼主視皮層的中央自激勵(lì)、鄰域范圍內(nèi)抑制的神經(jīng)元間的側(cè)連接組織方式相似,具有生物學(xué)上的合理性[8]。這種結(jié)構(gòu)促成相鄰顯著點(diǎn)之間的局部競(jìng)爭(zhēng)。由該方法產(chǎn)生的興趣圖更接近稀疏分布,目標(biāo)之外的部分被很好的抑制。局部迭代法對(duì)其他非顯著目標(biāo)部分產(chǎn)生強(qiáng)烈抑制的特點(diǎn),表明了該策略在對(duì)噪聲有良好的魯棒性。
如何確定感興趣區(qū)域的范圍,又該如何排除干擾,使區(qū)域的選擇更精確,基于前文顯著圖的獲取,利用綜合自動(dòng)閾值分割和種子點(diǎn)的區(qū)域生長(zhǎng)方法分別對(duì)各個(gè)顯著圖進(jìn)行區(qū)域提取進(jìn)而得到各自的興趣區(qū)域,在根據(jù)判決準(zhǔn)則對(duì)各個(gè)區(qū)域進(jìn)行篩選合并,從而得到最后的感興趣區(qū)域:具體步驟如下:
1)保留前文生成的亮度、顏色和方向的顯著圖I,C,O。
2)利用最優(yōu)直方圖方法從合并的興趣圖生成閾值Hs。
3)根據(jù)Hs分別對(duì)底層特征顯著圖進(jìn)行閾值分割。
4)用保留的最佳尺度的注視點(diǎn)[Xi,Yi],i∈(I,C,O)為種子點(diǎn),然后通過(guò)逐個(gè)對(duì)分割后的顯著圖進(jìn)行區(qū)域生長(zhǎng)的方法得到各自的興趣區(qū)域 R,i∈(I,C,O)。
5)定義興趣區(qū)域面積 Sregion=|max(x)-min(x)|×|max(y)-min(y)|,(x,y)∈R 如果 Sregion>65%Smap,則該區(qū)域被刪除。 其中Smap為興趣圖的面積。
6)將保留的感興趣區(qū)域進(jìn)行合并,得到最終的感興趣區(qū)域。
感興趣區(qū)域提取方法的流程如圖2所示。
圖2 感興趣區(qū)域提取模型Fig.2 Region of interest extraction model
該方法與閾值分割技術(shù)和種子點(diǎn)的區(qū)域生長(zhǎng)技術(shù)相結(jié)合,近似的估算了顯著圖目標(biāo)的尺寸。經(jīng)過(guò)對(duì)多幅興趣圖的處理后發(fā)現(xiàn),當(dāng)興趣區(qū)域面積過(guò)大時(shí)表明該顯著圖的顯著點(diǎn)分布過(guò)于平坦和均勻,顯著圖會(huì)給最終顯著圖和興趣圖的合并帶來(lái)干擾,影響到最終興趣區(qū)域范圍的精度。因此我們選擇用顯著圖面積的65%來(lái)作為篩選指數(shù)。
該模型的工作流程敘述如下:首先對(duì)輸入的原始圖像進(jìn)行處理生成顯著圖,然后根據(jù)生成的顯著圖產(chǎn)生各自的顯著區(qū)域。由于輸入的圖像特征不同,因此所得到顏色、亮度、和方向顯著區(qū)域?qū)︼@著圖的合并貢獻(xiàn)不同。比如顏色顯著圖的顯著性較強(qiáng),對(duì)合并的貢獻(xiàn)就較大;然而方向顯著圖的顯著性卻分布較為均勻,對(duì)合并的貢獻(xiàn)就較小而且還會(huì)帶來(lái)干擾。
為了驗(yàn)證本文方法的正確性和有效性,在Intel Pentium 1.6 GHz、內(nèi)存 1 GB 的微機(jī)上,利用 Matlab 7.6.0(R2008a)分別對(duì)簡(jiǎn)單背景單一目標(biāo)、簡(jiǎn)單背景復(fù)雜目標(biāo)和復(fù)雜背景的多幅自然圖像進(jìn)行了實(shí)驗(yàn)。如圖3所示,該方法生成的可變區(qū)域包含了視覺(jué)上最為顯著的目標(biāo),比較準(zhǔn)確的提取了符合人類視覺(jué)感知[8]的感興趣區(qū)域。
圖3 感興趣區(qū)域提取的結(jié)果展示圖Fig.3 Results of extraction region of interest map
本文在基于經(jīng)典的Itti模型[10]基礎(chǔ)上,采用了局部迭代的特征合并策略并在此基礎(chǔ)上綜合自動(dòng)閾值分割和種子點(diǎn)的區(qū)域生長(zhǎng)方法實(shí)現(xiàn)了感興趣區(qū)域的提取方法。該方法很好的實(shí)現(xiàn)了感興趣區(qū)域的提取,通過(guò)實(shí)驗(yàn)表明其檢測(cè)順序和結(jié)果比較符合人類視覺(jué)感知,具有良好的魯棒性和實(shí)時(shí)性。
[1]王國(guó)營(yíng),梁春迎.一種圖像顯著區(qū)域的提取方法[J].計(jì)算機(jī)應(yīng)用,2010,30(6):1619-1621.
WANG Guo-ying,LIANG Chun-ying.Extraction of salient regions in image[J].Joumal of Computer Applications,2010,30(6):1619-1621.
[2]張菁,沈蘭蓀,高靜靜.基于視覺(jué)注意機(jī)制的感興趣區(qū)檢測(cè)[J].光子學(xué)報(bào),2009,38(6):1561-1565.
ZHANG Jing,SHEN Lan-sun,GAO Jing-jing. Extraction of interests region based on visual attention mechanism[J].Acta Photonica Sinica,2009,38(6):1561-1565.
[3]韋靈麗,李翠彬.基于視覺(jué)選擇性注意機(jī)制的目標(biāo)檢測(cè)的研究[J].計(jì)算機(jī)與現(xiàn)代化,2010,180(8):92-97.
WEI Ling-li,LI Cui-bin.Object dectection based on visual selection attention mechanism[J].Computer and Modernization,2010,180(8):92-97
[4]Itti L,Kouch C.Computational modeling of visual attention[J].Nature Reviews Neuroscience,2001,2(3):194-230.
[5]IttiL,Kouch C.Feature combination strategies for saliency-based visual attention systems[J].Journal of Electronic Imaging,2001,10(1):161-169.
[6]Aehanta R,Hemami S,Estrada F,et al.Frequeney-tuned salient region deteetion[C]//InProeeedings of IEEE Conferenee on Computer Vision and Pattern Reeognition(CVPR2009),2009:1597-1604.
[7]HU Yi-qun,XIE Xing,MA Wei-ying.Salient region detection using weighted feature maps based on the human visualattention model [C]//Advances in Multimedia Information Processing.Heidelberg:Springer,2004:993-1000.
[8]Weliky M,Kander K,F(xiàn)itzpatrick D,et al.Patterns of excitation and inhibition evoked by horizontal connections in visual cortex share a common relationship to orientation columns[J].Neuron,1995,15(3):541-552.
[9]張卓,張學(xué)武,梁瑞宇,等.基于視覺(jué)感知的船閘監(jiān)控系統(tǒng)研究與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2009(22):135-138.
ZHANG Zhuo,ZHANG Xue-wu,LIANG Rui-yu,etal.Research and Implementation ofShip-lock Monitoring System Based on SVM and Visual Perception[J].Modern Electronics Technique,2009(22):135-138.
[10]吳月娥,邊后琴.尺度與特征引導(dǎo)視覺(jué)選擇性注意機(jī)制模型[J].現(xiàn)代電子技術(shù),2009(22):84-87.
WU Yue-e,BIAN Hou-qin.Model of visual selective attention mechanism deployed by scale and features[J].Modern Electronics Technique,2009(22):84-87.