魯天舒
人類視覺系統(tǒng)能夠?qū)D像進(jìn)行高效的解讀,可以快速地搜索到感興趣區(qū)域并對(duì)其進(jìn)行解譯。但對(duì)于機(jī)器來說,其不具備人類視覺系統(tǒng)的圖像自動(dòng)注意感興趣區(qū)域的能力。隨著人工智能以及機(jī)器人技術(shù)的發(fā)展,急需建立基于機(jī)器的圖像自動(dòng)解譯系統(tǒng),而在圖像自動(dòng)解譯系統(tǒng)中,視覺注意力機(jī)制的建立最為關(guān)鍵。
1.機(jī)器視覺
人類的視覺系統(tǒng)可以做到從外界獲得大量信息,對(duì)獲得的信息進(jìn)行快速篩選并濾除無用信息。這種自發(fā)的信息過濾就是所謂的注意力機(jī)制。人類視覺系統(tǒng)可以在短時(shí)間內(nèi)注意到一副圖像中的獨(dú)特部分,如圖1所示,在這些圖像中獨(dú)特的部分就是人們所關(guān)心的關(guān)鍵性內(nèi)容。不具備人類視覺注意機(jī)制的機(jī)器,難以發(fā)覺圖像中的關(guān)鍵性信息,從而制約了人工智能與機(jī)器人技術(shù)的發(fā)展。
受到人類視覺系統(tǒng)注意力機(jī)制的啟發(fā),很多研究人員在建立機(jī)器對(duì)圖像自動(dòng)處理與認(rèn)知的過程中引入了模擬人類視覺對(duì)圖像信息的感知過程,建立了機(jī)器對(duì)于圖像數(shù)據(jù)的自動(dòng)注意機(jī)制算法模型。這種注意機(jī)制算法模型能夠分配有限的計(jì)算機(jī)信息加工資源,將計(jì)算資源優(yōu)先分配給顯著區(qū)域,賦予機(jī)器對(duì)圖像信息自動(dòng)注意的能力,將提高機(jī)器處理解譯圖像信息的效率。但到目前為止無論是心理學(xué)、生理學(xué)還是信息科學(xué)領(lǐng)域,都未能完全做到對(duì)選擇性注意機(jī)制進(jìn)行完整的描述,因此,許多學(xué)者在該領(lǐng)域開展了大量的研究工作。其中“視覺注意”最早出現(xiàn)在Treisman和Gelade提出的“特征合并理論”。這一理論說明了視覺感知特性的重要性,但其未能體現(xiàn)視覺注意這一過程是由何種信息引導(dǎo)的。在此基礎(chǔ)上Koch和Itti等人提出了一種模型,通過模擬人眼對(duì)圖像信息接收的“注意”過程來建立相應(yīng)的機(jī)器對(duì)圖像關(guān)鍵信息的注意機(jī)制,以及對(duì)關(guān)鍵信息的顯著性分析過程,從而建立了機(jī)器視覺中的注意機(jī)制體系。至此,打開了機(jī)器視覺注意機(jī)制研究領(lǐng)域的大門,更多的研究者進(jìn)行了更深入的研究。針對(duì)這些研究工作,其機(jī)器視覺注意模型大致可以分為兩大類:①“自底向上”的視覺注意模型;②“自頂向下”的視覺注意模型。
其中“自頂向下”的視覺注意模型是通過特定任務(wù)約束的圖像注意機(jī)制。而“自底向上”的視覺注意模型是通過圖像信息中的差異性特征引導(dǎo)機(jī)器自動(dòng)的關(guān)注關(guān)鍵性內(nèi)容,這里的差異性特征指圖像信息中與無關(guān)背景信息差異較大的內(nèi)容,例如圖1中能引起注意的內(nèi)容是那些具有不同的形狀、顏色、大小和方向等的特征信息。
在此以探索機(jī)器視覺中注意力模型為目的,研究“自底向上”的視覺注意模型,結(jié)合遙感圖像覆蓋面積廣、包含目標(biāo)種類多樣、關(guān)鍵信息復(fù)雜以及對(duì)于遙感圖像關(guān)鍵性信息搜索困難的問題,進(jìn)行了遙感圖像目標(biāo)顯著性分析的研究,提出了一種“自底向上”的機(jī)器視覺算法模型,實(shí)現(xiàn)了對(duì)大范圍遙感圖像中關(guān)鍵性目標(biāo)內(nèi)容的自主搜尋與注意過程?!白缘紫蛏稀币曈X注意模型算法流程如圖2所示,可以分為3個(gè)步驟:①差異特征提?。ǚ较?、局部對(duì)比度、全局對(duì)比度);②融合特征圖生成(顯著圖生成);③顯著性分析。
在特征提取階段為了建立有效的差異性特征自主注意機(jī)制,提出的算法選取方向、局部對(duì)比度和全局對(duì)比度這三方面特征作為機(jī)器視覺注意模型主要分析的差異性特征。為了公平統(tǒng)一地分析方向、局部對(duì)比度與全局對(duì)比度特征對(duì)于視覺注意模型的貢獻(xiàn)度,在進(jìn)行融合特征圖前,分別對(duì)這三方面特征進(jìn)行數(shù)據(jù)歸一化處理。在融合特征圖生成階段,考慮到三方面特征的差異性,根據(jù)其不同屬性以線性方程為基礎(chǔ),構(gòu)建了融合特征圖準(zhǔn)則。最后,根據(jù)生成的融合特征圖,以“勝者為王”的策略完成“注意焦點(diǎn)”的自動(dòng)選取,實(shí)現(xiàn)了對(duì)遙感圖像“自底向上”的目標(biāo)顯著性分析。
2.方法
2.1遙感圖像預(yù)處理
從表1~表3中可以看出,本文方法具有較好目標(biāo)顯著性特性與目標(biāo)檢測(cè)指標(biāo),在參照方法中具有較好的Significance值。因此,機(jī)器視覺遙感圖像目標(biāo)顯著性分析方法可以有效的幫助機(jī)器自主實(shí)現(xiàn)遙感圖像有效目標(biāo)內(nèi)的注意和搜索。
4.結(jié)束語
通過與3種經(jīng)典視覺注意模型與CFAR檢測(cè)算法的對(duì)比仿真實(shí)驗(yàn)結(jié)果,表明本文模型對(duì)遙感圖像目標(biāo)的顯著區(qū)域提取效果更好,能夠準(zhǔn)確檢測(cè)出圖像中的顯著目標(biāo)區(qū)域,漏檢、虛警數(shù)量少,且目標(biāo)區(qū)域具有較為清晰地目標(biāo)輪廓和形狀,實(shí)現(xiàn)了較高精度的自主顯著區(qū)域檢測(cè)。