朱 爽
(北京工業(yè)職業(yè)技術(shù)學(xué)院,北京 100042)
顏色作為目標(biāo)的一個(gè)重要特征,常常和目標(biāo)的身份有密切的關(guān)系[1-3],利用顏色信息進(jìn)行圖像檢索也成了一個(gè)必然選擇[4-5]。利用圖像的顏色檢索是指給定一個(gè)查詢圖像,需要從圖像庫(kù)找到與之顏色分布類似的圖像,即當(dāng)兩幅圖像的相似程度大于設(shè)定閾值,則認(rèn)為兩幅圖像為同一類圖像。
顏色直方圖圖像檢索方法是一種重要的基于顏色特征圖像檢索方法[6-8],具有特征提取和相似度計(jì)算簡(jiǎn)便,并且隨圖像尺度、旋轉(zhuǎn)變化不敏感的特點(diǎn)[9-10]。目前,已經(jīng)許多學(xué)者在這一方面進(jìn)行了研究。John Zachary[11]提出采用信息熵描述圖像的顏色特征,將圖像的顏色直方圖特征由多維降到一維,這有效地克服直方圖維數(shù)過(guò)高問(wèn)題。但該方法在進(jìn)行圖像檢索時(shí)沒(méi)有考慮熵的數(shù)學(xué)特性(主要是對(duì)稱性問(wèn)題),即某一矢量熵函數(shù)的取值只與該矢量的概率分布有關(guān),矢量中各分量的次序任意改變時(shí),熵值不變。孫君頂?shù)柔槍?duì)信息熵方法進(jìn)行了改進(jìn)[12],在一定程度上克服了熵的對(duì)稱性造成圖像誤檢索的不足。竇建軍等對(duì)2種顏色空間(RGB和HSV)和4種直方圖距離共8種圖像檢索方法進(jìn)行了比較[1,13]。金蓮芳等利用結(jié)構(gòu)量化直方圖的圖像檢索對(duì)傳統(tǒng)的直方圖方法進(jìn)行了改進(jìn)[14]。
目前的研究中,基于直方圖的圖像檢索的相似度以圖像之間的距離進(jìn)行表達(dá),導(dǎo)致圖像相似度的定義較為混亂。本文從顏色直方圖圖像檢索的本質(zhì)出發(fā),提出直方圖之間灰階概率的重合面積為圖像之間的相似度,更加明確了相似度的含義,并將該方法應(yīng)用到遙感影像檢索中,選擇出相似度較高的遙感影像,并與基于信息熵的圖像檢索方法進(jìn)行比較,本文方法表現(xiàn)出明顯的穩(wěn)健性。
John Zachary基于信息熵進(jìn)行圖像檢索的過(guò)程中,是以圖像的灰度值直方圖作為概率密度函數(shù)構(gòu)建信息熵。假設(shè)vi表示被量化的第i種顏色在整幅圖像中所占的百分比,即像元顏色灰度值取值為i占整個(gè)圖像像元個(gè)數(shù)的比例,則整個(gè)圖像定義的信息熵為
(1)
式(1)表明,基于圖像灰度值構(gòu)建的信息熵由于灰度出現(xiàn)概率相關(guān),實(shí)現(xiàn)圖像灰度直方圖特征由二維降維到一個(gè)標(biāo)量進(jìn)行表達(dá)。計(jì)算出圖像信息熵Ev后,進(jìn)一步利用dl-norm距離定量計(jì)算圖像的相似度
Dl-norm(P,Q)=|EP-EQ|
(2)
式中,P和Q表示兩個(gè)圖像的灰度直方圖;EP、EQ分別為兩個(gè)圖像對(duì)應(yīng)的信息熵??梢?jiàn),Dl-norm越低,兩幅圖像越相似,否則相差越大。
通過(guò)式(1)可以發(fā)現(xiàn),信息熵Ev具有對(duì)稱性、非負(fù)性、確定性、擴(kuò)展性、可加性及極值性等[15]。但是不可避免地帶來(lái)一個(gè)問(wèn)題,即基于式(1)計(jì)算的信息熵對(duì)只與灰度值出現(xiàn)的概率相關(guān),而對(duì)灰度值的大小沒(méi)有任何反映,這會(huì)導(dǎo)致即使兩幅圖像地物不同,但只要圖像上相對(duì)應(yīng)的灰度值概率相同,計(jì)算結(jié)果就認(rèn)為兩幅圖像比較相近的結(jié)論,從而出現(xiàn)嚴(yán)重的偏差。試舉一例,對(duì)于兩幅遙感影像,一幅影像上是30%的林地和70%裸地,另一幅影像上也是這兩種地物但比例相反,如果通過(guò)式(1)計(jì)算信息熵相同,式(2)計(jì)算出來(lái)的結(jié)果則比較接近,會(huì)得出這是兩幅比較相近圖像的結(jié)論。但這兩幅影像上的地物景觀明顯不同,顯然這種方法會(huì)帶來(lái)很大的偏差??梢?jiàn),在進(jìn)行圖像檢索的時(shí)候,不但要考慮圖像本身的信息熵,還要考慮各種地物的灰度值,這才能夠得到一種有效的圖像檢索方法。
從圖像直方圖上來(lái)看,兩幅圖像是否相似,取決于圖像之間灰階的重合程度??梢?jiàn),圖像檢索的本質(zhì)可以通過(guò)圖像直方圖之間灰階的重合面積刻畫出來(lái),即兩個(gè)直方圖重合的面積越大,兩個(gè)圖像的相似度越大。同時(shí),考慮到圖像的大小直接影響直方圖的面積,因此為了消除圖像大小的影響,直方圖的縱軸以圖像中灰階出現(xiàn)的頻率來(lái)代替圖像的灰階個(gè)數(shù)總和。如圖1(a)中的直方圖表示方式轉(zhuǎn)化為圖1(b)的形式,各個(gè)灰階出現(xiàn)的概率之和為1。
兩個(gè)圖像的概率直方圖的面積之和都為1,當(dāng)兩個(gè)圖像的概率直方圖完全不重合時(shí),兩個(gè)直方圖重合面積是0,則兩幅圖像完全不相似;當(dāng)兩個(gè)圖像的概率直方圖完全重合時(shí),兩個(gè)直方圖的重合面積為1,則兩幅圖像完全相同??梢?jiàn),概率直方圖的重合面積可以有效地刻畫兩幅圖像的灰度相似程度。如圖2所示,S為兩幅圖像的重合面積,S1和S2分別為兩個(gè)圖像未重合的面積,可見(jiàn)S的大小直接反映出了兩幅圖像之間的相似程度。
為了方便于計(jì)算,兩個(gè)灰度概率直方圖的相似度S定義如下
(3)
(4)
基于面積相似度方法進(jìn)行圖像檢索,整個(gè)技術(shù)流程主要包括3個(gè)步驟(如圖3所示):
圖3 技術(shù)流程
首先,針對(duì)一幅TM遙感影像進(jìn)行分區(qū),劃分檢索圖像集,用于定義目標(biāo)圖像集合,被檢索圖像集作為要選擇的集合,通過(guò)計(jì)算檢索、被檢索圖像之間的相似度,確定檢索圖像的類別歸屬。
其次,利用概率直方圖重合面積法進(jìn)行圖像檢索,主要是計(jì)算圖像直方圖、概率直方圖和計(jì)算概率直方圖的面積,最后計(jì)算檢索圖像與被檢索圖像之間的相似度,確定類型的歸屬。
最后,為驗(yàn)證本文所提面積相似度法的適用性,將本文方法與傳統(tǒng)的信息熵方法進(jìn)行對(duì)比分析,驗(yàn)證本文方法的適用性。
本文中選用TM多光譜影像作為測(cè)試數(shù)據(jù)檢驗(yàn)該方法的適用性,影像的獲取日期為2006年4月7日,位于河南,軌道號(hào)為124/37,無(wú)云質(zhì)量較好,分辨率為30 m,包含7個(gè)波段(藍(lán)光:0.45~0.52 μm;綠光:0.52~0.60 μm;紅光:0.62~0.69 μm;近紅外:0.76~0.90 μm;中紅外1.55~1.75 μm;熱紅外:10.40~12.50 μm,不參與運(yùn)算;遠(yuǎn)紅外:2.08~3.35 μm)。在遙感影像上切割出圖像尺寸大小100像元×100像元的5組遙感影像,每組6幅圖像,共30個(gè)分塊影像,分割基本原則為能夠覆蓋每組影像,地物豐富,同時(shí)每組內(nèi)地物的景觀特征相似。表1為每組圖像的景觀特征的基本介紹,圖像RGB波段組合分別為7、4、3波段。本文中針對(duì)每一組選擇3個(gè)作為檢索圖像,剩余2個(gè)為被檢索圖像。
利用IDL8.5編程實(shí)現(xiàn)面積法和信息熵兩種方法進(jìn)行圖像相似度計(jì)算,計(jì)算結(jié)果見(jiàn)表2、表3。
表1 試驗(yàn)圖像的說(shuō)明
表2 基于直方圖面積法的圖像相似度
表3 基于信息熵法的圖像相似度
表2表明,對(duì)角線上表達(dá)的同類地物間的相似度高于0.7以上,明顯高于其它地物之間的相似度。舉例來(lái)看,山體-山體之間的相似度為0.79,最低的是山體-水體相似度為0.08,其他兩種情況山體-城鎮(zhèn)、山體-冬小麥的相似度也在0.3~0.4之間,可見(jiàn)本文方法能夠非常準(zhǔn)確地搜索到相近的圖像。對(duì)于信息熵法(見(jiàn)表3),由于該方法通過(guò)距離進(jìn)行表達(dá),兩個(gè)圖像越相似,則取值越小,因此對(duì)角線上的值都偏小,說(shuō)明該方法具有一定的適用性。但是,仔細(xì)分析,在某些類型檢索上,其優(yōu)勢(shì)不夠明顯。比如,對(duì)于水體-小麥搜索的時(shí)候,水體/小麥-水體/小麥的相似度為0.54,比城鎮(zhèn)-水體/小麥相似度0.80沒(méi)有低太多,說(shuō)明二者的區(qū)分度表達(dá)不夠高,而直方圖面積法優(yōu)勢(shì)明顯。
從表2、表3看出兩種方法都可有效地刻畫出地物之間的相似度,從數(shù)值比較來(lái)看,基于直方圖面積法計(jì)算出的相似度比基于信息熵的方法更能有效地區(qū)分同類、不同類的圖像。例如,表2中同類地物之間的相似度都高于0.7,且其他圖像之間的相似度與這個(gè)值差別比較大,而基于信息熵方法計(jì)算同類地物的相似度距離都低于非同類地物之間的距離,但有時(shí)候計(jì)算出的同類地物相似度距離要大于非同類地物相似度的距離。如水體-水體相似度距離為0.83,城鎮(zhèn)-山體的相似度距離為0.79,同一類地物水體-水體的相似度要低于不同地物之間的相似度,可見(jiàn)利用信息熵計(jì)算的相似度無(wú)法形成一個(gè)統(tǒng)一標(biāo)準(zhǔn)計(jì)算圖像之間的相似程度,然而利用直方圖面積法能夠有效區(qū)分開(kāi)相似/非相似的圖像。
從表2、表3中可以明確地看出,通過(guò)基于直方圖面積法計(jì)算出的相似度比基于信息熵計(jì)算出的相似度更能準(zhǔn)確反映兩類地物之間的相似度。例如,比較水體與水體-小麥二者的相似度,直方圖面積法的相似度取值為0.37,信息熵方法的相似度距離為4.12。直觀上看,水體-小麥圖像中有一部分地物為水體,水體與水體-小麥兩組圖像的相似度較高,但通過(guò)信息熵方法計(jì)算出的相似度距離為4.12,其相似度相對(duì)于其他兩組不相關(guān)圖像(城鎮(zhèn)與小麥相似度距離為1.46,山體與小麥的相似度距離為1.03)的相似度明顯偏低。圖4中是從地物水體-小麥、水體、城鎮(zhèn)中選擇出的一組圖像,繪制7、4、3波段的灰度直方圖。
從圖4可以看出,水體-小麥圖像有2個(gè)灰度波峰,其中有一個(gè)灰度波峰的圖像與水體圖像的單波峰相重合,水體-小麥與城鎮(zhèn)的差別比較大,幾乎沒(méi)有灰度重合,可見(jiàn)這兩類圖像之間的相似性比較小。從基于信息熵方法計(jì)算的結(jié)果來(lái)看,城鎮(zhèn)與水體-小麥之間相似度要(相似度距離為0.80)高于水體與水體-小麥之間的相似度(相似度距離為4.12),從圖4可以看出這個(gè)結(jié)果是不合理的;通過(guò)基于直方圖面積法計(jì)算出的城鎮(zhèn)與小麥的相似度(0.18)比水體與水體-小麥的相似度(0.37)要低,這個(gè)結(jié)果更為合理。究其原因,從圖4可以看出,城鎮(zhèn)在各個(gè)波段表現(xiàn)為平緩的單波峰,對(duì)于水體-小麥的不同波段有2個(gè)波峰,波峰的寬度和高度與城鎮(zhèn)比較相近,由于熵的對(duì)稱性,基于信息熵計(jì)算出的二者相似度比較高,這造成了圖像的誤檢索。
圖4 三種地物的灰度直方圖
本文提出了一種基于灰度直方圖面積法的圖像檢索方法,并用多波段的遙感影像作為數(shù)據(jù)源進(jìn)行試驗(yàn),驗(yàn)證檢索合理性。試驗(yàn)結(jié)果證明,文中提出的方法比以往的基于信息熵的圖像檢索算法具有更強(qiáng)的穩(wěn)健性,更能準(zhǔn)確地反映圖像之間的相似程度,避免了信息熵的圖像檢索方法由于對(duì)稱性的不足導(dǎo)致的圖像相似度出現(xiàn)偏差。
本文在研究過(guò)程中,重點(diǎn)在于計(jì)算圖像之間的灰度相似性,沒(méi)有考慮圖像顏色的空間分布信息,如何將空間信息與直方圖面積法相結(jié)合進(jìn)行圖像檢索是本文進(jìn)一步的研究方向,同時(shí)在實(shí)際的圖像檢索系統(tǒng)中,僅僅利用顏色特征是不夠的,需要再結(jié)合圖像的紋理、形狀等特征,進(jìn)一步提高檢索性能。