沈未名 魏小莉
(武漢大學測繪遙感信息工程國家重點實驗室 武漢 430079)
由于手工標注圖像存在很大的困難,因此需要自動地索引圖像.對此,人們提出了許多解決方法,如基于顏色、紋理或者形狀等方法[1-2].圖像的紋理對于圖像檢索來說是一個非常有用的特征,許多文獻中提到使用不同的濾波技術用于紋理分割,以及多通道濾波器技術[3-4],Manjunath等人研究并實現(xiàn)了基于Gabor濾波器組的紋理特征的檢索[5].Unser[6]采用標準小波進行完全小波分解,由濾波器的輸出估計各通道的方差來獲取紋理特征.但是標準小波不適用于窄帶高頻信號分析,與標準小波分解得到的對數(shù)頻率分解不同,M帶小波分解可以得到對數(shù)和線性頻率分解,而且M帶小波分解能夠產(chǎn)生極大數(shù)量的子帶,從而可以進行高質(zhì)量的分割.本文運用M帶小波變換多分辨率的優(yōu)點來提取色彩和紋理特征,再通過FCM聚類算法對小波變換后的能量值進行聚類,得到圖像的多分辨率特征向量,最后由關系函數(shù)來確定查詢圖像與目標圖像的特征向量之間的相似性,由此獲得檢索結果.
正交M帶小波是由傳統(tǒng)的小波直接變換得到的,標準的雙小波不適用于窄帶高頻信號的分析,而由兩帶標準正交小波直接變換得到的M帶標準正交小波可以解決這個問題.M帶小波可以放大信號的窄帶高頻成分,更好的集中能量.M帶小波變換對時域空間分別進行線性變換和以對數(shù)形式的非線性變換,實現(xiàn)對高頻成分的處理.本文使用M通道的濾波器將時域空間分解為M×M子帶.
一維4帶的正交濾波器具有線性相位,對多分辨率分析有良好的重建性.一維M帶的濾波器變換函數(shù)由Hi組成,其中i=1,…,4.在M 帶小波分解之前,先把圖像轉(zhuǎn)換成YCbCr色彩空間,確保圖像的紋理特征與色彩特征相互獨立.在亮度成分上,將小波分解后的小波系數(shù)作為紋理信息;在色度成分上,將小波分解后的小波系數(shù)作為顏色信息,小波變換適用于Y,Cb,Cr空間.在相同尺寸的子帶內(nèi)完全分解后,所獲得的特征作為圖像中每個像素的特征,可以用于進一步的聚類,并將分解后獲得的16個子帶系數(shù)作為原始特征.
自然圖像存在紋理的空域變化,基于紋理的圖像檢索并不能確保紋理都有同質(zhì)性,所以紋理的局部特征顯得尤為重要.因此本文估計每個16子帶圖像的局部能量,對于每個像素,高斯能量在一個鄰域內(nèi)計算得到:
式中:1≤ m1≤ M ;1≤ m2≤ M ;G(x,y)=;N 為 鄰域的大 小 ,本文中 N
取11;Wfm1,m2為小波變換系數(shù),是由原圖像與濾波器Hm1進行行卷積,再將原圖像與濾波器Hm2進行列卷積得到.
FCM 把n個向量xi(i=1,2,…,n)分為c個模糊組,并求每組的聚類中心,使得非相似性指標的價值函數(shù)達到最小.FCM用模糊劃分,使每個給定數(shù)據(jù)點用取值為0到1之間的隸屬度來確定其屬于各個組的程度.隸屬矩陣U允許有取值在0到1之間的元素,但是經(jīng)過歸一化處理,數(shù)據(jù)集的隸屬度的和總是等于1,即
FCM的價值函數(shù)(或目標函數(shù))如下式表示
式中:uij∈(0,1);ci為模糊組I的聚類中心;dij=ci-xj為第i個聚類中心與第j個數(shù)據(jù)點間的歐幾里德距離,m∈[1,∞)為加權指數(shù).
構造新的目標函數(shù),從而求得使式(3)達到最小值的必要條件,如下所示
式中:λj,j=1,…,n,是式(2)的n個約束式的拉格朗日乘子.對上式中所有輸入?yún)⒘壳髮?,求出使式?)達到最小的必要條件為
由上述2個必要條件可知,模糊C均值聚類算法是一個簡單的迭代過程.在批處理方式運行時,F(xiàn)CM采用下列步驟確定聚類中心ci和隸屬矩陣U.
步驟1 取0到1之間的隨機數(shù)初始化隸屬矩陣U,使其滿足式(2)中的約束條件.
步驟2 用式(5)計算c個聚類中心ci,i=1,…,c.
步驟3 根據(jù)式(3)計算價值函數(shù).如果函數(shù)值小于某個確定的閾值,或者相對上次價值函數(shù)值的改變量小于某個閾值,則算法停止.
步驟4 利用式(6)計算新的U矩陣.返回步驟2.
運用上述聚類算法,分別對16個子帶的能量值進行聚類,可以獲得圖像的小波域特征向量,用F表示,F(xiàn)={F1,…,F(xiàn)c}.式中:c=16.Fi為第i個子帶的特征向量,由第i個子帶中能量值的n個聚類中心以及每一種聚類包含的像素個數(shù)組成,即Fi={c1,…,cn,n1,…,nn},cj為第j個聚類中心,nj為第j個聚類中所包含的像素個數(shù).通過FCM聚類得到圖像的特征向量,有利于圖像的模糊相似度計算.
圖像的劃分可以由一系列區(qū)域組成的集合{R1,…,Rc}來表示;同樣,在特征空間中,圖像用特征集合F={F1,…,F(xiàn)c}來表示.從而區(qū)域Ri可以用Fi的集合和2幅圖像之間的相似度來描述,相似度可由Fi計算得到[7].每一個區(qū)域定義為
式(7)表示所有Fi的中心,且中心值也可以不是Fi中的元素.
為了將特征集Fi模糊化處理,需要定義一個關系函數(shù):μ~F:R6→[0,1].對任意f∈Fi,μ~F(f)稱為f和模糊集Fi的關系度.本文選用柯西函數(shù)作為關系函數(shù),因為柯西函數(shù)具有很高的計算效率,因此,特征集Fi的關系函數(shù)定義為
為了計算2幅圖像的相似度,首先需要獲得模糊相似度度量,對于2個模糊集和的模糊相似度度量S(,可以定義為:S(,)=~B(x).
定義為:
令Fq和Ft分別代表查詢圖像q和目標圖像t的模糊特征.查詢圖像和目標圖像的相似性通過,F(xiàn)t)得到.2幅圖像的相似度為 m(q,t),如下式所示.
式中:w為矢量,表示查詢和目標圖像的歸一化區(qū)域百分比.
本文的算法是用Matlab語言編寫,在Dell Precision T5400,內(nèi)存為4G的PC電腦上運行實現(xiàn).實驗系統(tǒng)中共有2259張圖像,其中包括了人、大海、汽車、花朵、馬、建筑這6個不同的類別.首先將本文算法與基于空域的顏色或紋理特征的檢索算法進行比較,然后將本文算法與基于特征融合的方法進行對比實驗.對于圖像檢索結果的性能評價指標,本文使用查全率(recall)與查準率(precision),其定義分別如下,且查全率和查準率越高說明檢索的效果越好:查全率=正確檢索數(shù)/(正確檢索數(shù)+漏檢數(shù));查準率=正確檢索數(shù)/(正確檢索數(shù)+誤檢數(shù)).
圖1為運用本文算法,選取查詢圖像為花朵得到的部分檢索結果,這里列出前14幅圖像.圖2給出了本文算法與基于顏色或紋理特征的檢索算法的查全率和查準率的實驗數(shù)據(jù)對比.圖3給出了本文算法與文獻[8-10]中基于多特征融合方法的查全率和查準率實驗對比.與本文算法不同的是,文獻[8]中提出的是一種將顏色信息和快速傅里葉變換的紋理特征相結合的檢索方法,文獻[9]提出了結合顏色、紋理、形狀及相關反饋機制的圖像檢索方法,文獻[10]中采用了多特征融合以及支持向量機的分類方法.
圖1 利用本文算法得到的檢索結果
圖1 中,圖像“1.jpg”為查詢圖像,其余14幅圖像為查詢結果中的前14個輸出結果.根據(jù)圖1的檢索結果可以看出,本文算法能夠較為有效的檢索出用戶需求的圖像,前14幅圖像的檢索準確性較高,其中圖像“226.jpg”為誤檢圖像,主要是由于其對象特征與查詢對象花朵的紋理等方面有一定的相似性,而其余圖像均能正確有效檢出.
圖2 3種不同的圖像檢索算法的查全率和查準率對比圖
圖3 4種不同檢索算法的查全率和查準率對比圖
根據(jù)圖2分析可得,本文提出的算法性能要明顯優(yōu)于基于紋理或色彩特征的檢索方法,平均查全率和查準率達到80.93%和82.76%,而基于紋理特征的查全率和查準率分別為57.44%和61.12%,基于顏色特征的檢索結果分別為49.23%和51.39%,因此本文算法相對傳統(tǒng)的特征提取算法有較大的改進.通過圖3分析,文中提出的方法與文獻[8-10]中多特征融合算法相比有明顯的改進,充分證明了該方法的有效性和可行性.下一步的工作是將本文算法用在大型數(shù)據(jù)庫中進行測試分析和改進,而且對檢索的實時性進行嚴格分析.
本文主要提出了將小波變換應用于彩色紋理圖像檢索中,使用M帶小波變換進行色彩和紋理特征的提取,再對提取出的色彩紋理特征用模糊C均值聚類算法進行聚類,最后使用關系函數(shù)來進行圖像的模糊相似度計算,把查詢圖像和目標圖像的模糊特征進行相似性計算,從而得到檢索結果.實驗表明,本文的方法可以有效地提取圖像的色彩紋理特征,并通過模糊相似度計算能較好的檢索出用戶需求的圖像.
[1]Manjunath B S,Ohm J R,Vasudevan V V,et al.Color and texture descriptors[J].IEEE Transactions on Circuits and System for Video Technology,2001,11(6):703-715.
[2]Bober B.MPEG-7 visual shape descriptors[J].IEEE Transactions on Circuits and Systems for Video Technology,2001,11(6):716-719.
[3]Farrokhnia F,Jain A K,A multichannel filtering approach to texture segmentation[C]∥Proceedings of Computer Vision and Pattern Recognition,1991:364-370.
[4]Chang T,Kuo C C J.Texture analysis and classification with tree structured wavelet transform[J].IEEE Trans.on Image Process,1993,2(4):42-44.
[5]Manjunath B S,Salembier P,Sikora T.Introduction to MPEG-7:multimedia content description interface[M].John Wiley and Sons,Inc,USA 2002.
[6]Unser M.Texture classification and segmentation using wavelet frames[J],IEEE Trans.on Image Process,1995,4(11):1 549-1 560.
[7]Chen Yixin,Wang J Z.A region-based fuzzy feature matching approach to content-based image retrieval[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,IEEE,2002,24(9):1 252-1 267.
[8]劉 真,周淑秋.利用圖像顏色特征與紋理特征進行圖像檢索[J].計算機工程與設計,2007,28(20):4 952-4 954.
[9]田 卉,覃團發(fā),梁 琳.綜合顏色、紋理、形狀和相關反饋的圖像檢索[J].計算機應用研究,2007,24(11):292-295.
[10]黨長青,宋鳳娟,劉樹明.基于多特征融合和相關反饋的圖像檢索[J].計算機工程與應用,2008,44(3):186-188.