鄧 瑩, 余元輝
(1.華僑大學廈門工學院,福建廈門361021; 2.集美大學計算機工程學院,福建廈門361021)
(2)采用1.2節(jié)的方法將其分割成一個圓和M-1個圓環(huán)、1個分割剩余部分,對這M+1個部分用0將其填充為正方形區(qū)域;
(3)將每一個正方形分成8×8個子塊,對每一子塊進行離散余弦變換,提取其直流分量,對這64個直流分量求其均值μ和標準方差σ,做為圖像的能量矩特征;
(4)對環(huán)形能量矩采用下面的方法進行相似性度量:
基于內(nèi)容的圖像檢索技術CBIR(Content-Based Image Retrieval)是由機器首先自動提取包含圖像內(nèi)容的可視特征,如顏色、紋理、形狀、對象的位置和相互關系等,然后將數(shù)據(jù)庫中圖像和查詢樣本圖像在特征空間進行相似匹配,以檢索出與樣本相似的圖像過程.
在圖像檢索中,常采用基于多種特征綜合的CBIR以提高檢索精確度.但圖像特征向量維數(shù)過多又會影響檢索效率,有時甚至還會導致檢索精度下降.因此,能以較少維度的特征向量表達更多的圖像信息,從而獲得更好的檢索結(jié)果成為人們追求的目標.顏色矩(color moments)是一種簡單而有效的顏色特征[1-2].但顏色矩同樣側(cè)重于圖像的全局特征,沒有包含顏色間的空間關系.鑒于此,本文采用提取圓環(huán)顏色矩的局部特征來描述檢索圖像,同時為避免在實際應用中低次矩較弱的分辨能力,提取基于離散余弦變換的能量矩統(tǒng)計特征作為圖像間匹配的重要依據(jù).實驗表明,與傳統(tǒng)的顏色直方圖及紋理特征檢索結(jié)果的方法相比較,所提出的方法能以較少維度的特征向量表達更多的圖像信息,從而獲得更好的檢索結(jié)果.
顏色特征是圖像檢索中應用最為廣泛的視覺特征,而選擇一個符合人眼視覺特性的顏色模型是利用顏色特征進行圖像檢索的關鍵.L*a*b*顏色模型是國際照明委員會(CIE)于1976年定義的一種基于對立色理論和參考白點而建立的顏色模型.L*a*b*模型具有色域?qū)掗?、與光線及設備無關的優(yōu)點.另外,L*a*b*模型還彌補了RGB模型色彩分布不均的不足,且處理速度與RGB模型同樣快.因此,本文選擇了基于CIEL*a*b*顏色模型來提取顏色矩特征.
設RGB模型的顏色分量分別為R、G、B,則由RGB顏色模型到L*a*b*顏色模型的轉(zhuǎn)換由下式給出:
其中:X、Y和Z是XYZ彩色空間分量,X0、Y0和Z0為參考白點的分量[3].
由Stricker和Orengo提出的顏色矩(color moments)[1-2]是一種非常簡單而有效的顏色特征.這種方法的數(shù)學基礎在于圖像中任何的顏色分布均可以用它的矩來表示.由于顏色分布信息主要集中在低階矩中,因此,僅采用顏色的一階矩(mean)、二階矩(variance)和三階矩(skewness)就足以表達圖像的顏色分布.與顏色直方圖相比,該方法的另一個好處在于無需對特征進行向量化.顏色的3個低次矩的數(shù)學表達形式為:
其中:N代表圖像的像素總數(shù),pij是圖像中第j個像素的第i個顏色分量.因此,圖像的顏色矩一共只需要9個分量(3個顏色分量L*、a*和b*,每個分量3個低階矩).實驗表明顏色矩的維數(shù)盡管遠遠低于顏色直方圖,但檢索效果卻很接近.
顏色矩反映的是圖像的整體特征,沒有表達圖像色彩的空間位置.而事實上,圖像中對象所在的位置和對象之間的空間關系同樣是圖像檢索中非常重要的特征.基于此,本文采用圓環(huán)形幾何分割法[4]來記錄顏色的空間信息,并且保證特征量具有旋轉(zhuǎn)、縮放不變性等特點.圓環(huán)形幾何分割算法的主要思想是將一幅圖像按照中心點坐標將其等間隔分割成一個圓和M-1個圓環(huán)、1個分割剩余部分.設W、H為圖像的寬和高,則圓和圓環(huán)半徑
然后分別計算這幾個分割區(qū)域的L*a*b*顏色矩特征向量[5].這樣,圖像就可以用顏色分布矩特征向量表征.在圖像相似性度量時,計算兩幅圖像的顏色分布矩特征向量序列中對應向量的加權歐氏距離Dcm,即可據(jù)此進行圖像檢索.
離散余弦變換(discrete cosine transform,DCT)[6]的變換核為余弦函數(shù),具有將能量集中于少數(shù)低頻頻率系數(shù)、各系數(shù)互不相關、高頻能量衰減很快且能量較小等性質(zhì).二維DCT的解析式定義可由下式表示:
其中:u=0,1,…,M-1, v=0,1,…,N-1
設F(u,v)代表圖像經(jīng)過DCT變換后每一分塊的變換系數(shù),F(xiàn)(0,0)是分塊內(nèi)所有樣值的集中,相當于直流分量,它表示了輸入矩陣全部幅度的平均值;隨著u、v值增加,相應系數(shù)分別代表逐步增加的水平空間頻率分量和垂直空間頻率分量的大小.
DCT變換算法簡單,實現(xiàn)方便,本文將其引入用于圖像檢索.通過提取各分塊DCT變換系數(shù)的直流分量,采用能量的均值和方差作為圖像間匹配的紋理統(tǒng)計特征.
對于一幅彩色RGB圖像,計算其基于離散余弦變換能量矩特征的過程為:
(1)首先把一幅彩色RGB的圖像轉(zhuǎn)換為灰度圖像,然后歸一化圖像尺寸(文中均為256× 256);
(2)采用1.2節(jié)的方法將其分割成一個圓和M-1個圓環(huán)、1個分割剩余部分,對這M+1個部分用0將其填充為正方形區(qū)域;
(3)將每一個正方形分成8×8個子塊,對每一子塊進行離散余弦變換,提取其直流分量,對這64個直流分量求其均值μ和標準方差σ,做為圖像的能量矩特征;
(4)對環(huán)形能量矩采用下面的方法進行相似性度量:
分別使用環(huán)形能量矩和傳統(tǒng)灰度共生矩陣[5]方法,檢索部分圖像,檢索結(jié)果的相似性度量值列于表1中.對比檢索結(jié)果可知:環(huán)形能量矩方法對旋轉(zhuǎn)、縮放和噪聲均具有較好的魯棒性.
表1 部分圖像紋理特征的相似性度量Table 1 The similarity based on textural features
單個特征和語義之間存在相當?shù)恼Z義斷層,某些語義上完全不相關的圖像的特征矢量在特征空間中的位置卻可能相當接近.為了避免低次矩較弱的分辨能力,可綜合利用顏色矩和基于DCT的能量矩特征進行檢索.首先按上述方法分別提取顏色矩和DCT能量矩特征向量,然后將這兩個向量結(jié)合起來進行檢索.
由于顏色矩和基于DCT的能量矩特征的物理意義不同,不具有直接可比性.因此,需要對不同的數(shù)值進行歸一化.現(xiàn)采用高斯歸一化方法,其主要步驟為:設子特征i的距離度量為Di,相應的距離均值和標準差分別為mi和σi.在高斯假設的前提下,歸一化距離度量為:
其中Qj、Ij是任意兩幅圖像的特征向量(對應于子特征i).上式保證Di'的取值有99%落入[0,1]區(qū)間中.實際應用中,將[0,1]區(qū)間外的值設為0或1,以保證所有數(shù)值均落在[0,1]區(qū)間.
圖像庫中有1 015幅JPEG格式的的彩色圖像,其中1 000幅是來自于Corel公司的專業(yè)收藏照片數(shù)據(jù)庫,分為10個種類,每個種類包含100幅圖像,圖像大小為384×256或者256× 384.另外15幅圖像為從庫中任選了3幅圖像,分別對其進行縮放1/2倍、2倍、旋轉(zhuǎn)90°和180°及加噪處理后所得.
圖1為綜合環(huán)形顏色矩和能量矩檢索的部分實驗結(jié)果.結(jié)果中的第1幅圖像為查詢圖像兼檢索結(jié)果,后面的圖像是按照相似度由大到小排列的檢索結(jié)果.結(jié)果表明:該方法檢索出的結(jié)果更符合人們的視覺要求,且原圖經(jīng)縮放、旋轉(zhuǎn)、加噪處理后的圖像在檢索結(jié)果中位置居前,說明該方法對旋轉(zhuǎn)、縮放和噪聲有較好的魯棒性.
圖1 綜合環(huán)形顏色矩和能量矩檢索結(jié)果Fig.1 Retrieval result of the proposed approach
圖2為文獻[5]、文獻[7]和本文提出的方法在圖像庫中平均的查全率和查準率比較.從圖2中可知:提出的方法對彩色圖像的檢索有較高的查全率和查準率.且本方法檢索速度快,返回100幅圖像的平均時間為5.62 s,而文獻[5]和文獻[7]的平均檢索時間分別為7.64 s和11.82 s.
圖2 平均查全率和查準率比較Fig.2 The comparison of average precision-recall
在研究單一顏色矩特征和離散余弦變換進行圖像檢索的基礎上,提出了一種綜合利用這兩個特征進行檢索的方法,其中顏色特征用分塊顏色矩來表示,DCT能量矩的提取則以DCT變換系數(shù)的直流分量為基礎,求其均值和標準方差.實驗表明:L*a*b*空間更符合人的視覺要求,且提出的方法能以較少的特征向量表達較多的圖像信息,從而快速地獲得較好的檢索效果.下一步工作將是利用聚類技術進一步提高檢索精度和效率.
[1] 莊越挺,潘去鶴,吳飛.網(wǎng)上多媒體信息分析與檢索[M].北京:清華大學出版社,2002:188-226.
[2] Stricker M,Orengo M.Similarity of color images.SPIE Storage and Retrieval for Image and Video DatabaseⅢ[C].San Jose CA USA:SPIE,1995:381-392.
[3] 范立南,韓曉微,張廣淵.圖像處理與模式識別[M].北京:科學出版社,2007:80-120.
[4] Rohini Aibing Rao,Srihari Rohini K,Zhang Zhong Fei.Spatial Color Histograms for Content based Image Retrieval[C].Chicago:IEEE,1999:183-186.
[5] 徐琨,李燕.基于分塊顏色矩和紋理特征的圖像檢索方法[J].西安石油大學學報:自然科學版,2005,20(2):77-79.
[6] 張賜勛.離散余弦變換的設計與實現(xiàn)[D].杭州:浙江大學,2006:6-8.
[7] 傾明.基于顏色和紋理特征圖像檢索技術的研究[J].科學技術與工程,2009,19(15):1301-1304.