張水利
(延安大學(xué)物理與電子信息學(xué)院,陜西延安,716000)
圖像檢索就是根據(jù)對圖像內(nèi)容的描述,在目標(biāo)圖像集合中找到具有指定特征或包含指定內(nèi)容的圖像。根據(jù)使用的圖像特征不同,圖像檢索可以分為色彩方法、紋理方法和形狀方法。計算圖像的色彩特征更方便、快速,因此色彩方法是圖像檢索中常用的方法。圖像的顏色直方圖是圖像中各種色彩出現(xiàn)的頻率,它反映圖像的顏色特征,而且不因圖像的幾何變換而改變,是檢索中經(jīng)常使用的特征。顏色索引技術(shù)( color indexing) 作為一種圖像相似檢索方法最早在文獻(xiàn)[3] 中提出, 它的核心思想是計算圖像的顏色分布, 即顏色直方圖(color histogram),并利用直方圖相交算子(histogram intersection) 計算圖像之間的相似度。對多媒體數(shù)據(jù)的檢索,早期的方法是用文本將多媒體數(shù)據(jù)進(jìn)行標(biāo)識,這顯然不是基于多媒體信息本身內(nèi)容的檢索,對多媒體數(shù)據(jù)中包含的信息是一種極大的浪費;基于內(nèi)容的檢索是多媒體數(shù)據(jù)庫的關(guān)鍵技術(shù),如何實現(xiàn)這種技術(shù),是值得商榷的,而最好的方法是使用無需領(lǐng)域知識的檢索方法,因此,基于顏色的方法就是實現(xiàn)的關(guān)鍵;而顏色直方圖檢索是利用顏色進(jìn)行圖像檢索的最常用的方法。本文針對檢索圖像具有某種特定的顏色特征,在RGB 顏色空間,提出了一種基于主顏色特征的彩色圖像檢索算法,在檢索過程中,引入了各顏色分量的權(quán)重來表示各顏色分量在圖像檢索過程中的貢獻(xiàn),利用MATLAB 語言環(huán)境進(jìn)行檢索實驗,并取得了預(yù)期的檢索性能。
對于查詢圖像和數(shù)據(jù)庫分別計算查詢圖像的R、G、B 分量的統(tǒng)計直方圖。
圖像的統(tǒng)計直方圖是一個一維的離散函數(shù):
其中k 代表圖像的特征取值,L 代表特征可取值的個數(shù),nk是圖像中具有特征值為k 的象素個數(shù),n 數(shù)圖像象素的總數(shù)。
在MATLAB 語言環(huán)境中,用imhist 語句分別計算R、G、B這三種顏色分量的統(tǒng)計直方圖,即每一顏色分量中特定顏色的象素點的數(shù)目。
這里首先選用直方圖相交算法的公式:
分別計算查詢圖像各顏色分量與數(shù)據(jù)庫圖像各顏色分量的統(tǒng)計直方圖相交距離,相交距離越大越相似。距離為1 說明兩幅圖像完全相同,距離為0 說明兩幅圖像差別最大。用P1、P2、P3分別表示查詢圖像與數(shù)據(jù)庫圖像之間的紅色、綠色、藍(lán)色分量的直方圖相交距離;Wr、Wg、Wb 分別表示紅色、綠色和藍(lán)色分量的權(quán)重(加權(quán)系數(shù)),且有Wr+Wg+Wb=1,并由此得到本實驗過程中的距離度量公式:根據(jù)所選查詢圖像對各顏色分量的要求不同,Wr、Wg、Wb 的取值不同。
檢索算法的優(yōu)劣通常采用兩個性能指標(biāo):查準(zhǔn)率(P) 和查全率(R) 來評價檢索算法。查準(zhǔn)率指返回的結(jié)果集中有效圖像的比率,用于測量系統(tǒng)排除無關(guān)圖像的能力。查全率指返回的結(jié)果中有效圖像占數(shù)據(jù)庫中所有相似圖像的數(shù)量的比率,用于測量系統(tǒng)檢索相關(guān)圖像的能力。將查全率R 作為x軸,查準(zhǔn)率P 作為y 軸,繪制一條查準(zhǔn)率vs 查全率曲線,稱為PVR 曲線。設(shè)PVR 曲線為f(x),則f(x)與xy 軸圍成的面積為。稱S(f) 為PVR 指數(shù),記為E(如圖2)。由于P, ,可得 。E 越大,圖像檢索性能越好;E 越小,圖像檢索性能越差。E=1,那么圖像檢索性能達(dá)到最佳,其PVR曲線為f(x,y)=1
本實驗選取由紅色為主色調(diào)的小汽車所組成的圖像庫, 在檢索時將Wr 取值偏大,Wg 和Wb 取值相同, 圖2 到圖七分別列出了Wr、Wg、Wb 取不同值時得到的檢索結(jié)果(列出了排在前十位的相似圖像,相似度從左到右,從上到下降序排列):
為評價Wr、Wg、Wb 取值不同時,檢索性能的好壞,在同一坐標(biāo)系里繪出了Wr、Wg、Wb 取值不同時的PVR 曲線如圖8所示:
由PVR 曲線可以看出,Wr =0.9 的檢索效果最好,隨著Wr 的增大,檢索效果越來越好,并不是說Wr 可以無限制的增大,到某一程度也可能會使檢索性能下降。因此可以得出,對于一幅真彩的RGB 查詢圖像來說,如果其紅色分量較多,那么就可以在檢索過程中可以適當(dāng)增加紅色分量的權(quán)重(加權(quán)系數(shù)),反之,就可增加藍(lán)色或綠色分量的權(quán)重。而如果查詢圖像是黃色的,因為黃色是基于紅色和綠色之間的顏色,那么在檢索過程中,就將紅色和綠色分量的權(quán)重取值相同并且大于藍(lán)色分量;同樣,當(dāng)是紫色圖像時,紫色是位于紅色和藍(lán)色中間,就可將紅色和藍(lán)色分量的權(quán)重取值相同并且大于綠色分量的權(quán)重。即在確定各顏色分量的權(quán)重時,要根據(jù)具體的情況而定。
在基于內(nèi)容的圖像檢索中,顏色是最容易說明的特征,主色調(diào)可以反映圖像的總體概貌。通過圖像檢索算法能夠?qū)⒂脩糁付ǖ亩喾N主色調(diào)通過適當(dāng)?shù)臄U(kuò)展用于匹配,從而獲得更好的檢索結(jié)果。一幅圖像能夠勝過千言萬語,圖像的深刻內(nèi)涵用區(qū)區(qū)幾個字符是難以表達(dá)出來的,利用圖像檢索技術(shù)能夠使用戶較容易記住任何物體的顏色特征,這種方法更值得我們采用。
[1] 石軍, 常義林. 圖像索引技術(shù)綜述[J]. 西安電子科技大學(xué)學(xué)報(自然科學(xué)版),2003,30(4):486 ~491.
[2] 王宇生, 陳純.一種新的基于色彩的圖像檢索方法[J].計算機(jī)研究與發(fā)展,2002,39(1):105- 109.
[3] Swain M.J,Ballard D.H.Color indexing[J] .International Journal of Computer Vision, 1991,7(1):11- 32.
[4] 張水利.彩色圖像檢索方法研究[D].太原:太原理工大學(xué),2006:25.
[5] 韋素云, 吉根林. 基于加權(quán)顏色直方圖和顏色對的圖像檢索系統(tǒng)[J]. 南京師范大學(xué)學(xué)報( 工程技術(shù)版), 2005,5(1):53- 56;164- 168.