裴新超
(中北大學(xué)計(jì)算機(jī)與控制工程學(xué)院,山西 太原 030051)
伴隨著計(jì)算機(jī)技術(shù)特別是數(shù)字圖像處理技術(shù)的快速發(fā)展,利用圖像的底層物理內(nèi)容特征進(jìn)行圖像檢索的技術(shù)隨之出現(xiàn),即基于內(nèi)容的圖像檢索(Content-based Image Retrieval,簡(jiǎn)稱CBIR)[1]。
采用單一圖像特征(如顏色或者紋理或者形狀)描述圖像,進(jìn)行圖像檢索具有一定的局限性,難以實(shí)現(xiàn)檢索的準(zhǔn)確性[3]。傳統(tǒng)的CBIR 算法更多地考慮待檢索圖像與數(shù)據(jù)庫(kù)中圖像之間的相似性,忽視圖像庫(kù)內(nèi)部圖像之間的相似性,沒有對(duì)圖像庫(kù)中的圖像進(jìn)行聚類,無法縮小圖像檢索的范圍,達(dá)不到有效地檢索。
針對(duì)以上缺點(diǎn),為達(dá)到提高檢索準(zhǔn)確性和有效性目的,本文提出了一種新的綜合顏色和紋理特征聚類的圖像檢索算法(Image retrieval based on color and texture feature clustering,ICTC)。在提取顏色特征方面,利用顏色自相關(guān)圖考慮了顏色空間信息;在提取紋理特征方面,利用Gabor 小波來描述。二者相結(jié)合,利用改進(jìn)的K-means 進(jìn)行聚類,讓檢索在某一類對(duì)象中進(jìn)行,從而保證檢索具有較高的準(zhǔn)確性和較低的時(shí)間復(fù)雜性。
RGB 顏色模型作為與設(shè)備相關(guān)的顏色空間被廣泛使用在圖像中。但是RGB 顏色模型與人的視覺感官不相符合。HSV 顏色模型更接近于人的主觀認(rèn)識(shí),能夠更準(zhǔn)確地體現(xiàn)人眼睛對(duì)于顏色的辨知能力,能夠更好地適合基于顏色的圖像相似度的比較[4]。
基于上述原因,本文ICTC 算法采用顏色模型HSV 作為研究的基本顏色空間,然后對(duì)其各個(gè)分量進(jìn)行量化,但是采取非等量標(biāo)準(zhǔn),色調(diào)H、飽和度S、亮度V 量化為8 級(jí),3 級(jí),4 級(jí),量化規(guī)則如下:
根據(jù)量化后的結(jié)果對(duì)各個(gè)分量取不同值合成一維的特征矢量,即:
式(4)中:Qs、Qv分別是飽和度S,亮度V 的量化級(jí)數(shù),取Qs=3,Qv=4,所以式子為:
考慮顏色直方圖無法表達(dá)圖像空間關(guān)系的弊端[10],ICTC 算法采用顏色自相關(guān)圖提取圖像的顏色特征,該方法利用顏色對(duì)空間的關(guān)系,將顏色和空間信息二者有效地聯(lián)系起來[9]。
假設(shè)T 表示一幅圖像,將圖像T 中的顏色量化為m 種顏色,對(duì)于任意某個(gè)像素點(diǎn)p=(x,y)∈T,令Tc={p|C(p)=c},表示顏色為Ci的所有像素。
對(duì)于圖像T 的兩種顏色Ci,Cj∈[m],距離d∈[n],顏色相關(guān)圖的公式表示:
式(6)中,<i,j >的第k 個(gè)分量表示顏色為Ci的像素與顏色為Cj的像素之間的距離小于k 的概率。
式(7)中,d 表示像素點(diǎn)P1和像素點(diǎn)P2之間的距離。
顏色相關(guān)圖考慮任何顏色之間的相關(guān)性,所以顏色相關(guān)圖非常復(fù)雜,空間復(fù)雜度太高O(m2d)。顏色自相關(guān)圖(Color AutoCorrelogram)是一種簡(jiǎn)化的表達(dá),公式表示:
由于顏色自相關(guān)圖簡(jiǎn)單的考慮相同顏色像素之間的空間關(guān)系,空間復(fù)雜度會(huì)降低很多O(md)。所以ICTC 算法采用顏色自相關(guān)圖提取顏色特征。
紋理特征是描述圖像局部結(jié)構(gòu)的特征,是以圖像中的局部對(duì)不同物體進(jìn)行區(qū)分。因此在檢索系統(tǒng)中被廣泛應(yīng)用。
小波變換被廣泛地用于描述圖像紋理特征方面[8]。其實(shí)質(zhì)是采取分解信號(hào),構(gòu)造出一些實(shí)值函數(shù)。通過研究感知系統(tǒng)生理學(xué),發(fā)現(xiàn)在捕捉空間頻率,空間位置,方向選擇性等局部結(jié)構(gòu)信息方面,Gabor 基函數(shù)特點(diǎn)與人類大腦皮層單細(xì)胞的二維反射區(qū)特點(diǎn)相似。因此,在描述圖像紋理特征選擇用Gabor 濾波器。
Gabor 濾波函數(shù)表示為:
式(9)中,w 為高斯函數(shù)復(fù)頻率,σx,σy是相應(yīng)的x 和y軸的帶寬。
通過對(duì)Gabor 函數(shù)進(jìn)行尺度的縮放和方向旋轉(zhuǎn)得到濾波器,表示為:
式(10)中,x'=a-m(xcosθ +ysinθ);y'=a-m(-xsinθ+ycosθ);θ=nπ/N。
只有盡可能地提取特征信息,才能達(dá)到更好地描述紋理信息以達(dá)到區(qū)分的目的。這就要求Gabor 濾波器要涵蓋全部的范圍,而且在頻域上不能出現(xiàn)重疊。Gabor 的位置決定于兩個(gè)參數(shù):尺度和方向。紋理提取的效果要達(dá)到最好,就意味著要選取更多的濾波方向,但是濾波器數(shù)目的增加,會(huì)伴隨著出現(xiàn)實(shí)時(shí)性變差的問題。因此,為了既可以很好地表述圖像的紋理特征,同時(shí)計(jì)算量也不會(huì)太大,ICTC 算法在采用Gabor 方法描述圖像紋理特征時(shí),選取6 個(gè)方向和4 個(gè)尺度,構(gòu)建了由24 個(gè)濾波器組成的濾波器組。用這24 個(gè)濾波器對(duì)圖像進(jìn)行濾波,得到24 幅過濾后的圖像,計(jì)算這24 幅圖像均值和標(biāo)準(zhǔn)差,將二者組合表述圖像的48 維紋理特征。
通過顏色自相關(guān)圖提取顏色特征和Gabor 提取紋理特征[6],為了提高檢索的效率,減少圖像庫(kù)的訪問,要對(duì)圖像進(jìn)行聚類,將96 維的顏色特征和48 維的紋理特征融合生成144 維的綜合特征(q1,q2,q3,…,q144),表示一幅圖像的綜合特征,若圖庫(kù)中包含有Q 幅圖像對(duì)象,則整個(gè)圖庫(kù)圖像可以表示為:
K-means 算法認(rèn)為類是由距離靠近對(duì)象組成,其屬于硬聚類算法,相似性采用距離作為衡量指標(biāo),即距離更接近的兩個(gè)對(duì)象,二者相似度就更大[2]。
具體過程:
1)初始類心通過任意選擇k 個(gè)對(duì)象來獲得。
2)計(jì)算每個(gè)對(duì)象到各個(gè)類心的距離,根據(jù)最小距離把它歸并到最近的類。
3)計(jì)算各自新產(chǎn)生的類的平均值,得到各自類新的類心。
4)迭代執(zhí)行2)到3)直到所有的聚類都不再改變。
原始的K-means 算法對(duì)初始類心的確定是任意的,即聚類中的所有初始類心是隨機(jī)產(chǎn)生的,具有不確定性[7]。本文ICTC 算法采用改進(jìn)的k-means 算法確定初始聚類類心,根據(jù)“距離更接近的兩個(gè)對(duì)象,二者相似性更大”的原則,圖像特征通過顏色相關(guān)圖和Gabor 組合獲得。具體實(shí)現(xiàn)過程如下:
Step1 計(jì)算圖像庫(kù)中的所有圖像,得到其綜合特征。假設(shè)圖像庫(kù)中有q 幅圖像,每幅圖像都各不相同,所以有q 個(gè)特征向量,即特征集為x=(x1,x2,x3,…,xq);每個(gè)圖像的綜合特征向量有144 維。
Step2 根據(jù)特征集x,計(jì)算任意兩個(gè)特征xj和xk之間的歐式距離:
查找最小L,特征向量xj和xk結(jié)合生成組合S1。
Step3 計(jì)算剩余的特征與S1的距離,找到距離最小,并加入組合S1。
Step4 重復(fù)Step3 直到組合S1中的數(shù)目達(dá)到聚類平均數(shù)為止,組合S1結(jié)束。
Step5 在除去組合S1中包含的特征之外的剩余特征,重新找到距離最小的兩個(gè)特征向量,重復(fù)Step2 到Step4,可以得到S2,以此類推可以得到S3,S4,S5,…,Sk。
Step6 計(jì)算S1,S2,S3,…,Sk的算術(shù)平均數(shù),得到的k 個(gè)平均數(shù)作為聚類的初始類心,設(shè)初始類心向量集為W,即W=(W1,W2,W3,…,Wk)。
通過上面過程獲取k 個(gè)初始類心,然后根據(jù)K-means 聚類的具體過程1)~4)對(duì)特征向量集x 聚類,生成聚類C,類心W,即C=(C1,C2,C3,…,Ck),W=(W1,W2,W3,…,Wk)。
為了評(píng)價(jià)聚類性能,算法采用誤差平方和準(zhǔn)則函數(shù)[5],公式表示:
式中,J 表示迭代過程中所有對(duì)象的平方誤差總和,隨著迭代次數(shù)增大,誤差平方和J 減小,最終J 收斂于某一個(gè)固定值,迭代結(jié)束,即聚類結(jié)束。
基于內(nèi)容的圖像檢索(CBIR)是根據(jù)提交的圖像查找在圖像數(shù)據(jù)庫(kù)中與提交的圖像相似的圖像。本文采用圖像顏色和紋理特征的綜合特征描述圖像,對(duì)圖像數(shù)據(jù)庫(kù)的圖像特征向量集進(jìn)行聚類,得到聚類C,類心W,即C=(C1,C2,C3,…,Ck),W=(W1,W2,W3,…,Wk)。一次圖像檢索過程如下:
Step1 獲取待檢索綜合特征q,即圖像的顏色和紋理特征相融合。
Step2 計(jì)算待檢索圖像綜合特征q 和各個(gè)類心Wi之間距離,式子表示:
Step3 根據(jù)相似性原理,即距離越小,圖像越類似。找出待檢索圖像相似度最大類Cmin。
Step4 分別計(jì)算類Cmin中各個(gè)圖像綜合特征與q 的距離。
Step5 依據(jù)距離從大到小排序,返回類Cmin中全部圖像。
本文采用Corel 圖像庫(kù)中的1 000 幅圖像,總共10 類,包括汽車,恐龍,花,大象,食物,馬等,其中每個(gè)分類都包含100 幅圖像。為了檢驗(yàn)ICTC 算法的有效性,采用查準(zhǔn)率P和查全率R 作為圖像檢索性能的衡量標(biāo)準(zhǔn),公式如下:
其中N 代表檢索返回來的總圖像數(shù)目,M 代表圖像數(shù)據(jù)庫(kù)中與用戶提交圖像有關(guān)聯(lián)圖像數(shù)目,n 代表檢索返回來的與用戶提交圖像有關(guān)聯(lián)的圖像數(shù)目。
實(shí)驗(yàn)方案:選取一種常見的基于顏色的圖像檢索算法(CR 算法),一種常見的基于顏色和紋理的圖像檢索算法(CTT 算法),本文算法(ICTC 算法)從圖像數(shù)據(jù)庫(kù)中的每類圖像中,隨機(jī)抽取10 幅圖像作為待檢索圖像,對(duì)于每次檢索,計(jì)算每一級(jí)查全率下的平均查找率,實(shí)驗(yàn)結(jié)果如表1。
表1 CR 算法,CTT 算法,ICTC 算法查準(zhǔn)率比較
由表1 實(shí)驗(yàn)結(jié)果得出,當(dāng)查全率一定的情況下,ICTC 算法的查準(zhǔn)率高于CR 算法,CTT 算法。
圖1 公交車的檢索結(jié)果
圖2 馬的檢索結(jié)果
圖1 和圖2 是利用本文ICTC 算法分別進(jìn)行的一次圖像檢索的結(jié)果。圖1 和圖2 都返回了20 張圖像,圖1 檢索到17 張相關(guān)圖像,圖2 檢索到18 張相關(guān)圖像。其他兩種算法的檢索效果就不一一列舉了,圖3 是本文ICTC 算法與CR 算法,CTT 算法關(guān)于查全率和查準(zhǔn)率的對(duì)比。
由圖3 可知,ICTC 算法相比較其他兩種算法,具有更好的檢索性能,能夠達(dá)到較理想的檢索效果。所以ICTC 算法能夠適用于大部分的圖像檢索。
圖3 3 種算法查全率和查準(zhǔn)率曲線
針對(duì)采用單一特征描述圖像進(jìn)行檢索準(zhǔn)確度不高,以及沒有考慮圖像庫(kù)中圖像之間相似度,未對(duì)圖像進(jìn)行聚類,導(dǎo)致檢索速度不快的問題,提出了顏色自相關(guān)圖和Gabor 算法相結(jié)合聚類檢索方法。顏色自相關(guān)圖考慮了顏色的空間關(guān)系;提取紋理特征采用Gabor 變換;二者特征融合能夠更好地描圖像,采用改進(jìn)K-means 算法對(duì)圖像進(jìn)行聚類,使檢索過程在更理想范圍內(nèi)進(jìn)行,加快檢索速度,獲得更好地檢索效果。實(shí)驗(yàn)表明,本文ICTC 算法能獲得更好的檢索速度和檢索精度。
[1]Dahane GM,Vishwakarmas.Content Based Image Retrieval System[J].International Journal of Engineering and Innovative Technology,2012,1(5) :92-96.
[2]呂明磊,劉冬梅,曾智勇.一種改進(jìn)的K-means 聚類算法的圖像檢索方法[J].計(jì)算機(jī)科學(xué),2013,40(8) :285-288.
[3]張?chǎng)?,溫顯斌,孟慶霞.基于顏色特征的圖像檢索方法研究[J].計(jì)算機(jī)科學(xué),2012,39(11) :243-245.
[4]李麗麗,孫勁光.基于主色提取和主色集擴(kuò)充的圖像檢索算法[J].計(jì)算機(jī)應(yīng)用與軟件,2012,29(1) :152-154.
[5]謝輝,陸月明,孫松林.基于半監(jiān)督學(xué)習(xí)的一種圖像檢索方法[J].計(jì)算機(jī)應(yīng)用研究,2013,30(7) :2210-2212.
[6]常哲,侯榆青,李明利,等.綜合顏色和紋理特征的圖像檢索系統(tǒng)[J].小型微型計(jì)算機(jī)系統(tǒng),2011,32(1) :161-164.
[7]陳湘濤,王愛云,謝偉平,等.基于內(nèi)容圖像檢索的聚類算法研究[J].計(jì)算機(jī)應(yīng)用研究,2008,25(12) :3546-3549.
[8]高燕,胡學(xué)龍,李玱,等.基于小波多尺度分析的綜合特征圖像檢索[J].微電子學(xué)與計(jì)算機(jī),2010,27(4) :21-24,28.
[9]李永芳.基于顏色相關(guān)圖和紋理矩的圖像檢索[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(10) :38-42.
[10]申海洋,李月娥,張?zhí)?基于邊緣方向直方圖相關(guān)性匹配的圖像檢索[J].計(jì)算機(jī)應(yīng)用,2013,33(7) :1980-1983.