張 斌
宿州職業(yè)技術(shù)學(xué)院,安徽 宿州 234101
隨著多媒體信息量的不斷增多,人們?cè)诠ぷ魃钪袑?duì)圖像的檢索與查詢(xún)?cè)絹?lái)頻發(fā)[1]。基于顏色的圖像檢索(TBIR)技術(shù)成為當(dāng)前研究的熱點(diǎn),該種方法的優(yōu)點(diǎn)是技術(shù)簡(jiǎn)單、實(shí)現(xiàn)容易,但是存在不足之處[2]。傳統(tǒng)的顏色直方圖檢索方法[3],在不同的顏色背景下檢測(cè)同一目標(biāo)物,盡管顏色直方圖的顏色檢測(cè)結(jié)果區(qū)別很大,但是進(jìn)行相識(shí)度測(cè)量時(shí)卻默認(rèn)為相識(shí)度不高[4]。因此,開(kāi)發(fā)一種基于顏色的圖像檢索系統(tǒng)成為了迫在眉睫的研究工作重點(diǎn)。鑒于此,引入改進(jìn)的加權(quán)局域顏色直方圖和全局直方圖相結(jié)合方法,可應(yīng)用于顏色網(wǎng)絡(luò)圖像的檢索中。此外,還檢測(cè)了該算法應(yīng)用的實(shí)際效果,這為推動(dòng)高效圖像檢索技術(shù)的研發(fā)與應(yīng)用提供了理論參考。
1.1.1 系統(tǒng)檢索流程
整個(gè)圖像檢索系統(tǒng)檢索流程如圖1 所示:首先是打開(kāi)示例圖像,通過(guò)特征提取和相似度的比較,檢索出圖像庫(kù)中與示例圖像相似度較高的目標(biāo)圖像;其次重新將圖像庫(kù)中的jpg 圖像按照相似度的大小排列順序,最后在界面上輸出相似度最高的前8 幅圖像。本文系統(tǒng)開(kāi)發(fā)工具選用的是matlab(7.0版本)。該系統(tǒng)選擇GUI 來(lái)設(shè)計(jì)布置界面,布置完成后的界面如圖2 所示。
圖1 基于彩色特征的圖像檢索流程圖
圖2 GUI 界面布置圖
1.1.2 圖像特征提取方法
該系統(tǒng)采用一種全局顏色直方圖和分塊關(guān)鍵直方圖相結(jié)合的算法進(jìn)行圖像顏色特征提取。首先在HSV-顏色空間下對(duì)圖像進(jìn)行非均勻的等級(jí)量化處理,共得到256 等級(jí)。同時(shí),對(duì)顏色空間進(jìn)行歸一化處理,以顏色取值為橫坐標(biāo),每個(gè)顏色值對(duì)應(yīng)的像素?cái)?shù)目為縱坐標(biāo),構(gòu)成整幅圖的顏色直方圖如下:
圖3 圖像效果
1.1.3 圖像相識(shí)度測(cè)量方法
相識(shí)度測(cè)量模塊是檢索系統(tǒng)中的核心,通過(guò)特征模塊檢索完成數(shù)據(jù)庫(kù)中匹配圖像提取,進(jìn)而實(shí)現(xiàn)目標(biāo)圖像的檢索。在具體檢索時(shí),首先要分析圖像庫(kù)中圖像的顏色直方圖的信息,并與關(guān)鍵圖的顏色直方圖進(jìn)行比較,進(jìn)而得到相似度,本次設(shè)計(jì)運(yùn)用的是歐氏距離測(cè)量相似度[4]。選取的顏色空間為“HSV-顏色空間”。HSV-顏色空間中顏色的分布較為均勻,顏色間相似度同其圓柱形坐標(biāo)方位有關(guān)[5]。此外,HSV-顏色空間的三大通道是相互之間獨(dú)立的,不同的通道的變化給人不同的視覺(jué)感受。因此,HSV-顏色空間的分劃常常是更加的精確。
查準(zhǔn)、查全率一般情況下是用來(lái)評(píng)價(jià)檢索性能的相似性檢索準(zhǔn)則,對(duì)各個(gè)檢索結(jié)果進(jìn)行計(jì)算便可以得出查準(zhǔn)、查全率的平均值[6],以此給出評(píng)價(jià)。
1.2.1 查準(zhǔn)率
1.2.2 查全率
查準(zhǔn)、查全率分別從準(zhǔn)確性和全面性?xún)蓚€(gè)方面評(píng)價(jià)了系統(tǒng)的有效性。理論上說(shuō)是兩者的比例越大越好,但是這兩者又是矛盾體,所以本次系統(tǒng)就要求盡量使查準(zhǔn)率和查全率達(dá)成平衡。
1.3.1 系統(tǒng)優(yōu)越性測(cè)試
為了突出顏色圖像檢索技術(shù)的優(yōu)越性,選擇了更為客觀的評(píng)價(jià)方式(查準(zhǔn)率大小),即通過(guò)檢驗(yàn)檢索圖像是否屬于同一類(lèi)別進(jìn)行判定兩幅圖像是否為相似的圖像。本文從3 個(gè)圖像類(lèi)別中共選擇了5幅圖像作為查詢(xún)圖像,合計(jì)15 幅圖像,分別采用全局直方圖、分塊直方圖以及本文算法對(duì)15 幅圖進(jìn)行查詢(xún),對(duì)比在查全率分布為0.2、0.4、0.6、0.8、1.0時(shí)的查準(zhǔn)率情況。
1.3.2 系統(tǒng)普適性測(cè)試
為了驗(yàn)證本文算法的普適性,對(duì)圖像庫(kù)中的6類(lèi)圖像包括人物、建筑、植物、景色、商標(biāo)和山水進(jìn)行查準(zhǔn)率和查全率的統(tǒng)計(jì),每類(lèi)圖像選擇10 幅圖像進(jìn)行測(cè)試,合計(jì)60 幅圖像,選擇查全率為80%時(shí),測(cè)試不同圖像類(lèi)別的顏色特征查準(zhǔn)率。
首先,從圖像檢索數(shù)據(jù)庫(kù)中隨機(jī)選擇一張“圖像”作為研究對(duì)象,其界面展示如圖4 所示。
圖4 確定查詢(xún)圖像的界面
其次,通過(guò)計(jì)算示例圖像與圖像庫(kù)素材的相似度完成檢索操作。在計(jì)算相似度之前,需要確定好距離的度量方法。該系統(tǒng)采用歐氏距離算法測(cè)量顏色直方圖距離,從而確定圖像間相似度,得到的檢索結(jié)果如圖5 所示。從檢索結(jié)果中可以看出,這種綜合檢索的方法能夠準(zhǔn)確從圖像庫(kù)中找到,并檢索出目標(biāo)圖像。
圖5 基于顏色的圖像檢索結(jié)果
如表1 所示,在相同查全率基礎(chǔ)下,該算法的查準(zhǔn)率均高于全局直方圖與分塊直方圖方法的檢索結(jié)果。其中在查全率為40%時(shí),該算法的相似圖像查準(zhǔn)率達(dá)到100%。一般而言,查全率高的查準(zhǔn)率往往較低,而查準(zhǔn)率高的查全率往往偏低。所以通過(guò)對(duì)比查準(zhǔn)率與查全率的取值范圍,可以判定該方法是否能滿(mǎn)足用戶(hù)的實(shí)際需求。如表1 所示,本文算法在查全率為80%時(shí),查準(zhǔn)率依然能夠達(dá)到90.46%,說(shuō)明該系統(tǒng)還可以得到令查詢(xún)用戶(hù)比較滿(mǎn)意的檢索結(jié)果。
表1 三種算法的比較
如表2 所示,當(dāng)查全率為80%時(shí),本文算法在人物與商標(biāo)圖像的檢索查準(zhǔn)率較高,而在植物與景色圖像檢索的查準(zhǔn)率較低。
表2 本文算法的性能統(tǒng)計(jì)
綜上所述,結(jié)合了顏色特征和紋理特征的圖像,本文算法的查準(zhǔn)率和查全率都高,且檢索的效果更好。這種綜合檢索的方法能對(duì)單一特征檢索方法的缺陷做出補(bǔ)償,可以更全面的利用圖像顏色特征檢索與樣圖相似圖像。單一特征提取算法的復(fù)雜度都比較低,結(jié)合HSV 空間提取顏色特征的方法可以滿(mǎn)足較為復(fù)雜的圖樣,因此這種綜合檢索方法更為有效。
網(wǎng)絡(luò)圖像檢索長(zhǎng)期以來(lái)都是計(jì)算機(jī)應(yīng)用技術(shù)發(fā)展的重要方向,基于顏色特征的圖像檢索的方法研究能夠?yàn)閳D像數(shù)據(jù)庫(kù)的分析與檢索帶來(lái)更準(zhǔn)確的查詢(xún)技術(shù)。研究設(shè)計(jì)的圖像全局顏色與關(guān)鍵顏色模塊直方圖檢索方法具有較好的檢索效果。主要結(jié)論如下:
該顏色特征檢索系統(tǒng)比單一化的全局直方圖和分塊直方圖的顏色特征提取方法具有更高的查全率和查準(zhǔn)率。
從研究實(shí)例中看出,無(wú)論是人物、建筑、植物、景色、商標(biāo)和山水等圖像的檢索,均具有較好查準(zhǔn)率和查全率,符合實(shí)際使用的需求。
為了進(jìn)一步提高圖像顏色特征的檢索效果,還需要從顏色的心理、物理和視覺(jué)等方面進(jìn)行更加深入的研究。