潘文文,孫曉飛*,王 霞
(棗莊學(xué)院 信息科學(xué)與工程學(xué)院,山東 棗莊 277160)
越來越便捷的圖像采集手段制造出海量的圖像資料,如何有效地從海量圖像中檢索圖像是有效利用圖像資料的前提。目前,在智能設(shè)備上進行圖像檢索主要采用基于文本的檢索,這種方式僅能通過名稱、關(guān)鍵字、描述文字等對圖片簡單命名和主觀描述,不能表達圖像的完整信息[1]。利用手繪草圖從智能設(shè)備中檢索圖像比文本方式更具想象力和創(chuàng)造力,能更準確地反映人類對圖像的準確需求。文獻[2]利用傅里葉形狀描述方法來描述手繪草圖,解決了基于筆劃描述方式的計算效率低和輸入順序敏感的問題,可以獲得較好的檢索效果。文獻[3]提出一種基于結(jié)構(gòu)圖的草圖檢索方法,在保持圖像大致形狀的基礎(chǔ)上對圖像的輪廓數(shù)據(jù)進行有效的降維處理,解決了輪廓的起點選擇、旋轉(zhuǎn)、平移以及縮放等不變性。
基于手繪草圖檢索的本質(zhì)是內(nèi)容方式的圖像檢索,目前主要有2種方法:1)用加權(quán)求和的方式來綜合利用多種特征[4-6];2)構(gòu)造混合特征[7-10]。文獻[11]通過改進的分水嶺算法對彩色圖像進行分割,運用區(qū)域化空間注意力模型計算各個子區(qū)域的顯著性,該方法傾向于將顯著物體劃分為一個整體,會造成邊緣細節(jié)的丟失。文獻[12]認為圖像中的顏色分布越廣或者越分散,顯著性目標包含這種顏色的可能性就越小,特定顏色的全局空間分布能夠用來描述目標的空間顯著性,先將圖像中的顏色通過K-均值聚類算法進行初步分類,再用多元正態(tài)分布來建模圖中像素顏色的概率分布。文獻[13]提出一種基于遺傳反饋的圖像檢索算法,以遺傳算法和相關(guān)反饋為基礎(chǔ),利用多特征進行檢索,具有較低反饋次數(shù)和較高的查詢精度。文獻[14]提出基于互信息啟發(fā)的相似度組合圖像檢索算法,利用互信息度量相對熵的原理,計算連續(xù)變量相似度與離散變量相似性之間的相關(guān)性,對多種相似度進行選擇,該算法相對復(fù)雜。
現(xiàn)有的基于內(nèi)容的搜索方法克服了基于文本搜索的一些缺點,但仍存在計算量大、占用存儲量大、效率低下等問題。本文提出一種首先獲取顯著區(qū)域,然后對顯著區(qū)域提取相似特征的方法,圖像的主要語義內(nèi)容集中于顯著區(qū)域,因此可以用顯著區(qū)域代表整幅圖像進行圖像搜索。
首先將原始圖像分割成區(qū)域,然后采用文獻[15]的方法來計算各個分區(qū)的顏色直方圖,將原圖像中各個分區(qū)的像素顏色的RGB分量量化為12個值,在此基礎(chǔ)上統(tǒng)計各個分區(qū)的顏色直方圖。將顏色直方圖中各顏色按照出現(xiàn)頻率排序,將低頻顏色替換為相似的高頻顏色,并去掉比重為0的顏色,從而得到稀疏直方圖。這樣可以保持與原圖像視覺效果基本相同,卻大大減少了顏色的數(shù)量。
然后將各個分區(qū)的顏色直方圖轉(zhuǎn)換至Lab空間,計算各個分區(qū)之間的顏色距離。2個分區(qū)rm,rn之間的顏色距離為:
其中:f(cm,i)為第m個分區(qū)rm的第i種顏色占整張圖片的比例,而不是占本分區(qū)的比例,這有利于取得更好的顯著圖;D(cm,i,cn,i)為 rm的第 i種顏色與 rn分區(qū)的第j種顏色的歐式距離;N1,N2分別為rm,rn分區(qū)的顏色數(shù)量。
由式(2)可知,相互距離越遠的分區(qū)對彼此顯著性的影響越小,即分區(qū)顯著度S(rk)與其他分區(qū)間的距離 Ds(rk,ri)成反比,故用1/δDs(rk,ri)作為距離權(quán)值,δ為常數(shù),取180時效果最佳。其中:Ds(rk,ri)=|xk-xi|+|yk-yi|為2個分區(qū)質(zhì)心之間的城市街區(qū)距離,即不同分區(qū)質(zhì)心橫坐標差的絕對值與縱坐標差的絕對值之和。使用城市街區(qū)距離而不是歐式距離可以取得更高效率。同等距離下分區(qū)ri的像素w(ri)個數(shù)越大,其對分區(qū)rk的影響越大,故S(rk)與w(ri)成正比。
采用本方法可以獲取與文獻[15]視覺效果相近的顯著圖,但由于沒有采用顏色空間平滑,計算更為簡單,如圖1所示。
圖1 采用本方法獲取的顯著圖
對 S(rk),k=1,2,…,N 進行排序,排除顯著度最低的最外圍分區(qū),余下分區(qū)為物品所在的分區(qū)r1,r2,…,rm,將這些分區(qū)作為一個整體 R=r1∪r2∪…∪rm,以R最外圍的4個頂點所在的橫縱坐標為邊界,等比例劃分10×10個矩形分塊 ui,i=1,2,…,100,即R=r1∪r2∪…∪r100。使用前述算法可以很好地提取顯著區(qū)域,較完整地保留顯著目標信息。劃分10×10個矩形分塊,可以按比例保留顯著目標的信息,當(dāng)2張圖片顯著目標相似但大小不同時仍可提取相近的檢索特征。
然后遍歷這些分區(qū)的像素點,看其屬于哪個矩形分塊ui,就將此像素點的灰度值累加至ui塊的灰度值gi,最后將gi的值除以該分塊像素個數(shù)ni,保存每個分塊ui的平均灰度到矩陣m,以備圖像檢索使用。進行圖像檢索時,先將待檢索圖像經(jīng)過上述處理,得到矩陣信息mk,將mk與保存的所有矩陣信息mi進行比較。
其中:Du(為分塊uk與ui平均灰度距離??紤]到空間關(guān)系,我們加上了線性距離權(quán)值i/tu,其中:tu為分塊的總數(shù)100,i為各個分塊的序號(1,2,…,100)。將D(mk,mi)進行排序,值越小則圖片相似度越高。
本文從各大購物網(wǎng)站中抽取90張圖片,分3類(上衣、褲子、女鞋),每類有30張圖片。采用上述方法進行檢索。檢索結(jié)果如圖2所示,上方為3類物品的手繪圖,下方為檢索結(jié)果。
圖2 3類物品的檢索實例
為更加客觀地評價本方法的可行性,分別統(tǒng)計2種情況下的查準率:不同查全率下的查準率和不同檢出結(jié)果下的查準率。查準率為檢出正確結(jié)果的數(shù)量與檢出結(jié)果總數(shù)量的比值,查全率為檢出正確結(jié)果的數(shù)量與應(yīng)有正確結(jié)果總數(shù)量的比值。
如圖3(a)所示,隨著查全率的提高,鞋類和褲子類的查準率保持在90%以上,上衣的查準率基本保持在40%以上。上衣查準率下降趨勢較明顯,原因是圖庫中上衣的樣式復(fù)雜多樣,分類不夠明確,草圖對形狀描述準確從而排除了樣式差異較大的上衣。從圖3(b)可以看出,每類圖片數(shù)目為30張的情況下,大多數(shù)圖片在檢出15個結(jié)果時的準確率較高。
圖3 2種情況下的查準率
提出一種基于顯著性檢測的手繪草圖圖像檢索方法。首先利用基于圖的方式進行圖像分割,然后為各分區(qū)建立稀疏顏色直方圖,進而計算各分區(qū)的顯著性。提取顯著性高的分區(qū)從而獲得所要展示的物品。將物品所在區(qū)域等比例劃分為100個分塊,按塊計算平均灰度,結(jié)合每個分塊的空間位置作為該圖像的檢索特征。抽取各大購物網(wǎng)站的圖片構(gòu)建了圖像庫,通過實驗表明本文方法可以獲取高質(zhì)量的顯著圖,從而可以準確檢索預(yù)期的物品。對每一張圖片統(tǒng)計了10種情況下的查準率,共900次統(tǒng)計,從而較準確地測試了本方法的檢索性能,實驗表明本方法可以通過手繪輪廓準確查詢相似圖像。
[1]黃祥林,沈蘭蓀.基于內(nèi)容的圖像檢索技術(shù)研究.電子學(xué)報[J].2002,30(7):1065 -1071.
[2]李曼舞,孫正興,顧慶東.基于輪廓的手繪草圖檢索研究[J].2005,25(2):344 -347.
[3]高竹紅,湯進,羅斌.基于結(jié)構(gòu)圖的手繪草圖檢索[J].計算機技術(shù)與發(fā)展,2008,18(3):32 -35.
[4]PIAAMSA-NGA P,ALEXANDRIDIS N A,SRAKAEW S,et al.Multifeature content based image retrieval[C]//Proceedings of InternationalConf-erenceon ComputerGraphics and Imaging.Halifax,Canada:IASTED,1998.
[5]孫君頂,崔江濤,毋小省,等.基于顏色和形狀特征的彩色圖像檢索方法[J].中國圖像圖形學(xué)報,2004,9(7):820 -827.
[6]鄧誠強,馮剛.基于內(nèi)容的多特征綜合圖像檢索[J].計算機應(yīng)用,2003,23(7):100 -102.
[7]吳介,裘正定.底層內(nèi)容特征的融合在圖像檢索中的研究進展[J].中國圖像圖形學(xué)報,2008,13(2):189 -197.
[8]HU M.Visual pattern recognition by moment invariants[J].IRE Transactions on Information Theory,1962(8):179 -187.
[9]王義平,黃新生,李曉雷,等.一種新的灰度變化不變矩[J].大連海事大學(xué)學(xué)報,2009,34(4):23 -27.
[10]MINGDRU F,TUYTELAARS T,GOOL L V,et al.Moment invariants for recognition under changing viewpoint and illumination[J].Computer Vision and Image Understanding,2004,94(1):3-27.
[11]LOWER D G.Distinctive image features from scale-invariant key points[J].International Journal of Computer Vision,2004,60(2):91-110.
[12]孟琭.基于視覺注意機制的彩色圖像顯著性區(qū)域提?。跩].計算機應(yīng)用研究,2013,30(10):3159 -3161.
[13]楊軍,林土勝,肖應(yīng)旺.基于全局顏色對比的顯著性目標檢測[J].計算機應(yīng)用研究,2014.31(1):292 -298.
[14]傅啟明,劉全,王曉燕,等.遺傳反饋的多特征圖像檢索[J].中國圖像圖形學(xué)報,2011,16(10):1858 -1865.
[15]支力佳,張少敏,趙大哲,等.互信息啟發(fā)的相似度組合圖像檢索算法[J].中國圖像圖形學(xué)報,2011,16(10):1850 -1857.
[16]CHENG M M,ZHANG G X.Global contrast based salient region detection[C]//IEEE International Conference on Computer Vision and Pattern Recognition(IEEE CVPR),2011:409 -416.