吳岸雄
摘? 要:提出了一種改進(jìn)的基于神經(jīng)網(wǎng)絡(luò)的圖像檢索算法。這種算法不止是考慮到了圖像顏色和形狀特征的提取,更是把特征權(quán)值的調(diào)整轉(zhuǎn)化為優(yōu)化問題。利用神經(jīng)網(wǎng)絡(luò)算法得到權(quán)值的最優(yōu)解,從此到最佳檢索效果。通過實(shí)驗(yàn)結(jié)果表明,此算法能更加高效地找到圖像,并且有較強(qiáng)的穩(wěn)定性和圖像檢索功能。
關(guān)鍵詞:圖像檢索;神經(jīng)網(wǎng)絡(luò);特征提取;特征權(quán)重
中圖分類號(hào):TP391? ? ? ? ?文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號(hào):2095-2945(2020)34-0022-02
Abstract: An improved image retrieval algorithm based on neural network is proposed. This algorithm not only considers the extraction of image color and shape features, but also turns the adjustment of feature weights into an optimization problem. The optimal solution of weights is obtained by neural network algorithm to achieve the best retrieval effect. Experimental results show that this algorithm can find the image more efficiently and has strong stability and capability of image retrieval.
Keywords: neural network; feature extraction; image retrieval; feature weigh
1 概述
一幅圖像主要由顏色、紋理、形狀等組成,因?yàn)轭伾菆D像最直觀的特征,Ritendra Datta等人研究提出基于顏色的圖像檢索算法,不過此算法存在容易丟失顏色空間分布信息以及特征維數(shù)過高等問題;Eauqueur J等人提出了一種基于圖像分割的圖像檢索算法和一種基于加權(quán)顏色直方圖的快速圖像檢索算法,但是檢索效果還是滿足不了用戶需求。
本論文研究提出一種新型的基于神經(jīng)網(wǎng)絡(luò)的圖像檢索算法,首先,提取及分析圖像的特征,對(duì)一定的特征權(quán)重進(jìn)行初始化,然后進(jìn)行首次檢索;接著,設(shè)定一個(gè)學(xué)習(xí)準(zhǔn)則,通過神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),不斷調(diào)整特征值,直到得到最優(yōu)解。
2 圖像檢索中的特征權(quán)重問題
本小節(jié)將圖像檢索中的特征權(quán)重自動(dòng)計(jì)算問題轉(zhuǎn)換為最優(yōu)化問題,用來實(shí)現(xiàn)更好的基于神經(jīng)網(wǎng)絡(luò)的圖像檢索算法,為方便計(jì)算,其定義為:
(1) 圖像數(shù)據(jù)庫定義為:DB={Ii},其中Ii為每幅圖像,m為圖像的數(shù)量;
(2) 兩幅圖像I1和I2的相似函數(shù)S定義為:S(I1,I2)=
wj,其中wj表示已歸一化至[0,1]區(qū)間的特征權(quán)重,n表示特征數(shù)量,f表示圖像I1的第j個(gè)特征值。
(3) 檢索圖像評(píng)價(jià)指標(biāo):召回率和準(zhǔn)確率分別為:R=,P=,其中a表示檢索到的與樣本圖像相關(guān)聯(lián)的圖像的數(shù)量,k表示目標(biāo)圖像的數(shù)量,z表示檢索圖像的總參考書目。
根據(jù)以上分析,召回率R和準(zhǔn)確率P越高,表示檢索方法越好,W=,可以看出,W與R、P成正比。那么由此可見,特征權(quán)重的設(shè)置是一個(gè)組合優(yōu)化問題,可以通過求解優(yōu)化問題來解決。
3 基于神經(jīng)網(wǎng)絡(luò)的圖像檢索算法
本文首先提取算法的核心來檢索圖像的顏色和形狀,顏色信息用ihs空間來描述顏色(色相)值的形狀信息用CSS(曲率尺度空間)來描述。然后利用神經(jīng)網(wǎng)絡(luò)對(duì)圖像特征進(jìn)行優(yōu)化組織形式;最后根據(jù)求解的W值可以獲得我們所需要的圖像信息。
3.1 提取形狀信息
獲得圖像形狀信息后,接下來需要對(duì)圖像進(jìn)行更進(jìn)一步的處理,以獲得更加精確的圖像形狀特征。算法大致如下:首先進(jìn)行圖像定位,鎖定重要信息,其次進(jìn)行灰度轉(zhuǎn)化,使其變?yōu)榛叶葓D像;然后再把灰度圖像二值轉(zhuǎn)換變成二值圖像;再提取輪廓線以獲得曲率尺度空間圖像,最后通過聚類將圖像噪聲去除。具體過程如圖1所示。
圖像預(yù)處理后,利用拉普拉斯算子提取圖像的輪廓線,跟蹤圖像的輪廓線。最后,根據(jù)式(1)提取圓形圖像信息,圖像被進(jìn)一步處理,如上所述,直到曲率變成0。
其中u表示弧長,?滓代表高斯核的寬度
這種算法一方面可以得到圖像的特征圖像,另一方面可以根據(jù)兩幅圖像的特征圖像得到相似度,并將其作為圖像的第一特征,即f(j=1)。那么:
3.2 提取顏色信息
為了獲得更準(zhǔn)確的圖像特征,還需進(jìn)一步提取檢索圖像的顏色信息。本論文選擇更符合人眼視覺的HIS顏色空間通過獲得色彩值與人的視覺相一致、飽和度和亮度決定了圖像的色彩特征。算法首先將RGB空間轉(zhuǎn)換為HIS空間。本文只考慮色相值的差異,只考慮色相值的轉(zhuǎn)換過程。具體換算公式如下:
其中:
運(yùn)用此公式,就能獲取索引圖像和作為圖像的第二個(gè)特征的圖像,即f(j=2)。那么:
4 實(shí)驗(yàn)結(jié)果及分析
本文對(duì)于特征權(quán)重的選擇采用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)訓(xùn)練,首先,設(shè)定形狀和顏色信息的特征權(quán)重,利用上述由公式得到圖像的相似度函數(shù)。然后將特征權(quán)值作為RBF神經(jīng)網(wǎng)絡(luò)的輸入,通過多次學(xué)習(xí),得到輸出值;最后運(yùn)用前面提出的公式,可以得到最符合的一幅或多幅圖像。
本文測試圖像數(shù)據(jù)為Corel圖像庫,運(yùn)用本文算法得到查全率和查準(zhǔn)率 。與傳統(tǒng)算法的檢索結(jié)果相比,這種算法的檢索精度明顯比傳統(tǒng)算法要高。同時(shí)給出了三種算法的查全率和查準(zhǔn)率比較曲線,進(jìn)一步驗(yàn)證了算法的有效性(見圖2)。
5 結(jié)論
本文提出了一種基于神經(jīng)網(wǎng)絡(luò)的可調(diào)特征權(quán)的圖像檢索算法,將多特征組織方法轉(zhuǎn)化為神經(jīng)網(wǎng)絡(luò)優(yōu)化問題。理論分析中可以得出,這種方法具有一定的學(xué)習(xí)能力。實(shí)驗(yàn)結(jié)果表明,該算法在檢索方面優(yōu)于前兩種算法,具有很強(qiáng)的穩(wěn)定性和圖像檢索能力。
參考文獻(xiàn):
[1]Veltkamp R C,Tanase M. Content-based image retrieval systems: a survey, UU-CS-2000-34[D]. Department of Computer Science, Utretch University,October,2000.
[2]Ritendra Datta, Jia Li.Content-based image retrieval approaches and trends of the new age[C].Proceedings of the 7th International Workshop on Multimedia Information Retrieval, in conjunction with ACM International Conference on Multimedia, Singapore, ACM, November 2005:253-262.
[3]Wang Yi,Zhai Hong-chen. Shape description matrix and its applications to color-image retrieval and recognition [J].Science in China Ser. E Engineering & Materials Science, 2004,34(3):337-344.
[4]于永健,王向陽,等.基于顏色復(fù)雜度的加權(quán)顏色直方圖圖像檢索算法[J].小型微型計(jì)算機(jī)系統(tǒng),2009(3):507-511.