姜雪
(淄博職業(yè)學(xué)院 信息工程系, 山東 淄博 255314)
基于內(nèi)容的圖像檢索CBIR(content based image retrieval),直接利用圖像的顏色、底紋、形狀等底層圖像內(nèi)容作為檢索特征來進(jìn)行圖像檢索[1]。在特征提取方面,為了更全面地描述圖像信息,提高圖像檢索精度,需要多提取圖像的各種特征,如顏色特征、紋理特征、形狀特征、角點(diǎn)特征[2],語義特征[3]等。但實(shí)際情況表明,并非提取的特征越多檢索效果越好。本文運(yùn)用遺傳算法對(duì)提取的圖像特征進(jìn)行選擇,旨在去除冗余特征以降低特征的維數(shù),減小計(jì)算的復(fù)雜性,縮短程序運(yùn)行的時(shí)間,以提高圖像檢索效率;同時(shí)運(yùn)用遺傳算法設(shè)置多檢索特征的權(quán)重,使特征有效融合,以達(dá)到更好的檢索效果。
遺傳算法(genetic algorithm,GA)是借鑒適者生存、優(yōu)勝劣汰的生物界進(jìn)化規(guī)律的隨機(jī)化搜索方法,由美國(guó)的Holland教授于1969年提出[4]。遺傳算法從代表問題可能解的一個(gè)初始種群開始,種群由經(jīng)過基因編碼的一定數(shù)目的個(gè)體組合而成。初始種群產(chǎn)生后,根據(jù)適者生存和優(yōu)勝劣汰的原理,一代一代演化出越來越好的近似解。在每一代中,根據(jù)問題集中每個(gè)個(gè)體的適應(yīng)度大小來選擇個(gè)體,借助遺傳算子按照一定的概率進(jìn)行交叉和變異,產(chǎn)生下一代種群。這個(gè)過程將導(dǎo)致后代種群比前代更加適應(yīng)環(huán)境,最后一代種群中的最優(yōu)個(gè)體經(jīng)過解碼,可以作為解決問題的最優(yōu)解。遺傳算法流程如圖1所示。
圖1 遺傳算法流程Fig.1 Flow chart of genetic algorithm
遺傳算法的研究受到了國(guó)內(nèi)外學(xué)者的廣泛關(guān)注,近年來該算法已被成功地應(yīng)用于工業(yè)、經(jīng)濟(jì)管理、交通運(yùn)輸、工業(yè)設(shè)計(jì)等不同領(lǐng)域,解決了很多實(shí)際問題[5-7]。本文將遺傳算法用于圖像檢索的特征選擇和權(quán)重設(shè)置兩個(gè)環(huán)節(jié),以提高圖像檢索效率。
特征選擇[8-9]是指從一個(gè)初始特征集中選出一些特征組成最優(yōu)特征子集[10],依據(jù)這些最優(yōu)子集構(gòu)成檢索特征能夠使檢索結(jié)果的評(píng)估標(biāo)準(zhǔn)達(dá)到最優(yōu),使檢索過程具有較高的檢索效率。本文選用Caltech256數(shù)據(jù)集和Corel1000數(shù)據(jù)集,分別提取了圖像的11個(gè)特征,即RGB、HSV直方圖特征、顏色相關(guān)圖特征、顏色矩特征,LBP特征、灰度共生矩陣特征、gabor小波的3個(gè)特征,以及角點(diǎn)的Hu矩特征和灰度共生矩陣特征,采用查準(zhǔn)率和查全率作為評(píng)價(jià)特征子集的標(biāo)準(zhǔn),通過遺傳算法進(jìn)行特征選擇,得到最優(yōu)特征子集。該最優(yōu)特征子集作為圖像的檢索特征,用相對(duì)曼哈頓距離[11]進(jìn)行相似性度量。特征選擇的步驟如下:
1)對(duì)初始種群的個(gè)體進(jìn)行編碼。首先,將提取的n個(gè)圖像特征對(duì)應(yīng)的特征值進(jìn)行歸一化處理;然后,隨機(jī)產(chǎn)生n位二進(jìn)制數(shù)作為個(gè)體編碼,其中1代表選擇該特征,0代表不選擇該特征[12]。
2)設(shè)定初始種群的規(guī)模。不同問題采用的初始種群規(guī)模各不相同,規(guī)模越大所得最優(yōu)特征子集越接近最優(yōu)解,但耗時(shí)會(huì)越多,初始種群的取值一般在30~100,本文將初始種群設(shè)定為100個(gè)個(gè)體。
3)確定適應(yīng)度函數(shù)。基于內(nèi)容的圖像檢索旨在提高檢索的效率,即在人能夠接受的一般時(shí)間范圍內(nèi),盡可能地提高圖像檢索的查準(zhǔn)率和查全率,所以本文適應(yīng)度函數(shù)定義為查準(zhǔn)率和查全率之和,其公式如下:
F=Pn+Rn,
4)根據(jù)個(gè)體適應(yīng)度的大小,選擇算子采用輪盤賭算法進(jìn)行種群個(gè)體的選擇,即個(gè)體的適應(yīng)度越大被選擇的幾率越大,被選擇的個(gè)體進(jìn)入下一代種群。
5)在滿足一定交叉概率的前提下,依次從種群中抽出兩個(gè)個(gè)體,進(jìn)行隨機(jī)位的交叉,交叉概率一般取值為0.4~0.99,本文選取的交叉概率為0.7。
6)在滿足一定變異概率的前提下,依次對(duì)種群中的個(gè)體進(jìn)行隨機(jī)位的變異。原來為1,變異為0;原來為0,變異為1。變異概率一般取值為0.001~0.1,本文選取的變異概率為0.05。
7)算法終止條件的設(shè)定。算法終止條件的設(shè)定有多種,如所求解達(dá)到了精度要求或算法達(dá)到了最大運(yùn)行時(shí)間等,本文選擇的算法終止條件為所求解達(dá)到最大的迭代次數(shù)100,即從初始種群開始要進(jìn)化100代。
依然采用遺傳算法,對(duì)通過特征選擇得到的多個(gè)最優(yōu)特征進(jìn)行權(quán)重設(shè)置,使得多個(gè)圖像特征能夠有效融合。具體操作步驟如下:
1)根據(jù)特征選擇得到的最優(yōu)檢索特征的個(gè)數(shù)k,首先將這k個(gè)特征對(duì)應(yīng)的特征值進(jìn)行歸一化處理,然后進(jìn)行初始種群個(gè)體的二進(jìn)制編碼。假設(shè)權(quán)重系數(shù)要精確到小數(shù)點(diǎn)后兩位,則每個(gè)權(quán)重系數(shù)至少要編碼成7位二進(jìn)制數(shù)[13],k個(gè)檢索特征的權(quán)重系數(shù)就要編碼成7k位二進(jìn)制數(shù),即初始種群中的個(gè)體為7k位二進(jìn)制數(shù)。
2)初始種群的個(gè)數(shù)仍設(shè)定為100。個(gè)體適應(yīng)度函數(shù)與特征選擇的適應(yīng)度函數(shù)相同,為查全率和查準(zhǔn)率之和。
3)選擇、交叉和變異過程均與特征選擇的過程相同,其中交叉概率為0.7,變異概率為0.05,種群進(jìn)化代數(shù)為300。
4)編碼的解碼,是將7k位二進(jìn)制數(shù)解碼為k個(gè)權(quán)重系數(shù)。依次將每7位二進(jìn)制數(shù)轉(zhuǎn)化成對(duì)應(yīng)的十進(jìn)制數(shù)a1,a2…,ak,k個(gè)檢索特征的權(quán)重系數(shù)為
本文的實(shí)驗(yàn)環(huán)境為:Intel(R) Core(TM) i5-4460 CPU @ 3.20 GHz,8.00GBRAM,Windows7操作系統(tǒng),MATLAB R2016a軟件。
實(shí)驗(yàn)選用了Caltech256數(shù)據(jù)集和Corel1000數(shù)據(jù)集,分為如下四個(gè)階段來進(jìn)行:
1)提取圖像的顏色特征(HSV直方圖特征、顏色相關(guān)圖特征、顏色矩特征)和紋理特征(gabor小波特征中的3個(gè)特征)共6個(gè)特征,構(gòu)成的特征向量為190維進(jìn)行圖像檢索實(shí)驗(yàn)。
2)再提取圖像的顏色特征(RGB直方圖特征)、紋理特征(LBP特征、灰度共生矩陣特征)以及角點(diǎn)的Hu矩特征和灰度共生矩陣特征共11個(gè)特征,構(gòu)成的特征向量為321維,對(duì)這11個(gè)特征對(duì)應(yīng)的特征值進(jìn)行歸一化處理,并將其作為檢索特征進(jìn)行圖像檢索實(shí)驗(yàn)。
3)用遺傳算法對(duì)這11個(gè)圖像特征進(jìn)行特征選擇,其中初始種群個(gè)數(shù)為100、交叉概率為0.7、變異概率為0.05、迭代次數(shù)為100,將得到的多個(gè)最優(yōu)特征作為檢索特征進(jìn)行圖像檢索實(shí)驗(yàn)。
4)用遺傳算法為特征選擇得到的最優(yōu)特征設(shè)置權(quán)重,其中初始種群個(gè)數(shù)為100、交叉概率為0.7、變異概率為0.05、迭代次數(shù)為300,將得到的權(quán)重系數(shù)有效融合多個(gè)最優(yōu)特征并進(jìn)行圖像檢索實(shí)驗(yàn)。
在Caltech256數(shù)據(jù)集中,選擇了Backpack、Bear、Binoculars、Bonsai、Butterfly五個(gè)語義類,每類100幅共500幅圖像作為數(shù)據(jù)庫(kù)圖像,從五類中各選10幅共50幅圖像作為查詢圖像,檢索結(jié)果返回20幅圖像。
在實(shí)驗(yàn)的第三階段,通過特征選擇得到了gabor小波的2個(gè)特征和角點(diǎn)的Hu矩特征共3個(gè)最優(yōu)特征,構(gòu)成的特征向量為71維;在實(shí)驗(yàn)的第四階段,通過權(quán)重設(shè)置得到的權(quán)重系數(shù)為[0.23,0.39,0.38]。
在四個(gè)階段的圖像檢索中,所得數(shù)據(jù)見表1,各階段的檢索精度對(duì)比如圖2所示。
表1 各類圖像在四個(gè)階段的檢索精度Tab.1 Retrieval accuracy of all kinds of images in four stages
圖2 各階段的檢索精度對(duì)比Fig.2 Comparison of retrieval accuracy in different stages
從實(shí)驗(yàn)數(shù)據(jù)來看,僅僅增加檢索特征并不能使檢索精度得到有效改善。如在增加5個(gè)檢索特征后,Bear類和Bonsai類的檢索精度反而降低了,其他類的檢索精度略有提升。用遺傳算法進(jìn)行特征選擇后,得到了3個(gè)最優(yōu)特征,用這3個(gè)特征進(jìn)行圖像檢索的精度提高了。當(dāng)用遺傳算法賦予這3個(gè)最優(yōu)特征適當(dāng)權(quán)重之后,檢索精度又有所提升。
在Corel1000數(shù)據(jù)集中,從每類中各選10幅共100幅圖像作為查詢圖像,檢索結(jié)果返回20幅圖像。
在實(shí)驗(yàn)的第三階段,通過特征選擇得到了RGB、HSV直方圖特征、顏色矩特征、灰度共生矩陣特征和gabor小波(其中1個(gè)特征)共5個(gè)最優(yōu)特征,構(gòu)成的特征向量為118維;在實(shí)驗(yàn)的第四階段,通過權(quán)重設(shè)置得到的權(quán)重系數(shù)為[0.21,0.13,0.01,0.40,0.26]。
在四個(gè)階段的圖像檢索中,所得數(shù)據(jù)見表2,各階段的檢索精度對(duì)比如圖3所示。
圖3 各階段的檢索精度對(duì)比Fig.3 Comparison of retrieval accuracy in different stages
實(shí)驗(yàn)數(shù)據(jù)說明,在增加5個(gè)檢索特征后,Africa類、Elephant類、Mountain類和Food類的檢索精度降低了,其他類的檢索精度略有提升。用遺傳算法進(jìn)行特征選擇和權(quán)重設(shè)置后,有效融合了5個(gè)最優(yōu)特征,優(yōu)化了檢索效率。
在基于內(nèi)容的圖像檢索中,提取的圖像特征越多,雖然對(duì)于圖像的描述更加全面和細(xì)致了,但是并非圖像檢索的效果就越好。本文對(duì)于圖像中提取的11種特征,通過用遺傳算法進(jìn)行特征選擇后僅僅選出了少數(shù)最優(yōu)特征,降低了特征向量的維度,而檢索精度卻提升了,這充分說明在特征提取后先進(jìn)行特征選擇是十分必要的;而當(dāng)用遺傳算法進(jìn)行了權(quán)重設(shè)置后,檢索精度又有了提高,這也說明了對(duì)多個(gè)特征進(jìn)行有效融合同樣很重要。同時(shí)要注意到,經(jīng)過特征選擇,各類圖像檢索精度的提升幅度各不相同,如本文中Bear類圖像提升的幅度就比較小,如何進(jìn)一步優(yōu)化特征選擇算法,以使各類圖像的檢索精度都有效提升,將是今后工作的重點(diǎn)。