史書偉,夏 彬,冀 翼,桑小田
(中華全國供銷合作總社鄭州棉麻工程技術(shù)設(shè)計(jì)研究所,鄭州 450000)
?
棉花圖像檢索中的分塊權(quán)重優(yōu)化
史書偉,夏彬,冀翼,桑小田
(中華全國供銷合作總社鄭州棉麻工程技術(shù)設(shè)計(jì)研究所,鄭州450000)
摘要:針對(duì)棉花圖像檢索中顏色直方圖方法中的各圖像分塊權(quán)重難以設(shè)定的難題,提出一種基于粒子群算法的多分塊權(quán)重自動(dòng)優(yōu)化方法,它將圖像各分塊權(quán)重設(shè)定轉(zhuǎn)化為智能求優(yōu)過程,使用粒子群算法求取較佳分塊權(quán)重組合。結(jié)合棉花數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,與均等權(quán)重方法以及用戶自定義權(quán)重方法相比,該方法能夠取得較為優(yōu)化的權(quán)重組合,提高棉花圖像的檢索性能。
關(guān)鍵詞:棉花圖像;分塊顏色直方圖;粒子群算法;權(quán)重優(yōu)化
棉花圖像檢索就是根據(jù)棉花圖像本身的顏色、紋理、形狀等內(nèi)容屬性,在目標(biāo)圖像數(shù)據(jù)庫中查詢具有指定特征或內(nèi)容圖像的過程,是目前圖像檢索中較為常用的方法。在顏色特征中,由于全局顏色直方圖計(jì)算簡單,且具有較強(qiáng)的魯棒性,已廣泛應(yīng)用[1-2]于圖像檢索中。但是,由于全局顏色直方圖沒有考慮圖像顏色的空間關(guān)系,不同的圖像有可能具有相同的直方圖,從而造成誤檢,因此,文獻(xiàn)[3-4]提出采用對(duì)棉花圖像進(jìn)行分塊和加權(quán)的方法,將圖像分成N*N塊,計(jì)算相應(yīng)塊之間的直方圖距離,然后為每個(gè)圖像塊設(shè)置權(quán)重,棉花圖像整體的相似度根據(jù)相應(yīng)子塊的距離和權(quán)重綜合得到。
對(duì)于棉花圖像各個(gè)分塊權(quán)重,一般情況下,有3種設(shè)置方法:a)圖像的每個(gè)分塊設(shè)置相同權(quán)重,即,都賦值為“1”,這樣以來,圖像所有分塊均被同等對(duì)待;b)每個(gè)圖像分塊實(shí)行選擇對(duì)待,這樣它們的權(quán)重有兩種可能:“1”或者“0”,分別表示該分塊被選中或者沒被選中,這樣有效降低了分塊所構(gòu)成的特征維數(shù),但會(huì)忽略沒有被選中的圖像塊;c)手工設(shè)置權(quán)重,也即是通過實(shí)驗(yàn)分析預(yù)先求取優(yōu)化過的權(quán)重值,顯然,這種權(quán)重選取方法主觀性較強(qiáng)。由于劃分的不同圖像分塊在整幅圖像中的重要程度不相同,對(duì)檢索結(jié)果的影響也不一致,所以,如何為這些圖像分塊自動(dòng)賦予合適的權(quán)值,進(jìn)而提高圖像檢索的性能,成為一個(gè)亟待研究的課題。
針對(duì)上述問題,本文提出一種基于粒子群算法的圖像分塊權(quán)重自動(dòng)優(yōu)化方法,用粒子群算法[5-6]來求取棉花圖像檢索中合適的分塊權(quán)重組合,并結(jié)合棉花圖像數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn)。
1.1粒子群算法原理
粒子群算法,也稱粒子群優(yōu)化算法[7-9](particle swarm optimization,PSO)是Eberhart和Kennedy發(fā)明的一種新的全局優(yōu)化算法,它來源于對(duì)鳥群捕食過程中的行為研究。假設(shè)有一個(gè)場景:在特定區(qū)域中只有一塊食物,一群鳥在空間中隨機(jī)搜索該食物,所有的鳥都不清楚食物的具體位置。但它們知道當(dāng)前的位置距離食物的遠(yuǎn)近。那么找到食物簡單、有效的就是搜索當(dāng)前距離食物最近的鳥的附近區(qū)域。而PSO算法就是通過模擬鳥群覓食行為而提出來的,該算法通過群體行為中個(gè)體間協(xié)作和信息共享來求取最優(yōu)解,已成為一種常用的自動(dòng)優(yōu)化方法。
在求解問題時(shí),PSO將搜索空間中的一個(gè)粒子(particle)對(duì)應(yīng)一個(gè)問題解法。其中,每個(gè)粒子都擁有自己的位置、速度和適應(yīng)值(fitness value),每個(gè)粒子在解空間中跟隨當(dāng)前最優(yōu)粒子進(jìn)行搜索,且不斷更新自身的位置和速度。具體求解過程如下:首先,PSO隨機(jī)初始化一群粒子,假設(shè)粒子數(shù)目為N,那么,第i個(gè)粒子的位置采用D維向量表示xi,xi=(xi1,xi2,…xiD),其中,i=1,2,…N。接著,粒子通過跟蹤兩個(gè)極值來更新自身的位置和速度,直到找到最優(yōu)解。其中,在全局版PSO中,兩個(gè)極值分別是指:一個(gè)是全局極值,表示群體找到的最優(yōu)解;一個(gè)是個(gè)體極值,表示粒子個(gè)體找到的最優(yōu)解。在局部版PSO中,粒子除了跟蹤個(gè)體極值之外,另外還追蹤局部極值。對(duì)于全局版PSO,每次迭代中,粒子根據(jù)式(1),式(2)更新自身的位置和速度:
(1)
(2)
1.2權(quán)重設(shè)置問題的轉(zhuǎn)化
定義1棉花圖像庫的定義為:
DB={Ii}n,i=1
其中:Ii表示圖像庫中的一幅棉花圖像,n表示圖像庫中的棉花圖像總數(shù)。
定義2任意兩幅棉花圖像I1,I2間相似程度函數(shù)S定義為:
(3)
定義3樣本訓(xùn)練數(shù)據(jù)庫為db?DB,訓(xùn)練對(duì)定義為:
TD=(Ie,IT,IR)
(4)
其中:Ie為檢索示例棉花圖像,IT為與該示例圖像相似的目標(biāo)數(shù)據(jù)集,IT={It1,It2,…,Itk},IR為實(shí)際檢索出的圖像集,即S(Ii,Ie) 定義4圖像檢索評(píng)價(jià)指標(biāo)查全率(recall)和查準(zhǔn)率(precision)定義為: (5) 其中:P為查準(zhǔn)率,是指在檢索過程中,查詢到的相關(guān)圖像數(shù)量同該次查到的所有圖像數(shù)量的比值;a為檢索出的與示例圖像相關(guān)的圖像數(shù)量;z為檢索出圖像總數(shù)量;R為查全率,指在檢索過程中,查詢到的相關(guān)圖像數(shù)量與圖像庫中實(shí)際與目標(biāo)圖像相關(guān)的所有圖像數(shù)量的比值;k為目標(biāo)圖像數(shù)量。 (6) 其中:num為檢索示例圖像總數(shù)。在棉花圖像檢索中,查全率和查準(zhǔn)率越高,說明該棉花圖像檢索算法性能越優(yōu)越。 2.1優(yōu)化策略與實(shí)現(xiàn) 粒子群算法開始時(shí)隨機(jī)生成粒子的初始位置Xi=(Xi1,Xi2,…,Xim),(i=1,2,…,n),n為群中粒子數(shù),m為粒子維數(shù),并且每個(gè)粒子都隨機(jī)分配一個(gè)初始速度Vi=(Vi1,Vi2,…,Vid),(i=1,2,…,n)。在計(jì)算過程中,粒子的當(dāng)前速度Vi,粒子搜索過程中的最優(yōu)點(diǎn)Pi,群體的最優(yōu)點(diǎn)Pg。粒子在迭代過程中實(shí)時(shí)改變速度向前Pi和Pg移動(dòng)[10]。 在棉花圖像檢索中,使用PSO進(jìn)行分塊權(quán)重優(yōu)化的方法流程如圖1所示。 圖1 圖像塊權(quán)重優(yōu)化流程 優(yōu)化策略具體步驟如下: Step1對(duì)粒子群進(jìn)行初始化,隨機(jī)生成各個(gè)粒子的初始位置Xi、初始速度Vi。 Step2將各個(gè)粒子位置Xi載入優(yōu)化目標(biāo)函數(shù),計(jì)算粒子適應(yīng)度。 Step3將各個(gè)粒子當(dāng)前值與其自身最優(yōu)適應(yīng)度值Pi進(jìn)行比較,如果當(dāng)前值小于Pi,則用當(dāng)前適應(yīng)度值替換Pi,并使用當(dāng)前位置更新自身最優(yōu)位置。 Step4將各個(gè)粒子適應(yīng)度值Pi與全局最優(yōu)適應(yīng)度值Pg進(jìn)行比較,如果小于Pg,則替換Pg,同時(shí),使用該粒子位置更新全局最優(yōu)粒子位置。 Step5各粒子速度和位置使用式(1)和式(2)更新。 vid(t+1)=w×vid(t)+φ×rand() ×[pid(t)-xid(t)]+φ2+rand()× pgd(t)-xid(t)] (7) xid(t+1)=xid(t)+vid(t+1) 1≤i≤n,1≤d≤D (8) 其中:φ1和φ2為加速因子;w為慣性因子,w越大探查范圍越大,w越小適用于小范圍開挖;rand()為在[0,1]上的隨機(jī)數(shù);xi為迭代中位置;vi為速度。 Step6如果滿足迭代終止條件(足夠好的位置或最大迭代次數(shù)),優(yōu)化完成,否則轉(zhuǎn)Step2。 2.2關(guān)鍵參數(shù)選取 為了獲取穩(wěn)健和高效的優(yōu)化效果,按照方差分析選擇適應(yīng)的算法參數(shù)設(shè)置水平,關(guān)鍵參數(shù)選取如下: a)選取適應(yīng)度函數(shù)E=Y(W)。 b)群中粒子數(shù)n:通常在[25,42]區(qū)間取值,對(duì)于一般情況,32個(gè)粒子已經(jīng)足夠;對(duì)于特定類別的問題或較難問題,粒子數(shù)n可以在[50,1000]區(qū)間中選取。 c)粒子維數(shù)m:一般情況下,問題解的長度通常設(shè)為粒子的范圍寬度。 d)加速因子φ1和φ2:加速常數(shù)值取值越小,可使粒子在遠(yuǎn)離目標(biāo)區(qū)域內(nèi)振蕩搜索;而取值較大的加速常數(shù)值,可使粒子迅速向目標(biāo)區(qū)域移動(dòng),甚至又離開目標(biāo)區(qū)域。模擬結(jié)果表明,當(dāng)φ1由2.5線性遞減至0.5,φ2由0.5線性遞增至2.5時(shí),算法容易獲得最優(yōu)適應(yīng)值。 e)慣性因子w:讓m隨著疊代次數(shù)的增加,在[1.4,0]區(qū)間逐步減少可以獲取較好的實(shí)驗(yàn)結(jié)果。 在算法驗(yàn)證試驗(yàn)中,采集白棉三級(jí)棉花圖像作為數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),該數(shù)據(jù)集包括1960例棉樣圖像,每副圖像分辨率為1400×1400;實(shí)驗(yàn)硬件平臺(tái)是一臺(tái)聯(lián)想M490便攜式計(jì)算機(jī),該計(jì)算機(jī)配備CORE i5 CPU,4GB內(nèi)存。 3.1圖像分塊數(shù)目分析 對(duì)于棉花圖像檢索來講,重要的就是確定圖像分塊數(shù)目,而分塊的數(shù)目取決于單塊圖像的分辨率像素點(diǎn)數(shù)。為了選取合適的圖像塊大小尺寸,本文針對(duì)常用的不同分塊尺寸進(jìn)行了實(shí)驗(yàn),結(jié)果如表1所示。 表1不同圖像塊尺寸對(duì)比實(shí)驗(yàn) 圖像分塊尺寸/pixel檢索響應(yīng)時(shí)間/s8*82.124*241.948*481.864*641.5128*1281.3256*2561.1 根據(jù)表1數(shù)據(jù),考慮到數(shù)據(jù)集中圖像的分辨率以及檢索響應(yīng)時(shí)間,實(shí)驗(yàn)選取64 pixel*64 pixel作為圖像塊尺寸進(jìn)行算法間對(duì)比分析。 3.2不同方法間對(duì)比分析 為了驗(yàn)證本文方法的有效性,將其與現(xiàn)有權(quán)重相等方法和用戶自定義權(quán)重方法進(jìn)行比較和分析。其中,本文方法選取64 pixel*64 pixel為圖像塊尺寸,粒子群算法參數(shù)根據(jù)2.1節(jié)的方法設(shè)置;用戶自定義權(quán)重方法中各分塊權(quán)重按照實(shí)驗(yàn)中經(jīng)驗(yàn)值設(shè)置。實(shí)驗(yàn)結(jié)果如圖2所示。 圖2 3種方法的性能比較 由圖2可見,由于本文方法采用粒子群算法優(yōu)化分塊權(quán)重,通過訓(xùn)練學(xué)習(xí)的優(yōu)化方法彌補(bǔ)了由于用戶自定義設(shè)置權(quán)重的不足,提高了檢索效果,本文提出的方法在查全率和查準(zhǔn)率上優(yōu)于其它分塊權(quán)重方法,具有一定的有效性。 本文提出一種在棉花圖像檢索中,基于粒子群算法的圖像分塊權(quán)重自動(dòng)優(yōu)化方法,用粒子群算法來自動(dòng)求取棉花圖像檢索中合適的分塊權(quán)重組合,將圖像各分塊權(quán)重設(shè)定轉(zhuǎn)化為智能求優(yōu)過程,改善圖像檢索性能。這種方法思路較為新穎,在棉花圖像檢索的實(shí)驗(yàn)結(jié)果表明,該方法具有學(xué)習(xí)能力,分塊權(quán)重的自動(dòng)優(yōu)化,提高了系統(tǒng)查全率和查準(zhǔn)率,在提高棉花圖像檢索效率上有一定的優(yōu)勢。對(duì)于一些特定應(yīng)用,該論文有很好的參考和借鑒作用。 如何進(jìn)一步優(yōu)化算法,在更大棉花數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)將是下一階段的主要工作內(nèi)容。 參考文獻(xiàn): [1] 夏彬.基于內(nèi)容的近似圖像檢測算法研究[D].武漢:湖北工業(yè)大學(xué),2010. [2] 汪啟偉,萬壽紅,岳麗華.一種新的空間顏色直方圖及其度量方法[J].小型微型計(jì)算機(jī)系統(tǒng),2014,46(6):34-36. [3] 溫泉徹,彭宏,黎瓊.基于內(nèi)容的圖像檢索關(guān)鍵技術(shù)研究[J].微計(jì)算機(jī)信息,2007,23(3):278-280. [4] 方俊,郭雷,汪子強(qiáng).一種改進(jìn)的基于顏色空間特征的圖像檢索方法[J].計(jì)算機(jī)工程與應(yīng)用,2005,24(25):68-70. [5] 薄玉玲,姜靜清,孫艷紅.粒子群優(yōu)化算法研究進(jìn)展[J].內(nèi)蒙古民族大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,29(6):91-93. [6] 張丹,韓勝菊,李建,等.基于改進(jìn)粒子群算法的BP算法的研究[J].計(jì)算機(jī)仿真,2011,23(2):102-104. [7] 楊維,李歧強(qiáng).粒子群優(yōu)化算法綜述[J].中國工程科學(xué),2004,10(5):87-93. [8] 楊帆,胡春平,顏學(xué)峰.基于蟻群系統(tǒng)的參數(shù)自適應(yīng)粒子群算法及其應(yīng)用[J].控制理論與應(yīng)用,2010,45(11):78-79. [9] 劉志雄,梁華.粒子群算法中隨機(jī)數(shù)參數(shù)的設(shè)置與實(shí)驗(yàn)分析[J].控制理論與應(yīng)用,2010,15(11):26-27. [10] 張琪,屈衛(wèi)清,熊偉清.基于混沌粒子群算法的多目標(biāo)調(diào)度優(yōu)化研究[J].激光雜志,2015,29(1):57-59. (責(zé)任編輯:陳和榜) 收稿日期:2015-04-29 作者簡介:史書偉(1979-),男,河南新鄭人,高級(jí)工程師,主要從事棉花光電檢測方面的研究。 通信作者:夏彬,E-mail:binxia@126.com 中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1009-265X(2016)01-0001-04 Block Weight Optimization of Cotton Image Retrieval SHIShuwei,XIABin,JIYi,SANGXiaotian (Zhengzhou Cotton & Jute Engineering Technology and Design Research Institute of China Co-op, Zhengzhou 450000, China) Abstract:Aiming at the problem that it is difficult to set image block weight in cotton image retrieval with color histogram, this paper proposes multi-block weight automatic optimization method based on Particle Swarm Optimization (PSO). It converts the block weight setting into intelligent optimization process, and then PSO is used to gain optimal block weight combination. Experimental results combined with cotton data set show that the method ca gain optimized weight combination and improves cotton image retrieval property, compared with equal weighting method and user-defined weighting method. Key words:cotton image; block color histogram; PSO; weight optimization2 基于PSO的分塊權(quán)重優(yōu)化方法
3 實(shí)驗(yàn)結(jié)果與分析
4 結(jié) 語