朱黎輝, 李曉寧(四川師范大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院, 四川 成都 610101)
?
面向圖像分類的多層感知機(jī)BBO優(yōu)化方法
朱黎輝, 李曉寧*
(四川師范大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院, 四川 成都 610101)
為了通過優(yōu)化多層感知機(jī)權(quán)重及偏置提高圖像分類決策的正確率,借鑒生物地理學(xué)優(yōu)化(BBO)算法的思想,提出面向圖像分類的多層感知機(jī)BBO方法.首先提取圖像的顏色矩和降維梯度方向直方圖(DRHOG)的組合特征作為多層感知機(jī)的輸入數(shù)據(jù),然后使用BBO優(yōu)化方法得到迭代250次的最優(yōu)權(quán)重及偏置,最后經(jīng)多層感知機(jī)得出測(cè)試圖像的類別.該方法有效避免算法早熟現(xiàn)象,增強(qiáng)圖像分類能力.通過仿真實(shí)驗(yàn),驗(yàn)證此方法比粒子群優(yōu)化算法優(yōu)化多層感知機(jī)具有更高的求解質(zhì)量和效率,為圖像分類提供又一可行方案.
生物地理學(xué)優(yōu)化; 多層感知機(jī); 顏色矩; 降維梯度方向直方圖; 粒子群優(yōu)化
隨著網(wǎng)絡(luò)技術(shù)的普及,圖像數(shù)量呈指數(shù)級(jí)增長(zhǎng)趨勢(shì),在大數(shù)據(jù)集的圖像數(shù)據(jù)庫中查找符合條件的圖片成為了當(dāng)前網(wǎng)絡(luò)技術(shù)研究熱點(diǎn).圖像分類作為其中的一項(xiàng)重要技術(shù),已成為重點(diǎn)研究方向.圖像分類研究集中在圖像特征提取和分類器的選擇上.圖像特征主要有3類,一是基于顏色特征的顏色矩和顏色直方圖等;二是基于形狀特征的梯度方向直方圖[1]、zernike矩[2]等;三是基于紋理特征的灰度共生矩陣[3]、局部二值模式[4]等.分類器主要包括支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、在線分類器[5]等.另外,特征的優(yōu)化問題得到廣泛關(guān)注.本文結(jié)合實(shí)際項(xiàng)目,主要研究圖像分類中的優(yōu)化問題.
常用于優(yōu)化問題的啟發(fā)式算法有粒子群優(yōu)化(PSO)[6]、遺傳算法(GA)[7]等,生物地理學(xué)優(yōu)化(BBO)[8]算法是近幾年才提出的啟發(fā)式算法,它是受動(dòng)物或其他物種的遷移策略啟發(fā)來求解優(yōu)化問題的算法,文獻(xiàn)[9]已證明BBO算法具有較佳的優(yōu)化能力,因此被應(yīng)用到實(shí)際生活中的優(yōu)化問題,包括車間調(diào)度問題[10]、移動(dòng)機(jī)器人控制系統(tǒng)[11]、電力系統(tǒng)優(yōu)化[12]等.著名的沒有免費(fèi)午餐定理(NFL)證明沒有一個(gè)啟發(fā)式算法適合解決所有優(yōu)化問題[13],PSO較GA,具有將能獲得較優(yōu)解的所有粒子記憶下來,而GA隨著種群的改變會(huì)破壞之前的較優(yōu)解,PSO以更快速度收斂于最優(yōu)解的概率更大;BBO不僅能保留每次迭代最佳解,而且其擁有變異算子能增強(qiáng)搜索能力;GA作為進(jìn)化算法也具有突變算子,但是通常在整個(gè)種群中只有一個(gè)突變算子,而BBO增加了更多的可變性,每個(gè)種群擁有不同的突變常量.從理論出發(fā),綜合考量后,本文采用BBO優(yōu)化算法進(jìn)行特征優(yōu)化,并用對(duì)比實(shí)驗(yàn)驗(yàn)證,BBO優(yōu)化算法具有較強(qiáng)的魯棒性.
多層感知機(jī)(MLP)屬于前向神經(jīng)網(wǎng)絡(luò)(FNN)[14],它是神經(jīng)網(wǎng)絡(luò)中最著名和使用最廣泛的形式[15].因此本文提出基于BBO優(yōu)化算法的MLP圖像分類方法.MLP輸入數(shù)據(jù)為顏色矩和DRHOG的組合特征,DRHOG特征是基于傳統(tǒng)梯度直方圖的改進(jìn)特征,本文方法提供了一種較少特征向量來高效解決圖像分類的方法.
圖1為一個(gè)結(jié)構(gòu)為n-h-m的3層感知機(jī),包括輸入層、隱藏層、輸出層.輸入節(jié)點(diǎn)個(gè)數(shù)是n,隱藏節(jié)點(diǎn)個(gè)數(shù)為h,輸出節(jié)點(diǎn)個(gè)數(shù)為m,節(jié)點(diǎn)之間存在單向連接.MLP的輸出的計(jì)算流程如圖1所示.
1) 計(jì)算輸入的加權(quán)和.具體計(jì)算為(1)式,其中,n是輸入節(jié)點(diǎn)的數(shù)目,Wij是從輸入層第i節(jié)點(diǎn)到隱藏層第j節(jié)點(diǎn)的連接權(quán)重,θj是第j個(gè)隱含節(jié)點(diǎn)的偏置,Xi表示第i個(gè)輸入.
(1)
2) 計(jì)算隱藏節(jié)點(diǎn)的輸出數(shù)據(jù).每一隱藏節(jié)點(diǎn)輸出計(jì)算為
j=1,2,…,h.
(2)
(3)
k=1,2,…,m.
(4)
多層感知最重要的是連接權(quán)重和偏置.在上述方程中看出,權(quán)重和偏置影響最終輸出值.為了實(shí)際輸出更接近期望輸出,需尋找最佳的連接權(quán)重和偏置來訓(xùn)練多層感知機(jī).
2.1 顏色矩特征 顏色矩(CMs)能表達(dá)圖像的顏色信息,因此可提取圖像的CMs特征作為多層感知機(jī)的輸入數(shù)據(jù).CMs的提取步驟如下:
1) 提取色度、飽和度及亮度分量.將圖像轉(zhuǎn)換到符合人類視覺特征的HSV空間顏色模型,分別提取表示不同顏色的色度(hue)分量H、表示顏色的深淺的飽和度(saturation)分量S和表示顏色的明暗程度的亮度(value)分量V.
2) 對(duì)每個(gè)顏色分量求顏色矩.提取兩個(gè)矩,分別為均值(Mn)和標(biāo)準(zhǔn)方差(Sd).數(shù)學(xué)定義分別為(5)和(6)式,其中i∈H、S、V,表示任一通道.Ii,j表示圖像第i顏色通道中第j像素點(diǎn)的值,N是像素總個(gè)數(shù).
(5)
(6)
3) 組合矩.圖像顏色分量選取H、S和V,共3個(gè)顏色分量,每個(gè)分量有2個(gè)顏色矩,線性組合6個(gè)矩,得到對(duì)應(yīng)圖像的一個(gè)6維顏色矩特征.
2.2 降維梯度方向直方圖特征 梯度方向直方圖(HOG)[16]算法可提取圖像形狀特征,使用文獻(xiàn)[17]中簡(jiǎn)化了分單元的細(xì)節(jié)的IHOG特征提取算法,并在此基礎(chǔ)上使用主成分分析的方法降維,使維數(shù)約減到最佳維度,此方法記為降維梯度方向直方圖(DHOG),操作步驟如圖2.
1) 計(jì)算梯度.像素點(diǎn)(x,y)水平方向的梯度Gh(x,y)、垂直方向的梯度Gv(x,y)分別用(7)和(8)式計(jì)算:
Gh(x,y)=f(x+1,y)-f(x-1,y)?x,y,
(7)Gv(x,y)=f(x,y+1)-f(x,y-1)?x,y,
(8)
像素點(diǎn)(x,y)的梯度值及梯度方向θ(x,y)分別用(9)和(10)式計(jì)算:
(9)
(10)
2) 分塊.將分辨率為m*n像素的圖像分為3×3塊,分塊時(shí)讓相鄰的區(qū)域有部分重疊,可使圖像特征向量包含盡量多的信息.通過行步長(zhǎng)?m/(3+1)」、列步長(zhǎng)?n/(3+1)」,嚴(yán)格控制重疊塊區(qū)域,使重疊部分大小為原區(qū)域的一半.圖3為區(qū)域分塊示意圖.單元C1,C2,C5,C6組成塊B1;單元C5,C6,C9,C10組成塊B4;C5、C6為重疊區(qū)域.
3) 計(jì)算梯度直方圖.對(duì)9個(gè)小塊分別計(jì)算梯度直方圖.首先每小塊梯度方向范圍取0°~180°,然后將其均分為9個(gè)方向角度,即0°~20°、21°~40°、
41°~60°等,最后結(jié)合式(9)、(10)計(jì)算出的結(jié)果分別統(tǒng)計(jì)在這9個(gè)方向角度的梯度值總和.
4) 歸一化特征向量.對(duì)每一塊的梯度直方圖進(jìn)行歸一化能使特征向量空間對(duì)光照,陰影和邊緣變化具有魯棒性,選取L1-norm范式作為歸一化函數(shù),即式(11).其中,ν表示未歸一化的特征向量,‖ν‖1為1-norm,ε為常數(shù),為保證分母不為0,取值為0.01.
ν→ν/(‖ν‖1+ε).
(11)
5) 組合特征向量.將9塊歸一化后的特征向量線性組合,合成一個(gè)81維的特征向量.
6) 降維.為進(jìn)一步獲取步驟5)得到的特征向量的有效特征,利用主成分分析方法進(jìn)行降維處理,選取得分率(方差貢獻(xiàn)率)在89%以上的特征,得到最后降維梯度方向直方圖.
3.1 BBO算法基礎(chǔ) BBO的數(shù)學(xué)模型描述了物種種類在不同的棲息地遷入和遷出情況.圖4所示為簡(jiǎn)單的物種遷移模型,在實(shí)際問題中則更復(fù)雜.橫坐標(biāo)代表物種種類,縱坐標(biāo)代表比率.當(dāng)物種種類為0時(shí),遷入率λ最大,遷出率為0;S1遷入率大于遷出率,S2的遷入率低于遷出率.S1遷入率比S2的高,而遷出率比S2的低;當(dāng)物種種類達(dá)到飽和的情況,遷出率最高,遷入率為0.當(dāng)物種種類為S0時(shí),遷入率等于遷出率,物種數(shù)量達(dá)到平衡狀態(tài),此時(shí)如出現(xiàn)突發(fā)疾病、貪婪捕食、自然災(zāi)害等情況,就需要花費(fèi)較長(zhǎng)時(shí)間恢復(fù)物種數(shù)量的平衡.
生物種群生活在不同的棲息地(Habitat),每個(gè)棲息地對(duì)應(yīng)不同的棲息地適宜性指數(shù)(HSI).HSI越高,越適合物種居住.棲息地隨著時(shí)間推移的規(guī)則為:居住在高HSI的種群,隨著時(shí)間的推移此棲息慢慢地達(dá)到飽和,種群會(huì)遷出到低HSI的棲息地;低HSI的棲息地更容易吸引從高HSI棲息地遷出的種群;高HSI和低HSI的棲息地都可能面臨一些突發(fā)情況,從而改變現(xiàn)有棲息地環(huán)境.BBO算法流程圖如圖5所示.
1) 生成初始棲息地.設(shè)定棲息地?cái)?shù)量,棲息地內(nèi)移民的最大容量,遷入率、遷出率函數(shù)的最大值I和E,最大的變異率mmax.
2) 計(jì)算所有棲息地的HSI.HIS按訓(xùn)練樣本的均方誤差(MSE)(12)式進(jìn)行計(jì)算,即第i個(gè)棲息地的HIS值為(13)式計(jì)算所得.計(jì)算過后按HSI從高到低對(duì)棲息地排序.
(12)
HSI(Habitati)=E(Habitati),
(13)
輸出.
3) 更新每個(gè)棲息地的遷入率、遷出率、變異率.遷出率(μk)和遷入率(λk)數(shù)學(xué)定義為(14)、(15)式.N是棲息地上允許的最大移民數(shù),n是棲息地上當(dāng)前的移民數(shù),E是最大的遷出率,I是最大的遷入率.
(14)
(15)
變異算子能保證棲息地盡可能呈現(xiàn)多樣化的狀態(tài),從而增加搜索機(jī)會(huì).數(shù)學(xué)定義為(16)式,其中M是由用戶自定義的變異初始值,pn是第n個(gè)棲息地的變異率,
pmax=arg max(pn),n=1,2,3,…,N.
(16)
4) 修改棲息地.根據(jù)每個(gè)棲息地的遷入率和遷出率,移民按照遷移策略修改棲息地,并且重新計(jì)算HSI.
5) 更新物種,進(jìn)行突變操作.執(zhí)行步驟4)后,要重新計(jì)算每個(gè)棲息地的種群數(shù)量,根據(jù)變異算子,對(duì)非精英棲息地進(jìn)行突變,并重新計(jì)算HSI.
6) 保留每次迭代最佳解.因突變會(huì)破壞較優(yōu)方案的棲息地特征,所以在算法的迭代過程中,保留部分群體精英個(gè)體,這樣能在HSI發(fā)生突變后,也能恢復(fù)到最佳解決方案.
7) 結(jié)果是否滿意.此步驟主要看是否滿足停止的條件,如不滿足,則重回到第(2)步驟,滿足條件則輸出迭代最優(yōu)解.
3.2 BBO訓(xùn)練MLP 學(xué)習(xí)的最終目的是訓(xùn)練1個(gè)多層感知機(jī),使它能夠識(shí)別測(cè)試集.
在學(xué)習(xí)階段最重要的是訓(xùn)練集,每個(gè)訓(xùn)練樣本應(yīng)參與計(jì)算每個(gè)棲息地的HSI.
BBO訓(xùn)練MLP流程為首先產(chǎn)生1組隨機(jī)MLP集作為棲息地,每個(gè)MLP對(duì)應(yīng)1個(gè)棲息地,每個(gè)權(quán)重和偏置對(duì)應(yīng)棲息地上的移民;由(12)式計(jì)算每個(gè)MLP的MSE;下一步是更新遷入率、遷出率和突變率;然后根據(jù)遷出率和遷入率重新選擇MLP;根據(jù)突變率對(duì)MLP進(jìn)行突變;具有較低MSE的解作為精英解保留;重復(fù)步驟,直到達(dá)到終止準(zhǔn)則.
圖6是BBO訓(xùn)練MLP的概念模型.
圖示的4個(gè)棲息地的HSI高低為:HSI(Habitat1) 從圖中可以看出,棲息地1具有最高的遷出率;棲息地4具有最高的遷入率,棲息地4接收來自棲息地1、棲息地2、棲息地3的移民,從而增加了權(quán)重和偏置;每一個(gè)棲息地都會(huì)發(fā)生突變. 4.1 實(shí)驗(yàn)設(shè)置 本文實(shí)驗(yàn)選用2個(gè)不同數(shù)量、類型的圖像庫,一個(gè)圖像庫為自制的水果圖像數(shù)據(jù)庫,定義為圖像庫1(如圖7(a));另一個(gè)圖像庫選用文獻(xiàn)[18]使用的部分Corel圖像,定義為圖像庫2(如圖7(b)).圖像庫1中的圖像種類為3類,包括蘋果、番茄和天草圖像,均為128*128*3像素,JPG格式.每類圖有50幅,一共有150幅圖像;圖像庫2中的圖像是選取Corel圖像庫的5類圖像,包括鮮花、馬、恐龍、海灘、大象,每類圖像有100幅,共500幅.實(shí)驗(yàn)過程中訓(xùn)練集和測(cè)試集的組成為:圖像庫1中每類圖像隨機(jī)抽取20幅作為訓(xùn)練集,有3類圖像,即一共選擇60幅作為訓(xùn)練集,剩下的90幅圖像作為測(cè)試集;圖像庫2中每類圖像隨機(jī)抽取30幅作為訓(xùn)練集,有5類圖像,即一共選擇150幅作為訓(xùn)練集,剩下的350幅圖像作為測(cè)試集. 由于沒有標(biāo)準(zhǔn)規(guī)則選擇隱藏節(jié)點(diǎn)的數(shù)量,因此本文使用公式: 來定義隱藏節(jié)點(diǎn)數(shù)量,其中N表示輸入數(shù)量,H表示隱藏節(jié)點(diǎn)數(shù)量. BBO算法中,每一個(gè)棲息地隨機(jī)初始化的范圍是[-10,10],步長(zhǎng)為0.1;每個(gè)棲息地的最大移民數(shù)是200;移民率范圍是[0,1];遷入率、遷出率最大值I和E均為1;為使變異率更切合實(shí)際,設(shè)置初始變異率為0,最大變異率為0.005;最大迭代次數(shù)為250次;精英棲息地設(shè)為保留2個(gè). 4.2 特征提取實(shí)驗(yàn) 分別對(duì)圖像庫1及圖像庫2進(jìn)行顏色矩特征、降維梯度方向直方圖特征提取.根據(jù)2.1節(jié)介紹的顏色矩特征方法,分別得到圖像庫1及圖像庫2的顏色矩特征.根據(jù)2.2節(jié)介紹的DRHOG特征提取方法,首先圖像庫1及圖像庫2中的每一幅圖像在第五步得到的特征向量為81維,然后進(jìn)行步驟六的主成分分析降維處理,把得到的150*81、500*81維特征向量通過線性變換轉(zhuǎn)成另一組不相關(guān)的變量,并使新的變量按照方差依次遞減的順序排列.數(shù)學(xué)變換保持變量的總方差不變,使第一變量具有最大的方差,稱第一主成分,第二變量的方差次大,并和第一變量不相關(guān),稱為第二主成分.依次類推,81個(gè)變量就有81個(gè)主成分.接下來確定要提取的主成分的數(shù)量,選取方差貢獻(xiàn)率在89%以上的特征.圖像庫1前10個(gè)主成分的方差貢獻(xiàn)率達(dá)到90.67%;圖像庫2前10個(gè)主成分的方差貢獻(xiàn)率達(dá)到89.51%,因此圖像庫1和圖像庫2的提取的主成分的數(shù)量均取10,由此得到每一幅圖像的DRHOG特征. 表1是原始HOG(文獻(xiàn)[16]使用的HOG方法)和DRHOG的對(duì)比數(shù)據(jù)表,特征維數(shù)表示對(duì)一幅圖像進(jìn)行相應(yīng)特征提前后得到的特征具有的維數(shù);時(shí)間表示一幅圖像進(jìn)行特征提取所耗時(shí)間. 表 1 原始HOG和DRHOG對(duì)比 表1所示DRHOG相比原始HOG特征,特征維數(shù)降低378倍,特征提取時(shí)間卻少0.1 s.DRHOG算法繼承了原始HOG描述子能描述圖像局部形狀信息、一定程度上抑制平移和旋轉(zhuǎn)影響等優(yōu)點(diǎn)的基礎(chǔ)上,簡(jiǎn)化了分單元的細(xì)節(jié),且利用主成分分析的方法降維,選取方差貢獻(xiàn)率在89%以上的特征,使得DRHOG具有用盡量少的維數(shù)表示盡量多的形狀信息的功能. 分別得到圖像庫1和圖像庫2的顏色矩和DRHOG特征后,線性組合這兩個(gè)特征,得到每幅圖像的一個(gè)16維組合特征,即有16個(gè)輸入節(jié)點(diǎn),采用的隱藏節(jié)點(diǎn)數(shù)量為33.圖像庫1的多層感知機(jī)結(jié)構(gòu)為16-33-3;圖像庫2的多層感知機(jī)結(jié)構(gòu)為16-33-5. 4.3 優(yōu)化實(shí)驗(yàn) 為驗(yàn)證BBO算法訓(xùn)練多層感知機(jī)(BBO_MLP)用作圖像分類的有效性,利用文獻(xiàn)[19]中的粒子群優(yōu)化算法訓(xùn)練多層感知機(jī)的方法(PSO_MLP)分別對(duì)圖像庫1和圖像庫2進(jìn)行對(duì)比實(shí)驗(yàn).實(shí)驗(yàn)結(jié)果如表2,分類準(zhǔn)確率代表10次平均分類準(zhǔn)確率.PSO初始參數(shù)中粒子數(shù)為200;最大迭代次數(shù)為250次;慣性權(quán)重取值0.3;社會(huì)學(xué)習(xí)因子和認(rèn)知學(xué)習(xí)因子均取值為1;采用全連接型拓?fù)浣Y(jié)構(gòu). 表 2 不同圖像數(shù)據(jù)庫分類準(zhǔn)確率比較 Table 2 The comparison of classification accuracy in different image databases % 迭代次數(shù)圖像庫1分類準(zhǔn)確率BBO_MLP PSO_MLP圖像庫2分類準(zhǔn)確率BBO_MLP PSO_MLP1051.3341.3319.8017.402062.0048.6730.8024.203076.0064.6740.6037.0050100.0085.3364.2051.20100100.0085.3377.4065.80250100.0085.3384.2065.80 從表2數(shù)據(jù)可知,對(duì)于圖像庫1,迭代次數(shù)為10時(shí),BBO_MLP的分類準(zhǔn)確率為51.33%,PSO_MLP的分類準(zhǔn)確率為41.33%.迭代次數(shù)為20時(shí),BBO_MLP的分類準(zhǔn)確率為62.00%,PSO_MLP的分類準(zhǔn)確率為48.67%.隨時(shí)迭代次數(shù)的增加,BBO_MLP和PSO_MLP的分類準(zhǔn)確率逐步上升高或趨于穩(wěn)定.當(dāng)?shù)螖?shù)到達(dá)250的時(shí)候,BBO_MLP和PSO_MLP的分類準(zhǔn)確率達(dá)到較高精度,幾乎能夠?qū)D像庫1的圖像進(jìn)行精確分類.對(duì)圖像庫2,橫向來看,相同迭代次數(shù)下BBO_MLP分類準(zhǔn)確率稍高于PSO_MLP的分類準(zhǔn)確率,如迭代次數(shù)為20時(shí),BBO_MLP的分類準(zhǔn)確率為30.80%,PSO_MLP的分類準(zhǔn)確率為24.20%.縱向上來看,隨時(shí)迭代次數(shù)的增加,BBO_MLP和PSO_MLP的分類準(zhǔn)確率都呈現(xiàn)上升趨勢(shì).如BBO_MLP方法下,迭代次數(shù)100的分類準(zhǔn)確率為77.40%,迭代次數(shù)250的分類準(zhǔn)確率為84.20%. 4.4 優(yōu)化實(shí)驗(yàn)結(jié)果分析 圖像庫1和圖像庫2的結(jié)果存在差異的原因如下. 1) 測(cè)試圖像規(guī)模不同.圖像庫1的測(cè)試圖像一共150幅,而圖像庫2的測(cè)試圖像有500幅. 2) 測(cè)試圖像類別數(shù)量不同.圖像庫1的測(cè)試圖像類別為3類,圖像庫2有5個(gè)類別. 3) 圖像內(nèi)容不同.圖像庫1種類為蘋果、番茄和天草,本文使用顏色矩和DRHOG特征作為MLP的輸入數(shù)據(jù),而這3類圖像最顯著的特征就是顏色不一致,形狀差異相對(duì)較小,因此使用顏色矩和DRHOG特征用作圖像庫1的BBO_MLP、PSO_MLP分類準(zhǔn)確率相對(duì)較高;圖像庫2種類為鮮花、馬、恐龍、海灘、大象,圖像內(nèi)容相對(duì)較復(fù)雜,具有類內(nèi)顏色多變,類間顏色相似,顏色特征差異較圖像庫1小,而形狀特征也受背景差異、前景個(gè)數(shù)不一致的影響使形狀特征差異表現(xiàn)不顯著.因此整體上來看,相同迭代次數(shù)下圖像庫的分類率圖像庫1高于圖像庫2. BBO_MLP和PSO_MLP方法對(duì)同一圖像庫分類準(zhǔn)確率不同,主要原因是BBO優(yōu)化算法的收斂速度優(yōu)于PSO優(yōu)化算法.圖8為圖像庫1和圖像庫2的收斂曲線.由圖8可知,不管是圖像庫1還是圖像庫2,BBO優(yōu)化算法的收斂速度較PSO優(yōu)化算法快. 除了BBO_MLP收斂速度比PSO_MLP快之外,BBO_MLP方法計(jì)算復(fù)雜度較PSO_MLP方法小,BBO_MLP方法一次迭代平均運(yùn)行時(shí)間為1.34 s,而PSO_MLP方法一次迭代平均運(yùn)行時(shí)間為1.45 s. BBO算法是一個(gè)具有高收斂速度、較低計(jì)算復(fù)雜度、能避免局部極小的優(yōu)化算法.由于它具有遷移和突變策略,所以能避免局部極小問題.PSO算法高度依賴于初始種群的分布,主要依靠是群體成員之間的吸引力來運(yùn)動(dòng).如果許多粒子陷入局部最優(yōu),算法不能防止其他粒子也被吸引到局部最優(yōu)位置,因此大部分粒子都被困在同一局部最優(yōu).BBO算法相比PSO算法具有更多的隨機(jī)性,可根據(jù)突變策略不停的探索全局最優(yōu)解,避免局部最小值問題,可解決復(fù)雜數(shù)據(jù)集的優(yōu)化問題. 本文提出了面向圖像分類的多層感知機(jī)BBO優(yōu)化方法,能對(duì)不同種類的圖像進(jìn)行分類識(shí)別.在特征提取部分,采用顏色矩和DRHOG的組合特征,使得分類依據(jù)相對(duì)充分.在特征優(yōu)化部分,通過采用BBO優(yōu)化算法解決了MLP的連接權(quán)重和偏置的優(yōu)化問題.為驗(yàn)證BBO優(yōu)化算法優(yōu)于其他優(yōu)化算法,采用了PSO優(yōu)化算法進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)表明BBO優(yōu)化算法的收斂速度優(yōu)于PSO優(yōu)化算法,BBO優(yōu)化算法訓(xùn)練MLP的計(jì)算復(fù)雜度低于PSO優(yōu)化算法.實(shí)驗(yàn)采用2個(gè)不同數(shù)量規(guī)模、不同區(qū)分內(nèi)容的圖像庫進(jìn)行對(duì)比分析,驗(yàn)證了基于BBO優(yōu)化的多層感知機(jī)分類方法的有效性.由于實(shí)驗(yàn)圖像庫1和圖像庫2的差異,實(shí)驗(yàn)采用的顏色矩和DRHOG特征并不能滿足相對(duì)較復(fù)雜圖像庫2的分類識(shí)別需要,下一步將在此基礎(chǔ)上,針對(duì)多種類多容量的大數(shù)據(jù)集圖像庫進(jìn)行特征提取研究,采取適合的特征向量作為MLP的輸入數(shù)據(jù),進(jìn)行BBO-MLP分類識(shí)別. 致謝 四川師范大學(xué)優(yōu)秀論文培育基金(校研字[2014]7號(hào)28)對(duì)本文給予了資助,謹(jǐn)致謝意. [1] Dalal N, Triggs B. Histograms of oriented gradients for human detection[C]//IEEE Computer Society:CVPR 2005.2005,1:886-893. [2] Ryu S J, Kirchner M, Lee M J, et al. Rotation invariant localization of duplicated image regions based on Zernike moments[J]. IEEE Transactions Information Forensics and Security,2013,8(8):1355-1370. [3] Reddy R, Reddy B E, Reddy E K. Classifying similarity and defect fabric textures based on GLCM and binary pattern Schemes[J]. Inter J Infor Engin Electronic Business,2013,5(5):25-33. [4] Ojala T, Pietikainen M, Maenpaa T. Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[J]. IEEE Transactions Pattern Anal Machine Intelligence,2002,24(7):971-987. [5] 丁學(xué)東,劉淵,謝振平. 增量學(xué)習(xí)語義屬性的圖像內(nèi)容檢索系統(tǒng)增強(qiáng)[J]. 計(jì)算機(jī)應(yīng)用研究,2014,31(1):273-276. [6] 張俊才,張靜. 使用粒子群算法進(jìn)行特征選擇及對(duì)支持向量機(jī)參數(shù)的優(yōu)化[J]. 微電子學(xué)與計(jì)算機(jī),2012,29(7):138-141. [7] 靳玉萍,李保霖. 基于遺傳優(yōu)化徑向基概率神經(jīng)網(wǎng)絡(luò)的巖性識(shí)別應(yīng)用[J]. 計(jì)算機(jī)應(yīng)用,2013,33(2):353-356. [8] Simon D. Biogeography-based optimization[J]. IEEE Transactions Evolutionary Computation,2008,12(6):702-713. [9] Ma H, Simon D. Biogeography-based optimization with blended migration for constrained optimization problems[C]//Proceedings of the 12th Annual Conference on Genetic and Evolutionary Computation.ACM,2010:417-418. [10] Rahmati S H A, Zandieh M. A new biogeography-based optimization (BBO) algorithm for the flexible job shop scheduling problem[J]. Inter J Advanc Manufact Technol,2012,58(9/10/11/12):1115-1129. [11] Lozovyy P, Thomas G, Simon D. Biogeography-based optimization for robot controller tuning[C]//Comput Model Simul Intell:Current State and Future Perspectives,2011:162-181. [12] Rarick R, Simon D, Villaseca F E, et al. Biogeography-based optimization and the solution of the power flow problem[C]//IEEE International Conference SMC 2009:1003-1008. [13] Ho Y C, Pepyne D L. Simple explanation of the no-free-lunch theorem and its implications[J]. J Optim Theory Appl,2002,115:549-570. [14] Choudhari C S, Jain V. An Optimum Decision Making in Cognitive Radio via Fuzzy Neural Network[J]. Inter J Engineer,2012,1(5):1-7. [15] Kruse R, Borgelt C, Klawonn F, et al. Multi-Layer Perceptrons[M]. London:Springer-Verlag,2013:47-81. [16] 葉林, 陳岳林, 林景亮. 基于 HOG 的行人快速檢測(cè)[J]. 計(jì)算機(jī)工程,2010,36(22):206-210. [17] 朱黎輝, 李曉寧, 張瑩, 蒲華秀, 吳純潔. 基于形狀特征及紋理特征的中藥材檢索方法[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2014(11):3903-3907. [18] Zhang Z, Gu X, Kung S. Color-frequency-orientation histogram based image retrieval[C]//IEEE International Acoustics,Speech and Signal Processing,2012:1321-1324. [19] Peterson L E. Covariance matrix self-adaptation evolution strategies and other metaheuristic techniques for neural adaptive learning[J]. Soft Computing,2011,15(8):1483-1495. (編輯 陶志寧) BBO Optimization Method for Image Classification Based on Multi-layer Perceptron ZHU Lihui, LI Xiaoning In order to improve the accuracy of image classification decisions with the MLP’s weight and bias optimization, a BBO method for image classification based on multi-layer perceptron is proposed by borrowing from the thought of biogeography based optimization. Firstly, The combination of image features color moment and dimension reduction histogram of oriented gradient is extracted, then put to multi-layer perceptron as input datas. Secondly, BBO method is used to obtain the optimal weights and bias in 250 iterative times. Lastly, the test image’s category is obtained with multi-layer perceptron.This method can avoid algorithm being premature convergence and enhance the capability of image classification. With simulation experiments, compared with the method of particle swarm optimization, the higher quality and efficiency of this method is verified. Furthermore, the feasible scheme for image classification is also provided . biogeography based optimization; multi-layer perceptron; color moments; dimension reduction histogram of oriented gradient; particle swarm optimization 2014-09-03 四川省應(yīng)用基礎(chǔ)計(jì)劃(2013JY0086)和四川省科技創(chuàng)新苗子工程基金(20132033) TP391 A 1001-8395(2015)06-0930-08 10.3969/j.issn.1001-8395.2015.06.026 *通信作者簡(jiǎn)介:李曉寧(1972—),男,副教授,主要從事圖像處理和模式識(shí)別的研究,E-mail:lxn@sicnu.edu.cn4 實(shí)驗(yàn)與分析
5 結(jié)語
(CollegeofComputerScience,SichuanNormalUniversity,Chengdu610101,Sichuan)
四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2015年6期