王東霞,周觀民
(濟(jì)源職業(yè)技術(shù)學(xué)院 信息工程系,河南 濟(jì)源 459000)
遺傳算法優(yōu)化特征權(quán)值的支持向量機(jī)圖像分類
王東霞,周觀民
(濟(jì)源職業(yè)技術(shù)學(xué)院 信息工程系,河南 濟(jì)源 459000)
為了提高圖像分類的準(zhǔn)確率,提出了一種遺傳算法優(yōu)化特征權(quán)值的支持向量機(jī)圖像分類(GA-SVM)。首先分別提取圖像的顏色和紋理特征,然后采用改進(jìn)遺傳算法確定特征權(quán)值,最后采用支持向量機(jī)建立圖像分類器,并對corel圖像庫進(jìn)行仿真測試。結(jié)果表明,相對于其他圖像分類算法,GA-SVM提高了圖像分類精度。
圖像分類;特征加權(quán);支持向量機(jī);遺傳算法
隨著圖像處理技術(shù)和互聯(lián)網(wǎng)技術(shù)迅速發(fā)展,圖像數(shù)據(jù)日益增多,如何對這些圖像進(jìn)行分類,幫助用戶找到自己感興趣的圖像,顯得越發(fā)重要。圖像分類是圖像檢索的基礎(chǔ),受到多種因素綜合影響,圖像分類精確率有待進(jìn)一步提高[1]。
圖像分類實(shí)際上是一個(gè)模式識別問題,其分類結(jié)果優(yōu)劣與特征選擇和分類器構(gòu)建密切相關(guān)。傳統(tǒng)方法主要采用單一顏色或紋理特征對圖像進(jìn)行建模和分類,但是不同圖像對于顏色和紋理的敏感度不同,單純依靠單一的特征對復(fù)雜多變的圖像進(jìn)行分類達(dá)不到好的效果。比如,海底世界和海灘、花朵和落日,其類與類之間都有極其相似的顏色特征,故只通過顏色特征來分類則效果必然不佳,單一特征從一個(gè)角度對圖像類別信息進(jìn)行描述,難以全面、準(zhǔn)確地描述圖像類別信息,無法保證識別的正確性,識別精度低[2]。為了克服單一特征不足,一些學(xué)者基于組合優(yōu)化原理,提出特征融合的圖像分類算法,使圖像的分類正確率得以提高[3]。在當(dāng)前組合特征圖像分類中,每一維的權(quán)重都默認(rèn)為1,即認(rèn)為所有特征對分類結(jié)果貢獻(xiàn)相同,這與實(shí)際情況不相符[4]。當(dāng)前圖像分類器主要采用神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等進(jìn)行構(gòu)建[5-7],神經(jīng)網(wǎng)絡(luò)均基于“大樣本”定理,在滿足大樣本條件下,具有較好的分類結(jié)果,當(dāng)圖像數(shù)量樣本有限時(shí),易陷入局部極值和過擬合等缺陷,分類正確率難以滿足圖像實(shí)際分類應(yīng)用的要求。支持向量機(jī)(Support Vector Machine Classifier,SVM)基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,較好地克服了神經(jīng)網(wǎng)絡(luò)的過擬合等缺陷,在圖像分類中得到了廣泛的應(yīng)用[8]。
為了提高圖像分類的準(zhǔn)確率,提出了一種遺傳算法優(yōu)化特征權(quán)值的支持向量機(jī)圖像分類(GA-SVM)。首先分別提取圖像的顏色和紋理特征,然后采用改進(jìn)遺傳算法確定特征權(quán)值,最后采用支持向量機(jī)建立圖像分類器,并對corel圖像庫進(jìn)行仿真測試。結(jié)果表明,相對于其他圖像分類算法,GA-SVM提高了圖像分類精度。
GA-SVM的圖像分類基本思想為:首先分別提取圖像的顏色和紋理特征,然后采用遺傳算法得到最優(yōu)分類權(quán)值向量解,并利用該最優(yōu)權(quán)值對圖像各個(gè)特征進(jìn)行加權(quán),最后用加權(quán)支持向量機(jī)建立圖像分類器。具體如圖1所示。
圖1 圖像分類算法的工作流程
2.1 顏色特征
對于一幅圖像,直方圖和矩陣特征難以描述其類別關(guān)系,這主要由于它們沒有考慮各個(gè)顏色分布的結(jié)構(gòu)特性,因此本文選擇用顏色聚合向量來表達(dá)圖像的顏色特征[9]。其表達(dá)式為:<(?1,β1),(?2,β2),...(?N,βN)>,其中 βi為非聚合像素的數(shù)目,?i為第i個(gè)bin的聚合像素的數(shù)目[10]。
2.2 Gabor紋理特征
Gabor濾波器函數(shù)可以表示為
各個(gè)濾波器的方差可以表示為
通過Gabor濾波,可以找到一個(gè)40維的Gabor紋理特征向量:(μ11,σ11,μ12,σ12,...,μ45,σ45)。
2.3 特征歸一化
由于特征數(shù)量綱量不一致,容易對分類效率產(chǎn)生不利影響,為了解決該難題,將提取的特征進(jìn)行歸一化處理,具體方式如下[11-12]。
提取的顏色和紋理特征如圖2所示,從圖2可知,不同類圖像的顏色和紋理特征差異大,因此,根據(jù)該差異對圖像進(jìn)行分類。
圖2 十類圖像的特征分布
2.4 遺傳算法確定特征權(quán)值
傳統(tǒng)圖像分類算法認(rèn)為各個(gè)特征對分類效果的貢獻(xiàn)一樣,但實(shí)踐證明,對于不同類型的圖像,起決定性因素的分類特征是不一樣的。鑒于此,采用遺傳算法對圖像特征進(jìn)行加權(quán),考慮各個(gè)特征對圖像分類效果的不同貢獻(xiàn),為貢獻(xiàn)大的特征在分類中分配更大的權(quán)值,貢獻(xiàn)小的特征分配較小的權(quán)值,然后結(jié)合多種特征共同對圖像進(jìn)行分類。
1)收集圖像數(shù)據(jù),并對圖像預(yù)處理,消除圖像中的噪聲。
2)分別提取圖像的紋理、顏色特征,并轉(zhuǎn)化為相應(yīng)的特征向量,同時(shí)對特征進(jìn)行歸一化處理。
3)隨機(jī)初始化種群,每個(gè)個(gè)體對應(yīng)一組特征權(quán)值。
4)根據(jù)特征值建立學(xué)習(xí)樣本,輸入到支持向量機(jī)中學(xué)習(xí),計(jì)算每一組權(quán)值相對應(yīng)的檢索結(jié)果。
5)對個(gè)體進(jìn)行選擇、交叉和突異操作,產(chǎn)生新一代種群。
6)如果達(dá)到最大迭代次數(shù),則結(jié)束權(quán)值尋優(yōu),否則跳轉(zhuǎn)到步驟4)繼續(xù)執(zhí)行。
7)將最優(yōu)個(gè)體進(jìn)行解碼,得到特征的最優(yōu)權(quán)值。
具體流程如圖3所示。
圖3 遺傳算法優(yōu)化特征權(quán)值的流程
設(shè)訓(xùn)練集的樣本數(shù)為n,那么訓(xùn)練集可以表示為:xi,yi,1<i<n,其中,xi∈Rm,yi∈R ,m表示訓(xùn)練集輸入?yún)?shù)的準(zhǔn)度,xi為一個(gè)m維的向量,yi表示訓(xùn)練集輸出結(jié)果,為一個(gè)實(shí)數(shù)。SVM通過非線性映射函數(shù)φ(x)將輸入樣本映射到高維特征空間F,并在F中進(jìn)行線性估計(jì),SVM在高維特征空間中的估計(jì)函數(shù)為
式中:w和b分別為估計(jì)函數(shù)的權(quán)值向量及偏移量。
根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,式(6)可轉(zhuǎn)化為如下優(yōu)化問題,即
式中:‖w ‖是與函數(shù) f復(fù)雜度相關(guān)的項(xiàng);ε為不敏感損失系數(shù);ξi,表示松弛因子;C表示懲罰因子。
引入拉格朗日乘子,優(yōu)化問題變?yōu)橥苟蝺?yōu)化問題
式中:αi和表示拉格朗日乘子。
為了加快求解速度,將式(6)轉(zhuǎn)成對偶形式,即有
相應(yīng)的約束條件為
采用核函數(shù)K(xi,x)代替高維空間中的向量內(nèi)積(φ(xi),φ(x)),避免維數(shù)災(zāi)難,則SVM的分類決策函數(shù)為
由于RBF函數(shù)待優(yōu)化參數(shù)少,因此選擇其建立SVM分類函數(shù),因此有
式中,σ為RBF核函數(shù)寬度。
SVM是二分類器,而圖像分類是一種多分類問題,必須構(gòu)造多分類器才能進(jìn)行圖像自動分類,采用一種“一對多”方式進(jìn)行構(gòu)建,具體如圖4所示。
4.1 數(shù)據(jù)來源
為了驗(yàn)證GA-SVM的圖像分類性能,在Intel 2.8 GHz CPU,2 Gbyte RAM,Windows 7的計(jì)算機(jī)平臺,采用VC++進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)圖像來自corel公司發(fā)布的權(quán)威圖像數(shù)據(jù)庫,共包含有10類圖像,它們分別為非洲、蝴蝶、建筑、汽車、恐龍、海底世界、花朵、駿馬、山峰和落日,每類圖像100幅,共1 000幅圖像,訓(xùn)練集每類50幅,測試集每類50幅,各類圖像如圖5所示。
圖4 圖像分類器的構(gòu)建
圖5 仿真實(shí)驗(yàn)用到的圖像
4.2 結(jié)果與分析
提取圖像的72維顏色聚合向量表征顏色特征和40維Gabor紋理向量表征紋理特征,根據(jù)遺傳算法得到權(quán)值,然后采用支持向量機(jī)進(jìn)行分類,并采用顏色特征、紋理特征分類、沒有加權(quán)組合特征的分類圖像結(jié)果進(jìn)行對比,結(jié)果見表1。
表1 不同算法在測試集的分類正確率%
從表1可以得到如下結(jié)論:
1)相比于單特征和不加權(quán)組合特征分類方法,GA-SVM能夠明顯提高分類系統(tǒng)的平均準(zhǔn)確性。并且利用遺傳算法自身特有的優(yōu)勢,為特征權(quán)值找到全局最優(yōu)解,提高了圖像分類準(zhǔn)確率。
2)對于建筑和山峰,這兩種圖像很容易造成錯(cuò)分,主要是由于兩者的灰色調(diào)相同,使得提取紋理特征十分相似,而且兩者都具有相似的外形,如都較挺拔堅(jiān)硬,如圖6所示。
圖6 容易被錯(cuò)分圖像
4.3 識別速度比較
測試顏色特征方法、紋理特征方法、沒有加權(quán)的組合特征方法以GA-SVM的識別速度,結(jié)果見圖7。從圖7可知,相較于其他算法,GA-SVM的識別效率得到大幅度提高,可以更好地滿足網(wǎng)絡(luò)圖像的在線檢索應(yīng)用。
圖7 各算法的識別速度對比
針對圖像分類的特征提取和分類器優(yōu)化問題,提出一種特征加權(quán)和支持向量機(jī)相融合的圖像分類模型。首先分別提取圖像的顏色和紋理特征,然后采用遺傳算法確定特征權(quán)值,最后采用支持向量機(jī)建立圖像分類器,并對corel圖像庫進(jìn)行仿真測試。仿真結(jié)果表明,GA-SVM提高了圖像分類的正確率,具有較高的分類速度,驗(yàn)證GA-SVM的有效性。
[1] SIMPSON J J,MCINTIR JT.A recurrent neural network classifi?er for improved retrievals of area extent of snow cover[J].IEEE Trans.Geosciences and Remote Sensing,2001,39:2135-2147.
[2]SMEULDERS A W M,WORRING M,SANTINI S,et al.Con?tent-based image retrieval at the end of the early years[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2000,22(12):1-32.
[3] 謝文蘭,石躍祥,肖平.應(yīng)用BP神經(jīng)網(wǎng)絡(luò)對圖像分類[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(2):163-166.
[4]付巖,王耀威,王偉強(qiáng),等.SVM用于基于內(nèi)容的圖像分類和檢索[J].計(jì)算機(jī)學(xué)報(bào),2003,26(10):1262-1265.
[5]朱飛,王興起.基于SIFT算法的體育類圖像分類與應(yīng)用研究[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(10):232-234.
[6] LU D,WENG Q.A survey of image classification methods and techniques for improving classification performance[J].Internation?al Journal of Remote Sensing,2007,28(5):823.
[7] CHEN Y X,WANG J Z.Image categorization by learning and reasoning with regions[J].Journal of Machine Learning Re?search,2004,5(8):913-939.
[8] ZHAO G,PIETIKAINEN M.Dynamic texture recognition using local binary patterns with an application to facial expressions[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2007,27(6):915-928.
[9]ZHANG B C,GAO Y S,ZHAO SQ,et al.Local derivative pat?tern versus local binary pattern:face recognition with high-order local pattern descriptor[J].IEEE Trans.Image Processing,2010,19(2):533-544.
[10] 劉麗,匡綱要.圖像紋理特征提取方法綜述[J].中國圖象圖形學(xué)報(bào),2009,14(4):623-635.
[11] JIANG Shuhong,HEN Bingfa.Method of image retrieval based on integrating low level feature with relevance feedback[J].Ma?chine Building and Automation,2009,38(3):51-53.
[12] 張剛,馬宗民.一種采用Gabor小波的紋理特征提取方法[J].中國圖象圖形學(xué)報(bào),2010,15(2):248-254.
Iam ges Classification Based on Genetic A lgorithm Optim izing Features W eight and Support Vector M achine
WANG Dongxia,ZHOU Guanmin
(Department of Information Engineering,Jiyuan Vocational and Technical College,Henan Jiyuan 459000,China)
In Order to improve the accuracy of the image classification,a support vector machine image classification (GA-SVM)is proposed based on genetic algorithm optimizing feature weight.Firstly,the color and texture of image are extracted.Then the feature weight are determined by the improved genetic algorithm.Finally,image classifier is established by support vector machine and the simulation test is carried out on core image library.The results show that the GA-SVM algorithm can improve the image classification accuracy compared to other image classification algorithm.
image classify;feature-weighted;support vector machine;genetic algorithm
TN911.73
A
10.16280/j.videoe.2015.02.020
王東霞(1970—),女,副教授,主研計(jì)算機(jī)應(yīng)用、圖像圖像處理、知識工程;
2014-04-21
河南省科技攻關(guān)項(xiàng)目(132102210229)
【本文獻(xiàn)信息】王東霞,周觀民.遺傳算法優(yōu)化特征權(quán)值的支持向量機(jī)圖像分類[J].電視技術(shù),2015,39(2).
周觀民(1964—),副教授,主研計(jì)算機(jī)應(yīng)用、圖像處理、網(wǎng)絡(luò)技術(shù)。
責(zé)任編輯:閆雯雯