胡全 王霓虹 邱兆文
摘要針對(duì)森林火場(chǎng)采用了新的顏色特征提取方法,融合圖像的顏色和紋理特征作為圖像的特征向量,并用支持向量機(jī)作為學(xué)習(xí)工具,充分利用已有森林火場(chǎng)的數(shù)據(jù)進(jìn)行學(xué)習(xí),提高森林火場(chǎng)的自動(dòng)識(shí)別的準(zhǔn)確率。結(jié)果表明,新的顏色特征提取方法適用于森林火場(chǎng)的識(shí)別,采用支持向量機(jī)融合多特征可成功用于森林火場(chǎng)的自動(dòng)識(shí)別。
關(guān)鍵詞森林火場(chǎng);特征提取;特征融合;支持向量機(jī)
中圖分類號(hào)S762;TP391文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào)0517-6611(2014)12-03688-02
基金項(xiàng)目“十二五”農(nóng)村領(lǐng)域國(guó)家科技計(jì)劃項(xiàng)目(2012AA102003-2);國(guó)家公益性行業(yè)專項(xiàng)(201104037)。
作者簡(jiǎn)介胡全(1979-),男,助理研究員,從事多媒體信息檢索和模式識(shí)別研究。*通訊作者,教授,博士生導(dǎo)師,從事模式識(shí)別和數(shù)字林業(yè)等研究。
森林火災(zāi)是一種破壞性極大的自然災(zāi)害,它對(duì)生態(tài)環(huán)境的影響極為惡劣,造成的損失巨大,因此,它越來越受到世界各國(guó)政府的重視。森林火災(zāi)中,初期火是較為容易撲滅的,且造成的損失較小,因此對(duì)于火場(chǎng)的實(shí)時(shí)監(jiān)控并快速地發(fā)現(xiàn)火情、識(shí)別火場(chǎng)就成為研究的重點(diǎn)之一[1]。為此,筆者采用新的顏色特征提取方法,融合圖像的顏色和紋理特征作為圖像的特征向量,以支持向量機(jī)對(duì)大小興安嶺已發(fā)生火災(zāi)的圖像進(jìn)行學(xué)習(xí),從而實(shí)現(xiàn)對(duì)森林火場(chǎng)的識(shí)別。
1 森林火場(chǎng)圖像的多特征提取和融合
顏色是圖像的一個(gè)顯著的物理特征,顏色特征相對(duì)于幾何形狀特征而言,對(duì)平移、旋轉(zhuǎn)、縮放等變換具有不變性,易于計(jì)算且表現(xiàn)出相當(dāng)強(qiáng)的魯棒性。顏色直方圖表征了圖像色彩頻率分布,但丟失了色彩的空間信息,而紋理特征可很好地描述色彩的空間信息。針對(duì)森林火場(chǎng)產(chǎn)生的顏色和煙霧,選取了森林火場(chǎng)的顏色特征和紋理特征進(jìn)行融合[2]。
1.1顏色特征的提取在HSV空間中,H從0°到360°變化時(shí),色調(diào)依次呈現(xiàn)為紅、橙、黃、綠、青、藍(lán)、紫,而且每一種色調(diào)對(duì)應(yīng)的H分量的區(qū)域不均勻。根據(jù)森林火場(chǎng)火焰和煙霧的顏色分布和視覺對(duì)顏色的心理感覺,將H分量分為不等間隔的7份。當(dāng)V足夠小(V<0.15)時(shí),視覺感知的顏色基本上接近黑色,可以忽略H的影響,僅需一個(gè)量化值就可以表示。當(dāng)S足夠?。⊿<0.1)時(shí),視覺感知的顏色基本上接近灰度圖像,可以忽略H的影響,僅需4個(gè)量化值就可以表示。將H、S、V 3個(gè)分量進(jìn)行非均勻量化,把色調(diào)H分成7份,飽和度S分成2份,亮度V分成1份,并根據(jù)色彩的不同范圍進(jìn)行量化,量化后的色調(diào)、飽和度和亮度值分別為H、S、V,見式(1)。
1.2 紋理特征的提取在對(duì)森林火場(chǎng)煙霧進(jìn)行紋理特征提取時(shí),利用灰度共生矩陣法來提取紋理特征[3]。選取表示紋理特征的4個(gè)統(tǒng)計(jì)量:對(duì)比度(contrast)、 紋理的一致性(uniformity)、像素對(duì)灰度的相關(guān)性(correlation) 和熵2支持向量機(jī)的建立
2.1最優(yōu)分類面及核函數(shù)的構(gòu)建選擇SVM作為學(xué)習(xí)機(jī)器[5],SVM是統(tǒng)計(jì)學(xué)習(xí)理論中最年輕的部分,在解決小樣本、非線性及高維模式識(shí)別問題中表現(xiàn)出很多特有的優(yōu)勢(shì)。SVM是從線性可分情況下的最優(yōu)分類面發(fā)展而來的,其基本思想是通過在原始空間或投影后的高維空間中構(gòu)造最優(yōu)分類面,進(jìn)行兩類分類[6]。
對(duì)于給定的兩類可分性訓(xùn)練樣本集合(xi,yi)1≤i≤l,其中xi∈Rn,yi∈{-1,+1}。yi是向量xi的類別標(biāo)簽。要找一個(gè)分類規(guī)則I(x),使它能對(duì)未知類別的新樣本作盡可能正確的劃分。
在訓(xùn)練集線性可分情形時(shí),SVM就是要構(gòu)造一個(gè)最優(yōu)超平面(w,x)+b=0,這個(gè)超平面既要滿足yi(w·xi+b)-1≥0,(i=1,K…,l),同時(shí)還要使函數(shù)φ(w)=12‖w‖2=12(w∶w)取得最小值。
通過求解最優(yōu)化問題可得最優(yōu)超平面∑svyia*i(x·xi)+b*=0,其中SV表示支持向量,ai*是拉格朗日乘子。
在訓(xùn)練集線性不可分時(shí),引進(jìn)松弛因子ξi≥0及懲罰參數(shù)C。這時(shí)需要做的是在約束yi(w·xi+b)≥1-ξi(i=1,…,l)下最小化函數(shù)φ(ξ)=12‖w‖2+C∑li=1ξi。類似可得最優(yōu)超平面, 最優(yōu)分類函數(shù)只要取I(x)=sgn{∑svyia*i(x·xi)+b*}即可。
在低維空間中向量集往往難于劃分,通過映射將向量集映射到高維空間,使其可分,但隨之會(huì)帶來“維數(shù)災(zāi)難”問題。SVM通過引入核函數(shù)巧妙地解決了這個(gè)問題。注意到上面的最優(yōu)分類函數(shù)中只涉及樣本特征向量的點(diǎn)積,就可以用核函數(shù)K(x,y) 代替原來的點(diǎn)積(x,y)。若函數(shù)K(x,y)滿足Mercer條件,則K(x,y)=(x)·(y),其中表示某個(gè)映射(未必知其具體表達(dá)式)常用的核函數(shù),有多項(xiàng)式核函數(shù)K(x,y)=[(x·y)+s]d、徑向基函數(shù)K(x,y)=exp(-σ‖x-y‖2)、Sigmoid函數(shù)K(x,y)=tanh[k(x·y)-μ]等等。適當(dāng)選取一個(gè)核函數(shù)后,就可得到對(duì)應(yīng)高維空間的最優(yōu)分類函數(shù)f(x)=sgn{∑ni=1a*iyiK(xi,x)+b*}[6]。
2.2建立基于支持向量機(jī)的分類器為每一類圖像建立一個(gè)分類器,圖像的組合特征(36維)作為支持向量機(jī)的輸入向量,對(duì)圖像類進(jìn)行學(xué)習(xí),選取了地表火、樹冠火、地下火等50個(gè)圖像類,共計(jì)12 000幅圖像。試驗(yàn)數(shù)據(jù)全部選自伊春林管局火災(zāi)圖像庫。對(duì)每類圖像,每次從12 000幅圖像中先隨機(jī)抽取50個(gè)正例、450個(gè)反例,形成一個(gè)500幅圖像的小規(guī)模的樣本訓(xùn)練集進(jìn)行訓(xùn)練得到一個(gè)初始的分類器,從12 000幅圖像中先隨機(jī)抽取150個(gè)正例、1 850個(gè)反例,形成一個(gè)2 000幅圖像的大規(guī)模的樣本訓(xùn)練集。用初始的分類器對(duì)大規(guī)模訓(xùn)練集進(jìn)行修剪,修剪后得到一個(gè)規(guī)模很小的約減集,再用這個(gè)約減集進(jìn)行訓(xùn)練得到最終的分類器。
2.3火場(chǎng)圖像語義標(biāo)注①對(duì)目標(biāo)圖像I進(jìn)行預(yù)處理,提取目標(biāo)圖像的顏色、紋理和形狀共36維特征,構(gòu)成圖像的特征向量V;②將特征向量V提交給分類器樹T;③按廣度優(yōu)先策略遍歷分類器樹T中的每一個(gè)節(jié)點(diǎn),若當(dāng)前節(jié)點(diǎn)對(duì)應(yīng)的分類器返回的值為1,則將當(dāng)前節(jié)點(diǎn)對(duì)應(yīng)的分類器的語義信息賦給待分類圖像I,并實(shí)現(xiàn)圖像語義的自動(dòng)標(biāo)注,停止對(duì)分類器樹T 的遍歷;若當(dāng)前節(jié)點(diǎn)對(duì)應(yīng)的分類器返回的值為0,繼續(xù)按廣度優(yōu)先策略遍歷分類器樹T。④若分類器樹T中的所有節(jié)點(diǎn)對(duì)應(yīng)的分類器返回的值全部為0,則圖像的語義自動(dòng)標(biāo)注失敗,將這樣的圖像統(tǒng)一歸類,等待人工處理。
3實(shí)例分析
3.1圖像選取試驗(yàn)中的圖像均選自伊春林管局火災(zāi)圖像庫。
試驗(yàn)1選取地表火、樹冠火、地下火等50個(gè)圖像類。從每類圖像中抽取200幅正例,以8∶7的比例分配給訓(xùn)練集和測(cè)試集。不同類別的圖像互相作為反例加入訓(xùn)練集中。訓(xùn)練集的反例還包括1 000幅除此50類圖像以外的其他類圖像。測(cè)試集一共5 000幅,其中除了50類待分類圖像外,還包括其他類圖像。試驗(yàn)中,核函數(shù)選取高斯核,其中σ=2,懲罰參數(shù)C=500。將只采用顏色特征分類和融合多特征分類進(jìn)行了對(duì)比試驗(yàn)。
試驗(yàn)2中,采用已建好的分類器,從初期火焰、地表小煙霧、地表大煙霧、樹冠火和中期火焰等5個(gè)圖像類中各隨機(jī)抽取50幅圖像進(jìn)行測(cè)試,進(jìn)行圖像語義自動(dòng)標(biāo)注試驗(yàn)。
3.2試驗(yàn)環(huán)境 在服務(wù)器HP ProLiant DL380p Gen8上,采用Visual C++.NET 語言,SQL Server 2008為數(shù)據(jù)庫,Windows 2008 Server為平臺(tái)完成了一個(gè)圖像檢索系統(tǒng),來實(shí)現(xiàn)森林火場(chǎng)圖像語義的自動(dòng)標(biāo)注。
3.3結(jié)果與分析 試驗(yàn)1中,采用顏色特征設(shè)計(jì)的分類器進(jìn)行森林火場(chǎng)圖像語義自動(dòng)標(biāo)注的平均正確率為69.3%,融合顏色和紋理特征設(shè)計(jì)的分類器進(jìn)行森林火場(chǎng)圖像語義自動(dòng)標(biāo)注的平均正確率為73.8%,融合多特征較采用單一特征設(shè)計(jì)的分類器分類的正確率提高了4.5%。
試驗(yàn)2中,采用融合多特征和基于支持向量機(jī)構(gòu)造的分類器進(jìn)行森林火場(chǎng)圖像語義的自動(dòng)標(biāo)注,平均正確率為69.4%。
4 結(jié)論
基于HSV空間的18色非均勻量化算法,特征維數(shù)少,計(jì)算量小,檢索效果較好;融合多特征可彌補(bǔ)單一特征的不足,提高森林火場(chǎng)識(shí)別的準(zhǔn)確率;采用支持向量機(jī)作為學(xué)習(xí)機(jī)器融合圖像多特征實(shí)現(xiàn)森林火場(chǎng)圖像語義的標(biāo)注是可行的,采用此方法可以較為快速地實(shí)現(xiàn)對(duì)森林火場(chǎng)的識(shí)別。
參考文獻(xiàn)
[1] 吳雪瓊,覃先林.我國(guó)林火監(jiān)測(cè)體系現(xiàn)狀分析[J].森林防火,2010(3):69-72.
[2] MA Y D,LIU L.Pulsecoupled neural networks and oneclass support vector machines[J].Image and Vision Computing,2010,28:1524-1529.