摘要[目的]解決水稻害蟲傳統(tǒng)識(shí)別方法的低時(shí)效性問題。[方法]采用數(shù)字圖像處理方法對(duì)水稻害蟲進(jìn)行圖像識(shí)別和分類,對(duì)水稻害蟲的蟲體面積、蟲體周長(zhǎng)、偏心率、形狀參數(shù)、似圓度、葉狀性、球形性等幾何形狀特征進(jìn)行提取和研究,并采用支持向量機(jī)(SVM)分類器對(duì)水稻害蟲二化螟、三化螟、稻飛虱、卷葉螟進(jìn)行分類。[結(jié)果]利用所建立的6個(gè)特征判別函數(shù)對(duì)4種水稻害蟲進(jìn)行判別分類,識(shí)別率達(dá)到96.67%,說明這6個(gè)經(jīng)過篩選的特征具有很強(qiáng)的判別性。[結(jié)論]支持向量機(jī)分類器的識(shí)別方法很好地解決水稻害蟲傳統(tǒng)識(shí)別方法的低時(shí)效性問題。支持向量機(jī)以風(fēng)險(xiǎn)最小化為原則,兼顧訓(xùn)練誤差與測(cè)試誤差的最小化,具體體現(xiàn)在分類模型的選擇和模型參數(shù)的選擇上。
關(guān)鍵詞圖像處理;特征提?。蛔R(shí)別分類
中圖分類號(hào)S126文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào)0517-6611(2014)23-08043-03
作者簡(jiǎn)介李文斌(1990- ),男,浙江溫州人,碩士研究生,研究方向:數(shù)字圖像處理。
收稿日期20140707水稻是我國(guó)最重要的糧食作物之一,因此提高水稻產(chǎn)量是當(dāng)前水稻生產(chǎn)的重要目標(biāo)。但是,由于生產(chǎn)設(shè)備和預(yù)防監(jiān)控措施落后,尤其是農(nóng)業(yè)生物災(zāi)害又頻頻發(fā)生,對(duì)水稻生產(chǎn)造成了非常嚴(yán)重的影響。近年來。水稻害蟲危害逐年加重。因此,害蟲準(zhǔn)確、及時(shí)地預(yù)測(cè)預(yù)報(bào)成為了水稻害蟲預(yù)防和治理的前提,而水稻害蟲預(yù)測(cè)預(yù)報(bào)的核心內(nèi)容就是圖像識(shí)別和分類。
然而,以往的水稻害蟲識(shí)別方法都是依靠人為完成,通過大量的工作人員實(shí)地考查水稻害蟲的形狀、顏色等外部特征進(jìn)行,需要較長(zhǎng)的工作周期,并且實(shí)時(shí)性差,嚴(yán)重影響了水稻害蟲識(shí)別速度。基于此,筆者對(duì)水稻害蟲圖象自動(dòng)識(shí)別技術(shù)進(jìn)行研究。
1系統(tǒng)流程
圖像自動(dòng)識(shí)別技術(shù)包括兩個(gè)方面:水稻害蟲圖像幾何特征提取和圖像識(shí)別分類。圖像幾何特征反映了水稻害蟲的一些基本特征,合理的幾何特征便于更好地獲得有效的害蟲形態(tài)特征信息,進(jìn)而用于圖像識(shí)別分類。該研究通過對(duì)多種水稻害蟲的面積、周長(zhǎng)、偏心率、形狀參數(shù)、似圓度、葉狀性、球形性等幾何形狀特征進(jìn)行了提取和研究,并采用支持向量機(jī)分類器(SVM)對(duì)多種水稻害蟲進(jìn)行了分類識(shí)別處理,解決了以往識(shí)別技術(shù)中時(shí)效性差的問題。系統(tǒng)流程圖如所示。
系統(tǒng)流程2圖像預(yù)處理
2.1圖像去噪及其灰度化基于ARM系統(tǒng)的COMS攝像頭獲得的圖像由于受到自身像素及其各種自然環(huán)境和拍攝角度的影響,往往圖片質(zhì)量會(huì)較差,從而給后面的識(shí)別工作帶來困難,因此,需要對(duì)水稻害蟲初始圖像進(jìn)行必要的預(yù)處理,以提高圖像質(zhì)量。為了提高圖像質(zhì)量,減少初始圖像中的噪聲,采取了圖像平滑處理來去除噪聲。常用的圖像平滑方法有均值濾波和中值濾波,該系統(tǒng)采用中值濾波的方法,這是因?yàn)樵谕瘸叽绱笮∠?,中值濾波具有更好的去噪能力和較低的模糊度[1]。
另一方面,通過COMS攝像頭獲取的圖像都是彩色圖像,然而彩色圖像包含較多的像素,因此會(huì)占用較大的計(jì)算時(shí)間,而圖像灰度化就是將彩色圖像轉(zhuǎn)換為灰度圖像的過程,這樣可以減少計(jì)算時(shí)間和減少內(nèi)存占用,所以在進(jìn)行圖像特征提取之前首先將圖像進(jìn)行灰度化處理,處理結(jié)果如所示。
2.2圖像灰度閾值變換處理在圖像識(shí)別中,對(duì)直接拍攝得到的圖像直接進(jìn)行分類是不科學(xué)的,這是因?yàn)闆]經(jīng)過處理的圖像數(shù)據(jù)占用很大的存儲(chǔ)空間,如果直接進(jìn)行識(shí)別,則具有大量的計(jì)算量,降低效率;另外,直接拍攝得到的圖像有很多冗余的信息,如圖像的背景等一切與蟲體無關(guān)的信息量,因此,在提取水稻害蟲特征前必須先去除背景等無用信息,
原始圖像及處理后的灰度圖像突出蟲體有效信息。因此,采用灰度閾值變換處理,使得背景圖案和蟲體能夠很好地分離開來。
所謂灰度閾值變換就是將一幅灰度圖像轉(zhuǎn)換成黑白的二值圖像,設(shè)置一個(gè)灰度值,該灰度值起到分界線的作用。圖像中某像素的灰度值小于該灰度值,則將該像素的灰度值設(shè)置為0,否則設(shè)置為255,這個(gè)起到分界線作用的灰度值成為閾值。
在試驗(yàn)中,得出將灰度閾值設(shè)置為180的時(shí)候的二值化圖像是最優(yōu)的,基本上完整地描繪出了整個(gè)昆蟲圖像的輪廓。當(dāng)設(shè)置為大于180的時(shí)候,圖像的輪廓會(huì)變得厚重圓滑,從而使得外形失真;當(dāng)灰度閾值小于180的時(shí)候,圖像輪廓會(huì)有不同程度缺失,會(huì)使得大量數(shù)據(jù)丟失。試驗(yàn)結(jié)果如所示。
灰度圖像及處理后的二值化后圖像3圖像特征提取
對(duì)于人類視覺而言,人們通常利用水稻害蟲的物理結(jié)構(gòu)特征來進(jìn)行識(shí)別處理,但這些特征對(duì)于機(jī)器識(shí)別是具有很大難度的[2]。所謂特征提取就是從水稻害蟲中提取出可以把蟲體種類區(qū)分開來的并能被機(jī)器所直接使用的數(shù)據(jù)量。要對(duì)水稻害蟲進(jìn)行特征提取,首先要確定水稻害蟲有哪些蟲體特性參數(shù)。其次,要適當(dāng)?shù)剡x擇提取的特征參數(shù),特征參數(shù)選擇的好壞直接影響到后面能否正確地識(shí)別出害蟲種類,因?yàn)橛行┫x體原始特征對(duì)于分類器的識(shí)別分類影響不大。因此,需要從試驗(yàn)的所有特征參數(shù)中挑選出效果最好的特征參數(shù)。該系統(tǒng)中,主要對(duì)水稻害蟲的面積、周長(zhǎng)、偏心率、形狀參數(shù)、似圓度、葉狀性、球形性和孔洞數(shù)等形態(tài)學(xué)特征進(jìn)行識(shí)別分類[3]。
3.1蟲體面積蟲體面積是一個(gè)能直接區(qū)分蟲體種類的特征參數(shù),直接關(guān)系到蟲體的形狀和大小,是用來描述水稻害蟲大小的基本特性,圖像蟲體面積表示該圖像中蟲體在一定范圍內(nèi)所占的像素點(diǎn)總數(shù)。蟲體面積表達(dá)式如下:
A=Mx=1My=1f(x,y)
3.2蟲體周長(zhǎng)周長(zhǎng)和面積一樣,是描述蟲體外圍形狀和輪廓的重要參數(shù)。水稻害蟲種類不同,它們的圖像所占區(qū)域的大小也相差很大;周長(zhǎng)P=A-SUM(in),其中,A表示圖像區(qū)域面積,SUM(in)表示圖像的4鄰域范圍內(nèi)的像素總數(shù)。
3.3偏心率偏心率的表達(dá)式為E=p/q,是一個(gè)用來描述蟲體緊湊性的一個(gè)參數(shù),它在一定程度上表示水稻害蟲的蟲體形狀,體型狹窄度。一般情況下,偏心率越大,則蟲體就越狹窄;偏心率越小,則蟲體外形就越寬大。
3.4形狀參數(shù)形狀參數(shù)的表達(dá)式為C=P3/4πA,該參數(shù)描述了蟲體所占圖像區(qū)域的緊湊性,形狀參數(shù)這一特征可以有效地識(shí)別那些蟲體受損的水稻害蟲。一般情況下,當(dāng)蟲體受損后,很難將其區(qū)分出來,而加入形狀參數(shù)后,這一缺陷得到了很好的改善。
3.5似圓度似圓度R=4A/πl(wèi)2,其中,A是圖像面積,L是圖像橫軸長(zhǎng)度。似圓度描述了圖像形狀的問題,是一個(gè)相對(duì)參數(shù),可以用來描述水稻害蟲的形態(tài)特征。
3.6葉狀性葉狀性反映水稻害蟲的邊界幅度變化特性,定義為:B=R1/W,式中,B為葉狀性參數(shù),R1為區(qū)域重心到邊界的最短距離,W為圖像的橫軸長(zhǎng)度。
3.7球形性球形性SP=Ri/Rc,其中,Ri和Rc分別表示目標(biāo)內(nèi)切圓和外切圓的半徑,兩個(gè)圓的圓心都在區(qū)域的重心上。
3.8孔洞數(shù)將水稻害蟲圖像區(qū)域中無用的小區(qū)域定義為孔洞,對(duì)小區(qū)域進(jìn)行標(biāo)記并計(jì)數(shù)實(shí)現(xiàn)孔洞數(shù)的計(jì)算。
4圖像特征提取結(jié)果分析
選取50幅二化螟圖像、50幅三化螟圖像、50幅稻飛虱圖像、50幅卷葉螟圖像,測(cè)得上述8個(gè)特征數(shù)據(jù)如所示。從可以看出,二化螟圖像面積在3種水稻害蟲中最大,周長(zhǎng)也最大;而卷葉螟圖像偏心率最大,是卷葉螟體型狹長(zhǎng)、細(xì)窄的體現(xiàn);稻飛虱、二化螟和三化螟展翅寬度較大,反映為偏心率較小。葉狀性反映了目標(biāo)邊界的曲直變化頻率和幅度。在4種昆蟲中,卷葉螟圖像的葉狀性最大,是由于卷葉螟向外伸展使得圖像邊界幅度和方向變化很大,二化螟和稻飛虱的翅和體之間也有比較大的變化,其葉狀性小于卷葉螟而大于三化螟,根據(jù)似圓度,也可以判斷出卷葉螟似圓度最大。另一方面,根據(jù)球形性和孔洞數(shù)很難判斷出一個(gè)昆蟲的形狀特征和種類。
因此,運(yùn)用逐個(gè)分析方法對(duì)上述特征進(jìn)行篩選,得到6個(gè)特征,分別為區(qū)域面積、偏心率、形狀參數(shù)、周長(zhǎng)、似圓度、葉狀性,剔除了孔洞數(shù)特征以及球形性。利用所建立的6個(gè)特征判別函數(shù)對(duì)以上4種昆蟲進(jìn)行了判別分類,結(jié)果如所示,識(shí)別率達(dá)到96.67%,說明這6個(gè)經(jīng)過篩選的特征具有很強(qiáng)的判別性。
圖像特征提取結(jié)果水稻害蟲蟲體面積蟲體周長(zhǎng)形狀參數(shù)似圓度葉狀性偏心率球形性孔洞數(shù)二化螟10 393.54768.824.690.370.008 460.440.1526.44三化螟5 196.72521.324.350.350.001 800.310.1126.12卷葉螟2 846.29415.647.651.040.146 001.640.1322.04稻飛虱4 351.63498.326.590.980.009 400.420.1725.02
5支持向量機(jī)(SVM)分類器的設(shè)計(jì)
一般情況下,傳統(tǒng)意義上的識(shí)別技術(shù)都是通過分類器對(duì)訓(xùn)練樣本的擬合情況進(jìn)行蟲體識(shí)別,利用最小化訓(xùn)練集上的分類器作為訓(xùn)練目標(biāo),通過提供充足的樣本來提高分類器的識(shí)別率,然而,這個(gè)方法存在一個(gè)很嚴(yán)重的缺陷。當(dāng)樣本數(shù)量嚴(yán)重不足的時(shí)候,不能保證一個(gè)很好地分類了訓(xùn)練樣本的分類器也能夠很好地測(cè)試樣本,在缺乏代表性的小訓(xùn)練集情況下,一味地降低訓(xùn)練集上的分類錯(cuò)誤就會(huì)導(dǎo)致過度擬合。
針對(duì)傳統(tǒng)識(shí)別模式中存在的缺點(diǎn),采取支持向量機(jī)(SVM)分類器的識(shí)別方法,該方法很好地解決了這一問題。支持向量機(jī)以風(fēng)險(xiǎn)最小化為原則,即兼顧訓(xùn)練誤差與測(cè)試誤差的最小化,具體體現(xiàn)在分類模型的選擇和模型參數(shù)的選擇上[4]。
該試驗(yàn)中,將二化螟、三化螟、稻飛虱、卷葉螟4類水稻害蟲分別標(biāo)記為A、B、C、D 4類樣本,將這4類樣本兩類兩類地組成訓(xùn)練集,得到(A,B)、(A,C)、(A,D)、(B,C)、(B,D)、(C,D)。對(duì)于這4類樣本中的任意一類,就可以用相對(duì)應(yīng)的分類器來識(shí)別,像A類樣本,可以組合成(A,B)、(A,C)、(A,D)這3類分類器來對(duì)害蟲進(jìn)行分類識(shí)別,因此可以根據(jù)這些分類器的置信度來對(duì)這些二分器進(jìn)行可靠性排列。一般情況下,置信度高的分類器得到的結(jié)果可靠性就高,置信度低的分類器出現(xiàn)誤判斷的機(jī)會(huì)就比較大。蟲體識(shí)別判別過程如下所示。
第1步:對(duì)不同分類器的置信度大小進(jìn)行排列,依次為(A,C)、(A.B)、(A,D)、(B,D)、(C,D)、(B,C),并分別編號(hào)為第1類分類器、第2類分類器、第3類分類器、第4類分類器、第5類分類器、第6類分類器。
第2步:設(shè)被識(shí)別對(duì)象為未知昆蟲X,首先由第1類分類器進(jìn)行識(shí)別操作,根據(jù)第1類分類器的判別函數(shù)的結(jié)果來判斷。當(dāng)?shù)?類分類器的判別函數(shù)的結(jié)果為正數(shù)時(shí),則結(jié)果為類型A,所有關(guān)于類型C的判別函數(shù)均被淘汰;若結(jié)果為負(fù)數(shù)時(shí),則結(jié)果為C,所有關(guān)于類型A的判別函數(shù)都被淘汰;若判別函數(shù)的結(jié)果為0,則表示拒絕判斷,這時(shí)選用第2類分類器進(jìn)行識(shí)別;如果結(jié)果類型為C,則所剩判別函數(shù)為(B,D)、(C,D)、(B,C)。
第3步:被識(shí)別對(duì)象X再由第4類分類器進(jìn)行識(shí)別,若判別函數(shù)結(jié)果為正數(shù),淘汰所有關(guān)于D類的判別函數(shù),則所剩下的判別函數(shù)為第6類分類器(B,C)。
第4步:被識(shí)別的樣本在由第6類判別函數(shù)進(jìn)行識(shí)別,若得到結(jié)果為正數(shù),則判定最終的分類器結(jié)果為B。
6分類識(shí)別結(jié)果
由可知,4種水稻害蟲的識(shí)別率分別為96%、94%、94%、90%。
4種水稻害蟲識(shí)別率
水稻害蟲識(shí)別數(shù)目識(shí)別率∥%二化螟4896三化螟4794稻飛虱4794卷葉螟4590注:參試水稻害蟲的數(shù)目均為50。
42卷23期李文斌水稻害蟲圖像識(shí)別技術(shù)研究7結(jié)論
該研究初步選擇8個(gè)水稻害蟲圖像特征,并根據(jù)試驗(yàn)過程和結(jié)果挑選出6個(gè)具有實(shí)際判別意義的幾何特征,這些特征是相互獨(dú)立的,符合建立分類器要求特征之間具有相互獨(dú)立性的原則。該研究提取8種幾何形狀特征非常直觀并易于提取,能夠反映水稻害蟲特點(diǎn),也能反映出昆蟲的體型結(jié)構(gòu)以及形態(tài)特征。但如何提取更多能夠直接反映昆蟲形態(tài)特征和鑒別特征的特征及其設(shè)計(jì)更有效的分類器是今后努力的方向,也是完善昆蟲數(shù)學(xué)形態(tài)學(xué)理論的重要步驟之一。