馬佳佳, 陳友鵬, 王克強(qiáng), 劉展眉, 溫艷蘭, 林欽永, 蔡 肯
(仲愷農(nóng)業(yè)工程學(xué)院1,廣州 510225) (廣州南洋理工職業(yè)學(xué)院2,廣州 510925)
農(nóng)作物病蟲害是主要農(nóng)業(yè)災(zāi)害之一,具有種類多、影響大、并時(shí)常暴發(fā)成災(zāi)的特點(diǎn),其發(fā)生范圍和嚴(yán)重程度對(duì)農(nóng)業(yè)生產(chǎn)常造成重大損失[1-3]。蟲害的預(yù)測(cè)預(yù)報(bào)和實(shí)時(shí)監(jiān)測(cè)是蟲害管理的重要組成部分,也是有效防治和控制蟲害蔓延的依據(jù)。只有對(duì)蟲害發(fā)生進(jìn)行及時(shí)、準(zhǔn)確的識(shí)別監(jiān)測(cè),正確的擬定綜合防治對(duì)策,才能經(jīng)濟(jì)有效地降低蟲害威脅,確保農(nóng)業(yè)糧食的安全,進(jìn)而推動(dòng)農(nóng)業(yè)可持續(xù)發(fā)展。而傳統(tǒng)的蟲害識(shí)別仍然依賴于人力,存在檢測(cè)不及時(shí)、標(biāo)準(zhǔn)不規(guī)范、效率低等弊端。機(jī)器視覺(jué)技術(shù)作為人工智能領(lǐng)域中的重要分支之一,同時(shí)也是圖像識(shí)別領(lǐng)域的重要技術(shù)手段之一,研究熱度逐年攀升,在農(nóng)業(yè)相關(guān)領(lǐng)域的主要應(yīng)用方向包括農(nóng)產(chǎn)品品質(zhì)無(wú)損檢測(cè)、農(nóng)作物生長(zhǎng)情況監(jiān)控及農(nóng)作物產(chǎn)量預(yù)測(cè)等[4,5]。與此同時(shí),國(guó)內(nèi)外研究學(xué)者也在蟲害識(shí)別的應(yīng)用上,分別基于傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)兩個(gè)方向,做了不少嘗試。傳統(tǒng)機(jī)器學(xué)習(xí)方法依賴于作為先驗(yàn)知識(shí)的特征提取算法,可以通過(guò)多源信息融合或算法優(yōu)化進(jìn)一步改進(jìn)模型識(shí)別性能。鄒永杰等[6]提取番茄樣本圖像的HOG和LBP特征作為SVM分類器的特征向量,提出了一種番茄病蟲害檢測(cè)方法,對(duì)公開番茄病害數(shù)據(jù)集的識(shí)別率達(dá)99.49%。吳一全等[7]選用Shearlet變換和Krwtchouk矩分別提取儲(chǔ)糧害蟲圖像中的紋理、形狀特征向量,同時(shí)提出一種全局混沌蜂群算法優(yōu)化SVM分類模型,由于提取到的特征信息較為完整,該模型對(duì)三種儲(chǔ)糧害蟲取得較好的識(shí)別效果。Kasinathan等[8]結(jié)合HOG和GIST特征描述子對(duì)田間蟲害圖像進(jìn)行特征提取,采用多數(shù)投票的集成分類器實(shí)現(xiàn)較優(yōu)的蟲害分類效果?;谏疃葘W(xué)習(xí)的蟲害識(shí)別方法在近年來(lái)隨著計(jì)算機(jī)性能的不斷提升也得到廣泛關(guān)注。苗海委等[9]提出一種基于改進(jìn)SSD的黏蟲板儲(chǔ)糧蟲害圖像檢測(cè)算法,實(shí)現(xiàn)了對(duì)粘蟲板誘捕到六類害蟲的識(shí)別與定位,識(shí)別率達(dá)81.36%。Shen等[10]采用Faster R-CNN模型建立了儲(chǔ)糧蟲害識(shí)別系統(tǒng),通過(guò)優(yōu)化的初始網(wǎng)絡(luò)對(duì)圖片樣本進(jìn)行特征提取,系統(tǒng)對(duì)儲(chǔ)糧蟲害的識(shí)別精度達(dá)88%。因此,機(jī)器學(xué)習(xí)技術(shù)在蟲害識(shí)別應(yīng)用上具有一定的必要性與可行性。
本研究以遷飛性害蟲草地貪夜蛾為識(shí)別對(duì)象,提出了基于粒子群優(yōu)化SVM的蟲害圖像快速識(shí)別方法。目前基于粒子群優(yōu)化SVM的算法模型已被嘗試應(yīng)用于工業(yè)檢測(cè)中,如電路故障診斷[11]、環(huán)境數(shù)據(jù)的異常檢測(cè)[12]及工業(yè)控制中的異常檢測(cè)[13]等,其數(shù)據(jù)來(lái)源相對(duì)標(biāo)準(zhǔn)且規(guī)范,但在農(nóng)業(yè)領(lǐng)域的識(shí)別應(yīng)用中,采集到的大多數(shù)數(shù)據(jù)都是不標(biāo)準(zhǔn)且背景復(fù)雜的,這對(duì)模型的識(shí)別性能提出了更高要求。本研究首先構(gòu)建草地貪夜蛾成蟲圖像數(shù)據(jù)集,并對(duì)圖像提取方向梯度直方圖特征,通過(guò)結(jié)合粒子群優(yōu)化算法對(duì)SVM分類模型進(jìn)行參數(shù)尋優(yōu),將優(yōu)化SVM模型應(yīng)用于蟲害圖像檢測(cè)中,重點(diǎn)解決實(shí)際應(yīng)用中小訓(xùn)練樣本的識(shí)別精度問(wèn)題,該方法的簡(jiǎn)單性和高效率使其適用于復(fù)雜背景下的蟲害識(shí)別。
為準(zhǔn)確識(shí)別出目標(biāo)類別,研究學(xué)者提出了許多特征提取方法,本研究選用HOG特征描述符來(lái)獲取圖像特征向量。方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征是一種通過(guò)計(jì)算和統(tǒng)計(jì)圖像局部區(qū)域的梯度方向直方圖來(lái)構(gòu)建特征信息的一種特征描述子。HOG特征的本質(zhì)可以理解為梯度的統(tǒng)計(jì)信息,圖像中局部目標(biāo)的表象和形狀能夠充分通過(guò)梯度方向密度分布來(lái)描述[14,15]。另外,因?yàn)樵撎卣鞣椒ǖ牟僮鲗?duì)象是圖像的局部方格單位,所以提取到的HOG特征對(duì)圖像的形變,包括幾何上的和光學(xué)上的都能保持良好的不變性[16]。
HOG特征提取算法的實(shí)現(xiàn)過(guò)程如下:首先采用Gamma校正法對(duì)灰度圖像進(jìn)行顏色空間的歸一化操作,目的是調(diào)節(jié)圖像對(duì)比度[17],降低圖像局部由光照變化引起的光學(xué)影響,同時(shí)增強(qiáng)魯棒性。然后,計(jì)算每個(gè)局部方格單位內(nèi)各像素點(diǎn)的梯度,從而得到圖片中對(duì)象的輪廓信息與梯度方向。圖像中像素點(diǎn)(x,y)的梯度計(jì)算公式如式(1)~式(4)所示。
Gx(x,y)=H(x+1,y)-H(x-1,y)
(1)
Gy(x,y)=H(x,y+1)-H(x,y-1)
(2)
式中:Gx(x,y),Gy(x,y),H(x,y)分別為輸入圖像像素點(diǎn)(x,y)處的水平方向梯度、垂直方向梯度和像素值。
(3)
(4)
式中:G(x,y),a(x,y)分別為像素點(diǎn)處的梯度幅值和梯度方向。
將檢測(cè)窗口大小設(shè)置為與圖像分辨率一致為(150,150),把每個(gè)窗口分成10×10個(gè)方格區(qū)域,把梯度方向平均劃分為9個(gè)區(qū)間,分別計(jì)算各區(qū)域內(nèi)的梯度直方圖,再把相鄰的區(qū)域組合成一個(gè)區(qū)域塊,在區(qū)域塊內(nèi)對(duì)梯度強(qiáng)度做歸一化。最后再將各方格內(nèi)提取到的特征向量串聯(lián)組合,形成圖像整體的HOG特征信息。本實(shí)驗(yàn)在特征提取步驟中從每幅圖像中提取得到2 916個(gè)特征值。
針對(duì)本研究面向的小樣本數(shù)分類問(wèn)題,選用傳統(tǒng)機(jī)器學(xué)習(xí)算法中的支持向量機(jī)(Support Vector Machine,SVM)分類模型。因該模型具有泛化能力強(qiáng),對(duì)小樣本數(shù)據(jù)友好,算法靈活等諸多優(yōu)點(diǎn),目前已被廣泛應(yīng)用于目標(biāo)識(shí)別中[18]。SVM是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的分類方法,通過(guò)監(jiān)督學(xué)習(xí)的方式對(duì)數(shù)據(jù)進(jìn)行二元分類,其決策邊界是對(duì)學(xué)習(xí)樣本求解的最大邊距超平面,該超平面的求解公式可以表述為:
y(ω·x+b)≥1-ξi(ξi≥0;i=1,2,…,n)
(5)
式中:ω為權(quán)重向量;b為分類閾值;ξi為松弛因子;C為懲罰因子。
引入核函數(shù)映射后,得到?jīng)Q策函數(shù)如式(6)所示:
(6)
式中:f(x)取值為1或-1;K(xi,x)為核函數(shù),選用高斯核函數(shù)。
由式(6)可知,SVM對(duì)其內(nèi)部參數(shù)有著極高的依賴性,懲罰因子c與核參數(shù)gamma的選擇將直接影響模型識(shí)別準(zhǔn)確率[19]。同時(shí),對(duì)于不同的數(shù)據(jù)集,使得識(shí)別效果最好的參數(shù)值也是不同的,因此模型內(nèi)部參數(shù)的選取優(yōu)化是SVM模型訓(xùn)練中格外重要的一步。
粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是一種基于迭代的智能群算法,是通過(guò)模擬鳥群捕食行為設(shè)計(jì)的。該算法的基本思想是通過(guò)群體中個(gè)體之間的協(xié)作和信息共享來(lái)尋找最優(yōu)解[20]。從隨機(jī)解出發(fā),通過(guò)迭代尋求最優(yōu)解,并通過(guò)適應(yīng)度來(lái)評(píng)價(jià)解的質(zhì)量,粒子速度和位置的更新公式如式(7)和式(8)所示。
(7)
(8)
為了進(jìn)一步提高SVM模型的識(shí)別性能與泛化能力,本研究提出采用粒子群優(yōu)化SVM算法,解決模型中核函數(shù)與參數(shù)的尋優(yōu)問(wèn)題,進(jìn)而建立效果更優(yōu)的蟲害圖像識(shí)別模型。PSO-SVM算法模型的建立步驟如下:
初始化參數(shù),隨機(jī)生成初始粒子群;
通過(guò)計(jì)算各粒子的個(gè)體最優(yōu)解和全局最優(yōu)解,更新粒子的速度和位置;
判斷是否滿足迭代終止條件,若滿足則跳出迭代,否則重復(fù)步驟2;
得到SVM模型內(nèi)部參數(shù)c與gamma的最優(yōu)值;
按正常步驟訓(xùn)練SVM模型,使用測(cè)試集對(duì)模型識(shí)別效果進(jìn)行評(píng)價(jià)。
本研究應(yīng)用自行采集的草地貪夜蛾成蟲圖像進(jìn)行識(shí)別實(shí)驗(yàn)。準(zhǔn)備好圖像樣本后,首先對(duì)圖像進(jìn)行簡(jiǎn)單的預(yù)處理,得到質(zhì)量相對(duì)增強(qiáng)的圖像;然后從圖像中提取得到HOG特征信息,將圖像信息轉(zhuǎn)換為表征數(shù)據(jù)以便進(jìn)行后續(xù)分類;接著將特征信息輸入PSO-SVM算法模型進(jìn)行識(shí)別,最終得到蟲害識(shí)別結(jié)果。算法訓(xùn)練與識(shí)別流程如圖1所示。
圖1 算法流程
選擇草地貪夜蛾成蟲作為實(shí)驗(yàn)對(duì)象。草地貪夜蛾成蟲翅展寬度一般為32~40 mm。前翅灰色至深棕色,后翅灰白色,翅脈呈棕色并透明[21]。在暗箱內(nèi)固定環(huán)形光源,選用德國(guó)IDS工業(yè)相機(jī)(型號(hào):UI-3070CP-C-HQ Rev.2)作為圖像采集設(shè)備,標(biāo)準(zhǔn)化圖像采集環(huán)境如圖2所示。采集成蟲在簡(jiǎn)單背景下和復(fù)雜背景下的正樣本(即有成蟲對(duì)象)圖像1 000張及負(fù)樣本(即無(wú)成蟲對(duì)象)圖像800張,共1 800副彩色圖像作為本實(shí)驗(yàn)的數(shù)據(jù)集。
圖2 圖像采集環(huán)境示意圖
為提高檢測(cè)效率,對(duì)圖像進(jìn)行預(yù)處理操作。首先將圖片分辨率降低為150×150(單位:像素),同時(shí)進(jìn)行灰度化處理。接著對(duì)灰度圖像進(jìn)行濾波操作,分別選用5×5的中值濾波模板和高斯濾波模板消除圖像中的隨機(jī)噪聲。經(jīng)過(guò)預(yù)處理后的部分正樣本圖像如圖3所示。
圖3 預(yù)處理后的正樣本圖像示例
實(shí)驗(yàn)中訓(xùn)練模型的基礎(chǔ)環(huán)境為64位Windows10系統(tǒng),并配置有Intel Core i5-6300HQ CPU和NVIDIA GeForce GTX 960M GPU。實(shí)驗(yàn)在圖形處理單元(GPU)模式下進(jìn)行,選用的腳本語(yǔ)言為Python,并安裝OpenCV圖像處理庫(kù)及Scikit-learn機(jī)器學(xué)習(xí)庫(kù)。
對(duì)PSO算法的初始參數(shù)做如下設(shè)置:慣性因子為1,學(xué)習(xí)因子為2,種群規(guī)模為20,迭代次數(shù)為100。通過(guò)迭代,PSO計(jì)算得到使得SVM分類效果最優(yōu)的最佳懲罰因子c為0.025,最佳核參數(shù)gamma為1.964。PSO優(yōu)化前后模型的識(shí)別實(shí)驗(yàn)結(jié)果如表1、表2所示,識(shí)別正確樣本平均數(shù)指多次實(shí)驗(yàn)后通過(guò)記錄每次實(shí)驗(yàn)識(shí)別正確樣本數(shù)進(jìn)而計(jì)算得到的平均值,平均準(zhǔn)確率指識(shí)別正確樣本平均數(shù)除以待識(shí)別樣本數(shù)得到得到的百分比數(shù),平均識(shí)別時(shí)間包含模型訓(xùn)練所需的時(shí)間與識(shí)別測(cè)試所需的時(shí)間。
表2 模型對(duì)復(fù)雜背景下樣本的識(shí)別實(shí)驗(yàn)結(jié)果
由表1、表2可知,傳統(tǒng)SVM模型與PSO-SVM模型在對(duì)簡(jiǎn)單背景下蟲害圖像的識(shí)別中都能達(dá)到100%的準(zhǔn)確率,但在對(duì)復(fù)雜背景下蟲害圖像的識(shí)別中,PSO-SVM模型的識(shí)別準(zhǔn)確率相比于SVM模型提升了7.22%,且在識(shí)別時(shí)間上也縮短了30%。因此,經(jīng)PSO算法優(yōu)化后的SVM模型,既顯著降低了SVM模型性能對(duì)其內(nèi)部參數(shù)懲罰因子c和核參數(shù)gamma的依賴程度,同時(shí)有效提高了其識(shí)別的精度與效率。
為進(jìn)一步驗(yàn)證PSO-SVM模型的識(shí)別性能,隨機(jī)選取300張圖片,分別選用裝袋最近鄰(Bagging-kNN)、自適應(yīng)提升(AdaBoost)、隨機(jī)森林(Random Forest)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)中的典型模型GoogLeNet inceptionV3與本文提出的PSO-SVM共5種機(jī)器學(xué)習(xí)分類模型對(duì)草地貪夜蛾蟲害圖像進(jìn)行識(shí)別測(cè)試,實(shí)驗(yàn)結(jié)果如表3所示。
表3 不同模型識(shí)別實(shí)驗(yàn)結(jié)果
本研究提出的PSO-SVM模型在對(duì)蟲害圖像的識(shí)別實(shí)驗(yàn)上,準(zhǔn)確率均明顯優(yōu)于另外幾種算法。其中,與Bagging-kNN、AdaBoost、Random Forest相比,同樣是選用HOG特征描述符從圖片樣本中提取特征向量作為模型的輸入,但從分類器效果來(lái)看,PSO-SVM模型的識(shí)別效果明顯更優(yōu),準(zhǔn)確率差距基本保持6%以上,同時(shí)識(shí)別速度更快,能夠做到蟲害的實(shí)時(shí)檢測(cè)。對(duì)于CNN模型,在實(shí)驗(yàn)中選用典型模型GoogLeNet inceptionV3進(jìn)行對(duì)比實(shí)驗(yàn),該模型不依賴于先驗(yàn)知識(shí)的特征提取算法,具有自主特征學(xué)習(xí)、自我完善模型等優(yōu)點(diǎn)[22],可以自動(dòng)學(xué)習(xí)并得到數(shù)據(jù)隱含在圖像內(nèi)部的關(guān)系,提取出更高維、更具表達(dá)力的特征信息。但由于數(shù)據(jù)樣本數(shù)量的限制以及圖像采集背景的復(fù)雜性,在此實(shí)驗(yàn)中CNN模型沒(méi)有取得很好的識(shí)別效果;且從識(shí)別時(shí)間上看,GoogLeNet inceptionV3模型在數(shù)據(jù)充足的條件下,提前訓(xùn)練好學(xué)習(xí)模型后將會(huì)有不錯(cuò)的識(shí)別效率,但在小樣本的應(yīng)用條件下,其訓(xùn)練時(shí)間成本相對(duì)較高。因此,出于識(shí)別精度與效率的綜合考慮,PSO-SVM模型在蟲害圖像識(shí)別實(shí)驗(yàn)中取得了相對(duì)較好的識(shí)別效果。
機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展,大大提升了目標(biāo)識(shí)別的速度與精度,為其在農(nóng)業(yè)領(lǐng)域上的應(yīng)用發(fā)展帶來(lái)了新的契機(jī)。本研究結(jié)合HOG特征描述符,提出一種基于PSO-SVM的蟲害圖像快速識(shí)別方法,對(duì)不同背景下的草地貪夜蛾蟲害圖像進(jìn)行識(shí)別研究。實(shí)驗(yàn)結(jié)果表明,該模型對(duì)簡(jiǎn)單背景下樣本的識(shí)別率達(dá)100%,對(duì)復(fù)雜背景下樣本的識(shí)別率達(dá)93.89%,保證了蟲害識(shí)別的精度與效率,能夠?yàn)檗r(nóng)作物蟲害識(shí)別與預(yù)防工作提供有益的參考。在今后的研究中,會(huì)考慮加入其他優(yōu)化模型,加速優(yōu)化迭代過(guò)程,達(dá)到更高效準(zhǔn)確的效果。