沈美,于翔
摘 要:鑒于無(wú)線傳輸技術(shù)的推廣和應(yīng)用,文章以無(wú)人機(jī)為載體,以水稻紋枯病為例,通過(guò)支持向量機(jī)、AdaBoost等機(jī)器學(xué)習(xí)算法,重點(diǎn)研究并實(shí)現(xiàn)了基于機(jī)器學(xué)習(xí)的農(nóng)田無(wú)人機(jī)農(nóng)作物病害圖像自動(dòng)尋的系統(tǒng),并對(duì)該系統(tǒng)進(jìn)行深層次探索和功能分析。
關(guān)鍵詞:機(jī)器學(xué)習(xí);支持向量機(jī);AdaBoost;無(wú)人機(jī);農(nóng)作物病害;水稻紋枯病
1 農(nóng)作物病蟲(chóng)害現(xiàn)狀
我國(guó)農(nóng)業(yè)正在從傳統(tǒng)型農(nóng)業(yè)向精細(xì)型農(nóng)業(yè)發(fā)展。精細(xì)農(nóng)業(yè)的中心思想是在農(nóng)事勞動(dòng)和農(nóng)業(yè)生產(chǎn)生活中,依靠先進(jìn)的科學(xué)技術(shù)手段,快速、準(zhǔn)確地采集盡可能多的農(nóng)田信息,以達(dá)到減少投入的同時(shí)增加產(chǎn)出、提高投入物利用率、降低環(huán)境污染程度的目標(biāo)[1]。
作為影響農(nóng)作物最終產(chǎn)量的重要關(guān)鍵因素之一—農(nóng)作物病蟲(chóng)害的田間調(diào)查、檢測(cè)、識(shí)別及病蟲(chóng)害危害狀況進(jìn)行分級(jí)、監(jiān)測(cè),卻長(zhǎng)期依賴專業(yè)的植保人才,導(dǎo)致作物病蟲(chóng)害識(shí)別診斷的主觀性強(qiáng)、工作量大、成本高、誤差大、時(shí)效差、對(duì)專業(yè)知識(shí)要求較高,已經(jīng)遠(yuǎn)不能滿足我國(guó)現(xiàn)階段對(duì)現(xiàn)代農(nóng)業(yè)快速發(fā)展的需求[2]。因此,采用無(wú)損測(cè)試技術(shù),即在不破壞植物組織結(jié)構(gòu)的基礎(chǔ)上,利用各種手段對(duì)作物的生長(zhǎng)、病害危害狀況進(jìn)行監(jiān)測(cè),以便及時(shí)采取措施治理或合理安排計(jì)劃[3]。從而實(shí)現(xiàn)對(duì)病害進(jìn)行早期預(yù)警,對(duì)控制病蟲(chóng)害大范圍蔓延、保護(hù)作物產(chǎn)量有深遠(yuǎn)研究作用及社會(huì)意義[4]。
本文利用無(wú)人機(jī)(Unmanned Aerial Vehicle,UAV)便利、高效的特點(diǎn),通過(guò)其攜帶的攝像頭對(duì)水稻田間進(jìn)行高速飛掠采樣,利用機(jī)器視覺(jué)、機(jī)器學(xué)習(xí)等先進(jìn)技術(shù)對(duì)水稻紋枯病病害圖像進(jìn)行識(shí)別、尋的,從而完成基于機(jī)器視覺(jué)的水稻紋枯病的早期預(yù)警、診斷及病蟲(chóng)害分級(jí)判斷,為在相關(guān)條件成熟的情況下實(shí)現(xiàn)精準(zhǔn)噴灑、施藥打下堅(jiān)實(shí)的技術(shù)基礎(chǔ),從而實(shí)現(xiàn)基于機(jī)器學(xué)習(xí)的水稻紋枯病無(wú)人機(jī)平臺(tái)自動(dòng)尋的。該研究結(jié)果能對(duì)其他類似農(nóng)作物病蟲(chóng)害的無(wú)人機(jī)自動(dòng)尋的以及精準(zhǔn)施藥技術(shù)起到借鑒作用。
2 機(jī)器學(xué)習(xí)在農(nóng)作物無(wú)人機(jī)圖像尋的中的應(yīng)用
機(jī)器學(xué)習(xí)是一門多領(lǐng)域交叉學(xué)科,主要研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能,是目前人工智能中最具智能特征、最前沿的研究領(lǐng)域之一[5]。歷經(jīng)多年的發(fā)展,源于人工神經(jīng)網(wǎng)絡(luò)的研究,包含多個(gè)隱藏層的、多層感知器的、機(jī)器學(xué)習(xí)中的一種—深度學(xué)習(xí),通過(guò)組合低層特征形成更加抽象的高層表示屬性類別或特征,模仿人腦的機(jī)制來(lái)解釋數(shù)據(jù),例如圖像、聲音和文本等,在很多方面收獲了突破性進(jìn)展,本文主要通過(guò)支持向量機(jī)(Support Vector Machine,SVM)與Adaboost兩種機(jī)器學(xué)習(xí)算法,應(yīng)用于無(wú)人機(jī),對(duì)水稻紋枯病病害圖像的尋的有極大幫助。
2.1 支持向量機(jī)
支持向量機(jī)是Cortes和Vapnik于1995年首創(chuàng)的,在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì),并能夠推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問(wèn)題中[7]。
SVM理論來(lái)自于數(shù)據(jù)二值分類問(wèn)題的處理:假定在可分?jǐn)?shù)據(jù)中由多個(gè)可以區(qū)分正負(fù)樣本的超平面(Hyperplane)組成超平面集,在可分?jǐn)?shù)據(jù)中尋找一個(gè)滿足分類要求的最優(yōu)分割超平面(Optimal Separating Hyperplane,OSH),使得在保證分類精度的同時(shí)最大化OSH兩側(cè)的間隔[8]。
假定空間中存在包含正負(fù)兩類的自變量xi∈R,i=1,…l及因變量y,滿足y∈{1,﹣1}。假定存在一個(gè)分類超平面可以區(qū)分這兩類正負(fù)樣本,超平面上的點(diǎn)xi滿足ω·xi+b=0,其中ω為超平面的法向量,|b|/||ω||為超平面到原點(diǎn)的垂線距離,||ω||為ω的范數(shù)。
給出一組數(shù)據(jù){(xi,yi)},i=1,…l滿足
滿足上式且在超平面H1和超平面H2上的樣本點(diǎn)xi可分別表示為x+和x-。將上述兩式整合可得到
超平面H1和超平面H2可分別表示為
在超平面H1和H2上的點(diǎn)到原點(diǎn)的最短垂線距離分別是|1-b|/||ω||和|﹣1-b|/||ω||。因此,超平面間的間隔Margin為:
2.2 Adaboost算法
Schapire和Freund于1997年第一次提出Adaboost算法,將多個(gè)弱分類器有機(jī)地結(jié)合在一起,通過(guò)多次迭代,對(duì)訓(xùn)練樣本的權(quán)重不斷更新定義,隨后通過(guò)投票機(jī)制進(jìn)行分類。隨著迭代次數(shù)的增加,Adaboost算法會(huì)將分類的重點(diǎn)逐漸放在一些難區(qū)分的樣本上,通過(guò)這種機(jī)制,最后實(shí)現(xiàn)整體識(shí)別準(zhǔn)確率的提高。
Adaboost算法過(guò)程如下[9]:首先,將把數(shù)據(jù)分成訓(xùn)練集和測(cè)試集兩部分,隨后輸入訓(xùn)練集,對(duì)訓(xùn)練樣本權(quán)重進(jìn)行初始化,D1代表數(shù)據(jù)集的權(quán)重集合,N代表樣本的個(gè)數(shù),ω代表每個(gè)樣本的權(quán)重(一般初始的權(quán)重都設(shè)為1/N),其公式如下:
將清洗后的數(shù)據(jù)集輸入算法中,并建立一對(duì)多(One Against All,OAA)一對(duì)一(One Against One,OAO)分類器,分別用于訓(xùn)練和測(cè)試;
在每一次迭代過(guò)程后,根據(jù)如下公式計(jì)算弱分類器的錯(cuò)誤率em:
在迭代m次之后,根據(jù)弱分類器的錯(cuò)誤率確定每一個(gè)弱分類器在最終分類集合中的比例系數(shù)am:
每次迭代后,根據(jù)下面兩個(gè)公式來(lái)更新OAA分類器所有的權(quán)重:
輸入測(cè)試集,調(diào)用OAO分類器下式:
最后得到分類器:
3 利用SVM與Adaboost分類器實(shí)現(xiàn)無(wú)人機(jī)水稻紋枯病尋的
3.1 利用SVM與Adaboost分類器實(shí)現(xiàn)無(wú)人機(jī)水稻紋枯病尋的技術(shù)路線
在無(wú)人機(jī)施工過(guò)程中,如果利用無(wú)人機(jī)實(shí)現(xiàn)基于機(jī)器視覺(jué)的精準(zhǔn)尋的,就必須將正常葉片、病害葉片及土地等噪聲分開(kāi),這也是無(wú)人機(jī)植保中的關(guān)鍵問(wèn)題之一。因此,構(gòu)造一個(gè)具有較高精度的分類器,從而實(shí)現(xiàn)病害葉片的檢出及對(duì)正常葉片、泥土、雜草圖像等噪聲的分類,為基于機(jī)器視覺(jué)的無(wú)人機(jī)尋的提供精準(zhǔn)目標(biāo)就成為實(shí)現(xiàn)無(wú)人機(jī)精準(zhǔn)尋的一種解決思路。本文提出利用Adaboost及SVM建立兩級(jí)級(jí)聯(lián)分類器,從而實(shí)現(xiàn)新型的、高效的、具有計(jì)算復(fù)雜度小、分類精度高等優(yōu)點(diǎn)的二級(jí)級(jí)聯(lián)分類器來(lái)解決該問(wèn)題。
本文通過(guò)研究不同局部特征對(duì)紋枯病和非紋枯病檢測(cè)的影響,創(chuàng)造性地提出在水稻基部紋枯病識(shí)別研究中利用兩層分類器來(lái)對(duì)紋枯病進(jìn)行檢測(cè)與識(shí)別,其技術(shù)路線如圖1所示。
圖1 利用SVM與Adaboost分類器實(shí)現(xiàn)無(wú)人機(jī)
水稻紋枯病尋的技術(shù)路線
首先,在第一層利用水稻基部圖像的顏色特征,通過(guò)圖像預(yù)處理等手段對(duì)具有水稻紋枯病變的葉片圖像進(jìn)行處理,隨后利用Adaboost分類器進(jìn)行初步分類、建立正負(fù)樣本,初步實(shí)現(xiàn)水稻紋枯病的檢測(cè)。然后,通過(guò)顏色特征、方向梯度直方圖(Histogram of Oriented Gridients,HOG)特征及局部二值模式(Local Binary Patterns,LBP)特征組合成新的特征組,并利用SVM對(duì)第一層檢測(cè)結(jié)果進(jìn)行非目標(biāo)的精細(xì)排除,進(jìn)一步去除泥點(diǎn)、枯葉、雜草、水滴、反光等噪聲,減少誤差,并實(shí)現(xiàn)對(duì)水稻植株紋枯病的自動(dòng)檢出。
3.2 基于Adaboost分類器的無(wú)人機(jī)尋的
針對(duì)同樣的訓(xùn)練集病害圖像特征值,通過(guò)Adaboost算法訓(xùn)練出多個(gè)不同的弱分類器,然后對(duì)分類器輸出的結(jié)果設(shè)定一個(gè)閾值,通過(guò)大量的實(shí)驗(yàn),設(shè)定該閾值為1,通過(guò)該閾值來(lái)區(qū)分正、負(fù)樣本。如下式所示:
其中x為樣本的數(shù)據(jù),hj(x)為對(duì)應(yīng)于第j張病害圖像的病害特征值,βj為判定閾值,在本文中確定為1。
基于顏色分量的級(jí)聯(lián)分類器構(gòu)成設(shè)計(jì)思路如圖2所示。
圖2 基于顏色分量的級(jí)聯(lián)分類器構(gòu)成
本實(shí)驗(yàn)過(guò)程中存在著數(shù)量極為龐大的顏色特征描述值,若通過(guò)計(jì)算所有的特征來(lái)完成識(shí)別的過(guò)程,其計(jì)算量是十分龐大的。本文設(shè)計(jì)了基于顏色分量的級(jí)聯(lián)分類器,針對(duì)彩色圖像的3個(gè)顏色通道,首先賦予所有樣本每個(gè)顏色通道相同的權(quán)重。然后,分別進(jìn)行計(jì)算,得到樣本每個(gè)顏色通道分類的錯(cuò)誤率。最后,調(diào)整并重新分配樣本的權(quán)重,從而提高錯(cuò)誤樣本顏色分量分類的權(quán)重,實(shí)現(xiàn)對(duì)錯(cuò)誤樣本在下一輪訓(xùn)練中的重視程度。多次對(duì)樣本進(jìn)行迭代訓(xùn)練后,實(shí)現(xiàn)利用Adaboost算法來(lái)對(duì)每個(gè)顏色通道進(jìn)行弱分類,并通過(guò)閾值組合成強(qiáng)分類器,最終解決該問(wèn)題,
4 結(jié)語(yǔ)
通過(guò)Adaboost算法的不斷迭代運(yùn)算,首先將彩色圖像的3個(gè)通道顏色特征值單獨(dú)拿出來(lái)進(jìn)行分別計(jì)算,然后,利用大量的實(shí)驗(yàn)確定閾值為1,實(shí)現(xiàn)弱分類器的第一次分類,進(jìn)行過(guò)程中,當(dāng)錯(cuò)誤率達(dá)到了預(yù)想值時(shí),迭代的過(guò)程就可以結(jié)束了。隨后,將Adaboost算法分類出的結(jié)果輸送給SVM,構(gòu)建出第二個(gè)分類器,通過(guò)對(duì)多個(gè)弱分類器的級(jí)聯(lián)實(shí)現(xiàn)無(wú)人機(jī)對(duì)水稻紋枯病病害圖片的強(qiáng)分類,最終實(shí)現(xiàn)水稻紋枯病病害的精準(zhǔn)檢出,從而實(shí)現(xiàn)無(wú)人機(jī)對(duì)水稻紋枯病病害圖片的自動(dòng)尋的。
本研究使用5個(gè)級(jí)別測(cè)試150個(gè)樣本,對(duì)區(qū)分不同危害程度的水稻紋枯病測(cè)試了準(zhǔn)確率。根據(jù)結(jié)果可以看出,2級(jí)病株中有一株誤判,偏大,正確率80%;3級(jí)病株有一株誤判,偏大,正確率89%;4級(jí)中全部都檢測(cè)無(wú)誤,正確率100%;5級(jí)中有一株誤判,偏小,正確率80%??傮w來(lái)講,其正確率在可接受范圍內(nèi)。分析發(fā)生誤判的原因,有以下幾點(diǎn):
(1)在發(fā)病初期,如2級(jí)病株的植株基部病狀太輕,不易檢出,且有多個(gè)暗綠色斑點(diǎn),無(wú)法分辨是否為噪聲,從而產(chǎn)生誤判,并導(dǎo)致樣本的計(jì)算百分比不準(zhǔn)確。
(2)在水稻發(fā)病的過(guò)程中,樣本有時(shí)并不能很好地反映發(fā)病情況,在很大程度上會(huì)影響判別效果。
(3)在實(shí)時(shí)檢測(cè)中,攝像頭需要平行地面且盡可能靠近作物采集病斑,并且從側(cè)面以固定的角度、傾斜方向采集整株高度,采樣時(shí)因采樣角度不對(duì)而產(chǎn)生誤差。
作者簡(jiǎn)介:沈美(1978— ),女,青海樂(lè)都人,副教授,碩士;研究方向:人工智能,神經(jīng)網(wǎng)絡(luò)。
[參考文獻(xiàn)]
[1]張心雨.低密度下評(píng)估稻飛虱智能識(shí)別系統(tǒng)的有效性[D].南京:南京農(nóng)業(yè)大學(xué),2016.
[2]柴阿麗.基于計(jì)算機(jī)視覺(jué)和光譜分析技術(shù)的蔬菜葉部病害診斷研究[D].北京:中國(guó)農(nóng)業(yè)科學(xué)院,2011.
[3]唐晏.基于無(wú)人機(jī)采集圖像的植被識(shí)別方法研究[D].成都:成都理工大學(xué),2014.
[4]黃向陽(yáng).低密度下評(píng)估稻飛虱智能識(shí)別系統(tǒng)的有效性[D].南京:南京農(nóng)業(yè)大學(xué),2016.
[5]王曉麗.無(wú)人機(jī)精準(zhǔn)作業(yè)決策方法研究[D].北京:中國(guó)民航大學(xué),2017.
[6]張松.基于SVM和AdaBoost的多分類算法研究[D].濟(jì)南:山東師范大學(xué),2019.
[7]任浩,葉亮,李月,等.基于多級(jí)SVM分類的語(yǔ)音情感識(shí)別算法[J].計(jì)算機(jī)應(yīng)用研究,2017(6):1682-1684.
[8]金純,陳光勇.基于優(yōu)化的LSTSVM的多模態(tài)生理信號(hào)情感識(shí)別[J].電子技術(shù)應(yīng)用,2018(3):112-116.
[9]劉巖,李幼軍,陳萌.基于EMD和SVM的抑郁癥靜息態(tài)腦電信號(hào)分類研究[J].山東大學(xué)學(xué)報(bào)(工學(xué)版),2017(47):26.
Research and implementation of unmanned aerial vehicle search for crop diseases based on machine vision: taking rice sheath blight as an example
Shen Mei, Yu Xiang
(Information and Intelligent Engineering School, Nantong College of Science and Technology, Nantong 226007, China)
Abstract:In view of the popularization and application of wireless transmission technology, this paper takes unmanned aerial vehicle as the carrier, takes rice sheath blight as an example, through the support vector machine, AdaBoost and other machine learning algorithms, focuses on the research and implementation of the system of agricultural unmanned aerial vehicle. Based on machine learning to automatically find the crop disease image, and makes a deep exploration and functional analysis of the system.
Key words:machine learning; support vector machine; AdaBoost; unmanned aerial vehicle; crop disease; rice sheath blight