馬 超,袁 濤,姚鑫鋒,籍延寶,李琳一
(上海市農(nóng)業(yè)科學(xué)院農(nóng)業(yè)科技信息研究所,上海201403)
水稻是我國(guó)重要的糧食作物之一,對(duì)農(nóng)業(yè)經(jīng)濟(jì)有著較大影響。病蟲害是威脅水稻產(chǎn)量和品質(zhì)的主要因素[1],及時(shí)發(fā)現(xiàn)、準(zhǔn)確判斷病蟲害并采取適當(dāng)?shù)姆乐未胧┦菧p少病蟲為害損失的有效途徑。非植保專業(yè)人員缺乏準(zhǔn)確識(shí)別病蟲害經(jīng)驗(yàn),常因病蟲害誤診導(dǎo)致防治不當(dāng)造成經(jīng)濟(jì)損失或農(nóng)藥殘留超標(biāo)。隨著信息技術(shù)的發(fā)展,基于機(jī)器視覺的病蟲害診斷為該問題提供了解決方案,即采集作物病蟲害圖片,利用機(jī)器視覺技術(shù)對(duì)作物病蟲害進(jìn)行識(shí)別和診斷,為病蟲害防治提供輔助決策依據(jù)。
以大田水稻為試驗(yàn)對(duì)象,分兩種方式獲取病斑識(shí)別原始訓(xùn)練素材:第一種方式是用iPhone6s和Sumsung Note3手機(jī)拍攝,圖像以jpg格式儲(chǔ)存,采集時(shí)以能夠清晰拍攝水稻病斑為主要原則,可輔助白色背景板方便后續(xù)處理;第二種方式是使用網(wǎng)絡(luò)爬蟲抓取常見水稻病害圖片。兩種方式累計(jì)獲得條紋葉枯病、紋枯病、稻瘟病、霜霉病與赤枯病的5種病害圖片1 000張,圖像預(yù)處理后,每種病害隨機(jī)抽取50張,合計(jì)250張作為識(shí)別樣本,其余750張作為訓(xùn)練樣本。其中病斑切割為訓(xùn)練正樣本,5種病害樣本圖片共計(jì)3 311張,非病斑部分作為負(fù)樣本,即正常葉片以及背景共計(jì)1 000張。實(shí)際訓(xùn)練過(guò)程中,會(huì)將目標(biāo)病害以外的4種病害圖片也作為負(fù)樣本,以達(dá)到場(chǎng)景全覆蓋的目的。
本研究病害照片皆來(lái)源于開放的拍攝環(huán)境,對(duì)存在亮斑、噪點(diǎn)以及曝光不足等問題的照片,良好的預(yù)處理可以保證輸入照片的規(guī)格統(tǒng)一。適當(dāng)提高原始圖像的質(zhì)量不僅可以降低計(jì)算機(jī)的運(yùn)算負(fù)擔(dān),還有利于最終的圖像分割以及病害識(shí)別。
1.2.1 亮度均衡
把原始圖像的直方圖變換為均衡分布的形式,可以增加像素的灰度值的動(dòng)態(tài)范圍,從而增強(qiáng)圖像整體的對(duì)比度。使用的方法是灰度級(jí)變換:s=T(r),0≤r≤1。
T(r)滿足下列兩個(gè)條件:
(1)當(dāng)0≤r≤1時(shí),T(r)為單值且單調(diào)遞增[保證原圖各灰度級(jí)在變換后仍保持從黑到白(或從白到黑)的排列次序];
(2)當(dāng)0≤r≤1時(shí),0≤T(r)≤1(保證變換前后灰度值動(dòng)態(tài)范圍的一致性),則有:
GMZ07膨潤(rùn)土及其摻砂混合物試樣的初始干密度(ρd0)為1.5 g/cm3.將砂與混合物的干土質(zhì)量之比定義為摻砂率(Rs).將膨潤(rùn)土與砂按照Rs為0%,30%,50%的比例混合配制成不同摻砂率試樣.根據(jù)北山地區(qū)地下水溶解固體含量范圍[3],配制NaCl溶液摩爾濃度(以下簡(jiǎn)稱濃度)分別為0,0.5,1.0 mol/L.利用不同濃度NaCl溶液將GMZ07膨潤(rùn)土及其摻砂混合物試樣進(jìn)行飽和.對(duì)每種NaCl濃度的飽和試樣各施加200,400,800 kPa豎向荷載,固結(jié)完成后進(jìn)行慢剪試驗(yàn).
Pr()r是r的概率密度函數(shù),Ps()s是s的概率密度函數(shù),Pr()r和 ()Tr已知,且T-1()s滿足上述條件(1),有Ps()s=,已知一種重要變換函數(shù),關(guān)于上限的定積分的導(dǎo)數(shù)即為該上限的積分值(萊布尼茨準(zhǔn)則)。,對(duì)于離散值,其中rk是第k個(gè)灰度級(jí)(k=0,1,2,…,L-1);nk是圖像中灰度級(jí)為rk的像素個(gè)數(shù),n是圖像中像素的總數(shù)。已知變換函數(shù)的離散形式為:sk=Tr()k(k=0,1,2,…,L-1),sk稱作直方圖均衡化,由輸入圖像中灰度級(jí)rk(橫坐標(biāo))的像素映射到輸出圖像中灰度級(jí)sk(橫坐標(biāo))的對(duì)應(yīng)像素得到。
1.2.2 中值濾波
中值濾波法是一種非線性平滑技術(shù),它將每一像素點(diǎn)的灰度值設(shè)置為該點(diǎn)某鄰域窗口內(nèi)的所有像素點(diǎn)灰度值的中值。本文目標(biāo)判定的主要特征是形狀,而中值濾波有較好保護(hù)邊緣的作用。處理效果如圖1所示。
HOG(Histogram of Oriented Gradient,方向梯度直方圖)特征是一種在計(jì)算機(jī)視覺和圖像處理中用來(lái)進(jìn)行物體檢測(cè)的特征描述子,通過(guò)計(jì)算和統(tǒng)計(jì)圖像局部區(qū)域的梯度方向直方圖來(lái)構(gòu)成特征。SVM(Support Vector Machine,支持向量機(jī))是一類按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器。HOG特征結(jié)合SVM分類器已經(jīng)被廣泛用于圖像識(shí)別中[15-17]。
HOG特征是一種底層的視覺特征,主要描述圖像內(nèi)容的邊界。用于提取HOG特征的訓(xùn)練圖像必須能完整地描述病斑,即每張訓(xùn)練圖內(nèi)需要包含有一個(gè)能夠完整識(shí)別的病斑。原始病斑素材圖像一般采用手動(dòng)裁剪配合批量尺寸修改獲得。
為區(qū)分不同的水稻病斑,準(zhǔn)備訓(xùn)練樣本時(shí),將目標(biāo)識(shí)別病害圖像作為正樣本,其他非目標(biāo)識(shí)別病害圖像作為負(fù)樣本。如檢測(cè)稻瘟病時(shí),系統(tǒng)將稻瘟病作為訓(xùn)練正樣本,條紋葉枯病等其他病斑圖片及正常葉片作為訓(xùn)練負(fù)樣本。完整的HOG特征獲取流程如圖2所示。
SVM使?jié)M足分類要求的最優(yōu)線性分類超平面在保證分類精度的同時(shí),能夠使超平面兩側(cè)的空白區(qū)域最大化。
SVM的學(xué)習(xí)過(guò)程如下:
1)對(duì)樣本集合測(cè)試集進(jìn)行特征提取;
2)選用合適的核函數(shù)進(jìn)行變換,將輸入的樣本空間轉(zhuǎn)換到一個(gè)高維的RKHS(Reproducing Kernel Hilbert Space,RKHS);
圖2 HOG特征提取Fig.2 HOG feature extraction
3)在RKHS空間構(gòu)造最優(yōu)分離超平面,即搜索SVM,由得到的SVM構(gòu)造學(xué)習(xí)機(jī),完成樣本的訓(xùn)練;
4)經(jīng)過(guò)同樣預(yù)處理的未知類別數(shù)據(jù)輸入學(xué)習(xí)機(jī)進(jìn)行分類判別,得到學(xué)習(xí)結(jié)果,學(xué)習(xí)過(guò)程結(jié)束。
本試驗(yàn)采用Emgucv自帶機(jī)器學(xué)習(xí)類中的SVM進(jìn)行處理,且采用交叉驗(yàn)證后得到的準(zhǔn)確度最高的懲罰參數(shù)c和核函數(shù)參數(shù)g,再對(duì)整個(gè)訓(xùn)練集進(jìn)行訓(xùn)練得到SVM模型參數(shù)。試驗(yàn)選擇的核函數(shù)為徑向基核函數(shù),即,r>0其中,懲罰參數(shù)c=13.93,核函數(shù)參數(shù)g=2.64。
完整的訓(xùn)練及識(shí)別流程如圖3所示。
圖3 病斑檢測(cè)流程Fig.3 Cell detection process
用于病害識(shí)別的圖片所含信息通常比較復(fù)雜,如一張圖片內(nèi)包含多張植物葉片,病葉和健康葉混雜,病斑大小、數(shù)量差異大,病斑顏色有偏差,形狀有畸變等等(圖4),另外不同病害種類之間病斑特征也存在很大的差異,病斑診斷效果難以用單一指標(biāo)做出全面的評(píng)價(jià)。本試驗(yàn)用病害識(shí)別準(zhǔn)確率、病葉檢出率和病斑定位正確率3個(gè)遞進(jìn)指標(biāo)分別對(duì)條紋葉枯病、紋枯病、稻瘟病、霜霉病以及赤枯病5種水稻病害識(shí)別結(jié)果進(jìn)行評(píng)價(jià)。檢測(cè)結(jié)果如表1所示。
圖4 病斑檢測(cè)結(jié)果Fig.4 Cell detection results
表1 基于HOG+SVM的病斑識(shí)別結(jié)果Table 1 Classification result of diseases based on HOG+SVM
(1)病害識(shí)別準(zhǔn)確率
5種病害的識(shí)別率平均達(dá)到98.4%,其中條紋葉枯病、霜霉病以及赤枯病三種病害診斷正確率為100%,條紋葉枯病正確率為98%,病害識(shí)別正確率最低的為稻瘟病,識(shí)別準(zhǔn)確率為94%。由此可見,該方法可以較好地用于水稻病害的田間識(shí)別。
(2)病葉檢出率
病葉檢出率最高的為條紋葉枯病98.7%,最低的為霜霉病94.3%,累計(jì)5種病害的平均病葉檢出率為96.1%,該指標(biāo)可較好地用于病害程度的評(píng)估。
(3)病斑定位正確率評(píng)價(jià)
條紋葉枯病病斑定位正確率為98.2%,表現(xiàn)最好;其次為稻瘟病與霜霉病,病斑定位正確率分別為95.1%與96.0%;誤報(bào)率較高的為紋枯病與水稻赤枯病,病斑定位正確率分別為91.8%與91.7%。
綜上,該方法可較好的用于一些形態(tài)特征較明顯的病斑,對(duì)于特征不明顯病斑識(shí)別誤差略高。
(1)本方法對(duì)病害圖片的拍攝光源、拍攝角度和拍攝質(zhì)量有較好的包容性,照片可以由不同設(shè)備拍攝,也可通過(guò)網(wǎng)絡(luò)和其他渠道獲得,降低了訓(xùn)練和識(shí)別素材的獲取難度,整體需要用戶介入的步驟很少,水稻病害識(shí)別均值仍可達(dá)98.4%,此方法適合田間病害識(shí)別應(yīng)用,能夠滿足實(shí)際生產(chǎn)中病害診斷的需求。
(2)圖像處理過(guò)程簡(jiǎn)便,對(duì)樣本數(shù)量要求不高,無(wú)需先驗(yàn)知識(shí)。在預(yù)處理上,僅需對(duì)圖像進(jìn)行簡(jiǎn)單的亮度均衡以及中值濾波,對(duì)于成像質(zhì)量較好的設(shè)備所拍攝的照片甚至可以跳過(guò)此步驟,過(guò)程簡(jiǎn)便;在訓(xùn)練樣本獲取上具有可操作性,訓(xùn)練樣本需求數(shù)量遠(yuǎn)遠(yuǎn)小于深度學(xué)習(xí)方法。病葉漏報(bào)率平均僅為3.9%,適合水稻葉部常見病害識(shí)別。
(3)不同病害識(shí)別效果因病害特征不同存在差異?;贖OG+SVM的識(shí)別方式更適合斑塊明顯、邊緣清晰的病斑識(shí)別,以水稻條紋葉枯病為例,準(zhǔn)確率98%,漏報(bào)率1.315%,誤報(bào)率1.818%。不適合斑塊顏色較淺或形狀較為不規(guī)則的病斑識(shí)別,如水稻赤枯病的誤報(bào)率達(dá)到了8.333%,主要原因是測(cè)試圖片背景復(fù)雜及圖像中除病葉外的非病葉圖像元素干擾所致。
上海農(nóng)業(yè)學(xué)報(bào)2019年5期