李云昊,李仲賢,伏帥,張忠雪,茆士琴,馮琦勝,梁天剛*,李彥忠
(1. 蘭州大學(xué)草地農(nóng)業(yè)科技學(xué)院,草地農(nóng)業(yè)生態(tài)系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室,蘭州大學(xué)農(nóng)業(yè)農(nóng)村部牧草創(chuàng)新重點(diǎn)實(shí)驗(yàn)室,蘭州大學(xué)草地農(nóng)業(yè)教育工程研究中心,甘肅 蘭州 730020;2. 蘭州大學(xué)網(wǎng)絡(luò)安全與信息化辦公室,甘肅 蘭州 730000)
紫花苜蓿(Medicago sativa)具有營養(yǎng)價值高、適口性好等特點(diǎn),是我國飼養(yǎng)家畜的主要飼料之一[1]。據(jù)統(tǒng)計(jì),我國苜蓿種植面積約高達(dá)377 萬hm2[2]。然而,苜蓿為多年生牧草,病害一旦入侵便會持續(xù)影響多年,病害不僅會影響苜蓿產(chǎn)量[3-4],還會降低苜蓿的生產(chǎn)性能,導(dǎo)致家畜消化率大幅下降,并直接影響家畜的健康狀況和生育能力[5-6]。我國苜蓿種植地域廣,全國范圍內(nèi)都有種植,且病害發(fā)生普遍造成嚴(yán)重威脅,僅西北地區(qū)的苜蓿病害導(dǎo)致苜蓿減產(chǎn)最高超過60%[7]。由于苜蓿種植范圍廣,短期通過常規(guī)方法對大面積的栽培苜蓿進(jìn)行病害外業(yè)調(diào)查及鑒別的工作量極大。此外,苜蓿病害多為真菌病害,識別工作需要將采集的病株或病葉壓制成蠟葉標(biāo)本,進(jìn)行細(xì)致的癥狀觀察,經(jīng)過制片鏡檢后,詳細(xì)記錄病原菌形態(tài)[8],識別人員需要具有多年專業(yè)的病害鑒別經(jīng)驗(yàn)。多種苜蓿病害的表觀特征差異不明顯,苜蓿病害也具有多生共生的特點(diǎn),例如小光殼葉斑病、夏季黑莖葉斑病等葉斑病容易共生,導(dǎo)致不同時期不同病害同時出現(xiàn),會增加病害鑒別的難度[9-10]。因此傳統(tǒng)苜蓿病害鑒別方法耗時長,時效性差,即便專業(yè)人員也難以通過目視方式直觀觀察區(qū)分,不能及時識別出病害種類并提供防治建議,而根據(jù)積累經(jīng)驗(yàn)進(jìn)行苜蓿病害種類區(qū)分易產(chǎn)生誤判,不能簡單憑借表觀特征進(jìn)行病害鑒別??傮w而言,人工識別具有時效性差,效率低以及準(zhǔn)確度較低的缺點(diǎn)。研發(fā)更加快速、準(zhǔn)確、成本低,適合較大范圍識別苜蓿病害的鑒別手段,對提出關(guān)于苜蓿病害發(fā)生過程中更為高效的識別和防治策略具有重要的應(yīng)用價值。
近年來,利用深度學(xué)習(xí)的圖像識別方法在眾多行業(yè)發(fā)展迅速。深度學(xué)習(xí)具有對圖像處理的強(qiáng)大學(xué)習(xí)能力和實(shí)用價值,特別在涉及可見光圖像處理的領(lǐng)域已得到廣泛應(yīng)用[11-12],可以極大地提升工作效率[13]。自2006 年深度學(xué)習(xí)概念[14-17]被提出后,Krizhevsky 等[18]于2012 年實(shí)現(xiàn)了在圖形處理器(graphics processing unit, GPU)上的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN),此后提出多種基于CNN 的目標(biāo)檢測模型框架,在此工作基礎(chǔ)上,AlexNet 首次將ReLU 激活函數(shù),使用隨機(jī)梯度下降法(stochastic gradient descent, SGD)中的Dropout 方法和局部響應(yīng)歸一化(local response normalization, LRN)應(yīng)用在CNN 網(wǎng)絡(luò)中,使其在圖像分類方面具有較好的訓(xùn)練效果,過擬合的處理手段和激活函數(shù)的應(yīng)用方法也對后來的分類算法產(chǎn)生了重要的影響。
利用深度學(xué)習(xí)的圖像識別方法近年來在植物識別研究領(lǐng)域也逐漸得到應(yīng)用[19-23],例如產(chǎn)業(yè)界有花伴侶、草伴侶、微軟識花等植物識別系統(tǒng),此類系統(tǒng)主要以分辨植物種類為主,能夠識別的植物種類較為豐富但識別精度不高,通過校正預(yù)訓(xùn)練模型以及對訓(xùn)練參數(shù)進(jìn)行調(diào)整,可以進(jìn)一步提升識別精度和泛化能力。高宏元等[24]以預(yù)訓(xùn)練模型為基礎(chǔ)進(jìn)行訓(xùn)練模型所有層微調(diào),對InceptionV3 模型進(jìn)行改進(jìn),對293 種天然草地植物物種進(jìn)行識別訓(xùn)練,研究結(jié)果表明驗(yàn)證集的識別準(zhǔn)確率達(dá)到97.71%,相較于已有的產(chǎn)業(yè)界植物識別模型得到了更好的識別精確度和更高的識別效率。近年來公開的ImageNet(image-net.org)圖像大數(shù)據(jù)集和PlantVillage 植物病害公共數(shù)據(jù)集等公開圖像數(shù)據(jù)資料,可以用于不同神經(jīng)網(wǎng)絡(luò)的病害圖像識別研究。如李淼等[25]通過對AlexNet 和VGG(Visual Geometry Group Network)模型使用歸一化算法進(jìn)行優(yōu)化調(diào)整,使用PlantVillage 公開數(shù)據(jù)集訓(xùn)練得到預(yù)訓(xùn)練模型,最后使用瓶頸特征提取和遷移學(xué)習(xí)的方法降低過擬合后,對黃瓜(Cucumis sativus)和水稻(Oryza sativa)病害進(jìn)行特征提取,最終識別準(zhǔn)確率達(dá)到98.33%。許景輝等[26]實(shí)現(xiàn)了小數(shù)據(jù)樣本復(fù)雜田間背景下的玉米(Zea mays)病害圖像識別,提出了一種基于遷移學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)玉米病害圖像識別模型,在訓(xùn)練模型全部層和訓(xùn)練集數(shù)據(jù)擴(kuò)充的條件下,對玉米健康葉、大斑病葉、銹病葉圖像的平均識別準(zhǔn)確率為95.33%。在苜蓿病害防治領(lǐng)域主要由人工鑒別病害種類。秦豐等[27]基于Logistic 回歸模型對苜蓿的褐斑病和銹病訓(xùn)練構(gòu)建了識別模型,模型識別準(zhǔn)確度達(dá)到了96.59%,識別效果較好但識別種類少,不能很好地滿足多種苜蓿病害的識別。此外,在苜蓿病害領(lǐng)域的智能識別研究較少,同時缺乏較為成熟完整的苜蓿病害圖像數(shù)據(jù)庫作為苜蓿病害識別的數(shù)據(jù)支撐。建立較為完備的苜蓿病害數(shù)據(jù)庫,不僅可以為苜蓿病害研究提供參考依據(jù),同時能作為識別算法研究的基礎(chǔ)。
基于以上因素的考慮,本研究主要利用13 種苜蓿病害圖像數(shù)據(jù)和AlexNet 研究苜蓿病害的識別算法,分析苜蓿病害智能識別模型精度,探究識別算法在移動智能終端進(jìn)行苜蓿病害快速識別的可行性,可對提升苜蓿病害的識別效率和改進(jìn)識別方法提供技術(shù)支撐。
本研究主要針對我國苜蓿常見的病害,收集和采集了北方地區(qū)2016-2021 年間13 種田間栽培苜蓿病害圖像數(shù)據(jù),構(gòu)建了苜蓿病害識別數(shù)據(jù)庫。為了得到最佳的模型識別結(jié)果,采用樣地隨機(jī)角度拍攝和固定角度拍攝兩種方式采集圖片樣本,兼具單一背景和復(fù)雜背景環(huán)境兩類。單一背景使用微距鏡頭采集葉面細(xì)節(jié)信息,采集部位以病害葉片為主,獲取以葉片為單位的局部表觀特征;復(fù)雜背景圖像在苜蓿生長地拍攝,包括植株地上部分的莖、葉、花等部位,也包括病害植株的生長環(huán)境信息,如土壤及周邊植株生長狀態(tài)等信息。使用數(shù)碼相機(jī)或智能手機(jī)進(jìn)行圖像采集,保存RGB 可見光圖像。采集的圖片數(shù)量約為4000 張,進(jìn)行病害類別鑒定以及篩選后總計(jì)獲得有效圖片2922 張,共13 個類別(圖1);另外,為了區(qū)分健康苜蓿與有病害的苜蓿植物的差異,本研究也使用了1735張健康苜蓿圖片。
1.2.1 數(shù)據(jù)清洗 數(shù)據(jù)清洗是指對原數(shù)據(jù)可識別錯誤進(jìn)行糾正,處理無效數(shù)據(jù),將不符合訓(xùn)練要求以及無法辨識的圖片進(jìn)行處理后保留適用于訓(xùn)練的圖片,以保證數(shù)據(jù)的有效性和正確性。本研究的病害分組主要參照李彥忠等[28]編著的《紫花苜蓿病害圖譜》,對所有收集到的近4000 張照片進(jìn)行篩選并確認(rèn)其病害種類。由于諸多病害的表觀特征與正常葉片和缺素癥所導(dǎo)致的表觀特征十分相似,如黃萎病后期的枯黃現(xiàn)象在多種缺素癥中都有同樣的表現(xiàn),所以標(biāo)記環(huán)節(jié)重點(diǎn)需要區(qū)分病害種類,同時用健康苜蓿、枯草和裸地照片作為對照標(biāo)記組,并對由于反光造成的葉面黃色特征明顯,以及缺水造成的葉面枯黃卷曲等外界干擾進(jìn)行詳細(xì)的區(qū)分比對,將表觀特征不明顯且難以區(qū)分的照片予以剔除。
為區(qū)分苜蓿健康部位與病害部位,本研究基于13類苜蓿病害和健康苜蓿圖像構(gòu)建了苜蓿病害數(shù)據(jù)集用于深度學(xué)習(xí)模型訓(xùn)練,總計(jì)照片數(shù)量為2922 張。苜蓿病害數(shù)據(jù)集中各種類分布情況如表1 所示。
表1 苜蓿病害數(shù)據(jù)集Table 1 Alfalfa disease dataset
1.2.2 數(shù)據(jù)增強(qiáng) 深度神經(jīng)網(wǎng)絡(luò)具有較多的感知機(jī)組成的卷積層,以及全連接結(jié)構(gòu)的連接方式,每個感知機(jī)基本單元對于像素?cái)?shù)據(jù)的處理十分復(fù)雜,需要大量的訓(xùn)練樣本訓(xùn)練矯正和提取圖像特征數(shù)據(jù),單個角度的圖片過多會造成過擬合的情況,從而使模型的泛化能力變差,為了避免這些問題,本研究采用水平鏡像翻轉(zhuǎn)、垂直鏡像翻轉(zhuǎn)、順時針90°旋轉(zhuǎn)、順時針270°旋轉(zhuǎn)和隨機(jī)裁剪等數(shù)據(jù)增強(qiáng)方式,對有效樣本圖片進(jìn)行處理后(圖2),14 類苜蓿病害樣本圖片數(shù)量擴(kuò)充6 倍,總計(jì)達(dá)到27942 張圖片(表1)。使用數(shù)據(jù)增強(qiáng)后的圖庫作為訓(xùn)練以及驗(yàn)證栽培苜蓿病害模型的圖片數(shù)據(jù)集。
圖2 數(shù)據(jù)增強(qiáng)Fig.2 Examples of enhancing data
1.2.3 劃分?jǐn)?shù)據(jù)集 對于擴(kuò)增后的數(shù)據(jù)集,由于各個病害種類的照片樣本之間的數(shù)量差異也被擴(kuò)大,為避免隨機(jī)抽樣時分布不均,以每個病害種類為單位,使用分層隨機(jī)抽樣法分為訓(xùn)練集和驗(yàn)證集兩個部分,其中訓(xùn)練集占數(shù)據(jù)集的80%,參與深度學(xué)習(xí)的特征提取以及模型構(gòu)建;驗(yàn)證集占數(shù)據(jù)集的10%;剩余10%作為用于測試模型識別效果的測試集。采用隨機(jī)采樣方式,將數(shù)據(jù)庫中的圖像文件列表隨機(jī)取樣1/10 作為驗(yàn)證集。
本研究主要采用AlexNet 神經(jīng)網(wǎng)絡(luò)對苜蓿病害進(jìn)行圖像分類(圖3)。AlexNet 由5 個卷積層和2 個全連接層組成[29],卷積層數(shù)較多時,對于較大尺寸輸入圖像的特征提取效果更好,但是過多層數(shù)的卷積層反而會導(dǎo)致模型擬合能力變差。本研究搭建的AlexNet 網(wǎng)絡(luò)結(jié)構(gòu)使用基于Torch 的Python 版本Pytorch 作為框架,采用改進(jìn)型單層網(wǎng)絡(luò)結(jié)構(gòu),使用Pytorch 下的Linear 創(chuàng)建全連接層,開展了苜蓿病害識別模型的調(diào)參和建模分析。
圖3 簡化型AlexNet 網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Simplified structure of AlexNet model
在卷積神經(jīng)網(wǎng)絡(luò)中,模型訓(xùn)練并非使用原生尺寸圖像作為輸入數(shù)據(jù),首先需要進(jìn)行圖像壓縮,每個卷積核要對圖像中像素點(diǎn)進(jìn)行一定步長的特征提取,神經(jīng)網(wǎng)絡(luò)輸入像素過高首先會導(dǎo)致每個卷積核負(fù)擔(dān)的數(shù)據(jù)量過大,造成巨大的時間資源浪費(fèi),同時過于精細(xì)地提取局部的像素分布會導(dǎo)致不能更好地提取出整體的像素特征,且無法避免的將對焦距離和快門時間以及噪點(diǎn)造成的圖像干擾因素作為圖像特征,導(dǎo)入模型訓(xùn)練過程。因此,在訓(xùn)練之前需要對樣本圖像進(jìn)行一定程度的壓縮,使卷積核單次掃描面積處于合適的范圍內(nèi),并避免干擾因素在其中所占比例過大對訓(xùn)練結(jié)果產(chǎn)生影響。
在本研究中,簡化AlexNet 網(wǎng)絡(luò)結(jié)構(gòu)使用5 個卷積層和2 個全連接層,每個全連接層使用2048 個神經(jīng)元;使用ReLU 函數(shù)作為激活函數(shù),池化方式為MaxPooling;卷積核大小與原AlexNet 保持相同。
為了提升模型訓(xùn)練后的識別精度,以訓(xùn)練時的圖像輸入的像素壓縮為變量參數(shù),對其進(jìn)行相應(yīng)調(diào)整,以不同的壓縮程度將訓(xùn)練圖像數(shù)據(jù)集分為4 組,并對比不同圖像壓縮比例和訓(xùn)練后識別精度變化狀況。將樣本數(shù)量較多的6 類病害,分為3 組不同輸入的高分辨率組,測試高分辨率輸入尺寸的訓(xùn)練識別效果。
AlexNet 神經(jīng)網(wǎng)絡(luò)為降低資源占用,權(quán)衡算力與訓(xùn)練結(jié)果,默認(rèn)建議訓(xùn)練輸入圖像尺寸為224 像素×224 像素。為了增加卷積核的特征提取與輸出量,將高分辨率組首先使用512 像素×512 像素的默認(rèn)輸入進(jìn)行訓(xùn)練,將迭代次數(shù)設(shè)置為300 次以便于觀察隨著迭代次數(shù)增加,識別精度的收斂區(qū)域,并得到該尺寸輸入下的最優(yōu)識別精度。依據(jù)未參與訓(xùn)練的測試集進(jìn)行預(yù)測得出訓(xùn)練后的識別精度(圖4)。
圖4 研究技術(shù)路線Fig.4 Research technology roadmap
精度評價是苜蓿病害識別模型鑒別效果評判的重要方式。在本研究中,模型識別總體精度(accuracy,%)計(jì)算公式為:
式中:n是單個植物病害預(yù)測正確的數(shù)目;N是單個物種的樣本總數(shù);m是模型樣本類別總數(shù)。
2.1.1 模型識別精度分析 通過分組訓(xùn)練結(jié)果(表2~4)可以看出,模型識別總體精度與參與預(yù)訓(xùn)練的輸入樣本照片分辨率有密切的關(guān)系,二者基本上呈正相關(guān),在1200 像素×1200 像素左右總體識別精度達(dá)到最高。在13 種病害的4 組訓(xùn)練集模型中,512 像素×512像素分辨率組照片的測試結(jié)果最優(yōu)。在6 類病害3 種分辨率樣本照片測試中,苜蓿照片分辨率為1200 像素×1200 像素的訓(xùn)練效果最好,總體精度可達(dá)92.3%。
表2 13 類病害分組訓(xùn)練總體識別精度Table 2 Overall recognition accuracy of group training for 13 kinds of diseases
表3 5 類病害分組訓(xùn)練總體識別精度(低分辨率組)Table 3 Overall recognition accuracy of group training for five kinds of diseases (low resolution group)
將13 類病害與健康苜蓿圖像分為4 組進(jìn)行訓(xùn)練,其中224 像素×224 像素為AlexNet 的初始輸入尺寸,128 像素×128 像素、256 像素×256 像素、512 像素×512 像素3 組為按照等比規(guī)律排列的圖像尺寸。
在256 像素×256 像素、512 像素×512 像素兩組輸入分辨率基礎(chǔ)上加入768 像素×768 像素和1200 像素×1200 像素兩種不同訓(xùn)練輸入尺寸作為基準(zhǔn)分別進(jìn)行訓(xùn)練,研究測試高分辨率像素尺寸輸入得出模型的識別精度變化,最終1200 像素×1200 像素識別精度達(dá)到了最高,為92.3%,相較于256 像素×256 像素和512 像素×512 像素的輸入訓(xùn)練結(jié)果,模型識別精度升高,表明在高分辨率輸入尺寸的訓(xùn)練過程中,樣本圖像的特征信息提取效果隨輸入尺寸的升高而升高,但在1500 像素×1500 像素分組中,相較于1200 像素×1200 像素組模型識別精度下降,因?yàn)檫^高分辨率輸入尺寸導(dǎo)致神經(jīng)網(wǎng)絡(luò)提取數(shù)據(jù)量過大,模型無法較好地總結(jié)全局特征(表4)。
表4 5 類病害分組訓(xùn)練總體識別精度(高分辨率組)Table 4 Overall recognition accuracy of group training for five kinds of diseases (high resolution group)
2.1.2 不同輸入分辨率識別效果 隨著輸入分辨率的提升,4 組13 類病害和健康苜蓿不同分辨率訓(xùn)練過程中的識別精度并無明顯提升(圖5)。
圖5 13 類病害和健康苜蓿在4 組輸入尺寸下的識別精度變化Fig. 5 Recognition accuracy of 13 types of diseases and healthy alfalfa under four sets of input sizes
4 組5 類病害和健康苜蓿內(nèi)部識別精度在1200 像素×1200 像素圖片輸入尺寸較為明顯地高于其他3 個分組。表明在1200 像素×1200 像素左右達(dá)到較高識別精度(圖6)。
圖6 5 類病害和健康苜蓿在4 組輸入尺寸下的識別精度變化Fig. 6 Recognition accuracy changes of 5 types of diseases and healthy alfalfa under 4 sets of input sizes
在13 類病害參與訓(xùn)練時,512 像素×512 像素的輸入尺寸下的訓(xùn)練模型識別精度最高,為72.5%,在5類病害參與訓(xùn)練的1200 像素×1200 像素的輸入尺寸訓(xùn)練模型測試中,識別精度最高,可以達(dá)到92.3%,為最優(yōu)模型。
在深度學(xué)習(xí)訓(xùn)練中,樣本數(shù)量與模型訓(xùn)練結(jié)果有直接關(guān)系,樣本數(shù)量越多,提供的圖像特征越多,訓(xùn)練好的模型在預(yù)測時的識別精度越高,預(yù)測準(zhǔn)確性越好。參與訓(xùn)練的樣本類別增加通常會降低訓(xùn)練模型的精度(表5)。在病害樣本數(shù)量有限而種類增加的情況下,由于較低的樣本數(shù)量導(dǎo)致卷積層不能夠提取足夠多的特征參數(shù),是導(dǎo)致模型識別效果變差的主要原因。
表5 最優(yōu)模型測試集識別精度Table 5 Identification accuracy of the optimal model on the test set
本研究的13 種苜蓿病害中,褐斑病以及小光殼葉斑病具有相似的病斑特征,相較于其他病害識別精度明顯較低(表5)。這兩種病害在表觀特征上均為葉片表面有面積較小的斑點(diǎn)狀枯黃壞死的病斑分布。兩種病斑表觀特征極為相似,都具有中心枯黃的褐色小斑點(diǎn),同時病斑面積普遍較?。▓D7),普通的圖像采集設(shè)備較難采集到高分辨率的病斑圖像,對于模型的特征提取是較大的一個干擾因素。因此,訓(xùn)練的模型對這2 類病害有極大的誤判可能性,同時也降低了整體識別精度。
圖7 褐斑病與小光殼葉斑病早期階段對比Fig. 7 Comparison of brown spot and small light shell leaf spot at the early stage
苜蓿葉片的平均大小通常為1~3 cm2,在日常使用的絕大多數(shù)的影像采集設(shè)備中并不容易對此類大小的目標(biāo)采集到足夠清晰的質(zhì)量較高足以區(qū)分葉斑病一類病害的圖像信息。根據(jù)測試結(jié)果,褐斑病、夏季黑莖葉斑病以及小光殼葉斑病均有識別精度較低且易于混淆的情況出現(xiàn),這是由于目前常用的圖像采集設(shè)備并不能滿足在較小的空間尺度中捕捉到較為清晰的病害表觀特征的要求。智能手機(jī)是目前最常用的圖像采集設(shè)備,利用這類設(shè)備采集的病害圖像一般不能完整清晰表現(xiàn)部分病害的病斑細(xì)節(jié)特征,因此僅通過提高現(xiàn)有病害圖像分辨率等方法,其識別精度不會有明顯的提升空間。
影響病害識別精度的因素較多,但樣本圖像質(zhì)量和數(shù)量是關(guān)鍵。樣本圖片的采集方式對于深度學(xué)習(xí)特征提取具有十分重要的影響。單一背景如純色背景圖像可以避免前期訓(xùn)練中背景環(huán)境對于病害紋理特征提取效果的影響。而模型的泛化性能提升可以通過后期遷移學(xué)習(xí)達(dá)到這一目的。更加清晰的病害紋理可以有效地提升特征提取效率,因此在采集圖像時盡量選用光照良好的單一環(huán)境背景,因?yàn)樘镩g實(shí)拍的樣本圖片會因?yàn)轱L(fēng)力以及水分、光照的干擾導(dǎo)致病害表觀紋理特征受到干擾不能清晰成像,進(jìn)而影響識別效果。
對不能完整清晰表現(xiàn)病斑細(xì)節(jié)特征的圖像進(jìn)行分類識別時,可以預(yù)見其識別精度不會有明顯的提升空間。因此,在增加照片分辨率和清晰度的基礎(chǔ)上,應(yīng)考慮將參考病害植株的其他特征以及不同地理環(huán)境影響的病害發(fā)生率等作為變量之一,輔助提升病害的識別效果。
多病害共生同樣會影響訓(xùn)練效果。深度學(xué)習(xí)具有人工不可干涉的性質(zhì),無法直接對特征提取的過程進(jìn)行人為干預(yù),因此無法人工修正病害發(fā)生不同階段產(chǎn)生的不同表觀特征。霜霉病較為明顯的早期表觀特征是葉表面發(fā)生褪綠,葉面發(fā)黃,后期葉背面出現(xiàn)白色霉層;白粉病的中期在葉表面形成絲狀白色霉層;病毒病的癥狀表現(xiàn)為在葉片表面出現(xiàn)褪綠,葉面發(fā)黃。由此可見,白粉病中期癥狀與霜霉病后期癥狀極為相似,病毒病的癥狀則與霜霉病的早期癥狀較為相似。在表觀層面,這幾類病害在不同時期的癥狀特征不易區(qū)分,往往容易對特征提取產(chǎn)生干擾。
樣本數(shù)量是圖像分類以及目標(biāo)檢測的最主要影響因素,也是目前植物病害圖像識別領(lǐng)域的主要瓶頸問題。植物病害圖像往往需要高分辨率照相機(jī)采集,對大多數(shù)病害的鑒別主要依賴于專業(yè)人員和專用設(shè)備(如放大鏡、顯微鏡等)。建立一個完整的可用于深度學(xué)習(xí)圖像目標(biāo)檢測的樣本庫需要極大的人力、物力和時間成本。在植物病害領(lǐng)域,除了PlantVillage 有樣本量龐大的主要糧食作物的病害樣本圖像外,其余如牧草病害的樣本圖片則寥寥無幾。由于受照片質(zhì)量和數(shù)據(jù)共享等眾多因素的影響,目前可用于苜蓿病害識別的照片數(shù)量極其匱乏。
本研究的13 類苜蓿病害的總體識別精度為72.5%,其中照片數(shù)量多的5 類苜蓿病害最優(yōu)模型的總體識別精度可達(dá)92.3%,能對主要苜蓿病害進(jìn)行有效鑒別,可以搭載于栽培草地智能感知系統(tǒng),對栽培苜蓿病害發(fā)生狀況進(jìn)行多點(diǎn)位、大范圍的動態(tài)監(jiān)測,為病害識別及防治提供技術(shù)支持。同時,本研究訓(xùn)練得到的模型和整理的苜蓿病害圖像數(shù)據(jù)庫,可以為后續(xù)苜蓿病害研究提供重要參考。
在病害照片樣本數(shù)據(jù)短期內(nèi)無法得到大量補(bǔ)充,已有照片已進(jìn)行過數(shù)據(jù)清洗和數(shù)據(jù)增強(qiáng)的情況下,模型訓(xùn)練無法得到更多圖像特征,但輸入圖片分辨率對模型識別精度具有重要的影響,如輸入尺寸過小則單張圖像所能提供的像素特征也會減少。本研究所得出的最優(yōu)模型的輸入分辨率為1200 像素×1200 像素,由于第一層卷積層輸入信息量較大,導(dǎo)致模型對搭載平臺的算力要求較高。目前提升模型精度同時得到體積較小的模型,可嘗試小樣本訓(xùn)練方法[29-30]加以輔助,并測試模型識別效果。
在基于深度學(xué)習(xí)的圖像處理領(lǐng)域,自2000 年以來尤其是近10 年間發(fā)生了突飛猛進(jìn)的變化,誕生了以R-CNN(Region-CNN)為基礎(chǔ)的大量深度學(xué)習(xí)圖像處理算法,在2014 年產(chǎn)生以O(shè)ne-stage 為基本特征學(xué)習(xí)及預(yù)測的目標(biāo)檢測模型和以Two-stage 為基本特征學(xué)習(xí)及預(yù)測的目標(biāo)檢測模型兩條分支。其中的代表作有YOLO[31]系列、Fast-Rcnn[32]以及其后續(xù)的改進(jìn)型。目標(biāo)檢測已經(jīng)在監(jiān)控、智能無人駕駛以及人臉識別與檢測等領(lǐng)域有了較為廣泛的實(shí)際運(yùn)用。相較于圖像分類,目標(biāo)檢測是一個功能更加復(fù)雜但是學(xué)習(xí)效率和識別效果都十分強(qiáng)大的算法,相較于簡單的病害分類,目標(biāo)檢測可準(zhǔn)確地判識病害類型的同時,還可以框型方式標(biāo)記出病害所在區(qū)域,方便對于具體病害部位進(jìn)行識別。在苜蓿病害發(fā)生過程中,往往并不是單類病害集中在較小區(qū)域發(fā)生,病害通常具有較強(qiáng)的傳播性,因此在同一時空尺度容易產(chǎn)生多種病害。充分利用目標(biāo)檢測方法的優(yōu)勢是未來病害智能高效識別的重要研究方向,但需要前期大量高質(zhì)量的病害圖像數(shù)據(jù)的積累。
在栽培苜蓿病害檢測領(lǐng)域,目前尚無較為完善的圖像數(shù)據(jù)庫以供研究使用,這導(dǎo)致其他應(yīng)用較為廣泛的深度學(xué)習(xí)算法無法獲得足夠的訓(xùn)練參數(shù)以訓(xùn)練出具有實(shí)用價值的模型。因此,通過多種渠道和方式繼續(xù)擴(kuò)充數(shù)據(jù)庫,仍然是今后使用深度學(xué)習(xí)算法構(gòu)建高精度病害識別模型的關(guān)鍵環(huán)節(jié)。
本研究利用AlexNet 深度學(xué)習(xí)算法,經(jīng)過測試對比后采用2922 張有效苜蓿照片,采用對訓(xùn)練輸入圖像壓縮進(jìn)行訓(xùn)練的方式,構(gòu)建了一個較為理想的栽培苜蓿病害診斷模型,其中單類病害最高識別率可達(dá)92.3%,13 類病害平均分類精度為72.5%。該模型可以部署至網(wǎng)頁端和移動端,通過手持智能終端可以較為方便快速地識別苜蓿病害,以期為栽培苜蓿病害檢測及防治系統(tǒng)建設(shè)提供技術(shù)支持。