管洪亮,李克峰,張廣淵,朱振方,王朋
Res-Efficient:應(yīng)用于作物病害自動(dòng)識別的輕量級模型
管洪亮,李克峰,張廣淵*,朱振方,王朋
山東交通學(xué)院 信息科學(xué)與電氣工程學(xué)院, 山東 濟(jì)南 250375
卷積神經(jīng)網(wǎng)絡(luò)模型可通過作物病害圖像準(zhǔn)確率較高地識別作物病害類型,達(dá)到防治作物病害的目的,但傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)模型存在模型尺寸大、遷移效果差等問題。針對這些問題,引入學(xué)習(xí)率動(dòng)態(tài)衰減訓(xùn)練策略,使用EfficientNetV2的Fused-MBConv和MBConv模塊替換ResNet18的部分殘差模塊,提出Res-Efficient模型。實(shí)驗(yàn)證明,使用學(xué)習(xí)率動(dòng)態(tài)衰減策略能提高Res-Efficient模型識別作物病害的準(zhǔn)確率,Res-Efficient模型在Plant Village和2018 AI Challenger測試集上分別達(dá)到99.70%和87.20%的準(zhǔn)確率,模型尺寸減少到14.0 MB。Res-Efficient模型能為移動(dòng)端和嵌入式設(shè)備部署作物病害自動(dòng)識別應(yīng)用提供參考。
作物病害; 自動(dòng)識別; 模型
病害是導(dǎo)致作物產(chǎn)量下降的重要因素之一,嚴(yán)重的病害會(huì)給作物種植者帶來巨大的經(jīng)濟(jì)損失[1]。作物病害大都能通過根系、花粉、孢子等媒介進(jìn)行傳播,因此在病害傳播的早期能準(zhǔn)確識別作物病害種類,就能通過切斷傳染源等手段阻斷病害的大面積傳播,減少經(jīng)濟(jì)損失[2-3]。傳統(tǒng)的作物病害識別主要以人工識別為主,通過觀察葉片的病變特征判斷病害類型,但這種方法過于依賴個(gè)人經(jīng)驗(yàn),主觀性強(qiáng),效率低[4]。隨著深度學(xué)習(xí)計(jì)算機(jī)視覺領(lǐng)域的迅速發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)模型逐漸應(yīng)用于農(nóng)業(yè)領(lǐng)域,解決農(nóng)業(yè)病害自動(dòng)識別問題。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型是將一個(gè)卷積核作為一個(gè)神經(jīng)單元對圖像進(jìn)行特征提取,通過平鋪和堆疊卷積核,實(shí)現(xiàn)對圖像深層特征的提取。Sladojevic S等[5]使用Caffe深度學(xué)習(xí)框架構(gòu)建CNN模型CaffeNet,該模型對訓(xùn)練的13種植物病害類型的識別精準(zhǔn)率平均達(dá)到96.3%,證明CNN模型識別植物病害類型的有效性。Hu WJ等[6]在實(shí)驗(yàn)中得到ResNet50模型在經(jīng)過預(yù)處理后的AI Challenger數(shù)據(jù)集上得到82.40%的模型精準(zhǔn)率,較AlexNet模型提高2.69%,ResNet50模型在相同數(shù)據(jù)集下,比AlexNet模型擁有更高的識別準(zhǔn)確率。
Sifre L等[7]提出深度可分離卷積(Depthwise separable convolution, DSC),DSC相比普通的卷積操作模型參數(shù)的計(jì)算量減少三分之二,Howard AG等[8]使用DSC構(gòu)造出MobileNet輕量級網(wǎng)絡(luò)模型,從此輕量級網(wǎng)絡(luò)在深度學(xué)習(xí)領(lǐng)域成為了一個(gè)熱門的研究方向。Tan M等[9]通過NAS技術(shù)搜索出MBConv和Fused-MBConv模塊的最佳超參數(shù)配比,提出的EfficientNetV2同時(shí)兼顧準(zhǔn)確率和輕量級兩個(gè)指標(biāo),使CNN模型性能進(jìn)一步提高。帖軍等[10]應(yīng)用輕量化模塊提出SK-Efficient模型,模型在Plant Village數(shù)據(jù)集上平均準(zhǔn)確率達(dá)到99.64%,模型參數(shù)量與ResNet模型相比減少84%。以上研究說明,通過使用輕量級模塊改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)模型,不僅能有較高的植物病害圖像識別能力,而且能大幅度降低模型尺寸和參數(shù)量。
通過上述研究發(fā)現(xiàn),CNN模型在作物病害圖像識別領(lǐng)域呈現(xiàn)準(zhǔn)確率越來越高,越來越輕量級的趨勢。且通過觀察農(nóng)業(yè)病害圖像的數(shù)據(jù)集發(fā)現(xiàn),相比于自然環(huán)境下多特征的植物病害圖片,作物病害葉片圖像具有病害特征明顯、噪聲少、易拍攝等特點(diǎn)。基于上述研究并結(jié)合作物病害葉片圖像的特點(diǎn),本文提出Res-Efficient模型,達(dá)到以更輕量級的模型取得準(zhǔn)確率高的作物病害分類效果,為提高水果產(chǎn)量,減少農(nóng)業(yè)經(jīng)濟(jì)損失提供技術(shù)支持
本文提出的Res-Efficient模型由1個(gè)卷積批量歸一化激活(Conv-BN-Act)模塊,2個(gè)Fused-MBConv模塊,2個(gè)Residual模塊,2個(gè)MBConv模塊和1個(gè)卷積池化全連接(Conv-Pooling-FC)模塊,共8個(gè)模塊串聯(lián)而成。模型總體結(jié)構(gòu)和模型主要參數(shù)見表1。
表 1 Res-Efficient模型參數(shù)
表1中的層數(shù)(Layer)表示模塊重復(fù)串聯(lián)的次數(shù),步距(Stride)表示該模塊第一個(gè)負(fù)責(zé)特征提取的卷積核步距大小,通道數(shù)(Channel)表示特征圖經(jīng)過該模塊后的特征圖數(shù)量,失活率(Dropout)表示輸出節(jié)點(diǎn)數(shù)的失活比例,膨脹系數(shù)(Expansion)表示深度可分離卷積核的個(gè)數(shù)與輸入通道數(shù)量的倍數(shù)關(guān)系。
卷積批量歸一化激活模塊由1個(gè)卷積(Convolution,Conv)層,1個(gè)BN(Batch Normalization)層和1個(gè)SiLU激活層組成。卷積池化全連接模塊由1個(gè)卷積層,1個(gè)自適應(yīng)平均池化層和1個(gè)全連接層組成。
其中:()表示均值函數(shù);V()示方差函數(shù);,是可學(xué)習(xí)的參數(shù)向量,默認(rèn)為1,為0;是作為一個(gè)極小值,防止除0操作;表示特征圖的元素;表示歸一化特征圖元素的結(jié)果。
其中:是特征圖的元素值;是可學(xué)習(xí)的參數(shù)向量,默認(rèn)為1。
主體框架包含2個(gè)Fused-MBConv模塊,2個(gè)殘差(Residual)模塊和2個(gè)MBConv模塊。主體框架中的模塊構(gòu)造如圖1所示。
圖 1 Res-Efficient主要模塊
Residual模塊是ResNet18的基礎(chǔ)殘差模塊,殘差模塊主要由3個(gè)尺寸為3的卷積核和一個(gè)shortcut連接組成。殘差模塊能將原始特征圖與經(jīng)過卷積處理生成的特征圖相加后得到新的特征圖。因?yàn)樽魑锊『θ~片圖像特征分布簡單,容易出現(xiàn)因卷積層不斷加深而造成的梯度爆炸和梯度消失問題。應(yīng)用Residual層則可以挖掘作物病害葉片圖像的深層特征,具體結(jié)構(gòu)如圖1(a)所示。
MBConv模塊是基于殘差模塊的一種改進(jìn)。首先將普通卷積操作替換為深度可分離卷積操作,即在殘差結(jié)構(gòu)的基礎(chǔ)上,增加2個(gè)尺寸為1的卷積核,實(shí)現(xiàn)深度可分離卷積操作。然后增加壓縮與激勵(lì)層,增加模型的自注意力機(jī)制,消除部分因參數(shù)量下降而造成準(zhǔn)確率降低的影響,提高模型預(yù)測的準(zhǔn)確度。該模塊的具體結(jié)構(gòu)如圖1(b)所示。
Fused-MBConv模塊是基于MBConv的改造,即去掉MBConv模塊中第一個(gè)用于升維的卷積層和用于對數(shù)據(jù)進(jìn)行壓縮和激勵(lì)的SE層,且根據(jù)膨脹系數(shù)決定是否進(jìn)行深度可分離卷積的逐點(diǎn)操作。Res-Efficient模型在淺層使用Fused-MBConv模塊可以減少網(wǎng)絡(luò)層數(shù),達(dá)到降低模型尺寸的效果,同時(shí)引入Fused-MBConv模塊可加快模型訓(xùn)練的速度。Fused-MBConv模塊的具體結(jié)構(gòu)如圖1(c)所示。
其中:l表示下一輪學(xué)習(xí)率;l表示最后一輪的學(xué)習(xí)率;表示當(dāng)前輪次的學(xué)習(xí)率;表示最大迭代次數(shù)。
Plant Village數(shù)據(jù)集[12]是公開的農(nóng)業(yè)病害數(shù)據(jù)集,包含9種作物的38種不同種類作物健康或病害的葉片圖片,共54303張,該數(shù)據(jù)集常用于識別農(nóng)業(yè)病蟲害的研究。
2018 AI Challenge病蟲害分類數(shù)據(jù)集(https://aistudio.baidu.com/aistudio/dataset detail/76075),該數(shù)據(jù)集是飛槳平臺(tái)AI Challenger 2018競賽的數(shù)據(jù)集,包含61種不同作物病害程度的葉片圖像。
將2018 AI Challenge病蟲害分類數(shù)據(jù)集,刪除11個(gè)圖像樣本數(shù)少于200的類別,剩下的50個(gè)類別的圖像將參與模型訓(xùn)練。對參與作物病害自動(dòng)識別模型的Plant Village和2018 AI Challenger數(shù)據(jù)集以3:1:1的比例劃分為訓(xùn)練集、驗(yàn)證集和測試集,劃分后的數(shù)據(jù)集樣本數(shù)量如表2所示。
表 2 數(shù)據(jù)集樣本劃分
本試驗(yàn)?zāi)P陀?xùn)練階段使用“騰訊云”的GPU計(jì)算型GN7-8核32G云服務(wù)器,GPU型號為Nvidia Tesla T4,顯存16 GB,內(nèi)存32 GB。操作系統(tǒng)為Ubuntu Server 20.04 LTS 64位。Cuda版本為11.2。
Adam和隨機(jī)梯度下降(SGD)是CNN模型訓(xùn)練時(shí)常用的優(yōu)化器,Res-Efficient作物病害自動(dòng)識別模型分別使用Adam和SGD優(yōu)化器進(jìn)行訓(xùn)練,并余弦漸進(jìn)式衰減動(dòng)態(tài)調(diào)整學(xué)習(xí)率策略進(jìn)行消融實(shí)驗(yàn),模型在兩個(gè)數(shù)據(jù)集的測試集上的實(shí)驗(yàn)結(jié)果如表3所示。
表 3 消融實(shí)驗(yàn)結(jié)果
從表3可看出,學(xué)習(xí)率動(dòng)態(tài)學(xué)習(xí)策略與Adam優(yōu)化器結(jié)合對Res-Efficient模型識別作物病害的準(zhǔn)確率提升幅度較小,與SGD優(yōu)化器結(jié)合對模型識別作物病害的準(zhǔn)確率提升幅度較大。Res-Efficient作物自動(dòng)識別模型在SGD優(yōu)化器結(jié)合學(xué)習(xí)率動(dòng)態(tài)衰減策略,在Plant Village和2018 AI Challenger兩個(gè)數(shù)據(jù)集上達(dá)到最高的準(zhǔn)確率,分別為99.70%和87.20%。
Res-Efficient作物病害自動(dòng)識別模型分別在Plant Village和2018 AI Challenger數(shù)據(jù)集上與ResNet18、ResNet50和EfficientNetV2原模型進(jìn)行訓(xùn)練過程的準(zhǔn)確率進(jìn)行對比訓(xùn)練過程對比見圖2。然后對上述4種模型在測試集上進(jìn)行評估,評估結(jié)果如表4所示。
(a) Plant Village數(shù)據(jù)集模型對比Comparison of plant village dataset models (b) 2018 AI Challenger數(shù)據(jù)集模型對比2018 AI challenger dataset model comparison
由圖2(a)可看出,Res-Efficient模型在Plant Village病害數(shù)據(jù)集上能以最快的速度收斂且收斂效果最好,同時(shí)該模型的準(zhǔn)確率也始終高于其他3個(gè)模型。由圖2(b)可看出,ResNet18在2018 AI Challenger作物病害數(shù)據(jù)集上的訓(xùn)練速度最快,但模型收斂效果不佳,Res-Efficient模型雖然訓(xùn)練時(shí)間比ResNet18長,但模型收斂的時(shí)間與ResNet18模型訓(xùn)練完成的時(shí)間相近,且收斂后的準(zhǔn)確率也高于其他3個(gè)模型。
表 4 模型評估結(jié)果
從表4可看出,本文設(shè)計(jì)的Res-Efficient模型與其他3個(gè)模型相比,在兩個(gè)作物病害數(shù)據(jù)集的測試集上得到的準(zhǔn)確率、精準(zhǔn)率、召回率和F1得分最高。Res-Efficient的模型尺寸僅為14.0MB,與性能相近的EfficientNetV2原模型尺寸相比降低83%,與ResNet18模型尺寸相比下降69%,模型輕量級程度大幅度提升。
本文提出了Res-Efficient自動(dòng)識別作物病害類別的輕量級模型,并使用學(xué)習(xí)率動(dòng)態(tài)衰減策略提高模型識別作物病害種類的準(zhǔn)確率。實(shí)驗(yàn)證明,使用SGD優(yōu)化器并結(jié)合學(xué)習(xí)率動(dòng)態(tài)衰減策略能使Res-Efficient模型識別作物病害類型的準(zhǔn)確率有較明顯的提升,在Plant Village和AI Challenger 2018數(shù)據(jù)集上分別得到99.70%和87.20%的準(zhǔn)確率。Res-Efficient模型尺寸僅為14.0 MB,為嵌入式和移動(dòng)端設(shè)備部署輕量級作物病害自動(dòng)識別應(yīng)用提供參考模型。
[1] 宋余慶,謝熹,劉哲,等.基于多層EESP深度學(xué)習(xí)模型的農(nóng)作物病蟲害識別方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2020,51(8):196-202
[2] King A. Technology: The future of agriculture [J]. Nature, 2017,544(7651):S21-S23
[3] 蘇仕芳,喬焰,饒?jiān)?基于遷移學(xué)習(xí)的葡萄葉片病害識別及移動(dòng)端應(yīng)用[J].農(nóng)業(yè)工程學(xué)報(bào),2021,37(10):127-134
[4] 王樹桐,王亞南,曹克強(qiáng).近年我國重要蘋果病害發(fā)生概況及研究進(jìn)展[J].植物保護(hù),2018,44(5):13-25
[5] Sladojevic S, Arsenovic M, Anderla A,. Deep neural networks based recognition of plant diseases by leaf image classification [J]. Computational Intelligence and Neuroscience, 2016,6:1-11
[6] Hu WJ, Fan J, Du YX,. MDFC–ResNet: an agricultural IoT system to accurately recognize crop diseases [J]. IEEE Access, 2020,8:115287-115298
[7] Sifre L, Mallat S. Rotation, scaling and deformation invariant scattering for texture discrimination [C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2013:1233-1240
[8] Howard AG, Zhu M, Chen B,. Mobilenets: Efficient convolutional neural networks for mobile vision applications [J]. arXiv preprint arXiv:1704.04861, 2017.
[9] Tan M, Le Q. Efficientnetv2: Smaller models and faster training [C]//International Conference on Machine Learning. PMLR,2021:10096-10106
[10] 帖軍,隆娟娟,鄭祿,等.基于SK-EfficientNet的番茄葉片病害識別模型[J].廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2022,40(4):104-114
[11] Ramachandran P, Zoph B, Le QV. Searching for activation functions [J]. arXiv preprint arXiv:1710.05941, 2017
[12] Mohanty SP, Hughes DP, Salathé M. Using deep learning for image-based plant disease detection [J]. Frontiers in Plant Science, 2016,7:1419
Res-Efficient: A Lightweight Model for Automatic Identification of Crop Diseases
GUAN Hong-liang, LI Ke-feng, ZHANG Guang-yuan*, ZHU Zhen-fang, WANG Peng
250375,
The convolutional neural network model can identify crop disease types with high accuracy through crop disease images to achieve the purpose of preventing and controlling crop diseases. However, the traditional convolutional neural network model has problems such as large model size and poor migration effect. To deal with these problems, a learning rate dynamic attenuation training strategy is introduced, and the Fused-MBConv and MBConv modules of EfficientNetV2 are used to replace part of the residual module of ResNet18, and the Res-Efficient model is proposed. Experiments have proved that using the learning rate dynamic decay strategy can improve the accuracy of the Res-Efficient model in identifying crop diseases. The Res-Efficient model achieved 99.70% and 87.20% accuracy on the Plant Village and 2018 AI Challenger test sets, respectively, and the model size was reduced. to 14.0 MB. The Res-Efficient model can provide a reference for deploying crop disease automatic identification applications on mobile terminals and embedded devices.
Crop disease; automatic identification; model
S41-30
A
1000-2324(2022)06-0858-05
2022-05-01
2022-06-04
管洪亮(1995-),男,碩士研究生,研究方向:機(jī)器人工程,計(jì)算機(jī)視覺. E-mail:cbxxghl@qq.com
Author for correspondence. E-mail:xdzhanggy@163.com
10.3969/j.issn.1000-2324.2022.06.007