摘要:在玉米生長過程中,病蟲害對玉米的產(chǎn)量和質量均有較大的影響,因而有效地預防與治理玉米病蟲害對玉米產(chǎn)業(yè)甚至糧食安全具有十分重要的現(xiàn)實意義。玉米病蟲害的精準識別是實現(xiàn)病蟲害預防與治理的有效手段。然而,目前玉米病蟲害識別通常采用基于專家經(jīng)驗的人工識別方式,具有主觀性強、精確度不穩(wěn)定的缺點。為了解決這個問題,本研究提出一種基于改進神經(jīng)網(wǎng)絡算法的玉米病蟲害識別模型LSE-ResNet50。首先,通過在每個殘差模塊中引入SE注意力機制,通過對每個殘差模塊中的特征圖進行加權處理,來提高模型的特征提取能力,進而加快其收斂速度;然后,通過在損失函數(shù)中引入標簽平滑機制,對真實標簽進行一定的平滑處理防止模型過擬合,來進一步提升原模型的泛化能力。為了驗證本研究模型的有效性,在玉米病蟲害數(shù)據(jù)集上與其他5種經(jīng)典方法進行了對比試驗。結果表明,與其他經(jīng)典模型相比,本研究提出的改進模型LSE-ResNet50的收斂速度更快,識別準確率比原ResNet50模型提升了2.3百分點。LSE-ResNet50模型在識別效率和精確度方面均取得了較好的性能,因而是一種有效的玉米病蟲害識別模型。
關鍵詞:玉米;病蟲害識別;LSE-ResNet50;注意力機制;標簽平滑
中圖分類號:TP391.41 文獻標志碼:A
文章編號:1002-1302(2024)16-0239-06
玉米生長過程中容易受到各種疾病以及蟲害的干擾,玉米病蟲害對于玉米的產(chǎn)量和品質均有較大的影響。例如,玉米大斑病會感染玉米葉片導致葉片失去光合作用進而使產(chǎn)量降低;玉米螟會啃食玉米秸稈導致玉米營養(yǎng)輸送減少,玉米蚜蟲以及黏蟲會啃食葉片,導致葉片失去光合作用進而減少產(chǎn)量[1]。因此,有效地預防與治理玉米病蟲害對玉米產(chǎn)業(yè)甚至糧食安全具有十分重要的現(xiàn)實意義。病蟲害防治工作的前提是準確地識別病蟲害具體類別。在病蟲害類型識別方面,傳統(tǒng)的方式主要采用基于儀器輔助的人工識別方法。然而,人工識別方式存在主觀性強、性能不穩(wěn)定、誤判率較高等不足,因而在識別準確性、穩(wěn)定性、效率以及應用場景等方面不能很好地滿足現(xiàn)代農業(yè)生產(chǎn)和科學研究的需要[2]。
隨著機器學習理論和技術的不斷發(fā)展完善,基于機器學習算法的分類模型廣泛應用在各種模式識別領域,并取得了不錯的效果?;跈C器學習的病蟲害識別方法主要包括2個步驟:首先,使用某種機器學習算法在收集的農作物病害圖像數(shù)據(jù)集上進行學習,得到一個預測模型;然后,使用該模型對接下來遇到的農作物葉片病害進行識別和預測。
然而,傳統(tǒng)機器學習算法的識別精度對于所選擇特征的表征能力存在過度依賴現(xiàn)象,容易導致預測精度不穩(wěn)定的問題。其中,近年來,深度學習[3]迅速發(fā)展,能高效地實現(xiàn)數(shù)據(jù)的自動特征提取,并在圖像識別等領域取得了優(yōu)異性能,因而廣泛用于各種農作物的病害圖像處理和識別任務中,并顯著地優(yōu)于支持向量機[4]等傳統(tǒng)的機器學習算法。鑒于深度學習的卓越性能,本研究使用深度學習技術來對玉米病蟲害進行識別。
下面首先簡要回顧深度學習在各種農作物病害識別中的相關應用,然后提出本研究方法的基本思路。
(1)深度學習在農作物病害識別中的相關應用。
任維鑫等以ResNet18作為主干網(wǎng)絡,構建出了一個基于孿生網(wǎng)絡的度量模型,其被應用到AI Challenger 2018農業(yè)病蟲害數(shù)據(jù)集中蘋果的6種病害識別上,識別準確率達到了79.79%[5]。彭東海等利用ResNet50遷移學習、余弦退火學習利率衰減算法進行模型訓練,模型對西藏高原地區(qū)玉米種植中的4種病害的識別準確率達到81%[6-8]。顧博等以玉米小斑病、大斑病和灰斑病等3種病害的圖像作為訓練樣本,在實現(xiàn)GrabCut算法的自動分割的基礎上,融合基于顯著性的SLIC算法來對玉米病害圖像進行更好的目標識別和圖像分割,采用融合顯著信息的GrabCut算法與相同樣本數(shù)量和條件下的 One-Cut 算法、See78aa9ad81ea77706af4477fd17aa42LIC算法進行試驗和對比分析,通過訓練模式進行驗證,對于3種病害的識別率分別能夠達到87.2%、82.4%和83.6%[9]。
魯?shù)烟岢鼋?jīng)過微調遷移學習的MobileNet v2網(wǎng)絡,通過對本地田間玉米病害圖像進行實地測試,拍照上傳圖像識別的準確率為84%[10]。王澤鈞等提出一種基于注意力機制和多尺度特征融合的輕量型神經(jīng)網(wǎng)絡模型LMA-CNNs,模型在59類公開農作物病害圖像測試集上的準確率為88.08%[11]。張凈等提出一種基于多尺度注意力殘差網(wǎng)絡MSA-ResNet的農作物葉片病害識別方法,通過多尺度卷積,削弱無關特征的影響,對AI Challenger公開數(shù)據(jù)集中的13種常見農作物、17類病害的識別準確率達到89.93%[12]。
(2)本研究方法的基本思路。
上述研究表明,通過構建深度神經(jīng)網(wǎng)絡模型可較好地對農作物病蟲害進行識別。然而,盡管上述幾種玉米病蟲害識別方法在識別精度上有了較大的改進,但在泛化能力方面仍存在一定的提升空間。本研究通過對幾類常用網(wǎng)絡模型的對比試驗發(fā)現(xiàn),ResNet50模型在玉米病蟲害數(shù)據(jù)集上識別效果最好,因此本研究以ResNet50為基礎模型,提出一種改進的玉米病蟲害識別方法LSE-ResNet50。
本研究方法的基本思路如下:首先,通過在每個殘差模塊中引入注意力機制來提高模型的特征提取能力,進而加快收斂速度;然后,通過引入Label Smooth標簽平滑來進一步提升模型的泛化能力;最后,將本研究的LSE-ResNet50模型與未改進的ResNet50模型以及其他經(jīng)典模型進行對比。
1 玉米病蟲害數(shù)據(jù)集
本研究采用的數(shù)據(jù)集來自于百度飛槳中的玉米14類病蟲害公開數(shù)據(jù)集,共6 571張圖片。其中,劃分得到了訓練集5 264張、驗證集658張、測試集649張圖片,包括健康、黑粉病、灰斑病、南方銹病、絲黑穗病、穗腐病、紋枯病、小斑病、銹病、葉斑病、玉米螟、玉米蚜蟲、玉米葉螨、玉米黏蟲等常見病蟲害,玉米病蟲害圖像中各種病蟲害間的圖像特征不明顯,尤其是各類葉部病害的圖像特征較為相似,模型的訓練難以提取到深層信息,限制了模型準確率的提升,各類樣本如圖1所示。
2 卷積神經(jīng)網(wǎng)絡ResNet50
由于本研究提出的LSE-ResNet50模型是對ResNet50模型的改進,因此本節(jié)首先介紹ResNet50的基本結構與原理。
2.1 卷積神經(jīng)網(wǎng)絡ResNet50的結構
隨著卷積神經(jīng)網(wǎng)絡的不斷發(fā)展,對于深層特征的獲取,一味地增加卷積網(wǎng)絡的層數(shù)并不總是可行的。網(wǎng)絡超過一定的層數(shù),再繼續(xù)增加層數(shù)就會出現(xiàn)網(wǎng)絡退化的現(xiàn)象。ResNet[13-14](深度殘差網(wǎng)絡)引入了跨層連接,將輸入直接跨層傳遞,進行同等映射,再將輸入與卷積之后的結果進行相加。堆疊層不再符合底層映射,轉而全部符合殘差的映射,這種結構一定程度上解決了網(wǎng)絡退化的問題。殘差網(wǎng)絡的結構特點使得神經(jīng)網(wǎng)絡的訓練過程得以加快,它不僅有效地解決了網(wǎng)絡退化的現(xiàn)象,還實現(xiàn)了在模型大小與參數(shù)不變的情況下,模型識別精度與速度的提升,其結構如圖2所示。
ResNet50包含有49個卷積層和1個全連接層,ResNet50的整體結構如圖3所示,整體結構由Conv卷積層,Batch Norm歸一化層,ReLU激活函數(shù)等基礎結構構成。
2.2 卷積神經(jīng)網(wǎng)絡SENet的模塊構成
SENet由Hu等提出,主要思想是基于對通道之間的關系進行矯正,從而提升神經(jīng)網(wǎng)絡相關的特征[15],主要思想是壓縮與激勵,SENet的結構如圖4所示。
SENet首先進行Squeeze壓縮操作,將空間維度壓縮成一個通道描述符,使得每個二維的特征通道變?yōu)橐粋€具有全局感受野的數(shù)值,接著進行Excitation操作,為了利用Squeeze操作后的數(shù)值,基于每個通道的相關性,對應地生成權重,分別代表著各自特征的重要程度。最后再進行Scale操作[16],將得到的權重加權到對應的特征上,提升有利于任務特征的重要性,降低不利特征的重要性。
3 基于改進LSE-ResNet50的玉米病蟲害識別模型
基于ResNet50模型,本研究提出了一種改進 LSE-ResNet50模型。為增加模型的收斂速度、提高運行效率,引入SE注意力機制;為增加模型的識別精度,提高模型對玉米病蟲害圖像的特征提取能力,在模型訓練中引入標簽平滑。
3.1 引入注意力機制加快模型收斂速度
由于ResNet50模型在玉米病蟲害數(shù)據(jù)集上,訓練速度較慢、效率低,本研究將SE注意力模塊增加到ResNet50網(wǎng)絡結構中,在模型每個殘差模塊中引入SE注意力機制,從而對特征圖進行加權處理,提高模型的特征提取能力,進而加快模型收斂速度。首先進行全局池化層生成特征分布,完成提取信息編碼,然后通過激活函數(shù)ReLU以及Sigmiod控制機制,得到各個通道之間的相關性,其中ReLU兩端依舊是 1×1的全連接層[16],SE-ResNet網(wǎng)絡結構如圖5所示。
3.2 引入標簽平滑提升網(wǎng)絡泛化性能
為了進一步增強模型對于玉米病蟲害的特征提取能力,本研究將標簽平滑引入到模型訓練中,以對真實標簽進行平滑處理防止模型過擬合, 來進一步提升原模型的泛化能力。Label Smooth標簽平滑是由Szegedy等提出,針對one-hot可能帶來的過擬合問題,傳統(tǒng)的分類損失多使用softmax loss,對全連接進行計算softmax,再利用交叉熵進行計算[17]。Label Smooth標簽平滑引入了隨機噪聲,將目標變?yōu)榉莖ne-hot形式,其中ε代表超參數(shù),n為分類的類別個數(shù)。公式如下:
qi=ε/n-1,i≠target1-ε,i=target。(1)
標簽平滑中,損失的概率不再是1或0,這一定程度上增強了模型的泛化能力,且彌補了玉米病蟲害模型可能出現(xiàn)的過擬合問題,產(chǎn)生更好的校準網(wǎng)絡。因此,將SE注意力機制與Label Smooth標簽平滑綜合起來加入到模型訓練的過程中,可以進一步增加模型訓練的收斂速度、提高模型的泛化能力。
3.3 改進模型LSE-ResNet50的構建
本研究將SE注意力機制加入到了ResNet50基礎模型中,SE-ResNet模型的基礎結構如圖6所示。
首先,將ResNet50原模型加入SE注意力機制,后將中間模型訓練過程中的交叉熵損失函數(shù)替換為標簽平滑,針對玉米病蟲害進行模型訓練,進而得到改進后的LSE-ResNet50模型。
4 試驗研究
4.1 試驗設置
在有以下配置的計算機上進行試驗:Windows10操作系統(tǒng),16 GB RAM,CPU為AMD Ryzen7 7735H-3.20 GHz處理器,GPU為RTX4060,使用編程語言為Python 3.10,深度學習框架為Pytorch 1.7.1,試驗中設置訓練次數(shù)為40個epoch,訓練過程中使用AdamW優(yōu)化器,在玉米病蟲害數(shù)據(jù)集上進行訓練,以驗證本研究識別模型的有效性和穩(wěn)定性。
4.2 評價指標與試驗結果
本研究基于ResNet50模型進行優(yōu)化修改,在其網(wǎng)絡結構中增加SE注意力機制構建出SE-ResNet50模型。后通過已經(jīng)構建出的SE-ResNet50模型,將訓練中的交叉熵損失函數(shù)改進為Label Smooth標簽平滑損失函數(shù),以增加信息量,提高模型的泛化能力。
將改進得到的LSE-ResNet50模型與原ResNet50、SE-ResNet50以及VGG、MobileNet v2、EfficientNet的預測結果進行對比。評價指標為準確率、召回率、F1分數(shù)和混淆矩陣,LSE-ResNet50在準確率、召回率、F1分數(shù)中均表現(xiàn)最好(表1)。
由表1可以看出,引入SE注意力機制以及標簽平滑的LSE-ResNet50在準確率上最高,比VGG、MobileNet v2、EfficientNet、SE-ResNet50分別提升了3.2、33.7、4.0、0.7百分點。并且LSE-ResNet50在準確率、召回率以及F1分數(shù)上,對比原ResNet50模型分別提升了2.3、3.8百分點與0.040。
模型訓練中的損失值如圖7所示,由圖7中可以看出,隨著迭代次數(shù)的增加,引入SE注意力機制后的LSE-ResNet50比ResNet50原模型損失下降的更快,有著更快的收斂速度。對比原ResNet50模型,改進后模型識別精度的提升與收斂速度的下降,進一步證明了引入注意力機制與標簽平滑的有效性。試驗結果表明,LSE-ResNet50能夠實現(xiàn)玉米病蟲害的精準識別。
從圖8中各模型混淆矩陣可以看出,改進后的LSE-ResNet50 對比其他模型在各類型的玉米病蟲
害上的預測表現(xiàn)最好,其中對于玉米蚜蟲的預測錯誤較多,主要是因為蚜蟲個體較小,圖片上噪聲過多。同時其他幾個模型對于玉米絲黑穗的預測效果都存在著錯誤現(xiàn)象,而LSE-ResNet50對于玉米絲黑穗的預測準確率達到了100%。
5 結論
針對模型訓練收斂速度較慢、訓練效率低的問題,在每個殘差模塊中引入了SE注意力機制對每個殘差模塊中的特征圖進行加權處理,提高模型的特征提取能力,進而提升了模型的收斂速度。針對玉米病蟲害圖片深層特征難以提取、模型泛化能力不強的問題,在損失函數(shù)中引入了Label Smooth標簽平滑,對真實標簽進行一定的平滑處理防止模型過擬合,進一步提高了模型的泛化能力。試驗結果顯示,改進后的LSE-ResNet50準確率比原模型ResNet50提升了2.3百分點,對于玉米病蟲害的識別與防治有著一定的借鑒意義。為擴大模式適用范圍增加擴展性,今后將繼續(xù)收集及實地采樣,獲取更多玉米病蟲害圖片補充數(shù)據(jù)集,并進行更為細致的劃分,進一步完善與優(yōu)化模型結構。
參考文獻:
[1]張永新. 基于綠色防控技術的玉米病蟲害防治研究[J]. 黑龍江糧食,2023(1):104-106.
[2]翟肇裕,曹益飛,徐煥良,等. 農作物病蟲害識別關鍵技術研究綜述[J]. 農業(yè)機械學報,2021,52(7):1-18.
[3]曾文婕. 深度學習究竟是什么:來自歷史、共時和未來維度的探問[J]. 教育研究,2023,44(3):52-62.
[4]孫 瑜,張永梅,武玉軍. 基于粒子群算法和支持向量機的黃花菜葉部病害識別[J]. 中國農學通報,2022,38(8):135-140.
[5]任維鑫,曹新亮,白宗文. 一種單樣本農作物病害識別方法[J]. 無線電工程,2023,53(2):484-489.
[6]彭東海,袁輝勇,余煥杰,等. 基于深度遷移學習的果樹病蟲害識別研究與實踐[J]. 智慧農業(yè)導刊,2023,3(13):13-16.
[7]張文景,蔣澤中,秦立峰. 基于弱監(jiān)督下改進的CBAM-ResNet18模型識別蘋果多種葉部病害[J]. 智慧農業(yè)(中英文),2023,5(1):111-121.
[8]張正超,方文博,郭永剛. 基于ResNet50的西藏高原地區(qū)玉米病害識別系統(tǒng)[J]. 高原農業(yè),2022,6(2):164-172,212.
[9]顧 博,鄧蕾蕾,李 巍,等. 基于GrabCut算法的玉米病害圖像識別方法研究[J]. 中國農機化學報,2019,40(11):143-149.
[10]魯 笛. 基于遷移學習的玉米病害識別研究[D]. 鄭州:河南農業(yè)大學,2022:1-4. [HJ2.1mm]
[11]王澤鈞,馬鳳英,張 瑜,等. 基于注意力機制和多尺度輕量型網(wǎng)絡的農作物病害識別[J]. 農業(yè)工程學報,2022,38(增刊1):176-183.
[12]張 凈,李 進,劉曉梅. 基于多尺度注意力殘差網(wǎng)絡MSA-ResNet的農作物病害識別[J]. 軟件導刊,2023,22(4):148-155.
[13]He K M,Zhang X Y,Ren S Q,et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas,NV,USA.IEEE,2016:770-778.
[14]熊夢園,詹 煒,桂連友,等. 基于ResNet模型的玉米葉片病害檢測與識別[J]. 江蘇農業(yè)科學,2023,51(8):164-170.
[15]Hu J,Shen L,Sun G. Squeeze-and-excitation networks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). IEEE,2018:2011-2023.
[16]陳雪敏. 基于SE-ResNet模型的多角度人臉識別系統(tǒng)設計[J]. 貴陽學院學報(自然科學版),2020,15(4):10-13.
[17]Szegedy C,Vanhoucke V,Ioffe S,et al. Rethinking the inception architecture for computer vision[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas,NV,USA.IEEE,2016:2818-2826.
基金項目:山東省重大科技創(chuàng)新工程項目(編號:2019JZZY010706);山東省自然科學基金面上項目(編號:ZR2023MF098)。
作者簡介:馮 峰(1996—),男,山東棗莊人,碩士研究生,主要從事農業(yè)深度學習研究。E-mail:1152728515@qq.com。
通信作者:王志軍,博士,教授,主要從事農業(yè)信息化研究。E-mail:wzj@sdau.edu.cn。