石放 王瑩 王新法 馬玉琨
摘要:為克服傳統(tǒng)網(wǎng)絡(luò)模型結(jié)構(gòu)固化、對馬鈴薯病害識別率低的問題,以PlantVillage數(shù)據(jù)集中的五類馬鈴薯病害為研究對象,對圖像進(jìn)行隨機(jī)放大縮小、水平翻轉(zhuǎn)、垂直翻轉(zhuǎn)等操作進(jìn)行數(shù)據(jù)增強(qiáng)。使用一種基于網(wǎng)絡(luò)設(shè)計(jì)空間思想設(shè)計(jì)出具有高度靈活性的RegNet網(wǎng)絡(luò)模型,利用PoLy損失函數(shù)對RegNet進(jìn)行改進(jìn),并加入注意力機(jī)制,對數(shù)據(jù)增強(qiáng)后的馬鈴薯病害圖片進(jìn)行預(yù)測,再與傳統(tǒng)網(wǎng)絡(luò)模型AlexNet和GoogLeNet進(jìn)行對比。試驗(yàn)結(jié)果表明:改進(jìn)后的RegNetX在馬鈴薯識別方面具有良好的性能,最高準(zhǔn)確率可達(dá)99.8%,模型準(zhǔn)確率超過AlexNet與GoogLeNet,可為馬鈴薯病害識別作參考。
關(guān)鍵詞:馬鈴薯;農(nóng)作物病害;RegNet網(wǎng)絡(luò);圖像識別;網(wǎng)絡(luò)設(shè)計(jì)空間
中圖分類號:S435.32; TP391.4
文獻(xiàn)標(biāo)識碼:A
文章編號:2095-5553 (2024) 06-0229-06
收稿日期:2022年7月2日
修回日期:2022年9月16日
*基金項(xiàng)目:河南省科技攻關(guān)項(xiàng)目(212102110234,222102320080);河南省高等學(xué)校重點(diǎn)科研項(xiàng)目(22A210013);河南省博士后科研啟動項(xiàng)目(202102090);河南省新鄉(xiāng)市重大科技專項(xiàng)(21ZD003)
第一作者:石放,男,1997年生,河南周口人,碩士;研究方向?yàn)檗r(nóng)業(yè)信息化。E-mail: 281139088@qq.com
通訊作者:馬玉琨,女,1983年生,河南新鄉(xiāng)人,博士,副教授;研究方向?yàn)樾盘柼幚砼c識別。E-mail: yukuner@126.com
Research on potato disease identification based on RegNet network
Shi Fang, Wang Ying, Wang Xinfa, Ma Yukun
(Henan Institute of Science and Technology, Xinxiang, 453003, China)
Abstract: In order to overcome the problems of solidified structure of traditional network model and low recognition rate of potato diseases, five types of potato diseases in PlantVillage dataset are taken as the research object, and the images are randomly zoomed in and out, horizontally flipped, vertically flipped and so on for data enhancement. Then a RegNet network model with a high degree of flexibility is designed using a network-based design space idea, and the PoLy loss function is used to improve RegNet and the attention mechanism is added to predict the potato disease images after data enhancement, and the traditional network models are compared with AlexNet and GoogLeNet. The experimental results show that the improved RegNetX has good performance in potato recognition, the highest accuracy can reach 99.8%, and the model accuracy is higher than AlexNet and GoogLeNet, which can be used as a reference for potato disease recognition.
Keywords: potato; crop diseases; RegNet network; image recognition; network design space
0 引言
馬鈴薯的生產(chǎn)對我國居民的日常生活和國際蔬菜貿(mào)易有著重大的影響。然而在馬鈴薯的種植過程中,難免受到環(huán)境、氣候、土壤和病害的影響,其中病害是影響馬鈴薯減產(chǎn)的重要問題。傳統(tǒng)的馬鈴薯病害防治需要大量的植保人員根據(jù)他們已有的知識儲備和相關(guān)種植經(jīng)驗(yàn),人為地去判斷馬鈴薯是否發(fā)生了病害,這種識別的方法效率低、準(zhǔn)確率難以保證,具有一定的滯后性。
為解決農(nóng)作物病害識別的問題,國內(nèi)外學(xué)者進(jìn)行了相關(guān)研究。徐巖等[1]為解決馬鈴薯病害導(dǎo)致的減產(chǎn)問題,提出了一種基于注意力和殘差思想的深度卷積神經(jīng)網(wǎng)絡(luò)模型RANet,取得了93.86%的平均識別率。蒲秀夫等[2]使用二值化卷積神經(jīng)網(wǎng)絡(luò)模型對PlantVillage數(shù)據(jù)集共54 306張圖片進(jìn)行識別,試驗(yàn)表明二值化模型的計(jì)算速度遠(yuǎn)遠(yuǎn)高于原模型且準(zhǔn)確率可以達(dá)到96.8%。趙建敏等[3]為實(shí)現(xiàn)馬鈴薯葉片病害識別,設(shè)計(jì)了一種基于壓縮感知理論的馬鈴薯病害圖像分類方法,經(jīng)對比測試,采用字典學(xué)習(xí)的圖像分類方法對馬鈴薯三種葉片病害平均識別率可達(dá)95.33%。姜敏等[4]采用截取感興趣區(qū)域、圖片尺寸歸一化等預(yù)處理方式與SSD MobileNet v1等深度學(xué)習(xí)模型結(jié)合對水稻病害進(jìn)行識別,平均準(zhǔn)確率達(dá)到了75%。黨滿意等[5]基于機(jī)器視覺技術(shù)對馬鈴薯葉部晚疫病進(jìn)行檢測,提出顏色紋理形狀特征結(jié)合的識別方法,試驗(yàn)結(jié)果顯示對患病中期與后期的識別率分別為90%和92.5%。于洪濤等[6]使用Retinex算法結(jié)合VGG-F網(wǎng)絡(luò)模型對蘋果病害進(jìn)行識別,結(jié)果相較于原始的VGG模型,準(zhǔn)確率提高了5%。牛沖等[7]基于圖像灰度直方圖特征的草莓病害識別算法對草莓蛇眼病進(jìn)行識別,結(jié)果表明,SVM分類器的分類效果優(yōu)于其他分類器,準(zhǔn)確率達(dá)到90%以上。王林柏等[8]針對自然環(huán)境下馬鈴薯葉片病害識別率低和晚疫病斑定位難的問題,提出一種改進(jìn)型的CenterNet-SPP模型,對馬鈴薯葉片病害進(jìn)行識別,試驗(yàn)結(jié)果表明訓(xùn)練后的模型在驗(yàn)證集下的mAP可達(dá)90.03%,準(zhǔn)確率為94.93%,召回率為90.34%,F(xiàn)1值為92.58%。
然而傳統(tǒng)的機(jī)器學(xué)習(xí)方法與普通的卷積神經(jīng)網(wǎng)絡(luò)模型[9-12]具有識別率低、網(wǎng)絡(luò)結(jié)構(gòu)固化等局限性,基于此問題,本文使用數(shù)據(jù)增強(qiáng)技術(shù)對數(shù)據(jù)進(jìn)行擴(kuò)充以增加網(wǎng)絡(luò)的魯棒性,采用更具靈活性的RegNet模型對5類馬鈴薯病害圖片進(jìn)行識別,并針對識別率低的問題引入注意力機(jī)制[13-18]和PolyLoss[19]以提高識別準(zhǔn)確率,最后與AlexNet和GooLeNet的準(zhǔn)確率和訓(xùn)練時長進(jìn)行對比分析,能為馬鈴薯病害識別作為參考。
1 RegNet網(wǎng)絡(luò)模型
1.1 RegNet設(shè)計(jì)原理
RegNet[20]是2020年由何凱明團(tuán)隊(duì)在《Designing Network Design Spaces》提出的。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)一般都是基于神經(jīng)結(jié)構(gòu)搜索(Neural Architecture Search)思想,其特點(diǎn)為在特定的設(shè)計(jì)空間內(nèi)通過搜索算法從而尋找出最佳的參數(shù)組合,具有一定的局限性,而RegNet的設(shè)計(jì)者不再只局限于單一網(wǎng)絡(luò)的設(shè)計(jì),而是通過研究網(wǎng)絡(luò)設(shè)計(jì)空間,來探索出相對不被定義的網(wǎng)絡(luò)模型簇。
RegNet的設(shè)計(jì)者采用誤差評估的方法對設(shè)計(jì)空間的質(zhì)量進(jìn)行評價,其表達(dá)式如式(1)所示。
F(e)=1n∑ni=11[ei 式中:n——設(shè)計(jì)空間在ImageNet上訓(xùn)練的模型個數(shù); e——訓(xùn)練誤差; F(e)——誤差小于e的模型比例。 RegNet的設(shè)計(jì)者提出了初始設(shè)計(jì)空間(AnyNet)這一概念,AnyNet由三層結(jié)構(gòu)組成,這種結(jié)構(gòu)猶如植物的生長結(jié)構(gòu)一樣,分別是莖部、身體和頭部。其結(jié)構(gòu)如圖1(a)所示。其中莖部和頭部在結(jié)構(gòu)中固定不變。莖部為一個3×3大小,步長為2,卷積核個數(shù)為32的普通卷積層。頭部由一個全局平均池化層和全連接層組成,用于預(yù)測分類。而身體內(nèi)部則是由4個階段構(gòu)成,這些階段的分辨率r逐步降低,如圖1(b)所示,每一個階段內(nèi)又由若干個模塊組成,默認(rèn)第一個塊使用的步長為2,如圖1(c)所示,但模塊的參數(shù)不受限制,可以是任意可能的組合。圖1中w表示網(wǎng)絡(luò)深度,r表示分辨率,n表示輸出類別的個數(shù)。 AnyNet中的block結(jié)構(gòu)主分支由一個1×1的卷積核,一個3×3的組卷積,最后再接一個1×1的卷積組成,當(dāng)步長為1時,捷徑分支不作處理,如圖2(a)所示,當(dāng)步長為2時,僅通過一個1×1的卷積,如圖2(b)所示。 其中w為網(wǎng)絡(luò)深度,r為分辨率,g為組卷積中每個組的組寬,b為瓶頸比。這種模塊結(jié)構(gòu)被定義為“X模塊”,通過X模塊的各種組合可以使網(wǎng)絡(luò)靈活地應(yīng)用于各種場景,RegNetX網(wǎng)絡(luò)就是基于此來設(shè)計(jì)的,本文使用RegNetX網(wǎng)絡(luò)模型進(jìn)行馬鈴薯病害識別試驗(yàn)。 1.2 RegNet網(wǎng)絡(luò)改進(jìn) 為解決識別率低的問題,本文在RegNetX網(wǎng)絡(luò)中引入了注意力機(jī)制,同時使用PolyLoss損失函數(shù)替換了傳統(tǒng)的交叉熵?fù)p失函數(shù)。 1.2.1 SE模塊 SE全稱Squeeze-and-Excitation,是一種注重通道的注意力機(jī)制,主要由Squeeze和Excitation兩部分組成,結(jié)構(gòu)如圖3所示,其中W為特征圖的寬,H為特征圖的高,C為通道數(shù),輸入特征圖大小為W×H×C。 SE模塊的壓縮操作實(shí)際是一個全局平均池化操作,通過壓縮操作使特征圖變?yōu)?×1×C向量。其流程如圖4(a)所示。SE模塊的激勵操作由兩個全連接層和兩個激活函數(shù)組成,第一個全連接層有C×SERatio個神經(jīng)元,輸入為1×1×C,輸出1×1×C×SERadio,后接一個ReLu激活函數(shù)。第二個全連接層有C個神經(jīng)元,輸入為1×1×C×SERadio,輸出為1×1×C,后接一個Sigmoid激活函數(shù)。其流程如圖4(b)所示。 最后執(zhí)行scale操作,在得到1×1×C向量后,對原來的特征圖進(jìn)行scale操作,即通道權(quán)重相乘,原有特征向量為W×H×C,將SE模塊計(jì)算出來的各通道權(quán)重值分別和原特征圖對應(yīng)通道的二維矩陣相乘,得出的結(jié)果輸出。 1.2.2 PolyLoss損失函數(shù) PolyLoss來自交叉熵?fù)p失函數(shù)的泰勒展開式,如式(2)所示。 LCE=-log(Pt)=∑∞j=11/j(1-Pt)j =(1-Pt)+1/2(1-Pt)2…(2) 式中:Pt——目標(biāo)類標(biāo)簽的預(yù)測概率; (1-Pt)j——每個多項(xiàng)式基,在使用泰勒公式展開交叉熵后,可知其多項(xiàng)式系數(shù)為1/j,但這些系數(shù)過于固定,并不是所有模型和任務(wù)的最優(yōu)條件。 PolyLoss在此基礎(chǔ)上添加了一個可調(diào)整項(xiàng)ε1·(1-Pt),從而形成一個更為靈活的框架,通過調(diào)整ε1的值來更好地提升模型效果,其表達(dá)式如式(3)所示。 LPoly-1=(1+ε1)(1-Pt)+1/2(1-Pt)2+… =-log(Pt)+ε1(1-Pt)(3) PolyLoss可以根據(jù)不同模型調(diào)整適用參數(shù)這一特點(diǎn)相對于傳統(tǒng)的交叉熵?fù)p失函數(shù)更為靈活與精準(zhǔn),本文使用PolyLoss代替交叉熵?fù)p失函數(shù)。 2 數(shù)據(jù)來源和數(shù)據(jù)增強(qiáng) 本文采取PlantVillage數(shù)據(jù)集中的馬鈴薯細(xì)菌斑、早疫病、晚疫病、葉霉菌、七星葉斑病五種常見病害作為研究對象,原始數(shù)據(jù)馬鈴薯細(xì)菌斑圖片數(shù)量為2 127張、馬鈴薯早疫病圖片數(shù)量為1 000張、馬鈴薯晚疫病圖片數(shù)量為1 909張、馬鈴薯葉霉菌圖片數(shù)量為952張、馬鈴薯七星葉斑病圖片數(shù)量為1 771張,總數(shù)量為7 759張。由于原始數(shù)據(jù)量較少,又通過網(wǎng)絡(luò)爬蟲爬取部分?jǐn)?shù)據(jù),篩選可用數(shù)據(jù),對每一類病害圖片進(jìn)行標(biāo)注,并分別放入Tomato_Bacterial_spot、Tomato_Early_blight、Tomato_Late_blight、Tomato_Leaf_Mold、Tomato_Septoria_leaf_spot文件夾中,按8∶2的比例劃分訓(xùn)練集和測試集。部分爬取結(jié)果如圖5所示,整合后部分?jǐn)?shù)據(jù)集如圖6所示,圖6中第三行為爬取圖片。 本試驗(yàn)對原始數(shù)據(jù)集進(jìn)行了數(shù)據(jù)增強(qiáng),數(shù)據(jù)增強(qiáng)是一種重要的深度學(xué)習(xí)方法之一,是基于已有的訓(xùn)練樣本數(shù)據(jù)來生成更多的訓(xùn)練數(shù)據(jù),其目的就是為了使擴(kuò)增的訓(xùn)練數(shù)據(jù)盡可能接近真實(shí)分布的數(shù)據(jù),從而提高檢測精度。此外,數(shù)據(jù)增強(qiáng)能夠迫使模型學(xué)習(xí)到更多魯棒性的特征,從而有效提高模型的泛化能力。本文采用的數(shù)據(jù)增強(qiáng)操作包括隨機(jī)放大縮小、水平翻轉(zhuǎn)、垂直翻轉(zhuǎn)、隨機(jī)度數(shù)旋轉(zhuǎn)、明暗度調(diào)整、平移、添加噪聲、模糊等,圖7為進(jìn)行過數(shù)據(jù)增強(qiáng)后的效果圖。 經(jīng)數(shù)據(jù)增強(qiáng)后,馬鈴薯細(xì)菌斑圖片數(shù)量為4 650張、馬鈴薯早疫病圖片數(shù)量為2 996張、馬鈴薯晚疫病圖片數(shù)量為4 165張、馬鈴薯葉霉菌圖片數(shù)量為3 478張、馬鈴薯七星葉斑病圖片數(shù)量為4 279張,總數(shù)量為19 568張。 3 試驗(yàn)和結(jié)果分析 3.1 環(huán)境配置 本文試驗(yàn)采用個人計(jì)算機(jī),具體參數(shù)配置見表1。 3.2 試驗(yàn)參數(shù) 本文使用Pytorch框架搭建RegNetX200MF網(wǎng)絡(luò),并采用遷移學(xué)習(xí)加快模型收斂速度,遷移學(xué)習(xí)是將在某一領(lǐng)域或任務(wù)中學(xué)到的知識或模式應(yīng)用到不同但相關(guān)的領(lǐng)域或問題上,在訓(xùn)練過程中,模型提升的速率更快,訓(xùn)練結(jié)束后得到的收斂性更好,本文把在ImageNet中學(xué)習(xí)到的知識遷移到試驗(yàn)當(dāng)中。并與AlexNet和GoogLeNet訓(xùn)練的結(jié)果進(jìn)行對比。 RegNetX200MF設(shè)置學(xué)習(xí)率為0.001,batch size(一次訓(xùn)練選取的樣本數(shù)量)設(shè)為16,epoch設(shè)為15,優(yōu)化器選擇SGD。AlexNet與GoogLeNet設(shè)置學(xué)習(xí)率為0.000 1,batch size設(shè)為32,epoch設(shè)為100,優(yōu)化器選擇Adam。 3.3 不同模型的結(jié)果分析 不同模型的準(zhǔn)確率和損失值對比如圖8、圖9所示。由圖8和圖9對比可以明顯看到,RegNetX200MF在第11個epoch時開始收斂,而AlexNet和GoogLeNet直至100個epoch才收斂,收斂速度遠(yuǎn)遠(yuǎn)不如RegNetX200MF。 三種網(wǎng)絡(luò)模型的測試準(zhǔn)確率、損失值及訓(xùn)練耗時如表2所示。 由表2對比可知,AlexNet和GooLeNet的準(zhǔn)確率分別為98.9%和99.1%,RegNetX200MF的準(zhǔn)確率最高可達(dá)99.8%,分別高于AlexNet 0.9個百分點(diǎn)和GooLeNet 0.7個百分點(diǎn),說明RegNetX200MF在準(zhǔn)確率上要由于AlexNet和GooLeNet。但在模型收斂后,RegNetX200MF的損失值在0.105上下輕微浮動,GooLeNet的損失值約為0.06,AlexNet的損失值最少,約在0.053左右,說明RegNetX200MF在損失值上還有改進(jìn)的空間。在訓(xùn)練耗時上,RegNetX200MF用了5.3 h,低于GooLeNet的9.3 h,高于AlexNet的2.2 h,說明RegNetX200MF在網(wǎng)絡(luò)結(jié)構(gòu)上還有優(yōu)化的空間。 3.4 不同病害的結(jié)果分析 本文使用精準(zhǔn)率Precision、召回率Recall作為不同病害識別性能評價指標(biāo)。 Precision=TNFP+TN(4) Recall=TPTP+FN(5) 式中:TP——真實(shí)值為正且預(yù)測也為正的樣本數(shù)量,記為真陽性; TN——真實(shí)值為負(fù)且預(yù)測也為負(fù)的樣本數(shù)量,記為真陰性; FP——真實(shí)值為負(fù)但預(yù)測為正的樣本數(shù)量,記為假陽性; FN——真實(shí)值為正但預(yù)測為負(fù)的樣本數(shù)量,記為假陰性。 使用RegNetX200MF模型對馬鈴薯細(xì)菌斑、早疫病、晚疫病、葉霉菌、七星葉斑病五類病蟲害進(jìn)行測試,按數(shù)據(jù)集8∶2的比例隨機(jī)劃分測試集,約3 900多張圖片,評價結(jié)果如表3所示。 由表3可以看出,RegNetX200MF網(wǎng)絡(luò)對馬鈴薯五類病害的識別的精準(zhǔn)率平均值為98.74%,召回率的平均值為98.6%,模型表現(xiàn)與各類指標(biāo)呈正比,且五類病害指標(biāo)都比較均勻,平均值都在95%以上,說明模型表現(xiàn)較好,各類病害測試的混淆矩陣如圖10所示,隨機(jī)抽取圖片對五類病害單張圖片進(jìn)行測試,部分結(jié)果如圖11所示。 4 結(jié)論 1) 針對傳統(tǒng)模型識別馬鈴薯病害準(zhǔn)確率不高的問題,本文使用經(jīng)過Poly損失函數(shù)和注意力機(jī)制改進(jìn)的RegNetX200MF網(wǎng)絡(luò)對五類馬鈴薯病害進(jìn)行識別試驗(yàn),并與傳統(tǒng)網(wǎng)絡(luò)模型AlexNet和GooLeNet進(jìn)行對比分析。 2) 所采用的RegNetX200MF在馬鈴薯識別方面具有良好的性能,準(zhǔn)確率最高可達(dá)99.8%,超過傳統(tǒng)的AlexNet和GooLeNet,適合作用于馬鈴薯病害識別。 3) 綜上所述,經(jīng)過Poly損失函數(shù)和注意力機(jī)制改進(jìn)的RegNetX200MF網(wǎng)絡(luò)在馬鈴薯病害識別方面表現(xiàn)良好,可為農(nóng)作物病害識別提供參考,對農(nóng)業(yè)信息化的發(fā)展具有推動意義。 參 考 文 獻(xiàn) [1]徐巖, 李曉振, 吳作宏, 等. 基于殘差注意力網(wǎng)絡(luò)的馬鈴薯葉部病害識別[J]. 山東科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2021, 40(2): 76-83. Xu Yan, Li Xiaozhen, Wu Zuohong, et al. Potato leaf disease recognition via residual attention network [J]. Journal of Shandong University of Science and Technology (Natural Science), 2021, 40(2): 76-83. [2]蒲秀夫, 寧芊, 雷印杰, 等. 基于二值化卷積神經(jīng)網(wǎng)絡(luò)的農(nóng)業(yè)病蟲害識別[J]. 中國農(nóng)機(jī)化學(xué)報(bào), 2020, 41(2): 177-182. Pu Xiufu, Ning Qian, Lei Yinjie, et al. Identification of agricultural plant diseases based on binarized convolutional neural network [J]. Journal of Chinese Agricultural Mechanization, 2020, 41(2): 177-182. [3]趙建敏, 蘆建文. 基于字典學(xué)習(xí)的馬鈴薯葉片病害圖像識別算法[J]. 河南農(nóng)業(yè)科學(xué), 2018, 47(4): 154-160. Zhao Jianmin, Lu Jianwen. Identification algorithm of potato diseases on leaves using dictionary learning theory [J]. Journal of Henan Agricultural Sciences, 2018, 47(4): 154-160. [4]姜敏, 沈一鳴, 張敬堯, 等. 基于深度學(xué)習(xí)的水稻病蟲害診斷方法研究[J]. 洛陽理工學(xué)院學(xué)報(bào)(自然科學(xué)版), 2019, 29(4): 78-83. Jiang Min, Shen Yiming, Zhang Jingyao, et al. Research on rice diseases and pests diagnosis based on deep learning [J]. Journal of Luoyang Institute of Science and Technology (Natural Science Edition), 2019, 29(4): 78-83. [5]黨滿意, 孟慶魁, 谷芳, 等. 基于機(jī)器視覺的馬鈴薯晚疫病快速識別[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2020, 36(2): 193-200. Dang Manyi, Meng Qingkui, Gu Fang, et al. Rapid recognition of potato late blight based on machine vision [J]. Transactions of the Chinese Society of Agricultural Engineering, 2020, 36(2): 193-200. [6]于洪濤, 袁明新, 王琪, 等. 基于VGG-F動態(tài)學(xué)習(xí)模型的蘋果病蟲害識別[J]. 科學(xué)技術(shù)與工程, 2019, 19(32): 249-253. Yu Hongtao, Yuan Mingxin, Wang Qi, et al. Recognition of apple pests and diseases based on VGG-F dynamic leaming model [J]. Science Technology and Engineering, 2019, 19(32): 249-253. [7]牛沖, 牛昱光, 李寒, 等. 基于圖像灰度直方圖特征的草莓病蟲害識別[J]. 江蘇農(nóng)業(yè)科學(xué), 2017, 45(4): 169-172. Niu Chong, Niu Yuguang, Li Han, et al. Strawberry disease recognition based on image gray histogram feature [J]. Jiangsu Agricultural Science, 2017, 45(4): 169-172. [8]王林柏, 張博, 姚竟發(fā), 等. 基于卷積神經(jīng)網(wǎng)絡(luò)馬鈴薯葉片病害識別和病斑檢測[J]. 中國農(nóng)機(jī)化學(xué)報(bào), 2021, 42(11): 122-129. Wang Linbai, Zhang Bo, Yao Jingfa, et al. Potato leaf disease recognition and potato leaf disease spot detection based on Convolutional Neural Network [J]. Journal of Chinese Agricultural Mechanization, 2021, 42(11): 122-129. [9]趙晉陵, 詹媛媛, 王娟, 等. 基于SE-UNet的冬小麥種植區(qū)域提取方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2022, 53(9): 189-196. Zhao Jinling, Zhan Yuanyuan, Wang Juan, et al. SE-UNet-Based extraction of winter wheat planting areas [J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(9): 189-196. [10]張為, 李璞. 基于注意力機(jī)制的人臉表情識別網(wǎng)絡(luò)[J]. 天津大學(xué)學(xué)報(bào)(自然科學(xué)與工程技術(shù)版), 2022, 55(7): 706-713. Zhang Wei, Li Pu. Facial expression recognition network based on attention mechanism [J]. Journal of Tianjin University (Science and Technology), 2022, 55(7): 706-713. [11]黃海松, 陳星燃, 韓正功, 等. 基于多尺度注意力機(jī)制和知識蒸餾的茶葉嫩芽分級方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2022, 53(9): 399-407, 458. Huang Haisong, Chen Xingran, Han Zhenggong, et al. Tea buds grading method based on multi-scale attention mechanism and knowledge distillation [J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(9): 399-407, 458. [12]殷獻(xiàn)博, 鄧小玲, 蘭玉彬, 等. 基于改進(jìn)YOLOX-Nano算法的柑橘梢期長勢智能識別[J]. 華南農(nóng)業(yè)大學(xué)學(xué)報(bào), 2023, 44(1): 142-150. Yin Xianbo, Deng Xiaoling, Lan Yubin, et al. Intelligent recognition of citrus shoot growth based on improved YOLOX-Nano algorithm [J]. Journal of South China Agricultural University, 2023, 44(1): 142-150. [13]于雪瑩, 高繼勇, 王首程, 等. 基于生成對抗網(wǎng)絡(luò)和混合注意力機(jī)制殘差網(wǎng)絡(luò)的蘋果病害識別[J]. 中國農(nóng)機(jī)化學(xué)報(bào), 2022, 43(6): 166-174. Yu Xueying, Gao Jiyong, Wang Shoucheng, et al. Apple disease recognition based on Wasserstein generative adversarial networks and hybrid attention mechanism residual network [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(6): 166-174. [14]高榮華, 白強(qiáng), 王榮, 等. 改進(jìn)注意力機(jī)制的多叉樹網(wǎng)絡(luò)多作物早期病害識別方法[J]. 計(jì)算機(jī)科學(xué), 2022, 49(S1): 363-369. Gao Ronghua, Bai Qiang, Wang Rong, et al. Multi-tree network multi-crop early disease recognition method based on improved attention mechanism [J]. Computer Science, 2022, 49(S1): 363-369 [15]楊玥, 馮濤, 梁虹, 等. 融合交叉注意力機(jī)制的圖像任意風(fēng)格遷移[J]. 計(jì)算機(jī)科學(xué), 2022, 49(S1): 345-352, 396. Yang Yue, Feng Tao, Liang Hong,et al. Image arbitrary style transfer via criss-cross attention [J]. Computer Science, 2022, 49(S1): 345-352, 396. [16]高雨亮, 徐向英, 章永龍, 等. 融合分組注意力機(jī)制的水稻病蟲害圖像識別算法[J]. 揚(yáng)州大學(xué)學(xué)報(bào)(自然科學(xué)版), 2021, 24(6): 53-57. Gao Yuliang, Xu Xiangying, Zhang Yonglong, et al. Image recognition algorithm of rice diseases and insect pests based on shuffle attention mechanism [J]. Journal of Yangzhou University (Natural Science Edition), 2021, 24(6): 53-57. [17]毛騰躍, 宋陽, 鄭祿. 基于多尺度與混合注意力機(jī)制的蘋果目標(biāo)檢測[J]. 中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版), 2022, 41(2): 235-242. Mao Tengyue, Song Yang, Zheng Lu. Apple target detection based on multi-scale and hybrid attention mechanism [J].Journal of South-Central Minzu University (Natural Science Edition), 2022, 41(2): 235-242. [18]駱潤玫, 殷惠莉, 劉偉康, 等. 基于YOLOv5-C的廣佛手病蟲害識別[J]. 華南農(nóng)業(yè)大學(xué)學(xué)報(bào), 2023, 44(1): 151-160. Luo Runmei, Yin Huili, Liu Weikang, et al. Identification of bergamot pests and diseases in complex background using YOLOv5-C algorithm [J]. Journal of South China Agricultural University, 2023, 44(1): 151-160. [19]Leng Z, Tan M, Liu C, et al. PolyLoss: A polynomial expansion perspective of classification loss functions [C]. International Conference on Learning Representations (ICLR), 2022. [20]Radosavovic I, Kosaraju R P, Girshick R, et al. Designing network design spaces [C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2020.