摘 要:精準(zhǔn)識(shí)別花椒病害可以幫助農(nóng)民采取合適的措施對(duì)花椒進(jìn)行對(duì)癥治療,從而減少對(duì)花椒產(chǎn)量和經(jīng)濟(jì)造成的損失。本研究選取ShuffleNetV2模型作為基礎(chǔ)模型對(duì)花椒葉片是否存在病害進(jìn)行智能識(shí)別。為提升識(shí)別精度,在基礎(chǔ)模型中嵌入坐標(biāo)注意力機(jī)制(CA)改進(jìn)主體網(wǎng)絡(luò)架構(gòu),增強(qiáng)模型對(duì)重點(diǎn)位置信息和重要特征的關(guān)注指數(shù),并采用遷移學(xué)習(xí)訓(xùn)練策略來優(yōu)化模型,獲得CA-ShuffleNetV2模型。經(jīng)由自建花椒葉片數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)測試,結(jié)果表明,CA-ShuffleNetV2網(wǎng)絡(luò)模型獲得的識(shí)別準(zhǔn)確率高達(dá)92.6%,而參數(shù)量僅為2.72 MB。由此表明,該模型不僅具有較高的識(shí)別精度,且能較好地平衡模型大小與識(shí)別率,為花椒葉片病害的實(shí)時(shí)檢測提供了新的技術(shù)支持。
關(guān)鍵詞:花椒葉片病害;CA-ShuffleNetV2;坐標(biāo)注意力機(jī)制;遷移學(xué)習(xí);葉片檢測;識(shí)別率
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-1302(2025)06-00-05
DOI:10.16667/j.issn.2095-1302.2025.06.008
0 引 言
花椒是我國的主要經(jīng)濟(jì)作物之一,其產(chǎn)量會(huì)受到病害的嚴(yán)重影響[1-3]。對(duì)花椒病害進(jìn)行檢測,有利于及早診斷出花椒作物的病害跡象,提前采取防治措施,從而提升花椒作物的產(chǎn)量與品質(zhì),提高農(nóng)業(yè)收益及椒農(nóng)的經(jīng)濟(jì)收益。對(duì)花椒葉片病害進(jìn)行高效實(shí)用地快速識(shí)別有助于提高病害識(shí)別的準(zhǔn)確性和科學(xué)性,有助于農(nóng)作物病害的研究和防治工作。
早期的農(nóng)作物葉片病害識(shí)別研究主要基于傳統(tǒng)的機(jī)器學(xué)習(xí)方法。文獻(xiàn)[4]將棉花葉片邊緣殘缺、葉片孔洞作為主要特征,評(píng)估棉花蟲害對(duì)棉花健康的影響程度。文獻(xiàn)[5]運(yùn)用差分百分率直方圖法提取無土栽培番茄缺乏營養(yǎng)元素葉片的紋理特征,經(jīng)過遺傳算法的優(yōu)化組合后作為 K 近鄰模式識(shí)別的輸入項(xiàng)展開模式識(shí)別。文獻(xiàn)[6]結(jié)合圖像處理、色度學(xué)、計(jì)算機(jī)視覺等先進(jìn)技術(shù)理論,借助模糊K-近鄰算法對(duì)植株病害展開模式識(shí)別。文獻(xiàn)[7]使用 K-均值+聚類算法和分水嶺算法對(duì)向日葵葉病圖像進(jìn)行分割,從患病區(qū)域中提取了19個(gè)顏色特征和紋理特征的特征值,并構(gòu)造了隨機(jī)森林算法來識(shí)別患病區(qū)域。文獻(xiàn)[8]提出了基于結(jié)合 Retinex的二進(jìn)制小波變換和人工蜂群算法的番茄葉病識(shí)別框架,能夠?qū)Ψ巡『M(jìn)行有效識(shí)別。
近年來,深度學(xué)習(xí)技術(shù)取得了令人矚目的成就,在人臉識(shí)別、目標(biāo)檢測等領(lǐng)域都取得了良好的效果?;诰矸e神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)的深度學(xué)習(xí)模型逐漸被應(yīng)用于農(nóng)業(yè)領(lǐng)域,隨著AlexNet、VGG16、ResNet50、GoogLeNet以及輕量網(wǎng)絡(luò)MobileNetV2和EfficientNet B0等神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)不斷深化[9-14],CNN對(duì)圖像的識(shí)別準(zhǔn)確率越來越高,在農(nóng)作物的病害識(shí)別方面得到了更加廣泛的應(yīng)用。文獻(xiàn)[15]提出了一種新的兩階段輕量化CNN模型結(jié)構(gòu),對(duì)小麥病害的分類準(zhǔn)確率達(dá)到了93.3%。文獻(xiàn)[16]基于EfficientNet模型設(shè)計(jì)了新的Dise-efficient網(wǎng)絡(luò)架構(gòu),在Plant Village植物病蟲害數(shù)據(jù)集上的分類準(zhǔn)確率達(dá)99.80%。文獻(xiàn)[17]通過對(duì)GoogLeNet網(wǎng)絡(luò)結(jié)構(gòu)以及激活函數(shù)的改進(jìn),獲得的模型在農(nóng)作物檢測方面能力較強(qiáng),特別是對(duì)玉米的9種病害的分類準(zhǔn)確率達(dá)到了98.9%。文獻(xiàn)[18]針對(duì)蘋果等典型農(nóng)作物的常見葉片病害問題,使用卷積神經(jīng)網(wǎng)絡(luò)VGG16 及 ResNet50 對(duì)葉片病害進(jìn)行識(shí)別,分別達(dá)到了 82.57% 和 86.34%的準(zhǔn)確率。文獻(xiàn)[19]在Xception的基礎(chǔ)上提出一種新的通道擴(kuò)增模塊,采用特殊的通道分配權(quán)重增強(qiáng)了特征提取效率,對(duì)27種植物病害進(jìn)行識(shí)別分類,識(shí)別準(zhǔn)確率達(dá)到了91.9%。文獻(xiàn)[20]利用坐標(biāo)注意力機(jī)制(Coordinate Attention, CA)替換MobileNetV3網(wǎng)絡(luò),通過引入SVM多分類器,對(duì)識(shí)別水稻病害的準(zhǔn)確率高達(dá) 97.12%。
雖然基于深度學(xué)習(xí)的病害圖像智能處理算法發(fā)展迅速,但由于花椒葉片病害的可用數(shù)據(jù)較為稀少,基于深度學(xué)習(xí)的花椒葉片病害檢測方法依然有待深入研究。本文借助ShuffleNetV2檢測模型[21]完成了對(duì)花椒葉病害的智能檢測,并在ShuffleNetV2的基本單元中引入坐標(biāo)注意力機(jī)制,增強(qiáng)了網(wǎng)絡(luò)對(duì)花椒葉重要位置信息的獲取,并借助遷移學(xué)習(xí)加強(qiáng)網(wǎng)絡(luò)對(duì)模型的訓(xùn)練。另外,在自建數(shù)據(jù)集上的測試評(píng)估與對(duì)比實(shí)驗(yàn)研究表明,CA-ShuffleNetV2的檢測準(zhǔn)確率為92.6%,參數(shù)量為2.72 MB,實(shí)現(xiàn)了該模型對(duì)花椒葉病害檢測精度和檢測速度的平衡。
1 材料與方法
1.1 數(shù)據(jù)集處理
本研究先在Plant Village數(shù)據(jù)集上進(jìn)行訓(xùn)練獲得預(yù)訓(xùn)練模型,后遷移到自建花椒數(shù)據(jù)集進(jìn)行訓(xùn)練和微調(diào)。公共數(shù)據(jù)集Plant Village共包含14類農(nóng)作物或植物的39種病害類型,合計(jì)共有61 486張圖片[22]。本研究自建的花椒葉部病害數(shù)據(jù)集均為網(wǎng)絡(luò)爬取,涵蓋農(nóng)作物花椒葉的銹病、斑病以及未受病害入侵的花椒葉片,共計(jì)3種類型的葉片狀態(tài)。實(shí)驗(yàn)中為了確保檢測效率和精準(zhǔn)度,假定葉片主體清晰,背景真實(shí)可見,共網(wǎng)絡(luò)爬取230張圖片;該數(shù)據(jù)集經(jīng)過翻轉(zhuǎn)和葉片剪裁,共獲得690張花椒葉圖片。數(shù)據(jù)集樣例如圖1所示。
1.2 ShuffleNetV2模型
ShuffleNetV2是一種輕量級(jí)神經(jīng)網(wǎng)絡(luò)架構(gòu),主要由Stage2、Stage3和Stage4三個(gè)網(wǎng)絡(luò)訓(xùn)練階段組成,該神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)能夠在移動(dòng)或嵌入式設(shè)備上執(zhí)行高效的花椒病害葉片檢測和分類任務(wù)。此外,ShuffleNetV2通過引入逐通道組卷積和通道混洗操作來有效減少模型的參數(shù)量和計(jì)算量[23]。同時(shí)還采用了一種類似殘差連接的設(shè)計(jì),即每個(gè)階段包含一個(gè)直接連接的分支來保持特征圖的高維表達(dá)能力。這種設(shè)計(jì)可以有效減緩信息丟失,并提高模型的分類準(zhǔn)確率。
逐通道組卷積是將不同花椒葉片的特征圖進(jìn)行有序分組,然后借助不同的模版(卷積核)對(duì)各分組進(jìn)行有效卷積,此模版應(yīng)用于特征圖輸入的每一個(gè)分組通道,而非對(duì)整個(gè)輸入特征圖進(jìn)行卷積操作。因此,利用該方法有助于減少網(wǎng)絡(luò)訓(xùn)練的參數(shù)量和計(jì)算量,并提高模型的計(jì)算和執(zhí)行效率。深度可分離卷積(Depth Wise Separable Convolution, DWSC)通過將空間和通道維度拆開,并分析其維度的相關(guān)性,以獲得模版計(jì)算時(shí)的參數(shù)數(shù)量,是相對(duì)比較特殊的一種卷積神經(jīng)網(wǎng)絡(luò)模型。具體操作:將Inception模塊劃分為兩個(gè)部分,首先對(duì)通道進(jìn)行空間模版計(jì)算,獲得輸出后再次對(duì)1×1卷積核進(jìn)行通道卷積計(jì)算得到最佳特征圖。通道混洗操作的目的是為了打破分組卷積后產(chǎn)生的特征圖中通道之間的依賴關(guān)系,它將特征圖中的通道重新排列和混合,以增加特征圖之間的信息傳遞和多樣性。通道混洗過程如圖2所示。
1.3 遷移學(xué)習(xí)
遷移學(xué)習(xí)是一種在源域進(jìn)行學(xué)習(xí),解決目標(biāo)域問題的機(jī)器學(xué)習(xí)方法。遷移學(xué)習(xí)效果取決于源、目標(biāo)領(lǐng)域的圖片共性程度[24],通過學(xué)習(xí)卷積層共有特征后進(jìn)行知識(shí)遷移,將訓(xùn)練于源域數(shù)據(jù)集的模型參數(shù)應(yīng)用到目標(biāo)域,從而解決目標(biāo)域數(shù)據(jù)集不足而引起的訓(xùn)練效果不理想的問題。本研究基于Plant Village數(shù)據(jù)集,將ShuffleNetV2網(wǎng)絡(luò)模型放在該數(shù)據(jù)集上進(jìn)行充分訓(xùn)練,獲得初始權(quán)重值。然后針對(duì)自建花椒葉片數(shù)據(jù)集,經(jīng)由優(yōu)化學(xué)習(xí)機(jī)制更進(jìn)一步微調(diào)該網(wǎng)絡(luò)模型參數(shù)值,增強(qiáng)網(wǎng)絡(luò)模型對(duì)自建花椒葉片數(shù)據(jù)集的學(xué)習(xí)性能,加快模型收斂并提高模型的泛化能力。本研究遷移學(xué)習(xí)工作流程如圖3所示。
1.4 CA
通道注意力機(jī)制有助于對(duì)輸入特征圖中的不同通道進(jìn)行選擇性強(qiáng)調(diào),它可以自動(dòng)學(xué)習(xí)每個(gè)通道的重要性,并提供更有判別力的特征表示[25]。雖然通道注意力機(jī)制能夠有效提升模型獲取特征的能力,但是卻忽略了圖像的位置信息。CA不僅可以捕捉到跨通道信息,還可以捕捉到位置敏感信息[26]。另外,CA將通道注意力拆分為垂直方向和水平方向上1×1的特征編碼,允許沿著一個(gè)空間方向捕捉依賴關(guān)系,與此同時(shí)保留另一個(gè)空間方向上的位置信息。注意力機(jī)制的具體結(jié)構(gòu)如圖4所示。對(duì)于輸入X而言,高度為h的第c通道的輸出見式(1):
寬度為w的第c個(gè)通道的輸出見式(2):
級(jí)聯(lián)兩個(gè)方向上生成的特征圖,使用1×1卷積核進(jìn)行通道壓縮F1,生成中間特征圖f,其表達(dá)式見式(3):
沿著空間方向上的維度將f切分為兩個(gè)獨(dú)立張量,再次利用1×1卷積核進(jìn)行通道膨脹,獲得gh和gw,CA模塊的最終輸出見式(4):
由圖4可知,將CA插入到ShuffleNetV2網(wǎng)絡(luò)的基本單元中,具體的網(wǎng)絡(luò)結(jié)構(gòu)如圖5(a)和圖5(b)所示。在深度可分離卷積模塊之后加入CA 模塊,通過此操作,利用CA模塊捕獲了網(wǎng)絡(luò)通道間的依賴關(guān)系,同時(shí)又能保留精確坐標(biāo)信息的特性,使模型在注意花椒葉片的精確位置信息的同時(shí)強(qiáng)調(diào)重要病害特征。
2 實(shí)驗(yàn)設(shè)置
2.1 實(shí)驗(yàn)設(shè)置
試驗(yàn)環(huán)境:CPU型號(hào)為 Intel?CoreTMi7-9700K,GPU為12 GB顯存的NVIDIA RTX2080ti,RAM為32 GB的DDR4,CUDA版本為11.7,深度學(xué)習(xí)框架為Pytorch 2.0.1。為驗(yàn)證本研究選取ShuffleNetV2 模型對(duì)花椒病害識(shí)別的準(zhǔn)確性與實(shí)時(shí)性,選用傳統(tǒng)VGG16 網(wǎng)絡(luò)模型和 ResNet50 網(wǎng)絡(luò)模型進(jìn)行對(duì)比試驗(yàn)。對(duì)3種網(wǎng)絡(luò)均采取遷移學(xué)習(xí)方式。實(shí)驗(yàn)測試將數(shù)據(jù)集按照8∶2的比例劃分為訓(xùn)練集和測試集,每一次迭代數(shù)據(jù)都會(huì)被隨機(jī)打亂,每張輸入圖像大小被固定為224×224,優(yōu)化器使用Adam (Adaptive Momentum)[27],批次設(shè)定為16,初始化學(xué)習(xí)率設(shè)定為0.000 1,每訓(xùn)練10個(gè)Epoch,學(xué)習(xí)率衰減20%。網(wǎng)絡(luò)模型訓(xùn)練迭代次數(shù)約定為60,且損失函數(shù)同樣設(shè)定為交叉熵?fù)p失函數(shù)。
2.2 實(shí)驗(yàn)指標(biāo)
借助準(zhǔn)確率(Accuracy, A)、模型參數(shù)量(Parameters, P)、浮點(diǎn)運(yùn)算量(FLOPs)評(píng)估網(wǎng)絡(luò)模型性能。網(wǎng)絡(luò)模型參數(shù)量與浮點(diǎn)運(yùn)算量反映了該網(wǎng)絡(luò)模型的計(jì)算復(fù)雜度,準(zhǔn)確率客觀反映了模型識(shí)別出的所有預(yù)測正確樣本數(shù)占總樣本數(shù)的比重,即直觀反映出網(wǎng)絡(luò)模型的性能指標(biāo)。其計(jì)算公式見式(5):
式中:Pc代表花椒葉病害種類被正確預(yù)測的樣本數(shù)量;PALL代表花椒葉病害測試集的總樣本數(shù)量;Af為模型獲得的準(zhǔn)確率。
3 實(shí)驗(yàn)結(jié)果與分析
為驗(yàn)證本研究模型對(duì)花椒葉病害識(shí)別的準(zhǔn)確性與實(shí)時(shí)性,選取AlexNet、VGG16、 ResNet50、GoogleNet、MobileNetV2和EfficientNet B0等網(wǎng)絡(luò)模型進(jìn)行對(duì)比試驗(yàn)。試驗(yàn)時(shí)參數(shù)保持不變,對(duì)5種網(wǎng)絡(luò)都采取相同的遷移學(xué)習(xí)方式。由表1數(shù)據(jù)可知,CA-ShuffleNetV2的數(shù)據(jù)測試集準(zhǔn)確率在參與對(duì)比模型中略低于EfficientNet B0模型,而CA-ShuffleNetV2的浮點(diǎn)運(yùn)算量、參數(shù)范圍等均遠(yuǎn)低于EfficientNet B0模型。相較于其他網(wǎng)絡(luò),CA-ShuffleNetV2用更少的參數(shù)量和運(yùn)算量實(shí)現(xiàn)了更高的驗(yàn)證集準(zhǔn)確率。
CA-ShuffleNetV2 模型參數(shù)量僅為2.72 MB,浮點(diǎn)運(yùn)算量為0.15 B。相比于經(jīng)典分類網(wǎng)絡(luò) VGG16和ResNet50,其模型參數(shù)量僅是這些網(wǎng)絡(luò)模型參數(shù)量的1.97%和11.46%。相較于輕量級(jí)網(wǎng)絡(luò)MobileNetV2,準(zhǔn)確率高出6.1個(gè)百分點(diǎn)的同時(shí)參數(shù)量降低了22.29%。綜上所述,本文提出的CA-ShuffleNetV2網(wǎng)絡(luò)模型兼具準(zhǔn)確率高、計(jì)算復(fù)雜度低、易于部署等優(yōu)點(diǎn)?;谝陨咸攸c(diǎn)可將其部署于移動(dòng)端,以滿足使用設(shè)備識(shí)別花椒葉片病害的需要。
4 結(jié) 語
本文基于遷移學(xué)習(xí)提出并改進(jìn)了ShuffleNetV2模型,獲得了一種農(nóng)作物花椒葉片病害識(shí)別網(wǎng)絡(luò)模型算法。在ShuffleNetV2的基本Inception模塊中插入能兼顧通道特征和位置信息的坐標(biāo)注意力機(jī)制模塊,由此構(gòu)造出一種改進(jìn)CA-ShuffleNetV2 網(wǎng)絡(luò)模型,并借助遷移學(xué)習(xí)策略來輔助網(wǎng)絡(luò)模型訓(xùn)練,以獲得檢測精確率。實(shí)驗(yàn)測試結(jié)果表明,本文提出的CA-ShuffleNetV2改進(jìn)網(wǎng)絡(luò)模型的葉片病害識(shí)別算法能夠有效識(shí)別各花椒樹葉片上的害蟲類別,借助自建花椒葉片數(shù)據(jù)集,使得模型的識(shí)別準(zhǔn)確率可達(dá)92.6%。與對(duì)比的同類經(jīng)典模型相比,本文提出的改進(jìn)型CA-ShuffleNetV2 網(wǎng)絡(luò)模型能夠在較低的模型參數(shù)量和浮點(diǎn)運(yùn)算量前提下,獲得較優(yōu)的識(shí)別檢測準(zhǔn)確率,可廣泛部署和應(yīng)用于農(nóng)作物花椒葉片病害檢測領(lǐng)域。
注:本文通訊作者為王天一。
參考文獻(xiàn)
[1]田晉榮,楊俊杰.花椒產(chǎn)業(yè)發(fā)展與市場前景預(yù)測[J].南方農(nóng)業(yè),2019,13(11):95-96.
[2]李曉莉,黃登艷,刁英.中國花椒產(chǎn)業(yè)發(fā)展現(xiàn)狀[J].湖北林業(yè)科技,2020,49(1):44-48.
[3]任媛媛,翟曉巧,張晨.我國花椒產(chǎn)業(yè)發(fā)展現(xiàn)狀及存在問題和發(fā)展前景[J].河南林業(yè)科技,2020,40(4):31-34.
[4]陳佳娟,紀(jì)壽文,李娟,等.采用計(jì)算機(jī)視覺進(jìn)行棉花蟲害程度的自動(dòng)測定[J].農(nóng)業(yè)工程學(xué)報(bào),2001(2):157-160.
[5]徐貴力,毛罕平,李萍萍.差分百分率直方圖法提取缺素葉片紋理特征[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2003(2):76-79.
[6]程鵬飛. 植物病害的圖像處理及特征值提取方法的研究[D].太原:山西農(nóng)業(yè)大學(xué),2005.
[7] LIU J, LV F, DI H. Identification of sunflower leaf diseases based on random forest algorithm [C]// Proceedings of 2019 International Conference on Intelligent Computing, Automation and Systems (ICICAS). Chongqing, China: IEEE, 2019: 459-463.
[8] CHEN X, ZHOU G, CHEN A, et al. Identification of tomato leaf diseases based on combination of ABCK-BWTR and B-ARNet [J]. Computers and electronics in agriculture, 2020, 178: 105730.
[9] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks [J]. Communications of the ACM, 2017, 60(6): 84-90.
[10] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [C]// Proceedings of 3rd International Conference on Learning Representations (ICLR 2015), [S.l.]: [s.n.], 2015: 1-14.
[11] HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition [C]// Proceedings of 2016 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas, NV, USA: IEEE, 2016: 770-778.
[12] SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions [C]// Proceedings of 2015 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Boston, MA, USA: IEEE, 2015: 1-9.
[13] SANDLER M, HOWARD A, ZHU M, et al. MobileNetV2: inverted residuals and linear bottlenecks [C]// Proceedings of 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Salt Lake City, UT, USA: IEEE, 2018: 4510-4520.
[14] TAN M, LE Q V. EfficientNetV2: smaller models and faster training [Z/OL]. (2021-06-23) [2023-12-30]. https://arxiv.org/abs/2104.00298.
[15] RAHMAN C R, ARKO P S, ALI M E, et al. Identification and recognition of rice diseases and pests using convolutional neural networks [J]. Biosystems engineering, 2020, 194: 112-120.
[16] GUAN H, FU C, ZHANG G, et al. A lightweight model for efficient identification of plant diseases and pests based on deep learning [J]. Frontiers in plant science, 2023, 14: 1227011.
[17] ZHANG X, QIAO Y, MENG F, et al. Identification of maize leaf diseases using improved deep convolutional neural networks [J]. IEEE access, 2018, 6: 30370-30377.
[18]朱家輝,蘇維均,于重重.基于卷積神經(jīng)網(wǎng)絡(luò)的農(nóng)作物葉片病害診斷[J].植物檢疫,2021,35(2):28-32.
[19]項(xiàng)小東,翟蔚,黃言態(tài),等.基于Xception-CEMs神經(jīng)網(wǎng)絡(luò)的植物病害識(shí)別[J].中國農(nóng)機(jī)化學(xué)報(bào),2021,42(8):177-186.
[20]崔金榮,魏文釗,趙敏.基于改進(jìn)MobileNetV3的水稻病害識(shí)別模型[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2023,54(11):217-224.
[21] MA N, ZHANG X, ZHENG H T, et al. ShuffleNet V2: practical guidelines for efficient CNN architecture design [C]// Proceedings of European Conference on Computer Vision 2018. [S.l.]: [s.n.], 2018: 122-138.
[22] ATILA U, UCAR M, AKYOL K, et al. Plant leaf disease classification using efficientnet deep learning model [J]. Ecological Informatics, 2021, 61: 101182.
[23] ZHANG X, ZHOU X, LIN M, et al. ShuffleNet: an extremely efficient convolutional neural network for mobile devices [C]// Proceedings of 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, UT, USA: IEEE, 2018: 6848-6856.
[24] SHORTEN C, KHOSHGOFTAAR T M. A survey on image data augmentation for deep learning [J]. Journal of big data, 2019, 6(1): 60.
[25] HU J, SHEN L, ALBANIE S, et al. Squeeze-and-excitation networks [J]. IEEE transactions on pattern analysis and machine intelligence, 2020, 42(8): 2011-2023.
[26] HOU Q B, ZHOU D Q, FENG J S. Coordinate attention for efficient mobile network design [C]// Proceedings of 2021 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Nashville, TN, USA: IEEE, 2021: 13713-13722.
[27] KINGMA D P, BA J. Adam: a method for stochastic optimization [C]// Proceedings of 3rd International Conference on Learning Representations (ICLR). [S.l.]: [s.n.], 2015: 1-15.
作者簡介:周江龍(1999—),男,貴州六盤水人,碩士,研究方向?yàn)闄C(jī)器學(xué)習(xí)、智能圖像處理。
王天一(1989—),男,遼寧錦州人,博士,副教授,研究方向?yàn)樯疃葘W(xué)習(xí)、大數(shù)據(jù)與人工智能。
收稿日期:2024-04-15 修回日期:2024-05-22
基金項(xiàng)目:貴州省科技計(jì)劃項(xiàng)目(黔科合支撐[2021]一般176)