郭章龍, 李宜汀 趙維 陳凱
關(guān)鍵詞: 智能化;深度學(xué)習(xí);病害識別;卷積神經(jīng)網(wǎng)絡(luò);ResNet50_vd
0 引言
在當(dāng)前人工智能與大數(shù)據(jù)驅(qū)動的全球傳統(tǒng)農(nóng)業(yè)轉(zhuǎn)型趨勢下,我國農(nóng)業(yè)裝備正朝著計算機集成化、高度智慧化的方向蓬勃發(fā)展。農(nóng)作物病害識別是農(nóng)業(yè)領(lǐng)域的關(guān)鍵問題之一,傳統(tǒng)的檢測方式主要依據(jù)人工觀察識別病害類別,往往有速度慢、強度大、主觀性強等局限性。
針對上述問題,國內(nèi)外研究人員將人工智能技術(shù)應(yīng)用于農(nóng)作物病害識別領(lǐng)域,并已具備一定成效[1-7]。例如:宋大鵬等人[1]提出將深度學(xué)習(xí)用于水稻葉部病害識別任務(wù)中,通過引入深度可分離卷積機制,模型在速度和精度上均取得了較大程度的提升;王敬賢等[4]探究了不同深度的卷積神經(jīng)網(wǎng)絡(luò)對農(nóng)作物病害特征提取質(zhì)量的影響,并針對數(shù)據(jù)集樣本數(shù)量少可能引發(fā)的過擬合問題,提出使用遷移學(xué)習(xí)調(diào)整參數(shù)的思想,并分別在實驗中予以驗證;曾偉輝等[5]針對實際場景下農(nóng)作物病害識別精度較差的問題,提出一種深度殘差卷積神經(jīng)網(wǎng)絡(luò)方法,通過參數(shù)共享反饋子網(wǎng)絡(luò)抑制了圖像背景,提升了模型的魯棒性。
隨著算力的不斷提升及深度學(xué)習(xí)領(lǐng)域的發(fā)展,大量深度模型已開始部署在邊緣設(shè)備中[6],這在很大程度上提高了農(nóng)作物病害識別的自動化程度。本文將基于先進的ResNet50_Vd深度殘差網(wǎng)絡(luò)對農(nóng)作物病害識別數(shù)據(jù)集進行識別,并通過對比試驗驗證該方法的可行性和有效性。
1 農(nóng)作物病害識別模型
1.1 ResNet 網(wǎng)絡(luò)
傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Net? work, CNN)對圖像有較強的特征提取能力。越深的網(wǎng)絡(luò)能夠提取越豐富的抽象特征,并且這些特征具有語義信息。然而,增加網(wǎng)絡(luò)深度容易導(dǎo)致梯度消失和爆炸的問題。隨著網(wǎng)絡(luò)層數(shù)的增加,模型在一定程度上將出現(xiàn)退化現(xiàn)象,即在訓(xùn)練集上的性能下降。上述問題并不屬于過擬合問題,因為過擬合的表現(xiàn)在訓(xùn)練集上更好[8]。因此,如何解決深度CNN退化問題成為了深度學(xué)習(xí)的研究重點。2016年,何凱明團隊提出了有效的解決方法,即殘差網(wǎng)絡(luò)(Re? sidual Network,ResNet)[9]。該結(jié)構(gòu)在神經(jīng)網(wǎng)絡(luò)層數(shù)較深時,仍然展現(xiàn)出了強大的特征學(xué)習(xí)能力,其基本單元如圖1所示。
殘差網(wǎng)絡(luò)主要的突破點是“殘差”概念的提出,具體來說,是在兩層之間跨層映射,有效防止梯度消失和梯度爆炸情況的出現(xiàn)。假設(shè)一個殘差單元為yl,則其表達(dá)式為:
式中:xl 和xl + 1 分別表示的是第l層殘差單元的輸入和輸出;F 是殘差函數(shù),表示學(xué)習(xí)到的殘差;h(xl )表示恒等映射;f 是ReLU激活函數(shù)?;谏鲜?,可以得到從淺層l到深層L的學(xué)習(xí)特征為:
ResNet相比傳統(tǒng)卷積網(wǎng)絡(luò),具有多個優(yōu)點。首先,它通過在卷積層之間添加殘差連接,能夠解決梯度消失問題;其次,殘差網(wǎng)絡(luò)更好地利用了網(wǎng)絡(luò)的寬度,實現(xiàn)了更充分的信息流動;最后,殘差網(wǎng)絡(luò)訓(xùn)練速度更快,更易于收斂,通??梢栽诟痰臅r間內(nèi)獲得更高的準(zhǔn)確度。
1.2 ResNet50-vd 結(jié)構(gòu)
ResNet50網(wǎng)絡(luò)是殘差網(wǎng)絡(luò)的典型結(jié)構(gòu)之一,其優(yōu)點在于可以訓(xùn)練非常深的神經(jīng)網(wǎng)絡(luò),并且可以在不同的層之間保持信息的傳遞。這使得ResNet50 在計算機視覺等領(lǐng)域有著廣泛的應(yīng)用。目前針對ResNet50 網(wǎng)絡(luò)有較多改進策略,ResNet50_vd便是其中一種。ResNet50_vd 在ResNet50 的基礎(chǔ)上進行了一定的改進,以提高模型的性能和準(zhǔn)確率,其主要的改進結(jié)構(gòu)如圖2所示。
此外,與ResNet50相比,ResNet50_vd在整個模型上并沒有改動。本文選用該模型作為農(nóng)作物病害識別模型,以提升識別任務(wù)的準(zhǔn)確性,其完整的結(jié)構(gòu)圖如圖3所示。
2 實驗與分析
2.1 數(shù)據(jù)預(yù)處理與實驗參數(shù)設(shè)定
本文一共使用農(nóng)作物數(shù)據(jù)55 443張,數(shù)據(jù)量達(dá)到深度學(xué)習(xí)數(shù)據(jù)量要求。在使用數(shù)據(jù)前,首先進行了數(shù)據(jù)的預(yù)處理,其步驟如下:
首先,將數(shù)據(jù)進行縮放,將其大小統(tǒng)一變?yōu)椋?56, 2N5o6rm,3a);liz其at次ion,(B對N數(shù));最據(jù)后進使行用了卷批積標(biāo)神準(zhǔn)經(jīng)化網(wǎng)操絡(luò)作(C,N即N)B來at自ch動學(xué)習(xí)圖像特征,對農(nóng)作物病害數(shù)據(jù)進行端到端的圖像分類[10],彌補人工提取圖像特征的局限性。圖4展示了部分農(nóng)作物葉片圖像。
本次實驗使用的配置如下:GPU為Tesla V100 (40GB顯存),處理器核心數(shù)為4,RAM32GB,Disk100GB,深度學(xué)習(xí)框架PaddlePaddle。
式中:TP表示真正類,即樣本的真實類別是正類,并且模型識別的結(jié)果也是正類;FN表示假負(fù)類,即樣本的真實類別是正類,但是模型將其識別為負(fù)類;FP 表示假正類,即樣本的真實類別為負(fù)類,但是模型將其識別為正類;TN為真負(fù)類,即樣本的真實類別是負(fù)類,并且模型將其識別為負(fù)類。實驗過程中,模型的訓(xùn)練參數(shù)設(shè)定如表1所示。
2.2 實驗分析
為表現(xiàn)ResNet50_vd在農(nóng)作物病害識別中的優(yōu)異效果,選取深度學(xué)習(xí)任務(wù)中應(yīng)用廣泛的VGG 網(wǎng)絡(luò)、ResNet網(wǎng)絡(luò)作為實驗對比模型。圖5為各個模型在訓(xùn)練集上訓(xùn)練過程中的準(zhǔn)確率和損失函數(shù)隨著遍歷次數(shù)的變化趨勢圖。通過圖5可以看到,模型在訓(xùn)練集上擬合數(shù)據(jù)的有效性。
測試集上模型的表現(xiàn)效果往往可以證明其魯棒性,圖6展示了模型在測試集上的準(zhǔn)確率和損失函數(shù)的變化趨勢。通過測試集上可視化結(jié)果可以看出,模型具有較好的魯棒性,在測試集上也能很好地擬合數(shù)據(jù)。實驗中的結(jié)果對比數(shù)據(jù)如表2所示??梢钥闯觯P驮跍y試集上也有較高的預(yù)測精度,滿足實際場景需求。
3 結(jié)論
本文使用深度殘差神經(jīng)網(wǎng)絡(luò)模型ResNet50_vd進行農(nóng)作物病害圖像識別,該模型擁有較高的識別精度,并在對比實驗中展現(xiàn)了優(yōu)異的性能??梢钥闯?,將計算機視覺技術(shù)與病害識別結(jié)合,可以幫助農(nóng)民快速、準(zhǔn)確地識別作物病害,有助于提高農(nóng)業(yè)生產(chǎn)效率和農(nóng)作物產(chǎn)量。但是,本文僅研究了成像質(zhì)量較高的識別情境,未來將繼續(xù)深入探索現(xiàn)實場景中無人機拍攝下的作物圖像,提高模型在小目標(biāo)中的識別效果。