趙小虎,李 曉,葉 圣,李 曉,馮 偉,尤星懿
1.礦山互聯(lián)網(wǎng)應(yīng)用技術(shù)國(guó)家地方聯(lián)合工程實(shí)驗(yàn)室(中國(guó)礦業(yè)大學(xué)),江蘇 徐州 221008 2.中國(guó)礦業(yè)大學(xué) 信息與控制工程學(xué)院,江蘇 徐州 221008
為實(shí)現(xiàn)農(nóng)業(yè)生產(chǎn)智能化、現(xiàn)代化,很多學(xué)者將圖像分割技術(shù)應(yīng)用于農(nóng)業(yè)領(lǐng)域,實(shí)時(shí)分割病害并進(jìn)行識(shí)別,減少人工成本,實(shí)現(xiàn)病害的診斷和防治[1]。大多數(shù)農(nóng)作物的病變最初是從葉部開(kāi)始蔓延,因此分析葉部病斑是及時(shí)防治病害的有效措施之一。
近年來(lái)針對(duì)農(nóng)作物病斑分割技術(shù)層出不窮,主要有基于傳統(tǒng)方法和基于深度學(xué)習(xí)方法的分割。傳統(tǒng)的語(yǔ)義分割方法包括基于圖像紋理、色彩、幾何形狀和空間位置等信息對(duì)目標(biāo)進(jìn)行分割,并將其分割為互不相交的區(qū)域,且每一區(qū)域具有相同的語(yǔ)義像素信息。傳統(tǒng)語(yǔ)義分割方法可分為基于閾值的分割、基于聚類(lèi)的分割、基于邊緣的分割和基于區(qū)域的分割等方法。張武等[2]針對(duì)小麥條銹病等提出將K-means聚類(lèi)分割和Otsu算法結(jié)合的方式,逐步分割小麥的病害。Ma等[3]提出一種使用綜合顏色特征方法對(duì)蔬菜病害葉斑分割,實(shí)現(xiàn)病斑和噪聲背景的強(qiáng)識(shí)別。孫俊等[4]改進(jìn)Otsu算法,利用粒子群優(yōu)化算法尋找最優(yōu)閾值并用于生菜葉片分割。王昌龍等[5]基于K-means聚類(lèi)與LBP(local binary pattern)特征相結(jié)合實(shí)現(xiàn)南瓜葉片病害的識(shí)別,并滿(mǎn)足了精準(zhǔn)施藥的要求。Wang等[6]提出一種基于K-means聚類(lèi)的農(nóng)作物病害圖像自適應(yīng)分割方法,通過(guò)自適應(yīng)學(xué)習(xí)初始聚類(lèi)中心,將每?jī)蓚€(gè)聚類(lèi)間的距離作為聚類(lèi)分割結(jié)果的效果。但是傳統(tǒng)圖像分割方法需要有針對(duì)性的預(yù)處理以及大量人工標(biāo)注數(shù)據(jù)集,成本高,耗時(shí)長(zhǎng),因而網(wǎng)絡(luò)的靈活性不高,應(yīng)用范圍有所限制。
隨著深度學(xué)習(xí)的出現(xiàn),圖像分割技術(shù)突破傳統(tǒng)模式得到飛速發(fā)展。憑借深度神經(jīng)網(wǎng)絡(luò)較強(qiáng)的學(xué)習(xí)能力和自我訓(xùn)練能力,多角度獲取圖像信息,對(duì)病害預(yù)測(cè)、防治起到十分積極的作用。2015年Ronneberger等在FCN(fully convolutional networks)[7]基礎(chǔ)上提出了基于小數(shù)據(jù)集的網(wǎng)絡(luò)模型U-Net[8],此網(wǎng)絡(luò)包括收縮和擴(kuò)展路徑[9],通過(guò)跳躍連接將低層全局特征與高層語(yǔ)義信息結(jié)合,泛化性較強(qiáng),實(shí)現(xiàn)了端到端的網(wǎng)絡(luò)結(jié)構(gòu)。隨后各種分割網(wǎng)絡(luò)迅速發(fā)展,不同程度地實(shí)現(xiàn)了空間上下文信息完整性和多尺度提取特征等目標(biāo),提高模型的精度和分割速度。段凌鳳等[10]對(duì)子圖進(jìn)行基于改進(jìn)的SegNet網(wǎng)絡(luò)的分割操作,并將分割處理后的子圖拼接,實(shí)現(xiàn)稻穗和背景的二分類(lèi),該網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,運(yùn)行速度快。方晨晨等[11]提出一種基于改進(jìn)深度殘差網(wǎng)絡(luò)的番茄病害圖像識(shí)別方法,引入深度可分離卷積方法降低模型參數(shù)??椎路錥12]提出一種基于Inception-v3和遷移學(xué)習(xí)相結(jié)合的圖像分類(lèi)算法,實(shí)現(xiàn)將健康和患病番茄的分類(lèi)。Jiang等[13]提出一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的模型,通過(guò)引入Inception結(jié)構(gòu)和Rainbow進(jìn)行串聯(lián),實(shí)現(xiàn)蘋(píng)果葉片病害的檢測(cè)。王振等[14]使用了編-解碼結(jié)構(gòu)網(wǎng)絡(luò)進(jìn)行玉米病斑分割,編碼器部分通過(guò)改進(jìn)VGG-16網(wǎng)絡(luò),結(jié)合池化索引,并在解碼階段由池化索引進(jìn)行上采樣,最終得到密集的特征圖。此法避免了傳統(tǒng)的人工特征提取,且比現(xiàn)有的分割網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單。張善文等[15]提出了由編碼-解碼器構(gòu)成的多尺度融合神經(jīng)網(wǎng)絡(luò),創(chuàng)造性地在解碼階段使用九點(diǎn)雙線(xiàn)性插值算法對(duì)黃瓜特征圖進(jìn)行上采樣,該模型的MIoU達(dá)到91.36%。
綜上所述,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)方法對(duì)農(nóng)作物病害進(jìn)行病斑特征提取,利用反卷積、非線(xiàn)性插值或結(jié)合空洞卷積等方式進(jìn)行解碼,實(shí)現(xiàn)準(zhǔn)確分割農(nóng)作物病斑的目的。然而,以上方法針對(duì)真實(shí)田間農(nóng)作物的病斑分割易受復(fù)雜環(huán)境影響,分割邊緣模糊,特征提取效率低,難以實(shí)現(xiàn)實(shí)時(shí)分割病害的目的,并且當(dāng)數(shù)據(jù)集較少時(shí),模型容易產(chǎn)生過(guò)擬合。為了解決以上問(wèn)題,本文基于U-Net網(wǎng)絡(luò),分別在收縮和擴(kuò)展路徑引入多尺度特征提取,在解碼階段加入注意力機(jī)制(attention mechanism,AM),使模型更關(guān)注病斑區(qū)域。此外,將基于PlantVillage數(shù)據(jù)集[16-18]的改進(jìn)U-Net網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,增強(qiáng)模型特征提取能力,節(jié)省再訓(xùn)練田間番茄數(shù)據(jù)集的時(shí)間,加速模型收斂,提高特征提取的準(zhǔn)確度。
本實(shí)驗(yàn)中番茄葉片病害圖像樣本來(lái)自某現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)示范園科技創(chuàng)新示范基地。由于番茄生長(zhǎng)環(huán)境復(fù)雜,環(huán)境背景、日照光線(xiàn)、拍攝設(shè)備等會(huì)對(duì)圖像拍攝效果產(chǎn)生影響,為降低模型敏感度,圖像采集時(shí)間分布在2019年4—6月,分別選擇清晨、中午、下午進(jìn)行采集,包含晴天、陰天情況下的番茄葉片圖像,反映了真實(shí)場(chǎng)景情況。本文共采集了番茄葉片50張,從采集圖像中截取有效區(qū)域圖像塊以減少?gòu)?fù)雜背景信息對(duì)圖像分割效果的影響,并將圖片統(tǒng)一處理為256×256分辨率的圖像。其次,使用labelme對(duì)示范基地的番茄葉片數(shù)據(jù)集進(jìn)行區(qū)域標(biāo)注,每張圖像含有兩個(gè)數(shù)據(jù)標(biāo)簽:1代表目標(biāo),具體為番茄葉部病斑區(qū)域;0代表背景。標(biāo)注數(shù)據(jù)以json格式存儲(chǔ),并使用labelme_json_to_dataset命令將數(shù)據(jù)標(biāo)簽轉(zhuǎn)換為二值化png圖,如圖1所示。
圖1 數(shù)據(jù)集標(biāo)注示例圖Fig.1 Dataset annotation example graph
由于本實(shí)驗(yàn)使用真實(shí)田間農(nóng)作物數(shù)據(jù)集,圖像數(shù)據(jù)匱乏,直接使用原始數(shù)據(jù)進(jìn)行訓(xùn)練容易使模型產(chǎn)生過(guò)擬合的問(wèn)題。因此,本文對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)處理。CVPR細(xì)粒度視覺(jué)分類(lèi)挑戰(zhàn)賽中使用隨機(jī)增強(qiáng)光照、翻轉(zhuǎn)等操作對(duì)原始數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng),證明使用該類(lèi)方法以增強(qiáng)模型泛化能力的有效性。其次本實(shí)驗(yàn)采集的圖像易受光照等因素影響,而圖像具有平移翻轉(zhuǎn)不變性等特性,結(jié)合挑戰(zhàn)賽方法對(duì)原始數(shù)據(jù)集進(jìn)行隨機(jī)增強(qiáng)光照、平移、裁剪、翻轉(zhuǎn)操作,分別擴(kuò)增3、2、2、2倍,共計(jì)24倍,構(gòu)建番茄葉片病斑數(shù)據(jù)集(tomato leaf diseased dataset,TLDD),其中840張作為訓(xùn)練集,360張作為測(cè)試集。圖2為部分?jǐn)?shù)據(jù)增強(qiáng)圖像。
圖2 數(shù)據(jù)增強(qiáng)示意圖Fig.2 Data-enhanced image
為減少環(huán)境噪聲和計(jì)算復(fù)雜度,平滑圖像、去除椒鹽噪聲的同時(shí)保留圖像邊緣信息,對(duì)番茄葉片圖像進(jìn)行中值濾波降噪處理,如式(1):
其中,x(i)為滑動(dòng)窗口中心的像素點(diǎn)值,med參數(shù)為該像素鄰域值,y(n)為中值濾波輸出值。實(shí)驗(yàn)表明,降噪處理后的圖像可提高圖像識(shí)別精度。
針對(duì)番茄農(nóng)作物病斑分割因數(shù)據(jù)集較小、易受光照等復(fù)雜背景的影響,導(dǎo)致模型分割精度低,表現(xiàn)為過(guò)分割或欠分割的問(wèn)題,本文構(gòu)建了一種基于改進(jìn)的U-Net網(wǎng)絡(luò)模型,整體結(jié)構(gòu)如圖3所示。模型包括兩部分:多尺度特征提取編碼部分、注意力機(jī)制解碼部分。網(wǎng)絡(luò)輸入圖像尺寸256×256,為避免由單一通道提取特征無(wú)法準(zhǔn)確提取邊緣信息的問(wèn)題,編碼部分首先將圖像進(jìn)行4次Inception多通道卷積,加強(qiáng)非線(xiàn)性表達(dá)。在每次卷積后將各通道融合的特征圖送入2×2最大池化層,使特征圖尺寸縮小為原來(lái)的一半,防止模型過(guò)擬合,同時(shí)降低計(jì)算量。注意力機(jī)制解碼階段包括Inception模塊、上采樣、注意力模塊,其中上采樣是大小為3×3的反卷積層。然而,上采樣過(guò)程中會(huì)引入噪聲,丟失番茄葉片病斑邊緣信息,因此加入注意力模塊SENet,通過(guò)空間和通道兩個(gè)維度恢復(fù)在編碼階段損失的信息,并有效緩解權(quán)重分散問(wèn)題。最后通過(guò)SoftMax函數(shù)對(duì)番茄病斑和背景進(jìn)行二分類(lèi),輸出分割結(jié)果。
圖像分割效果的好壞關(guān)鍵在于圖像特征提取是否良好,獲取準(zhǔn)確的圖像特征信息,得到更多圖像屬性[19],進(jìn)而精確識(shí)別物體的位置和區(qū)域,實(shí)現(xiàn)番茄葉片病斑的有效分割和檢測(cè)。但編碼階段選取單一尺寸卷積核進(jìn)行提取特征,當(dāng)感受野選取不合適時(shí)會(huì)產(chǎn)生空間上下文信息提取準(zhǔn)確度低的問(wèn)題,導(dǎo)致分割區(qū)域模糊、分類(lèi)錯(cuò)誤的現(xiàn)象。因此,為解決以上問(wèn)題,本文基于U-Net網(wǎng)絡(luò)引入Inception[20]結(jié)構(gòu)將不同大小的卷積核并行,對(duì)輸入圖像進(jìn)行逐像素卷積。本實(shí)驗(yàn)前三層直接采用經(jīng)典的Inception結(jié)構(gòu)即1×1、3×3、5×5以及3×3最大池化,當(dāng)特征圖縮減為32×32時(shí)開(kāi)始使用將標(biāo)準(zhǔn)的卷積核轉(zhuǎn)換成兩個(gè)非對(duì)稱(chēng)的卷積核[21],即將3×3轉(zhuǎn)換成1×3與3×1,5×5轉(zhuǎn)換成的1×5與5×1的方式增強(qiáng)非線(xiàn)性,保持網(wǎng)絡(luò)稀疏性,同時(shí)極大地壓縮網(wǎng)絡(luò)參數(shù)量[22]。解碼階段與之對(duì)應(yīng)。多尺度特征提取中的非對(duì)稱(chēng)卷積模塊結(jié)構(gòu)圖如圖4所示。
圖4 非對(duì)稱(chēng)多通道卷積特征提取模塊Fig.4 Asymmetric multi-channel convolution feature extraction module
針對(duì)網(wǎng)絡(luò)訓(xùn)練層數(shù)參數(shù)大、不方便實(shí)際應(yīng)用的問(wèn)題,采用Inception多尺度提取特征,處理更加豐富的空間特征,小尺度卷積核關(guān)注小病斑區(qū)域,大尺度卷積核關(guān)注上下文信息,增強(qiáng)特征多樣性。采用非對(duì)稱(chēng)卷積進(jìn)行多通道特征提取減少約33%參數(shù)量,提高了實(shí)時(shí)分割病斑的效率,增強(qiáng)了網(wǎng)絡(luò)的旋轉(zhuǎn)魯棒性以及泛化和表達(dá)能力。
編-解碼網(wǎng)絡(luò)提取低層特征時(shí)獲得更多精確的細(xì)節(jié)和位置信息,提取高層特征時(shí)則更關(guān)注語(yǔ)義上下文,而U-Net網(wǎng)絡(luò)利用跳躍式連接將低層細(xì)節(jié)與高層語(yǔ)義相結(jié)合,實(shí)現(xiàn)目標(biāo)特征準(zhǔn)確提取。但在解碼階段進(jìn)行上采樣操作會(huì)丟失一部分位置空間等信息,從而導(dǎo)致病斑分割不精確。為使以上問(wèn)題得到有效解決,本文加入注意力機(jī)制模塊AM。AM通過(guò)直接級(jí)聯(lián)對(duì)應(yīng)編碼層和下一反卷積層,融合其互補(bǔ)特征信息[23],抑制上采樣產(chǎn)生的噪聲,增強(qiáng)模型魯棒性。本文綜合比較卷積塊注意模塊(convolutional block attention module,CBAM)[24]與擠壓和激勵(lì)網(wǎng)絡(luò)(squeeze and excitation networks,SENet)[25],CBAM在本實(shí)驗(yàn)數(shù)據(jù)集上準(zhǔn)確度比SENet略低,且SENet參數(shù)量比CBAM少約1.7%。因此最終選擇SENet,其結(jié)構(gòu)如圖5所示。
圖5 Attention Mechanism結(jié)構(gòu)示意圖Fig.5 Schematic diagram of Attention Mechanism
圖5中,V為輸入X經(jīng)過(guò)Ftr變換后的特征圖,X∈?H′×W′×C′,V∈?H×W×C,M=[m1,m2,…,m C]表示第c個(gè)濾波器的參數(shù),則Ftr過(guò)程公式如式(2)所示:
其中,*表示卷積操作。在Squeeze進(jìn)行全局池化,通過(guò)壓縮每個(gè)feature map從而獲取全局特征信息,并得到1×1×C的數(shù)列,F(xiàn)sq過(guò)程公式如式(3)所示:
其中,統(tǒng)計(jì)量s∈?C,V為局部描述符的集合。最后進(jìn)行Excitation激勵(lì)操作,通過(guò)兩個(gè)全連接層構(gòu)成Bottleneck結(jié)構(gòu)融合通道信息,利用Sigmoid門(mén)函數(shù)獲取通道間非線(xiàn)性關(guān)系。此模塊類(lèi)似于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)中的門(mén)機(jī)制。激勵(lì)過(guò)程公式如式(4)所示:
為加速模型收斂并緩解過(guò)擬合現(xiàn)象,本模型加入歸一化。批歸一化(batch normalization,BN)[26]以圖像數(shù)量N為單位進(jìn)行批量處理,如圖6所示,容易受batch size設(shè)置的影響。本文TLDD數(shù)據(jù)量有限,當(dāng)batch size設(shè)置過(guò)小時(shí)會(huì)導(dǎo)致均值、方差計(jì)算不準(zhǔn)確性升高。因此,本模型采用分組歸一化(group normalization,GN)[27],以通道C為單位,計(jì)算每個(gè)group的均值和方差(同圖6),當(dāng)batch size設(shè)置較小時(shí),也可以正確歸一化,公式如下:
圖6 Group Normalization結(jié)構(gòu)示意圖Fig.6 Structure diagram of Group Normalization
其中,a=(a N,a C,a H,aW);ε為常數(shù);γ和β為可學(xué)習(xí)變量;C為通道數(shù);G為分組數(shù),本文G取32。式(6)為歸一化公式,式(7)、(8)為每組方差和均值,式(9)為變換重構(gòu)過(guò)程,主要作用為加強(qiáng)非線(xiàn)性表達(dá)能力,防止其飽和時(shí)使網(wǎng)絡(luò)收斂變慢。
模型通過(guò)隨機(jī)梯度下降(stochastic gradient descent,SGD)[28]優(yōu)化算法對(duì)損失函數(shù)進(jìn)行優(yōu)化,對(duì)TLDD進(jìn)行二分類(lèi)(1病斑,0背景)交叉熵?fù)p失函數(shù)(Two-class cross_entropy loss)計(jì)算,表達(dá)式如式(11)所示:
番茄葉部病害圖像分割的目的是將圖像中每個(gè)像素進(jìn)行判定類(lèi)別,從而明確病害范圍。為評(píng)價(jià)模型分割效果,并從多個(gè)角度說(shuō)明本文算法的性能,本文選用了準(zhǔn)確率(Accuracy)、召回率(Recall)、平均交互比(mean intersection over union,MIoU)[29]三個(gè)指標(biāo),具體的計(jì)算公式如下三個(gè)式子:
式中,Pacc為準(zhǔn)確率;Prec為召回率;PMIoU為平均交互比;KTP為真正例,正確將病斑分類(lèi)的像素點(diǎn);KFP為假正例,將背景錯(cuò)分成病斑的像素點(diǎn);KTN為真負(fù)例,正確將背景分類(lèi)的像素點(diǎn);KFN為假負(fù)例,將病斑錯(cuò)分成背景的像素點(diǎn)。
本實(shí)驗(yàn)采用深度學(xué)習(xí)Pytorch框架,實(shí)驗(yàn)環(huán)境硬件設(shè)備采用i7 6700k CPU,GPU為GTX 2080Ti,運(yùn)行內(nèi)存為32 GB,優(yōu)化器采用SGD,學(xué)習(xí)速率為0.001,動(dòng)量設(shè)置為0.9,迭代次數(shù)設(shè)為100?;贑NN網(wǎng)絡(luò)的模型可以較好地達(dá)到圖像分割目的。首先對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)擴(kuò)增;然后為了增強(qiáng)模型敏感度,對(duì)數(shù)據(jù)集進(jìn)行圖像預(yù)處理;在模型訓(xùn)練階段,為增強(qiáng)模型圖像特征提取能力和訓(xùn)練速度,本文將PlantVillage數(shù)據(jù)集作為改進(jìn)UNet網(wǎng)絡(luò)算法模型的輸入,并且保留預(yù)訓(xùn)練的參數(shù),將預(yù)訓(xùn)練網(wǎng)絡(luò)作為本文創(chuàng)建的TLDD訓(xùn)練模型。通過(guò)預(yù)訓(xùn)練提高模型訓(xùn)練速度,有效增強(qiáng)網(wǎng)絡(luò)的擬合能力,實(shí)現(xiàn)在有限數(shù)據(jù)集上提高病斑分割的準(zhǔn)確度,本文方法最終準(zhǔn)確率達(dá)到0.929。整體番茄葉片病害分割模型具體流程如圖7所示。
圖7 番茄葉片病害分割模型流程圖Fig.7 Flow chart of tomato leaf disease segmentation model
將預(yù)訓(xùn)練完成的模型在TLDD訓(xùn)練,每次迭代訓(xùn)練結(jié)束后,記錄訓(xùn)練準(zhǔn)確率。由圖8可知,隨著訓(xùn)練迭代次數(shù)的不斷增加,模型的準(zhǔn)確率不斷上升,損失值不斷下降。當(dāng)?shù)螖?shù)達(dá)到88時(shí)準(zhǔn)確度穩(wěn)定在0.92,浮動(dòng)變化穩(wěn)定在1個(gè)百分點(diǎn)以?xún)?nèi),損失值穩(wěn)定在0.042,上下浮動(dòng)在0.01以?xún)?nèi),模型準(zhǔn)確率較高,魯棒性較好。由此分析可知,本文對(duì)U-Net網(wǎng)絡(luò)的改進(jìn)可以使模型達(dá)到一個(gè)較好的分割水平。
圖8 模型準(zhǔn)確率與損失值變化曲線(xiàn)Fig.8 Change curve of model accuracy and loss value
為衡量本文模型的有效性,基于真實(shí)田間環(huán)境番茄病害數(shù)據(jù)集TLDD,使用改進(jìn)后的U-Net分別與傳統(tǒng)UNet、FCN8s、SegNet、Inception+U-net、U-Net+AM進(jìn)行實(shí)驗(yàn)對(duì)比,樣本總數(shù)1 200張,隨機(jī)選取數(shù)據(jù)集70%作為訓(xùn)練樣本,30%作為測(cè)試樣本。如表1所示,表中InU表示基于U-Net網(wǎng)絡(luò)引入多尺度Inception特征提取網(wǎng)絡(luò)的模型,UAM表示在U-Net網(wǎng)絡(luò)中引入注意力模塊的模型。將U-Net、InU、UAM模型與本文方法進(jìn)行Pacc、Prec和PMIoU參數(shù)比較,同時(shí)為衡量模型訓(xùn)練圖像的速度,對(duì)每個(gè)模型的訓(xùn)練時(shí)間進(jìn)行記錄。由表1數(shù)據(jù)可知,從評(píng)價(jià)指標(biāo)上看,六種模型的準(zhǔn)確率分別為88.2%、86.4%、89.2%、92.1%、91.3%,92.9%。其中,F(xiàn)CN8s在整體上看效果最差,準(zhǔn)確率偏低,其次U-Net網(wǎng)絡(luò)分割效果在FCN8s的基礎(chǔ)上有所改善,SegNet在U-Net網(wǎng)絡(luò)基礎(chǔ)上準(zhǔn)確率上升3.2%。此外,InU和UAM的模型與U-net相比,準(zhǔn)確率分別提高約4.4%、3.5%,召回率提高了3.9%、4.4%;而同時(shí)加入多尺度特征提取和AM的模型效果最佳,準(zhǔn)確率為92.9%,召回率為91.1%,平均交互比為93.6%,分別比U-Net模型升高5.3%、6.0%、6.6%,則表明被正確分割的像素比例升高,正確分割率升高,整體表現(xiàn)為基本分割出番茄葉片的病斑區(qū)域。從訓(xùn)練時(shí)間上看,基于FCN8s網(wǎng)絡(luò)模型速度最慢,其次是U-Net、SegNet、UAM模型,分別為2.20 h、2.12 h、2.17 h、2.11 h,而UAM模型訓(xùn)練時(shí)間較慢是因?yàn)榧尤氲淖⒁饬δK會(huì)增加一定參數(shù)和計(jì)算量。本文方法為均衡該部分影響,加入GN層有效降低訓(xùn)練時(shí)間,加速模型收斂,最終訓(xùn)練時(shí)間為1.97 h。圖9為本文方法不同迭代次數(shù)下的分割預(yù)測(cè)結(jié)果,由其可知本文方法可準(zhǔn)確將病斑分割并接近真實(shí)值。
表1 實(shí)驗(yàn)對(duì)比結(jié)果Table 1 Experimental comparison results
圖9 迭代過(guò)程效果圖Fig.9 Effect diagram of iterative process
此外,為驗(yàn)證通過(guò)在PlantVillage數(shù)據(jù)集上預(yù)先訓(xùn)練對(duì)本文方法的有效性,基于TLDD將改進(jìn)U-Net模型與預(yù)先訓(xùn)練的圖像分割模型進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如表2所示。
表2 預(yù)訓(xùn)練模型實(shí)驗(yàn)對(duì)比Table 2 Pre-training model experiment comparison
表中Imp-U-Net表示直接將TLDD輸入本文改進(jìn)的U-Net網(wǎng)絡(luò),預(yù)訓(xùn)練+Imp-U-Net表示先經(jīng)過(guò)預(yù)訓(xùn)練,再基于改進(jìn)網(wǎng)絡(luò)對(duì)TLDD進(jìn)行訓(xùn)練。由表2可知,Imp-UNet網(wǎng)絡(luò)比U-Net模型準(zhǔn)確度提高約3.9%,主要是因?yàn)楸疚募尤氲亩喑叨染矸e模塊和注意力模塊準(zhǔn)確提取了病斑特征;而基于預(yù)訓(xùn)練+Imp-U-Net分割模型準(zhǔn)確度比U-Net模型提高約5.3%,比Imp-U-Net網(wǎng)絡(luò)準(zhǔn)確度提高1.3%,訓(xùn)練速度也明顯提高,充分證明在本文加入兩個(gè)模塊后,結(jié)合預(yù)訓(xùn)練的方法在準(zhǔn)確度和訓(xùn)練速度上均有所提升,同時(shí)也減少了網(wǎng)絡(luò)模型對(duì)硬件的需求,可在現(xiàn)實(shí)實(shí)驗(yàn)訓(xùn)練中被使用,以此節(jié)省訓(xùn)練時(shí)間。圖10為不同模型架構(gòu)的病斑分割效果圖。由圖可知,采用FCN8s網(wǎng)絡(luò)模型分割的效果與采用U-Net網(wǎng)絡(luò)進(jìn)行分割效果相差不大,均能分割出病斑的大致區(qū)域,但仍然存在分割不準(zhǔn)確現(xiàn)象。其中,F(xiàn)CN8s分割不準(zhǔn)確主要是因?yàn)樵谙虏蓸舆^(guò)程中對(duì)特征提取不夠準(zhǔn)確,尤其是對(duì)小病斑區(qū)域的分割效果較差。SegNet主要通過(guò)空洞卷積在不增加參數(shù)量的情況下擴(kuò)大感受野,但該方法對(duì)病斑邊緣分割效果較差;InU模型由于多尺度提取特征,導(dǎo)致部分區(qū)域存在過(guò)分割現(xiàn)象;UAM分割模型由于提取圖像屬性特征不充分,使模型存在病斑欠分割或過(guò)分割的問(wèn)題;而將二者結(jié)合的模型效果最好,平衡了多尺度提取特征和注意力關(guān)注病斑區(qū)域兩種方法,預(yù)測(cè)結(jié)果基本與真實(shí)值相對(duì)應(yīng),可較好地應(yīng)用于番茄病斑識(shí)別。
圖10 不同圖像分割方法效果對(duì)比圖Fig.10 Comparison of effects of different image segmentation methods
因此由實(shí)驗(yàn)分析可得,通過(guò)引入多尺度特征提取,能全面獲取病斑區(qū)域和邊緣信息;通過(guò)引入AM使模型更加準(zhǔn)確地關(guān)注病斑像素;相較于傳統(tǒng)分割、InU和UAM模型圖像分割方法,本文模型在衡量指標(biāo)上的分割效果更好。
葉片出現(xiàn)病斑是番茄及大多數(shù)農(nóng)作物開(kāi)始出現(xiàn)病變最直接、最明顯的表現(xiàn)。為了有效防止番茄病情惡化,及時(shí)識(shí)別病斑區(qū)域,本文基于改進(jìn)的U-Net網(wǎng)絡(luò)實(shí)現(xiàn)真實(shí)田間番茄病害分割,將采集番茄葉片數(shù)據(jù)進(jìn)行擴(kuò)充和預(yù)處理,并在此數(shù)據(jù)集上驗(yàn)證了本文方法在圖像分割任務(wù)中的有效性。與經(jīng)典的U-Net、FCN8s、SegNet進(jìn)行對(duì)比,本文分割效果最好;與引入Inception和AM方法相比,本文通過(guò)多尺度提取圖像低級(jí)與高級(jí)語(yǔ)義信息,同時(shí)加入注意力機(jī)制關(guān)注局部特征,結(jié)合模型預(yù)訓(xùn)練,在降低模型訓(xùn)練時(shí)間的同時(shí)有效增強(qiáng)了其表達(dá)能力。然而,基于CNN的圖像分割算法仍然有一定局限性,不適用于小數(shù)據(jù)集分割,難以在現(xiàn)實(shí)場(chǎng)景中應(yīng)用。未來(lái)將進(jìn)一步研究小數(shù)據(jù)集圖像分割與分類(lèi),以及實(shí)現(xiàn)真實(shí)復(fù)雜環(huán)境下不同病害的識(shí)別。