郭鑫鑫 劉 洋
(吉林農(nóng)業(yè)科技學(xué)院,吉林 昌邑 132101)
水稻紋枯病又稱花桿病,是一種真菌病害,病原菌為立枯絲核菌。該病害主要發(fā)生于葉鞘和葉片上,初期發(fā)病癥狀為葉片感染部位呈暗綠色,邊緣出現(xiàn)不清晰條紋狀小斑點(diǎn)。中期發(fā)病癥狀為出現(xiàn)淡褐色不規(guī)則水漬狀大斑點(diǎn),后期發(fā)病癥狀為葉片病斑邊緣呈暗褐色,中間呈灰綠色或褐色,形成不規(guī)則云紋狀褐斑。北方水稻紋枯病發(fā)病率一般在10%~15%,嚴(yán)重時(shí)達(dá)到40%以上,會(huì)導(dǎo)致葉鞘干枯,葉片枯死,甚至?xí)绊懰窘Y(jié)實(shí),導(dǎo)致大面積減產(chǎn),給農(nóng)戶帶來較大的經(jīng)濟(jì)損失。農(nóng)作物病斑的準(zhǔn)確分割能為后續(xù)病害的識別提供有效依據(jù),具有重要意義。
現(xiàn)階段圖像病斑分割常用方法有機(jī)器視覺和圖像處理技術(shù)兩種方法。隨著物聯(lián)網(wǎng)技術(shù)及機(jī)器視覺技術(shù)的發(fā)展,許多國內(nèi)外學(xué)者運(yùn)用機(jī)器視覺技術(shù)對農(nóng)作物病害圖像的分割做了大量研究。如戴子兵[1]利用ASPP模塊增加U-net網(wǎng)絡(luò)分割的精準(zhǔn)度,實(shí)現(xiàn)水稻病害分割。郭丹等[2]采用基于深度信念網(wǎng)絡(luò)的水稻紋枯病識別方法,利用Sobel邊緣檢測算子提取水稻紋枯病的病斑特征。晁曉菲[3]研究基于深度學(xué)習(xí)的蘋果葉片病害識別,提出一種融合Xception及DenseNet深度學(xué)習(xí)網(wǎng)絡(luò)提升網(wǎng)絡(luò)空間的注意力提取能力。王書志等[4]提出一種基于顯著性目標(biāo)檢測方法,提高葡萄葉片病害病斑分割性能。在機(jī)器視覺技術(shù)研究中,發(fā)現(xiàn)深度學(xué)習(xí)不需要人為確定訓(xùn)練集合,深度學(xué)習(xí)可以通過自我學(xué)習(xí)來完成對圖像病斑的像素級特征提取并完成語義分割,可以節(jié)省大量人力和時(shí)間。
北方水稻常見病害有稻瘟病、白葉枯病等,相關(guān)學(xué)者對其研究相對較多,而對水稻紋枯病研究較少。筆者在本研究中以水稻紋枯病為對象,利用Transformer模型結(jié)合U-net語義分割網(wǎng)絡(luò),提取紋枯病斑的像素特征,完成對紋枯病斑的語義分割,為水稻紋枯病的識別及診斷提供有效依據(jù)。
首先,將采集的測試樣本利用Labelme深度學(xué)習(xí)圖像標(biāo)注工具進(jìn)行像素標(biāo)記。其次,構(gòu)建Trans-Unet網(wǎng)絡(luò)模型,利用Transformer模型完成對圖像數(shù)據(jù)上下采樣的全局提取、編碼,結(jié)合U-net網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)訓(xùn)練、解碼得到語義分割模型。
試驗(yàn)中水稻病斑圖像采集自吉林農(nóng)業(yè)科技學(xué)院水稻示范區(qū),在自然光條件下利用手機(jī)后置攝像頭在距離水稻紋枯病葉的適當(dāng)位置拍攝紋枯病圖像,所獲取的紋枯病圖像分辨率為5 120×2 880。采集時(shí)期分別為水稻生長前期、中期和后期,每個(gè)時(shí)期紋枯病的圖像分別采集50幅,共采集150幅圖像,每幅圖像均以JPG格式進(jìn)行存儲(chǔ)。隨機(jī)選取紋枯病水稻圖像30幅作為測試集,部分圖像如圖1所示。
圖1 水稻紋枯病圖像
由于語義分割需要精確到像素級,因此按照定義好的水稻病斑標(biāo)簽對測試樣本進(jìn)行深度學(xué)習(xí)標(biāo)記[5]。為便于計(jì)算機(jī)深度學(xué)習(xí)訓(xùn)練,筆者使用深度學(xué)習(xí)標(biāo)注工具Labelme對30幅水稻紋枯病原始圖像進(jìn)行預(yù)處理。首先在原始圖像中截取病斑圖像較為突出的區(qū)域作為目標(biāo)區(qū)域,由于水稻紋枯病在水稻葉面區(qū)域分布較廣,分辨率較高,會(huì)直接影響到機(jī)器學(xué)習(xí)速率,因此目標(biāo)區(qū)域在葉片上的范圍選定為220×220像素以增加機(jī)器學(xué)習(xí)速率,共在30幅原始圖像中截取到125個(gè)目標(biāo)區(qū)域,將125個(gè)目標(biāo)區(qū)域的病斑圖像進(jìn)行像素標(biāo)記,并通過曲線框出葉面主體區(qū)域記為leaf,通過曲線框出目標(biāo)區(qū)域即病斑區(qū)域,記為disease。每張圖像標(biāo)注完成后,生成JPG圖像樣本,標(biāo)記后的一個(gè)訓(xùn)練樣本如圖2所示。
圖2 Labelme訓(xùn)練樣本標(biāo)記
U-net是較早使用全卷積網(wǎng)絡(luò)的圖像分割算法之一,是基于FCN的改進(jìn)語義分割網(wǎng)絡(luò)[6],于2015年由MICCAI發(fā)表。與FCN網(wǎng)絡(luò)相比較,U-net網(wǎng)絡(luò)結(jié)構(gòu)簡單、試驗(yàn)效果顯著,在分割結(jié)果方面可保留更多局部細(xì)節(jié),廣泛用于醫(yī)學(xué)影像、無人機(jī)遙感成像等語義分割場景,原始U-net網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 原始U-net網(wǎng)絡(luò)模型
U-net網(wǎng)絡(luò)是通過對目標(biāo)區(qū)域上、下采樣來實(shí)現(xiàn)對圖像的像素級分割,但由于U-net網(wǎng)絡(luò)的平移不變性和捕捉長期依賴能力不足,需要多層卷積后才能得到抽象的全局信息,影響病斑圖像的分割效率。Transformer網(wǎng)絡(luò)作為自然語言處理任務(wù)的模型,本身可以利用像素之間的長期依賴性,有效提取病斑的全局信息,但對細(xì)節(jié)信息提取效果差。U-net分割模型為左右對稱型網(wǎng)絡(luò),分割提取過程首先經(jīng)過左側(cè)收縮池化操作(Conv-Pooling)對目標(biāo)區(qū)域進(jìn)行下采樣,然后通過Deconv反卷積進(jìn)行上采樣。Transformer網(wǎng)絡(luò)旨在從目標(biāo)區(qū)域提取全局信息,將Transformer網(wǎng)絡(luò)置于U-net網(wǎng)絡(luò)的底部,利用Transformer模型的多頭自注意力機(jī)制(MHSA)增強(qiáng)模型對全局信息的感知能力。由于病斑區(qū)域的像素特征與健康區(qū)域的像素特征區(qū)別較大,在下采樣過程中需要經(jīng)過兩次卷積層[7](Conv-1和Conv-2)以及兩次線性整流層(ReLU-1和ReLU-2),通過卷積層來提取病斑區(qū)域的高維層次特征圖,通過線性整流層來提高泛化能力緩解過擬合發(fā)生。在上采樣過程中,每一級需要通過Deconv反卷積操作完成上采樣,同一維度經(jīng)過跳層連接保持目標(biāo)特征提取的一致性,重復(fù)4次卷積池化操作,最終經(jīng)過Softmax[8]獲得準(zhǔn)確的分割結(jié)果。改進(jìn)后的U-net網(wǎng)絡(luò)模型如圖4所示。
圖4 Trans-Unet網(wǎng)絡(luò)模型
為有效節(jié)省小樣本訓(xùn)練時(shí)間,筆者采用遠(yuǎn)程控制軟件Todesk軟件訪問試驗(yàn)服務(wù)器進(jìn)行網(wǎng)絡(luò)訓(xùn)練,服務(wù)器使用顯卡型號為英偉達(dá)A4000、顯存16 G的GPU,CUDA核心數(shù)量為6 144個(gè),顯存帶寬320 GB·s-1,算力30 MHash。詳細(xì)試驗(yàn)配置如表1所示。
表1 試驗(yàn)配置表
筆者利用改進(jìn)U-net網(wǎng)絡(luò)所構(gòu)建的Trans-Unet網(wǎng)絡(luò)模型對試驗(yàn)樣本進(jìn)行訓(xùn)練得到訓(xùn)練模型,由于Trans-Unet網(wǎng)絡(luò)具有小樣本訓(xùn)練優(yōu)勢,能夠利用少量樣本深度學(xué)習(xí)實(shí)現(xiàn)快速、精準(zhǔn)的分割。在測試過程中使用上述已采集125個(gè)目標(biāo)樣本為試驗(yàn)對象,樣本圖像大小為220×220像素,在125個(gè)樣本中隨機(jī)選取108個(gè)作為訓(xùn)練樣本,用于改進(jìn)模型的訓(xùn)練測試。
為了保證改進(jìn)模型的非線性和避免過擬合的情況,試驗(yàn)采用ReLU作為激活函數(shù),根據(jù)顯卡內(nèi)存情況,小批量規(guī)模設(shè)置為6,最大訓(xùn)練周期設(shè)置為10輪,則108個(gè)訓(xùn)練樣本每輪迭代次數(shù)18次,共計(jì)迭代次數(shù)為180次,閾值設(shè)置為0.8,設(shè)置初始學(xué)習(xí)率為0.000 01。設(shè)置好以上訓(xùn)練參數(shù),利用Trans-Unet網(wǎng)絡(luò)模型完成訓(xùn)練,該模型訓(xùn)練時(shí)間、準(zhǔn)確率和損失值變化情況如表2所示。
表2 Trans-Unet模型訓(xùn)練時(shí)間、準(zhǔn)確率與損失值
由表2的準(zhǔn)確率和損失值的變化情況可以看出,該模型在迭代次數(shù)趨于120次左右時(shí)趨于穩(wěn)定狀態(tài),訓(xùn)練樣本的準(zhǔn)確率及損失值變化幅度小,而且該模型訓(xùn)練時(shí)間較短,僅需要38 s即可完成180次迭代,小樣本測試準(zhǔn)確度高達(dá)98.74%,損失值為0.041 8,Trans-Unet網(wǎng)絡(luò)模型準(zhǔn)確率較高,可用于水稻紋枯病的病斑分割。
為檢測該模型的分割效率和泛化能力,在模型訓(xùn)練結(jié)束后,筆者采用的評價(jià)指標(biāo)為訓(xùn)練執(zhí)行時(shí)間、內(nèi)存占用率和語義分割準(zhǔn)確率,其中語義分割準(zhǔn)確率度量指標(biāo)[9]主要有四種:像素準(zhǔn)確率(PA)、平均像素準(zhǔn)確率(MPA)、平均交并比(MIoU)、訓(xùn)練損失值(BCE)。Trans-Unet網(wǎng)絡(luò)模型的執(zhí)行時(shí)間及內(nèi)存占用率如表3所示。
表3 Trans-Unet分割模型的執(zhí)行時(shí)間及內(nèi)存占用率
由表2、表3可以看出,該模型的分割執(zhí)行時(shí)間在37~40 s,平均分割時(shí)間約為38.3 s,服務(wù)器內(nèi)存占用率為68.9%~72.8%,平均內(nèi)存占用率約為71.35%。該分割模型訓(xùn)練執(zhí)行時(shí)間較短,內(nèi)存占用率較低。該模型采用的四種語義分割準(zhǔn)確率度量指標(biāo)計(jì)算公式如下。
像素準(zhǔn)確率PA是指測試目標(biāo)的正確像素點(diǎn)數(shù)占所有測試區(qū)域總像素的比例,公式如下:
平均像素準(zhǔn)確率MPA是對像素準(zhǔn)確率PA的改進(jìn)公式,對測試目標(biāo)計(jì)算PA值,然后再對所有PA值求平均值,公式如下:
平均交并比MIoU是語義分割的度量標(biāo)準(zhǔn),其通過計(jì)算測試目標(biāo)集合真實(shí)區(qū)域與預(yù)測區(qū)域的交集與并集之比,公式如下:
訓(xùn)練損失值BCE是用來估量該模型與目標(biāo)測試值與真實(shí)值之間的不一致程度,訓(xùn)練損失函數(shù)值越小,說明該模型魯棒性越好,公式如下:
式(1)~式(4)中,Pij表示本屬于類i,但被預(yù)測為類j的像素?cái)?shù)量。Pii表示本屬于i類且預(yù)測為i類的像素點(diǎn)總數(shù),即Pii表示為真正的數(shù)量,而pji則表示本屬于j類卻預(yù)測為i類的像素點(diǎn)總數(shù),k值表示像素點(diǎn)數(shù)量,Yi,Pi每個(gè)像素的預(yù)測值,N為迭代次數(shù)。
本試驗(yàn)重復(fù)訓(xùn)練周期為10次,得到該模型準(zhǔn)確率結(jié)果如表4所示。
表4 模型準(zhǔn)確率
由表4結(jié)果看出,該模型經(jīng)過10次訓(xùn)練后,該模型的像素準(zhǔn)確率為96.12%~97.88%,平均像素準(zhǔn)確率為96.82%~97.71%,平均交并比為87.01%~90.12%,模型損失值為1.12%~4.29%,由此看出該模型準(zhǔn)確率較高,泛化能力強(qiáng),魯棒性較好。
筆者在本試驗(yàn)中利用Trans-Unet網(wǎng)絡(luò)模型,綜合比較10次訓(xùn)練結(jié)果,第7次的訓(xùn)練結(jié)果準(zhǔn)確率更高,因此將第7次訓(xùn)練的Trans-Unet網(wǎng)絡(luò)結(jié)構(gòu)作為水稻病斑圖像分割模型,以備后續(xù)試驗(yàn)調(diào)用。利用Trans-Unet網(wǎng)絡(luò)模型對水稻紋枯病圖像分割,其結(jié)果如圖5所示。
圖5 水稻紋枯病分割結(jié)果
水稻紋枯病圖像分割結(jié)果顯示,可以得出本研究中構(gòu)建的Trans-Unet網(wǎng)絡(luò)模型對水稻紋枯病的分割具有較好的效果。在分割結(jié)果中可以看出,針對水稻紋枯病早期發(fā)生時(shí)面積較小的灰色病斑,還是中期或晚期病斑面積擴(kuò)大后的相對不規(guī)則褐色云狀病斑,該模型基本能夠?qū)崿F(xiàn)水稻紋枯病的準(zhǔn)確分割,因此,該模型于水稻紋枯病病發(fā)的初、中、晚期起到較好的分割效果。
筆者利用基于U-net網(wǎng)絡(luò)語義分割方法,并結(jié)合Transformer網(wǎng)絡(luò)模型構(gòu)建Trans-Unet分割模型實(shí)現(xiàn)水稻紋枯病斑的像素特征提取和語義分割任務(wù)。經(jīng)小樣本10輪測試訓(xùn)練后,Trans-Unet的水稻紋枯病分割模型執(zhí)行時(shí)間較短,平均38.3 s,內(nèi)存占用率較少,平均70.35%。病斑分割的PA值達(dá)到96.12%~97.88%,MPA值達(dá)到96.82%~97.71%,MIoU值達(dá)到87.01%~90.12%,Loss BCE值達(dá)到1.12%~4.29%。結(jié)果表明,該模型訓(xùn)練穩(wěn)定性較好,泛化能力較強(qiáng),魯棒性較好;可使用相機(jī)等拍照方式采集數(shù)據(jù),替代專業(yè)儀器實(shí)現(xiàn)水稻病害快速識別,提高水稻病害圖像識別準(zhǔn)確率,為小樣本機(jī)器學(xué)習(xí)提供了較好模型,同時(shí)為農(nóng)作物病害識別提供方法依據(jù)。