林芬芳 陳星宇 周維勛 王 倩 張東彥,*
基于堆棧稀疏自編碼器的小麥赤霉病高光譜遙感檢測(cè)
林芬芳1,2,3陳星宇1周維勛1王 倩2張東彥2,*
1南京信息工程大學(xué)遙感與測(cè)繪工程學(xué)院, 江蘇南京 210044;2農(nóng)業(yè)生態(tài)大數(shù)據(jù)分析與應(yīng)用技術(shù)國家地方聯(lián)合工程研究中心(安徽大學(xué)), 安徽合肥 230601;3黃河中下游數(shù)字地理技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室(河南大學(xué)), 河南開封 475004
小麥赤霉病具有發(fā)病快、周期短的特點(diǎn), 利用深度學(xué)習(xí)特征提取方法建立病害嚴(yán)重度檢測(cè)模型, 可為小麥赤霉病的防治提供科學(xué)指導(dǎo)。研究于2018—2020年間采集3個(gè)品種小麥在揚(yáng)花期、灌漿期和成熟期的麥穗高光譜數(shù)據(jù), 通過形態(tài)學(xué)處理去除麥芒, 提取出麥穗光譜曲線, 使用多源散射校正對(duì)光譜進(jìn)行去噪處理, 再采用堆棧稀疏自編碼器(Stacked Sparse Auto-encoder, SSAE)提取小麥赤霉病的光譜特征, 利用該特征分別結(jié)合Softmax分類器和偏最小二乘回歸方法構(gòu)建小麥赤霉病嚴(yán)重度判別和預(yù)測(cè)模型。通過預(yù)訓(xùn)練, 具有12~6個(gè)神經(jīng)元的雙層SSAE模型表現(xiàn)較好, 模型均方誤差更低, 而且各個(gè)病害等級(jí)的特征差異明顯; 以訓(xùn)練的SSAE模型提取的深度學(xué)習(xí)特征為基礎(chǔ)分別建立赤霉病嚴(yán)重度等級(jí)判別模型和嚴(yán)重度預(yù)測(cè)模型, 在嚴(yán)重度等級(jí)判別的分類結(jié)果中, 模型的總體精度和Kappa系數(shù)分別為88.2%和0.84, 其中“淮麥35”品種的總體精度最高; 在嚴(yán)重度預(yù)測(cè)模型中, 模型對(duì)所有品種測(cè)試集的預(yù)測(cè)決定系數(shù)和均方根誤差分別為0.927和0.062, 對(duì)各品種的預(yù)測(cè)決定系數(shù)均在0.95左右; 相比常見的幾種小麥赤霉病光譜指數(shù), 基于SSAE深度學(xué)習(xí)特征的赤霉病預(yù)測(cè)模型精度更高。高光譜遙感數(shù)據(jù)量大、光譜波段多, 堆棧稀疏自編碼器通過在自編碼器模型中加入稀疏表示的限定條件, 并增加隱含層數(shù)及隱含神經(jīng)元數(shù)來構(gòu)建更為復(fù)雜的模型, 所提取的光譜特征更能全方面地體現(xiàn)小麥赤霉病的光譜特征, 利用該特征構(gòu)建的小麥赤霉病檢測(cè)模型具有更高的精度, 可為精準(zhǔn)監(jiān)測(cè)小麥赤霉病提供科學(xué)依據(jù)。
赤霉病; 堆棧稀疏自編碼器; 高光譜; 檢測(cè); 小麥
小麥赤霉病(FHB, Fusarium head blight)是世界范圍內(nèi)最重要的小麥病害之一, 嚴(yán)重影響小麥的產(chǎn)量和品質(zhì)。該病不僅引起小麥大幅減產(chǎn), 受其污染的糧食或飼料, 可致人畜中毒, 嚴(yán)重危及到人類和動(dòng)物的食品安全與健康[1-2]。近10年來, 我國小麥種植區(qū)域發(fā)生赤霉病大流行的頻率明顯提高。因此, 在小麥關(guān)鍵生長(zhǎng)期, 能夠及時(shí)準(zhǔn)確的監(jiān)測(cè)赤霉病的發(fā)展動(dòng)態(tài), 實(shí)現(xiàn)早發(fā)現(xiàn)早處理, 對(duì)提高小麥的質(zhì)量和產(chǎn)量至關(guān)重要[3]。由于傳統(tǒng)的小麥赤霉病監(jiān)測(cè)方法主要依靠人工觀測(cè)及其經(jīng)驗(yàn), 存在費(fèi)時(shí)費(fèi)力、過程冗長(zhǎng)繁瑣、時(shí)效性差等弊端, 因此研究快速、精準(zhǔn)的小麥赤霉病檢測(cè)方法成為熱點(diǎn)。
作物感染病害后, 內(nèi)部生理指標(biāo)會(huì)發(fā)生變化, 作物的光譜在不同波段會(huì)表現(xiàn)出不同吸收和反射特性的變化, 因此使用遙感技術(shù)對(duì)小麥病害進(jìn)行檢測(cè)具有理論基礎(chǔ)和技術(shù)支撐[4-6]。Qiu等[7]利用數(shù)碼相機(jī)獲取的RGB圖像, 提出深度卷積神經(jīng)網(wǎng)絡(luò)可以準(zhǔn)確地檢測(cè)小麥麥穗和病斑區(qū)域; 之后, 相關(guān)學(xué)者繼續(xù)挖掘不同深度學(xué)習(xí)方法在小麥赤霉病上的識(shí)別潛力[8-10]; Zhang等[11-12]尤其考慮到病害樣本數(shù)量和大田復(fù)雜背景的影響, 針對(duì)小樣本提出了多特征機(jī)器學(xué)習(xí)的小麥赤霉病斑分割方法, 而對(duì)于大樣本提出了卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)和Unet++等多種深度學(xué)習(xí)方法的結(jié)合來識(shí)別赤霉病,并將這些方法應(yīng)用到小麥赤霉病噴藥防治效果評(píng)估上。數(shù)碼圖像雖然容易獲取, 但光譜特征有限且不易推廣到大面積的小麥赤霉病檢測(cè)上。相比之下, 高光譜遙感具有波段多、光譜范圍寬以及可提供光譜和空間域信息的特點(diǎn), 其中光譜信息能充分反映小麥內(nèi)部生物物理化學(xué)變化, 從而提高小麥赤霉病識(shí)別的準(zhǔn)確性[13-15]。小麥赤霉病高光譜遙感檢測(cè)的關(guān)鍵是病害敏感光譜特征的提取。為了有效分析小麥赤霉病光譜特征, 不同光譜預(yù)處理方法、光譜特征位置分析法、光譜指數(shù)法等被應(yīng)用到小麥赤霉病檢測(cè)中[16-18]。Whetton等[19-20]分別開展實(shí)驗(yàn)室和田間試驗(yàn), 利用高光譜成像技術(shù)通過偏最小二乘回歸和波段統(tǒng)計(jì)方法提取小麥赤霉病光譜特征并進(jìn)行病害識(shí)別; Zelazny等[21]分析比較了光譜相減、導(dǎo)數(shù)、標(biāo)準(zhǔn)正態(tài)變量變換等光譜預(yù)處理方法對(duì)小麥赤霉病光譜特征的影響。另外, Ma等[22-23]發(fā)現(xiàn)將光譜波長(zhǎng)、植被指數(shù)和小波特征等多種光譜特征融合能有效地提高小麥赤霉病的檢測(cè)精度。光譜植被指數(shù)是分析和檢測(cè)植物生理和化學(xué)變化的常用方法, 許多植被指數(shù)已經(jīng)被構(gòu)建用于作物病害識(shí)別并制圖[24]。根據(jù)小麥赤霉病的光譜響應(yīng), 一些學(xué)者提出了檢測(cè)小麥赤霉病的紅邊赤霉病指數(shù)、赤霉病病害指數(shù)、赤霉病分類指數(shù)等, 這些指數(shù)的提出因試驗(yàn)條件、小麥品種和生長(zhǎng)期等因素而不同。Bauriegel等[25]利用665~675 nm和550~560 nm范圍內(nèi)的光譜差異提出了赤霉病指數(shù)(head blight index, HBI), 該指數(shù)可以作為赤霉病識(shí)別的野外分類方法。Liu等[26]基于Sentinel-2數(shù)據(jù)提出了紅邊赤霉病指數(shù)(red-edge head blight index, REHBI), 結(jié)合冠層尺度上的高光譜數(shù)據(jù)在大尺度區(qū)域上進(jìn)行小麥赤霉病監(jiān)測(cè), 預(yù)測(cè)模型決定系數(shù)2為0.82。Zhang等[27]通過各個(gè)生長(zhǎng)期下赤霉病的最佳特征波長(zhǎng), 提出基于384~1050 nm光譜數(shù)據(jù)的赤霉病指數(shù)(Fusarium disease index, FDI), FDI顯示出較強(qiáng)的小麥赤霉病嚴(yán)重程度估測(cè)能力。丁文娟[28]通過光譜數(shù)據(jù)的一階微分處理仿照光譜歸一化微分指數(shù)構(gòu)建了赤霉病指數(shù)(wheat scab index, WSI)。Zhang等[29]通過高光譜顯微圖像也構(gòu)建了一個(gè)小麥赤霉病分類指數(shù)(fusarium classification index, FCI), 結(jié)果顯示了FCI對(duì)健康小麥和染赤霉病小麥的檢測(cè)潛力。
隨著深度學(xué)習(xí)方法的日趨成熟, 其越來越廣泛運(yùn)用于農(nóng)作物病害檢測(cè)。但是, 深度學(xué)習(xí)方法用于小麥赤霉病的高光譜特征挖掘的研究較少。Jin等[30]利用近地面獲取的高光譜遙感圖像比較了不同卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)小麥赤霉病的檢測(cè)能力, 結(jié)果發(fā)現(xiàn)具有卷積層和雙向遞歸層的混合神經(jīng)網(wǎng)絡(luò)能有效地從背景和健康中區(qū)分出染病麥穗。常規(guī)光譜數(shù)據(jù)處理方法對(duì)光譜特征的提取不夠透徹、深層和精準(zhǔn), 從而影響病害的識(shí)別。深度學(xué)習(xí)方法雖然較傳統(tǒng)的機(jī)器學(xué)習(xí)方法精度有所提高, 但是一些監(jiān)督學(xué)習(xí)的深度學(xué)習(xí)方法在數(shù)據(jù)標(biāo)注方面還需要人工進(jìn)行, 這個(gè)過程需要占據(jù)較多時(shí)間, 并且數(shù)據(jù)標(biāo)注的精度對(duì)一個(gè)網(wǎng)絡(luò)訓(xùn)練的優(yōu)良程度有很大的影響。堆棧稀疏自編碼器(Stacked Sparse Auto Encoder, SSAE)深度學(xué)習(xí)算法是一種無監(jiān)督方法, 相比于其他模型, 它不需要對(duì)數(shù)據(jù)進(jìn)行人工標(biāo)注, 另外, 該模型的重點(diǎn)是學(xué)習(xí)獲得一個(gè)可以良好代表輸入數(shù)據(jù)的特征, 它的輸出層后可以連接分類器或回歸模型。
為了探索一種快速和精準(zhǔn)監(jiān)測(cè)小麥赤霉病的方法, 本研究利用多年和多個(gè)品種的小麥赤霉病高光譜遙感數(shù)據(jù), 在SSAE參數(shù)優(yōu)化的基礎(chǔ)上深度提取小麥赤霉病光譜特征, 以建立魯棒性強(qiáng)的小麥赤霉病病害嚴(yán)重度等級(jí)識(shí)別和嚴(yán)重度估測(cè)模型; 光譜病害指數(shù)是針對(duì)某個(gè)特定病害而建立的一種光譜指數(shù),在病害監(jiān)測(cè)上具有簡(jiǎn)單和快速的特點(diǎn), 本研究探討基于SSAE的小麥赤霉病深度學(xué)習(xí)光譜特征與常見的小麥赤霉病病害光譜指數(shù)應(yīng)用于小麥赤霉病的檢測(cè)能力, 為小麥赤霉病的防控提供科學(xué)依據(jù)。
2018—2020年在安徽省農(nóng)業(yè)科學(xué)院試驗(yàn)田(31°89′N, 117°13'E)開展小麥赤霉病試驗(yàn), 試驗(yàn)品種分別為“西農(nóng)979”、“淮麥35”、“漯麥10”。其中, “西農(nóng)979”屬于中抗感赤霉病, “淮麥35”和“漯麥10”屬于易感赤霉病。一塊(10 m×10 m)的試驗(yàn)區(qū)分為接種區(qū)和控制區(qū)。在接種區(qū), 使用小型噴霧器將帶有鐮刀菌屬的孢子懸浮液噴灑在揚(yáng)花初期的麥穗上。揚(yáng)花期雨水多、溫度高, 適宜赤霉病的生長(zhǎng)。另外, 赤霉病是一種傳染性較強(qiáng)的病害, 當(dāng)一株小麥成功感染赤霉病后會(huì)作為感染源繼續(xù)傳染周圍的小麥。在控制區(qū), 將濃度為1500 g hm–2的多菌靈殺菌劑噴灑在麥穗上, 以防止控制區(qū)的小麥感染赤霉病。其他田間管理技術(shù)按照當(dāng)?shù)剞r(nóng)藝措施在2個(gè)小區(qū)進(jìn)行。
圖1顯示了研究所采用方法的示意流程圖。研究過程包括病害高光譜遙感數(shù)據(jù)獲取、病穗光譜提取和小麥赤霉病嚴(yán)重度計(jì)算、光譜數(shù)據(jù)預(yù)處理、基于堆棧稀疏自編碼器深度學(xué)習(xí)算法的病害光譜特征提取、赤霉病檢測(cè)模型構(gòu)建、基于不同方法的赤霉病檢測(cè)模型比較。
圖1 研究方法流程圖
1.3.1 高光譜數(shù)據(jù)采集與試驗(yàn)數(shù)據(jù)集選取 小麥赤霉病穗的高光譜遙感數(shù)據(jù)使用SOC710E (Surface Optics Corporation, 美國)成像光譜儀進(jìn)行獲取。成像光譜儀SOC710E的光譜范圍在400~1000 nm, 光譜分辨率為2.34 nm, 該儀器的其他性能參數(shù)見Zhang等[27]。
在天氣晴朗、無風(fēng)少云的田間自然環(huán)境下, 快速采摘麥穗并放置在黑色背景布上, 然后利用放置在高度可調(diào)三腳架上的SOC710E進(jìn)行麥穗的高光譜遙感圖像采集。數(shù)據(jù)采集時(shí), 鏡頭垂直向下朝向樣本, 調(diào)整鏡頭與背景布間的距離和曝光時(shí)間使麥穗能夠清晰成像。為準(zhǔn)確獲取麥穗的反射率, 在測(cè)量麥穗高光譜之前, 進(jìn)行白板和暗電流的測(cè)量。在樣品掃描前采集暗電流強(qiáng)度圖像, 通過覆蓋相機(jī)鏡頭去除暗電流噪聲。同樣, 在暗電流圖像之后立即收集99%反射標(biāo)準(zhǔn)的白板強(qiáng)度。將這兩幅圖像應(yīng)用于隨后的樣本強(qiáng)度圖像, 具體公式如下所示。
式中,為麥穗反射率,0為麥穗樣本電流強(qiáng)度,w和C分別為白板和暗電流強(qiáng)度。
利用成像光譜儀連續(xù)3年在該試驗(yàn)場(chǎng)采集揚(yáng)花期、灌漿期和成熟期的小麥麥穗高光譜遙感數(shù)據(jù)。最后將4576個(gè)樣本作為試驗(yàn)數(shù)據(jù), 其中2018年為631個(gè), 2019年為1680個(gè), 2020年為2265個(gè)。此外, 該儀器獲取的數(shù)據(jù)在900~1000 nm范圍內(nèi)出現(xiàn)了較大的噪聲, 因此本文只采用400~900 nm的高光譜數(shù)據(jù)。
1.3.2 高光譜數(shù)據(jù)預(yù)處理 為準(zhǔn)確獲取染病小麥麥穗的光譜信息, 必須對(duì)成像光譜儀SOC710E采集到的麥穗高光譜遙感圖像進(jìn)行預(yù)處理, 包括麥穗光譜曲線提取和光譜校正。小麥麥穗的麥芒對(duì)麥穗的光譜有影響, 因此必須去除以提取純麥穗光譜曲線。首先將原始高光譜圖像中的紅色(660 nm)、綠色(560 nm)和藍(lán)色(480 nm) 3個(gè)波段提取組成RGB圖像(圖2-a)。接著對(duì)B通道的灰度圖像進(jìn)行形態(tài)學(xué)處理, 去除麥穗中的毛刺、孤點(diǎn)等(圖2-b), 最后對(duì)獲得的圖像進(jìn)行二值化處理(圖2-c), 將麥穗?yún)^(qū)域從背景分離出來以提取純麥穗的光譜曲線。形態(tài)學(xué)是圖像處理的基本數(shù)學(xué)理論[31], 包括腐蝕與膨脹、開運(yùn)算與閉運(yùn)算、擊中與擊不中變換、骨架提取、形態(tài)學(xué)梯度等基本運(yùn)算。本研究采用腐蝕與膨脹和開運(yùn)算與閉運(yùn)算進(jìn)行麥穗麥芒的去除。
圖2 麥穗形態(tài)學(xué)處理
(a) 原始影像; (b) 形態(tài)學(xué)處理后影像; (c) 二值化影像。
(a): the original image; (b): the image after morphological processing; (c): binary image.
田間自然光條件下采集高光譜圖像數(shù)據(jù)時(shí), 信號(hào)會(huì)受到散射效應(yīng)和噪聲的影響, 影響的程度取決于測(cè)量過程中水分變化、光程長(zhǎng)度變化、儀器光學(xué)以及探測(cè)器的漂移和距離。為獲取地物準(zhǔn)確的光譜信號(hào), 必須進(jìn)行光譜數(shù)據(jù)預(yù)處理, 否則會(huì)導(dǎo)致光譜基線中的平行位移、斜率和強(qiáng)度效應(yīng)以及路徑長(zhǎng)度差異。多元散射校正(Multiplicative Scatter Correction, MSC)方法可以有效消除光譜中的基線效應(yīng), 包括平移和偏移[32]。它首先要建立一個(gè)“理想光譜”, 以該光譜為標(biāo)準(zhǔn)對(duì)所有其他樣品的光譜進(jìn)行修正。實(shí)際上, “理想光譜”很難得到, 一般取所有樣品光譜的平均值作為一個(gè)理想的標(biāo)準(zhǔn)光譜。平均光譜計(jì)算公式如下:
接著, 將平均光譜和樣本光譜進(jìn)行線性回歸, 通過最小二乘法計(jì)算基線平移量和偏移量。
最后利用基線平移量和偏移量, 對(duì)每個(gè)樣本光譜進(jìn)行校正。
參考國家農(nóng)業(yè)行業(yè)標(biāo)準(zhǔn)(GB/T 15796-2011)[33], 以及結(jié)合植保專家調(diào)查結(jié)果。小麥麥穗赤霉病嚴(yán)重度(disease index, DI)計(jì)算公式如下:
式中,lesion為一個(gè)麥穗中病斑區(qū)域面積,all為去除麥芒后整顆麥穗面積。
為準(zhǔn)確計(jì)算麥穗赤霉病嚴(yán)重度, 關(guān)鍵是從整顆麥穗中分割病斑區(qū)域。赤霉病病斑分割方法主要包括背景分離、麥芒去除、色度空間轉(zhuǎn)換和OTSU閾值分割4個(gè)步驟。前期提取光譜曲線已經(jīng)進(jìn)行了背景分離和麥芒去除的處理, 因此只需再進(jìn)行色度空間轉(zhuǎn)換和OTSU閾值分割。色度空間轉(zhuǎn)換是將圖像從RGB顏色空間轉(zhuǎn)換到Y(jié)DbDr色彩空間。感染赤霉病的麥穗中, 病斑區(qū)域偏黃, 健康部分偏綠色, 由于RGB顏色空間中的3個(gè)顏色分量之間相關(guān)性大,不利于病斑分割, 而在YDbDr色彩空間中的Dr分量下(圖3-a), 赤霉病病斑的顏色明顯區(qū)別于背景和健康區(qū)域。在Dr分量下, 利用OTSU閾值分割方法分割赤霉病斑區(qū)域(圖3-b)。OTSU閾值分割算法, 又稱最大類間方差法, 是一種自適應(yīng)的閾值確定方法[34-35]。該方法依據(jù)感興趣區(qū)域與背景區(qū)域在灰度圖像中的類間方差確定圖像的全局最佳分割閾值。最后, 在麥穗病斑圖像中統(tǒng)計(jì)病斑區(qū)域所占像素以計(jì)算小麥麥穗赤霉病嚴(yán)重度。
圖3 YDbDr空間下麥穗的Dr分量(a)和麥穗的OTSU閾值分割結(jié)果(b)
根據(jù)中華人民共和國國家標(biāo)準(zhǔn)GB/T 15796- 2011, 并結(jié)合實(shí)際情況, 本研究將赤霉病病害嚴(yán)重度劃分為4個(gè)等級(jí)(表1)。其中, 等級(jí)1為健康麥穗, 等級(jí)2為輕度染病, 等級(jí)3為中度染病, 等級(jí)4為重度染病。
自編碼器是一種無監(jiān)督學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò), 其網(wǎng)絡(luò)結(jié)構(gòu)包含輸入層、輸出層、隱含層以及一個(gè)偏置項(xiàng)系數(shù)[36]。它能夠?qū)斎霐?shù)據(jù)進(jìn)行編碼, 使其進(jìn)行降維, 從而學(xué)習(xí)到輸入數(shù)據(jù)的隱含特征, 同時(shí)用學(xué)習(xí)到的新特征進(jìn)行解碼, 重構(gòu)出原始輸入數(shù)據(jù)。堆棧稀疏自編碼器(Stacked Sparse Auto Encoder, SSAE)是通過計(jì)算單個(gè)稀疏自編碼器的輸出與原輸入的誤差, 然后不斷地調(diào)節(jié)該稀疏自編碼器的參數(shù), 將得到的結(jié)果作為下一個(gè)稀疏自編碼器的輸入, 依次層層疊加, 通過多次的訓(xùn)練, 提取出最終的隱含層特征, 以提高模型的泛化能力[37-38]。其過程可表示為:
表1 小麥赤霉病病害嚴(yán)重度等級(jí)
DI: disease index.
1.6.1 Softmax分類器 為判別小麥赤霉病嚴(yán)重度等級(jí), 本研究采用Softmax模型作為分類器。Softmax分類器是Logistic模型在多分類問題上的推廣, 在多分類問題中, 待分類的類別數(shù)量需要大于2, 且類別之間互斥。它的輸入值是一個(gè)向量, 向量中元素為任意實(shí)數(shù)的評(píng)分值, 之后輸出一個(gè)向量, 其中每個(gè)元素值在0~1之間, 且所有元素之和為1 (歸一化的分類概率)。
Softmax利用交叉熵?fù)p失作為其損失函數(shù):
L= –log10(f()) (7)
在使用Softmax分類器的分類任務(wù)中, 其中樣本x為第類的概率為:
圖中第1個(gè)框表示數(shù)據(jù)輸入層, 第2個(gè)框表示第1層SAE, 第3個(gè)框表示第2層SAE, 第4個(gè)框表示輸出層, 第5個(gè)框表示連接的分類器或回歸方法。
The first box means the data input layer, the second box for the first layer SAE, the third box for the second layer SAE, the fourth box for the output layer, and the fifth box for the connected classifiers or regression methods in the figure.
其中=(x,), 損失L= –log10((=|x)), 因此損失函數(shù)為:
1.6.2 偏最小二乘回歸 除了對(duì)小麥赤霉病嚴(yán)重度等級(jí)進(jìn)行判別以外, 本文利用偏最小二乘回歸方法估算小麥赤霉病嚴(yán)重度DI。該方法是一種通過投影分別將預(yù)測(cè)變量和觀測(cè)變量投影到一個(gè)新空間, 來尋找預(yù)測(cè)模型的統(tǒng)計(jì)學(xué)方法。
在本文中, 首先進(jìn)行變量的設(shè)置: 將第2層自編碼器提取的每個(gè)樣本的特征值設(shè)為自變量= [12, …, x], 自變量的個(gè)數(shù)等于特征的層數(shù); 每個(gè)小麥麥穗樣本的赤霉病嚴(yán)重度DI作為因變量, 對(duì)自變量和因變量進(jìn)行標(biāo)準(zhǔn)化, 求出其相關(guān)系數(shù)矩陣, 提取出自變量組和因變量組的成分, 最后得到因變量和自變量組之間的回歸方程, 即模型建立完成。
在構(gòu)建的嚴(yán)重度等級(jí)判別模型中采用誤差矩陣作為分類結(jié)果的評(píng)價(jià)指標(biāo)。一般誤差矩陣的左邊代表的是實(shí)際的類別, 上部代表的是預(yù)測(cè)的類別。誤差矩陣中對(duì)角線上列出的是正確分類的每類數(shù)量, 最右邊一列是每類別在實(shí)際中的總數(shù)量, 而最后一行是每類別在預(yù)測(cè)上的總數(shù)量。根據(jù)該矩陣, 可以計(jì)算得到總體分類精度(overall accuracy, OA)、Kappa系數(shù)、生產(chǎn)者精度(producer accuracy, PA)和用戶精度(user accuracy, UA)。
為了客觀評(píng)價(jià)偏最小二乘回歸模型對(duì)數(shù)據(jù)的擬合效果和預(yù)測(cè)能力, 本文使用了均方根誤差(root mean square error, RMSE)和決定系數(shù)(coefficient of determination,2)兩項(xiàng)指標(biāo)對(duì)模型的擬合效果進(jìn)行檢驗(yàn)評(píng)價(jià)。RMSE代表了預(yù)測(cè)值與真實(shí)值之間差值的標(biāo)準(zhǔn)差。2用于度量因變量的變異中可由自變量解釋的部分所占的比例,2越接近1, 表明回歸平方和占總平方和的比例越大, 回歸線與各觀測(cè)點(diǎn)越接近, 回歸的擬合程度就越好。
將不同品種和不同病害等級(jí)的反射光譜數(shù)據(jù)經(jīng)過多元散射校正后取平均值并繪制成圖(圖5)。在530~570 nm的綠光波段范圍, 病害程度越深, 麥穗的反射峰越小, 幾乎趨近于直線; 在670~700 nm波段范圍, 各個(gè)品種的健康麥穗由于高葉綠素含量呈現(xiàn)明顯的低反射率, 隨著病害的加重, 各個(gè)品種的麥穗反射率均在增加, 且吸收特征越來越弱, 但不同品種在該波段范圍的反射特征存在差異; 在靠近紅邊區(qū)域的近紅外范圍, 結(jié)果剛好相反, 隨著病害程度的提高, 各個(gè)品種的麥穗反射率均在降低。此外, 由于年份、光照、小麥生長(zhǎng)狀況等差異, 品種“西農(nóng)979”的光譜反射率低于其他2個(gè)品種, 尤其是在700 nm以后的波段范圍。
圖5 不同品種和病害等級(jí)下經(jīng)MSC校正后的小麥麥穗反射光譜曲線
圖中不同顏色代表不同的病害等級(jí), 其中黑色表示健康, 紅色表示輕度, 藍(lán)色表示中度, 綠色表示重度。
Different colors represent disease levels, among which, black for healthy, red for slight, blue for moderate, and green for serious.
最優(yōu)堆棧稀疏自編碼器架構(gòu)的構(gòu)建需要設(shè)置2個(gè)關(guān)鍵參數(shù), 分別是隱含層和編碼神經(jīng)元的數(shù)量。一般來說, 深層網(wǎng)絡(luò)比單層網(wǎng)絡(luò)可以學(xué)習(xí)更多的抽象特征。隱含層數(shù)或隱含層神經(jīng)元數(shù)增加, 能得到更抽象的特征, 但是層數(shù)或神經(jīng)元數(shù)量過多, 容易導(dǎo)致模型陷入過擬合狀態(tài)[39-43]。本文構(gòu)建的SSAE模型使用2層隱含層, 2層的神經(jīng)元個(gè)數(shù)組合可以選擇為18~12、18~6和12~6, 第1層和第2層預(yù)訓(xùn)練迭代次數(shù)分別設(shè)置為200和50, L2權(quán)重正則化系數(shù)為0.001, 稀疏正則化系數(shù)為4, 稀疏比例為0.05, 解碼器傳遞函數(shù)為Purelin。將樣本的光譜作為輸入數(shù)據(jù), 通過對(duì)模型的訓(xùn)練, 不同神經(jīng)元個(gè)數(shù)組合的訓(xùn)練均方誤差如圖6所示, 可見, 具有12~6個(gè)神經(jīng)元的雙層SSAE模型比具有18~12和18~6個(gè)神經(jīng)元的模型表現(xiàn)更好, 模型均方誤差更低。
SSAE的本質(zhì)是通過堆棧多層稀疏自編碼器SAE (Sparse Auto Encoder, SAE)的深度網(wǎng)絡(luò), 其前一層SAE獲得的特征作為輸入被送入到下一層SAE中, 以遞歸編碼方式獲得某層特征。通過這種方式, SSAE有潛能地從輸入數(shù)據(jù)中提取更為抽象和有用的高階特征表示, 盡可能地復(fù)現(xiàn)輸入信號(hào)的高階特征。圖7給出了不同層提取的各病害等級(jí)的麥穗赤霉病深度學(xué)習(xí)特征。當(dāng)神經(jīng)元數(shù)量高于10時(shí), 第1層SAE所提取的各病害等級(jí)的特征差異較明顯, 各病害等級(jí)的特征值從大到小依次為健康、輕度、中度和重度; 當(dāng)神經(jīng)元數(shù)量高于2時(shí), 第2層SAE所提取的各個(gè)病害等級(jí)的特征區(qū)分度越來越明顯。最后, 通過預(yù)訓(xùn)練, 第1層和第2層的神經(jīng)元數(shù)量分別為12和6時(shí), SSAE模型的結(jié)構(gòu)體系表現(xiàn)最優(yōu)。
2.3.1 病害嚴(yán)重度等級(jí)判別 將本文構(gòu)建的SSAE模型的第2個(gè)隱含層訓(xùn)練得到的高階特征作為特征輸入, 利用分類器softmax構(gòu)建小麥赤霉病嚴(yán)重度等級(jí)判別模型。通過所有品種的綜合測(cè)試集驗(yàn)證, 模型的總體精度OA為88.2%, Kappa系數(shù)為0.84, 各病害等級(jí)的生產(chǎn)者精度如下: 健康為90.5%、輕度為82.6%、中度為89.8%、重度為90.1%, 各病害等級(jí)的用戶精度如下: 健康為83.6%、輕度為85.7%、中度為88.6%、重度為93.6%??梢? 基于深度學(xué)習(xí)特征建立的病害等級(jí)判別模型的總體精度達(dá)85%以上, 病害程度越高, 模型的判別能力越強(qiáng)。
圖6 各層不同神經(jīng)元數(shù)量組合下模型的訓(xùn)練均方誤差
圖7 每層SAE提取的各病害等級(jí)特征
(a) 第1層; (b) 第2層。不同線型代表不同的病害等級(jí), 其中雙點(diǎn)劃線表示健康, 短劃線表示輕度, 直線表示中度, 點(diǎn)線表示重度。
(a): the first layer; (b): the second layer. Different types of lines represent disease levels, double dotted lines for healthy, dashed lines for slight, straight lines for moderate, and dotted lines for serious.
按照分品種統(tǒng)計(jì)(圖8和圖9), 3個(gè)品種的總體分類精度均達(dá)到了85%以上, 其中, “淮麥35”的總體精度最高, 其值為89.71%。3個(gè)品種的Kappa系數(shù)分別為0.798、0.841、0.824, “淮麥35”最高, 其次是“漯麥10”和“西農(nóng)979”。從模型對(duì)每個(gè)品種的各病害等級(jí)的判別精度上分析, 針對(duì)品種“淮麥35”, 除了輕度等級(jí), 模型對(duì)其他等級(jí)的判別精度均達(dá)90%以上; 對(duì)于品種“漯麥10”, 模型對(duì)各等級(jí)判別精度比較均衡, 用戶精度基本在88%~90%之間; 對(duì)于品種“西農(nóng)979”, 模型對(duì)健康、中度和重度3個(gè)等級(jí)的判別精度較高, 用戶精度在87%~92%之間, 但對(duì)輕度等級(jí)的識(shí)別精度較低, 用戶精度僅為68.8%。經(jīng)過分析, 病害輕度等級(jí)較多地錯(cuò)分到健康和中度, 這可能與等級(jí)劃分有關(guān)。
圖8 不同品種下小麥赤霉病嚴(yán)重度等級(jí)判別模型的總體精度和Kappa系數(shù)
圖9 不同品種下各病害等級(jí)的生產(chǎn)者精度(a)和用戶精度(b)
2.3.2 病害嚴(yán)重度DI預(yù)測(cè) 病害程度等級(jí)是以一定病害嚴(yán)重度范圍定義的, 是對(duì)病害程度的一個(gè)大概性質(zhì)確定, 而病害嚴(yán)重度DI是對(duì)病害程度的一種更精準(zhǔn)的判定。因此, 本文以SSAE算法提取的小麥赤霉病深度學(xué)習(xí)光譜特征為輸入, 利用偏最小二乘回歸方法預(yù)測(cè)小麥赤霉病嚴(yán)重度DI。圖10給出了所有品種和各品種測(cè)試集的預(yù)測(cè)精度。從圖中可知, 所有品種測(cè)試集預(yù)測(cè)的決定系數(shù)2和均方根誤差RMSE分別為0.927和0.062, 預(yù)測(cè)的總體精度較高。按照品種分析, “西農(nóng)979”、“淮麥35”和“漯麥10”的2分別為0.947、0.953和0.954, RMSE為0.058、0.045和0.049。綜合判斷, “淮麥35”的預(yù)測(cè)精度最高, 其次是“漯麥10”和“西農(nóng)979”。品種抗性和樣本量等因素都會(huì)影響病害檢測(cè)?!拔鬓r(nóng)979”屬于中抗感赤霉病, “淮麥35”和“漯麥10”屬于易感赤霉病, 相對(duì)而言, 后兩者更容易受病害影響。
圖10 預(yù)測(cè)模型精度
(a) 所有品種測(cè)試集; (b) 西農(nóng)979測(cè)試集; (c) 淮麥35測(cè)試集; d) 漯麥10測(cè)試集。
(a): all varieties test set; (b): Xinong 979 test set; (c): Huaimai 35 test set; (d): Luomai 10 test set.
利用高光譜數(shù)據(jù)中少數(shù)幾個(gè)特征波段以一定的數(shù)學(xué)形式組合起來形成光譜指數(shù)被認(rèn)為是一種簡(jiǎn)單高效的光譜數(shù)據(jù)處理方法。目前, 針對(duì)小麥赤霉病的光譜指數(shù)被陸續(xù)提出, 相對(duì)于常規(guī)的植被指數(shù), 這些指數(shù)是根據(jù)小麥赤霉病的光譜響應(yīng)特征構(gòu)建的, 具有唯一性、特異性和高檢測(cè)力的特點(diǎn)。這些指數(shù)包括Bauriegel等[25]提出的赤霉病指數(shù)(HBI)、Liu等[26]的紅邊赤霉病指數(shù)(REHBI)、Zhang等[27]的赤霉病指數(shù)(FDI)、丁文娟[28]提出的赤霉病指數(shù)(WSI)和Zhang等[29]構(gòu)建的小麥赤霉病分類指數(shù)(FCI)。表2詳細(xì)列出了這些指數(shù)的全稱和計(jì)算公式。這些指數(shù)的構(gòu)建都是根據(jù)感染赤霉病的小麥麥穗的光譜響應(yīng)特征。圖6顯示了染病麥穗的反射光譜特征主要體現(xiàn)在綠光波段、紅光波段以及近反射陡坡的近紅外波段范圍。這個(gè)結(jié)果與上述學(xué)者構(gòu)建赤霉病光譜指數(shù)的最優(yōu)光譜特征波段是一致的。盡管如此, 每個(gè)光譜指數(shù)只是利用了某種病害的最顯著光譜特征而設(shè)計(jì)的,但是影響小麥赤霉病的因素是復(fù)雜的, 這些因素可能是作物品種、生育期、溫度、濕度、土壤肥力等, 由此導(dǎo)致的病害光譜特征有些微小的差異, 這些差異是常規(guī)的光譜特征分析方法無法檢測(cè)到的。高光譜遙感數(shù)據(jù)量大、光譜波段多, 往往需要更復(fù)雜的模型對(duì)數(shù)據(jù)進(jìn)行分析與識(shí)別。深度學(xué)習(xí)模型通過增加隱含層數(shù)及隱含神經(jīng)元數(shù)來構(gòu)建更為復(fù)雜的模型,層數(shù)越多, 所提取的特征越抽象, 深度學(xué)習(xí)模型相比于淺層學(xué)習(xí)模型有能力更好地逼近非線性函數(shù)[44-45]。小麥赤霉病的全波段光譜數(shù)據(jù)可以全部放進(jìn)深度學(xué)習(xí)模型中, 在模型的自學(xué)習(xí)中病害光譜特征可以被全方面地深度挖掘。
560表示在波長(zhǎng)560 nm處的反射率, 其他以此類推;R、Re3和NIR分別代表紅光波段、紅邊3波段和近紅外波段的反射率; SD450–488和SD500–540分別表示在450~488 nm和500~540 nm波段范圍內(nèi)的一階微分值。
560means the reflectance at 560 nm, and so on.R,Re3, andNIRrepresent the reflectance of red band, red edge band 3, and near infrared band, respectively. SD450–488and SD500–540represent the first-order differential values in the band range of 450–488 nm and 500–540 nm, respectively.
本文比較了深度學(xué)習(xí)特征和上述小麥赤霉病光譜指數(shù)對(duì)赤霉病嚴(yán)重度的預(yù)測(cè)能力(圖11)。本文建立的基于SSAE深度學(xué)習(xí)特征的赤霉病預(yù)測(cè)模型精度均高于基于上述赤霉病光譜指數(shù)建立的模型。其中, 分別利用FDI和FCI構(gòu)建的回歸模型相對(duì)較高, 決定系數(shù)2在0.8~0.9之間, 其次是分別基于HBI和WSI指數(shù)建立的模型, 決定系數(shù)在0.65~0.75之間。相對(duì)而言, 通過赤霉病光譜指數(shù)REHBI建立的模型精度較低,2和RMSE分別僅為0.35和0.18。Zhang等[27]設(shè)計(jì)的小麥赤霉病光譜指數(shù)FDI所使用的數(shù)據(jù)是2018年揚(yáng)花期至成熟期獲取的“西農(nóng)979”麥穗高光譜遙感數(shù)據(jù), 屬于本文所用數(shù)據(jù)的其中一部分, 模型的預(yù)測(cè)精度2接近0.90??梢? 光譜指數(shù)FDI一定程度上能夠反映小麥赤霉病的光譜特征, 但是鑒于數(shù)據(jù)獲取和光譜特征提取的不夠全面和精細(xì), FDI無法真正體現(xiàn)小麥赤霉病的深度光譜特征。另外, 由于光譜指數(shù)設(shè)計(jì)的簡(jiǎn)單性會(huì)丟失小麥赤霉病的細(xì)微光譜特征。紅邊赤霉病指數(shù)REHBI是Liu等[26]利用小麥冠層高光譜遙感數(shù)據(jù)按照Sentinel-2遙感數(shù)據(jù)的多光譜通道而設(shè)計(jì)的, 用于在區(qū)域范圍內(nèi)檢測(cè)小麥赤霉病。雖然Sentinel-2遙感數(shù)據(jù)的通道多, 主要針對(duì)植被的遙感監(jiān)測(cè), 但是較低的光譜分辨率不易探測(cè)到小麥赤霉病的精細(xì)光譜特征。
圖11 深度學(xué)習(xí)特征和各小麥赤霉病光譜指數(shù)預(yù)測(cè)精度比較
(a): SSAE; (b): WSI; (c): FCI; (d): FDI; (e): REHBI; (f): HBI.
利用堆棧稀疏自編碼器提取的深度特征進(jìn)行小麥赤霉病嚴(yán)重度預(yù)測(cè)與直接使用小麥赤霉病光譜指數(shù)相比可提高預(yù)測(cè)精度。但是由于深度學(xué)習(xí)模型參數(shù)調(diào)整復(fù)雜, 選取不當(dāng)可使模型陷入局部最小或過擬合, 影響判別或預(yù)測(cè)精度。本文在隱含層內(nèi)神經(jīng)元數(shù)對(duì)模型精度的影響進(jìn)行了試驗(yàn)測(cè)試, 表明參數(shù)設(shè)置過大或過小均會(huì)對(duì)判別或預(yù)測(cè)精度產(chǎn)生影響。另外, 深度學(xué)習(xí)模型可以獲得令人滿意的精度, 然而該方法以犧牲一定的時(shí)間為代價(jià)。高光譜遙感數(shù)據(jù)的光譜波段幾十個(gè)甚至上百個(gè), 數(shù)據(jù)量大, 而且深度學(xué)習(xí)需要的樣本量大, 因此有必要加快判別或預(yù)測(cè)方法的執(zhí)行時(shí)間。
本文針對(duì)傳統(tǒng)光譜數(shù)據(jù)處理方法存在的不足, 提出利用堆棧稀疏自編碼器深度學(xué)習(xí)算法從3年的不同品種小麥麥穗高光譜遙感數(shù)據(jù)中提取小麥赤霉病的深層光譜特征, 并結(jié)合分類器和偏最小二乘回歸方法判別和預(yù)測(cè)赤霉病嚴(yán)重度。通過預(yù)訓(xùn)練和測(cè)試, 具有12~6個(gè)神經(jīng)元的雙層SSAE模型的結(jié)構(gòu)體系表現(xiàn)最優(yōu); 模型對(duì)所有品種的測(cè)試集的總體精度和Kappa系數(shù)分別為88.2%和0.84, 但模型對(duì)病害輕度等級(jí)的識(shí)別精度較低; 利用SSAE特征結(jié)合偏最小二乘回歸方法對(duì)赤霉病嚴(yán)重度進(jìn)行預(yù)測(cè), 模型對(duì)所有品種測(cè)試集的預(yù)測(cè)決定系數(shù)和均方根誤差分別為0.927和0.062, 其中, “淮麥35”的預(yù)測(cè)精度最高。此外, 與常見的小麥赤霉病光譜指數(shù)相比, 堆棧稀疏自編碼器深度學(xué)習(xí)方法可以更全面地深度挖掘小麥赤霉病光譜特征, 由此建立的模型判別和預(yù)測(cè)精度更高。
[1] 張昊, 陳萬權(quán). 小麥赤霉菌群體結(jié)構(gòu)和病害監(jiān)控技術(shù)研究進(jìn)展. 植物保護(hù)學(xué)報(bào), 2022, 49: 250–262. Zhang H, Chen W Q. Research progresses on population structure of pathogen and monitoring and controlling technology of Fusarium head blight in wheat., 2022, 49: 250–262 (in Chinese with English abstract).
[2] 陶晡, 齊永志, 屈赟, 曹志艷, 趙緒生, 甄文超. 基于增強(qiáng)回歸樹的海河平原小麥赤霉病預(yù)測(cè)模型構(gòu)建與驗(yàn)證. 中國農(nóng)業(yè)科學(xué), 2021, 54: 3860–3870. Tao B, Qi Y Z, Qu Y, Cao Z Y, Zhao X S, Zhen W C. Construction and verification of fusarium head blight prediction model in Haihe plain based on boosted regression tree., 2021, 54: 3860–3870 (in Chinese with English abstract).
[3] 邢瑜琪, 姚衛(wèi)平, 戶雪敏, 戴紀(jì)琛, 張?zhí)珜W(xué), 黃衛(wèi)利, 胡小平. 基于監(jiān)測(cè)預(yù)警的小麥赤霉病藥劑防治效果評(píng)價(jià). 植物保護(hù), 2021, 47: 323–326. Xing Y Q, Yao W P, Hu X M, Dai J S, Zhang T X, Huang W L, Hu X P. Evaluation of control effects of pesticides on wheat scab based on monitoring and early warning system., 2021, 47: 323–326 (in Chinese with English abstract).
[4] 黃文江, 師越, 董瑩瑩, 葉回春, 鄔明權(quán), 崔貝, 劉林毅. 作物病蟲害遙感監(jiān)測(cè)研究進(jìn)展與展望. 智慧農(nóng)業(yè), 2019, 1(4): 1–11. Huang W J, Shi Y, Dong Y Y, Ye H C, Wu M Q, Cui B, Liu L Y. Progress and prospects of crop diseases and pests monitoring by remote sensing., 2019, 1(4): 1–11 (in Chinese with English abstract).
[5] 孫瑞琳, 孫全, 孫成明, 劉濤, 李冬雙, 吳峰峰. 基于不同平臺(tái)的小麥病蟲害遙感監(jiān)測(cè)研究進(jìn)展. 中國農(nóng)機(jī)化學(xué)報(bào), 2021, 42(3): 142–150. Sun R L, Sun Q, Sun C M, Liu T, Li D S, Wu F F. Recent advances in remote sensing monitoring on wheat pests and diseases based on different platforms., 2021, 42(3): 142–150 (in Chinese with English abstract).
[6] Zhang N, Yang G, Pan Y, Yang X, Zhao C. A review of advanced technologies and development for hyperspectral-based plant disease detection in the past three decades.(Basel), 2020, 12: 3188.
[7] Qiu R C, Yang C, Moghimi A, Zhang M, Steffenson B J, Hirsch C D. Detection of fusarium head blight in wheat using a deep neural network and color imaging.(Basel), 2019, 11: 2658.
[8] 鮑文霞, 孫慶, 胡根生, 黃林生, 梁棟, 趙健. 基于多路卷積神經(jīng)網(wǎng)絡(luò)的大田小麥赤霉病圖像識(shí)別. 農(nóng)業(yè)工程學(xué)報(bào), 2020, 36(11): 174–181. Bao W X, Sun Q, Hu G S, Huang L S, Liang D, Zhao J. Image recognition of field wheat scab based on multi-way convolutional neural network., 2020, 36(11): 174–181 (in Chinese with English abstract).
[9] 鄧國強(qiáng), 王君嬋, 楊俊, 劉濤, 李冬雙, 孫成明. 基于圖像和改進(jìn)U-net模型的小麥赤霉病穗識(shí)別. 麥類作物學(xué)報(bào), 2021, 41: 1432–1440. Deng G Q, Wang J C, Yang J, Liu T, Li D S, Sun C M. Identification of fusarium head blight in wheat ears based on image and improved U-net model., 2021, 41: 1432–1440 (in Chinese with English abstract).
[10] 戴雨舒, 仲曉春, 孫成明, 楊俊, 劉濤, 劉升平. 基于圖像處理和Deeplabv3+模型的小麥赤霉病識(shí)別. 中國農(nóng)機(jī)化學(xué)報(bào), 2021, 42(9): 209–215. Dai Y S, Zhong X C, Sun C M, Yang J, Liu T, Liu S P. Identification of fusarium head blight in wheat-based on image processing and Deeplabv3+ model., 2021, 42(9): 209–215 (in Chinese with English abstract).
[11] Zhang D Y, Wang Z C, Jin N, Gu C Y, Chen Y, Huang Y B. Evaluation of efficacy of fungicides for control of wheat fusarium head blight based on digital imaging., 2020, 8: 109876–109890.
[12] Zhang D Y, Gu C Y, Wang Z C, Zhou X G, Li W F. Evaluating the efficacy of fungicides for wheat scab control by combined image processing technologies., 2021, 211: 230–246.
[13] 張凝, 楊貴軍, 趙春江, 張競(jìng)成, 楊小冬, 潘瑜春, 黃文江, 徐波, 李明, 朱西存, 李振海. 作物病蟲害高光譜遙感進(jìn)展與展望. 遙感學(xué)報(bào), 2021, 25: 403–422. Zhang N, Yang G J, Zhao C J, Zhang J C, Yang X D, Pan Y C, Huang W J, Xu B, Li M, Zhu X C, Li Z H. Progress and prospects of hyperspectral remote sensing technology for crop diseases and pests., 2021, 25: 403–422 (in Chinese with English abstract).
[14] Behmann J, Steinrucken, Plumer L. Detection of early plant stress responses in hyperspectral images., 2014, 93: 98–111.
[15] Zhang J C, Huang Y B, Pu R L, Gonzalez-moreno P, Yuan L, Wu K H, Huang W J. Monitoring plant diseases and pests through remote sensing technology: a review., 2019, 165: 104943.
[16] Xiao Y X, Dong Y Y, Huang W J, Liu L Y, Mm H Q. Wheat fusarium head blight detection using UAV-based spectral and texture features in optimal window size.(Basel), 2021, 13: 2437.
[17] Liu L Y, Dong Y Y, Huang W J, Dd X P, Ma H Q. Monitoring wheat fusarium head blight using unmanned aerial vehicle hyperspectral imagery.(Basel), 2020, 12: 3811.
[18] Alisaac E, Behmann J, Kuska M T, Dehne H W, Mahlein A K. Hyperspectral quantification of wheat resistance to fusarium head blight: comparison of two fusarium species., 2018, 152: 869–884.
[19] Whetton R L, Hassall K L, Waine T W, Mouazen A M. Hyperspectral measurements of yellow rust and fusarium head blight in cereal crops: Part 1: Laboratory study., 2018, 166: 101–115.
[20] Whetton R L, Waine T W, Mouazen A M. Hyperspectral measurements of yellow rust and fusarium head blight in cereal crops: Part 2: On-line field measurement., 2018, 167: 144–158.
[21] Zelazny W R, Chrpova J, Hamouz P. Fusarium head blight detection from spectral measurements in a field phenotyping setting: a pre-registered study., 2021, 211: 97–113.
[22] Ma H Q, Huang W J, Jing Y S, Pignatti S, Laneve G, Dong Y Y, Ye H C, Liu L Y, Guo A T, Jiang J. Identification of fusarium head blight in winter wheat ears using continuous wavelet analysis.(Basel), 2020, 20: 2001.
[23] Ma H Q, Huang W J, Dong Y Y, Liu L Y, Guo A T. Using UAV-based hyperspectral imagery to detect winter wheat fusarium head blight.-, 2021, 13: 3024.
[24] Thenkabail P S, Smith R B, Depauwd E. Hyperspectral vegetation indices and their relationships with agricultural crop characteristics., 2000, 71: 158–182.
[25] Bauriegel E, Giebel A, Geyer M, Schmidt U, Herppich W B. Early detection of fusarium infection in wheat using hyper-spectral imaging., 2011, 75: 304–312.
[26] Liu L Y, Dong Y Y, Huang W J, Du X P, Ma H Q. A disease index for efficiently detecting wheat fusarium head blight using Sentinel-2 multispectral imagery., 2020, 8: 52181–52191.
[27] Zhang D Y, Wang Q, Lin F F, Yin X, Gu C Y, Qiao H B. Deve-lopment and evaluation of a new spectral disease index to detect wheat fusarium head blight using hyperspectral imaging.(), 2020, 20: 2260.
[28] 丁文娟. 基于不同尺度的冬小麥赤霉病高光譜遙感監(jiān)測(cè). 安徽大學(xué)碩士學(xué)位論文, 安徽合肥, 2019. Ding W J. Hyperspectral Remote Sensing Monitoring of Winter Wheat Head Blight Based on Different Scales. MS Thesis of Anhui University, Hefei, Anhui, China, 2019 (in Chinese with English abstract).
[29] Zhang N, Pan Y C, Feng H K, Zhao X Q, Yang X G, Ding C L, Yang G J. Development of fusarium head blight classification index using hyperspectral microscopy images of winter wheat spikelets., 2019,186: 83–99.
[30] Jin X, Jie L, Wang S, Qi H, Li S. Classifying wheat hyperspectral pixels of healthy heads and fusarium head blight disease using a deep neural network in the wild field.(Basel), 2018, 10: 395.
[31] 何曉軍, 徐愛功, 李玉. 基于模糊相似性的彩色形態(tài)學(xué)圖像處理方法. 計(jì)算機(jī)應(yīng)用研究, 2019, 36(1): 258–263. He X J, Xu A G, Li Y. Color morphological image processing method based on fuzzy similarity., 2019, 36(1): 258–263 (in Chinese with English abstract).
[32] Zhang X, Sun J, Li P, Zeng F, Wang H. Hyperspectral detection of salted sea cucumber adulteration using different spectral preprocessing techniques and SVM method.-, 2021, 152: 112295.
[33] 中華人民共和國農(nóng)業(yè)部. 小麥赤霉病測(cè)報(bào)技術(shù)規(guī)范, GB/T 157962011, 2011. Ministry of Agriculture. Rules for Monitoring and Forecast of the Wheat Head Blight (Schw. /(Schw.) Petch), GB/T 15796–2011, 2011 (in Chinese).
[34] Otsu N. A threshold selection method from gray-level histograms.-, 1979, 9: 62–66.
[35] Wang D Y, Fu Y Y, Yang G J, Yang X D, Liang D, Zhou C Q, Zhang N, Wu H, Zhang D Y. Combined use of FCN and Harris corner detection for counting wheat ears in field conditions., 2019, 7: 178930–178941.
[36] 馬紅強(qiáng), 馬時(shí)平, 許悅雷, 呂超, 辛鵬, 朱明明. 基于改進(jìn)棧式稀疏去噪自編碼器的圖像去噪. 計(jì)算機(jī)工程與應(yīng)用, 2018, 54(4): 199–204. Ma H Q, Ma S P, Xu Y L, Lyu C, Xin P, Zhu M M. Image denoising based on improved stacked sparse denoising auto- encoder., 2018, 54(4): 199–204 (in Chinese with English abstract).
[37] Bai Y, Xiong Y, Huang J, Zhou J, Zhang B. Accurate prediction of soluble solid content of apples from multiple geographical regions by combining deep learning with spectral fingerprint features., 2019, 156: 110943.
[38] Ahman M, Alqarni M A, Khan A M, Hussain R, Mazzara M, Distefano S. Segmented and non-segmented stacked denoising autoencoder for hyperspectral band reduction., 2019, 180: 370–378.
[39] 戴曉愛, 郭守恒, 任清, 楊曉霞, 劉漢湖. 基于堆棧式稀疏自編碼器的高光譜影像分類. 電子科技大學(xué)學(xué)報(bào), 2016, 45: 382–386. Dai X A, Guo S H, Ren Q, Yang X X, Liu H H. Hyperspectral remote sensing image classification using the stacked sparse autoencoder., 2016, 45: 382–386 (in Chinese with English abstract).
[40] Zhao C H, Wan X Q, Zhao G P, Cui B, Liu W, Qi B. Spectral-spatial classification of hyperspectral imagery based on stacked sparse autoencoder and random forest., 2017, 50: 47–63.
[41] Wan X Q, Zhao C H. Local receptive field constrained stacked sparse autoencoder for classification of hyperspectral images., 2017, 34: 1011–1020.
[42] Shao Z F, Zhang L J, Wang L. Stacked sparse autoencoder modeling using the synergy of airborne LiDAR and satellite optical and SAR data to map forest above-ground biomass.-, 2017, 10: 5569–5582.
[43] Zhang L J, Shao Z F, Liu J C, Cheng Q M. Deep learning based retrieval of forest aboveground biomass from combined LiDAR and Landsat 8 data.(Basel), 2019, 11: 1459.
[44] Fan Y Y, Zhang C, Liu Z Y, Qiu Z J, He Y. Cost-sensitive stacked auto-encoder models to detect striped stem borer infestation on rice based on hyperspectral imaging.-, 2019, 168: 49–58.
[45] Yang D, Yuan J H, Chang Q, Zhao H Y, Cao Y. Early determination of mildew status in storage maize kernels using hyperspectral imaging combined with the stacked sparse auto-encoder algorithm., 2020, 109: 103412.
Hyperspectral remote sensing detection ofin wheat based on the stacked sparse auto-encoder algorithm
LIN Fen-Fang1,2,3, CHEN Xing-Yu1, ZHOU Wei-Xun1, WANG Qian2, and ZHANG Dong-Yan2,*
1School of Remote Sensing and Geomatics Engineering, Nanjing University of Information Science and Technology, Nanjing 210044, Jiangsu, China;2National Engineering Research Center for Agro-Ecological Big Data Analysis and Application (Anhui University), Hefei 230601, Anhui, China;3Key Laboratory of Geospatial Technology for the Middle and Lower Yellow River Regions (Henan University), Kaifeng 475004, Henan, China
(FHB) has the characteristics of rapid onset and short cycle. The deep learning feature extraction method was used to establish a disease severity detection model to provide guidance for the prevention and control of FHB. The hyperspectral data of wheat ears from flowering to maturity under three varieties from 2018 to 2020 were collected. The spectral curves of wheat ears were obtained by morphological processing and multi-source scattering correction. Then spectral features of FHB were extracted by stacked sparse auto-encoder (SSAE), combined with Softmax classifier and the partial least squares regression method to detect FHB. Through pre-training, the two-layer SSAE model with 12–6 neurons performed better, the mean square error of the model was lower, and the characteristics of each disease level were significantly different. The deep learning features extracted by the trained SSAE model were the basis of the establishment of FHB disease severity level discrimination model and severity prediction model. The overall accuracy and Kappa coefficient of the model were 88.2% and 0.84, respectively, and the accuracy was the highest for the variety of ‘Huaimai 35’. The prediction coefficient of determination (2) and root mean square error (RMSE) of the model for the test set of all varieties were 0.927 and 0.062 in the severity prediction model, respectively, and2for each variety was around 0.95. The FHB prediction model based on SSAE deep learning features has higher accuracy than those with several common FHB spectral indices. Hyperspectral remote sensing had the characteristics of large amount of data and many spectral bands. The stack sparse auto-encoder builded a more complex model by adding the limiting conditions of sparse representation to the auto-encoder model, and increasing the number of hidden layers and hidden neurons. The extracted spectral features can better reflect the spectral characteristics of FHB in all aspects, so the detection model of FHB constructed by using these features has higher accuracy, which provides a reference for timely and accurate monitoring of FHB.
; stacked sparse auto-encoder; hyperspectral; detection; wheat
2023-02-10;
2023-02-28.
10.3724/SP.J.1006.2023.21060
通信作者(Corresponding author):張東彥, E-mail: zhangdy@ahu.edu.cn
E-mail: linfenfang@126.com
2022-09-07;
本研究由國家自然科學(xué)基金項(xiàng)目(42271364), 江蘇省科技計(jì)劃項(xiàng)目(BK20211287)和黃河中下游數(shù)字地理技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室(河南大學(xué))開放課題項(xiàng)目(GTYR202104)資助。
This study was supported by the National Natural Science Foundation of China (42271364), the Science and Technology Plan in Jiangsu Province (BK20211287), and the Open Fund of Key Laboratory of Geospatial Technology for the Middle and Lower Yellow River Regions (Henan University), the Ministry of Education (GTYR202104).
URL: https://kns.cnki.net/kcms/detail//11.1809.S.20230228.0956.002.html
This is an open access article under the CC BY-NC-ND license (http://creativecommons.org/licenses/by-nc-nd/4.0/).