張 燕, 吳華瑞, 朱華吉*
1. 國家農(nóng)業(yè)信息化工程技術研究中心, 北京 100097 2. 北京農(nóng)業(yè)信息技術研究中心, 北京 100097 3. 農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)信息軟硬件產(chǎn)品質(zhì)量檢測重點實驗室, 北京 100097
我國是番茄的主要生產(chǎn)和消費國家, 番茄種植廣泛。 在農(nóng)業(yè)實際生產(chǎn)過程中, 番茄灰霉病感染早期無病斑顯現(xiàn), 因此無法被及時發(fā)現(xiàn), 導致灰霉病治理不及時引起的品質(zhì)下降和產(chǎn)量減少, 嚴重影響了番茄種植的經(jīng)濟效益[1-2]。 隨著高光譜成像無損檢測技術的發(fā)展能夠在更加微觀的尺度上對植物內(nèi)部器官進行精細探測, 適用于在未顯現(xiàn)病斑的病害潛育期進行光譜信息提取。 秦立峰等[3]針對溫室采集的不同環(huán)境光照下的黃瓜早期霜霉病高光譜圖像有效病害特征難以提取的問題, 以黃瓜7類感興趣區(qū)域94個樣本為研究對象, 提出采用改進的競爭性自適應重加權算法CARS結合連續(xù)投影算法SPA提取融合病害差異信息, 通過合并去除重復波段共提取47個特征波段, 建立最小二乘-支持向量機檢測模型。 對染病1 d的測試集檢測識別率達到95.83%, 對染病2 d到發(fā)病12 d均能取得100%的檢測識別率, 其中染病樣本的召回率達到100%。 康麗等(本刊41卷3期)采集大田自然發(fā)病癥狀較輕的水稻稻瘟病葉片和健康葉片為研究對象, 通過構建對比多種早期分級檢測模型, 發(fā)現(xiàn)CARS-SVM模型對染病無病斑樣本識別準確率最高, CARS-PCA-SVM模型在復雜度、 運算速度上優(yōu)于CARS-SVM。 牟多鐸等[4]將空間信息分別加入極限學習機(ELM)和支持向量機(SVM)對不同低維類別選取適當?shù)母吖庾V訓練樣本進行分類比較, 發(fā)現(xiàn)在分類時間及精度方面ELM均優(yōu)于支持向量機SVM。 蘆兵等[5]為了實現(xiàn)差異病害的準確預測, 分別建立ELM的特征光譜聯(lián)合灰度共生矩陣及LBP紋理信息的預測模型CARS-GLCM-ELM和CARS-LBP-ELM, 優(yōu)化后的模型預測分類正確率達92.73%。 陳芊澍等[6]在裂縫發(fā)育帶預測中引入了極限學習機算法, 相較于近似支持向量機, 極限學習機在保證分類準確度的同時訓練效率更高。 Sevinc等[7]提出TLBO_ELM分類模型對二進制和多類數(shù)據(jù)進行分類, 表明TLBO-ELM在分類上優(yōu)于PSO-SVM算法。
因此, 本工作采用基于教學優(yōu)化算法的極限學習機模型(teaching-learning-based optimization_extreme learning machine, TLBO_ELM)[6-7]進行建模, 針對番茄灰霉病潛育期病斑ROI區(qū)域進行特征波長提取, 并且提取不同病害程度的光譜信息, 通過對比不同光譜預處理效果, 選擇離散小波變換(discrete wavelet transformation, DWT)[8]預處理方法, 并結合競爭性自適應重加權算法(competitive adaptive reweighted sampling, CARS)[9-10]進行特征波段提取, 建立番茄灰霉病潛育期檢測教師學習-極限學習機(TLBO_ELM)模型, 實現(xiàn)番茄灰霉病潛育期高精度檢測及不同病害程度的高精度分類。
主要研究內(nèi)容包括:
(1) 圍繞番茄葉片灰霉病潛育期檢測方法, 通過連續(xù)跟蹤采集建立樣本葉片時序高光譜數(shù)據(jù), 實現(xiàn)番茄葉片表面未見明顯病斑的灰霉病潛育期診斷;
(2) 針對番茄灰霉病潛育期病斑ROI 區(qū)域特征波長及不同病害程度的光譜信息提取建立基于離散小波變換結合競爭性自適應重加權算法的特征提取模型;
(3) 針對極限學習機精度和泛化能力不穩(wěn)定的問題, 采用教學優(yōu)化算法對極限學習機的輸入權值和隱藏層的偏差進行訓練和優(yōu)化, 從而保證了ELM分類模型較高的精度和較好泛化能力。
實驗于2021年3月—4月在石家莊市農(nóng)林科學研究院農(nóng)業(yè)信息研究中心實驗室(114°54′E, 38°12′N)進行。 采用北方大部分地區(qū)設施大棚中普遍種植的大果型番茄“天明”(撫順市北方農(nóng)業(yè)科學研究所育成)為樣本, 取生長狀態(tài)較為一致的番茄幼苗60盆, 移入人工氣候箱備用, 每盆種植1株番茄苗, 塑料花盆大小10 cm×9 cm, 每天定時注入50 mL水。
灰霉病菌懸液的制備方法: 將灰霉病菌(購自中國農(nóng)業(yè)科學院蔬菜花卉研究所)在PDA培養(yǎng)基上劃線活化, 25 ℃恒溫培養(yǎng)7 d后挑取活化的病原菌孢子至150 mL的馬鈴薯葡萄糖液體培養(yǎng)基中, 25 ℃, 120RPM震蕩培養(yǎng)7 d得到菌懸液。
番茄苗于光照培養(yǎng)箱中生長出第七片葉片時進行接種, 接種部位選取第3~5片葉最尖端小葉, 設置三種接種方式: 全葉涂抹, 葉片局部點涂, 葉片局部針刺點涂。 接種后的植株放置在光照培養(yǎng)箱中培養(yǎng), 培養(yǎng)條件為: 濕度85%~90%, 溫度25 ℃/22 ℃, 光照9600LX/0, 12 h/12 h, 1 d后進行高光譜圖像采集。
選用寧波江南儀器有限公司RXZ-600B型號人工氣候室, 容積600 L, 控溫范圍0~50 ℃, 控溫精度0.1 ℃左右, 控濕范圍50~95%RH, 控濕精度1%RH左右, 光照強度0~400(30 000), 6級可調(diào), 隔板數(shù)量4塊, 工作時間可定時控制或連續(xù)運行, 外形尺寸1 313×740×1 500。 共購置人工氣候箱3臺, 每臺可育苗24株。
高光譜采集設備選用四川雙利合譜科技有限公司的短波紅外便攜式成像光譜系統(tǒng)GaiaField Pro-N17E lite高光譜成像儀, 相機集成高性能數(shù)據(jù)采集和分享處理系統(tǒng), 無需外接計算機, 支持Android智能手機、 Ipad、 Iphone無線遙控(Wifi模型), 選配支持遠距無線圖像傳輸于遙控操作(串口)。 掃描方式為內(nèi)置推掃, 光譜范圍960~1 640 nm, 光譜分辨率5 nm, 共320個光譜通道, 掃描速度為4 s·cube-1, 重量為7.5 kg, 內(nèi)置電池可工作2 h以上。
補光燈設備: (1) 50 W鹵素燈: 輸入電壓12 V, 功率50 W, 輸出光譜為350~2 500 nm寬光譜, 光源經(jīng)過勻化處理; (2) 調(diào)節(jié)支架: 固定鹵素燈并可調(diào)節(jié)鹵素燈角度, 高穩(wěn)定性, 高耐熱支架; (3) 穩(wěn)壓穩(wěn)流電源: 高穩(wěn)電源, 輸出電壓12 V, 為四臺50 W鹵素燈供電, 保證鹵素燈輸出穩(wěn)定光譜。
數(shù)據(jù)采集軟件為四川雙利合譜科技有限公司的SpecView, 為保證采集光譜信息的準確性, 采用補光燈設備, 四個補光燈調(diào)整好位置后, 固定不變。 每次采集前進行曝光、 調(diào)焦、 白板采集。 根據(jù)采集的番茄葉片調(diào)整方位, 需要采集的番茄葉需位于全局預覽界面中的右上框中。 距離鏡頭36~46 cm之間, 42 cm為最佳位置, 進行采集, 如圖1。 高光譜數(shù)據(jù)采集從接種后第一天即接種24 h后開始進行連續(xù)跟蹤采集, 每株跟蹤采集三個葉片, 共連續(xù)采集8 d。
圖1 樣本數(shù)據(jù)采集
高光譜分辨率在納米數(shù)量級, 具有數(shù)據(jù)量大, 相關性較高的特點, 可分性較好的、 相關性較低的特征波段的提取, 是提高分類識別模型精度的重要手段。 采用競爭自適應重加權(competitive adaptive reweighted sampling, CARS)[9-10]算法對預處理后的番茄灰霉病潛育期高光譜建模數(shù)據(jù)進行特征波段提取。
極限學習機(extreme learning machine, ELM)[4-5]是2004年由新加坡南洋理工大學的黃廣斌教授提出的, 是一種運算速度快、 泛化能力好的單隱層前饋神經(jīng)網(wǎng)絡, 因其具有獨特的優(yōu)勢, 被廣泛運用于解決各類非線性問題。
但極限學習機ELM模型主要參數(shù)輸入權值ω和隱含層閾值b的設置是隨機的, 導致模型精度和泛化能力不穩(wěn)定, 為了解決上述問題, 基于教學優(yōu)化的極限學習機分類模型TLBO_ELM (teaching-learning-based optimization_extreme learning machine)[6-7]被提出。
教學優(yōu)化算法[6]通過模擬教師的“教學”和學生之間的相互“學習”來提高學生的水平, 是一種新的群智能優(yōu)化算法, 適合求解參數(shù)較多的優(yōu)化問題。 在教與學算法中, 將學習知識范圍對應于搜索空間, 搜索空間中所有點的集合稱為班級, 某一點(j=1, 2, …,NP)對應著一個學生,NP為學生數(shù),D為學生學習科目數(shù)(對應于優(yōu)化問題中變量的維數(shù))。 班級中成績最好的學生記作老師, 用Xteacher表示。
將ELM的輸入權值和隱含層閾值編碼成教與學算法個體, 初始化班級, 以EML算法識別率達到最大或穩(wěn)定為目標進行尋優(yōu)獲得最優(yōu)個體, 解碼得到最優(yōu)的權值和最優(yōu)閾值b。
TLBO_ELM通過教學優(yōu)化算法對極限學習機的ω和b進行訓練和優(yōu)化, 從而得到最優(yōu)的權值ω和最優(yōu)閾值b, 從而保證了ELM分類模型較高的精度和較好泛化能力。 為了驗證構建模型的能力, 常用測試集的準確率Accuracy、 精確率Precision、 召回率Recall和調(diào)和評價值F1作為模型評價標準。
番茄灰霉病診斷及分類流程如圖2所示。
圖2 番茄灰霉病診斷及分類流程圖
高光譜數(shù)據(jù)處理采用四川雙利合譜科技有限公司的SpecSight、 ENVI5.3(Research Systme Inc., Boulder, Colo., USA)和Matlab2019b(The MathWorks Inc., Natick, USA)軟件開發(fā)平臺。
如圖3為從接種第1天(24 h后)到第8天病斑從無到有的變化過程圖像, 圖顯均為波段紅通道640.7 nm, 綠通道549.9 nm和藍通道469.7 nm。
圖3 接種發(fā)病樣本#1高光譜圖像從1~8 d變化過程圖
番茄葉片感染灰霉病潛育期, 沒有肉眼可見病斑導致專家無法直接確認葉片樣本是否感染及感染位置, 但是葉片內(nèi)部已發(fā)生生理反應, 葉細胞組織也已開始遭到破壞。 為實現(xiàn)番茄葉片灰霉病潛育期的檢測, 采取跟蹤采集所有接種后的樣本葉片時序高光譜圖像數(shù)據(jù), 來確定接種樣本葉片是否被感染及感染位置, 選取發(fā)病葉片樣本為本文實驗樣本, 根據(jù)樣本葉片發(fā)病病斑位置確定葉片樣本潛預期發(fā)病位置。 根據(jù)圖1接種后發(fā)病樣本#1的病斑變化過程, 按病斑面積將所有選取的ROI劃分為5個等級: 無感染ROI為0級、 染病無病斑ROI為1級(潛預期)、 病斑面積<10%ROI為2級(小病斑)、 病斑面積<25% ROI為3級(大病斑)、 病斑面積>25% ROI為4級(嚴重)。 利用ENVI5.3軟件提取接種后發(fā)病樣本1~8 d的感染區(qū)域ROI, ROI大小為10×10, 病斑較大時, 選取病斑中間位置。 從第1天到第8天采集27(19個感染ROI+8個無感染ROI)個樣本的高光譜數(shù)據(jù)。 利用ENVI5.3軟件計算每個感興趣區(qū)域ROI矩形框內(nèi)所有相似點的光譜反射率平均值作為實驗高光譜數(shù)據(jù), 共采集213個ROI平均光譜數(shù)據(jù), 無感染ROI為0級(55個)、 潛預期ROI為1級(43個)、 小病斑ROI為2級(43個)、 大病斑ROI為3級(39個), 病斑后期ROI為4級(33個)。
圖4為213個樣本不同發(fā)病等級番茄葉片高光譜平均反射率曲線, 光譜曲線在500~583 nm接近綠通道波長550 nm附近出現(xiàn)一個波峰, 潛育期ROI譜線和健康ROI譜線在557 nm之前幾乎重合, 之后潛育期ROI譜線出現(xiàn)紅移現(xiàn)象, 說明葉片組織開始受到破壞。
圖4 不同時期番茄葉片高光譜平均反射率曲線
為了消除或減弱外界環(huán)境及各種因素對光譜的影響, 采用有效的光譜預處理方法盡可能去除光譜噪聲并對光譜進行平滑及相關預處理, 不僅可以提高診斷模型的準確率和預測能力, 還能提高模型的泛化能力及魯棒性。 目前主流的光譜數(shù)據(jù)預處理方法包括: 數(shù)據(jù)規(guī)范化處理(NOR)[11]、 Savitzky-Golay卷積平滑(SG)[12]、 標準正態(tài)變換(SNV)[13]、 離散小波變換(DWT)[8]、 多元散射校正(MSC)[14]等, 比較上述各個處理, 如圖5, 發(fā)現(xiàn)對高光譜數(shù)據(jù)進行小波變換濾波處理后, 在681~840 nm波段間番茄灰霉病五個等級被清晰的區(qū)分開來, 其中大病斑4級和嚴重后期5級部分混在一起, 說明病害發(fā)展到大病斑后光譜相似度較大。 所以對每一個類分別進行小波濾波變換DWT濾波。
圖5 不同光譜預處理后光譜對比
采用經(jīng)過離散小波變換DWT處理后610~840 nm波段間樣本數(shù)據(jù), 基于CARS算法對訓練集進行特征波段提取, 設置蒙特卡洛采樣次數(shù)為50, 為解決CARS算法的隨機性問題, 利用CARS進行3次特征提取, 3次CARS提取的特征波段過程位置如圖4所示, 包括樣本變量個數(shù)(number of sampled variables, NSV)、 交叉驗證均方根誤差(RMSECV)和回歸系數(shù)(regression coefficient,rc)隨蒙特卡洛采樣次數(shù)的變化趨勢。 在RMSECV最小點取最優(yōu)變量個數(shù)(圖6中的星號豎線), 3次提取過程最小RMSECV分別為: 0.295 9, 0.294 5和0.297 4, 見表1, 將回歸系數(shù)絕對值大的波段保留, 即為提取的特征波段。 提取的特征波段如圖7所示, 提取的特征數(shù)量分別為5, 5和7, 見表1。 由圖7和表1可知, 3次選取的特征波段位置相近, 滿足穩(wěn)定性要求。 將3次特征波段合并并去除重復項, 共得到9個特征波段: 694, 696, 765, 767, 769, 772, 778, 838和840 nm。
圖6 DWT-CARS算法3次提取的特征波段
圖7 DWT-CARS算法3次提取的特征波段
表1 DWT-CARS算法3次提取的特征波段
在5個類213個樣本中, 每個類選擇14個樣本, 5個類共70個樣本建立測試集, 剩余樣本建立訓練集, 采用小波濾波變換DWT對樣本數(shù)據(jù)中每一類分別濾波。 DWT濾波后, 分別選取全波段FC、 610~840 nm波段、 DWT-CARS提取的特征波長(694, 696, 765, 767, 769, 772, 778, 838和840 nm)建立3個對比分類模型DWT-FC-TLBO-ELM, DWT-TLBO-ELM和DWT-CARS-TLBO-ELM進行對比。 用教學優(yōu)化算法選擇模型的最優(yōu)權值ω和最優(yōu)閾值b, 由于3個模型采用的波段不同, 因此TLBO選擇的參數(shù)不同, 如表2所示, 表2中給出了3個不同模型的最優(yōu)權值ω和隱藏層最優(yōu)閾值b及對應的測試集準確率、 精確率、 召回率和F1值。 由表2可知, DWT-FC-TLBO-ELM與DWT-TLBO-ELM模型在病害等級識別能力幾乎相同, 只有精確率略有不同。 而基于DWT-CARS提取的9個特征波段的識別率、 精確率、 召回率和F1值都達到最高100%。 比前兩個分類模型高4.29個百分點。
表2 不同模型參數(shù)選擇及相應測試集準確率、 精確率、 召回率和F1值
圖8為三個模型的混淆矩陣, 由圖8可知, DWT-FC-TLBO-ELM中, 大病斑類和嚴重類混淆, 其中三個嚴重類測試樣本被識別為大病斑, 這是由于大病斑類和嚴重類部分樣本較為接近; DWT-TLBO-ELM模型健康類和潛育期類存在混淆, 其中有3個潛育期類樣本被誤識別為健康類, 也是由于兩個類部分樣本較為類似; DWT-CARS-TLBO-ELM模型沒有出現(xiàn)誤識別, 表現(xiàn)優(yōu)越。 且DWT-CARS-TLBO-ELM模型潛預期召回率為100%, 表明提出模型不僅能較好的區(qū)分健康類和潛預期類, 也能較好的區(qū)分5個不同的病害級別。
圖8 三個模型測試集混淆矩陣
利用高光譜成像技術對設施番茄灰霉病進行早期檢測, 提出基于DWT-CARS特征提取方法, 先對每一類訓練數(shù)據(jù)進行小波變換, 通過CARS算法執(zhí)行3次提取特征波長, 對3次提取的特征波長進行合并去除重復項, 最終提出9個特征波段: 694, 696, 765, 767, 769, 772, 778, 838和840 nm, 通過教學優(yōu)化算法和極限學習機建立DWT-CARS-TLBO-ELM番茄灰霉病識別模型對5類染病階段的病害葉片ROI區(qū)域進行檢測, 實驗結果表明, 提出的番茄灰霉病特征波段提取方法有效, 對5個階段的檢測率、 精準率、 召回率、 F1值均達到100%。
根據(jù)病斑大小選取進行數(shù)據(jù)建模利用高光譜成像系統(tǒng)獲取5類感興趣區(qū)域在近紅外高光譜波段388~1 006 nm進行數(shù)據(jù)建模, 采用小波濾波變換DWT對樣本數(shù)據(jù)中每一類分別濾波。 DWT濾波后, 分別選取全波段FC、 610~840 nm波段、 CARS-PLS提取的9個特征波段建立3個分類模型DWT-FC-TLBO-ELM, DWT-TLBO-ELM和DWT-CARS-TLBO-ELM進行對比, 分別對3個模型采用教學優(yōu)化算法(TLBO)進行最優(yōu)參數(shù)選取, 其中DWT-CARS-TLBO-ELM檢測精確度最高達100%, 潛育期召回率100%, 表明提出模型可以實現(xiàn)番茄灰霉病潛育期無病斑葉片早期識別診斷, 為番茄灰霉病早期防治、 精準施藥提供理論依據(jù)。
下一步工作展望: 進一步擴大樣本量, 采集不同生長階段和不同品種番茄以及不同番茄病害的樣本數(shù)據(jù), 驗證并改進番茄病害識別算法。