摘要:高光譜成像技術通過獲取物體表面在多個波段的反射光譜,能夠提供豐富的光譜信息,對于早期診斷與監(jiān)測農(nóng)作物病害具有較大優(yōu)勢。本文主要探討了高光譜成像在農(nóng)作物病害檢測中的研究進展,結合先進的圖像處理和機器學習算法,系統(tǒng)梳理了常用的光譜預處理方法、特征提取技術以及病害分類算法,對多種深度學習模型在該領域的應用進行了詳細分析,最后指出了高維數(shù)據(jù)處理和實時性優(yōu)化等關鍵技術瓶頸,并提出了未來的研究方向。
關鍵詞:高光譜圖像;農(nóng)作物病害;檢測識別技術;研究進展
近年來,國家對于農(nóng)業(yè)現(xiàn)代化的重視不斷加深,《“十四五”推進農(nóng)業(yè)農(nóng)村現(xiàn)代化規(guī)劃》提出要“推動農(nóng)業(yè)生產(chǎn)加工和農(nóng)村地區(qū)水利、公路、電力、物流、環(huán)保等基礎設施數(shù)字化、智能化升級”,需要各地探索科技賦能的農(nóng)業(yè)生產(chǎn)方案。病害防治作為保障農(nóng)作物健康生長的關鍵環(huán)節(jié),亟需農(nóng)戶借助先進的技術手段提升精度與效率。高光譜成像技術能夠獲取作物表面多個波段的光譜信息,具備檢測病害的巨大潛力,應用前景甚為廣泛。
1 高光譜成像技術用于農(nóng)作物病害檢測的原理
病害侵襲會影響植物的生理狀態(tài)、內部組織結構及其化學成分,導致其在不同波長下的反射光強度出現(xiàn)差異,從而提供關于病害早期跡象的重要信息(如圖1所示)。健康植物的葉片在可見光區(qū)域(400~700 nm)
內會出現(xiàn)光譜吸收峰,大致在紅光(約650 nm)和藍光(約450 nm)。由于葉綠素的存在,健康植物會大量吸收紅光與藍光用于光合作用和其他生理過程。在近紅外波段(700~1 300 nm)植物組織的水分含量會影響光的反射效果,尤其水分較多的植物在這一波段的反射率較低[1]。而這些特征在病害發(fā)生后會發(fā)生變化,比如(如白粉病、黑腐病、灰霉病等)病害會使植物的葉綠素合成受阻,導致葉片的綠色變淺或呈黃色,在紅光波段的反射率升高,藍光波段的反射率降低。高光譜成像技術依托使用窄波段(有幾十至百個窄波段)的光譜相機,可獲取從可見光到近紅外的高分辨率圖像數(shù)據(jù)。通過分析每個波段的反射率,檢測人員可以根據(jù)水分缺失、葉綠素損失、細胞壁結構破壞、組織枯萎等留下的“指紋”,從光譜特征中提取健康和病變植物的微小差異。
2 農(nóng)作物病害檢測的高光譜成像技術
2.1 卷積神經(jīng)網(wǎng)絡
卷積神經(jīng)網(wǎng)絡(CNN)是一類深度學習模型,特別適用于圖像處理和模式識別任務,其基本原理源自人工神經(jīng)網(wǎng)絡。CNN通過模擬生物視覺系統(tǒng)中的神經(jīng)結構,能夠有效地識別圖像中的復雜模式,從低級到高級逐步抽象化數(shù)據(jù)[2]。卷積神經(jīng)網(wǎng)絡通常由輸入層、卷積層、池化層、全連接層和輸出層組成,常用的激活函數(shù)包括Sigmoid、Tanh、ReLU(修正線性單元)和Leaky ReLU等。ReLU因其計算簡單且能有效緩解梯度消失問題,在CNN中得到了廣泛應用。ReLU函數(shù)形式為:
對于輸入值為負的部分輸出為零,而對于輸入值為正的部分,輸出與輸入成正比。而Leaky ReLU是ReLU的變種,它允許小的負值(如),解決了ReLU在負區(qū)間的“死神經(jīng)元”問題。另外,在分類任務中,輸出層的節(jié)點數(shù)對應類別的數(shù)量,每個節(jié)點代表一個類別的概率分布,常用的激活函數(shù)為Softmax來將輸出轉換為概率值,并且概率之和為1。
2.2 支持向量機
支持向量機(Support Vector Machine,SVM)是一種廣泛應用于分類和回歸分析的監(jiān)督學習模型,特別適用于高維特征空間中的二分類問題,其核心思想是構建一個最佳分割超平面(hyperplane),將不同類別的樣本分開,同時最大化該超平面到樣本的邊界距離,以此提高模型的泛化能力。利用SVM對高光譜數(shù)據(jù)進行分類,能夠準確識別作物病害的不同階段。譬如,褚璇在其研究中采用高光譜成像技術,通過單點接種霉菌后,拍攝不同時間點的圖像,并使用SVM模型進行分類[3]。經(jīng)過特征波長選擇后,分類準確率達83.33%,彰顯了SVM在高光譜數(shù)據(jù)分析中的強大能力。在花生葉斑病的檢測中,關強采用多尺度高光譜分析對不同尺度下的花生葉片進行了病害嚴重度的檢測。在這一研究中,支持向量機作為分類方法之一,與K近鄰(KNN)以及反向傳播神經(jīng)網(wǎng)絡(BP)相比,SVM的分類精度均較高。在花生葉斑病的嚴重程度分類中,SVM模型達到了96.57%的總體精度(OA)和95.39%的Kappa系數(shù),實現(xiàn)了高效的病害分級[4]。
2.3 隨機森林
隨機森林(Random Forest,RF)是一種集成學習方法,通過構建多個決策樹進行分類、回歸和預測。作為一種基于決策樹的集成算法,每個決策樹都依賴于從原始數(shù)據(jù)集的隨機子集(bootstrap sampling)中提取的訓練樣本,并利用隨機選擇的特征進行節(jié)點劃分,也稱為“袋外數(shù)據(jù)”方法(Out-of-Bag,OOB)每棵樹生成采用以下兩個隨機化過程:(1)數(shù)據(jù)集通過有放回地抽取樣本生成多個子集,稱為自助采樣(bootstrap sampling),每個子集大約有63%的原始數(shù)據(jù),其余的數(shù)據(jù)作為“袋外數(shù)據(jù)”用于評估模型;(2)在每個節(jié)點的劃分過程中并非考慮所有特征,而從一個隨機選定的特征子集(通常是特征總數(shù)的平方根)中選擇最優(yōu)特征進行劃分。訓練完成后,隨機森林通過“投票”方式對樣本進行分類,最終預測結果為得到最多票數(shù)的類別。
梁瑩等人利用手持近紅外光譜儀采集煙葉樣本的高光譜數(shù)據(jù),并結合Savitzky-Golay平滑濾波與一階導數(shù)進行數(shù)據(jù)預處理后,使用隨機森林算法進行病害種類的識別[5]。研究結果表明,隨機森林在分類精度、靈敏度和特異度等二級評價指標上均優(yōu)于支持向量機(SVM)、反向傳播神經(jīng)網(wǎng)絡(BP)和偏最小二乘判別(PLS-DA)等傳統(tǒng)分類算法。對于F1分數(shù)和曲線下的面積(AUC)指標,RF同樣表現(xiàn)突出,驗證了其在煙葉病害檢測中的高效性。徐敏等人將隨機森林算法應用于江蘇省小麥赤霉病的病穗率預測,通過分析2002—2018年13個市的氣象數(shù)據(jù)與小麥赤霉病的發(fā)生情況,結合隨機森林的機器學習模型,識別出影響病穗率的關鍵氣象因素,并基于不同生育期建立了預測模型[6]。結果表明,隨機森林算法能夠準確模擬赤霉病病穗率的波動趨勢,且在模擬“中等”及“偏重”赤霉病等級的預測效果上表現(xiàn)優(yōu)異。此研究證明了隨機森林在農(nóng)業(yè)氣象學和作物病害預測中的強大
應用潛力。
2.4 主成分分析與線性判別分析
主成分分析(Principal Component Analysis,PCA)與線性判別分析(Linear Discriminant Analysis,LDA)是兩種常用的數(shù)據(jù)降維與模式識別方法。主成分分析是一種無監(jiān)督學習方法,其基本思想是通過對原始數(shù)據(jù)集進行正交變換,生成一組新的變量,稱為主成分,這些主成分按照其在數(shù)據(jù)集中的方差大小排列,第一主成分具有最大方差,第二主成分次之,以此類推,每個主成分都是原始變量的線性組合,且各主成分之間相互獨立。袁富容等人使用PCA結合相關性分析篩選1-MCP的最佳使用劑量,分別使用0、0.5、1.0、1.5、2.0μL/L的1-MCP處理藍莓,借助PCA分析發(fā)現(xiàn),1.0μL/L的1-MCP處理能夠最佳地降低果實腐爛率和失重率,并有效地保持可溶性固形物、可滴定酸和維生素C含量[7]。PCA將多個生理指標合并為少數(shù)幾個主成分,揭示了不同1-MCP劑量對果實的綜合效應,證實了PCA能夠為篩選最適宜的處理劑量提供定量依據(jù)。與PCA不同,線性判別分析是一種有監(jiān)督的降維方法,主要用于分類問題,其目標是找到一個線性投影,使類間散度與類內散度之比最大,從而在新的空間中,類別之間的距離最遠,同一類別內的樣本間距離最小。朱夢遠使用LDA對水稻紋枯病進行分類。研究者利用高光譜圖像獲取水稻葉片的光譜數(shù)據(jù),并通過Savitzky-Golay二階求導進行數(shù)據(jù)預處理[8]。然后,其選擇了12個特征波長,使用LDA模型對預處理后的數(shù)據(jù)進行分類。結果表明,使用LDA模型可以達到98.3%的正確識別率,預測集的準確率為95%,表明LDA能夠有效地將水稻葉片的光譜數(shù)據(jù)映射到低維空間,并且切實提高紋枯病的早期檢測精度。
3 農(nóng)作物病害檢測高光譜成像常見的網(wǎng)絡模型
3.1 GoogleNet
GoogleNet,又名Inception v1,是Google提出的一種深度卷積神經(jīng)網(wǎng)絡(CNN)架構,首次在2014年ImageNet大規(guī)模視覺識別挑戰(zhàn)賽(ILSVRC)中獲勝。GoogleNet的核心創(chuàng)新在于Inception模塊,其通過組合多個不同尺寸的卷積核(如1x1,3x3,5x5卷積)和池化層,能夠在同一層中捕捉不同尺度的特征。Inception模塊的并行結構使網(wǎng)絡能夠同時關注圖像的細節(jié)和全局信息。GoogleNet還采用了1x1卷積來進行降維,減少了計算開銷,這一技術在網(wǎng)絡的多個層次中得到了應用,尤其是在對輸入圖像進行特征提取時。該網(wǎng)絡通過深度優(yōu)化使得其參數(shù)量大大減少,相比于傳統(tǒng)的深層網(wǎng)絡(如VGGNet),GoogleNet的參數(shù)量減少了大約12倍。
3.2 ResNet
ResNet(Residualnetwork)是一種由Microsoft在2015年提出的深度卷積神經(jīng)網(wǎng)絡架構,最為顯著的創(chuàng)新是引入了殘差連接(Residual Connection),解決了傳統(tǒng)深度網(wǎng)絡在增加層數(shù)時出現(xiàn)的梯度消失和梯度爆炸問題。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡在層數(shù)加深時,容易出現(xiàn)訓練困難和精度下降的問題,ResNet通過在每一層的輸出與輸入之間建立直接連接(殘差連接),使得網(wǎng)絡能夠更容易地進行訓練。每個殘差單元的結構可以看作是對“恒等映射”的學習,即網(wǎng)絡不僅學習從輸入到輸出的變換,還學習輸入與輸出之間的差異。ResNet對于農(nóng)作物病害檢測表現(xiàn)出色,尤其是在處理復雜的高光譜圖像時,可幫助網(wǎng)絡更好地學習不同波長信息的深層次關系,提升圖像分類的準確率。
3.3 VGGNet
VGGNet(Visual Geometry Groupnetwork)是由牛津大學計算機視覺組提出的深度卷積神經(jīng)網(wǎng)絡,VGGNet的主要特點在于其簡單而深度的網(wǎng)絡結構。VGGNet使用了大量的小卷積核(3x3卷積),通過多層堆疊來加深網(wǎng)絡的深度,同時保持了較少的網(wǎng)絡參數(shù)。VGGNet的基本架構由多個卷積層和池化層組成,網(wǎng)絡深度從16~19層不等,其中16層版本(VGG16)是最常用的網(wǎng)絡。VGGNet在圖像分類任務中表現(xiàn)優(yōu)異,其簡單且統(tǒng)一的架構使得網(wǎng)絡訓練起來相對直觀,但也帶來了較大的計算量。對于高光譜圖像,VGGNet能夠通過多層卷積操作提取圖像中的細節(jié)信息,如農(nóng)作物的病斑形態(tài)或色彩變化。
3.4 DenseNet
DenseNet(Densely Connected Convolutional networks)作為一種深度卷積神經(jīng)網(wǎng)絡架構,其關鍵思想是密集連接,即每一層的輸出都與其之前的所有層的輸出進行連接。這種設計使得網(wǎng)絡中的每一層都能夠接收到來自前面所有層的特征圖,形成密集的連接結構。相較于傳統(tǒng)的網(wǎng)絡結構,DenseNet提高了特征重用的效率,并且減少了梯度消失的問題。在處理高光譜圖像時,DenseNet借助密集連接可提取更多細致的特征信息,在處理復雜的農(nóng)作物病害圖像時能夠精確區(qū)分不同病害的細微差異。
4 存在問題及展望
當前高光譜圖像數(shù)據(jù)的每個像素點通常包含數(shù)百到上千個波段,導致數(shù)據(jù)處理分析十分復雜。在農(nóng)作物病害識別過程中,這些冗余的波段會帶來噪聲,影響分類模型的準確性。當前的技術盡管能夠減少維度,但仍不足以完全解決高維數(shù)據(jù)帶來的計算壓力和信息丟失問題。同時,高光譜成像設備昂貴且操作復雜,限制了其在大規(guī)模農(nóng)業(yè)生產(chǎn)中的普遍應用。數(shù)據(jù)的采集往往受限于光照條件、氣候變化和環(huán)境因素,尤其在田間實時監(jiān)測時,惡劣的天氣條件往往會影響圖像質量,從而影響后續(xù)的病害診斷過程。展望未來,隨著傳感器技術和計算能力的提升,農(nóng)作物病害檢測的高光譜成像方法將更加普及,與多源數(shù)據(jù)融合(如氣象數(shù)據(jù)、土壤數(shù)據(jù)等)以及開發(fā)實時監(jiān)測系統(tǒng),將有望推動智能農(nóng)業(yè)快速發(fā)展。
5 結語
高光譜成像技術作為一種先進的農(nóng)作物病害檢測手段,在精準農(nóng)業(yè)中的優(yōu)勢,尤其是在病害早期檢測、分類識別和無損監(jiān)測等方面,正逐步被認可并得到實踐驗證。然而如何在復雜環(huán)境下處理高維度數(shù)據(jù)、提升實時性和減少設備成本等問題依然需要解決。未來,隨著傳感器技術和計算能力的進步,農(nóng)業(yè)領域的高光譜圖像分析將推動農(nóng)業(yè)生產(chǎn)方式革新,為全球糧食安全提供強有力的技術支持。
參考文獻
[1] 曹英麗,張弘澤,郭福旭,等.基于無人機遙感的農(nóng)作物病害監(jiān)測研究進展[J].沈陽農(nóng)業(yè)大學學報,2024,55(5):616-628.
[2] 張春昊.高光譜成像技術在農(nóng)作物檢測中的應用進展[J].農(nóng)機市場,2024(7):58-60.
[3] 褚璇,張焜,朱立學,等.基于近紅外光譜的腐皮鐮孢菌侵染香蕉過程表征研究[J].仲愷農(nóng)業(yè)工程學院學報,2022,35(4):50-55.
[4] 關強.基于多尺度高光譜的花生葉斑病病害分級檢測方法研究[D].沈陽:沈陽農(nóng)業(yè)大學,2023.
[5] 梁瑩,馬琨,張馨予,等.基于近紅外光譜和隨機森林的煙葉病害種類識別[J].激光與光電子學進展,2024,61(15):362-369.
[6] 徐敏,徐經(jīng)緯,謝志清,等.隨機森林機器算法在江蘇省小麥赤霉病病穗率預測中的應用[J].氣象學報,2020,78(1):143-153.
[7] 袁富容,楊婷,冉雅文,等.基于主成分分析法評價1-MCP處理對‘藍豐’藍莓果實品質及生理的影響[J].保鮮與加工,2024,24(9):8-18.
[8] 朱夢遠,楊紅兵,李志偉.高光譜圖像和葉綠素含量的水稻紋枯病早期檢測識別[J].光譜學與光譜分析,2019,39(6):1898-1904.