doi:10.15889/j.issn.1002-1302.2024.20.005
摘要:土壤全氮含量是評(píng)價(jià)土壤肥力及作物生長(zhǎng)支持的核心指標(biāo)之一。本研究構(gòu)建一種新型反演模型VMD-SSA-LSSVM模型,旨在增強(qiáng)土壤全氮含量預(yù)測(cè)的精確性與泛化性。首先,使用大疆精靈四多光譜無(wú)人機(jī)收集作物冠層5個(gè)波段的光譜反射率數(shù)據(jù);隨后,對(duì)田間表層土壤進(jìn)行取樣,并通過(guò)實(shí)驗(yàn)室分析,確定土壤全氮含量,通過(guò)分析光譜數(shù)據(jù)和土壤全氮含量之間的關(guān)系,選出敏感波段,并以此為基礎(chǔ)構(gòu)建預(yù)測(cè)模型;此外,通過(guò)比較VMD-SSA-LSSVM模型與其他2種模型(VMD-LSSVM、傳統(tǒng)LSSVM)的預(yù)測(cè)性能,評(píng)估不同方法對(duì)模型準(zhǔn)確性的影響。結(jié)果表明,相對(duì)于傳統(tǒng)LSSVM模型、VMD-LSSVM模型,VMD-SSA-LSSVM模型在土壤全氮含量的反演預(yù)測(cè)上表現(xiàn)最優(yōu)。該模型的決定系數(shù)(r2)為0.893 3,均方根誤差(RMSE)為0.031 3;在之后的拔節(jié)、灌漿、孕穗期的驗(yàn)證中,決定系數(shù)分別到達(dá)0.431、0.481、0.537。這些性能指標(biāo)表明,VMD-SSA-LSSVM模型能夠有效提高土壤全氮含量的預(yù)測(cè)準(zhǔn)確度。通過(guò)結(jié)合變分模態(tài)分解并利用麻雀搜索算法優(yōu)化的最小二乘支持向量機(jī)模型,展現(xiàn)出較高的預(yù)測(cè)精度和良好的泛化能力。VMD-SSA-LSSVM預(yù)測(cè)模型可作為土壤全氮含量監(jiān)測(cè)和農(nóng)田管理的有效工具,為農(nóng)業(yè)生產(chǎn)提供科學(xué)的決策支持。
關(guān)鍵詞:土壤;全氮含量;無(wú)人機(jī);多光譜遙感;最小二乘支持向量機(jī);變分模態(tài)分解
中圖分類號(hào):S127" 文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1002-1302(2024)20-0032-09
收稿日期:2023-11-30
基金項(xiàng)目:江蘇省重點(diǎn)研發(fā)計(jì)劃(編號(hào):BE2022338);現(xiàn)代農(nóng)業(yè)裝備與技術(shù)協(xié)同創(chuàng)新中心資助項(xiàng)目(編號(hào):XTCX1004);現(xiàn)代農(nóng)業(yè)裝備與技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室開放基金(編號(hào):MAET202113)。
作者簡(jiǎn)介:張" 進(jìn)(1999—),男,江蘇蘇州人,碩士研究生,主要從事農(nóng)業(yè)智能化、可視化研究。E-mail:zwjzxi123@gmail.com。
通信作者:吳春篤,博士,教授,博士生導(dǎo)師,研究方向?yàn)槲廴究刂乒こ?、水環(huán)境修復(fù)、農(nóng)業(yè)環(huán)境保護(hù)工程。E-mail:wucd@ujs.edu.cn。
土壤是農(nóng)作物生產(chǎn)的主要載體,農(nóng)作物產(chǎn)量與土壤養(yǎng)分狀況密切相關(guān)[1],土壤養(yǎng)分主要包括氮、磷、鉀等元素。土壤全氮含量為土壤中氮含量的總和,由有機(jī)氮和無(wú)機(jī)氮組成;其中無(wú)機(jī)氮包括硝態(tài)氮、亞硝態(tài)氮、銨態(tài)氮。土壤全氮含量反映土壤中氮素的供應(yīng)水平,不僅是判斷土壤氮素狀態(tài)的重要依據(jù),也是評(píng)價(jià)土壤肥力水平的關(guān)鍵指標(biāo)。在小麥種植過(guò)程中對(duì)土壤進(jìn)行氮素診斷,可以更好地協(xié)調(diào)小麥對(duì)于不同時(shí)期的氮素需求。另一方面,對(duì)土壤進(jìn)行氮素診斷,也可以避免化肥的過(guò)量使用,對(duì)于綠色農(nóng)業(yè)發(fā)展和環(huán)境保護(hù)具有重要作用。盡管傳統(tǒng)土壤測(cè)試方法涵蓋了田間取樣和實(shí)驗(yàn)室化學(xué)分析,但這些方法通常面臨著周期過(guò)長(zhǎng)、成本昂貴、操作繁瑣等問(wèn)題,據(jù)此制定土壤氮素分布圖、制定符合小麥生長(zhǎng)特性的施肥方案等,具有明顯的滯后性和不確定性,難以滿足當(dāng)下精準(zhǔn)農(nóng)業(yè)的生產(chǎn)需求。隨著數(shù)字農(nóng)業(yè)的快速發(fā)展,以準(zhǔn)確、迅速、經(jīng)濟(jì)的方式獲得土壤信息,已成為現(xiàn)代精準(zhǔn)農(nóng)業(yè)成功的關(guān)鍵。近年來(lái),多光譜技術(shù)作為一種先進(jìn)的分析方法,其發(fā)展速度明顯加快。多光譜成像技術(shù)能夠在寬光譜帶上進(jìn)行檢查,具有診斷不可見或者低對(duì)比度等重要特征的優(yōu)勢(shì);多光譜成像技術(shù)在一定程度上避免了傳統(tǒng)測(cè)土帶來(lái)的人為誤差,在監(jiān)測(cè)作物長(zhǎng)勢(shì)、產(chǎn)量、品質(zhì)和土壤墑情、養(yǎng)分含量等領(lǐng)域得到廣泛應(yīng)用[2-3]。
從20世紀(jì)70年代開始,土壤光譜與氮素的關(guān)系已經(jīng)是國(guó)內(nèi)外的研究熱點(diǎn),農(nóng)田土壤氮素遙感監(jiān)測(cè)包括光學(xué)遙感、熱紅外遙感、高光譜遙感、多光譜遙感;光學(xué)遙感主要是根據(jù)可見光、近紅外、短波紅外波段等不同波段的反射率來(lái)監(jiān)測(cè)土壤氮素[4]。土壤成分中不同營(yíng)養(yǎng)元素在不同光譜波段上的敏感度不同,如紅邊波段對(duì)土壤中的氮、磷元素比較敏感,而可見光能更好地檢測(cè)土壤中的鉀元素[5]。土壤的這些特征是實(shí)現(xiàn)光譜數(shù)據(jù)反演的理論依據(jù)。王璐等證明了多光譜數(shù)據(jù)定量反演土壤元素含量的可行性,在選擇多光譜遙感數(shù)據(jù)時(shí)要充分考慮傳感器的波段特征[6]。王世東等通過(guò)土壤高光譜數(shù)據(jù)測(cè)量對(duì)土壤光譜數(shù)據(jù)進(jìn)行3種數(shù)學(xué)變換,建立了偏最小二乘回歸、BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林等模型,并將偏最小二乘回歸與其他2個(gè)模型相結(jié)合,共同反演土壤全氮含量[7]。張強(qiáng)等基于歸一化光譜指數(shù)估算土壤全氮含量,其中預(yù)測(cè)效果最好的模型是指數(shù)函數(shù)(回歸決定系數(shù)為0.798) [8]。袁石林等采用最小二乘支持向量機(jī)的耦合模型對(duì)土壤氮素含量進(jìn)行反演[9]。Xu等利用隨機(jī)森林算法建立土壤總氮含量的預(yù)測(cè)模型,研究不同的超分辨率貝葉斯方法下光譜指數(shù)對(duì)于土壤總氮預(yù)測(cè)模型精度的影響,結(jié)果表明,結(jié)合多光譜數(shù)據(jù)和圖像挖掘算法得到的光譜指數(shù)在土壤總氮含量預(yù)測(cè)中展現(xiàn)出較高的精度[10]。Alvarez-Mendoza等利用無(wú)人機(jī)獲取的植被系數(shù)和土壤實(shí)地測(cè)量數(shù)據(jù)構(gòu)建模型來(lái)估算土壤中氮的百分比,結(jié)果表明綠地歸一化植被指數(shù)構(gòu)建的模型與土壤氮素之間具有較高相關(guān)性[11]。Orlando等利用激光誘導(dǎo)擊穿光譜與無(wú)人機(jī)多光譜、人工智能整合,訓(xùn)練了2個(gè)機(jī)器學(xué)習(xí)模型,包括多層感知回歸、支持向量回歸來(lái)預(yù)測(cè)土壤中的總氮含量,結(jié)果表明,基于機(jī)器學(xué)習(xí)的預(yù)測(cè)模型均方根誤差為10.8%[12]。可以看出,遙感技術(shù)在土壤氮素含量檢測(cè)領(lǐng)域具有廣泛的應(yīng)用潛力。多光譜技術(shù)在土壤氮素含量測(cè)定的相關(guān)研究中已廣泛應(yīng)用,并且均獲得相應(yīng)的成果,為土壤氮素含量測(cè)定提供了有效的技術(shù)支撐。目前,利用單個(gè)敏感波段的衛(wèi)星遙感或高光譜植被指數(shù)進(jìn)行土壤全氮含量監(jiān)測(cè)的方法已被廣泛研究,但在植被覆蓋條件下,采用無(wú)人機(jī)多光譜遙感技術(shù)對(duì)土壤全氮含量進(jìn)行監(jiān)測(cè)的相關(guān)研究尚不多見。此外,在植被覆蓋條件下使用無(wú)人機(jī)多光譜遙感技術(shù)進(jìn)行土壤全氮含量估算的反演模型也較為缺乏。
本研究通過(guò)無(wú)人機(jī)獲取多光譜遙感影像,收集冬小麥土壤的全氮含量信息,探討冬小麥植被冠層光譜反射率以及在各種波段變換形式轉(zhuǎn)換下土壤全氮含量與這些波段反射率之間的相關(guān)性;篩選與土壤全氮含量相關(guān)的敏感波段組,并使用變分模態(tài)分解方法對(duì)土壤數(shù)據(jù)做信號(hào)處理與分解;利用得到的敏感波段組,分別構(gòu)建冬小麥土壤全氮含量LSSVM、VMD-LSSVM、VMD-SSA-LSSVM預(yù)測(cè)模型;通過(guò)應(yīng)用特定的模型評(píng)估指標(biāo)來(lái)對(duì)3種不同的預(yù)測(cè)模型進(jìn)行精度比較,得出最適合的土壤全氮含量反演模型,旨在為使用無(wú)人機(jī)遙感技術(shù)對(duì)土壤全氮含量進(jìn)行營(yíng)養(yǎng)狀態(tài)診斷提供科學(xué)支持。
1" 材料與方法
1.1" 研究區(qū)概況
試驗(yàn)區(qū)位于江蘇省鎮(zhèn)江市京口區(qū)姚橋鎮(zhèn)(32°8′1″~34°8′6″N,119°43′59″~119°44′10″E)(圖1),試驗(yàn)田面積約為35 894 m2。該地區(qū)為亞熱帶季風(fēng)氣候,夏日濕潤(rùn)、降雨頻繁,冬季則呈干冷狀態(tài)。常年平均氣溫維持在16 ℃左右,而最近5年記錄的年均降水量為1 126.3 mm,尤其是6—8月降水更為集中。試驗(yàn)區(qū)主要土壤類型為黃棕壤,實(shí)行冬季小麥與夏季水稻的交替種植策略,依賴自然降水完成灌溉需求。所選用小麥品種為揚(yáng)麥23,種植時(shí)間為2022年10月末至11月初,種植方法采用廣撒式,種植密度達(dá)到400萬(wàn)株/hm2。
1.2" 試驗(yàn)設(shè)計(jì)
試驗(yàn)點(diǎn)采用棋盤式布點(diǎn)法,選用4塊相連的條田,其中3塊條田均選取14個(gè)采樣點(diǎn),第4塊條田選取21個(gè)采樣點(diǎn),總共63個(gè)采樣點(diǎn)(圖2),每個(gè)采樣點(diǎn)在土壤表層進(jìn)行取樣。
1.3" 數(shù)據(jù)采集與處理
1.3.1" 多光譜遙感影像獲取
本試驗(yàn)采用由大疆創(chuàng)新科技有限公司生產(chǎn)的P4 Multispectral型四旋翼無(wú)人機(jī)來(lái)獲取多光譜圖像。該無(wú)人機(jī)配備FC6360多光譜相機(jī),該相機(jī)裝有6個(gè)1/2.9英寸的CMOS影像傳感器。具體來(lái)說(shuō),其中1個(gè)傳感器用于捕獲常規(guī)的彩色(RGB)圖像,而其余5個(gè)傳感器則分別對(duì)應(yīng)5個(gè)不同的波段,進(jìn)行多光譜圖像的獲?。ū?)。其中包括(450±16) nm藍(lán)光波段(Blue)、(560±16) nm綠光波段(Green)、(650±16) nm紅光波段(Red)、(730±16) nm紅邊波段(Rededge)、(840±26) nm近紅外波段(NIR)。本試驗(yàn)中的多光譜影像于2023年2月28日進(jìn)行采集,此時(shí)冬小麥正處于返青生長(zhǎng)期,當(dāng)日天氣為晴朗轉(zhuǎn)多云,伴隨西南風(fēng)2級(jí)風(fēng)速。影像采集的具體時(shí)間段設(shè)定在11:00—15:00,期間天氣保持晴朗。采集過(guò)程中,使用DJI GS Pro軟件進(jìn)行飛行路線的精確規(guī)劃,選擇“S”形路徑以確保研究區(qū)域的全面覆蓋。無(wú)人機(jī)飛行高度定為100 m,飛行速度調(diào)整至4.1 m/s,并采用等時(shí)間隔拍照模式,設(shè)置間隔時(shí)間為2 s,以此確保獲取連貫性高的圖像數(shù)據(jù)。航向、側(cè)向的重疊度分別設(shè)置為85%、75%,旨在最大化圖像的覆蓋范圍并提高數(shù)據(jù)的完整性。在整個(gè)采集流程中,相機(jī)鏡頭與地面保持垂直,為后續(xù)的數(shù)據(jù)分析和模型建立提供高質(zhì)量的輸入源。
1.3.2" 多光譜遙感影像處理
試驗(yàn)中采用Pix4Dmapper、DJI Terra軟件對(duì)無(wú)人機(jī)獲取的多光譜遙感影像進(jìn)行預(yù)處理。預(yù)處理工作主要包括幾何校正、輻射校正這2個(gè)關(guān)鍵步驟。通過(guò)ENVI Classic 5.3軟件,采用已經(jīng)通過(guò)Pix4Dmapper進(jìn)行幾何校正的正射影像作為基準(zhǔn)圖像,于5個(gè)不同波段選擇清晰的地理標(biāo)志作為校正參考點(diǎn)。本次使用的正射影像內(nèi)置了8個(gè)三維地面控制點(diǎn),且其平均均方根誤差為0.006 m。在輻射校正方面,利用DJI Terra中的輻射校正功能并結(jié)合輻射標(biāo)定板完成,以確保多光譜圖像中的DN值(灰度值)能真實(shí)反映地表物質(zhì)的光譜反射率。同時(shí),利用手持GPS設(shè)備精確獲取采樣點(diǎn)位置信息,并利用ENVI Classic 5.3軟件將這些信息轉(zhuǎn)化為矢量圖層。之后,將經(jīng)過(guò)預(yù)處理的多光譜圖像及GPS矢量圖層導(dǎo)入至ENVI 5.3軟件(與Classic為相同軟件但操作界面不同)中作進(jìn)一步分析。在軟件中,以每個(gè)地面采樣點(diǎn)(每個(gè)采樣區(qū)域覆蓋1 m2)為中心,建立63個(gè)18像素×18像素的感興趣區(qū)域(ROI),并將這些ROI內(nèi)的平均反射率作為相應(yīng)采樣點(diǎn)的光譜反射率。
1.3.3" 土壤氮素?cái)?shù)據(jù)獲取
為確保數(shù)據(jù)的準(zhǔn)確性和可靠性,本研究在獲取多光譜遙感影像前的3 h內(nèi)進(jìn)行土壤樣本的采集工作。采樣方法為對(duì)角線五點(diǎn)取樣法,于每個(gè)選定的采樣點(diǎn)處,特別是在作物根系附近,收集深10 cm左右的5份表層土壤樣本。取出的土樣放置在標(biāo)記的鋁盒中,帶回實(shí)驗(yàn)室放入烘箱80 ℃烘烤干燥,每8 h取出不同位置標(biāo)記好的3個(gè)鋁盒進(jìn)行重復(fù)稱重至恒重。對(duì)土壤樣品進(jìn)行烘干,研磨,過(guò)0.149 mm篩,裝袋編號(hào)。稱取1 g土樣,經(jīng)過(guò)消解、蒸餾、滴定和空白試驗(yàn),記錄所用鹽酸標(biāo)準(zhǔn)溶液體積,根據(jù)公式測(cè)定土壤樣品全氮含量(g/kg)[13]。
1.4" 數(shù)據(jù)分析與處理
采用統(tǒng)計(jì)分析軟件IBM SPSS statistics 26進(jìn)行樣本統(tǒng)計(jì)分析,通過(guò)箱狀圖剔除1組異常點(diǎn)(圖3)。結(jié)果表明,研究區(qū)域內(nèi)除異常點(diǎn)之外,剩余62個(gè)樣本土壤的氮素含量符合正態(tài)分布(圖4),最大值為1.78 g/kg,最小值為0.97 g/kg,均值為 1.33 g/kg,標(biāo)準(zhǔn)差為0.17 g/kg。
1.5" 植被指數(shù)與波段變化形式構(gòu)建
前人研究發(fā)現(xiàn),直接利用原始波段的反射率不足以準(zhǔn)確識(shí)別出特定的特征波段;然而,對(duì)這些原始反射率進(jìn)行適當(dāng)處理之后,就能有效識(shí)別和提取與土壤全氮含量相關(guān)的特征波段[3]。提取特征波段可以采用遙感影像提取的各類光譜數(shù)據(jù),通過(guò)線性與非線性形式組合成植被指數(shù), 也可以通過(guò)人為變換形式對(duì)反射率進(jìn)行數(shù)學(xué)變換。本研究采用5種廣泛應(yīng)用的植被指數(shù),包括歸一化植被指數(shù)(NDVI)、差值植被指數(shù)(DVI)、紅光比值指數(shù)(RVI)、
土壤調(diào)整植被指數(shù)(SAVI)、優(yōu)化土壤調(diào)節(jié)植被指數(shù)(OSAVI)(表2)。通過(guò)對(duì)反射率進(jìn)行人為取對(duì)數(shù)、倒數(shù)、倒數(shù)的對(duì)數(shù)、對(duì)數(shù)的倒數(shù)、相乘取根號(hào)、波段線性組合來(lái)獲取特征波段。
1.6" 反演模型算法原理
1.6.1" 變分模態(tài)分解
變分模態(tài)分解(VMD)是一種信號(hào)分解方法,可以將1個(gè)信號(hào)分解為多個(gè)固有振動(dòng)模式(IMF),由Dragomiretskiy和Zosso在2014年提出,其顯著特點(diǎn)是能自動(dòng)適應(yīng)且確定所需分解的模態(tài)數(shù)量;它可以根據(jù)各個(gè)模態(tài)的理想中心頻率及其限定的帶寬進(jìn)行自我調(diào)整和配合,可有效處理非線性和非穩(wěn)定的信號(hào),從而準(zhǔn)確地分離出固有模態(tài)成分[17]。該方法主要依賴于構(gòu)建一個(gè)變分問(wèn)題及其求解過(guò)程[18]。
假想將初始信號(hào)f分解成k個(gè)組成部分,其約束是確保所有單獨(dú)的模態(tài)成分相加而等同于初始信號(hào),其表達(dá)式為:
min{uk},{ωk}∑5k=1tδ(t)+jπt×uk(t)e-jωkt22
s.t.∑5k=1uk=f(x)。(1)
式中:uk={u1,u2,u3,…,uk},為各模態(tài)函數(shù);ωk={ω1,ω2,ω3,…,ωk}為各模態(tài)中心頻率;k為各分解模態(tài)的數(shù)量,本試驗(yàn)k最大取值為5;δ(t)為狄拉克分布;t為梯度運(yùn)算;f(x)為實(shí)信號(hào);j為虛數(shù)單位;t為時(shí)間變量。
(1)解決約束最優(yōu)化。通過(guò)將約束問(wèn)題轉(zhuǎn)化為非約束變分問(wèn)題,并結(jié)合二次懲罰項(xiàng)和拉格朗日乘子法的優(yōu)點(diǎn),將約束的變分問(wèn)題轉(zhuǎn)換為非約束形式,以此減少高斯噪聲的干擾效果。表達(dá)式為:
L({uk},{ωk},λ)=α∑5k=1tδ(t)+jπt×uk(t)e-jωkt22+f(t)-∑5k=1uk(t)22+λ(t),f(t)-∑5k=1uk(t)。(2)
式中:α為二次懲罰參數(shù);λ為拉格朗日乘法算子。
模式分量更新:
un+1k(ω)=x(ω)-∑i≠ku(n)i(ω)+λ(n)(ω)21+2αω-ω(n)k2。(3)
式中:n為迭代次數(shù);i為遍歷不同模態(tài)分量的索引。
中心頻率更新:
ωn+1k=∫∞0ωun+1k(ω)2dω∫∞0un+1k(ω)2dω。(4)
拉格朗日更新:
λ(n+1)(ω)=λ(n)(ω)+τx(ω)-∑5k=1u(n+1)k(ω)。(5)
式中:τ為更新步長(zhǎng)。
(2)截止條件。重復(fù)公式(3)至公式(5)中的步驟,直至滿足如下的迭代約束條件:
∑kk=1u(n+1)k(ω)-u(n)k(ω)22u(n)k(ω)22lt;ε。(6)
1.6.2" 麻雀搜索優(yōu)化算法
麻雀搜索算法(SSA)是2020年由東華大學(xué)Xue等提出的一種新的優(yōu)化算法,麻雀優(yōu)化算法是受麻雀覓食和反捕食行為啟發(fā)而成,通過(guò)粒子的位置和麻雀密度來(lái)搜索最優(yōu)解[19]。為了方便理解,我們將麻雀行為理想化并制定相應(yīng)規(guī)則,全局中的每只麻雀扮演3種角色:(1)發(fā)現(xiàn)者,發(fā)現(xiàn)者的任務(wù)是給整個(gè)麻雀種群提供事務(wù)的位置和方向;(2)加入者,加入者在覓食過(guò)程中會(huì)時(shí)刻監(jiān)視著發(fā)現(xiàn)者;(3)警戒者,當(dāng)意識(shí)到危險(xiǎn)時(shí),警戒者迅速移動(dòng)到安全地方獲取更好的位置。詳細(xì)步驟如下。
(a)種群初始化
種群緯度為Dim,隨機(jī)初始化N個(gè)麻雀的初始解X,其種群位置如下所示:
X=x1,1x1.2…x1,d
x2,1x2,2…x2,d
xn,1xn,2…xn,d。(7)
式中:xn,d為麻雀的位置;n=1,2,…,N;d=1,2,…,Dim。
(b)發(fā)現(xiàn)者位置更新
Xn+1i,j=Xni,j·exp-iα·itermax," Rlt;ST
Xni,j+Q·L,R≥ST。(8)
式中:n為當(dāng)前迭代次數(shù);j的范圍是{1,2,…,d};Xni,j表示在第n次迭代時(shí),第i只麻雀在第j維度的值;itermax是最大的迭代次數(shù);α是(0,1]之間的隨機(jī)數(shù);R(R∈[0,1])、ST(ST∈[0.5,1])分別表示預(yù)警值、安全閥值;Q為一個(gè)服從正態(tài)分布的隨機(jī)數(shù);L為1×d的單位矩陣;當(dāng)Rlt;ST時(shí),表示周圍沒(méi)有天敵;當(dāng) R≥ST時(shí),表示附近存在危險(xiǎn)。
(c)加入者位置更新
Xn+1i,j=Q·expXnworst-Xni,ji2,""" igt;n2
Xn+1p+|Xni,j-Xn+1p|·A*·L,i≤n2。(9)
式中:Xnworst為當(dāng)前全局最差位置;Xp是當(dāng)前全局最優(yōu)位置;Xn+1p表示在n+1次迭代的位置;A表示 1×d的矩陣,每個(gè)元素隨機(jī)分配1或者-1,且滿足A*=AT(AAT)-1;當(dāng)igt;n2時(shí),表明適應(yīng)度值較差的加入者最有可能挨餓。
(d)警戒者位置更新
Xn+1i,j=Xnbest+β·|Xni,j-Xnbest|,""" figt;fg
Xni,j+K·|Xni,j-Xnworst|(fi-fw)+ε,fi=fg。(10)
式中:Xnbest為第n次迭代的全局最佳位置;β為迭代步長(zhǎng),服從均值為0,方差為1的標(biāo)準(zhǔn)正態(tài)分布;fi是當(dāng)前麻雀的適應(yīng)度值;fg、fw 分別為當(dāng)前全局最佳、最差適應(yīng)度;K為[-1,1]之間的隨機(jī)數(shù);ε為最小常數(shù),防止分母為0。當(dāng)fi=fg時(shí),麻雀發(fā)現(xiàn)危險(xiǎn),需要靠近其他麻雀,K表示麻雀移動(dòng)的方向;當(dāng)figt;fg時(shí),麻雀在群體邊緣捕食,Xbest代表人口中心位置,在其周圍為安全。
1.6.3" 最小二乘支持向量機(jī)
最小二乘支持向量機(jī)(LSSVM)是在SVM基礎(chǔ)上的改進(jìn),采用最小二乘法來(lái)求解線性方程組,直接得到模型參數(shù),而傳統(tǒng)的SVM使用優(yōu)化問(wèn)題的二次規(guī)劃來(lái)求解模型參數(shù),通過(guò)求解對(duì)偶問(wèn)題得到支持向量和決策邊界。LSSVM的核心原理是將輸入數(shù)據(jù)和參數(shù)映射到高維特征空間,直接處理對(duì)應(yīng)的線性問(wèn)題[20]。回歸函數(shù)如下:
f(x)=ω·φ(x)+b。(11)
式中:ω為超平面權(quán)重系數(shù)向量;φ(x)是LSSVM的核函數(shù);b是偏置量。算法步驟為:
定義優(yōu)化問(wèn)題目標(biāo)函數(shù)及其約束條件:
minJ(ω,e)=12ωTω+12γ∑ni=1e2i
s.t.yi=ωTφ(xi)+b+ei。(12)
式中:γ為正則化參數(shù);e為誤差向量;ei為誤差,ei∈e。
引入拉格朗日函數(shù)求解上述優(yōu)化問(wèn)題:
L(ω,b,e,β)=12ω2+12γ∑ni=1e2i-∑ni=1βi[ωTφ(xi)+b+ei-yi]。(13)
式中:β為拉格朗日向量;βi是拉格朗日乘數(shù),βi∈β。
對(duì)式中ω、b、e、β分別求偏導(dǎo),令導(dǎo)數(shù)為0,消除ω和ei,可得線性方程組
0ET
EK(xi,xj)+γ-1bβ=0y。(14)
式中:E=[1,1,…,1]T;K為核映射矩陣;y=[y1,y2,…,yn]T。得到LSSVM回歸函數(shù):
f(x)=∑Ni=1βiK(xi,xj)+b。(15)
本研究采用徑向基(RBF)核函數(shù),相比于其他核函數(shù)徑向基核函數(shù),具有徑向?qū)ΨQ、泛化能力強(qiáng)的特點(diǎn)[21],其表達(dá)式為:
K(xi,xj)=exp-‖xi-xj‖22σ2。(16)
其中:K(xi,xj)表示輸入樣本xi和xj之間的核函數(shù)值;exp指自然指數(shù)函數(shù),用來(lái)確保核函數(shù)的值位于0~1之間;‖xi-xj‖2表示樣本xi和xj之間的歐幾里得距離的平方。σ為核函數(shù)的帶寬,表示2個(gè)樣本點(diǎn)之間的距離對(duì)相似性的影響。
1.7" 反演模型的構(gòu)建
本研究對(duì)LSSVM加入模態(tài)分解并通過(guò)麻雀搜索優(yōu)化算法優(yōu)化LSSVM的2個(gè)參數(shù),具體步驟如下(圖5)。
(1)讀取土壤氮素?cái)?shù)據(jù),輸入到VMD中進(jìn)行分解,得到各子序列,對(duì)分解后的各個(gè)模態(tài)分量進(jìn)行歸一化處理。
(2)初始化SSA參數(shù),包括種群數(shù)量、迭代次
數(shù)、LSSVM初始參數(shù)γ和σ。
(3)計(jì)算每只麻雀的適應(yīng)度f(wàn)i,并根據(jù)fi選出最佳、最差個(gè)體對(duì)應(yīng)位置Xbest、Xworst,依據(jù)麻雀搜索算法原理,對(duì)迭代更新位置與當(dāng)前位置作比較,得出最優(yōu)參數(shù)。
對(duì)各分量構(gòu)建不同核特征的LSSVM預(yù)測(cè)模型重復(fù)步驟(2)(3),找到各個(gè)分量LSSVM模型的最佳參數(shù),代入光譜數(shù)據(jù)進(jìn)行訓(xùn)練與仿真,最后將各個(gè)LSSVM預(yù)測(cè)分量組合,得出最終的預(yù)測(cè)值。
1.8" 反演模型數(shù)據(jù)預(yù)處理與評(píng)價(jià)指標(biāo)
為了統(tǒng)一量綱和方便后面數(shù)據(jù)的處理,對(duì)VMD分解后的模態(tài)分量歸一化處理,使用線性歸一化將數(shù)據(jù)映射到[0,1]中,其公式表達(dá)為:
x′=x-min(x)max(x)-min(x)。(17)
式中:x′為歸一化后的數(shù)據(jù),x為分解后的數(shù)據(jù),max(x)、min(x)分別代表最大值、最小值。
為了評(píng)估模型的精確性,本研究采用決定系數(shù)(r2)和均方根誤差(RMSE)這2個(gè)指標(biāo)來(lái)衡量模型的精度[22]。決定系數(shù)也稱為擬合優(yōu)度,用于衡量回歸模型觀測(cè)數(shù)據(jù)的擬合程度;其取值范圍在0~1之間,其中0表示模型不可靠,1表示模型完全擬合數(shù)據(jù)。均方根誤差是衡量預(yù)測(cè)值、真實(shí)值之間差異的一種常用方法。RMSE越小,表示模型對(duì)真實(shí)數(shù)據(jù)的預(yù)測(cè)能力越好。
r2=1-∑ni=1(yi-y^i)2∑ni=1(yi-yi)2;(18)
RMSE=∑ni=1(yi-y^i)2n。(19)
式中:yi為土壤全氮含量的實(shí)測(cè)值,y^為土壤全氮含量的預(yù)測(cè)值,yi為土壤全氮含量實(shí)測(cè)值的平均值,n為樣本數(shù)。
2" 結(jié)果與分析
2.1" 小麥冠層光譜反射率與土壤全氮含量的相關(guān)性分析
本研究利用IBM SPSS Statistics 26統(tǒng)計(jì)軟件,對(duì)研究區(qū)域內(nèi)藍(lán)光波段、綠光波段、紅光波段、紅邊波段、近紅外波段的光譜反射率與地面測(cè)定的冬小麥土壤全氮含量之間的相關(guān)性進(jìn)行分析。分析結(jié)果(表3)顯示,相關(guān)系數(shù)分別為-0.14(綠光波段)、-0.10(紅光波段)、-0.05(藍(lán)光波段)、-0.263(近紅外波段)、-0.351(紅邊波段)。其中,近紅外波段的相關(guān)性在統(tǒng)計(jì)學(xué)上達(dá)到顯著水平(Plt;0.05),紅邊波段的相關(guān)性則達(dá)到極顯著水平(Plt;0.01)。相反,可見光波段的相關(guān)性均未達(dá)到顯著性標(biāo)準(zhǔn)(Pgt;0.05)。基于上述分析結(jié)果,本研究選擇紅邊波段作為預(yù)測(cè)模型的輸入變量。
2.2" 小麥冠層植被指數(shù)與土壤全氮含量的相關(guān)性分析
通過(guò)皮爾遜相關(guān)性分析法,本研究評(píng)估5種常用植被指數(shù)與冬小麥土壤全氮含量之間的相關(guān)性。分析結(jié)果表明, 這些植被指數(shù)與土壤全氮含量之間
的相關(guān)系數(shù)均未達(dá)到顯著水平(Pgt;0.05)(表4),因此不將植被指數(shù)作為模型的輸入變量。
2.3" 小麥冠層光譜反射率變換形式與土壤全氮含量相關(guān)性分析
通過(guò)皮爾遜相關(guān)性分析法,本研究對(duì)30個(gè)經(jīng)過(guò)變換后的反射率與冬小麥土壤全氮含量之間的相關(guān)度進(jìn)行探討,分析發(fā)現(xiàn),其中紅邊波段倒數(shù)的對(duì)數(shù)lg(1/Rededge)、紅邊波段對(duì)數(shù)的倒數(shù)
1/lg(Rededge)、Green×NIR、Green×Rededge、(Rededge+Green)與土壤全氮含量的相關(guān)性達(dá)到極顯著水平(Plt;0.01),紅邊波段的對(duì)數(shù)[lg(Rededge)]、紅邊波段的倒數(shù)1/Rededge、近紅外波段對(duì)數(shù)的倒數(shù)[1/lg(NIR)]、(Green-Rededge)等與土壤全氮含量的相關(guān)性達(dá)到顯著水平(Plt;0.05)(表5)??紤]到顯著性水平和模型簡(jiǎn)潔性的雙重標(biāo)準(zhǔn),本研究選擇lg(1/Rededge)、1/Rededge、Green×NIR、Green×Rededge、(Rededge+Green)、(Green-Rededge)等6種具有較高相關(guān)性的光譜變換形式波段作為模型的輸入變量。
2.4" 土壤全氮含量反演模型
本研究對(duì)采樣點(diǎn)采集的土壤全氮含量數(shù)據(jù)(圖6)進(jìn)行訓(xùn)練預(yù)測(cè),將樣本以7 ∶3的比例分為訓(xùn)練集和測(cè)試集。設(shè)置VMD的參數(shù):懲罰參數(shù)α=2 000;初始模態(tài)中心頻率ω=0;收斂因子為10-7,直流分量DC=0,中心頻率參數(shù)init=1,數(shù)據(jù)經(jīng)過(guò)分解后得到本征模態(tài)分量和殘差(圖7)。
本研究搭建LSSVM、VMD-LSSVM、VMD-SSA-LSSVM這3種模型進(jìn)行預(yù)測(cè)結(jié)果對(duì)比(圖8),其中LSSVM模型經(jīng)過(guò)SSA優(yōu)化的γ、σ分別為10、4.21。由圖8中的預(yù)測(cè)情況可知,本研究使用的VMD-SSA-LSSVM模型對(duì)預(yù)測(cè)集的驗(yàn)證效果比較準(zhǔn)確,能較好地與真實(shí)值曲線相擬合,未優(yōu)化的2種算法也能滿足較好的預(yù)測(cè)。
由表6可知,本研究使用算法的RMSE相較于另外2種算法分別降低了0.041 5、0.024 9。綜合分析表明,除了最小二乘支持向量機(jī)(LSSVM)模型外, 其他所有模型的決定系數(shù)(r2)均超過(guò)了0.6,說(shuō)
明這些模型在一定程度上均能有效揭示冬小麥農(nóng)田多光譜與實(shí)地測(cè)量全氮含量之間的相關(guān)性,其中VMD-SSA-LSSVM模型的精度最高。
除了對(duì)試驗(yàn)區(qū)的訓(xùn)練集和測(cè)試集進(jìn)行模型驗(yàn)證外,我們還選取了小麥另外3個(gè)時(shí)期(拔節(jié)期、灌漿期、孕穗期)各19組數(shù)據(jù),對(duì)精度最好的VMD-SSA-LSSVM模型作進(jìn)一步驗(yàn)證。結(jié)果(圖9)表明,孕穗期的驗(yàn)證精度最高,穩(wěn)定性也最好,3個(gè)時(shí)期r2均≥0.431,整體表現(xiàn)出適度的預(yù)測(cè)能力,盡管并非完美擬合,但該模型仍具有一定的解釋力,可作為進(jìn)一步研究和分析的基礎(chǔ)[23]。
3" 討論
作物全氮含量的快速檢測(cè)對(duì)于變量施肥和產(chǎn)量管理具有重要的現(xiàn)實(shí)意義。本研究選取6種波段變化形式波段和一個(gè)紅邊波段,作為構(gòu)建模型的輸入變量集合,采用了3種不同的回歸方式來(lái)得出冬小麥土壤全氮含量的反演模型。通過(guò)評(píng)估和比較這些回歸方法的效果,確定了最優(yōu)模型,以便利用無(wú)人機(jī)多光譜遙感技術(shù)進(jìn)行土壤全氮含量的定量反演。目前,前人對(duì)土壤氮素的定量反演大多集中于對(duì)裸土的直接反演[24],本研究針對(duì)在具有作物覆蓋影響的條件下,利用作物冠層光譜數(shù)據(jù)估算土壤的全氮含量,確定的敏感波段為紅邊波段。本研究發(fā)現(xiàn)紅邊波段與土壤全氮含量也具有一定的相關(guān)性;但與單波段相比,波段組合具有更好的相關(guān)系數(shù)。
本研究取得了良好的土壤全氮含量反演效果。但是由于獲取光譜圖像的過(guò)程中,不可避免會(huì)產(chǎn)生土壤背景的影響,造成獲取的光譜特征包含部分土壤表面的反射率,不能完全保證獲取的反射率全為作物的反射率。所以下一步可以考慮對(duì)圖像進(jìn)行重采樣,并對(duì)圖像進(jìn)行分割,默認(rèn)農(nóng)田圖像主要有植株和土壤兩部分組成,可以采用Ostu、植被指數(shù)來(lái)對(duì)圖像進(jìn)行閾值分割[25],剔除部分土壤背景的影響。此外,本研究的土壤氮素反演模型局限于本試驗(yàn)地農(nóng)田,對(duì)全國(guó)尺度乃至世界的統(tǒng)一氮素定量反演模型仍待研究。另一方面,除去植被指數(shù),其他的組合波段為自定義人為經(jīng)驗(yàn)組合,具有一定的參考意義,但不具備廣泛適用性。
4" 結(jié)論
在本研究中,通過(guò)分析5個(gè)多光譜波段以及6種數(shù)學(xué)變換后的小麥冠層多光譜波段與地面測(cè)量的冬小麥土壤全氮含量之間的相關(guān)性,確定紅邊波段為對(duì)土壤全氮含量敏感的波段。敏感數(shù)學(xué)變換形式下的組合波段分別為lg(1/Rededge)、1/Rededge、Green×NIR、Green×Rededge、(Rededge+Green)、(Green-Rededge)。利用所選敏感波段和敏感組合波段,建立冬小麥土壤全氮含
量的LSSVM、VMD-LSSVM、VMD-SSA-LSSVM模型,并進(jìn)行驗(yàn)證。結(jié)果表明,基于VMD-SSA-LSSVM的反演模型精度最高,其r2、RMSE分別為0.893 3、0.031 3,并對(duì)各時(shí)期的氮素?cái)?shù)據(jù)作進(jìn)一步預(yù)測(cè),得出孕穗期的驗(yàn)證模型精度最高,穩(wěn)定性也最好,整體3個(gè)時(shí)期r2、RMSE分別為0.518、0.278,模型表現(xiàn)出適度的預(yù)測(cè)水平,表明VMD-SSA-LSSVM的土壤全氮含量反演模型的有效性,可以為土壤氮素含量的快速檢測(cè)和田間管理提供理論支持。
參考文獻(xiàn):
[1]Santoso A M,Phoon K K,Quek S T. Effects of soil spatial variability on rainfall-induced landslides[J]. Computers amp; Structures,2011,89(11/12):893-900.
[2]李鑫星,曹閃閃,白雪冰,等. 多光譜技術(shù)在土壤成分含量檢測(cè)中的研究進(jìn)展[J]. 光譜學(xué)與光譜分析,2020,40(7):2042-2047.
[3]雷浩川,劉尊方,于曉晶,等. 基于Landsat 5影像的青海省大通縣土壤表層全氮空間格局反演[J]. 青海大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,39(6):79-86.
[4]祁亞琴,張顯鋒,張立福,等. 基于高光譜數(shù)據(jù)的農(nóng)田土壤養(yǎng)分含量估測(cè)模型研究[J]. 新疆農(nóng)業(yè)科學(xué),2018,55(3):490-495.
[5]楊棟淏,李亞強(qiáng),刀" 劍,等. 基于無(wú)人機(jī)多光譜與地面高光譜遙感的土壤主要養(yǎng)分含量估測(cè)[J]. 江蘇農(nóng)業(yè)科學(xué),2022,50(2):178-186.
[6]王" 璐,藺啟忠,賈" 東,等. 多光譜數(shù)據(jù)定量反演土壤營(yíng)養(yǎng)元素含量可行性分析[J]. 環(huán)境科學(xué),2007,28(8):1822-1828.
[7]王世東,石樸杰,張合兵,等. 基于高光譜的礦區(qū)復(fù)墾農(nóng)田土壤全氮含量反演[J]. 生態(tài)學(xué)雜志,2019,38(1):294-301.
[8]張" 強(qiáng),張國(guó)龍,張" 澤,等. 基于高光譜的土壤全氮含量估測(cè)[J]. 山西農(nóng)業(yè)科學(xué),2016,44(7):972-976.
[9]袁石林,馬天云,宋韜等. 土壤中總氮與總磷含量的近紅外光譜實(shí)時(shí)檢測(cè)方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2009,40(增刊1):150-153.
[10]Xu Y M,Smith S E,Grunwald S,et al. Effects of image pansharpening on soil total nitrogen prediction models in South India[J]. Geoderma,2018,320:52-66.
[11]Alvarez-Mendoza C I,Teodoro A,Quintana J,et al. Estimation of nitrogen in the soil of Balsa trees in Ecuador using unmanned aerial vehicles[C]//IGARSS 2020-2020 IEEE International Geoscience and Remote Sensing Symposium.Waikoloa,HI,USA.IEEE,2020:4610-4613.
[12]Orlando S,Minacapilli M,Sarno M,et al. A low-cost multispectral imaging system for the characterisation of soil and small vegetation properties using visible and near-infrared reflectance[J]. Computers and Electronics in Agriculture,2022,202:107359.
[13]中華人民共和國(guó)環(huán)境保護(hù)部. 土壤質(zhì)量" 全氮的測(cè)定" 凱氏法:HJ 717—2014[S]. 北京:中國(guó)環(huán)境科學(xué)出版社,2015.
[14]Han X,Wei Z,Chen H,et al. Inversion of winter wheat growth parameters and yield under different water treatments based on UAV multispectral remote sensing[J]. Frontiers in Plant Science,2021,12:609876.
[15]韓婷婷,習(xí)曉環(huán),王" 成,等. 基于TM數(shù)據(jù)的西雙版納地區(qū)森林葉面積指數(shù)反演[J]. 遙感信息,2014,29(2):28-32.
[16]Lee H,Wang J F,Leblon B. Using linear regression,random forests,and support vector machine with unmanned aerial vehicle multispectral images to predict canopy nitrogen weight in corn[J]. Remote Sensing,2020,12(13):2071.
[17]Dragomiretskiy K,Zosso D. Variational mode decomposition[J]. IEEE Transactions on Signal Processing,2014,62(3):531-544.
[18]王維高,魏云冰,滕旭東. 基于VMD-SSA-LSSVM的短期風(fēng)電預(yù)測(cè)[J]. 太陽(yáng)能學(xué)報(bào),2023,44(3):204-211.
[19]Xue J K,Shen B. A novel swarm intelligence optimization approach:sparrow search algorithm[J]. Systems Science amp; Control Engineering,2020,8(1):22-34.
[20]楊" 鄧,楊俊杰,胡晨陽(yáng),等. 基于改進(jìn)LSSVM的短期電力負(fù)荷預(yù)測(cè)[J]. 電子測(cè)量技術(shù),2021,44(18):47-53.
[21]張曉鵬,張興忠. 基于高斯核函數(shù)的支持向量機(jī)光伏故障診斷研究[J]. 可再生能源,2021,39(6):760-765.
[22]芮婷婷,徐云飛,程" 琦,等. 基于無(wú)人機(jī)多光譜遙感的冬小麥葉片含水量反演[J]. 麥類作物學(xué)報(bào),2022,42(10):1291-1300.
[23]臺(tái)" 翔. 被覆蓋條件下的無(wú)人機(jī)多光譜遙感土壤含鹽量監(jiān)測(cè)模型[D]. 楊凌:西北農(nóng)林科技大學(xué),2022.
[24]徐" 藝,邵光成,丁鳴鳴,等. 基于嶺回歸的土壤全氮含量反演模型[J]. 排灌機(jī)械工程學(xué)報(bào),2022,40(11):1159-1166.
[25]葉" 春. 基于數(shù)字圖像的水稻氮素營(yíng)養(yǎng)監(jiān)測(cè)方法研究[D]. 南昌:南昌大學(xué),2022.