郭晗, 張序, 陸洲, 田婷, 徐飛飛, 羅明, 吳正貴, 孫振軍
(1.蘇州科技大學環(huán)境科學與工程學院,江蘇 蘇州 215009;2.中國科學院地理科學與資源研究所,北京 100101;3.蘇州市農(nóng)業(yè)科學院,江蘇 蘇州 215000;4.蘇州市農(nóng)業(yè)技術(shù)推廣中心,江蘇 蘇州 215006;5.蘇州市農(nóng)業(yè)信息中心,江蘇 蘇州 215128)
土壤有機質(zhì)含量是評價土壤肥力的重要指標[1],其高效監(jiān)測是土地資源有效管理利用、種植業(yè)精細化運營必要條件和必然趨勢。傳統(tǒng)土壤有機質(zhì)監(jiān)測以室內(nèi)測定為主,操作繁瑣、耗時費力。航空、航天遙感以其高效、環(huán)保等特點在土壤有機質(zhì)監(jiān)測中應用日趨廣泛,但其影像獲取周期長,覆蓋不完全等缺點制約了其在田間應用。相較之下,機載高光譜操作簡便、環(huán)境友好、實時性強的優(yōu)勢逐漸凸顯[2-3],將其用于田間土壤有機質(zhì)監(jiān)測,必將促進現(xiàn)代化農(nóng)業(yè)的進步,推動精準農(nóng)業(yè)的快速發(fā)展。
21世紀以來,無人機(unmanned aerial vehicle,UAV)遙感技術(shù)快速發(fā)展,并應用于田間高分辨率土壤調(diào)查與制圖[4]。國內(nèi)外學者利用無人機遙感高光譜數(shù)據(jù)對土壤有機質(zhì)開展了眾多研究。Peon 等[5]利用機載高光譜掃描儀(airborne hyperspectral scanner,AHS)獲得山區(qū)植被覆蓋區(qū)數(shù)據(jù)源,建立了土壤有機質(zhì)多元回歸預測模型并取得了良好的效果。Xu等[6]利用Vis-NIR光譜結(jié)合SVR(support vector regression)對水稻土有機質(zhì)含量進行監(jiān)測,發(fā)現(xiàn)SVR對水稻土有機質(zhì)檢測具有很大的潛力,建立的土壤有機質(zhì)預測模型精度R2達到0.88。秦凱[7]基于重建的機載高光譜數(shù)據(jù)研究土壤有機質(zhì)的反演模型,開展了巖石礦物和土壤有機質(zhì)的信息提取算法研究。文錫梅等[8]利用機載高光譜成像系統(tǒng)獲取喀斯特地區(qū)土壤光譜數(shù)據(jù),為喀斯特地區(qū)快速、大范圍、實時地監(jiān)測土壤有機質(zhì)含量提供了更多的技術(shù)手段。張東輝等[9]通過CASI-1500航空高光譜成像系統(tǒng)(加拿大ITRES)獲取黑龍江建三江地區(qū)有機質(zhì)高光譜數(shù)據(jù),顯著提升了土壤信息反演的信息化水平。
土壤有機質(zhì)光譜會受到土壤粒徑、土壤類型、土壤pH等自身因素的影響而表現(xiàn)出不同形式,對于不同土壤類型,有機質(zhì)監(jiān)測模型有較大差別,普適性差。因此,針對特定土壤類型,減弱或去除植被、水分等土壤背景對機載高光譜的影響,研究具有針對性、高精度的土壤有機質(zhì)監(jiān)測模型是目前研究重點。南方地區(qū)以生產(chǎn)稻米聞名全國,為促進農(nóng)業(yè)可持續(xù)發(fā)展和資源永續(xù)利用,積極開展輪作休耕工作[10]。為評價南方水稻土輪作休耕效果,高效監(jiān)測土壤有機質(zhì)含量,本文對研究區(qū)的高光譜數(shù)據(jù)(波段范圍396~997 nm,波段個數(shù)176個)進行多種光譜變換,并利用多元回歸(multiple linear regression,MLS)、偏最小二乘(partial least squares,PLSR)、反向傳播神經(jīng)網(wǎng)絡(back propagation neural network, BPNN)、支持向量機(support vector machine,SVM)多種方法構(gòu)建108種基于不同光譜變換的模型,以此探討適應南方水稻土有機質(zhì)估算的最優(yōu)光譜變換和建模方法組合,為南方水稻土有機質(zhì)大范圍高效監(jiān)測、土壤質(zhì)量評價,提供技術(shù)參考。
選取蘇州市震澤鎮(zhèn)休耕水稻田(120°30′56.31″E~120°31′11.30″E,30°56′48.53″N~30°57′2.07″N)作為研究區(qū),位于亞熱帶濕潤季風氣候區(qū),平均年降水量在800~1 500 mm,氣候溫暖濕潤[11],適宜水稻生長。土壤多為粉砂質(zhì)粘壤,顆粒細小,孔隙度高[12],有利于降水入滲而底土層粘壤和粉砂粘壤對入滲降水有攔截作用,保水保肥性好,是水稻種植的理想土質(zhì)。
1.2.1高光譜數(shù)據(jù)獲取 機載高光譜數(shù)據(jù)通過DJ Mpro 600無人機搭載GaiaSky-Mini2-VN航空高光譜成像系統(tǒng)獲取(高光譜成像系統(tǒng)參數(shù)見表1)。為降低外界環(huán)境對土壤光譜的干擾,選擇天氣晴朗、風級小的1月25日于12:30~13:30對研究區(qū)進行數(shù)據(jù)采集。采集當日設置60個航點,共飛行2個架次,旁向覆蓋率70%,飛行高度300 m。空間分辨率0.073 m,光譜分辨率最高可達3.2 nm。獲得的高光譜數(shù)據(jù)利用SpecView先后進行了鏡頭校正,反射率校準,大氣校正,并通過HiSpectralStitcher完成60景影像的拼接。
1.2.2土壤有機質(zhì)數(shù)據(jù)獲取 采用漁網(wǎng)布點法[13]在研究區(qū)布設59個采樣點,實際采樣時剔除非裸土的采樣點后,共計45個采樣點(圖1)。去除秸稈和土壤表層,通過梅花采樣法采集5個點位0~10 cm表層土壤,混合作為一個土樣,每個土樣采集1 kg,避光保存。
采集的土樣經(jīng)過凍干、研磨、過篩等預處理后,用鹽酸消解無機碳,通過Multi NC3100TOC分析儀(德國耶拿)測定有機碳,測定結(jié)果乘以土壤有機質(zhì)轉(zhuǎn)換系數(shù)(1.724)得到土壤有機質(zhì)含量。相較于傳統(tǒng)的重鉻酸鉀容量法,該方法大大的減少了人為誤差,縮短了測定時間,提高了測定效率[14]。
1.3.1建模集檢驗集劃分 利用SPSS.22將研究區(qū)的45個樣本總集隨機劃分成32個建模集和13個檢驗集(圖1)。從圖1可以看出,建模集和檢驗集在研究區(qū)空間分布上較為均勻。
圖1 建模點與檢驗點分布
1.3.2一維、二維特征光譜提取 利用Excel和Origin.2018對45個采樣點176個波段的原始反射率進行去除包絡線(continuum removal,CR)、倒數(shù)(inverse,IR)、對數(shù)(logarithmic,LR)、一階微分(first-order differential,F(xiàn)DR)、二階微分(second-order differential single transformation,SDR)、倒數(shù)一階微分(inverse first-order differential,IFDR)、對數(shù)一階微分(logarithmic first-order differential,LFDR)、倒數(shù)對數(shù)(reciprocal logarithmic,ILR)8種變換,得到一維光譜。利用SPSS.22對一維光譜與有機質(zhì)進行相關(guān)性分析。
利用Matlab.7將所有波段的一維光譜兩兩組合,并對組合后光譜計算土壤比值指數(shù)(RSI)和土壤歸一化指數(shù)(NDSI),得到土壤有機質(zhì)的二維光譜。
RSI(λ1,λ2)=λ1/λ2
(1)
NDSI(λ1,λ2)=(λ1-λ2)/(λ1+λ2)
(2)
式中,λ1、λ2為任意兩個波段組合,λ1≠λ2。
二維光譜與有機質(zhì)之間的相關(guān)性系數(shù)計算,通過Matlab.7中的Corrcoef[15]函數(shù)中實現(xiàn)。
一維、二維特征光譜的篩選均在Excel中完成。為減少一維、二維建模之間的非必要差異因素,增加建模效果的可比性,結(jié)果的說服性,對一維和二維建模輸入變量個數(shù)進行統(tǒng)一(表2)。對原始和8種變換后的一維、二維光譜依次篩選出10個有機質(zhì)響應敏感的波段用于多元線性回歸模型(MLR)的建立。同時篩選出與全波段一維光譜個數(shù)相同的二維特征光譜作為偏最小二乘(PLSR)、反向傳播神經(jīng)網(wǎng)絡(BPNN)和支持向量機(SVM)建模方法的輸入變量。
表2 模型輸入變量個數(shù)
1.3.3模型建立與檢驗 本文建立了土壤有機質(zhì)高光譜預測的多元回歸(MLR)、偏最小二乘(PLSR)線性模型和反向傳播神經(jīng)網(wǎng)絡(BPNN)、支持向量機(SVM)非線性模型。
MLR模型的建立利用SPSS.22完成,設置95%作為誤差表征級別選入和剔除變量[16],依次構(gòu)建基于原始反射率及其8種數(shù)學變換的一維、二維特征光譜模型。土壤有機質(zhì)PLSR、BPNN、SVM預測模型的建立分別以全波段一維光譜、二維特征光譜作為輸入變量,通過調(diào)節(jié)建模參數(shù)達到理想的建模效果。建模精度和檢驗精度均通過決定系數(shù)(R2)和均方根誤差(RMSE)進行評價。
(1)
(2)
有機質(zhì)測定結(jié)果(表3)表明:總集、建模集、檢驗集均值在2%以上,都達到了國家三級土壤肥力標準[17],研究區(qū)的土壤有機質(zhì)含量較高,可以掩蓋土壤中鐵或者錳對土壤光譜的響應[18]??偧?、建模集、檢驗集變異系數(shù)均大于2.4%,避免了因土壤樣本有機質(zhì)含量變異系數(shù)過小造成的光譜反射率估算土壤有機質(zhì)含量精度偏低現(xiàn)象[19]。建模集、檢驗集劃分較合理,可用于土壤有機質(zhì)含量估算研究。
表3 研究區(qū)采樣點有機質(zhì)特征統(tǒng)計
2.2.1一維特征光譜 原始反射率(RAW)及8種光譜變換與有機質(zhì)之間的相關(guān)性分析見表4。LFDR及IFDR變換后光譜和有機質(zhì)之間相關(guān)性較好,最敏感波段處相關(guān)性均大于0.5,其中IFDR與有機質(zhì)之間相關(guān)性最高達到了0.561,較RAW特征光譜與有機質(zhì)之間的最優(yōu)相關(guān)性提高了0.16;經(jīng)過FDR、SDR、IFDR、LFDR變換后的反射率與有機質(zhì)之間的相關(guān)性變異系數(shù)均有較大的提高,可見微分變換能有效分解波段間的重疊峰,擴大樣品之間的光譜特征差異,提高光譜靈敏度,這與喬娟峰等[16]研究結(jié)論一致。
表4 一維光譜與有機質(zhì)之間相關(guān)性
一維特征光譜在全波段分布見圖2。410~440 nm處是特征光譜集中區(qū)域,共有46個特征波段,超過其他波段處特征光譜總和。結(jié)合采樣點在不同波段處的原始平均反射率(圖3)發(fā)現(xiàn),410~440 nm處存在一個反射率低谷,即土壤有機質(zhì)在此波段存在強吸收,其是有機質(zhì)響應的敏感波段。其他波段范圍內(nèi)雖然一維特征光譜分布較少,但仍然存在,為充分挖掘光譜信息,凸顯不同光譜之間差異,尋找隱含特征光譜,需對原始和變換后的一維光譜分別進行比值(RSI)和歸一化(NDSI)處理。
圖2 一維特征光譜在全波段分布
圖3 采樣點反射率均值曲線
2.2.2二維特征光譜 從圖4可以看出,二維特征光譜(RSI、NDSI)與有機質(zhì)之間的相關(guān)性較一維特征光譜均有較大程度提高,二維光譜在挖掘隱含光譜信息,反映土壤有機質(zhì)適應機制上優(yōu)于一維光譜[20-21]。LFDR變換對應的RSI、NDSI二維光譜與有機質(zhì)之間的相關(guān)性分別達到0.616、0.584,相較于其他光譜變換,LFDR變換對應的二維(RSI、NDSI)特征光譜與有機質(zhì)之間的相關(guān)性較好,表現(xiàn)最為穩(wěn)定。說明LFDR變換充分保留和結(jié)合了FDR變換和LR變換的優(yōu)勢,能有效解決光譜重疊問題,突出特征波段光譜信息,與周倩倩等[22]研究結(jié)果一致。RSI和NDSI二維特征光譜與有機質(zhì)之間的相關(guān)性差異不大,除SDR變換對應的二維特征光譜外,RSI二維特征光譜與有機質(zhì)之間的相關(guān)性略大于NDSI二維特征光譜。NDSI固有的運算法則會生成值為0的光譜指數(shù),從而導致部分特征光譜的遺失,此外NDSI處理對光譜背景有消除作用,但同時也會放大其他細微光譜信息,對有機質(zhì)光譜信息產(chǎn)生覆蓋、干擾。因此,RSI光譜變換能保留更完整的光譜信息,和有機質(zhì)之間的相關(guān)性分析更完全。
圖4 不同變換方法的最大相關(guān)系數(shù)
從圖5可以看出,RSI和NDSI篩選出的二維特征光譜所處波段位置基本相同,它們特征波段密集區(qū)均位于500~550 nm 組合處和900 nm組合處。采樣點的原始平均反射率曲線(圖3)在500~550 nm 及900 nm處的反射谷難以直觀看到,這是由于土壤背景及其他物質(zhì)的光譜信息對有機質(zhì)光譜信息產(chǎn)生干擾造成的。一維光譜變換很難篩選出被其它物質(zhì)光譜信息影響的有機質(zhì)響應敏感波段,而二維光譜(RSI、NDSI)可以去除冗余信息,有效放大有機質(zhì)與光譜之間的微弱關(guān)聯(lián),強化有機質(zhì)與光譜之間相互作用關(guān)系,快速提取有機質(zhì)響應敏感波段[23]。
圖5 全波段中RSI、NDSI二維特征光譜分布
2.3.1不同輸入變量的建模結(jié)果分析 基于上述原始反射率及8種變換的一維和二維(RSI、NDSI)特征光譜提取結(jié)果分別建立了MLR、PLSR、BPNN、SVM 4種模型(圖6~8),共計108個,其中BPNN在一維、二維(RSI、NDSI)光譜建模中都取得較高的建模精度和檢驗精度,整體建模效果較好。SDR光譜變換對應的NDSI二維光譜模型檢驗精度低,建模效果較差,遠不如SDR光譜變換對應的NDSI二維光譜建模效果,這與二維特征光譜提取結(jié)果一致,即SDR光譜變換對應的NDSI二維光譜與有機質(zhì)之間相關(guān)性小于RSI二維光譜。相較一維光譜,線性模型(MLR、PLSR)建模精度和檢驗精度在二維光譜中有較大程度提升,其中基于RSI二維光譜建立的線性模型(MLR、PLSR)效果最好。直接原因是RSI二維特征光譜與有機質(zhì)之間的相關(guān)性大于NDSI二維特征光譜與有機質(zhì)之間的相關(guān)性,可見特征光譜與有機質(zhì)之間的相關(guān)性程度與建模效果聯(lián)系緊密,恰當?shù)墓庾V變換是建立優(yōu)質(zhì)模型的基礎(chǔ)。除LFDR變換外,不同光譜變換的SVM模型建模精度和檢驗精度在一維和二維光譜中差異較大,穩(wěn)定性較差。說明原始反射率經(jīng)過LR和FDR組合變換后能準確定位有機質(zhì)響應的特征波段,提高有機質(zhì)與光譜之間擬合度,LFDR是建立SVM土壤有機質(zhì)預測模型的最佳光譜變量。二維光譜建模精度和檢驗精度整體高于一維光譜。比值(RSI)二維光譜建模效果優(yōu)于歸一化(NDSI)二維光譜建模效果,建立模型具有較好的穩(wěn)健性?;诓煌兞康慕PЧ筛叩降鸵来问牵篟SI二維光譜、NDSI二維光譜、一維光譜。
圖6 基于一維光譜的MLR、PLSR、BPNN、SVM建模效果
2.3.2建模質(zhì)量評價分析 為定量評價不同方法的建模質(zhì)量,本文定義檢驗精度誤差(模型檢驗精度與建模精度差值的絕對值)作為衡量指標(表5)。相較一維光譜,基于二維光譜建立的MLR、PLSR、BPNN模型,檢驗精度與建模精度之間的誤差有所減小,其中MLR模型檢驗精度與建模精度之間的誤差減小顯著,達到0.25。這是由于MLR建模輸入變量較少,且一維特征光譜信息單一,遺漏部分隱含特征光譜,忽略特征光譜之間的內(nèi)在聯(lián)系造成的。二維光譜建立的模型在適用性和穩(wěn)定性[24]上均優(yōu)于一維光譜建立的模型。
圖7 基于RSI二維光譜的MLR、PLSR、BPNN、SVM建模效果
圖8 基于NDSI二維光譜的MLR、PLSR、BPNN、SVM建模效果
表5 一維、二維光譜建模的檢驗精度誤差
2.3.3不同方法建模結(jié)果分析 線性模型(MLR、PLSR)建模精度及檢驗精度整體低于非線性模型(BPNN、SVM),其中,BPNN建立的模型對土壤有機質(zhì)和高光譜的整體擬合效果佳。SVM建立的有機質(zhì)預測模型精度較好,但檢驗精度較低,模型擬合度不如BPNN。綜合建模精度和檢驗精度,土壤有機質(zhì)含量估算模型由好到差依次是BPNN、SVM、PLSR、MLR,對應最適光譜輸入變量依次是RSIRAW、RSILFDR、RSIIR、NDSIIFDR?;赗SIRAW建立的BPNN模型建模精度為0.952,檢驗精度為0.889,擬合效果最好(表6),此時建模參數(shù):神經(jīng)元個數(shù)為5,網(wǎng)絡訓練次數(shù)為5 000,訓練目標為0.01,學習速率0.01。
表6 不同模型最優(yōu)建模型精度
本文選取蘇州市吳中區(qū)休耕水稻田(圖9)作為測試區(qū)域,機載高光譜影像數(shù)據(jù)于天氣晴朗的2019年3月4日采集(技術(shù)參數(shù)見1.2.1),同時采集8個土樣測定其有機質(zhì)含量(實驗操作同1.2.2),用于研究結(jié)果的驗證。
通過Envi5.3的Bandmath功能實現(xiàn)模型在田塊的應用,對土壤有機質(zhì)的估算結(jié)果見圖9。去除非田塊區(qū)域,從圖9中可估算該田塊的有機質(zhì)含量范圍是18.521~29.514 g·kg-1,其中大部分區(qū)域有機質(zhì)含量超過20 g·kg-1,有機質(zhì)含量較為豐富。實測點有機質(zhì)含量與估算結(jié)果見圖10,驗證精度(R2)為0.813,模型估算效果良好,檢驗均方根誤差(RMSE)為0.764,模型穩(wěn)定性較好,相對分析誤差(RPD)為1.983,模型較為可靠,本研究結(jié)果在南方水稻土有機質(zhì)監(jiān)測上具有可行性和借鑒性。
圖9 測試區(qū)域及測試結(jié)果
圖10 實測值對估算值驗證
本文針對外部環(huán)境對土壤有機質(zhì)光譜產(chǎn)生干擾這一問題,研究估算消除土壤背景影響的土壤有機質(zhì)含量,結(jié)果表明,LFDR變換后的光譜能有效擴大特征光譜與冗余信息之間的差異,顯著突出有機質(zhì)響應光譜信息,可作為光譜變換的首選方法;同時本文基于一維、二維光譜分別建立了MLR、PLSR、BPNN、SVM模型,其中非線性模型(BPNN、SVM)在建模精度和檢驗精度上均高于線性模型(MLR、PLSR),這與張小鳴等[25]研究結(jié)果一致,也印證了土壤有機質(zhì)含量預測由簡單線性模型向復雜非線性模型發(fā)展的趨勢[26];此外,發(fā)現(xiàn)不同建模方法的最適輸入變量分別為MLR-NDSI、PLSR-RSI、BPNN-NDSI、SVM-RS,這對土壤有機質(zhì)含量估算工作中的建模方法和輸入變量的選擇具有一定的借鑒意義;最后在非研究區(qū)地塊對研究結(jié)果進行有機質(zhì)含量估算測試,估算精度達到了 0.812 8,模型預測效果較好,可用于南方土壤有機質(zhì)高效監(jiān)測,對農(nóng)業(yè)耕種、施肥有重要指導作用。但由于研究出發(fā)點的限制,本研究結(jié)果具有一定局限性,難以在其他地域、其他類型土壤上推廣應用。當前針對不同地域不同類型土壤進行消除外部因素影響的研究日漸成熟,但環(huán)境因素復雜多變,研究成果普適性差、難以推廣。
在土壤有機質(zhì)一維、二維特征光譜提取中發(fā)現(xiàn),410~440 nm是土壤有機質(zhì)響應敏感的一維波段集中區(qū),500~550 及900 nm是土壤有機質(zhì)響應敏感的二維波段集中區(qū)。這與侯艷軍等[27]、Gunsaulis等[28]研究結(jié)果有所差別,但均位于可見光和近紅外波段處。這是因為土壤有機質(zhì)反射率會受到土壤類型、光譜獲取方式、植被數(shù)量、土壤水分等因素影響而增強或減弱,但反射率在可見和近紅外波段處的整體趨勢基本一致[29]??梢?,土壤有機質(zhì)響應高光譜存在固有反應機制,要解決土壤有機質(zhì)高光譜估算模型適用性差的問題,探討土壤有機質(zhì)內(nèi)部組分或官能團對光譜響應機理研究是關(guān)鍵。
有學者指出[20,23],土壤有機質(zhì)對光譜在可見光區(qū)域的響應主要是由有機質(zhì)中胡敏酸引起的,在近紅外波段處的響應是由O-H、C-H、N-H等官能團引起的,但此類結(jié)論只停留在經(jīng)驗推論上,缺少可靠、精確的實驗支撐和理論支持,而有機質(zhì)內(nèi)部組分對光譜響應的具體機制也尚無定論。因此,研究土壤有機質(zhì)內(nèi)部組分與光譜響應機制將成為未來重要發(fā)展方向,這也將促進高光譜在其他物質(zhì)測定領(lǐng)域的快速發(fā)展。