張全旺,郭 輝
(安徽理工大學(xué)空間信息與測(cè)繪工程學(xué)院,安徽 淮南 232001)
隨著地下煤炭開采工作的向前推進(jìn),煤層采空區(qū)面積持續(xù)擴(kuò)大,破壞了原有覆巖的應(yīng)力平衡,導(dǎo)致地表下沉和拉張裂隙的產(chǎn)生[1]。拉張裂隙對(duì)土壤的水分和養(yǎng)分循環(huán)產(chǎn)生一定影響,對(duì)原有的土壤結(jié)構(gòu)造成破壞。大面積的地表沉陷與拉張裂隙導(dǎo)致礦區(qū)耕地土壤養(yǎng)分發(fā)生空間變異,造成土壤質(zhì)量降低進(jìn)而影響糧食產(chǎn)量。目前,針對(duì)拉張裂隙影響土壤營養(yǎng)成分的研究主要集中在以氮、磷、鉀、有機(jī)質(zhì)為代表的養(yǎng)分特性。文獻(xiàn)[2]發(fā)現(xiàn)土壤有機(jī)質(zhì)質(zhì)量分?jǐn)?shù)的下降程度隨著拉張裂隙寬度的增大和水平距離的減小而增大。文獻(xiàn)[3]認(rèn)為拉張裂隙導(dǎo)致土壤水分與氮的流失,與拉張裂隙距離越近,土壤含水量和有效氮質(zhì)量分?jǐn)?shù)越低。為進(jìn)一步了解土壤有機(jī)質(zhì)含量分布,國內(nèi)外學(xué)者也探索了多種模型反演土壤有機(jī)質(zhì)[4-13],但對(duì)采煤拉張裂隙區(qū)土壤營養(yǎng)成分進(jìn)行監(jiān)測(cè)的相關(guān)研究還較少。精確恢復(fù)裂隙區(qū)土壤質(zhì)量及改善農(nóng)業(yè)產(chǎn)量的迫切需求,使探究裂隙區(qū)土壤營養(yǎng)成分的空間分布特征成為熱點(diǎn)。
本文首先分析裂隙區(qū)有機(jī)質(zhì)含量的空間分布特征,然后探討研究區(qū)不同深度土壤有機(jī)質(zhì)含量的反演工作,以期試驗(yàn)結(jié)果為后續(xù)高光譜遙感反演提供理論支撐,為采煤拉張裂隙區(qū)土壤有機(jī)質(zhì)含量監(jiān)測(cè)提供技術(shù)支持。
研究區(qū)位于安徽省淮北市朱莊煤礦3522工作面地表沉陷區(qū)(如圖1所示),受采煤活動(dòng)影響,在沉陷區(qū)平行于3522工作面風(fēng)巷形成了部分拉張裂隙。研究區(qū)年平均降水量為823.4 mm,年最大降水量為1 441.4 mm。土壤類型主要是半水成土綱的潮土與砂姜黑土。
圖1 研究區(qū)位置
以朱莊煤礦3522工作面沉陷區(qū)的C1裂隙為研究對(duì)象,采樣時(shí)間為2019年。以C1裂隙南北兩端等間距50 cm設(shè)置采樣點(diǎn),使用土鉆分層方式采集土壤樣本,裂隙以北每點(diǎn)采樣深度為1 m,每層土壤間隔10 cm,裂隙以南每點(diǎn)采樣深度為1 m,每層間隔20 cm,布設(shè)圖如圖1所示,總計(jì)采集土壤樣本90個(gè)。所有土樣帶回實(shí)驗(yàn)室攤平并自然風(fēng)干,直至土壤樣本質(zhì)量大小無明顯變化。清除枯枝等雜物后,將所獲土壤樣本單獨(dú)充分研磨,篩選的土壤顆粒大小為20目。 有機(jī)質(zhì)含量測(cè)定在安徽理工大學(xué)實(shí)驗(yàn)室進(jìn)行,采用重鉻酸鉀外加熱法測(cè)定有機(jī)質(zhì)含量。
采集土壤光譜反射率使用美國ASD公司FieldSpec4地物光譜儀,波段范圍為350~2500 nm,采樣間隔為1 nm。選用50 W的鹵素?zé)魹楣庠?光源天頂角為45°,距樣本表面30 cm。將光纖探頭置于土樣垂直正上方5 cm處,采集 20 條光譜曲線,利用ASDviewSpecpro軟件進(jìn)行預(yù)處理,剔除異常曲線,取平均值作為樣本最終光譜反射率。
1.3.1 光譜變換
光譜數(shù)據(jù)采集過程中受隨機(jī)誤差的影響,原始光譜反射率難以直接顯示特征波段的特征點(diǎn)。因此微分變換是常見的光譜數(shù)據(jù)處理方法,它能在某種程度上消除、削弱光譜數(shù)據(jù)中的噪聲,放大光譜信息,改善多重共線性[14]。本文對(duì)土壤原始光譜分別進(jìn)行了一系列光譜變換。一階微分變換(FD)能去除部分線性噪聲,增強(qiáng)局部位置的光譜響應(yīng)差[15];二階微分變換(SD)能消除基線漂移和一些儀器背景的影響[15];倒數(shù)和對(duì)數(shù)變換(LR)是常用的處理方法,可以增強(qiáng)相似光譜間差異,減少光照條件、地形、環(huán)境變化等因素的影響,增強(qiáng)可見光區(qū)域的光譜差異[16]。
1.3.2 建模方法
使用偏最小二乘回歸、BP神經(jīng)網(wǎng)絡(luò)對(duì)朱莊礦裂隙區(qū)土壤有機(jī)質(zhì)含量進(jìn)行建模估算。偏最小二乘回歸是對(duì)多元線性回歸建模的一種改進(jìn),解決了自變量之間多重相關(guān)的問題,可以實(shí)現(xiàn)多對(duì)多的建模[16]。偏最小二乘回歸模型可包含更多的光譜信息,從而具有較高的反演精度[17]。經(jīng)光譜變換后,根據(jù)相關(guān)系數(shù)大小、圖中波峰和波谷篩選特征波段,選取原始光譜及其變換光譜的反射率值為反演模型的自變量,有機(jī)質(zhì)含量為因變量,所測(cè)樣本按2∶1隨機(jī)選擇建模集和預(yù)測(cè)集,估測(cè)土壤有機(jī)質(zhì)含量。實(shí)際參與試驗(yàn)樣本88組,其中建模集65組,驗(yàn)證集23組,在Unscrambler10.3軟件中使用PLSR模塊構(gòu)建PLSR模型。BP神經(jīng)網(wǎng)絡(luò)算法流程等同于非線性映射,算法結(jié)果實(shí)現(xiàn)了一個(gè)多層反饋模型用于學(xué)習(xí)有用知識(shí),對(duì)算法進(jìn)行訓(xùn)練,熟悉訓(xùn)練集的模式后,按照已經(jīng)學(xué)習(xí)得出的模式對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),同時(shí)為了提高模型精度適時(shí)調(diào)整算法參數(shù)[18]。BP模型的建立同樣使用原始光譜反射率及其變換光譜作為反演模型的自變量,有機(jī)質(zhì)含量作為因變量,在Matlab 2016a軟件中神經(jīng)網(wǎng)絡(luò)工具箱模塊生成相關(guān)模型。
1.3.3 建模精度評(píng)價(jià)
采用決定系數(shù)R2、均方根系數(shù)RMSE對(duì)模型的精度及預(yù)測(cè)能力進(jìn)行評(píng)價(jià)。R2越接近1,表明模型的預(yù)測(cè)值與實(shí)測(cè)值越接近;RMSE越小,預(yù)測(cè)效果越好。具體公式如下
(1)
(2)
本文有機(jī)質(zhì)含量變異系數(shù)大于0.1,屬于中等變異性。變異系數(shù)越大,越利于模型構(gòu)建。根據(jù)裂隙區(qū)不同深度有機(jī)質(zhì)含量的統(tǒng)計(jì)結(jié)果(如圖2(a)所示),0~50 cm土壤有機(jī)質(zhì)含量的平均值、最大值及最小值總體呈逐層遞減趨勢(shì),50~100 cm土層處有機(jī)質(zhì)含量保持不變;根據(jù)裂隙區(qū)不同點(diǎn)位有機(jī)質(zhì)含量的統(tǒng)計(jì)結(jié)果(如圖2(b)所示),C1S—C6S是在拉張裂隙南側(cè)布設(shè)的采樣點(diǎn),C1N—C6N是在裂隙北側(cè)布設(shè)的6個(gè)采樣點(diǎn)。由圖2可知,C1N—C6N各點(diǎn)有機(jī)質(zhì)含量平均值逐漸減少,C6S—C1S點(diǎn)有機(jī)質(zhì)含量平均值逐漸增加。
圖2 不同深度和不同點(diǎn)位土壤有機(jī)質(zhì)含量分布
為提取原始光譜中不易發(fā)現(xiàn)的光譜信息,對(duì)原始光譜曲線進(jìn)行一階微分變換(FD)、二階微分變換(SD)、倒數(shù)和對(duì)數(shù)變換(LR)。根據(jù)相關(guān)系數(shù)大小與特征峰谷選取特征波段。經(jīng)過LR變換后,有機(jī)質(zhì)與光譜數(shù)據(jù)之間的相關(guān)系數(shù)從負(fù)相關(guān)轉(zhuǎn)變?yōu)檎嚓P(guān),特征波段變化不大;原始光譜經(jīng)過FD和SD處理后,吸收谷和反射峰密集,即微分處理能增大光譜響應(yīng)差異。
分析土壤有機(jī)質(zhì)含量與4種光譜數(shù)據(jù)之間的相關(guān)關(guān)系。圖3(a)為原始光譜反射率與有機(jī)質(zhì)含量相關(guān)系數(shù)圖,圖3(b)—(d)分別為FD、SD、 LR變換后的相關(guān)系數(shù)圖。由圖3(a)可知,土壤原始反射率光譜與有機(jī)質(zhì)呈負(fù)相關(guān),在350~1750 nm波段均表現(xiàn)出較好的相關(guān)性,在529 nm處達(dá)到相關(guān)系數(shù)的最大值,篩選出波段529、1366、1504、1734 nm。經(jīng)FD變換后,在350~2500 nm波段能夠找到較多特征點(diǎn),如在350~1750波段發(fā)現(xiàn)更多拐點(diǎn),399、503、1399、1893、2065、2196 nm的光譜波段十分顯著。原始光譜經(jīng)SD變換后,在350~1350 nm段相關(guān)系數(shù)的大小變化不大,1390、1407、1906 nm波段達(dá)到極值點(diǎn)。經(jīng)LR變換后,與原始光譜與有機(jī)質(zhì)的相關(guān)系數(shù)變化趨勢(shì)基本一致,在極值點(diǎn)529 nm處達(dá)到極大值后便不斷下降,據(jù)曲線走勢(shì)的特征點(diǎn)和相關(guān)系數(shù)大小篩選出535、1072、1303、1502、1702、2109 nm等波段。將所篩選的特征波段作為建立模型的反射波段,見表1。
表1 波段篩選
圖3 有機(jī)質(zhì)與原始光譜及其變換光譜的相關(guān)系數(shù)
反演模型的精度統(tǒng)計(jì)見表2。分析可知,經(jīng)光譜微分變換后,與原始光譜和最小二乘模型(R-PLSR)相比,一階微分模型(FD-PLSR)反演精度有所提高;二階微分模型(SD-PLSR)和倒數(shù)對(duì)數(shù)模型(LR-PLSR)略低于原始光譜模型,但驗(yàn)證精度基本接近。比較建模結(jié)果,FD-PLSR模型相比于其他3種PLSR模型,估算效果較優(yōu)。FD-PLSR模型建模集的R2比R-PLSR模型高0.12,比SD-PLSR模型高0.21,比LR-PLSR模型高0.21。所建PLSR模型驗(yàn)證集的R2基本接近,可能受限樣本數(shù)量限制,整體PLSR模型的驗(yàn)證集精度約為0.75,反演結(jié)果較理想。此外,FD-PLSR模型的RMSE皆小于其他PLSR模型。
表2 反演模型精度統(tǒng)計(jì)
BP神經(jīng)網(wǎng)絡(luò)模型的模擬精度與PLSR模型略有所不同。二階微分與神經(jīng)網(wǎng)絡(luò)模型(SD-BP)明顯優(yōu)于其他組合。其中,建模集的R2比原始光譜模型(R-BP)高0.04,比一階微分模型(FD-BP)高0.08,比倒數(shù)對(duì)數(shù)模型(LR-BP)高0.02。R-BP模型與SD-BP模型驗(yàn)證集的R2基本接近,比FD-BP模型高0.09,比R-BP模型高0.1。SD-BP模型的RMSE皆小于其他BP模型。
基于65份建模集的土壤有機(jī)質(zhì)含量值與篩選后的特征波段建立PLSR反演模型。4種數(shù)據(jù)擬合精度排序?yàn)?FD>R>SD>LR,二階微分和倒數(shù)對(duì)數(shù)模型略低原始光譜,但與原始光譜建模后估測(cè)效果基本接近。預(yù)測(cè)效果最佳為一階微分變換(R2=0.845 9,RMSE=0.680 6)。BP模型的土壤有機(jī)質(zhì)模擬精度相對(duì)較高,但其整體精度略低于PLSR模型。基于BP神經(jīng)網(wǎng)絡(luò)方法,SD變換預(yù)測(cè)效果更好(R2=0.811 1,RMSE=0.813 7)。可見FD-PLSR模型組合更適用于研究區(qū)反演工作。
圖4、圖5分別為PLSR、BP模型驗(yàn)證集的實(shí)測(cè)值-預(yù)測(cè)值散點(diǎn)圖。比較所有預(yù)測(cè)模型,FD-PLSR模型效果最為理想。反演公式為
圖4 土壤有機(jī)質(zhì)PLSR模型驗(yàn)證集的實(shí)測(cè)值-預(yù)測(cè)值散點(diǎn)圖
圖5 土壤有機(jī)質(zhì)BP模型驗(yàn)證集的實(shí)測(cè)值-預(yù)測(cè)值散點(diǎn)圖
Y=-1 607.56X399+447.618X503+6 844.013X1399-
1 281.47X1893+2 146.371X2065+
5 337.024X2196+9.07
(3)
本文建模過程中同時(shí)分析了不同采樣深度處和不同采樣點(diǎn)位處土樣的有機(jī)質(zhì)含量變化情況,拉張裂隙的形成影響了土壤有機(jī)質(zhì)含量的空間分布。沿研究區(qū)拉張裂隙水平方向兩側(cè),拉張裂隙近端至遠(yuǎn)端(C1N—C6N和C1S—C6S)有機(jī)質(zhì)含量呈減小趨勢(shì),在裂隙近端有機(jī)質(zhì)含量較高;沿拉張裂隙垂直方向0~50 cm土壤有機(jī)質(zhì)含量逐層遞減,50~100 cm土壤有機(jī)質(zhì)含量趨于不變。
基于光譜變換、偏最小二乘、BP神經(jīng)網(wǎng)絡(luò)構(gòu)建了拉張裂隙區(qū)土壤有機(jī)質(zhì)高光譜反演模型。FD-PLSR模型在所建PLSR模型中精度最高,而SD-BP模型在BP模型精度最高。其中,FD-PLSR模型建模集和驗(yàn)證集的R2分別為0.876 1、0.845 9,RMSE分別為0.497 2、0.680 6。SD-BP模型建模集和驗(yàn)證集的R2分別為0.784 2、0.811 1,RMSE分別為0.695 5、0.813 7。BP模型預(yù)測(cè)效果較好,但FD-PLSR模型更適合該研究區(qū)的反演工作。
拉張裂隙對(duì)研究區(qū)的有機(jī)質(zhì)空間分布造成了一定影響,裂隙沿裂垂直方向不同土壤深度處(0~50 cm)土壤有機(jī)質(zhì)含量的平均值表現(xiàn)為逐層遞減,50~100 cm土層有機(jī)質(zhì)含量趨于不變。C1N—C6N各點(diǎn)有機(jī)質(zhì)含量平均值逐漸減少,C6S—C1S點(diǎn)有機(jī)質(zhì)含量平均值逐漸增加。研究區(qū)所在的C1裂隙處于坡地,具有一定坡度(2°~3°),地勢(shì)北高南低,拉張裂隙橫腰中斷坡地。經(jīng)重力沉降和雨水沖刷,在裂隙南面(即地勢(shì)較低處)形成一定程度的有機(jī)質(zhì)含量聚集,即C1S—C6S有機(jī)質(zhì)含量逐漸增加;受拉張裂隙影響,在裂隙北部近端形成一定程度的聚集,即C1N—C6N有機(jī)質(zhì)含量逐漸減少。
建立PLSR反演模型,發(fā)現(xiàn)4種模型擬合精度排序?yàn)?FD-PLSR>R-PLSR>SD-PLSR>LR-PLSR,SD-PLSR模型和LR-PLSR模型略低于R-PLSR模型,但估測(cè)效果基本接近。該研究內(nèi)容與前人相比略有出入,但整體反演較理想。BP模型的土壤有機(jī)質(zhì)模擬精度相對(duì)較高,整體精度略低于PLSR模型,對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)一步改進(jìn)、優(yōu)化算法[19]可能效果更好。神經(jīng)網(wǎng)絡(luò)結(jié)合高階微分變換的反演效果是否更佳,后續(xù)研究工作會(huì)繼續(xù)展開探討。本文與前人土壤反演研究相比,主要是針對(duì)采煤拉張裂隙區(qū)土壤有機(jī)質(zhì)的反演與監(jiān)測(cè)工作,而不是基于某一塌陷區(qū)域[20]或某一區(qū)域土地反演[21]。比較建模精度,FD-PLSR模型效果最為理想。