王啟元,趙艷玲,房鑠東,楊熙,周虎,劉金鳳
1.中國礦業(yè)大學(xué)(北京) 土地復(fù)墾與生態(tài)重建研究所,北京 100083;2.山東省臨沂市城鄉(xiāng)建設(shè)服務(wù)中心,山東臨沂 276000
土壤含水量作為重要的土壤理化性質(zhì)之一,對土壤中的物質(zhì)和能量的運(yùn)移以及地表植被生長中水、肥、氣、熱等狀況都有著直接的影響[1]。我國東部草原礦區(qū)深居內(nèi)陸,礦區(qū)排土場地表荒蕪,植被稀疏,生態(tài)環(huán)境極其脆弱,干旱缺水是造成該現(xiàn)象的主要原因。因此,土壤水分遙感監(jiān)測對于礦區(qū)排土場的土地整治、生態(tài)恢復(fù)有著至關(guān)重要的意義[2]。
土壤含水量的傳統(tǒng)監(jiān)測方法主要有烘干法、電阻法、重量法和中子水分儀法等,空間范圍上均為點(diǎn)測量,一般都需要在實(shí)驗(yàn)室進(jìn)行測定,雖然精度高但范圍有限、工作量大、效率低,難以滿足現(xiàn)代大范圍、快速監(jiān)測土壤含水量的實(shí)際需求[3-4]。近年來,隨著遙感技術(shù)的迅速發(fā)展,利用遙感器獲取植被以及土壤的光譜反射特性,實(shí)現(xiàn)大范圍、高精度的土壤含水量的動(dòng)態(tài)、快速監(jiān)測已成為可能[5-8],彌補(bǔ)了傳統(tǒng)監(jiān)測方法的不足,也是熱點(diǎn)研究領(lǐng)域。
目前國內(nèi)外對于土壤水分的遙感監(jiān)測研究,在植被生長區(qū)域主要集中于地表表層土壤含水量的反演,常用的監(jiān)測方法有熱慣量法[9]、作物缺水指數(shù)法[10]、微波遙感法[11]、溫度植被干旱指數(shù)法[12-13]等;在無植被覆蓋區(qū)域多集中在使用地物光譜儀等非成像遙感手段進(jìn)行裸土土壤含水量反演的探索[14]。應(yīng)用低空光譜成像儀對裸土土壤水分的反演研究相對不多,已有研究中主要為基于經(jīng)驗(yàn)的統(tǒng)計(jì)模型法,包括偏最小二乘法等回歸模型和反向傳播(BP)神經(jīng)網(wǎng)絡(luò)。例如,張智韜等[15]利用6個(gè)多光譜波段的土壤光譜反射率結(jié)合多種回歸方法,對兩種深度的土壤樣本建立了土壤含水量反演模型,其結(jié)果顯示最佳方法為逐步回歸法,最佳監(jiān)測深度為表層1 cm;Sorensen等[16]通過近紅外波段處的土壤光譜反射特性,利用BP神經(jīng)網(wǎng)絡(luò)強(qiáng)大的自主學(xué)習(xí)能力及其在處理非線性情況方面的優(yōu)越性,對土壤含水量進(jìn)行了反演,結(jié)果顯示該模型的反演精度優(yōu)于其他模型。
土壤含水量反演的精度取決于反演因子與反演模型的選擇。為得到更優(yōu)的反演效果,除使用偏最小二乘回歸和嶺回歸法兩種反演模型外,本文重點(diǎn)探究不同波段組合作為反演因子的BP神經(jīng)網(wǎng)絡(luò)模型反演4種不同深度土層的土壤含水量,以期找到裸土土壤含水量的最佳反演模型與最佳反演深度,為礦區(qū)排土場的土壤水分遙感監(jiān)測提供最優(yōu)方法。
本次試驗(yàn)土壤來自內(nèi)蒙古自治區(qū)錫林浩特市勝利一號露天礦北排土場,土場土壤質(zhì)地多為砂質(zhì)土,土壤較緊實(shí),疏松性差,持水能力較弱。表土層均勻采樣后,用密封塑料袋帶回實(shí)驗(yàn)室進(jìn)行測試,采樣深度為0~30 cm。測得土壤干容重為1.51 g/cm3,土壤平均孔隙率為35.80%,土壤含水量均值為4.04%。為使得試驗(yàn)樣品水分含量精確配置,對采樣土壤先曬干、碾磨、混合,再經(jīng)過2 mm的篩網(wǎng)過濾制得試驗(yàn)土樣?;旌暇鶆蚝髮⒃嚇油寥婪謩e裝入4個(gè)高120 cm、直徑25 cm的透明圓柱,每個(gè)圓柱頂部預(yù)留約10 cm空余,分別在試驗(yàn)土柱距表層土1 cm、3 cm、5 cm、10 cm土層深度處埋設(shè)水分傳感器。每次試驗(yàn)當(dāng)天早晨8點(diǎn)注水1 000 ml,室內(nèi)放置,待試驗(yàn)時(shí)使得水分均勻下滲。
試驗(yàn)測量土壤含水量所用儀器為美國DECAGON公司的ECH2O土壤水分測量儀,該傳感器是一種電介質(zhì)型傳感器,將探頭埋在4根土柱的固定位置,通過測量傳感器上電容的變化來確定所在土壤的體積含水量。本次試驗(yàn)土壤水分真實(shí)值采樣間隔設(shè)置為10 min。
土壤光譜反射率獲得所用儀器為Spequoia多光譜相機(jī),相機(jī)詳細(xì)技術(shù)參數(shù)見表1。拍攝時(shí)將相機(jī)固定在土柱正上方高約1 m處,每張正射影像包含4種不同波長的土壤反射光譜:550 nm(綠)、660 nm(紅)、735 nm(紅邊)、790 nm(近紅外)。根據(jù)土壤水分下滲的實(shí)際情況,拍攝時(shí)間間隔由短到長,剛開始每10 min拍攝一次,當(dāng)水分下滲速率較慢后改為每30 min拍攝一次,每次試驗(yàn)前用標(biāo)準(zhǔn)白板進(jìn)行標(biāo)定。此次試驗(yàn)周期共4 d,每天10:00—14:00對土柱樣本進(jìn)行監(jiān)測。試驗(yàn)現(xiàn)場如圖2所示。3月27日至30日每天拍攝一根土柱,對應(yīng)圖1(a)(b)(c)(d)。
表1 Spequoia多光譜相機(jī)基本參數(shù)Tab.1 Basic parameters of Spequoia multispectral cameras
圖1 多光譜相機(jī)拍攝土柱試驗(yàn)現(xiàn)場示意圖Fig.1 Schematic of multispectral camera shooting test site
通過ECH2O土壤水分傳感器的數(shù)據(jù)收集裝置將監(jiān)測的土壤含水量數(shù)據(jù)輸出至計(jì)算機(jī)中,土壤水分傳感器設(shè)置的采樣間隔為10 min,對照多光譜相機(jī)拍攝時(shí)間,找到對應(yīng)時(shí)刻的土壤含水量監(jiān)測值。
多光譜相機(jī)每次拍攝產(chǎn)生4張TIF格式灰度影像,對應(yīng)4個(gè)波段。由于土柱上部有約10 cm空余,相機(jī)在其正上方1 m處拍攝,邊緣處會有陰影,再加上土壤光譜采集過程中不可避免受到當(dāng)時(shí)試驗(yàn)環(huán)境、光線、儀器本身等客觀因素影響,所以需要構(gòu)建合適的感興趣區(qū)(ROI),以ROI范圍內(nèi)的平均光譜反射率作為樣本該時(shí)刻的土壤光譜反射率,并根據(jù)標(biāo)準(zhǔn)白板的光譜將拍攝得到的各張影像灰度值校正為反射率值。最后,使用MATLAB R2017a軟件對影像進(jìn)行批量處理,處理過程包括ROI的選取、影像裁剪、反射率校正等。
多元回歸分析方法是處理多變量相依關(guān)系的常用統(tǒng)計(jì)方法之一,廣泛應(yīng)用于數(shù)理統(tǒng)計(jì)領(lǐng)域。但在實(shí)際應(yīng)用中,當(dāng)回歸方程建立后,由于各自變量間存在相關(guān)性,使得參數(shù)估計(jì)的方差增加,致使回歸方程變得不穩(wěn)定;或者某些自變量對因變量影響的顯著性被隱藏,回歸系數(shù)的符號與實(shí)際意義不相符等[17-18]。所以將各個(gè)波段土壤光譜反射率與土壤含水量進(jìn)行多元回歸分析之前,需要先對各個(gè)波段進(jìn)行共線性診斷。共線性診斷采用方差膨脹因子[19]來評估4個(gè)波段之間的線性關(guān)系的強(qiáng)弱。
方差膨脹因子(Variance Inflation Factor,VIF),是指解釋變量之間存在多重共線性時(shí)的方差與不存在多重共線性時(shí)的方差之比。VIF越大,顯示共線性越嚴(yán)重。
本文采用均勻變異的方式來完成變異操作。均勻變異是一種特殊的基本位變異,用于實(shí)數(shù)編碼。因?yàn)樗试S搜索點(diǎn)在整個(gè)搜索空間上變換,所以能夠豐富種群的多樣性,避免陷入局部最優(yōu)。其余操作均按第2、3節(jié)提出的改進(jìn)方法進(jìn)行。
式中,Ri為自變量對其余自變量作回歸分析的負(fù)相關(guān)系數(shù)。
一般建議,當(dāng)VIF > 10時(shí),表明模型中存在較強(qiáng)的共線性問題。
由于各個(gè)土壤反射波段之間很可能存在共線性問題,而常用的最小二乘回歸法難以解決變量間的多重共線問題,所以本文采用具有較好魯棒性的偏最小二乘回歸法和嶺回歸法[19-20]。
2.2.1 偏最小二乘回歸法
偏最小二乘(PLS)回歸是一種統(tǒng)計(jì)學(xué)方法。當(dāng)多個(gè)因變量間以及多個(gè)自變量間存在嚴(yán)重的多重相關(guān)時(shí),PLS是構(gòu)造預(yù)測模型的一種有效方法。偏最小二乘回歸法首先在自變量集中提取第一潛因子t1(t1為x1,x2,…,xn的線性組合,且盡可能多地提取原自變量集中的變異信息,比如第一主成分),在因變量集中也提取第一潛因子u1,并要求t1與u1相關(guān)程度達(dá)最大,然后建立因變量Y與t1的回歸;如果回歸方程已達(dá)到滿意的精度,則算法終止,否則繼續(xù)第二輪潛在因子的提取,直到能達(dá)到滿意的精度為止;若最終對自變量集提取n個(gè)潛因子(t1,t2,…,tn),偏最小二乘回歸將通過建立Y與t1,t2,…,tn的回歸式,然后再表示為Y與原自變量的回歸方程式。
2.2.2 嶺回歸法
嶺回歸是一種專用于共線性數(shù)據(jù)分析的有偏估計(jì)回歸方法,實(shí)質(zhì)上是一種改良的最小二乘估計(jì)法,即通過放棄最小二乘法的無偏性,以損失部分信息、降低精度為代價(jià)獲得回歸系數(shù)更為符合實(shí)際、更可靠的回歸方法。當(dāng)自變量存在多重共線關(guān)系時(shí),均方誤差將變得很大,而減少均方誤差的方法就是用嶺回歸估計(jì)替代最小二乘估計(jì)。
設(shè)k≥0,則稱
為β的嶺回歸估計(jì),其中k稱為嶺參數(shù)。
反向傳播(BP)是“誤差反向傳播”的簡稱,是一種與最優(yōu)化方法(如梯度下降法)結(jié)合使用的、用來訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)的常見方法[21-22]?;綛P算法包括信號的正向傳播和誤差的反向傳播兩個(gè)過程。正向傳播時(shí),輸入信號通過隱含層作用于輸出節(jié)點(diǎn),經(jīng)過非線性變換產(chǎn)生輸出信號,若實(shí)際輸出與期望輸出不相符,則轉(zhuǎn)入誤差的反向傳播過程。誤差反向傳播是將輸出誤差通過隱含層向輸入層逐層反傳,并將誤差分?jǐn)偨o各層所有單元,以從各層獲得的誤差信號作為調(diào)整各單元權(quán)值的依據(jù)。通過調(diào)整輸入節(jié)點(diǎn)與隱層節(jié)點(diǎn)的聯(lián)接強(qiáng)度和隱層節(jié)點(diǎn)與輸出節(jié)點(diǎn)的聯(lián)接強(qiáng)度以及閾值,使誤差沿梯度方向下降,經(jīng)過反復(fù)學(xué)習(xí)訓(xùn)練,確定與最小誤差相對應(yīng)的網(wǎng)絡(luò)參數(shù)(權(quán)值和閾值),訓(xùn)練即告停止。此時(shí)經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)即能對類似樣本的輸入信息,自行處理輸出誤差最小的經(jīng)過非線性轉(zhuǎn)換的信息。
在利用BP神經(jīng)網(wǎng)絡(luò)反演土壤含水量時(shí),為了得到最佳反演模型,以多光譜相機(jī)的綠(550 nm)、紅邊(735 nm)、近紅外(790 nm)三個(gè)波段單獨(dú)或組合作為輸入因子,來反演土壤含水量。
本文通過土壤含水量實(shí)測值與反演值計(jì)算各回歸模型和BP模型的決定系數(shù)(R2)和均方根誤差(RMSE),評價(jià)各個(gè)模型的反演效果。其中,RMSE計(jì)算公式如下:
應(yīng)用統(tǒng)計(jì)分析軟件SPSS 20.0對4種深度的試驗(yàn)土柱的光譜反射率數(shù)據(jù)進(jìn)行方差膨脹因子分析,結(jié)果見表2。
表2 試驗(yàn)土柱光譜反射率方差膨脹因子VIF統(tǒng)計(jì)
在共線性診斷中,通常當(dāng)自變量的VIF大于10時(shí),可以認(rèn)為該變量與其他自變量之間存在較強(qiáng)的共線性問題[18]。由表2可見,只有3 cm和5 cm深度的紅光波段VIF小于10 ,其余各深度各波段的VIF均遠(yuǎn)大于10。這說明4個(gè)波段間確實(shí)存在較為嚴(yán)重的共線性問題,所以在使用回歸模型時(shí)必須考慮這一點(diǎn)。為最大程度消除自變量間共線性帶來的影響,根據(jù)前人研究[5],本文構(gòu)建的多元回歸反演模型選用偏最小二乘回歸法與嶺回歸法,同時(shí)重點(diǎn)研究反向傳播神經(jīng)網(wǎng)絡(luò)反演模型。
使用MATLAB R2017a軟件對ECH2O土壤水分傳感器在3月27至30日所采集的4種不同深度的土壤含水量數(shù)據(jù),分別應(yīng)用偏最小二乘回歸法和嶺回歸法建立回歸模型。樣本數(shù)據(jù)中2/3用來建模,1/3留作模型的精度驗(yàn)證。2種回歸模型、相關(guān)系數(shù)見表3。
表3 各波段反射率的2種回歸分析模型Tab.3 Two regression analysis models of reflectance of all bands
根據(jù)表3可得出,兩種回歸模型反演4種深度的土壤含水量時(shí)表現(xiàn)出一定的規(guī)律性和差異。在規(guī)律性方面,兩種模型的R2隨著反演深度的變化呈現(xiàn)一致性,均為1 cm深度模型最高,而后隨深度增加遞減,至10 cm深度最??;在差異方面,根據(jù)共線性診斷結(jié)果,在嶺回歸法模型中未加入紅光波段反射率值,而該模型R2整體優(yōu)于偏最小二乘回歸法。
本文設(shè)計(jì)了5種反演土壤含水量的BP模型,分別由綠光(GREEN-BP)波段、紅邊(REG-BP)波段、近紅外(NIR-BP)波段、紅邊-近紅外(REG- NIR-BP)波段組合、綠-紅邊-近紅外(GREEN-REG-NIR-BP)波段組合共計(jì)5種形式作為輸入因子,ECH2O土壤水分傳感器監(jiān)測到的土壤含水量作為輸出因子,模型空間拓?fù)浣Y(jié)構(gòu)分別為1-3-1(輸入層為1,隱含層為3,輸出層為1)、2-3-1(輸入層為2,隱含層為3,輸出層為1)、3-3-1(輸入層為3,隱含層為3,輸出層為1)。網(wǎng)絡(luò)訓(xùn)練迭代次數(shù)設(shè)置為500,學(xué)習(xí)速率為0.03,學(xué)習(xí)誤差設(shè)定為0.001。使用仿真軟件MATLAB R2017a編寫程序,將各波段反射率數(shù)據(jù)和土壤含水量監(jiān)測數(shù)據(jù)導(dǎo)入訓(xùn)練網(wǎng)絡(luò)模型,結(jié)果如圖3所示。由于紅光波段在此次BP神經(jīng)網(wǎng)絡(luò)反演中精度過低,故未考慮與展示。
從圖2可以看到,4種不同深度(1 cm、 3 cm、5 cm、10 cm)下5種BP模型的反演結(jié)果差異較大。其中,GREEN-REG-NIR-BP模型反演效果最好;GREEN-BP模型反演效果最差,且隨深度的增加反演效果越差,其在3 cm深度下R2最高,也僅達(dá)到0.473。綜合來看,應(yīng)用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建的土壤含水量反演模型,多波段組合作為輸入因子的BP模型反演效果優(yōu)于單一輸入因子BP模型,且對于5 cm、10 cm深度土壤含水量的反演表現(xiàn)優(yōu)異。
使用驗(yàn)證樣本對各反演模型中進(jìn)行精度評價(jià)。結(jié)果見表4。
由表4可以看出,偏最小二乘回歸與嶺回歸2種回歸模型對于各深度土壤含水量的反演精度均不高,回歸模型R2最高的是1 cm深度下的嶺回歸法,僅為0.606。而基于BP神經(jīng)網(wǎng)絡(luò)的土壤含水量模型反演效果優(yōu)越,其中GREEN-REG-NIR-BP模型對5 cm深度土壤含水量反演效果最好,模型R2達(dá)到0.975,RMSE為0.103。
(1) 通過對4個(gè)波段的土壤光譜反射率進(jìn)行共線性診斷,其方差膨脹因子大部分都在10以上,表明各波段間有較強(qiáng)的共線性。因此,選擇可以消除共線性影響的偏最小二乘回歸法、嶺回歸法和BP神經(jīng)網(wǎng)絡(luò)模型對土壤含水量進(jìn)行反演。
(2) 回歸模型中,嶺回歸法的擬合精度和反演精度均高于偏最小二乘回歸法。嶺回歸法反演1 cm深度土壤含水量的精度最高,但R2僅有0.606。相比之下,BP神經(jīng)網(wǎng)絡(luò)各深度對于土壤含水量的反演精度都優(yōu)于嶺回歸模型,在實(shí)際應(yīng)用中可優(yōu)先采用BP神經(jīng)網(wǎng)絡(luò)在反演土壤含水量。
(3) 根據(jù)5種BP模型對4種深度的土壤含水量進(jìn)行反演的結(jié)果,G-R-N-BP模型最優(yōu),對各深度土壤含水量反演精度均為最高。土壤含水量反演最佳深度為5 cm,模型R2達(dá)到0.975,RMSE為0.103。綜合來看,G-R-N-BP模型反演精度高,可用性強(qiáng),能夠?yàn)榈V區(qū)地表水分監(jiān)測提供較好的支持。