豐秋林,鄭南山,2
(1. 中國礦業(yè)大學(xué)環(huán)境與測繪學(xué)院,江蘇 徐州 221116; 2. 江蘇省資源環(huán)境信息工程重點(diǎn)實驗室,江蘇 徐州 221116)
土壤濕度在研究生態(tài)水循環(huán)、植被水分供給、土地承載能力等方面發(fā)揮著至關(guān)重要的作用,實時、準(zhǔn)確、長期的土壤濕度信息將會為氣候、水文、農(nóng)業(yè)等科學(xué)研究及災(zāi)害防治提供重要的數(shù)據(jù)來源[1]。烘干稱重法、土壤濕度計法、電阻法等傳統(tǒng)的土壤濕度測量方法雖然很準(zhǔn)確,但遠(yuǎn)遠(yuǎn)達(dá)不到工程應(yīng)用的需求[2]。微波遙感及傳統(tǒng)的雙基地GNSS-R(Global Navigation Satellite System Reflection)技術(shù)是大范圍、非接觸式監(jiān)測土壤水分的重要手段,但還是存在需要特定的設(shè)備、價格昂貴及時空分辨率受限等一系列問題[3-5]。因此利用全球?qū)Ш叫l(wèi)星反射信號的干涉效應(yīng)(Global Navigation Satellite System interferometric reflectometry,GNSS-IR)成為一種探測土壤濕度的新技術(shù)[6]。
目前國內(nèi)外在利用此技術(shù)進(jìn)行土壤濕度測量方面作了大量基礎(chǔ)的研究和試驗。Bilich等通過利用SNR(signal-to-noise ratio)幅頻特性建立相關(guān)模型,并提取時變和動態(tài)多路徑信號的頻率和幅度的參數(shù),分析后發(fā)現(xiàn)剔除直射分量后的SNR幅頻特性與多路徑誤差存在一定的關(guān)系,同時確定了SNR幅頻特性與多路徑環(huán)境之間存在很強(qiáng)的相關(guān)性[7-8]。西班牙Starlab利用IPT(interference pattern technique)技術(shù)設(shè)計了SMIGOL反射計,該反射計利用垂直極化天線同時接收直射與反射信號,通過GNSS反射信號與直射信號產(chǎn)生的干涉效應(yīng)進(jìn)行土壤濕度測量[9]??屏_拉多大學(xué)Larson等證實了在衛(wèi)星高度角較低的情況下,普通測地型接收機(jī)同樣可以接收并跟蹤GPS衛(wèi)星反射信號,并利用觀測文件中的SNR數(shù)據(jù)進(jìn)行土壤濕度反演研究,試驗結(jié)果表明,幅度參數(shù)與土壤濕度之間存在相似性,但延遲相位參數(shù)與土壤濕度之間的相關(guān)性較幅度參數(shù)更高[10-12]。在國內(nèi),敖敏思等通過仿真和實測土壤濕度與GPS觀測值數(shù)據(jù)展開對比試驗,結(jié)果表明SNR多徑延遲相位與土壤濕度之間的存在較好的指數(shù)關(guān)系[13]。
但是目前對于利用GNSS反射信號的干涉進(jìn)行土壤濕度探測的研究,還是一直沒有建立準(zhǔn)確的解析模型,大多只是驗證了干涉信號的物理參數(shù)(相位、振幅、頻率等)與土壤濕度有很強(qiáng)的相關(guān)性。大多數(shù)的試驗成果依舊停留在土壤濕度趨勢的反演和監(jiān)測,除了少數(shù)利用線性公式進(jìn)行大致的土壤濕度監(jiān)測以外,沒有具體的土壤濕度的反演公式和模型。以此本文提出將GNSS的干涉信號和土壤濕度之間看成一個非線性的回歸問題。利用干涉信號物理參數(shù)如相位、振幅、頻率等作為輸入項,將地表粗糙度和植被覆蓋的影響看成噪聲,利用回歸方法得到土壤濕度。目前較好的回歸方法主要為BP神經(jīng)網(wǎng)絡(luò)算法和支持向量回歸機(jī),本文利用這兩種方法分別進(jìn)行土壤濕度反演,同時與線性模型進(jìn)行對比分析,選擇一種較優(yōu)的模型,旨在探索一種適用于定量估測地表土壤濕度的方法。
GNSS接收機(jī)每個歷元下不僅會記錄導(dǎo)航電文、偽距與載波相位觀測值,還會記錄GNSS信號的強(qiáng)度,即信噪比觀測值(SNR,signal-to-noise ratio)。由于多路徑效應(yīng)的影響,在通常情況下,測地型GPS接收機(jī)接收到的信號都是直射信號和反射信號的疊加信號,如圖1所示。具體的直射信號、反射信號及其兩者之間的相位差與SNR觀測值之間的關(guān)系表示為
(1)
式中,ψ為反射信號與直射信號的相位差,隨著衛(wèi)星高度角的變化而變化;Ad為直射信號分量;Am為反射信號分量。對于普通的GNSS接收機(jī)而言,直射信號占主要成分,因此Ad和Am在數(shù)值上會相差很大,可以采用低階多項式來進(jìn)行擬合,進(jìn)而提取去除直射信號后的殘余SNR值,即反射信號分量。對于去除直射信號后剩余的反射信號分量SNR與sinθ之間可以用某一固定頻率的余弦函數(shù)來進(jìn)行擬合,即
(2)
式中,θ為衛(wèi)星高度角;λ為GPS信號波長;h為接收機(jī)天線高度;Am為反射信號多徑干涉相對幅度;φ為反射信號相對相位延遲。
圖1 GPS反射信號示意圖
經(jīng)過上述擬合后,可以求出反射信號的干涉物理量Am和φ。它們的大小主要由接收機(jī)的增益水平和信號反射系數(shù)決定,而反射系數(shù)與天線周圍環(huán)境密切相關(guān)。因此在天線增益水平不變的情況下,可以通過SNR參量的變化建立土壤濕度與反射信號之間的關(guān)系。
本文正是利用反射信號分量的振幅和相位等特征參數(shù)與土壤濕度有很強(qiáng)的相關(guān)性,將利用SNR觀測值反演土壤濕度看成一個非線性的回歸問題,利用BP神經(jīng)網(wǎng)絡(luò)算法和支持向量回歸機(jī)兩種回歸方法,建立GNSS土壤濕度反演模型。同時,通過與線性回歸統(tǒng)計模型對比和實測數(shù)據(jù),探究其可行性。
BP(back propagation)神經(jīng)網(wǎng)絡(luò)模型是由Rumelhart和McCelland為首的科學(xué)家小組于1986年提出的一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò)模型,它是把一組樣本的輸入與輸出問題轉(zhuǎn)化為一個非線性優(yōu)化問題,并通過負(fù)梯度下降算法,利用迭代運(yùn)算求解權(quán)值問題的一種學(xué)習(xí)方法[14]。BP算法主要由正向傳播和誤差反向傳播組成,文獻(xiàn)[15]中詳細(xì)介紹了BP神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)和流程,這里不再詳細(xì)闡述。
根據(jù)上文的分析,SNR觀測值反射信號分量的振幅和相位等特征參數(shù)與土壤濕度有很強(qiáng)的相關(guān)性,因此將SNR觀測值反射信號分量的振幅Am和相位φ作為輸入項,而實際土壤濕度則作為期望輸出值。本文使用Matlab進(jìn)行BP神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建,BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練的基本參數(shù)設(shè)置為:最大迭代次數(shù)為50 000次,學(xué)習(xí)率為0.01,訓(xùn)練目標(biāo)誤差為0.000 1,輸出層神經(jīng)元個數(shù)為1,隱含層和輸出層激活函數(shù)都設(shè)置為tansig。由于隱藏層神經(jīng)元的個數(shù)對處理結(jié)果有影響,因此將隱含層神經(jīng)元個數(shù)范圍設(shè)置為7~13,逐步尋找最合適的神經(jīng)元個數(shù)。選擇最優(yōu)的隱含層神經(jīng)元個數(shù)和相應(yīng)的各層權(quán)值和閾值,來構(gòu)建基于BP神經(jīng)網(wǎng)絡(luò)模型的土壤濕度反演模型。
支持向量機(jī)是一種機(jī)器學(xué)習(xí)算法,它追求在有限信息條件下得到最優(yōu)結(jié)果,用結(jié)構(gòu)風(fēng)險最小化原則替代經(jīng)驗風(fēng)險最小化原則,通過一套在有限樣本下的機(jī)器學(xué)習(xí)理論框架和方法,在小訓(xùn)練集上能夠得到較好的泛化特性[16]。支持向量回歸機(jī)是在支持向量機(jī)的基礎(chǔ)上發(fā)展而來的,文獻(xiàn)[17]給出了詳細(xì)原理和公式推導(dǎo),這里不作詳細(xì)闡述。
這里同樣使用SNR觀測值反射信號分量的振幅Am和相位φ作為輸入項,而實際土壤濕度作為期望輸出值。由于輸入向量與土壤濕度的關(guān)系是非線性關(guān)系,因此需要將輸入空間中的樣本通過一個非線性變換映射到一個更高維度的特征空間,從而將輸入空間中的非線性問題轉(zhuǎn)化為特征空間中的線性問題,然后在特征空間中使用線性支持向量回歸機(jī)對樣本點(diǎn)進(jìn)行擬合。在構(gòu)建基于支持向量回歸機(jī)的反演模型時,還應(yīng)注意核函數(shù)的引入,因為核函數(shù)是利用解線性問題的方法求解非線性問題的關(guān)鍵,它成功避免了顯式地定義特征空間和映射函數(shù)。本文采用適用性更好的徑向基核函數(shù)(radial basis function,RBF),RBF核函數(shù)為
(3)
式中,γ為RBF核函數(shù)的待定參數(shù)。由此建立基于支持向量回歸機(jī)的土壤濕度反演模型。
美國大陸板塊邊界觀測網(wǎng)(plate boundary observatory,PBO)中安裝了超過1000臺用于大地測量的高質(zhì)量GPS接收機(jī),其中大部分位于美國西部地區(qū)和阿拉斯加地區(qū)。試驗選擇PBO觀測網(wǎng)中的P037站點(diǎn)(如圖2所示)2016年中90—249 d的觀測數(shù)據(jù)作為數(shù)據(jù)來源,該站點(diǎn)位置為36.448 113° W,256.846 046° N,海拔為1 493.6 m,站點(diǎn)周圍視野開闊,植被稀疏,地形平坦,可為用戶提供1 Hz采樣率的L2C觀測值。土壤濕度采用Noah土地表面模型計算,根據(jù)7種地上氣象數(shù)據(jù)(溫度、濕度、氣壓、降水量、平均風(fēng)速和長、短波輻射)估計地表土壤濕度。長、短波輻射由全球陸面數(shù)據(jù)同化系統(tǒng)(GLDAS)進(jìn)行插值獲得,降水?dāng)?shù)據(jù)由附近的氣象站獲得,其他數(shù)據(jù)來自GPS氣象文件。
圖2 P037站點(diǎn)
(1) 利用TEQC(translation,editing and quality checking)軟件對GNSS接收機(jī)的觀測文件進(jìn)行分析并提取SNR數(shù)據(jù)、衛(wèi)星高度角和方位角數(shù)據(jù),其中SNR數(shù)據(jù)與衛(wèi)星高度角數(shù)據(jù)用于多路徑反射信號的參數(shù)估計,方位角數(shù)據(jù)用于有效反射區(qū)域的確定。
(2) GNSS接收機(jī)觀測得到的SNR值是直射信號與反射信號的疊加,其中直射信號為主要趨勢項,因此采用低階多項式進(jìn)行擬合,提出直射信號分量,進(jìn)而得到SNR觀測值殘差,即為反射信號分量。本文選用8°~20°高度角之間的SNR反射分量作為反演數(shù)據(jù)。
(3) 通過重采樣得到SNR反射分量與衛(wèi)星高度角正弦值之間的變化量,再對重采樣后的數(shù)據(jù)進(jìn)行正弦擬合,得到反射信號分量的特征參數(shù)的相位和振幅。
通過上述預(yù)處理及數(shù)據(jù)整理后總共得到155組數(shù)據(jù),本文將這些數(shù)據(jù)采用隨機(jī)分配的方法分為兩組:一組為訓(xùn)練集共120組,一組為測試集35組。訓(xùn)練集和測試集是互斥的,沒有交集。本文除了將反演值與土壤濕度真值進(jìn)行對比外,還比較了基于機(jī)器學(xué)習(xí)算法的土壤濕度反演模型與其線性模型之間的關(guān)系。基于120組訓(xùn)練集擬合的線性模型如下。
振幅與土壤濕度線性回歸模型
y=-0.017 6x+0.337 6
(4)
式中,y為土壤濕度值;x為信號振幅值。
相位與土壤濕度線性回歸模型
y=-0.475 0x-0.761 1
(5)
式中,y為土壤濕度值;x為信號相位值。
在利用上述訓(xùn)練集數(shù)據(jù)進(jìn)行模型訓(xùn)練之后,分別利用模型進(jìn)行測試集的測試,圖3顯示了幾種模型的預(yù)測值與真值之間的關(guān)系。可以看出,由振幅擬合的線性模型預(yù)測的結(jié)果最差,第17—19 d的預(yù)測值誤差最大,都不符合其變化趨勢。而相位擬合的線性模型其預(yù)測結(jié)果基本符合土壤濕度值,與土壤濕度變化基本一致,這也說明振幅與土壤濕度的相關(guān)性遠(yuǎn)遠(yuǎn)不如相位與土壤濕度的相關(guān)性。但是相比基于機(jī)器學(xué)習(xí)算法的土壤濕度反演模型,相位擬合的線性模型部分預(yù)測值與真值還存在一定的差距,兩種回歸模型的預(yù)測值與土壤濕度真值的契合度都非常高,從圖中可以看出這兩種模型的預(yù)測值與真值相差無幾。這也充分證明了基于機(jī)器學(xué)習(xí)算法的土壤濕度反演模型具有一定可行性。
圖3 幾種模型預(yù)測結(jié)果與土壤濕度期望值的對比
為進(jìn)一步說明幾種模型的預(yù)測能力及兩種回歸模型的準(zhǔn)確性,分別計算了幾種模型的相對誤差,具體如圖4所示。從圖中可以清晰地看出,振幅擬合的線性模型的預(yù)測值相對誤差最大,而且起伏不定,好的情況低于5%,但最差的也甚至高于100%。相位擬合的線性模型的預(yù)測值則明顯優(yōu)于振幅擬合的線性模型,但也基本處于20%左右。而基于機(jī)器學(xué)習(xí)算法的土壤濕度反演模型的相對誤差則明顯較低,基本都不超過20%,同時基于支持向量回歸機(jī)的土壤濕度反演模型的相對誤差也優(yōu)于基于BP神經(jīng)網(wǎng)絡(luò)算法的土壤濕度模型。雖然BP模型的部分預(yù)測值的相對誤差小于支持向量回歸機(jī)模型,但是整體而言,支持向量回歸機(jī)模型的預(yù)測值的相對誤差大小更加穩(wěn)定。
由于相位擬合的線性模型只采用相位一個物理量,因此為了對比分析,本文還將兩種基于機(jī)器學(xué)習(xí)算法的土壤濕度模型只采用相位一個輸入量進(jìn)行預(yù)測,預(yù)測結(jié)果如圖5、圖6所示。從圖中可以看出,基于回歸算法的土壤濕度模型得預(yù)測值的準(zhǔn)確性高于相位擬合的線性模型。從圖6中幾種模型的相對誤差大小也可以看出,基于機(jī)器學(xué)習(xí)算法的土壤濕度反演模型的結(jié)果較優(yōu)。
從整體上進(jìn)一步比較幾種模型的優(yōu)越性,基于支持向量回歸機(jī)的土壤濕度反演模型的決定系數(shù)為0.912 8和0.928 3,均方根誤差RMSE為0.032 9和0.026 6,采用振幅和相位兩種物理參數(shù)作為輸入量的模型結(jié)果較優(yōu)。而基于BP神經(jīng)網(wǎng)絡(luò)算法的土壤濕度反演模型的決定系數(shù)為0.886 0和0.913 1,均方根誤差RMSE為0.038 0和0.032 6,同樣是用振幅和相位兩種物理參數(shù)作為輸入量的模型結(jié)果較優(yōu)。但是兩種模型采用兩個輸入量的結(jié)果比一個輸入量優(yōu)越性并不高,主要是由于振幅與土壤濕度的相關(guān)性不是很高。而振幅的擬合的線性模型的決定系數(shù)為0.553 2,均方根誤差為0.093 9,相位的擬合的線性模型的決定系數(shù)為0.859 8,均方根誤差為0.041 6。上述結(jié)論說明基于機(jī)器學(xué)習(xí)算法的土壤濕度反演模型可以反演土壤濕度,能達(dá)到一定的精度要求,有一定的可行性,而且基于支持向量回歸機(jī)的土壤濕度反演模型定量估測土壤濕度優(yōu)于基于BP神經(jīng)網(wǎng)絡(luò)算法的土壤濕度反演模型。
圖4 幾種模型的相對誤差
圖5 幾種模型結(jié)果與土壤濕度期望值的對比
圖6 幾種模型的相對誤差
本文主要研究了基于兩種機(jī)器學(xué)習(xí)算法的GNSS反射信號土壤濕度反演方法,給出了數(shù)據(jù)處理的一般流程,并開展了仿真試驗對該方法進(jìn)行驗證測試,同時與線性回歸統(tǒng)計模型和實測數(shù)據(jù)對比,其結(jié)果表明:
(1) 利用SNR觀測值提取的振幅和相位與土壤濕度之間存在很強(qiáng)的相關(guān)性,以分解的干涉信號的振幅和相位作為自變量集,利用兩種回歸算法構(gòu)建估算土壤濕度模型的方法是可靠的。
(2) 利用這兩種模型反演的結(jié)果與土壤濕度參考值相關(guān)性很好,反演模型的決定系數(shù)分別為0.928 3和0.913 1,均方根誤差為0.026 6和0.032 6,且基于支持向量回歸機(jī)的土壤濕度反演模型定量估測土壤濕度優(yōu)于基于BP神經(jīng)網(wǎng)絡(luò)算法的土壤濕度反演模型。
(3) 在得不到地表粗糙度和植被信息的情況下,取得了較高的反演精度,說明將這些解析模型不易建?;虿杉y度較高的因素作為系統(tǒng)噪聲使用機(jī)器學(xué)習(xí)算法進(jìn)行抑制是合理、有效的。
本文研究的基于機(jī)器學(xué)習(xí)算法的GNSS反射信號土壤濕度反演方法是可行的,但是在低矮灌木叢、較厚喬木植被和多種植被混合下的復(fù)雜情況,以及驗證基于BP神經(jīng)網(wǎng)絡(luò)算法的GPS衛(wèi)星反射信號土壤濕度反演方法的普遍適用性,仍需要進(jìn)一步研究。