丁凱文,張晨晰,陳 宇
(1.山東科技大學資源學院,山東 泰安 271019;2.中國礦業(yè)大學環(huán)境與測繪學院,江蘇 徐州 221116)
對流層內部的水汽約占總大氣含量的4%左右,急劇的三相變化會導致諸如洪澇、臺風、寒潮、暴雨等惡劣天氣,對人民生命財產安全造成重大隱患。
傳統(tǒng)探測水汽的方式如無線電探空儀、水汽輻射計等時間分辨率低,無法滿足預測的時效性。隨著全球衛(wèi)星導航系統(tǒng)(Global Navigation Satellite System,GNSS)應用領域的不斷拓展以及其空間分布均勻、全天候、全天時、高精度的優(yōu)勢,利用GNSS預測地區(qū)可降水量(Precipitable Water Vapor,PWV),對氣象災害預警領域的技術發(fā)展與研究具有重大推動作用[1]。
對流層延遲(Zenith Tropospheric Delay,ZTD)與大氣加權平均溫度(Atmospheric Weighted Average Temperature,Tm)是計算大氣可降水量的兩個關鍵參數(shù),數(shù)十年來,國內外許多學者針對二者進行了大量相關研究[2-3]。ZTD模型根據(jù)是否需要實測氣象參數(shù)以及建模方法不同,主要劃分為氣象參數(shù)模型與經驗模型;在模型建立方面,繼Bevis等[4]首次提出“GPS(Global Positioning System)氣象學”的概念,并給出的回歸經驗模型后,有關的研究工作大多集中在模型的優(yōu)化上[5-7]。與此同時,國內還有學者在Bevis模型的基礎上建立了區(qū)域模型[8-10],驗證精度均較前者有不同程度的提升。
值得關注的是,以上研究中對流層延遲的獲取大都來自GPS基線解算,且建模方法多基于最小二乘回歸,加之文獻[5]中嚴密驗證了地表溫度與加權平均溫度存在非線性關系。綜上,本文主要研究了基于單北斗衛(wèi)星系統(tǒng)(BeiDou Navigation Satellite System,BDS)的精密對流層延遲獲取,并考慮到隨機森林算法訓練速度快、非線性學習能力強、不易產生過擬合,以及在缺失某些特征的情況下依舊保證回歸準確率等優(yōu)勢,建立了香港地區(qū)多因子模型,并在對模型精度進行了驗證后,預測了香港地區(qū)2018年7月份可降水量。
地基GNSS反演水汽主要是利用地面上安置好的GNSS接收機,獲取衛(wèi)星信號穿過對流層的延遲量(主要是天頂方向延遲)。ZTD由天頂靜力學延遲(Zenith Hydrostatic Delay,ZHD)與天頂濕延遲(Zenith Wet Delay,ZWD)兩部分組成,其中ZHD約占對流層總延遲量的90%,性質較為穩(wěn)定。本文選擇Saastamoinen模型[11]分離出高精度ZHD分量,其模型計算公式為:
(1)
f(φ,H)=1-0.002 66×cos2φ+0.000 28×H
(2)
式中,δρZHD為天頂靜力學延遲,Ps為測站壓強(hPa),φ為測站緯度(°),H為測站高程(m)。
天頂濕延遲的影響因素較多,故ZWD的獲取一般由ZTD與ZHD作差得到,即:
ZWD=ZTD-ZHD
(3)
在獲得天頂濕延遲后,該值與氣象轉換因子Π相乘即可得到大氣可降水量(PWV),公式表示為:
PWV=ZWD×Π
(4)
其中,轉換因子Π為:
(5)
(6)
式中,ei為第i層大氣平均水氣壓(hPa),Ti為第i層大氣平均溫度(K),hi為第i層大氣高度(m)。由于探空數(shù)據(jù)的不連續(xù)性(每天只能獲取兩次),故Tm的計算均采用后一項離散化形式,并視為真值。
使用GAMIT/GLOBK_10.7軟件對吉林長春、北京房山、上海佘山、香港黃石4個IGS站點(測站距離均大于500 km,可減少對流層延遲相關性,避免引入系統(tǒng)誤差[12])2018年2月5日(年積日036)進行基線解算,站點信息如表1所示。
表1 IGS測站及探空站信息
運行環(huán)境安裝完成及前期文件準備就緒后,運行解算命令,之后分別對BDS與GPS進行單日批處理解算,解算成功后對兩個系統(tǒng)的結果進行3個方面的精度分析。
由于GAMIT/GLOBK軟件采用合網解的方式解算基線向量,所以同步環(huán)閉合差在基線處理完成時已經進行了分配(同步環(huán)閉合差恒為零)[13]。因此,可將時段基線解算精度指標標準化均方根誤差NRMS值作為同步環(huán)優(yōu)劣檢核的指標,對比結果如表2所示。
表2 基線解算均方根誤差對比
在8h~12h、12h~16h、16h~20h、20h~24h四個時段BDS基線解算的NRMS值均略低于GPS。一般認為,NRMS值在0.12~0.5之間是合理的,在0.25左右為最優(yōu),二者NRMS值均在0.22~0.25之間,符合精度要求。
選擇香港黃石(HKWS)站12h~16h、16h~20h、20h~24h三個時段的衛(wèi)星天空圖進行對比,從圖1中可以很明顯的發(fā)現(xiàn),同時段參與解算的BDS衛(wèi)星大致有5~9顆,而GPS衛(wèi)星則均在10顆以上。由于BDS衛(wèi)星數(shù)量受限,空間網型結構稀疏,其基線解算精度在一定程度上受到影響。
圖1 BDS與GPS天空圖對比
由圖2可以看出,BDS衛(wèi)星在高度角45°以下數(shù)據(jù)較GPS衛(wèi)星離散程度較高,前期趨勢線整體略偏離藍色中線,收斂程度較低,反觀GPS則較為平穩(wěn),這也表明GPS衛(wèi)星數(shù)據(jù)質量稍好于BDS衛(wèi)星。
圖2 相位殘差對比
綜上可得,BDS基線解精度與GPS持平,雖參與解算的衛(wèi)星數(shù)量以及相位殘差收斂情況稍遜于GPS,但也保證了利用單一BDS獲取對流層延遲數(shù)據(jù)的可行性與可靠性。
對香港國王公園探空站2016~2018年1、3、5、7、9、11月份探空站數(shù)據(jù)進行相關性分析,驗證了Tm與地表溫度Ts、水汽壓es、測站壓強Ps、露點溫度Ds四種氣象因子均高度相關,相關系數(shù)如表3所示,并在此基礎上建立了Tm單因子與多因子模型。
表3 Tm與Ts、es、Ps、Ds的相關系數(shù)
3.1.1 基于最小二乘的單因子模型
首先基于最小二乘法建立了香港地區(qū)Tm-Ts、Tm-es、Tm-Ps、Tm-Ds單因子模型,并在此基礎上引入Bevis與LJG經驗模型,模型公式及精度如表4所示。
表4 單因子模型分析結果
由表4可知,基于實測氣象數(shù)據(jù)的Tm-Ts模型(以下簡稱LTs模型)在所有單因子模型中均方根誤差最小,而對比Bevis與LJG經驗模型,二者MAE、RMSE均較大,模型精度稍差。
3.1.2 基于隨機森林算法的多因子模型
將與Tm具有映射關系的Ts、es、Ps、Ds作為輸入因子,探空站數(shù)據(jù)離散積分計算得到的Tm視為真值,在Python環(huán)境下構建基于隨機森林算法的RFTm模型,修改模型各參數(shù)配置。其中,樣本數(shù)據(jù)n=1 012,將70%樣本數(shù)據(jù)用于訓練,余下30%用于預測驗證;選擇數(shù)據(jù)洗牌,即將樣本數(shù)據(jù)順序打亂再進行訓練,這樣做可減小數(shù)據(jù)出現(xiàn)過擬合現(xiàn)象。
RFTm模型構建結果如表5所示,模型訓練完成后,隨機取100組Tm預測值與對應真值對比,二者擬合曲線如圖3所示。
表5 隨機森林多因子模型分析結果
圖3 數(shù)據(jù)測試預測圖
結合表4~5和圖3可以得出,RFTm模型在精度與模型擬合效果上均整體好于單因子模型與經驗模型:均方根誤差比LTs模型提升了16.2%,比Bevis模型提升了44.2%,比LJG模型提升了40.9%,并且與Tm的擬合程度超過0.9,進一步表明RFTm模型有更為良好的適用性。
利用GAMIT/GLOBK提取得到2018年7月份每日0:00對流層延遲量并采用Bevis模型、LJG模型、LTs模型以及RFTm模型,結合公式(1)~(5),計算得到PWV預測值。圖4為各模型預測PWV對比圖,其中柱狀圖為探空站數(shù)據(jù)計算得到的PWV真值,表6為各模型精度對比。
圖4 RFTm、Bevis、LJG、LTs模型預測PWV對比分析圖
表6 Bevis、LJG、LTs、RFTm模型預測PWV精度對比
由表6可知,RFTm模型均方根誤差為1.889 mm,比LTs模型精度提升約20.1%,比Bevis模型提升約25.0%。結合圖4可以看出,LJG模型出現(xiàn)較大偏差,R2也較低,模型擬合較差。進一步對4種模型PWV預測值的殘差進行統(tǒng)計,如圖5所示。
圖5 Bevis、LJG、LTs、RFTm殘差對比圖
由圖5可知,RFTm模型預測PWV的殘差分布于-3~2 mm之間,最貼近于PWV真值;LTs模型總體在-3~2 mm之間浮動,最小值為-7.402 mm,可能是樣本異常值;Bevis模型殘差總體高于PWV真值,范圍介于-3~7 mm,出現(xiàn)系統(tǒng)偏差;LJG模型精度最低,殘差范圍為-9~13 mm??梢?,基于實測數(shù)據(jù)的本地化LTs模型與基于隨機森林算法構建的RFTm模型皆可穩(wěn)定良好預測香港地區(qū)大氣可降水量,而傳統(tǒng)的經驗模型(Bevis、LJG)則在樣本數(shù)量較少的情況下出現(xiàn)較大誤差。
本文從衛(wèi)星基線解質量、衛(wèi)星數(shù)量、信號相位殘差三個維度驗證了利用單一北斗衛(wèi)星獲取天頂對流層延遲的精度及進行水汽反演的可行性。以地表溫度、水汽壓、測站壓強、露點溫度為輸入?yún)?shù),通過隨機森林算法構建了香港區(qū)域RFTm模型,與各模型精度對比,結果顯示其精度較本地LTs模型、Bevis經驗模型、LJG模型均有不同程度提升,可以看出Tm預測精度。利用上述模型分別對香港地區(qū)2018年7月份可降水量進行預測,RFTm模型較LTs模型、Bevis模型與探空站數(shù)據(jù)離散積分得到的Tm真值有更強的一致性。綜上可見,北斗衛(wèi)星系統(tǒng)結合隨機森林算法構建的RFTm多因子模型具有良好的適用性以及穩(wěn)定性,對預測大氣可降水量有明顯改善。