黎峻宇,姚宜斌,劉立龍,張 豹,黃良珂,曹利穎
1. 桂林理工大學測繪地理信息學院,廣西 桂林 541006; 2. 廣西空間信息與測繪重點實驗室,廣西 桂林 541006; 3. 武漢大學測繪學院,湖北 武漢 430079
GNSS信號穿過對流層時,產(chǎn)生的延遲(對流層延遲)是GNSS導航定位的主要誤差源之一。由于難以準確測量信號傳播路徑上的對流層延遲,因此需要對其進行模型化。常用的方式是確定天頂方向的對流層延遲(ZTD),然后將其乘以投影函數(shù),以獲得斜路徑的對流層延遲??梢?準確模型化ZTD是削弱對流層延遲影響的重要工作。根據(jù)影響因素的不同,ZTD可分為天頂對流層靜力學延遲(ZHD)和天頂對流層濕延遲(ZWD)。其中ZHD占到ZTD的90%左右,可通過實測氣象數(shù)據(jù)和經(jīng)驗模型精確計算,精度達毫米級[1]。因水汽等因素引起的ZWD由于水汽劇烈的時空變化,其變化率最高可達ZHD的4倍[2-3],難以準確計算,是制約GNSS對流層改正的主要因素。此外高精度的ZWD先驗值可提高GNSS精密單點定位的收斂速度、優(yōu)化坐標高程分量的精度[4-5]。因此,建立高精度的ZWD預報模型具有重要的現(xiàn)實意義。學者們在模型化ZWD方面做了很多努力,構建的模型主要分為:基于實測氣象參數(shù)的模型和經(jīng)驗模型。前者如Hopfield模型[6]和Saastamoinen模型[1]依賴實測溫度、相對濕度和壓強等氣象數(shù)據(jù),改正精度可達厘米級。后者只需要測站坐標和時間作為基本輸入信息,在實際工作中應用更廣,尤其對于GNSS實時應用。文獻[7—8]基于美國標準大氣數(shù)據(jù)提取的氣象參數(shù)年平均值和年周期振幅網(wǎng)格表,構建了UNB系列模型。該系列模型基于15°為一個緯度帶的網(wǎng)格表和顧及氣象參數(shù)年周期變化的三角函數(shù)計算ZWD,其中UNB3m模型的平均精度為5.5 cm[9]。文獻[10—12]利用美國國家環(huán)境預報中心氣象再分析資料,基于考慮氣象參數(shù)或ZWD年周期變化、日周期變化的三角函數(shù),構建了1°×1°的TropGrid系列模型。文獻[13]利用歐洲中尺度天氣預報中心的ERA-interim氣象再分析資料,基于顧及年周期和半年周期變化的函數(shù)對5°×5°和1°×1°氣象參數(shù)進行周期性擬合,建立了全球格網(wǎng)模型GPT2w。GPT2w是當前國際公認計算ZWD精度最高的模型[14-16]。此外,學者們基于類似的方式建立了一些相近的模型[17-19]。
由前人研究可知,當前主流的經(jīng)驗模型大多基于再分析資料等單源數(shù)據(jù),且通過模型函數(shù)表征ZWD在不同尺度上的變化方式,難以反映ZWD在不同尺度的非線性復雜變化。機器學習算法是通過對數(shù)據(jù)進行自動分析并獲取規(guī)律,進而利用發(fā)現(xiàn)的規(guī)律對未知數(shù)據(jù)進行預測的算法,其在處理當前規(guī)律尚未明確的復雜非線性問題方面優(yōu)勢突出[20-21]。文獻[22]通過反向傳播神經(jīng)網(wǎng)絡(BPNN)建立了Hopfield估算ZTD誤差的抵償模型,抵償模型的均方根誤差優(yōu)化了超過90%。文獻[21]基于BPNN構建了對流層參量加權平均溫度模型,該模型相對兩種精度較高的經(jīng)驗模型性能明顯提升,再次證明了機器學習算法在對流層參量建模方面的優(yōu)越性。廣義回歸神經(jīng)網(wǎng)絡(generalized regression neural network,GRNN)基于非線性回歸理論進行函數(shù)估計,并根據(jù)最大概率原則計算網(wǎng)絡輸出向量。與傳統(tǒng)神經(jīng)網(wǎng)絡相比,GRNN的訓練過程更加方便,特別適合解決曲線擬合問題,已在各學科和工程領域得到廣泛應用。鑒于ZWD時空變化劇烈的特點,本文基于多源數(shù)據(jù)和GRNN構建一個高精度的ZWD預報模型,并對模型精度進行檢驗。
本文選擇了緯度15°N—55°N和經(jīng)度70°E—135°E的區(qū)域開展研究。該地區(qū)覆蓋中國大陸和部分周邊國家與地區(qū),地形復雜,氣候模式多樣,陸-海作用強烈,導致ZWD時空變化劇烈[23]。得益于此,本區(qū)域或為研究高精度ZWD預報模型的理想試驗場,然而,復雜的自然條件也為高精度模型的建立帶來諸多挑戰(zhàn)。此外,該區(qū)域有龐大的北斗/GNSS實時用戶,如果能為其提供高精度的ZWD預測值,對于提高中國及周邊地區(qū)北斗/GNSS實時應用的精度具有積極推動作用。
本文所用數(shù)據(jù)包括中國氣象局新一代中尺度版本全球/區(qū)域同化和預報系統(tǒng)(GRAPES_MESO)數(shù)據(jù)、ECMWF第五代再分析資料(ERA5)和全球無線電探空綜合檔案(IGRA)。GRAPES_MESO的水平分辨率為0.1°×0.1°,垂直分辨率為1000 hPa到100 hPa,共8層,時間分辨率為3 h。使用了研究區(qū)域內GRAPES_MESO所有格網(wǎng)點2016、2017年溫度、水汽壓和位勢高垂直廓線預報數(shù)據(jù)的存檔資料來計算ZWD(記為GRAPES ZWD),具體公式如下
(1)
Nw=k2×e/T+k3×e/T2
(2)
式中,Nw表示濕折射率;k2=64.79 K/hPa,k3=377 600 K2/hPa;e為水汽壓,單位為hPa;T為溫度,單位為K[24]。
ERA5數(shù)據(jù)的時間分辨率為1 h,空間分辨率為0.25°×0.25°。使用了從1000 hPa至1 hPa 37個氣壓層的數(shù)據(jù)來計算ZWD(記為ERA5 ZWD),計算方法與GRAPES ZWD相同。ERA5氣壓分層數(shù)據(jù)不直接提供水汽壓,因此采用了文獻[25]的方法基于溫度、相對濕度計算水汽壓。
無線電探空儀可以測量多種大氣參數(shù),是大氣研究的重要手段。探空相對濕度和溫度的精度分別可達3%和0.2 K[26]。由于其高精度、高可靠性,探空數(shù)據(jù)常被用于評估模型的精度[14,19]。因此,使用了IGRA提供的2016、2017年146個探空站數(shù)據(jù)計算ZWD,記為RS ZWD,并將其用于建模和檢核,時間分辨率為12 h,方法同前。需要說明的是,利用RS ZWD進行檢核前,需要把GRAPES/ERA5 ZWD插值到探空站的位置。首先利用當前已知ZWD高程改正精度最高的方法[14],將探空站附近4個格網(wǎng)點的ZWD改正到探空站高度,然后通過雙線性水平插值到探空站位置。格網(wǎng)GRAPES/ERA5 ZWD覆蓋范圍和探空站點位分布見圖1,其中三角形表示參與建模的探空站,圓點表示檢核探空站。
圖1 格網(wǎng)GRAPES/ERA5 ZWD覆蓋范圍及探空站點位分布Fig.1 The coverage area of the grided GRAPES/ERA5 ZWD and distribution of radiosonde stations
已有的ZWD模型大多基于單一數(shù)據(jù)源,如再分析資料、數(shù)值天氣預報數(shù)據(jù)或探空數(shù)據(jù)的一種。基于前兩種數(shù)據(jù)的模型時空分辨率較高(最高可達0.1°×0.1°和1 h),然而在局部地區(qū)精度損失較大,尤其在用于同化的氣象站稀疏、高程起伏大和天氣變化較為劇烈的地區(qū)[27],如中國的青藏高原。基于后者的單站模型精度較高,但由于探空站的水平分辨率約為250 km,模型應用范圍較小,且時間分辨率一般只有12 h。本文利用兩種數(shù)據(jù)源的優(yōu)點,提出基于多源數(shù)據(jù)構建ZWD預報模型的方法。GRNN屬于前向傳播的神經(jīng)網(wǎng)絡,不需要反向傳播求模型參數(shù),學習速度快,不需要迭代過程[28]。這些優(yōu)點使得GRNN成為了處理回歸、近似、擬合和預測問題的強大工具。本文正是利用GRNN的這些優(yōu)點,構建了基于GRNN的ZWD預報模型。
GRNN的理論基礎是非線性回歸分析。在GRNN中,假設有隨機變量x和因變量y,其概率密度函數(shù)為f(x,y),且x的觀測樣本為X,則y的條件期望為
(3)
(4)
(5)
則高斯核可表示為
(6)
對式(3)進行積分可得
(7)
ZWD受時空影響較大[13,30],且經(jīng)驗值的輸入可改善機器學習模型的性能[21,28]?;诖?構建了基于GRNN的ZWD預測模型(GRNN-F)訓練框架,如圖2所示。與預設函數(shù)的模型固定ZWD的時變特征不同,GRNN網(wǎng)絡是數(shù)據(jù)自適應的。
圖2 GRNN-F的訓練框架Fig.2 The training framework of GRNN-F
圖2輸入層中l(wèi)at、lon和h分別為測站緯度、經(jīng)度和高程;d和hod為年積日和UTC時;ZWDGPT2w為GPT2w估算的經(jīng)驗ZWD(GPT2w-ZWD)。輸出層為優(yōu)化、降采樣后的格網(wǎng)ERA5/GRAPES ZWD(見2.2.1節(jié))與RS ZWD的合并數(shù)據(jù)集。基于圖2框架訓練好的模型,輸入三維坐標、時間和GPT2w-ZWD即可得到ZWD的預測值,記為GRNN-F-ZWD,則有
GRNN-F-ZWD=g(lat,lon,h,d,hod,ZWDGPT2w)
(8)
式中,g表示GRNN-F模型。此外,為突出基于多源數(shù)據(jù)建模的優(yōu)越性,僅利用參與了GRNN-F建模的RS ZWD作為訓練時的輸出,基于與GRNN-F相同的訓練框架和輸入變量建立了一個基于單源數(shù)據(jù)(RS ZWD)的ZWD預報模型,簡稱GRNN-R。將三維坐標、時間和GPT2w-ZWD輸入GRNN-R即可得到ZWD預測值(記為GRNN-R-ZWD),輸入和輸出的關系可表示為
GRNN-R-ZWD=g(lat,lon,h,d,hod,ZWDGPT2w)
(9)
需要說明的是,GPT2w并不直接輸出ZWD,用戶基于GPT2w輸出的氣象參數(shù)計算ZWD,具體公式如下[31]
(10)
2.2.1 數(shù)據(jù)預處理
高質量的訓練樣本有利于構建高精度的GRNN模型,因此在建模前對格網(wǎng)ERA5/GRAPES ZWD進行了優(yōu)化。優(yōu)化的基本思路是:利用GRNN以146個探空站處高質量的RS ZWD為輸出,插值到探空站處的ERA5/GRPES ZWD、測站三維坐標、時間為輸入的網(wǎng)絡結構來擬合它們之間的關系,進而建立以測站三維坐標、時間和ERA5/GRAPES ZWD為輸入,優(yōu)化后的ERA5/GRAPES ZWD為輸出的優(yōu)化模型,具體的方法和步驟見文獻[29]。將格網(wǎng)ERA5/GRAPES ZWD及對應三維坐標和時間輸入優(yōu)化模型,即可獲得優(yōu)化后的格網(wǎng)ERA5/GRAPES ZWD。以RSZWD為參考值,插值到探空站處的ERA5/GRAPES ZWD優(yōu)化前后的精度見表1。
表1 優(yōu)化前后插值到探空站處GRAPES/ERA5 ZWD的精度
顯然,優(yōu)化后GRAPES/ERA5ZWD的bias都減小到接近0 mm,RMS均小于3 cm。這對于基于實測氣象數(shù)據(jù)估算也僅能達到厘米級精度的ZWD而言,優(yōu)化效果是非常顯著的,可認為優(yōu)化后的GRAPES/ERA5 ZWD與RS ZWD是無偏的。
此外,多源數(shù)據(jù)的引入,相對單源數(shù)據(jù)建模,數(shù)據(jù)量劇增。假如僅以146個探空站數(shù)據(jù)建模,不計數(shù)據(jù)缺失兩年僅有213 452個時刻文件。引入GRAPES數(shù)據(jù)(1 526 626 248個時刻的文件)和ERA5數(shù)據(jù)(737 216 424個時刻文件)后,數(shù)據(jù)量增加了約1.1萬倍。如果將所有的數(shù)據(jù)均用于訓練模型,會帶來訓練時間過長的問題。為合理選擇建模數(shù)據(jù)的分辨率,分析了平均海平面處ERA5 ZWD在經(jīng)緯度方向變化特征(圖3)的基礎上,對優(yōu)化后的格網(wǎng)GRAPES/ERA5 ZWD進行了降采樣。
圖3 2016年平均海平面年均ERA5 ZWD隨經(jīng)緯度的變化Fig.3 The variations of the annual mean sea level ERA5 ZWD with latitude and longitude in 2016
由圖3可知,ZWD整體隨著緯度增加而降低,下降率為-6.36 mm/(°);ZWD隨經(jīng)度增大而增大的趨勢明顯,上升率為0.55 mm/(°),其原因可能是由于研究區(qū)域內,經(jīng)度越大越靠近海洋,同時西高東低加之山脈的阻隔導致來自海洋的水汽難以進入西部地區(qū),主要由水汽引起的ZWD整體西小東大。說明在研究區(qū)域內,ZWD在緯向和經(jīng)向上分別跨越0.5°和5°產(chǎn)生的變化約為3 mm,與RS ZWD的平均精度[32]相當。因此,在同時顧及模型精度和訓練時長的基礎上,將優(yōu)化后的格網(wǎng)GRAPES/ERA5 ZWD降采樣至0.5°×5°(緯度×經(jīng)度),聯(lián)合120個站的RS ZWD用作建模,此外選擇了26個分布相對均勻站的RS ZWD用作檢核。建模站和檢驗站見圖1的三角形和圓點。
2.2.2 模型訓練
由2.1節(jié)可知,GRNN模型訓練主要以σ為研究對象。選用了后驗尋優(yōu)的方法確定σ,即用不同的σ去訓練GRNN模型,每次訓練都采用十倍交叉驗證[33]的精度去檢驗訓練效果?;舅悸肥?對于每個σ,用90%的數(shù)據(jù)(包括輸入變量和輸出參考值)訓練GRNN模型,10%的數(shù)據(jù)(參考值)用于檢驗,既可以保證驗證結果具有更好的可靠性[33],還可以使更多的樣本參與建模,這樣交叉驗證的結果更接近最終的模型;這個過程進行10次,確保所有數(shù)據(jù)都參與了訓練和檢驗,統(tǒng)計檢驗值與模型預測值差值的RMS,并以RMS最小為準則來確定最佳σ。基于參考文獻[28—29]取得良好效果的σ尋優(yōu)方式,本文采用范圍為0.01~1(間隔為0.01)的σ值來重復訓練過程。需要說明的是,本文為了加快模型訓練速度,每月建立一個模型,然后將12個月的模型代碼存放到一起以供不同時刻調用,組成最終的模型。圖4給出了用不同的σ訓練8月GRNN模型對應的RMS。
圖4 不同σ訓練8月GRNN模型的RMSFig.4 RMS from GRNN based on different σ in August
由圖4可以看出,σ先急劇下降,然后逐漸增大,等于0.02時RMS最小。因此,選用σ=0.02來訓練8月的GRNN-F模型,其他月份的σ確定方式相同。1—12月的σ分別為:0.02、0.03、0.03、0.02、0.02、0.02、0.02、0.02、0.02、0.02、0.03和0.02。
3.1.1 內符合精度
為檢驗建模方法的合理性,利用參與建模的數(shù)據(jù)檢驗GRNN-F的內符合精度,統(tǒng)計了其估算ZWD的平均bias、STD和RMS。結果表明,GRNN-F-ZWD的bias為0,且STD、RMS均等于24.1 mm,內符合精度達到厘米級。這樣的內符合精度與依賴實測氣象數(shù)據(jù)模型估算ZWD的精度[3]相當,說明GRNN-F具有良好的擬合效果。
ZWD受緯度和高程影響較大,為反映GRNN-F內符合精度在緯度和高程上的變化,統(tǒng)計了GRNN-F在各緯度和高程段的內符合精度(圖5)。顯然,GRNN-F-ZWD的bias絕對值先隨緯度增加有所增大,緯度大于35°N之后整體呈減小趨勢,但最大值小于0.2 mm;在15°N~35°N之間,STD/RMS基本相等且相對較大,但最大值小于30 mm,緯度大于35°后逐漸減小。bias絕對值在約500 m以下的高程處相對較大,在其他高程段較小,且最大值小于0.5 mm;隨著高程上升STD/RMS整體呈降低趨勢,STD/RMS均小于30 mm。因此,在整個研究區(qū)域GRNN-F的內符合精度指標和變化幅度均在厘米級范圍內,具有較高且穩(wěn)定的內符合精度。
圖5 GRNN-F內符合精度隨緯度和高程的變化Fig.5 The variation with latitude and height of internal accuracy from the GRNN-F
由于ZWD有明顯季節(jié)特性,統(tǒng)計了GRNN-F-ZWD 2016—2017每日的空間平均bias、STD和RMS,以檢驗GRNN-F內符合精度的季節(jié)變化(見圖6)。顯然,GRNN-F-ZWD的bias在0左右均勻分布,平均值為0(見圖6(a)紅色線),且無超過1倍STD(24.1 mm)的跳變;STD/RMS夏秋兩季總體較大,冬季較小,但最大值仍小于48 mm??梢?GRNN-F的高內符合精度有良好的時間穩(wěn)定性。
圖6 GRNN-F內符合精度的時間序列Fig.6 The time series of internal accuracy from the GRNN-F
3.1.2 優(yōu)越性分析
為展示本文所提建模方法的優(yōu)越性和厘清基于多源數(shù)據(jù)或GRNN建模的優(yōu)勢,僅利用同時參與了GRNN-F和GRNN-R建模的120個站RS ZWD檢驗了GRNN-R和GRNN-F的精度,并與國際典范經(jīng)驗模型GPT2w(通過預設模型函數(shù)表征ZWD在不同尺度上的變化)直接估算ZWD的精度進行比較,結果見表2。
表2 不同模型估算120個參與建模站ZWD的精度
由表2可見,GRNN-R/GRNN-F-ZWD的bias絕對值、STD和RMS均明顯小于GPT2w-ZWD,bias絕對值減少了近10 mm,以GPT2w-ZWD作為部分輸入信息的GRNN-R和GRNN-F精度相對GPT2w有精度有明顯提升。這意味著基于GRNN建模對GPT2w的經(jīng)驗值有精化作用,能有效提高擬合ZWD的精度。GRNN-F-ZWD的bias絕對值與GRNN-R-ZWD相當,其他各項指標均明顯優(yōu)于GRNN-R-ZWD,STD和RMS均減少了12.8%,可見引入更多高質量的數(shù)據(jù)(多源數(shù)據(jù))建模同樣有助于提高ZWD擬合的效果,同時再次證明2.2.1節(jié)中優(yōu)化后的格網(wǎng)GRAPES/ERA5 ZWD與RS ZWD之間是無偏的。這些結果表明,基于多源數(shù)據(jù)和GRNN建模對于提升ZWD的擬合精度均有貢獻,相對主流建模方式有一定的優(yōu)勢。
為了更清晰地展示本文所提建模方法的優(yōu)越性,統(tǒng)計了3個模型在各建模站處的bias、STD和RMS(見圖7)以及對應的每日空間平均值(見圖8)。由圖7可知,GRNN-F-ZWD和GRNN-R-ZWD在大部分地區(qū)的bias絕對值接近,約等于零,且?guī)缀鯖]有空間差異,相對GPT2w-ZWD有明顯減少,在水汽含量大且變化較為劇烈的低緯度地區(qū)更明顯,可能是由于GRNN-F/GRNN-R更好地擬合到了ZWD除GPT2w顧及的季節(jié)性變化之外的復雜變化;海陸交界處由于受海洋和陸地氣候的綜合影響,水汽變化頻繁導致ZWD變化更為劇烈,給模型化帶來了更大的難度,而GRNN-F-ZWD的bias在幾個海陸交界處相對GRNN-R-ZWD仍有所減小,可見更高時空分辨率的多源數(shù)據(jù)有利于揭示ZWD更精細的變化。GRNN-F-ZWD和GRNN-R-ZWD的STD/RMS相對GPT2w-ZWD在各地區(qū)有不同程度的降低,在毗鄰印度洋和太平洋的區(qū)域降低尤為明顯,GRNN-F-ZWD在這些地區(qū)的STD/RMS相對GRNN-R-ZWD也有所減小,這些地區(qū)分別受東亞季風和南亞季風的影響,水汽含量高,ZWD變化劇烈,導致通過預設模型函數(shù)表征ZWD在不同尺度上變化的GPT2w精度在這些地區(qū)受到嚴重削弱,而基于GRNN的兩個模型相對GPT2w在這些地區(qū)有更明顯的精度改善,尤其是基于多源數(shù)據(jù)的GRNN-F。可見,本文的建模方式在研究區(qū)域的ZWD擬合方面具有明顯優(yōu)勢,且在ZWD變化較極端的地區(qū)仍具有突出優(yōu)勢。圖8表明,相對其他兩個模型,GPT2w-ZWD的bias分布更加離散且波動較大;GRNN-F-ZWD和GRNN-R-ZWD的bias均勻分布在0左右,無過大跳變;兩年間,GPT2w-ZWD的STD/RMS起伏最大、值也最大,GRNN-R-ZWD的值居中,GRNN-F-ZWD的值最小、離散性也最小,且出現(xiàn)了很多STD/RMS接近于0的時刻??傊?本文的建模方式在不同季節(jié)的ZWD擬合方面具有很好的優(yōu)勢。
圖7 不同模型估算各建模站ZWD的bias、STD和RMSFig.7 The bias, STD and RMS of the ZWD from different models at each modeling station
圖8 不同模型估算各建模站ZWD的每日空間平均bias、STD和RMSFig.8 The spatially averaged daily bias, STD and RMS from different models' ZWD from each modeling station
為檢驗模型的適應性,使用了26個未參與建模站的RS ZWD來檢驗GRNN-F的外符合精度。表3為3個模型預報ZWD的總體精度。
表3 不同模型預報未參與建模站ZWD的精度
顯然,GRNN-F-ZWD的bias絕對值、STD和RMS均小于GPT2w-ZWD和GRNN-R-ZWD,精度有全面的提升。相對GPT2w-ZWD,GRNN-F-ZWD的bias絕對值減少近5 mm,STD和RMS分別降低了10.8 mm (24.8%)和11.1 mm(25.3%)??梢?GRNN-F不是一個簡單的GPT2w精化模型,而是一個高精度的區(qū)域模型。相比GRNN-R-ZWD,GRNN-F-ZWD的bias絕對值減少了近3 mm,STD和RMS分別減少了4.0 mm (10.9%)和4.1 mm (11.1%)。說明基于多源數(shù)據(jù)的建??梢匀嫣嵘P驮谡麄€區(qū)域預報ZWD的精度,再次證明了本文所提建模方法的優(yōu)越性。此外,對比3.1.1節(jié)的結果和表3可發(fā)現(xiàn),GRNN-F的內外符合精度很接近,模型并沒有出現(xiàn)在非建模站點精度損失嚴重的情況,具有較強的適應能力。
為分析GRNN-F預報精度的空間穩(wěn)定性,統(tǒng)計了3個模型預報未參與建模站ZWD的bias、STD和RMS隨緯度(圖9)和高程(圖10)的變化。如圖9,隨緯度增加,3種模型的bias并無明顯變化規(guī)律;GRNN-F-ZWD的bias絕對值最小,且最穩(wěn)定,在0附近徘徊;3種模型的STD/RMS隨著緯度的增大呈現(xiàn)整體減小的趨勢,這是由于水汽含量更少的中高緯度地區(qū)ZWD小于低緯度地區(qū),ZWD變化也更加穩(wěn)定;GRNN-F-ZWD的STD/RMS在所有緯度節(jié)點相對其他2種模型均有所減少,在ZWD變化較劇烈的低緯度地區(qū)減少量更大,離散性最小,最大值仍小于50 mm??梢?GRNN-F-ZWD在各緯度段均具有較高的精度,且有很好的穩(wěn)定性。如圖10所示,3種模型的bias與高程關系并不明顯;GRNN-F-ZWD的bias明顯優(yōu)于其他2種模型,尤其在穩(wěn)定性方面,在0附近波動,最大絕對值小于20 mm;3種模型的STD/RMS整體與高程呈負相關關系,這是由于隨著高程的增加水汽含量越來越低,ZWD變化更加穩(wěn)定導致的;所有站點處GRNN-F-ZWD的STD/RMS均最小,振幅也最小,在ZWD變化更劇烈的低海拔地區(qū)優(yōu)勢更突出,峰值均小于50 mm??傮w來說,GRNN-F的高預報精度在高程上有很好的穩(wěn)定性。
圖9 各模型預報ZWD的bias、STD和RMS隨緯度變化情況(站點隨緯度升序排列)Fig.9 The bias, STD, and RMS of the forecasted ZWD from each model at RS stations sorted in ascending latitude
圖10 各模型預報ZWD的bias、STD和RMS隨高程變化情況(站點隨高程升序排列)Fig.10 The bias, STD, and RMS of the forecasted ZWD from each model at RS stations sorted in ascending altitude
為檢驗模型精度的時間穩(wěn)定性,統(tǒng)計了3種模型預報26個站ZWD的每日空間平均bias、STD和RMS,結果見圖11??梢钥吹?GRNN-F-ZWD的bias絕對值在四季中大多小于GRNN-R-ZWD和GPT2w-ZWD,變化范圍也明顯更小,隨著季節(jié)變遷沒有明顯的變化規(guī)律,最大絕對值小于48 mm,沒有出現(xiàn)大的跳變,較穩(wěn)定。不同季節(jié),GRNN-F-ZWD的STD/RMS最小,振幅最小,隨時間變化最平穩(wěn)。所有模型的STD/RMS均在夏季出現(xiàn)較大值,這是因為研究區(qū)域內夏季降雨更豐富,水汽活動更活躍,ZWD變化較劇烈,因而更加難以模型化。盡管如此,基于多源數(shù)據(jù)和GRNN建模的GRNN-F模型在夏季相對其他模型仍然具有相對較高的精度,相比GPT2w,STD/RMS減小量的均值、最小值、最大值和中位數(shù)分別為12.4/14.2 mm、-6.4/-11.5 mm、44.2/43.9 mm和12.4/14.0 mm。由此說明,GRNN-F-ZWD在不同季節(jié)表現(xiàn)出更高的符合度。
圖11 不同模型預報ZWD的每日空間平均bias、STD和RMSFig.11 The spatially averaged daily bias, STD, and RMS of the forecasted ZWD from each model at RS stations
相比如何構建模型,用戶可能更關心計算ZWD的效率,因此統(tǒng)計了GRNN-F生成365 d、時間分辨率為5 min的單站ZWD總耗時。結果表明,生成105 120個ZWD總耗時為1 325.665 s,即計算ZWD的平均效率為0.012 6 s/個。且GRNN-F只需輸入時間、坐標和GPT2w-ZWD經(jīng)驗值即可提前生成ZWD,可以滿足GNSS實時應用的需求。
已有研究表明,將高精度ZWD約束到PPP中可以改善收斂速度和坐標高程分量的精度,在此分別將GPT2w-ZWD和GRNN-F-ZWD約束到PPP中,并對其收斂速度和U方向的精度進行比較,以驗證GRNN-F應用于PPP的效果。約束策略為:使用GPT生成ZHD進行ZHD改正,然后將GPT2w-ZWD和GRNN-F-ZWD分別作為虛擬觀測量約束進PPP中,具體的解算軟件、策略、收斂條件及外部參考數(shù)據(jù)見表4。需要說明的是,使用GPT生成ZHD是為了避免GPT2w-ZHD和GPT2w-ZWD的自洽性。對流層延遲計算和估計不準確會使得定位精度降低,收斂時間延緩。尤其在極端天氣情況下,如降雨,會導致水汽劇烈波動,使得ZWD變化更加復雜,難以準確估算對流層延遲,導致PPP收斂時間延緩。因此,選用了IGS測站JFNG站2017年DOY3(晴)、DOY86(晴)、DOY188(雨)、DOY224(雨)的觀測數(shù)據(jù),分別利用GPT2w-ZWD(方法1)和GRNN-F-ZWD(方法2)為虛擬觀測量約束進行精密單點定位,來檢驗新模型相比GPT2w對PPP的改進效果。表5和圖12給出了兩種方法約束PPP的收斂時間和U方向的精度。顯然,除了DOY86(晴)天有細微的劣勢外,其他天GRNN-F-ZWD約束PPP的收斂時間均等于或小于GPT2w-ZWD,收斂速度平均提升了22.37%,尤其是雨天的優(yōu)勢更加明顯??赡苁怯捎谇缣斓膶α鲗友舆t變化相對平緩,GPT2w和GRNN-F預報ZWD的精度相差不大,但雨天ZWD在天氣尺度的變化更加復雜,GRNN-F能較好地刻畫這些天氣尺度的變化,這是GPT2w等經(jīng)驗模型不具備的,再次證明了模型的優(yōu)越性。對應的U方向精度均有提升,平均提升了37.10%,雨天的提升率更明顯??偟膩碚f,GRNN-F應用于PPP的改進效果優(yōu)于GPT2w。
表4 PPP的解算策略及模型
表5 不同方法約束PPP的收斂時間和U方向的精度
本文聯(lián)合探空ZWD、優(yōu)化后的格網(wǎng)ERA5/GRAPES ZWD和GRNN,將機器學習引入到ZWD的建模領域,建立了相比國際典范經(jīng)驗模型精度更高、時空穩(wěn)定性更強的ZWD預測模型(GRNN-F)。試驗結果顯示:①GRNN-F內符合精度bias等于0,STD/RMS均小于25 mm,擬合效果較為理想,且有很好的時空穩(wěn)定性;②多源數(shù)據(jù)的引入和基于GRNN建模均有利于提高模型對ZWD的擬合精度,基于多源數(shù)據(jù)和GRNN的建模方式較主流建模方法有明顯優(yōu)勢;③無預設模型函數(shù)的前提下,GRNN-F精度顯著優(yōu)于單源數(shù)據(jù)模型(GRNN-R)和通過預設模型函數(shù)表征ZWD在不同尺度上變化的模型(GPT2w),精度分別提升了11.1%和25.3%(以RS ZWD檢驗的RMS計),在不同時間和空間上表現(xiàn)出較好的預報效果和可靠性;④GRNN-F的計算效率可滿足GNSS實時應用的需求,且應用于PPP的改進效果優(yōu)于GPT2w。總體來說,基于多源數(shù)據(jù)和機器學習方法模型化ZWD具有明顯的優(yōu)越性,可為模型化ZWD提供一種思路。
致謝:感謝中國氣象數(shù)據(jù)網(wǎng)提供的GRAPES_MESO預報數(shù)據(jù),ECMWF提供的ERA5再分析資料,IGRA提供的探空數(shù)據(jù)。