熊雄 姚薇 張穎超
(1 南京信息工程大學 江蘇省大氣環(huán)境與裝備技術協(xié)同創(chuàng)新中心,南京 210044;2 江蘇省突發(fā)事件預警信息發(fā)布中心,南京 210019;3 南京信息工程大學 氣象災害預報預警與評估協(xié)同創(chuàng)新中心,南京 210044)
大量觀測實驗和數(shù)值計算模擬表明,數(shù)值天氣預報已成為開展現(xiàn)代氣象業(yè)務的主要手段之一,而資料同化技術是保障數(shù)值天氣預報準確性的前提[1],地面氣溫資料進行質量控制將有助于資料同化及數(shù)值天氣預報水平的提高[2-5]。
對地面氣溫觀測資料質量控制算法的研究遵循從單站到多站聯(lián)網研究的技術路線,逐步由氣象要素物理約束向氣象要素時空關聯(lián)性拓展,從一維空間向多維空間延伸。一般而言,地面氣溫觀測資料的質量控制算法可以分為兩類[6-7]:一類是利用鄰近站信息對目標站進行多站聯(lián)網質量控制;另一類則是從時序相關性、觀測要素自約束性等角度對目標站地面氣溫觀測資料進行單站質量控制。大量研究表明,在鄰近站觀測信息滿足參考條件情況下,多站聯(lián)網質量控制要比單一觀測站質量控制的效果好[8]。隨著國家氣象局在全國范圍內的“三站四網”大氣監(jiān)測工程的建設,地面氣溫觀測資料進行多站聯(lián)網質量控制成為一個發(fā)展趨勢[9]。根據(jù)實際情況的不同,國內外氣象學者們對地面氣溫觀測資料質量控制算法開展了不同的研究。維也納大學的學者們提出變分質量控制法[10],該算法的基礎是計算一個觀測場與背景場的代價函數(shù)及其誤差協(xié)方差的最小值,本質上是一個最優(yōu)控制問題。我國學者在地面氣溫觀測資料的研究中也有不少創(chuàng)新嘗試,ZOU,et al[11]從服務資料同化的角度出發(fā),通過對比觀測場和背景場觀測差異,提出了基于高斯分布和經驗正交函數(shù)分解等地面觀測資料質量控制方法;YE, et al[12]提出基于智能方程擬合的方法從時空回歸角度來構建質量控制方程實現(xiàn)對地面氣溫數(shù)據(jù)進行質量控制,拓展了學者們研究氣象數(shù)據(jù)質量控制問題的領域。XU, et al[13]在業(yè)務層面上,對地面資料質量控制方案提出了不同的修訂方案。從現(xiàn)有的研究來看,地面氣溫觀測資料質量控制算法均是從單一的維度去構建質量控制方程,勢必造成質量控制方程的不穩(wěn)定性。
因此,本文提出了一種基于改進空間面板數(shù)據(jù)模型的地面氣溫觀測資料的多站質量控制算法(ST-RH算法)。利用一定區(qū)域范圍內地面氣溫時空相關性信息構造空間面板數(shù)據(jù)模型,并將相對濕度作為解釋變量融入算法,實現(xiàn)對目標站地面氣溫觀測資料質量控制。該算法的出發(fā)點是設定地面氣象觀測資料的時空分布具有空間面板數(shù)據(jù)的結構特征,即地面氣象觀測資料的排放是先將某個時間節(jié)點區(qū)域范圍內觀測站資料堆放在一個橫截面上,再將不同時間節(jié)點的橫截面數(shù)據(jù)按時間順序堆放在一起。為了檢測ST-RH算法的有效性和普適性,利用國家氣象信息中心提供的國家級地面站觀測資料,通過多組獨立試驗對ST-RH算法進行檢測,并結合多個質量控制算法評價指標與IDW算法和SRT算法進行對比分析。
本文所涉及地面氣溫、相對濕度觀測資料均經過了嚴格的“臺站—省級—國家級”三級質量控制,剔除了明顯的粗大誤差。文中所涉及國家級地面站(目標站)及其周圍90 km范圍內鄰近站見表1所示。
表1 全國14個典型地面觀測站半徑90 km范圍內鄰近站數(shù)目Table 1 Numbers of neighboring stations within 90 km radius of14 surface observation stations
選取的14個目標觀測站分布在我國不同的地區(qū),所屬的氣候、地形和地貌等環(huán)境各異,便于檢測ST-RH算法的普適性和穩(wěn)定性:改則站位于青藏高原,屬高原山地氣候,地形地貌簡單,但鄰近觀測站站分布稀少;天池站、酒泉站位于西北地區(qū),靠近亞洲高原源地,大陸性結構特征強;包頭站、伊春站位于高緯度的黑龍江和內蒙古的北部地區(qū);四平站、懷柔站和忻州站位于華北和東北地區(qū)及黃土高原地區(qū),地形地貌多樣,特別忻州站處于山地區(qū)域,小氣候環(huán)境復雜;綿陽站、瀏陽站、南京站和贛州站均位于水系、山地復雜區(qū)域,氣候環(huán)境多變;東莞站、三亞站位于南部沿海地區(qū)。
為了檢測算法的質量控制效果,本文在目標站地面氣溫觀測資料中隨機選取占總樣本3%作為人為植入誤差[14],大小如式(1)所示:
Ex=sx·qx,
(1)
(2)
常規(guī)空間面板數(shù)據(jù)模型分為空間滯后模型(SLM)和空間誤差模型(SEM)兩類,其數(shù)學表達形式分別為:
y=δ(IT?W)y+Xβ+(τT?IN)μ+ε,
(3)
y=Xβ+(τT?IN)μ+u,u=ρ(lT?W)u+ε,
(4)
其中:T為時間序列長度;N為空間單元個體數(shù);y為NT×1的因變量;X為NT×K的解釋變量;K為解釋變量個數(shù);δ和ρ是空間自回歸系數(shù);β是K×1解釋變量系數(shù)列向量;IT和IN分別是T×T和N×N的單位矩陣;τT是T維元素全為1的列向量;?表示克羅內克(Kronecker)積;μ代表個體效應;u和ε分別都為獨立分布的隨機誤差項,均服從均值為0;方差為σ2的正態(tài)分布;W是行標準化了的N階方陣。W用來反映數(shù)據(jù)空間相關性,一般情況下,空間權重矩陣的設定為:若個體i與個體j相鄰,則Wij=1,否則Wij=0,Wij為W中的元素。
空間滯后模型和空間誤差模型在處理不同問題時各有優(yōu)缺點,如何選擇合適的空間面板數(shù)據(jù)模型至關重要。YING,et al[15]在拉格朗日乘數(shù)(LM)檢驗的基礎上[15],分別提出了檢驗空間誤差模型的準則LMERR和檢驗空間滯后模型的準則LMLAG,數(shù)學表達式分別如下:
(5)
(6)
(7)
(8)
運用空間面板數(shù)據(jù)模型對地面氣溫觀測資料進行質量控制時,SLM對應的原假設為H0:無空間滯后因變量;SEM對應的原假設為H0:無空間誤差項。無論是SLM還是SEM,若LM通過5%水平下的顯著性檢驗,則拒絕原假設,說明存在空間效應,適合用空間面板數(shù)據(jù)模型對數(shù)據(jù)進行分析,反之接受原假設;在通過顯著性的前提下,若robustLMERR>robustLMLAG,則選擇空間誤差模型,否則選擇空間滯后模型。
當空間效應存在時,分別采用普通最小二乘法(OLS)對空間滯后模型和空間誤差模型進行參數(shù)估計可得出結論:對于SEM模型來說模型的參數(shù)估計是無偏的,但不具有效性;對SLM模型來說模型的參數(shù)估計則為有偏且不一致。因此,在考慮空間效應存在時,本文擬采用極大似然(ML)法對模型參數(shù)進行估計。
利用空間面板數(shù)據(jù)模型對地面氣溫觀測資料進行質量控制本質上是運用空間回歸技術結合鄰站的觀測信息對目標站觀測值的回歸估計。地面氣溫在空間的分布連續(xù)、平穩(wěn),滿足空間相關性的條件;同時,由于地形地貌等小氣候環(huán)境的存在,不同空間觀測單元對應的觀測資料之間也存在著明顯的異質性。從而保證了空間面板數(shù)據(jù)模型在地面氣溫觀測資料質量控制中運用的理論可行性。
本文選取以南京站為中心及其周圍90 km范圍內鄰站2017年7月逐時氣溫和相對濕度觀測資料為例,對基于空間面板數(shù)據(jù)模型的地面氣溫觀測資料質量控制算法進行實例闡述。涉及地面氣象觀測資料時間序列長度。通過計算,南京站2017年7月逐時氣溫觀測資料空間相關性檢驗如表2所示:
表2 2017年7月南京站逐時地面氣溫觀測資料空間相關性檢驗 Table 2 Inspection of spatial correlation of hourly surface temperature observations for Nanjing station in July 2017
由表2可以看出無論是經典LM測試還是穩(wěn)健LM測試,原假設在1%顯著條件下都被拒絕,通過顯著性檢驗,表明存在空間相關性。同時檢驗因子LMERR>LMLAG,robustLMERR>robustLMLAG,分別對本文涉及的其它13個地面觀測站進行空間相關性檢驗均得到相同結果,說明采用空間誤差模型更適合地面氣溫觀測資料的質量控制。
地面氣溫觀測資料在空間維度和時間維度上均是連續(xù)的,同時文獻[17]指出在對流層的底部,氣溫與相對濕度具有明顯的強耦合關系。為了增加質控模型的內部復雜度與穩(wěn)定性,本文在空間誤差模型的基礎上加入時間維度氣溫信息作為協(xié)同變量,加入相對濕度信息作為解釋變量強化模型的魯棒性。因此,基于空間面板數(shù)據(jù)模型的地面氣溫觀測資料質量控制算法(ST-RH算法)可以描述為公式(9)所示:
y=Xβ+ω(IT?τN)η+(1-ω)(τT?IN)μ+
[INT-ρ(IT?W)]-1ε,
(9)
其中:τT是T維元素全為1的列向量;τT是N維元素全為1的列向量;μ和η分別代表個體效應和時間效應;INT為NT×NT的單位矩陣;ω為地面氣溫觀測資料的時間維度和空間維度協(xié)調系數(shù),其計算如式(10)所示:
(10)
其中:ρ1為地面氣溫觀測資料空間維度相關聯(lián)系數(shù);ρ2為地面氣溫觀測資料時間維度相關聯(lián)系數(shù)。為了便于計算,減少異方差,本文中用lny和lnX分別表示取對數(shù)后的逐時氣溫和相對濕度數(shù)據(jù),則公式(9)可以改寫為:
lny=C+lnXβ+ω(IT?τN)η+
(1-ω)(τT?IN)μ+[INT-ρ(IT?W)]-1ε,
(11)
其中:C為常數(shù)項,通過式(11)可以得到南京站2017年7月逐時氣溫觀測資料預測值,記為yest。若預測值與觀測值的差值的絕對值滿足公式(12)條件,則認為數(shù)據(jù)可信,否則標記為存疑數(shù)據(jù):
|yobs-yest|≤f·δ,
(12)
其中:yobs為目標站的觀測值;yest為目標站的預測值;δ為預測值與觀測值的標準差;f為質量控制參數(shù)。
本文通過宏觀檢錯率來考察算法的質量控制效果,宏觀檢錯率是錯誤檢出個數(shù)與實際插入的錯誤個數(shù)之比。在地面氣象觀測資料質量控制研究中通常存在兩類統(tǒng)計學錯誤:第一類錯誤:“去真”錯誤,即把真當假,第二類錯誤:“納偽”錯誤,即以假充真。從宏觀角度來說,當?shù)谝活愬e誤變大時,第二類錯誤將變小;反之,第一類錯誤變小時,第二類錯誤將變大。為了權衡、量化兩類統(tǒng)計錯誤發(fā)生的概率,文獻[18]提出均方根檢錯率概念(MSR)作為評價質量控制算法的考核指標,MSR數(shù)學表達如下:
(13)
其中:r1為第一類錯誤出現(xiàn)概率;r2為第二類錯誤出現(xiàn)概率;α為r1權重。通常情況下,α的設置調和了r1與r2對MSR的影響,綜合評估兩者在地面氣溫觀測資料質量控制中的重要性。此外,納什效率系數(shù)(NSC)、平均絕對誤差(MAE)和均方根誤差(RMSE)也常用來作為評價質量控制模型的評價指標:
(14)
(15)
(16)
以南京站為中心及其周圍90 km范圍內鄰站2017年逐時氣溫觀測資料為例,檢驗ST-RH算法的質量控制效果,并與IDW和SRT兩種算法比較,試驗結果如圖1所示。圖1a可以看出ST-RH算法在各月的宏觀檢錯率均高于SRT和IDW的宏觀檢錯率(特別是在1、8、12月)。由于SRT算法是根據(jù)均方根誤差來分配權重的;IDW算法是根據(jù)歐氏距離來分配權重的;而ST-RH算法是在通過地面氣溫觀測資料的時空相關性來進行回歸預測的,同時考慮到相對濕度與氣溫之間的強相關性,將相對濕度作為解釋變量融進算法之中,進一步增強了ST-RH算法的內部穩(wěn)定性。此外,從圖1a中也可以看到SRT和IDW兩種傳統(tǒng)算法的比較:SRT的宏觀檢錯率在1月和3月出現(xiàn)低于IDW的宏觀檢錯率的情況,2月的宏觀檢錯率與IDW算法基本上持平,其他月份的宏觀檢錯率均高于IDW的宏觀檢錯率。因此從圖1a中看到春、冬季的宏觀檢錯率相對于夏季而言較高,但是由于受到隨機誤差概率分布等因素的影響,難免出現(xiàn)IDW宏觀檢錯率高于SRT宏觀檢錯率的情況。圖1b中展示的是IDW、SRT和ST-RH 3種算法在不同月份宏觀檢錯率的宏觀分布情況。可以看到,ST-RH算法在不同月份的宏觀檢錯率平均值、最高值和最低值均優(yōu)于其它兩種方法;SRT算法要略優(yōu)于IDW算法。
圖1 ST-RH、SRT和IDW3種算法對南京站2017年逐時氣溫觀測資料質量控制對比分析:(a)不同月份宏觀檢錯率對比;(b)全年宏觀檢錯率對比Fig.1 Performance of ST-RH、SRT and IDW methods for the quality control of surface observations for Nanjing station in July 2017: (a) Macro error ratio for different months; (b) Macro error ratio during 2017
ZOU, et al[11]在對地面氣溫觀測資料質量控制研究中指出,質量控制的目的不僅是去除錯誤的觀測數(shù)據(jù),而且可使資料能夠更好地同化服務。資料同化最重要的一個假設條件是觀測場和背景場的誤差分布應盡可能地滿足高斯分布。鑒于此,本文選取歐洲中期天氣預報中心(ECMWF)的ERA-Interim再分析資料作為背景場資料,通過殘差分布情況檢測地面氣溫觀測資料經ST-RH、SRT和IDW算法控制后的可利用性。分析圖2a—c中頻數(shù)擬合分布可以看到,圖2a更加接近于正態(tài)分布,圖2b、 c中殘差的分布不確定性更強一點。圖2d—f中的Q-Q圖進一步檢驗殘差的分布,圖2d呈現(xiàn)一種比較理想的分布狀態(tài),而圖2e、 f中的散點頭部和尾部均與理想狀態(tài)有一定的差距。圖2表明,相比較于SRT方法和IDW方法,經過ST-RH算法質量控制后的地面氣溫觀測資料與背景場資料的殘差分布更具正態(tài)分布的特征。
圖2 ST-RH、SRT和IDW 3種算法對南京站2017年7月逐時氣溫觀測資料質量控制后與背景場對比殘差:(a—c)頻數(shù)分布;(d—f)殘差Q-Q分布Fig.2 Performance of ST-RH、SRT and IDW methods for comparison of residual plots with background field and the observations for Nanjing station after quality control: (a-c) frequency distribution diagram;(d-f) Q-Q distribution of residuals
圖3為SRT、ST-RH和IDW 3種算法對南京站2017年12個月逐時氣溫觀測資料進行質量控制NSC、MAE、RMSE三項性能指標分布情況。圖3中ST-RH的MAE和RMSE的值很低,低于0.1,說明預測誤差小;NSC的值很高,接近于1,說明預測值相對于實際觀測值擬合程度很高??偟貋砜?,ST-RH的三項性能指標值相對于SRT和IDW而言均表現(xiàn)出明顯的優(yōu)越性且其三項指標值的變化基本一致。SRT方法除了1月在絕大多數(shù)月份優(yōu)于IDW方法,1月出現(xiàn)的不一致性與隨機誤差的分布有關。
圖3 ST-RH、SRT和IDW 3種算法對南京站2017年逐時氣溫觀測資料質量控制性能指標對比分析:(a)NSC;(b)MAE;(c)RMSEFig.3 Performance of ST-RH、SRT and IDW methods for the quality control of surface observations for Nanjing station in July 2017: (a) NSC; (b) MAE; (c) RMSE
為了進一步考察ST-RH方法的普適性,利用ST-RH、SRT和IDW 3種算法對全國14個地面觀測站2017年地面氣溫觀測資料進行質量控制,MSR、NSC、MAE和RMSE分析結果如圖5所示。從圖4可以看到,東南部地區(qū)的質量控制效果較西北部要好,一方面由于東南地區(qū)經濟較發(fā)達,臺站分布較密集便于多站聯(lián)網質量控制;另一方面西北地區(qū)的氣候、地形地貌環(huán)境復雜多變,給質量控制帶來了不確定因素較多。從圖4中MSR、NSC、MAE、RMSE 4個指標綜合分析,ST-RH算法在3種算法中表現(xiàn)最優(yōu),SRT算法要優(yōu)于IDW算法。此外,ST-RH算法表現(xiàn)出了更好的穩(wěn)定性,對不同的地區(qū)適應性更好。
圖4 ST-RH、SRT和IDW 3種算法對14個不同地區(qū)2017年逐時氣溫觀測資料質量控制性能指標對比對比分析:(a)MSR;(b)NSC;(c)MAE;(d)RMSEFig.4 Performance of ST-RH、SRT and IDW methods for the quality control of surface observations for 14 different areas in 2017: (a) MSR; (b) NSC; (c) MAE; (d) RMSE
圖5 ST-RH、SRT和IDW 3種質量控制算法代價敏感性分析:(a)14個不同地區(qū)AUC值分布;(b)AUC值標準差分布Fig.5 Cost sensitivity analysis of ST-RH、SRT and IDW methods:(a) AUC for 14 different regions; (b) SD of AUC
此外,本文為了評估算法的代價敏感性,采用AUC值對ST-RH、SRT和IDW 3種算法進行分析。圖5a為通過ST-RH、SRT和IDW 3種算法對全國14個地面觀測站2017年地面氣溫觀測資料進行質量控制后結果的AUC值,從數(shù)值上來看ST-RH、SRT和IDW 3種算法的AUC值在不同的地區(qū)均大于0.75,表示3種算法的質量控制均是有效的。但是,從圖5a可明顯看出ST-RH算法是優(yōu)于其他兩種算法的,有5個地區(qū)ST-RH算法的AUC值大于0.9,體現(xiàn)了ST-RH算法的優(yōu)越性。同時,圖5b展示了ST-RH、SRT和IDW 3種算法AUC值的標準差分布情況,可以看出改則、天池、酒泉、包頭、伊春、四平和三亞的幅值跨度較大,反映了ST-RH、SRT和IDW 3種算法在這7個地區(qū)的質量控制效果具有較大差異。結合圖4以及三種算法的構造機理分析,ST-RH方法通過把溫度與相對濕度的強耦合關系為解釋變量融入算法,可以提高質量控制算法在氣候極端地區(qū)或周圍鄰站稀少地區(qū)的效果。
本文發(fā)展了一種基于改進空間面板數(shù)據(jù)模型的地面氣溫觀測資料質量控制算法(ST-RH算法),并對全國14個不同地區(qū)的地面氣溫觀測資料進行質量控制檢測。為了對新算法進行評估,本文采用多個指標值對質量控制效果進行分析,并與IDW算法和SRT算法進行比較。試驗表明,ST-RH質量控制算法能有效地標記出地面逐時氣溫觀測資料中的存疑數(shù)據(jù),相對于SRT算法和IDW算法而言具有較好的質量控制效果。通過多組獨立案例試驗可得到以下結論:
(1)ST-RH算法能夠實現(xiàn)對我國地面氣溫觀測資料進行質量控制,能夠有效地甄別出存疑數(shù)據(jù)。ST-RH算法相比較IDW算法和SRT算法而言,具有更好的檢錯效果和穩(wěn)定性,其原因在于ST-RH算法通過地面氣溫觀測資料的時空相關性來進行回歸預測的,同時考慮到相對濕度與氣溫之間的強耦合關系,將相對濕度作為解釋變量融進算法之中,增強了ST-RH算法的內部穩(wěn)定性。
(2)從不同地區(qū)的質量控制效果來看,ST-RH算法效果普遍具有較好的質控效果。在西部、北部地區(qū),ST-RH、SRT和IDW 3種算法質量控制效果均有下降,不同算法的質量控制效果差異性也較大。其原因一方面復雜的地理環(huán)境造成的近地面大氣分布的非平穩(wěn)特征加大了質量控制的難度;另一方面我國的西部、北部地區(qū)存在地面氣象觀測站點稀少的現(xiàn)象,為質量控制算法提供的可參考鄰站觀測信息不足。