林瑩晶 李雙錦
(福建省氣象信息中心,福建 福州 350001)
隨著氣象觀測技術(shù)的快速發(fā)展,觀測手段日益完善,包括了地面自動氣象站、雷達(dá)、衛(wèi)星等,獲取到的觀測數(shù)據(jù)不斷豐富,由此反演得到的數(shù)值模式模擬數(shù)據(jù)的質(zhì)量也在不斷提高。防汛、民航等部門和單位對氣象數(shù)據(jù)產(chǎn)品的要求持續(xù)加強,特別是空間精度更高、時間連續(xù)性更強的氣象產(chǎn)品。目前,許多研究通過數(shù)據(jù)融合和同化技術(shù),結(jié)合不同來源的氣象觀測數(shù)據(jù)和多模式的模擬數(shù)據(jù),得到高精度、時空連續(xù)的多源數(shù)據(jù)融合氣象網(wǎng)格產(chǎn)品。
目前,在國際上有許多認(rèn)可度較高的融合氣象網(wǎng)格產(chǎn)品,包括由歐洲中期天氣預(yù)報中心研發(fā)的再分析數(shù)據(jù)集ERA-Interim。ERA-Interim涵蓋1979年至2019年8月31日期間的大氣和地面參數(shù)。第二版研究和應(yīng)用的現(xiàn)代再分析數(shù)據(jù)集MERRA-2是由美國國家航空航天局(NASA)全球模擬和同化辦公室推出的高分辨率全球再分析資料,覆蓋時間由1980年至今。中國氣象局國家信息中心在學(xué)習(xí)國際先進(jìn)融合技術(shù)的基礎(chǔ)上,創(chuàng)建了中國氣象局陸面數(shù)據(jù)同化系統(tǒng)(CMA Land Data Assimilation System,CLDAS)[1-2]。
近些年,許多學(xué)者開展了CLDAS 2.0產(chǎn)品的驗證和應(yīng)用研究。劉瑩等評估了CLDAS氣溫數(shù)據(jù)在中國區(qū)域的可信性和適用性,認(rèn)為CLDAS氣溫較好地反映了中國氣溫的年際變化[3]。孫帥等使用地面觀測降水?dāng)?shù)據(jù)對 1998—2015 年CLDAS長序列融合水?dāng)?shù)據(jù)集進(jìn)行了評估,認(rèn)為CLDAS 長序列融合降水?dāng)?shù)據(jù)效果優(yōu)于CMORPH衛(wèi)星反演產(chǎn)品、MERRA2再分析降水產(chǎn)品以及CMPA_Hourly降水產(chǎn)品,能夠滿足中國區(qū)域的陸面水文模擬、氣候研究等相關(guān)領(lǐng)域的需要[4]。劉晨等利用CLDAS V2.0降水產(chǎn)品等對2017年6月20日發(fā)生在蘭州的冰雹過程進(jìn)行分析,闡述了導(dǎo)致冰雹過程的物理機(jī)制[5]。
多源數(shù)據(jù)融合格點產(chǎn)品能彌補艱苦環(huán)境地區(qū)臺站分布稀疏的缺憾,完善全球陸面氣象資料。但在實際應(yīng)用中還存在一些亟待解決的問題,如空間尺度上粗細(xì)網(wǎng)格變化、時間分辨率的高低等,以及在不同地形地勢、不同氣候狀況、不同天氣系統(tǒng)條件下如何切實改進(jìn)多源融合格點分析產(chǎn)品。如何評價融合網(wǎng)格數(shù)據(jù)的“真實性”,通過評價為融合、同化技術(shù)找到存在的不足,提出有價值的建議。
福建省境內(nèi)峰巒疊嶂、山嶺聳峙,河谷與盆地錯落相間,屬多山地區(qū)。全省海拔80m以上的丘陵和山地占全省土地面積的89.3%,且地形坡度較大,平原主要分布在沿海地區(qū),地勢總體為西北高,東南低。目前CLDAS資料在福建省的適用性研究幾乎空白,亟待開展較為細(xì)致的評價工作。本文聚焦CLDAS在福建省的適用性,選取2m氣溫作為研究參數(shù),討論在福建復(fù)雜地形背景下我國研發(fā)的多源融合格點實況數(shù)據(jù)是否有較好的代表性。
為驗證多源融合網(wǎng)格實況數(shù)據(jù)的氣溫質(zhì)量,本文使用福建省2021年8月的5km×5km實況格點產(chǎn)品中的2m氣溫要素和70個國家級地面氣象站的實測數(shù)據(jù)。70個國家級地面氣象站包括國家氣象觀測站、國家基本氣象站、國家基準(zhǔn)氣候站,每個臺站設(shè)有雙套設(shè)備,降低數(shù)據(jù)的缺測率,也為主站數(shù)據(jù)提供一致性參考,及時發(fā)現(xiàn)儀器異常。觀測要素包括氣溫、相對濕度、氣壓、能見度、天氣現(xiàn)象、草面溫度、淺層地溫、深層地溫、日照、降水量、風(fēng)向、風(fēng)速和地面溫度。本文使用國家級地面氣象站2021年8月2m氣溫資料,時間分辨率為1h。使用的格點實況數(shù)據(jù)為CLDAS 2.0版的氣溫產(chǎn)品,空間分辨率為5km,時間分辨率為1h。CLDAS陸面數(shù)據(jù)同化產(chǎn)品利用多重網(wǎng)變分、空間格點拼接、離散縱坐標(biāo)短波輻散遙感反演以及CLM、Noah-MP、CoLM多陸面模式集合模擬等技術(shù)研發(fā)而成[1]。CLDAS陸面數(shù)據(jù)同化產(chǎn)品被證實在中國區(qū)域的時空分布特征更加準(zhǔn)確,適用性更強[6-10]。
選用鄰近插值和雙線性插值兩種方法將氣溫實況融合格點產(chǎn)品插值到70個國家級考核站,鄰近插值法是將與氣象站最鄰近的網(wǎng)格點的數(shù)據(jù)作為格點資料在臺站的要素值;雙線性插值就是將包圍氣象站的4個格點進(jìn)行x方向一元線性插值后,再進(jìn)行y方向一元線性插值,對于剛好在x(y)網(wǎng)格線上的臺站,則將y(x)方向上上下(左右)2個格點的值進(jìn)行一元線性插值,得到臺站的格點產(chǎn)品值。
通過絕對誤差、平均絕對誤差、均方根誤差及相關(guān)系數(shù)對該產(chǎn)品進(jìn)行評估。
絕對誤差(AE):
AE=|G-O|
平均絕對誤差(MAE):
均方根誤差(RMSE):
相關(guān)系數(shù)(COR):
其中,O為站點觀測值,G為實況格點產(chǎn)品插值到檢驗站點得到的數(shù)值,N為參與檢驗的總樣本數(shù)。絕對誤差A(yù)E反映了測量值偏離真值的大??;平均絕對誤差MAE是所有單個絕對誤差的平均值,避免誤差相互抵消,可以準(zhǔn)確反映實際預(yù)測誤差的大??;均方根誤差RMSE是觀測值與真值偏差的平方和與觀測次數(shù)N比值的平方根,用來衡量觀測值同真值之間的偏差,在算數(shù)中對誤差進(jìn)行平方算數(shù),因此受到異常值的影響較大;相關(guān)系數(shù)COR是按積差方法計算,同樣以兩變量與各自平均值的離差為基礎(chǔ),通過兩個離差相乘來反映兩變量之間相關(guān)程度,相關(guān)系數(shù)的絕對值越接近1,則相關(guān)性越強,當(dāng)相關(guān)系數(shù)絕對值大于0.8時,稱為高度相關(guān)。
通過鄰近插值和雙線性插值兩種方法對實況格點產(chǎn)品2m氣溫和國家氣象站的實測數(shù)據(jù)進(jìn)行比較,圖1展示了兩種插值方法得到的平均絕對誤差、均方根誤差及相關(guān)系數(shù)的日變化,點段線為國家站平均2m氣溫日變化(本文時間均為北京時)。福建省在2021年8月的日出時間約為5時30分,日落時間約為18時30分。
MAE在0~6h和17~23h都表現(xiàn)為鄰近插值法誤差明顯小于雙線性插值法,在7~16h兩者差距較小(圖1a)。雙線性插值的MAE日變化為0.54~0.86,而鄰近插值法的結(jié)果為0.52~0.79,分別在7時和6時達(dá)到最低值,在19時和14時達(dá)到最高值。MAE的日變化與溫度有著密不可分的聯(lián)系,在日出前,氣溫降為最低時,MAE也為日最小值,但隨著日出氣溫增大,MAE急劇增大。日溫度最大時(14時)和日落后(19時)氣溫快速下降時MAE達(dá)到最大。綜上,氣溫增大或者氣溫快速變化時,融合網(wǎng)格產(chǎn)品難以精準(zhǔn)把握氣溫的實時變化,造成MAE數(shù)值增大,且鄰近插值法受該因素的影響較小。
雙線性插值和鄰近插值的RMSE日變化與MAE相似,鄰近插值法的均方根誤差在0~23h都小于雙線性插值結(jié)果,尤其在0~6h和17~23h,鄰近插值法得到的結(jié)果明顯優(yōu)于雙線性插值(圖1b)。在日出前降為最小值,在午后或日落后升至最高值(或次峰值)。雙線性插值的RMSE日變化為0.75~1.15,鄰近插值法的結(jié)果為0.71~1.04,鄰近插值法的RMSE更小,插值的離散程度更小。
兩種方法都能得到較好的相關(guān)性,8月期間鄰近插值法的結(jié)果全天都優(yōu)于雙線性插值結(jié)果,鄰近插值法的相關(guān)系數(shù)全天都在0.9以上(圖1c)。雙線性插值的相關(guān)系數(shù)為0.88~0.94,鄰近插值法的相關(guān)系數(shù)為0.90~0.95,且都在21時降為最小值,在16時增加至最大值。8時和17時可觀察到兩個谷值,即在日出后和日落前,再次說明網(wǎng)格實況產(chǎn)品難以準(zhǔn)確捕捉到氣溫的快速變化,造成了氣象站觀測值與實況格點產(chǎn)品相關(guān)性較差。
圖1 2021年8月實況格點產(chǎn)品和氣象站觀測數(shù)值之間的平均絕對誤差(a)、均方根誤差(b)和相關(guān)系數(shù)(c)的日變化
綜上,對于2m氣溫的實況格點產(chǎn)品,鄰近插值法比雙線性插值法更接近臺站真實狀況。實況網(wǎng)格產(chǎn)品與氣象站之間的誤差及相關(guān)性存在明顯日變化,在氣溫較高或者日落氣溫快速變化時的MSE和RMSE較大,而在日出或日落時,實況網(wǎng)格產(chǎn)品與氣象站實測值之間的相關(guān)性由于氣溫的快速變化而下降。如何提高日出和日落時實況網(wǎng)格產(chǎn)品氣溫要素的真實性是今后需要關(guān)注的難點問題。
鄰近插值法的2m氣溫更接近氣象站觀測值,本節(jié)使用鄰近插值法的結(jié)果分別討論8月份福建省內(nèi)國家氣象站氣溫要素與氣象站觀測值之間的絕對誤差(AE)受緯度、經(jīng)度和臺站海拔高度的影響。福建的地理跨度較小,大部分觀測結(jié)果集中在24.5°N~27.5°N和117°E~119.5°E。緯度較低(24.5°N以南)站點的氣溫絕對誤差值較小,一般在2℃以內(nèi),剩余站點的絕對誤差分布較為離散,存在絕對誤差較大情況(圖2a)。絕對誤差與經(jīng)度的概率密度分布難以得到明顯的規(guī)律,即受到東西向地理條件的影響較小(圖2b)。福建省的臺站集中分布在海拔高度300m以下,這些站點的氣溫絕對誤差也有較大差異,分布較為離散,但是概率密度大值分布在1℃內(nèi)。300m以上的高山站絕對誤差分布存在較大差異,既有集中分布在2℃以內(nèi)的站點,也存在離散分布在0~4℃內(nèi)的站點(圖2c)。綜上,海拔高度較低的站點更有可能存在較低的氣溫絕對誤差,網(wǎng)格數(shù)據(jù)更容易接近實測狀況,但是海拔高度的增加不是產(chǎn)生較大絕對誤差的充分條件,還存在其他影響因素。
為了進(jìn)一步探尋造成實況格點產(chǎn)品與氣象站實測數(shù)據(jù)之間誤差較大的影響因素,選取研究結(jié)果中MAE最大的10個臺站,通過站點環(huán)境基本信息,討論造成插值結(jié)果誤差較大的可能原因。將站點資料整理成表1,其中MAE最大的站點為九仙山站,該站位于海拔高度1653.9m的山頂,地形復(fù)雜,周圍地勢起伏度較大,削弱了站點的區(qū)域代表性,在這類高山站點使用實況網(wǎng)格產(chǎn)品時需引起注意[3]。在MAE最大的10個站點中,有9個臺站位于山頂,且其中5個存在建筑物或樹木等障礙物遮擋。福建境內(nèi)峰嶺聳立,丘陵連綿,山地、丘陵占全省總面積的80%以上,在復(fù)雜地形的影響下,氣象站的代表性大大減小。除山地丘陵地形影響外,建筑物或者樹木等障礙物遮擋也是使得站點區(qū)域代表性下降的重要原因,站點在選址和維護(hù)中應(yīng)當(dāng)避免和及時清除這種影響,一方面能增加臺站的區(qū)域代表性,另一方面能使得融合數(shù)據(jù)與實測數(shù)據(jù)之間的差異減小。
圖2 2021年8月實況格點產(chǎn)品的鄰近插值和氣象站觀測數(shù)值之間,受緯度(a)、經(jīng)度(b)和海拔高度(c)影響的絕對誤差
表1 鄰近插值結(jié)果中MAE最大10個臺站的環(huán)境基本信息
以十地市為單位,計算各個城市在研究期間的絕對誤差,并開展絕對誤差的分布離散性討論,對比各地市格點實況產(chǎn)品氣溫的適用性差異。所有地市都表現(xiàn)出上四分位數(shù)和下四分位數(shù)組成的箱盒偏下,說明各地市的絕對誤差更偏向低值,格點氣溫在各地市都表現(xiàn)較好。絕對誤差上四分位數(shù)大于1℃的臺站有三明、南平、龍巖,且中位數(shù)也較大,這三個城市的絕對誤差相對偏大。同時,這三個市的上下邊緣間隔較遠(yuǎn),即市內(nèi)的最大絕對誤差與最小絕對誤差的差距較大,離散性強。福建省地勢總體上西北高、東南低,在西部形成由武夷山脈、杉嶺山脈等組成的閩西大山帶,較高的地勢和復(fù)雜的丘陵下墊面是造成三明、南平、龍巖絕對誤差相對較大、數(shù)值分布較為離散的原因。此外,這三個城市屬福建省內(nèi)陸城市,而其余七個屬沿海城市。由于海洋比熱容較大,能調(diào)節(jié)氣溫變化,使得日出或日落時的氣溫變化減緩,使得沿海城市的絕對誤差總體較小,絕對誤差數(shù)值較為集中,離散度小。
受到地形和下墊面的影響,三明、南平、龍巖的平均氣溫相對較低,為討論氣溫對于網(wǎng)格模擬結(jié)果的真實性影響,對匹配結(jié)果的絕對誤差和實測氣溫的相關(guān)性開展研究。
圖3 2021年8月實況格點產(chǎn)品與觀測值之間的
氣溫和絕對誤差密集分布在24~29℃和0~1℃。當(dāng)氣溫較低時(小于20℃),絕對誤差在0~4.5℃之間離散分布。當(dāng)氣溫增長到22℃及以上時,絕對誤差集中分布在1℃以內(nèi)。這可能來源于高山或者地表反照率高的站點,這些站點在日出前氣溫達(dá)到日最低氣溫,在日出后氣溫快速變化,實測溫度和模擬結(jié)果之間容易存在較大的差距。
圖4 2021年8月實況格點產(chǎn)品的氣溫絕對誤差與
本文針對2021年8月的福建區(qū)域內(nèi)5km×5km的實況網(wǎng)格產(chǎn)品2m氣溫數(shù)據(jù)和70個國家站的小時氣溫數(shù)據(jù)開展誤差分析,得到以下結(jié)果:
①對于2m氣溫要素,鄰近插值法比雙線性插值法更接近臺站真實狀況。實況網(wǎng)格產(chǎn)品與氣象站之間的誤差及相關(guān)性存在明顯日變化,在氣溫較高或者日落氣溫快速變化時的MSE和RMSE較大。
②緯度較低(24.5°N以南)站點的氣溫絕對誤差值較小,海拔高度較高站點的絕對誤差較大,這與站點周圍地形緊密相關(guān)。
③除山地丘陵地形影響外,障礙物遮擋也是造成格點資料誤差較大的重要原因。
④受到緯度和下墊面的影響,三明、南平、龍巖的平均氣溫相對較低,絕對誤差相對較大,數(shù)值分布較為離散。
⑤高山或者地表反照率高的站點在日出后氣溫快速變化,實測溫度和模擬結(jié)果之間容易存在較大的差距。
未來在改善實況網(wǎng)格產(chǎn)品的研究中,丘陵等復(fù)雜地形的誤差分析系統(tǒng)及偏差訂正技術(shù)是研究重點。另外,如何提高日出后、日落前實況網(wǎng)格產(chǎn)品氣溫要素的真實性也是今后需要關(guān)注的問題。站點在選址和維護(hù)中應(yīng)當(dāng)避免和及時發(fā)現(xiàn)對氣象數(shù)據(jù)有影響的障礙物,以增加臺站的區(qū)域代表性,使得融合數(shù)據(jù)與實測數(shù)據(jù)之間的差異減小。