孫虹雨,王 迪,劉成瀚,張 燕,王式功
(1.成都信息工程大學(xué)大氣科學(xué)學(xué)院/高原大氣與環(huán)境四川省重點(diǎn)實(shí)驗(yàn)室,四川 成都 610225;2.遼寧省氣象臺,遼寧 沈陽 110166;3.河南省氣象臺,河南 鄭州 450003;4.涼山州氣象局,四川 涼山彝族自治州 615000;5.成都平原城市氣象與環(huán)境四川省野外科學(xué)觀測研究站,四川 成都 610225)
由于大氣實(shí)際探測方式較多,觀測時間不統(tǒng)一,空間分辨率不均勻,不利于歷史資料統(tǒng)計分析。20世紀(jì)90 年代之后,美國、歐洲和日本等推出了自己的“再分析資料”,較好地解決了常規(guī)觀測資料歷史反演的困難。隨著當(dāng)前探測方式和探測資料的不斷增多,資料同化技術(shù)的迅速提升,計算機(jī)性能的高速發(fā)展,給“再分析資料”注入了新的活力,使其在時間分辨率和空間分辨率上有了質(zhì)的提升。歐洲中期天氣預(yù)報中心(ECMWF)是較早開展再分析資料研發(fā)的機(jī)構(gòu),最新的4D-Var 方法也是最早投入業(yè)務(wù)運(yùn)用。時至今日,ECMWF 推出了五代再分析資料產(chǎn)品,分別為:第一代再分析產(chǎn)品(FGGE)[1]、第二代再分析產(chǎn)品(ERA-15)[2]、第三代再分析產(chǎn)品(ERA-40)[3]、第四代再分析產(chǎn)品(ERA-Interim)[4]和第五代再分析產(chǎn)品(ERA-5)[5]。第五代再分析產(chǎn)品從數(shù)據(jù)量、時空分辨率以及同化方法上都有了較大的提高。
再分析資料質(zhì)量如何,能否反映歷史真實(shí)的大氣狀況,近年來備受關(guān)注,國內(nèi)外很多專家和學(xué)者針對不同的再分析資料做過很多質(zhì)量評估工作。孟憲貴等[6]通過對ERA5 資料的實(shí)用性進(jìn)行了分析,指出ERA5 資料的海平面氣壓和2 m 溫度與實(shí)況相關(guān)性好于2 m 相對濕度和10 m 風(fēng)場。朱景等[7]利用浙江省71 個臺站觀測的日平均氣溫和地表(0 cm)溫度資料對兩套再分析資料(ERA5 和ERA-Interim)進(jìn)行評估,指出兩套資料總體實(shí)用性均較高。秦艷慧等[8]研究表明再分析資料能較好地再現(xiàn)高原多年凍土區(qū)的地表溫度基本特征,并能較好地描述地表溫度的季節(jié)變化。滕華超等[9]和白磊等[10]通過分析ERA-Interim 風(fēng)速再分析資料的適用性,指出ERAInterim 風(fēng)速再分析資料整體具有較高的可信度,且ERA-Interim 再分析資料的氣壓、溫度的可信度要優(yōu)于NCEP/NCAR 數(shù)據(jù),但局部有差異。支星等[11-12]對再分析資料年平均高空溫度在中國地區(qū)的可信度進(jìn)行系統(tǒng)分析,指出三種再分析資料(NCEP/NCAR、ERA 和JRA)高空溫度較探空資料高空溫度偏低,ERA 和JRA 在對流層中下層與探空資料更加接近。陳艷春等[13]分析了五種再分析資料在本地的適用性,指出在環(huán)渤海區(qū)域10 m 風(fēng)場中,JRA 資料與觀測站的相關(guān)系數(shù)最高,ERA 資料的均方根誤差最小。袁松等[14],指出NCEP 資料中溫度、相對濕度、U 風(fēng)場和V 風(fēng)場絕對差值隨地點(diǎn)、高度、季節(jié)變化較小。高淑新等[15]和謝瀟等[16]指出,不同再分析資料存在一定的共性,但不同地區(qū)不同時間尺度下差異顯著,遼寧西部地區(qū)再分析資料可用性差異較大。鄭艷萍[17]通過研究ERA5 再分析資料在廣東省的適用性指出,ERA5 再分析地面資料的海平面氣壓、溫度表現(xiàn)較好,相對濕度表現(xiàn)稍差。王秀明等[18]選取60 個超級單體風(fēng)暴個例,研究再分析資料在我國強(qiáng)對流天氣環(huán)境分析中的適用性,指出NCEP 再分析資料計算的對流有效位能、水汽參數(shù)與觀測值差異較大,用K 指數(shù)、溫度直減率來分析大氣層結(jié)穩(wěn)定度效果較好。夏凡等[19]通過對WRF 預(yù)報的2 m 溫度進(jìn)行驗(yàn)證,指出08 時的預(yù)報效果好于20 時,且白天預(yù)報效果好于晚上。許敏等[20]和李翔翔等[21]指出,GRAPES和T639 模式對大雨及以上降水和小雪預(yù)報效果較好,T639 模式TS 評分高于GER、JPN 等模式;通過訂正JAR55 再分析資料,其地面溫度均方根誤差得到有效縮小。陳艷春等[22]運(yùn)用環(huán)渤海氣象臺站資料與NCEP/NCAR 等5 種再分析資料研究其適用性問題,指出ERA-Interim 資料水平分辨率較高,強(qiáng)風(fēng)時可重點(diǎn)參考。鄧小花等[23]也指出各種再分析資料所使用的同化方案、數(shù)據(jù)來源、質(zhì)量控制算法及相關(guān)的偏差校正方法不同,應(yīng)從經(jīng)驗(yàn)出發(fā)分析各類再分析資料在不同方面的優(yōu)缺點(diǎn)。
由于大氣的狀態(tài)和變化具有很強(qiáng)的地域性,已有的研究成果可為科研和業(yè)務(wù)應(yīng)用提供思路和參考依據(jù),部分成果和參數(shù)在遼寧省不一定適用。本文將重點(diǎn)分析ERA5 資料在遼寧地區(qū)的適用性,并根據(jù)ERA5 資料的誤差結(jié)果,運(yùn)用機(jī)器學(xué)習(xí)的方法進(jìn)行訂正,縮小ERA5 資料與實(shí)況資料的差距,為ERA5資料在遼寧適用性的研究和應(yīng)用提供借鑒和參考。
1.1.1 ERA5 再分析資料
為便于計算和提高運(yùn)算效率,結(jié)合遼寧省邊界,資料范圍為38°~44°N,118°~126°E。ERA5 再分析資料選取業(yè)務(wù)中常用資料包括地面溫度、露點(diǎn)、風(fēng)向和風(fēng)速資料,高空選取不同高度的氣壓、位勢高度、溫度、露點(diǎn)、風(fēng)向和風(fēng)速資料。為盡可能保證評估的普適性和代表性,選用2009 年1 月1 日—2018 年12 月31 日(北京時,下同)共10 a 資料;地面和高空時間分辨率為1 h,空間分辨率為0.25°×0.25°,高空選用11 個標(biāo)準(zhǔn)層(1 000、925、850、700、500、400、300、250、200、150、100 hPa)。
1.1.2 實(shí)況觀測資料
遼寧省共有國家地面站62 個,探空站4 個,站點(diǎn)分布如圖1 所示。文中涉及的地圖,均來自于“標(biāo)準(zhǔn)地圖服務(wù)網(wǎng)”下載的中國標(biāo)準(zhǔn)地圖,審圖號為GS(2020)4619 號。實(shí)況資料時間為2009 年1 月1日—2018 年12 月31 日共10 a 資料,地面觀測資料選取62 個國家站的溫度、露點(diǎn)、風(fēng)向和風(fēng)速資料,探空資料選取氣壓、高度、溫度、露點(diǎn)、風(fēng)向和風(fēng)速資料。由于ERA5 再分析資料的時間分辨率為1 h,所以地面資料也選用逐小時資料進(jìn)行匹配;高空選用每日2 次(08、20 時)的探空資料。所有觀測資料來自遼寧省氣象局,本文使用的站點(diǎn)均為考核站點(diǎn),數(shù)據(jù)質(zhì)量可信度較高。
圖1 遼寧省國家氣象觀測站和探空站分布
為分析和檢驗(yàn)實(shí)況觀測資料和ERA5 再分析資料的差異,很多專家運(yùn)用不同的方法將再分析資料匹配到實(shí)況觀測站點(diǎn)上,其中有雙線性插值法和鄰近點(diǎn)匹配法等。朱景等[7]通過研究指出,雙線性插值會帶來插值誤差,而且鄰近點(diǎn)匹配法誤差相對較小;所以本文將采用鄰近點(diǎn)匹配法,將ERA5 再分析資料和地面及高空實(shí)況觀測資料進(jìn)行匹配。為定量評估再分析資料的性能,選用均方根誤差和相關(guān)系數(shù)來檢驗(yàn)再分析資料對實(shí)況觀測的偏離程度。相關(guān)系數(shù)(RR)公式:
均方根誤差(RMSE)公式:
式中:N 為樣本數(shù)量,i 為每一個樣本,XERA5為ERA5再分析資料,Xobs為實(shí)況觀測資料。
為提升ERA5 資料的適應(yīng)性,減小資料與實(shí)況資料的均方根誤差,提高相關(guān)系數(shù),本文采用機(jī)器學(xué)習(xí)的方法對ERA5 地面溫度和相對濕度資料進(jìn)行訂正。機(jī)器學(xué)習(xí)模型選用線性回歸中的嶺回歸算法(Ridge),采用“K 折交叉驗(yàn)證”的方法將訓(xùn)練集和評估集隨機(jī)分離,運(yùn)用“10 折交叉驗(yàn)證”的方法評估模型準(zhǔn)確度。嶺回歸算法最大的優(yōu)勢是可用于共線性分析的有偏估計回歸方法,通過損失部分信息的代價,獲取更真實(shí)可靠的回歸方法。本文采用Python的Sklearn 庫包,調(diào)用嶺回歸算法模型來實(shí)現(xiàn)[24]。
2.1.1 地面氣象要素相關(guān)系數(shù)分布
由全省站點(diǎn)相關(guān)系數(shù)分析可知,2 m 溫度相關(guān)系數(shù)>0.99 的站點(diǎn)大多集中于遼河流域及其西側(cè)地區(qū),大連、葫蘆島地區(qū)相關(guān)系數(shù)相對較低,但均>0.94,也屬強(qiáng)相關(guān)。2 m 露點(diǎn)溫度相較于2 m 溫度,相關(guān)系數(shù)>0.99 的地方較少,主要分布于沈陽和鐵嶺地區(qū),但≥0.98 的地區(qū)較多,在全省均有分布;2 m 露點(diǎn)溫度相關(guān)系數(shù)低值區(qū)依然集中于大連和葫蘆島地區(qū)。地面氣壓相關(guān)系數(shù)均較高,平均值高達(dá)0.994,僅有個別站點(diǎn)相關(guān)系數(shù)出現(xiàn)<0.95 的情況,說明ERA5 再分析資料在地面氣壓的反演中表現(xiàn)優(yōu)越。10 m 風(fēng)速的對比中發(fā)現(xiàn)相關(guān)系數(shù)總體下降,平均相關(guān)系數(shù)僅0.684,但遼河流域及兩側(cè)地區(qū)依然是相關(guān)系數(shù)高值區(qū),撫順、丹東、葫蘆島地區(qū)最低,僅達(dá)到0.55~0.60;大連、本溪部分地區(qū)較低。由于風(fēng)向?yàn)?°~360°,對比驗(yàn)證不便,故采用U、V 分量形式對比驗(yàn)證,U 分量代表緯向風(fēng),V 分量代表徑向風(fēng)。由10 m 風(fēng)場U、V 分量相關(guān)系數(shù)可知,U 分量相關(guān)系數(shù)明顯低于V分量,這和均方根誤差U 分量高于V 分量有明顯不同,在業(yè)務(wù)應(yīng)用時要特別注意;且U 分量相關(guān)系數(shù)平均值僅0.666,V 分量相關(guān)系數(shù)平均值僅0.818,U、V 分量相關(guān)系數(shù)高值區(qū)主要位于遼河流域地區(qū),丹東、本溪、朝陽地區(qū)較低,最低僅0.44;V 分量相關(guān)系數(shù)雖然較U 分量高,但>0.90 的站數(shù)僅13 個,高相關(guān)系數(shù)區(qū)位于遼河流域及以西區(qū)域,東部站點(diǎn)的相關(guān)系數(shù)明顯偏小。
2.1.2 地面氣象要素均方根誤差分布
由全省站點(diǎn)均方根誤差分布可知,2 m 溫度(圖2a)的均方根誤差總體<2 m 露點(diǎn)溫度(圖2b),2 m溫度均方根誤差最低為1.56 ℃,平均為2.0 ℃,而2 m 露點(diǎn)溫度均方根誤差最低為1.89° ℃,平均為2.4 ℃;從空間分布也能直觀看出,2 m 溫度的均方根誤差在1.5~2.0 ℃分布較廣,特別是遼河流域以西最為集中,且僅有個別點(diǎn)均方根誤差>2.6 ℃;2 m露點(diǎn)溫度均方根誤差在1.5~2.0 ℃的僅有4 個站點(diǎn),均分布于遼寧北部的沈陽和鐵嶺地區(qū),均方根誤差在2.1~2.5 ℃分布最廣,大連地區(qū)的均方根誤差較大且分布集中。由地面氣壓的均方根誤差分布(圖2c)可知,最低為0.46 hPa,均方根誤差大值區(qū)集中于遼寧的東部和西部,誤差最高為本溪桓仁站(32.2 hPa),均方根誤差較低的地方主要集中于遼河流域及其西側(cè)地區(qū)。
圖2 地面氣象要素均方根誤差空間分布(a 為2 m 溫度,b 為2 m 露點(diǎn)溫度,c 為地面氣壓,d 為10 m 風(fēng)速,e 為10 m 風(fēng)場U 分量,f 為10 m 風(fēng)場V 分量)
10 m 風(fēng)速(圖2d)均方根誤差高值和低值在全省分布較為分散,全省14 個地市中,均有誤差高值和低值區(qū)。經(jīng)統(tǒng)計發(fā)現(xiàn),風(fēng)速誤差最低為1.2 m/s,最高為2.9 m/s,平均為1.76 m/s,總體表現(xiàn)良好;>2.0 m/s 的站點(diǎn)多分布于沿海地區(qū),推測可能是受海洋影響,ERA5 再分析資料反演質(zhì)量較差造成。根據(jù)U、V 風(fēng)場空間分布可知(圖2e、2f),遼寧中北部地區(qū)U 風(fēng)場均方根誤差低于V 風(fēng)場,10 m 風(fēng)場U 分量均方根誤差平均值為1.5 m/s,較10 m 風(fēng)場V 分量總體較低,特別是遼寧中北部地區(qū)均方根誤差均<1.5 m/s,大連、朝陽、葫蘆島地區(qū)誤差相對較高,大連地區(qū)的誤差最高,但大多≤2.8 m/s;10 m 風(fēng)場V 分量誤差平均值為2.0 m/s,高誤差地區(qū)全省分布較為分散,誤差>2.5 m/s 的地區(qū)位于大連、撫順、營口和葫蘆島地區(qū)。
2.1.3 地面氣象要素相關(guān)系數(shù)及誤差逐月變化特征
為研究地面各觀測要素和ERA5 資料對比狀況,根據(jù)各要素在不同月份的平均相關(guān)系數(shù)和平均均方根誤差對比特征,繪制了月變化分布圖(圖3)。選取了相對濕度(RH)、風(fēng)速(V)、U 風(fēng)場(u)、V 風(fēng)場(v)分量等4 個月變化特征相對明顯的要素,其他月變化特征不明顯的要素在此省略。根據(jù)相關(guān)系數(shù)逐月分布可以看出地面相對濕度的相關(guān)系數(shù)要高于風(fēng)速、U 風(fēng)場和V 風(fēng)場,各要素月變化特征明顯;1—4月相關(guān)系數(shù)呈波動上升趨勢,4 月達(dá)到最大值后開始下降,7 月達(dá)到最低,而后開始上升至10 月;總體呈現(xiàn)春秋季平均相關(guān)系數(shù)好于夏冬季。因相對濕度(RH)平均均方根誤差較大,為清楚顯示風(fēng)速、U 風(fēng)場、V 風(fēng)場月變化特征,故在圖3 均方根誤差圖中右側(cè)單獨(dú)列出相對濕度坐標(biāo)軸(紅色)。由平均均方根誤差月分布(圖3b)可以看出,相對濕度的均方根誤差最高,所有要素的均方根誤差月變化特征明顯,春季最高,夏季最低;相關(guān)系數(shù)高的季節(jié),均方根誤差也偏高。U、V 風(fēng)場的月變化中,U 風(fēng)場平均相關(guān)系數(shù)低于V 風(fēng)場,但風(fēng)場的平均均方根誤差為1.773,U風(fēng)場平均均方根誤差也小于V 風(fēng)場;而風(fēng)速的平均相關(guān)系數(shù)僅有0.670,在業(yè)務(wù)和科研使用中需要注意。
圖3 遼寧省所有地面站點(diǎn)各要素平均相關(guān)系數(shù)(a)和平均均方根誤差(b)逐月分布
遼寧省共有4 個探空氣象站,分別為沈陽、大連、丹東和錦州站,為保證研究區(qū)域的全面性,增加遼寧省周圍的5 個探空站進(jìn)行補(bǔ)充分析,分別是吉林省的長春和臨江站,內(nèi)蒙古的通遼和赤峰站,以及河北省的樂亭站。
2.2.1 高空氣象觀測要素相關(guān)系數(shù)分布
根據(jù)探空站的ERA5 再分析資料和實(shí)況資料對比相關(guān)系數(shù)分析發(fā)現(xiàn)(圖4),總體上溫度的相關(guān)系數(shù)最高,在高空300 hPa 以下,相關(guān)系數(shù)均超過0.95,300 hPa 以上丹東站和錦州站相關(guān)系數(shù)略有降低,錦州站在150 hPa 處最低,為0.74。從溫度相關(guān)系數(shù)隨氣壓的分布廓線(圖4a)可知,錦州站最低、丹東站次之,其他站點(diǎn)分布較為一致,且相關(guān)系數(shù)隨高度變化較??;平均相關(guān)系數(shù)最高為大連站,達(dá)到0.991,其次是通遼站;ERA5 高空資料在遼寧中部地區(qū)的質(zhì)量要高于東西部地區(qū),這可能和地形有關(guān),遼寧中部為遼河流域平原地帶,海拔較低,東西部分別為山區(qū)和丘陵地帶,地形可能影響了ERA5 資料同化。而ERA5 資料的相對濕度(圖4b)質(zhì)量相比于溫度稍差,多數(shù)站在低層相關(guān)系數(shù)高于高層,丹東和錦州站相關(guān)系數(shù)在中層及以下明顯較其他站點(diǎn)偏小,大連站相關(guān)系數(shù)在中層突然大幅度減小,其他層結(jié)相關(guān)系數(shù)較高;相對濕度的平均相關(guān)系數(shù)最高是大連站,為0.723,其次是通遼站,為0.675,最低是臨江站,為0.547;相對濕度的診斷在天氣預(yù)報中至關(guān)重要,在日常業(yè)務(wù)和研究中,若使用ERA5 再分析資料的相對濕度數(shù)據(jù)時,應(yīng)謹(jǐn)慎使用。由U 風(fēng)場的相關(guān)系數(shù)(圖4c)分布可知,中低層以上相關(guān)系數(shù)整體較高,且越往高空相關(guān)系數(shù)基本呈現(xiàn)升高趨勢(除150 hPa異常偏低);相關(guān)系數(shù)在低空普遍較低,1 000 hPa 丹東和錦州站偏低尤為明顯;除丹東和錦州站,其他站在中層及以上相關(guān)系數(shù)均超過0.9,相關(guān)性較強(qiáng),說明ERA5 資料對東西方向的風(fēng)整體質(zhì)量較高,優(yōu)于南北方向。相較于U 風(fēng)場,V 風(fēng)場(圖4d)相關(guān)系數(shù)整體偏低,特別是丹東和錦州站的V 風(fēng)場相關(guān)系數(shù)較低,且兩站從中層到高層相關(guān)系數(shù)逐漸減小,100 hPa 達(dá)到最小,此時錦州站相關(guān)系數(shù)僅為0.701。除丹東和錦州站外,其他站點(diǎn)的V 風(fēng)場相關(guān)系數(shù)總體較高、整層平均相關(guān)系數(shù)均超過0.9,平均相關(guān)系數(shù)最高是大連站,為0.963。
2.2.2 高空氣象觀測要素均方根誤差分布
高空ERA5 資料和實(shí)測資料對比均方根誤差分布如圖5 所示。根據(jù)溫度均方根誤差分布(圖5a)可知,ERA5 資料在丹東站和錦州站的均方根誤差最大,與這兩地的相關(guān)系數(shù)較低相一致;總體呈現(xiàn)中層均方根誤差最小,低空均方根誤差整體較高;最大溫度均方根誤差出現(xiàn)在錦州站的950 hPa,為4.089;各層平均均方根誤差最高的為錦州站,均方根誤差為3.134,其次為丹東站,最小是通遼站,為0.904。相對濕度的均方根誤差(圖5b)總體較大,從低空到300 hPa 均方根誤差上升較快,在300 hPa 達(dá)到最大,各站在300 hPa 平均均方根誤差為35.540;從各站平均均方根誤差看,通遼站最小,為21.933,最大是臨江站,為25.096;在分析天氣時,如需研究相對濕度或濕度相關(guān)物理量時要特別注意。由U 風(fēng)場均方根誤差分布(圖5c)可知,誤差較大的站點(diǎn)出現(xiàn)在丹東站和錦州站,其中丹東站誤差最大,平均均方根誤差,為5.838,其次是錦州站為4.968,平均均方根誤差最小是通遼站,為2.290;由垂直分布可以看出,大多數(shù)站點(diǎn)的均方根誤差集中在2 左右,且越往高空,誤差越大,在150 hPa 誤差急劇升高達(dá)到最大;誤差最大值是150 hPa 的丹東站,為9.127。由V 風(fēng)場的均方根誤差垂直分布(圖5d)可知,誤差最大的站點(diǎn)依然出現(xiàn)在丹東站和錦州站,且平均均方根誤差值明顯超過U 風(fēng)場,丹東站平均誤差最大,錦州站次之,最大誤差出現(xiàn)在250 hPa 的丹東站,為9.392;大多數(shù)站點(diǎn)的各層均方根誤差也都集中于2 附近,這種分布方式和U 風(fēng)場類似,但V風(fēng)場的總平均誤差要高于U 風(fēng)場;從低層到高層,V 風(fēng)場均方根誤差呈現(xiàn)上升趨勢,但在250 hPa 達(dá)到最高,再往高空誤差下降,這種分布和U 風(fēng)場既有相似之處,又有區(qū)別;再次說明,ERA5 資料總體經(jīng)向風(fēng)(V 風(fēng)場)質(zhì)量低于緯向風(fēng)(U 風(fēng)場)。
圖5 高空觀測要素均方根誤差分布(a 為溫度,b 為相對濕度,c 為U 風(fēng)場,d 為V 風(fēng)場)
2.2.3 高空氣象要素相關(guān)系數(shù)及誤差逐月變化特征根據(jù)所有探空站點(diǎn)實(shí)測資料,與ERA5 資料各層次一一匹配,繪制了溫度(T)、相對濕度(RH)、U風(fēng)場(u)和V 風(fēng)場(v)平均相關(guān)系數(shù)和平均均方根誤差逐月分布圖(圖6)。由于相對濕度的相關(guān)系數(shù)較其他要素低,均方根誤差較其他要素高,特將相對濕度用單獨(dú)坐標(biāo)軸繪制(右側(cè)紅軸)。由相關(guān)系數(shù)分布(圖6a)可知,相對濕度相關(guān)系數(shù)最低,但其有很強(qiáng)的月變化特征,呈現(xiàn)“單峰單谷”型,從年初相關(guān)系數(shù)迅速下降,到4 月達(dá)到最低(相關(guān)系數(shù)為0.636),然后從6 月開始快速上升,8 月達(dá)到最高,相關(guān)系數(shù)為0.750,之后繼續(xù)下降;可見相對濕度的平均相關(guān)系數(shù)在春夏之交時最低,夏季相關(guān)系數(shù)上升較快,夏秋之交時相關(guān)系數(shù)達(dá)到最高。平均相關(guān)系數(shù)最高的為溫度,月變化較小,各月平均相關(guān)系數(shù)均在0.99以上。U 風(fēng)場平均相關(guān)系數(shù)是明顯高于V 風(fēng)場,這和上文的研究結(jié)果相一致,U 風(fēng)場全年月變化不及V 風(fēng)場明顯,V 風(fēng)場相關(guān)系數(shù)從年初開始升高,5 月達(dá)到最高(相關(guān)系數(shù)為0.947),而后緩慢下降。從平均均方根誤差的分布(圖6b)來看,相對濕度誤差分布依然具有很強(qiáng)的月變化特征,呈現(xiàn)“單峰”型,6 月最高(均方根誤差為27.892),1 月最低(均方根誤差為21.524),在相關(guān)系數(shù)快速上升的月(6—8 月),平均均方根誤差也呈現(xiàn)出快速上升的趨勢。溫度的平均均方根誤差最小,年平均值為1.6,且波動較小。U風(fēng)場和V 風(fēng)場的均方根誤差相差不大,U 風(fēng)場稍低一些,而且U、V 風(fēng)場平均均方根誤差月變化較一致,季節(jié)性變化明顯,冬季最高,夏季最低。
圖6 遼寧省所有探空站各氣象要素平均相關(guān)系數(shù)(a)和平均均方根誤差(b)逐月分布
為提升ERA5 再分析資料的業(yè)務(wù)和科研應(yīng)用,結(jié)合前面的分析發(fā)現(xiàn),ERA5 資料溫度的數(shù)據(jù)質(zhì)量相對較高,而相對濕度的數(shù)據(jù)質(zhì)量相對較低,鑒于文章篇幅有限,本次選擇了兩種具有代表性的要素進(jìn)行試驗(yàn)訂正,訂正方法選擇機(jī)器學(xué)習(xí)模型,將地面ERA5 資料的溫度和相對濕度進(jìn)行訂正。將每一個國家站點(diǎn)的ERA5 與實(shí)況資料的均方根誤差(以下簡稱為“原誤差”)減去機(jī)器學(xué)習(xí)模型訂正結(jié)果資料和實(shí)況資料的均方根誤差(以下簡稱為“訂正后誤差”),得到均方根誤差之差空間分布(圖7)。
圖7 各國家站點(diǎn)地面溫度(a)和相對濕度原誤差(b)與訂正后誤差之差空間分布
由國家站點(diǎn)的地面溫度均方根誤差之差可知,原誤差平均值為2.1,訂正后誤差平均值為1.9,說明基于嶺回歸算法的機(jī)器學(xué)習(xí)訂正方法有效縮小了ERA5 資料與實(shí)況資料的差距;由各站點(diǎn)地面溫度原誤差與訂正后誤差空間分布(圖7a)可知,正值誤差越大說明機(jī)器學(xué)習(xí)訂正算法效果越好,負(fù)值越大說明機(jī)器學(xué)習(xí)訂正算法起到反作用越大,差值大部分集中在0~1.0,0~0.5 分布最多,證明機(jī)器學(xué)習(xí)訂正算法可有效縮減小誤差0.5~1.0 ℃,其中遼河平原地區(qū)提升效果明顯;遼寧南部的部分地區(qū)訂正有反作用,分布比較分散,但均≤-0.7 ℃,業(yè)務(wù)運(yùn)用或科研中注意適當(dāng)調(diào)整。由國家站點(diǎn)的地面相對濕度均方根誤差之差可知,原誤差平均值為11.7,訂正后誤差平均值為10.3,訂正效果好于地面溫度;由各站點(diǎn)地面相對濕度原誤差與訂正后誤差空間(圖7b)分布可知,相對濕度的訂正最好的地區(qū)普遍位于遼寧的南部地區(qū),大連、營口、丹東地區(qū)分布最集中,遼西的葫蘆島地區(qū)也有較多分布,誤差最高可降低26%;遼寧中部地區(qū)的本溪、遼陽地區(qū)訂正反作用較為集中,但起到反作用的站點(diǎn)數(shù)理明顯低于正作用的數(shù)量。從機(jī)器學(xué)習(xí)的嶺回歸算法訂正結(jié)果的綜合分析可知,本方法可有效提升ERA5 資料的應(yīng)用能力,有效縮小與實(shí)況資料的差距。
(1)地面要素相關(guān)系數(shù)中2 m 溫度整體較高,大多集中于遼河流域及以西地區(qū),2 m 露點(diǎn)溫度相關(guān)系數(shù)稍低于2 m 溫度,但大多超過98%,2 m 溫度均方根誤差<2 m 露點(diǎn)溫度;地面氣壓相關(guān)系數(shù)均較高,平均值高達(dá)0.994,遼寧的東部和西部地區(qū)均方根誤差較大。高空站點(diǎn)溫度的相關(guān)系數(shù)最高,低層均方根誤差整體高于中高層,相對濕度相關(guān)系數(shù)整體較低,均方根誤差較大。
(2)地面10 m 風(fēng)速平均相關(guān)系數(shù)整體相對較低,遼河流域及兩側(cè)地區(qū)依然是相關(guān)系數(shù)高值區(qū),均方根誤差全省分布不均;地面風(fēng)場U 分量相關(guān)系數(shù)明顯低于V 分量,且遼寧中北部地區(qū)U 分量均方根誤差低于V 分量。高空站點(diǎn)遼寧中部地區(qū)的數(shù)據(jù)質(zhì)量要高于東部、西部地區(qū);U 風(fēng)場的相關(guān)系數(shù)從中低層以上整體比較高,且往高空相關(guān)系數(shù)呈現(xiàn)升高趨勢,均方根誤差集中在2 左右,且越往高空,誤差越大;ERA5 資料在高空總體經(jīng)向風(fēng)(V 風(fēng)場)質(zhì)量低于緯向風(fēng)(U 風(fēng)場)。
(3)地面相對濕度、風(fēng)速、U 風(fēng)場和V 風(fēng)場平均相關(guān)系數(shù)和均方根誤差月變化特征明顯,相對濕度相關(guān)系數(shù)和均方根誤差整體最高,相關(guān)系數(shù)總體呈現(xiàn)春秋季高于夏冬季,所有要素的均方根誤差分布呈現(xiàn)春季高、夏季低的狀態(tài),且相關(guān)系數(shù)高的季節(jié),均方根誤差也偏高;U 風(fēng)場相關(guān)系數(shù)低于V 風(fēng)場,U風(fēng)場均方根誤差也低于V 風(fēng)場。
(4)高空資料逐月分布中,溫度的相關(guān)系數(shù)最高,均方根誤差最小;U 風(fēng)場平均相關(guān)系數(shù)明顯高于V 風(fēng)場;相對濕度的相關(guān)系數(shù)在春夏之交時最低,夏季相關(guān)系數(shù)上升較快,夏秋之交時達(dá)到最高;而相對濕度在相關(guān)系數(shù)快速上升的月,均方根誤差也呈現(xiàn)出快速上升的趨勢。U 風(fēng)場和V 風(fēng)場的均方根誤差相差不大,且均方根誤差月變化相一致。
(5)通過機(jī)器學(xué)習(xí)的訂正方法可有效提升地面溫度和相對濕度的應(yīng)用能力,ERA5 地面溫度資料的均方根誤差減小主要集中在遼河流域,誤差減小0.5~1.0 ℃;地面相對濕度資料的均方根誤差減小主要分布于遼寧南部地區(qū),降低誤差最高達(dá)到26%。