亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        北京地區(qū)體感溫度誤差訂正方法研究

        2022-06-09 07:20:20武略焦瑞莉王毅夏江江嚴中偉李昊辰
        氣象科學(xué) 2022年2期
        關(guān)鍵詞:體感方根時效

        武略 焦瑞莉 王毅 夏江江 嚴中偉 李昊辰

        (1 北京信息科技大學(xué) 信息與通信工程學(xué)院,北京 100101; 2 國家氣象中心,北京 100081;3 中國科學(xué)院大氣物理研究所,北京 100029;4 中國科學(xué)院大學(xué),北京 100049;5 北京郵電大學(xué) 理科學(xué)院,北京 100876;6 北京大學(xué),北京 100871)

        引 言

        體感溫度是指人體所感受到的冷暖程度,其大小會受到諸如氣溫、風速、相對濕度和太陽輻射等氣象要素的綜合影響[1-3]。體感溫度不僅直接影響各類人群的日常生活、工作、旅游等,也可影響人體健康。

        體感溫度屬于人體舒適度研究范疇。人體舒適度是以人類機體與近地大氣之間的熱交換原理為基礎(chǔ),從氣象角度評價人類在不同氣候條件下舒適感的一項生物氣象指標[4]。自1966年Terjung提出人體舒適度指數(shù)概念以來,發(fā)達國家相繼開展了廣泛深入的研究,并提出了諸如風效指數(shù)、不適指數(shù)、溫濕指數(shù)等不同的生物氣象指標[5]。在1980s我國有關(guān)舒適度的研究還只是一些定性的描述,直到1990s開始才取得較快的進展。氣象領(lǐng)域人體舒適度指數(shù)研究基礎(chǔ)和關(guān)鍵在于體感溫度的研究[6]。目前,對體感溫度的預(yù)報多為基于數(shù)值天氣預(yù)報模式預(yù)報的溫度、風速和相對濕度的結(jié)果計算得到[7]。因此,對體感溫度的預(yù)報能力取決于數(shù)值天氣預(yù)報對溫度、風速和相對濕度等氣象要素的預(yù)報能力。過去40 a數(shù)值天氣預(yù)報的預(yù)報水平不斷提高[8],但由于大氣系統(tǒng)存在混沌行為、人們對天氣氣候系統(tǒng)的物理機制認識不夠、以及對外強迫的不準確描述等原因,導(dǎo)致數(shù)值天氣預(yù)報的不確定性[9-10],所以難以做到絕對準確。

        受制于數(shù)值天氣預(yù)報對單一氣象要素的預(yù)報不確定性,對多氣象要素非線性組合得到的體感溫度預(yù)報也存在不確定性,數(shù)值天氣預(yù)報需要模式后處理方法來提高對氣象要素的預(yù)報能力。利用統(tǒng)計方法如模式輸出統(tǒng)計MOS[11]、相似集合AnEn[12]、卡爾曼濾波KF[13-14]等,可在數(shù)值天氣預(yù)報模式預(yù)報的變量和目標預(yù)報量之間構(gòu)建一個統(tǒng)計關(guān)系,以此對數(shù)值模式輸出結(jié)果進行后處理訂正預(yù)報,這種方法結(jié)合了物理模擬(數(shù)值模式)和數(shù)據(jù)驅(qū)動(統(tǒng)計方法)的優(yōu)勢——以物理模擬來實現(xiàn)對環(huán)境大氣趨勢的預(yù)測結(jié)合數(shù)據(jù)驅(qū)動來實現(xiàn)對高分辨率局地特征的統(tǒng)計,在一定程度上可以提高數(shù)值天氣預(yù)報對氣象要素的預(yù)報能力。

        機器學(xué)習(xí)可以在不完全理解物理過程的情況下得到結(jié)果,以及可以相對容易的處理多種不同的數(shù)據(jù)源,機器學(xué)習(xí)對科學(xué)和技術(shù)的發(fā)展越來越重要[15]。近年大量氣象研究工作中應(yīng)用了機器學(xué)習(xí)方法[16-18]。機器學(xué)習(xí)也被作為后處理技術(shù)提高數(shù)值天氣預(yù)報模式的預(yù)報能力[19-21]。

        本研究旨在基于歐洲中期天氣預(yù)報中心(ECMWF)數(shù)值天氣預(yù)報模式的輸出,利用機器學(xué)習(xí)算法提高對體感溫度的預(yù)報。第24屆冬奧會、冬殘奧會于2022年在北京城區(qū)、延慶賽區(qū)和河北張家口賽區(qū)舉行。冰雪運動項目與氣象條件關(guān)系密切,同時冬季戶外大型賽事也對氣象服務(wù)提出了嚴苛要求,作為氣象服務(wù)中的體感溫度預(yù)報可為運動員、服務(wù)人員和觀眾提供直觀的冷熱感覺參考,具有現(xiàn)實意義。因而本研究選擇北京地區(qū)為目標研究區(qū)域,并著重研究冬季體感溫度的預(yù)報。

        1 體感溫度計算方法及資料介紹

        1.1 體感溫度經(jīng)驗計算公式

        體感溫度主要受溫度、風速和相對濕度等氣象要素的綜合影響,在以往的研究中已有廣泛的認識[22-23]。研究使用的是呂偉林[1]的體感溫度經(jīng)驗計算公式,該公式以溫度、風速、相對濕度和太陽輻射來計算體感溫度,具體為:

        Tg=T+Tu+Tf+Tr。

        (1)

        式中:Tg為體感溫度;T為氣溫;Tu為空氣相對濕度修正項;Tf為風速修正項;Tr為太陽輻射修正項。

        (2)

        其中:u為相對濕度,而ut定義為靜風、非太陽直射條件下體感溫度等于氣溫時的相對濕度:

        (3)

        風速修正項Tf為:

        (4)

        其中:V為風速。

        太陽輻射修正項為:

        Tr=0.42Ca(1-0.9Mc)Ia,

        (5)

        式中:Ca為所著衣物對太陽輻射的吸收能力,衣物顏色越深,吸收輻射能力越強,對體感溫度的增益效果越高。從夏季多數(shù)人衣著顏色偏淺、冬季多數(shù)人衣著顏色偏深這一特點考慮,夏半年Ca定為0.4,冬半年Ca定為0.75;Mc為云量系數(shù),云量越多,輻射增溫效果越弱,由于站點觀測中并沒有云量資料,所以使用降水資料進行代替,晴天時為0,降水時為1.0;Ia為輻射增溫系數(shù),其中夏季為1.2,春、秋季為0.9,冬季為0.4。

        1.2 站點數(shù)據(jù)及缺失數(shù)據(jù)插補

        采用2015年1月—2017年11月北京地區(qū)20個氣象觀測站的逐小時氣溫、相對濕度、風速數(shù)據(jù),基于該數(shù)據(jù)用公式(1)計算體感溫度作為真值數(shù)據(jù)(機器學(xué)習(xí)標注數(shù)據(jù))。站點詳細信息及缺失(或異常)數(shù)據(jù)占該站點所有數(shù)據(jù)比例如表1所示。由表可見,北京地區(qū)20個氣象觀測站的數(shù)據(jù)存在不同程度上的缺失,約2.0%~5.0%。需要對缺測資料進行必要的數(shù)據(jù)插補,才能保證資料的連續(xù)性。對于缺測資料的恢復(fù),常使用鄰站未缺測資料進行比較其差值,基于差值進行恢復(fù)?;蛘呃孟噜從攴葙Y料做線性內(nèi)插來恢復(fù)[24]。選取1個站點連續(xù)3 d的氣溫變化數(shù)據(jù),可以直觀的發(fā)現(xiàn)數(shù)據(jù)的缺失,如圖1紅色實線所示。

        為了能更充分地利用數(shù)據(jù),使用缺失數(shù)據(jù)前后的正常數(shù)據(jù)構(gòu)造插值函數(shù),如下:

        表1 北京地區(qū)20個氣象觀測站信息Table 1 Information of twenty meteorological observations stations in Beijing

        (6)

        其中:(xi,yi)和(xj,yj)分別表示缺失值前后的時間和氣象要素數(shù)值,建立線性模型,然后對缺失時刻進行插補,得到了較好的結(jié)果,如圖1藍色虛線所示。

        圖1 插補前后氣溫變化對比圖(以2015年1月1日00時(世界時,下同)—3日23時為例)Fig.1 Comparison of temperature changes before and after interpolation(0000 UTC on January 1 to 2300 UTC on January 3, 2015)

        1.3 ECMWF模式預(yù)報數(shù)據(jù)

        模式預(yù)報數(shù)據(jù)使用歐洲中期天氣預(yù)報中心(European Centre for Medium-Range Weather Forecasts,ECMWF)數(shù)值天氣預(yù)報模式輸出氣象要素。每天按照所使用的初值分為00時(世界時,下同)與12時給出2個時次的預(yù)報,時間分辨率為:0~72 h逐3 h分辨率、72~240 h逐6 h分辨率;空間分辨率中近地面分辨率為0.125°×0.125°,高空分辨率為0.25°×0.25°;時間范圍為:2015年1月—2017年11月;空間范圍選華北地區(qū)(35°~45°N,110°~ 120°E)。

        考慮到世界時和北京時存在8 h時差,本研究把ECMWF數(shù)據(jù)時間和觀測時間做了匹配,將北京時轉(zhuǎn)換為ECMWF數(shù)據(jù)對應(yīng)的世界時。

        選取44個預(yù)報氣象要素,包括地面層預(yù)報場包括2 m溫度、2 m露點溫度、表面溫度、10 m東西風、100 m東西風、10 m南北風、100 m南北風、海面溫度、大氣柱水總量、大氣柱水汽總量、平均海平面氣壓、零度層、總云量、低云量、預(yù)報反照率、對流有效位能、降雪量、雪深、總降水量、大尺度降水;氣壓層預(yù)報場包括500、850 hPa的溫度、東西風、南北風,500、850、1 000 hPa的相對濕度、比濕、散度、垂直速度、位勢高度、位勢渦度。

        2 方案設(shè)計

        研究設(shè)計了3種方案進行對比試驗,分別分析3種方案的預(yù)測效果,以選擇最優(yōu)方案進行體感溫度的預(yù)報:

        方案一為利用模式預(yù)報的氣溫、風速、相對濕度直接計算體感溫度作為預(yù)測結(jié)果,此方案為參照方案;

        方案二為將ECMWF輸出的44個氣象要素作為機器學(xué)習(xí)模型的輸入X,站點觀測計算得到的體感溫度作為模型的輸出Y,構(gòu)建兩種機器學(xué)習(xí)模型(多元線性回歸和梯度提升回歸樹)進行預(yù)測;

        方案三為使用ECMWF輸出的氣象要素組合首先計算出體感溫度,再使用MOS方法進行統(tǒng)計預(yù)報。因MOS方法作為經(jīng)典的模式后處理訂正方法[11]應(yīng)用最為廣泛,此方案定義為基于傳統(tǒng)統(tǒng)計方法做預(yù)測的代表性參照試驗。

        2.1 數(shù)據(jù)集構(gòu)建

        如上所述,方案二使用的是機器學(xué)習(xí)算法構(gòu)建模型,對其構(gòu)建相應(yīng)的機器學(xué)習(xí)數(shù)據(jù)集,將1.2節(jié)中處理得到的代表真值的體感溫度作為監(jiān)督學(xué)習(xí)中的標注(label)。

        BNP屬于多肽類激素一種,是心血管系統(tǒng)的一種具有生物活性的重要激素,能在心肌受損時快速入血進行調(diào)節(jié),能夠靈敏的反映出心肌受損的情況[6],并且與心肌受損程度正相關(guān),心肌損傷越嚴重BNP水平越高,它是一種常用且有效的心衰檢測指標。目前BNP已被納入心衰診斷指南,用于心衰患者的預(yù)測和診斷工作。本研究中,鉤藤人參高劑量組BNP水平與卡托普利組BNP水平相近,并明顯低于模型組,說明鉤藤人參高劑量組在降低HCHF大鼠BNP水平,改善心功能方面效果顯著。

        圖2 GBRT示意圖Fig.2 GBRT schematic

        將每套數(shù)據(jù)集分為訓(xùn)練集和測試集。訓(xùn)練集用于生成預(yù)測模型,測試集進行實際預(yù)測。以2015年1月16日—2017年1月19日的數(shù)據(jù)集作為訓(xùn)練集(占數(shù)據(jù)集93%),2017年1月20日—3月13日的數(shù)據(jù)集作為測試集(占數(shù)據(jù)集7%)。實際需要用到的預(yù)報時效是從最近的起報時間開始第12~72 h逐3 h間隔和第78~240 h逐6 h間隔共49個時效(舍棄3 h、6 h、9 h是考慮了北京地區(qū)獲得ECMWF模式預(yù)報數(shù)據(jù)的計算和傳輸延遲)。

        2.2 算法模型和檢驗方法

        2.2.1 模式輸出統(tǒng)計預(yù)報方法

        (7)

        2.2.2 多元線性回歸(Linear Regression,LR)

        線性模型利用輸入特征的線性函數(shù)進行預(yù)測,是回歸問題最簡單也是最經(jīng)典的線性方法。對于回歸問題,線性模型預(yù)測的一般公式如下:

        (8)

        2.2.3 梯度提升回歸樹

        梯度提升回歸樹(Gradient Booosting Regression Tree,GBRT)是由Friedman[28]提出的一種迭代的決策樹算法,該算法的基本思想是通過構(gòu)建M個弱學(xué)習(xí)器,經(jīng)過多次迭代最終組合而成一個強學(xué)習(xí)器[29]。GBRT作為回歸樹的一種,相對于一般決策樹算法具有防止過擬合、泛化能力較強等優(yōu)點。

        模型預(yù)測的時候,對于輸入的一個樣本實例,首先會賦予一個初值,然后會遍歷每一棵決策樹,每棵樹都會對預(yù)測值進行調(diào)整修正,最終的結(jié)果是將每一棵決策樹的結(jié)果進行累加得到的最后得到預(yù)測的結(jié)果,如圖2及公式(9)所示,

        F(x)=F0+β1T1(X)+β2T2(X)+…+
        βMTM(X),

        (9)

        其中:F0為初值;β為權(quán)重系數(shù);T(X)為每一顆決策樹的結(jié)果。

        GBRT有兩類重要的參數(shù);一是Boosting框架的重要參數(shù),二是弱學(xué)習(xí)器即CART回歸樹的重要參數(shù)。本文主要使用了第一類中的n_estimators(最大的弱學(xué)習(xí)器個數(shù),即迭代次數(shù),過小會欠擬合,過大又容易過擬合)、learning_rate(每個弱學(xué)習(xí)器的權(quán)重縮減系數(shù),即步長,此值較小意味著需要更多的弱學(xué)習(xí)器的迭代次數(shù)),以上兩個參數(shù)要一起調(diào)試,開始選擇一個較小的步長來網(wǎng)格搜索最好的迭代次數(shù),改變步長再次網(wǎng)格搜索,針對本文中的數(shù)據(jù)集,n_estimators和learning_rate分別設(shè)置為240和0.01。還設(shè)置了subsample(子采樣率,GBRT采用的是不放回抽樣),取值為1時,代表所有樣本都采用,即沒有進行子采樣;小于1時可以減小方差,防止過擬合,但也會增加樣本擬合的偏差,同樣對其進行網(wǎng)格搜索,定為0.6。對于CART回歸樹的參數(shù),最大特征數(shù)max_features默認為None,這是因為本文輸入的氣象要素特征為44個,特征數(shù)不多為None時即考慮所有的特征數(shù);決策樹最大深度max_depth設(shè)置為取決于樣本和特征的數(shù)量,一般為10~100,具體數(shù)值取決于數(shù)據(jù)的分布,包括樣本量和特征量,本文設(shè)置為13。葉子節(jié)點最少樣本數(shù)min_samples_leaf限制了葉子節(jié)點最少的樣本數(shù),也受樣本數(shù)量級的影響,設(shè)置為10。其他參數(shù)均為默認。

        在進行調(diào)參時,首先從n_estimators和learning_rate進行調(diào)試,控制learning_rate對n_estimators進行網(wǎng)格搜索;再對max_depth和min_samples_leaf進行網(wǎng)格搜索,得出最優(yōu)值;由于本文的特征數(shù)較少,可直接將max_features設(shè)置為None;最后考慮子采樣網(wǎng)格搜索,得到subsample的尋優(yōu)參數(shù)。而在實際問題的應(yīng)用中,調(diào)參雖然會獲得更好的預(yù)測結(jié)果,但也會消耗較多的調(diào)參時間,如何選擇合適的算法使相關(guān)問題得到又快又準確的解決也是機器學(xué)習(xí)乃至人工智能面臨的一個挑戰(zhàn)。

        2.2.4 檢驗方法

        為了更好地評價預(yù)測體感溫度的各個方法與算法,我們采用均方根誤差來對預(yù)測結(jié)果進行檢驗。均方根誤差(Root Mean Square Error, RMSE)是觀測值與真值偏差的平方與觀測次數(shù)比值的平方根,是回歸任務(wù)最常用的性能度量。

        (10)

        其中:f為所采用的算法模型;D為劃分的數(shù)據(jù)集;K為數(shù)據(jù)集D的樣本總數(shù);xk為第k個樣本的輸入;yk為第k個樣本的標記(對應(yīng)本文中的體感溫度)。

        為更好的觀察預(yù)測結(jié)果,將LR、GBRT、MOS分別與ECMWF的均方根誤差進行比較,定義3種算法的結(jié)果為Rn,ECMWF的結(jié)果為Re,可得提升效果R的計算公式如下:

        (11)

        3 結(jié)果與分析

        3.1 預(yù)測結(jié)果

        圖3 ECMWF、MOS和兩種機器學(xué)習(xí)模型的預(yù)測均方根誤差隨預(yù)報時效的變化Fig.3 Prediction of RMSEs for ECMWF, MOS and other two machine learning models with forecasting time

        用4種方法分別對49個預(yù)測時效進行預(yù)測,分別計算均方根誤差并將20個站點的結(jié)果平均,結(jié)果如圖3所示?;贚R、 GBRT、 MOS和ECMWF模式預(yù)報得到的平均RMSE分別是3.12、3.06、3.45、4.06℃。即線性回歸和GBRT明顯優(yōu)于其他兩種,傳統(tǒng)的MOS對ECMWF的提升效果只有15%;總體而言,隨著預(yù)測時效的增長,4種方法的均方根誤差都呈現(xiàn)增大態(tài)勢。

        從時間上分析,均方根誤差的分布可分為兩個階段:當預(yù)報時效小于144 h時,4種方法的預(yù)測效果呈現(xiàn)穩(wěn)定的日循環(huán)特征,相鄰日期之間的RMSE并沒有很大的差異。以ECMWF為例,當預(yù)報時效大于12 h且小于36 h時,ECMWF預(yù)報的RMSE由4.61 ℃下降到3.02℃并迅速回升到4.57℃,1 d內(nèi)平均均方根誤差為3.92℃。采用相同的方法計算36~60 h,平均均方根誤差為3.72℃,差距較小。但若進一步分析LR和GBRT,可以看到日變化的最低點隨時效增長逐漸升高,日平均均方根誤差逐漸增大,即預(yù)報時效越長,預(yù)報效果越差。當預(yù)報時效大于144 h,日循環(huán)特征不再顯著,這既是由于RMSE隨預(yù)報時效的增大長而變大,也是因為20個站點的預(yù)測效果不同,兩者共同作用導(dǎo)致進行平均處理后就抵消掉了日循環(huán)特征,其中LR和GBRT相比MOS較早的出現(xiàn)了消失現(xiàn)象。日循環(huán)現(xiàn)象是ECMWF的本身特點,因此在此基礎(chǔ)上進行訂正的3種方法也同樣具有了這種現(xiàn)象。

        從方法上分析,首先4種預(yù)測方法都遵循預(yù)報時效越長,預(yù)報效果越差這一客觀事實。通過公式(11)計算3種算法相比于ECMWF的提升度,如表2所示。其次,選取機器學(xué)習(xí)方法GBRT、傳統(tǒng)統(tǒng)計方法MOS與ECMWF進行比較:在12~72 h短期預(yù)報范圍內(nèi),3種方法預(yù)測的平均均方根誤差分別為2.72、3.07和3.73℃,GBRT和MOS相比ECMWF分別提升了27%和17%;在72~240 h中期預(yù)報范圍內(nèi),3種方法的平均均方根誤差分別為3.29、3.69和4.27℃,GBRT和MOS相比ECMWF分別提升了22%和13%,機器學(xué)習(xí)方法預(yù)報效果變差,但仍比MOS要好,這體現(xiàn)出了機器學(xué)習(xí)在體感溫度短中期預(yù)報這一方面的優(yōu)勢,也彰顯了使用機器學(xué)習(xí)進行天氣要素預(yù)報的必要性。

        表2 3種算法提升度Table 2 The degree of improvement of the three algorithms

        將20個站點的預(yù)測結(jié)果呈現(xiàn)在北京地區(qū)(39.6°~40.8°N,115.5°~117.2°E),如圖4所示,可以進一步觀察到均方根誤差隨時效的增長而逐漸變大,4種方法對中長期的預(yù)報呈現(xiàn)疲軟態(tài)勢。通過統(tǒng)計站點的數(shù)目,可以發(fā)現(xiàn)其他3種方法相比ECMWF都要具有更好的預(yù)測效果,其中線性回歸在12~36 h具有更好的預(yù)測能力(平均RMSE為2.70℃),而GBRT在216~240 h中具有更好的預(yù)測能力(平均RMSE為4.01℃),與圖3中20個站點的平均結(jié)果相符。

        進一步分析表明,在12~36 h和60~84 h時,ECMWF對20個站點的預(yù)報效果差異明顯(圖d1和圖d2),尤其北部的佛爺頂、湯河口和上甸子站點(處于40.6°~40.8°N),均方根誤差分別是9.13、8.01和5.78℃(12~36 h和60~84 h取平均,下同),在同時段相對于其他17個站點偏高(平均RMSE為3.4℃)。在采用3種算法訂正后,MOS能對3個站點起到一定的訂正效果,RMSE分別是:4.55、4.02和3.50℃,LR和GBRT取得了更好的訂正效果,RMSE分別是:3.02、3.13和2.75℃,2.89、3.20和2.74℃。

        216~240 h時均方根誤差增大,LR和MOS訂正后的空間差異不明顯,站點的均方根誤差多分布在4~5℃。但GBRT仍存在空間差異(圖b3),以40.2°N為分界線,南部13個站點的平均RMSE為3.86℃,北部7個站點的平均RMSE為4.30℃,有明顯的南北差異。

        綜上,3種訂正方法對北京地區(qū)站點的預(yù)測效果大致呈現(xiàn)北差南好的態(tài)勢,這是因為它們在ECMWF(也呈現(xiàn)“北差南好”的特點,如圖d1、d2和d3所示)的基礎(chǔ)上進行訂正。而ECMWF具有此特點是因為其網(wǎng)格點和地面站點的高程差會導(dǎo)致誤差[30],同時北京的西北部多為山區(qū),站點海拔較高,所以會出現(xiàn)此南北差異。

        圖4 (a1—a3) LR、(b1—b3) GBRT、(c1—c3) MOS和(d1—d3) ECMWF在20個站點上不同時效下逐6 h平均的預(yù)測結(jié)果(RMSE, 單位: ℃;其中高海拔站點在d3中用“△”框出): (a1、b1、c1、d1) 12 ~ 36 h; (a2、b2、c2、d2) 60 ~ 84 h; (a3、b3、c3、d3) 216 ~ 240 h Fig.4 (a1-a3) LR, (b1-b3) GBRT, (c1-c3) MOS and (d1-d3) ECMWF prediction results at 20 stations average by six hours in different models(RMSE, unit:℃; high altitude stations are boxed with “△” in d3): (a1, b1, c1, d1) from 12 h to 36 h;(a2,b2,c2,d2) from 60 h to 84 h; (a3,b3,c3,d3) from 216 h to 240 h

        3.2 海拔差異

        對20個站點分別進行預(yù)測時,發(fā)現(xiàn)預(yù)測結(jié)果在不同海拔的站點上效果不同。訂正效果在高海拔站點十分明顯,這一點在圖4中也得到印證,即使用機器學(xué)習(xí)預(yù)測高山站有著較好的提升效果。

        如圖5,定義高度大于200 m的站點為高海拔站點,將高海拔站點(延慶、佛爺頂、湯河口、上甸子、齋堂、霞云嶺,見圖4d3)和低海拔站點(觀象臺、昌平、朝陽、大興、房山、豐臺、懷柔、門頭溝、平谷、順義、通州、海淀、密云、石景山)的預(yù)測結(jié)果分別取平均,可以看到對高山站使用機器學(xué)習(xí)預(yù)測體感溫度獲得的訂正效果優(yōu)于ECMWF的預(yù)報數(shù)據(jù)和MOS預(yù)測方法,這是由于在同一經(jīng)緯度下,溫度、氣壓等要素會隨著高度的變化而變,但是ECMWF分辨率太低(約13 km),其結(jié)果不能細致刻畫局地地形、海拔等特征,在對高山站進行預(yù)報時就會出現(xiàn)較大的誤差。監(jiān)督學(xué)習(xí)的目的在于學(xué)習(xí)一個由輸入到輸出的映射,這一映射由模型來表示。簡而言之,學(xué)習(xí)的目的就在于找到最好的這樣的模型[31]。使用高山站點的觀測數(shù)據(jù)作為標記,對模型的訓(xùn)練有了更準確的參考,這也是使用機器學(xué)習(xí)進行體感溫度預(yù)測的目的之一。

        圖5 高海拔和低海拔站點的預(yù)測均方根誤差對比(單位:℃)Fig.5 Comparison of RMSE of high altitude and low altitude stations(unit:℃)

        3.3 時效差異

        圖3結(jié)果表明3種算法訂正效果對比ECMWF的預(yù)報數(shù)據(jù)有更好的預(yù)報效果,其中多元線性回歸與GBRT的表現(xiàn)比較接近,因此將多元線性回歸與GBRT進行單獨比較(圖6)。由圖可見,當預(yù)報時效較短時,兩種算法的準確率不相上下;當預(yù)報時效增長時,GBRT逐漸展現(xiàn)出優(yōu)勢。這是由于當預(yù)報時效較短時,線性模型在ECMWF的基礎(chǔ)上結(jié)合站點真值已經(jīng)能夠最大限度地進行預(yù)測,當選取算法結(jié)構(gòu)復(fù)雜的GBRT時,預(yù)測結(jié)果已得不到提升。當預(yù)報時效增長時,ECMWF的預(yù)測結(jié)果變差,結(jié)構(gòu)簡單的線性模型不能很好的分析數(shù)據(jù)特征,這時就需要GBRT或者其他相對復(fù)雜的算法來進一步分析數(shù)據(jù),提取隱藏于特征中的規(guī)律,從而提高預(yù)測效果。

        圖6 LR與GBRT預(yù)測結(jié)果的均方根誤差比較(單位:℃;線線表示102 h)Fig.6 Comparison of root mean square errors between LR and GBRT prediction results (units: ℃; green line indicate 102 h)

        結(jié)果表明,當預(yù)報時效小于102 h(圖6中綠線所處時效),優(yōu)先選擇線性回歸模型,因為其準確率高、易于操作、復(fù)雜度??;當預(yù)報時效大于102 h,選用GBRT模型去獲得更好的準確率。

        4 結(jié)論

        基于氣象站觀測數(shù)據(jù),結(jié)合ECMWF的模式預(yù)報數(shù)據(jù),本文提出了基于機器學(xué)習(xí)的模式預(yù)報訂正后處理思路,應(yīng)用于北京地區(qū)地面體感溫度預(yù)報,使用兩種機器學(xué)習(xí)算法與傳統(tǒng)MOS方法進行體感溫度的訂正預(yù)測并進行對比評估,結(jié)論如下:

        (1)3種算法訂正效果對比ECMWF的預(yù)報數(shù)據(jù)有更好的預(yù)報效果,其中多元線性回歸與GBRT的表現(xiàn)明顯優(yōu)于其他兩種方法,但隨著預(yù)測時間的延長,預(yù)測效果都出現(xiàn)了不同程度的下降;針對多元線性回歸和GBRT,兩種算法都表現(xiàn)了很好的預(yù)測效果,具體應(yīng)用時,可以不再使用單一的預(yù)測模型,而是根據(jù)預(yù)測效果結(jié)合模型的復(fù)雜程度進行算法選擇,組建集成預(yù)報模型進行預(yù)報。

        (2)在對華北地區(qū)20個站點的預(yù)測中,使用機器學(xué)習(xí)的訂正效果不僅在平原地區(qū)取得了較好的效果,在高海拔站點的訂正效果更加突出。一方面因為海拔變化后氣溫、氣壓等隨之變化,體感溫度也變化,ECMWF不能對特定高度的站點進行準確的預(yù)報;另一方面是由于監(jiān)督學(xué)習(xí)的優(yōu)勢,站點的觀測數(shù)據(jù)對模型的構(gòu)建有了很好的參考。

        猜你喜歡
        體感方根時效
        方根拓展探究
        體感交互技術(shù)在腦卒中康復(fù)中的應(yīng)用
        人體體感感知機械手設(shè)計與實現(xiàn)
        電子制作(2019年13期)2020-01-14 03:15:20
        非觸控式的體感機械臂交互控制系統(tǒng)研究
        電子制作(2017年13期)2017-12-15 09:00:05
        均方根嵌入式容積粒子PHD 多目標跟蹤方法
        J75鋼的時效處理工藝
        一種新型耐熱合金GY200的長期時效組織與性能
        上海金屬(2016年3期)2016-11-23 05:19:47
        環(huán)保執(zhí)法如何把握對違法建設(shè)項目的追責時效?
        揭開心算方根之謎
        體感語境下的交互行為設(shè)計
        欧美a级在线现免费观看| 一本无码中文字幕在线观| 熟女少妇内射日韩亚洲| 亚洲av永久无码精品秋霞电影影院| 青青草综合在线观看视频| 亚洲国产精品av麻豆一区| 免费a级毛片无码免费视频首页| 台湾无码av一区二区三区| www插插插无码视频网站| 亚洲综合网在线观看首页| 中文字幕人成乱码中文乱码| 日本成年一区久久综合| 国产乱子伦| 四月婷婷丁香七月色综合高清国产裸聊在线 | 亚洲乱码中文字幕在线| 樱桃视频影视在线观看免费| 国产精品流白浆喷水| 日本熟妇裸体视频在线| 国产精品免费一区二区三区四区 | 日本少妇熟女一区二区| 久9re热视频这里只有精品| 99亚洲男女激情在线观看| 亚洲精品国产字幕久久vr| 亚洲一区二区三区美女av| 青青草精品视频在线播放| 久久久久香蕉国产线看观看伊| 免费 无码 国产在线观看不卡 | 国产剧情av麻豆香蕉精品| 国色天香精品一卡2卡3卡4| 尤物视频一区二区| 加勒比特在线视频播放| 18禁裸体动漫美女无遮挡网站 | 婷婷色婷婷开心五月四| 精品国模一区二区三区| 亚洲高清有码在线观看| 毛片成人18毛片免费看| 蜜臀av999无码精品国产专区| 99er视频| 人妖系列在线免费观看| 真人抽搐一进一出视频| 乱码一二三入区口|