亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林的EC氣溫預(yù)報(bào)訂正研究

        2022-08-29 03:29:34李月英石美亮
        農(nóng)業(yè)災(zāi)害研究 2022年6期
        關(guān)鍵詞:格點(diǎn)氣象要素方根

        李 韜,王 磊,李月英,石美亮

        衡水市氣象局,河北衡水 053000

        氣象要素預(yù)報(bào)是以動(dòng)力氣象學(xué)、天氣學(xué)、統(tǒng)計(jì)學(xué)以及氣象觀測資料等原理與數(shù)據(jù)為參考依據(jù),根據(jù)某一區(qū)域的天氣演變規(guī)律和氣候背景,對這一區(qū)域未來一定時(shí)段內(nèi)的天氣狀態(tài)做出定性或者定量的預(yù)測。而精細(xì)化格點(diǎn)氣象要素預(yù)報(bào)是一種將地區(qū)按既定范圍劃分成格點(diǎn)狀,以格點(diǎn)為單位做超精細(xì)化的格點(diǎn)氣象要素預(yù)報(bào)。精細(xì)化格點(diǎn)氣象要素預(yù)報(bào)是在所預(yù)報(bào)的地域生成所設(shè)定大小的分辨率格點(diǎn),每個(gè)格點(diǎn)代表了一定區(qū)域范圍內(nèi)的實(shí)時(shí)風(fēng)速、比濕、高度、溫度等各類氣象要素預(yù)報(bào)值,與傳統(tǒng)數(shù)值預(yù)報(bào)相比,精細(xì)化程度明顯提升。精細(xì)化格點(diǎn)氣象要素預(yù)報(bào)是未來天氣預(yù)報(bào)發(fā)展的主要方向。隨著國內(nèi)外氣象學(xué)者對機(jī)器學(xué)習(xí)技術(shù)的不斷深入研究,段文廣[1]等提出BP神經(jīng)網(wǎng)絡(luò)進(jìn)行精細(xì)化溫度預(yù)報(bào)的方法,該方法基于時(shí)序分析技術(shù),通過在歷史序列的溫度樣本進(jìn)行迭代學(xué)習(xí)來建立預(yù)測模型。門曉磊[2]等基于機(jī)器學(xué)習(xí)的3種后處理模型和4個(gè)數(shù)值天氣預(yù)報(bào)模式對氣溫預(yù)報(bào)進(jìn)行了多模式集合預(yù)報(bào)分析,效果表現(xiàn)較好。郭瀚陽[3]等通過深度學(xué)習(xí)對強(qiáng)對流高分辨率臨近預(yù)報(bào)進(jìn)行試驗(yàn),發(fā)現(xiàn)相較傳統(tǒng)外推臨近預(yù)報(bào)方法,在強(qiáng)對流回波臨近預(yù)報(bào)準(zhǔn)確率上有較明顯的提高。方穎等[4-7]將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用與氣象因子的預(yù)報(bào)訂和正領(lǐng)域,具有明顯的提升效果。

        本文采用目前較為常用的隨機(jī)森林方法,對ECMWF數(shù)值天氣預(yù)報(bào)模式預(yù)測的2 m溫度進(jìn)行訂正。首先基于ECMWF模式計(jì)算所得的各種要素特征進(jìn)行特征選擇,即通過隨機(jī)森林算法獲得相關(guān)要素特征集,再以選擇的特征集進(jìn)行隨機(jī)森林建模,對ECMWF預(yù)測的未來3~24 h逐3 h溫度進(jìn)行訂正。為實(shí)現(xiàn)溫度的精細(xì)化預(yù)報(bào)提供新的方法和思路。

        1 資料與方法

        1.1 模式資料與實(shí)況資料

        選取衡水站、石家莊站、邢臺(tái)站3個(gè)國家氣象觀測站。

        模式資料來源于歐洲中期天氣預(yù)報(bào)中心,包含ECMWF數(shù)值天氣預(yù)報(bào)模式的各標(biāo)準(zhǔn)等壓面的溫濕度和近地面的風(fēng)、溫度、露點(diǎn)溫度、3 h降水量、海平面氣壓、地表溫度、總云覆蓋等歷史資料,資料時(shí)間序列為2015—2016年。模式起報(bào)時(shí)間均為20:00(北京時(shí)間),分辨率均為0.125°(緯度)×0.125°(經(jīng)度)。選取模式預(yù)報(bào)時(shí)效為03:00~24:00,時(shí)間間隔為3 h。實(shí)況數(shù)據(jù)是地面觀測站的1.5 m實(shí)況氣溫?cái)?shù)據(jù)。

        1.2 資料處理

        從原始模式數(shù)據(jù)中提取出格點(diǎn)的各標(biāo)準(zhǔn)等壓面的溫、濕度和近地面的風(fēng)、溫度、露點(diǎn)溫度、3 h降水量、海平面氣壓、地表溫度、總云覆蓋等資料。所使用方法為線性插值,3個(gè)站點(diǎn)插值坐標(biāo)為石家莊、衡水和邢臺(tái)。

        1.3 數(shù)據(jù)清洗

        為排除因系統(tǒng)故障或者數(shù)據(jù)存儲(chǔ)等原因造成的數(shù)據(jù)丟失、重復(fù)、錯(cuò)誤等問題,需要對模式預(yù)報(bào)格點(diǎn)數(shù)據(jù)進(jìn)行清洗。同時(shí)為了滿足特殊網(wǎng)絡(luò)模型結(jié)構(gòu)的需要,還要對數(shù)據(jù)進(jìn)行轉(zhuǎn)換、重構(gòu)等預(yù)處理。在進(jìn)行數(shù)據(jù)清洗時(shí),重復(fù)值只獲取一次,缺失值則直接刪除。

        1.4 數(shù)據(jù)標(biāo)準(zhǔn)化

        因收集的數(shù)據(jù)較大,使得模型訓(xùn)練時(shí)間過長,同時(shí)各個(gè)氣象要素的單位不統(tǒng)一,不用要素間的數(shù)值之間可能幾個(gè)數(shù)量級的差別,因此還需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)的歸一化的預(yù)處理。本文使用Z-Score算法,計(jì)算公式如下:

        將原始數(shù)據(jù)按比例放縮到同一數(shù)量級,其中,x為觀測值,y是氣象要素的總體數(shù)據(jù)均值,σ是總體數(shù)據(jù)的標(biāo)準(zhǔn)差。

        1.5 氣象關(guān)鍵要素選擇及數(shù)據(jù)集構(gòu)成

        基于數(shù)據(jù)驅(qū)動(dòng)的訂正方法需要從大量模式預(yù)報(bào)數(shù)據(jù)和實(shí)況數(shù)據(jù)中擬合出預(yù)報(bào)與實(shí)況之間的偏差關(guān)系,而模式預(yù)報(bào)數(shù)據(jù)包含要素較多,會(huì)影響到模型訓(xùn)練的效果,如何從眾多要素中獲取那些對溫度訂正最有效的關(guān)鍵要素,從而對特征空間維數(shù)進(jìn)行壓縮,即獲取一組“少而精”且回歸誤差小的要素集變得至關(guān)重要。為此,本文在EC預(yù)報(bào)要素與站點(diǎn)實(shí)況溫度基礎(chǔ)上,基于隨機(jī)森林對各氣象要素的重要性進(jìn)行重要性評估,比較特征之間的貢獻(xiàn)大?。ㄔ?~1之間數(shù)值越大代表相關(guān)性越大),篩選出與實(shí)況氣溫相關(guān)性較大的關(guān)鍵要素,進(jìn)行下一步處理。

        將EC預(yù)報(bào)的2 m溫度、2 m露點(diǎn)溫度、10 m風(fēng)速等多種要素(表1)進(jìn)行隨機(jī)森林相關(guān)性評估,結(jié)果顯示1 000 hPa溫度相關(guān)系數(shù)為0.525、2 m溫度相關(guān)系數(shù)為0.349、925 hPa氣溫相關(guān)系數(shù)為0.074、850 hPa溫度相關(guān)系數(shù)為0.031、海平面氣壓和地表溫度相關(guān)系數(shù)為0.003、其他要素的重要性均在0.002以下。因此將EC預(yù)報(bào)的1 000 hPa溫度、2 m溫度、925 hPa溫度、850 hPa溫度、海平面氣壓和地表溫度等6個(gè)特征量與1個(gè)標(biāo)簽(與模式數(shù)據(jù)時(shí)間對應(yīng)的站點(diǎn)實(shí)際觀測1.5 m溫度)整合為數(shù)據(jù)集,即數(shù)據(jù)集包含6個(gè)特征和1個(gè)標(biāo)簽,再將資料(整體數(shù)據(jù)集)隨機(jī)分為訓(xùn)練集合和測試集。測試集為隨機(jī)選取3個(gè)站點(diǎn)的各1 000組數(shù)據(jù),剩余數(shù)據(jù)為訓(xùn)練集。

        表1 EC預(yù)報(bào)要素

        1.6 訂正結(jié)果評價(jià)指標(biāo)

        評價(jià)指標(biāo)用于分析模型的訂正值和真實(shí)值之間存在的差異,數(shù)值越小說明模型的訂正效果越好。本文選擇用RMSE(Root Mean Squared Error, 均方根誤差)作為衡量訂正模型優(yōu)劣的指標(biāo),RMSE是氣溫頂正值與氣溫實(shí)況值之差的平方和與觀測次數(shù)比值的平方根,其數(shù)學(xué)公式為:

        2 隨機(jī)森林模型

        隨機(jī)森林是Breiman提出的一種基于決策樹組合的可用于分類、回歸以及多維數(shù)據(jù)處理的機(jī)器學(xué)習(xí)算法,其基本組成單元為決策樹,基本思想是二分遞歸分割法,在計(jì)算過程中充分利用二叉樹,在一定的分割規(guī)則下將當(dāng)前樣本分割為2個(gè)子樣本集,使得生成的決策樹的每個(gè)非葉節(jié)點(diǎn)都有2個(gè)分枝,這個(gè)過程又在子樣本集上重復(fù)進(jìn)行,直至不可再分為葉節(jié)點(diǎn)為止,由于單棵決策樹模型往往精度不高,并且容易出現(xiàn)過擬合現(xiàn)象,因此需要通過聚集多個(gè)模型來提高預(yù)測精度。較傳統(tǒng)決策樹算法而言,該算法能夠平衡分布不均勻樣本的誤差,分類精度高,對異常值和噪聲有很好的容忍度[7]。

        隨機(jī)森林訂正模型的構(gòu)建和優(yōu)化基于Python語言的scikit-learn類庫實(shí)現(xiàn)。主要工作流程為:(1)有放回的隨機(jī)抽取樣本數(shù)據(jù),形成新樣本集,且大小與原始樣本集保持一致。假設(shè)輸入N 個(gè)樣本數(shù)據(jù),那么新的樣本集也是N個(gè),此方法下得到的樣本集可能會(huì)有重復(fù)的樣本;(2)無放回隨機(jī)抽取特征。假設(shè)特征數(shù)為m,則中隨機(jī)抽取無重復(fù)的n個(gè)特征,作為該決策樹的輸入特征。正是因?yàn)殡S機(jī)森林遵循這兩點(diǎn),才使得隨機(jī)森林在不剪枝的情況下不容易出現(xiàn)過擬合現(xiàn)象。針對本文所研究的訂正問題,將選定的6個(gè)EC預(yù)報(bào)要素作為特征輸入隨機(jī)森林訂正模型,建立多個(gè)決策樹“森林”(圖1)。本文通過網(wǎng)格搜索算法,從參數(shù)組合中尋找最佳超參數(shù)配置。

        圖1 隨機(jī)森林結(jié)構(gòu)示意圖

        3 訂正結(jié)果分析

        3.1 總體訂正能力分析

        通過模型對3個(gè)站點(diǎn)的EC預(yù)報(bào)2 m溫度進(jìn)行訂正后,發(fā)現(xiàn)訂正后溫度誤差基本都處于正負(fù)2℃范圍內(nèi)(圖2),因此也具有參考性。從表2可知,模型對衡水、石家莊、邢臺(tái)的正確訂正率分別為52%、65%、71%,訂正后的3個(gè)站點(diǎn)均方跟誤差均減小,也說明模型具有正向訂正能力。邢臺(tái)站的均方根誤差從2.27℃降至1.62℃,訂正能力最強(qiáng);石家莊站均方根誤差從2.01℃降至1.58℃,訂正能力略低于邢臺(tái)站;衡水站的均方根誤差從1.61℃降至1.55℃,模型對衡水站的訂正能力有限,原因是EC對衡水站的溫度預(yù)報(bào)較為準(zhǔn)確,導(dǎo)致模型較難使訂正溫度準(zhǔn)確率有所提升。

        圖2 RF訂正效果散點(diǎn)圖

        表2 RF模型結(jié)果

        3.2 不同溫度區(qū)間訂正能力分析

        通過對3個(gè)站點(diǎn)不同溫度區(qū)間均方根誤差分析發(fā)現(xiàn)(圖3),在衡水站,對0℃~29.9℃范圍的氣溫實(shí)現(xiàn)了有效訂正,且對0℃~9.9℃范圍的訂正能力最強(qiáng),均方根誤差減少了0.3℃,對30℃以上和0℃以下的氣溫?zé)o訂正能力。在對石家莊站的訂正中發(fā)現(xiàn),除30℃以上氣溫訂正為無效訂正外,其他溫度范圍訂正均為有效訂正,且對0℃~9.9℃范圍的訂正能力最強(qiáng),均方根誤差減少了0.7℃,對0℃以下的氣溫訂正能力較弱。在對邢臺(tái)站的訂正中,對所有溫度區(qū)間的訂正能力均為正技巧,且對0℃~9.9℃范圍的訂正能力最強(qiáng),均方根誤差減少了0.8℃,對30℃以上和0℃以下的氣溫訂正能力較弱。

        圖3 不同溫度區(qū)間的均方根誤差

        4 結(jié)論

        (1)模型總體而言對3個(gè)站點(diǎn)的基本實(shí)現(xiàn)了有效訂正值,因此訂正結(jié)果具有一定的可參考性,且訂正能力最強(qiáng)為邢臺(tái)站,石家莊站次之,對衡水站訂正能力有限。

        (2)總體而言模型對衡水站的訂正能相對有限,可能原因是衡水地處平原地區(qū),氣象要素變化相對而言簡單,EC對該站的預(yù)報(bào)能力較強(qiáng),導(dǎo)致模型對該站點(diǎn)的訂正較難。

        (3)模型對0℃~9.9℃區(qū)間內(nèi)的溫度訂正能力最強(qiáng),對30℃及0℃以下的氣溫訂正能力相對較弱。

        猜你喜歡
        格點(diǎn)氣象要素方根
        方根拓展探究
        帶有超二次位勢無限格點(diǎn)上的基態(tài)行波解
        成都電網(wǎng)夏季最大電力負(fù)荷變化特征及其與氣象要素的關(guān)系
        一種電離層TEC格點(diǎn)預(yù)測模型
        帶可加噪聲的非自治隨機(jī)Boussinesq格點(diǎn)方程的隨機(jī)吸引子
        沈陽市1951—2013年氣候變化特征及其區(qū)域蒸發(fā)的響應(yīng)分析
        北京市朝陽區(qū)大氣污染物時(shí)空分布特征及與氣象要素的關(guān)系研究
        均方根嵌入式容積粒子PHD 多目標(biāo)跟蹤方法
        探測環(huán)境變化對臨沭站氣象要素的影響
        揭開心算方根之謎
        亚洲av无码专区亚洲av桃| 不卡的av网站在线观看| 无码孕妇孕交在线观看| 精华国产一区二区三区| 日本丰满熟妇videossexhd| 搡老熟女老女人一区二区| 亚洲韩国在线| 亚洲自偷自拍另类第一页| 极品嫩模大尺度av在线播放| 亚洲欧美牲交| 国产 国语对白 露脸| 国产成人精品人人做人人爽| 国产一区二区三区的区| 亚洲日韩久久综合中文字幕| 特级毛片a级毛片在线播放www| 亚洲日产国无码| 91偷拍与自偷拍亚洲精品86| 天天爽天天爽夜夜爽毛片| 欧美精品中文字幕亚洲专区| 亚洲视频一区二区蜜桃| 亚洲av精二区三区日韩| 国产午夜福利在线播放| 亚洲av在线播放观看| 丝袜美腿诱惑区在线播放| 国产亚洲美女精品久久久2020| 粗了大了 整进去好爽视频| 白白色发布永久免费观看视频| 国产熟人精品一区二区| 国产无遮挡又黄又爽在线观看| 日韩秘 无码一区二区三区| 亚洲一区二区三区免费av| 国产播放隔着超薄丝袜进入| 国产精品后入内射日本在线观看| av东京热一区二区三区| 久久午夜精品人妻一区二区三区| 国产成人啪精品视频免费软件| 四虎国产精品免费久久麻豆| 国产精品熟女视频一区二区三区| 天天综合网在线观看视频| 亚洲色AV性色在线观看| 99精品国产av一区二区|