亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)的韶關(guān)地區(qū)短期日平均氣溫研究

        2022-12-06 07:23:06羅燁泓
        陜西氣象 2022年6期
        關(guān)鍵詞:效果模型

        羅 威,羅燁泓,王 威

        (1.興寧市氣象局,廣東興寧 514500;2.韶關(guān)市氣象局,廣東韶關(guān) 512028;3.深圳市氣象局,廣東深圳 518000)

        自工業(yè)革命以來,人類活動所導(dǎo)致的大氣二氧化碳排放量劇增,更多的熱量被截留在大氣層內(nèi),致使地球氣溫增高。受此影響,全球平均表面溫度自工業(yè)革命以來表現(xiàn)出顯著的上升趨勢。全球變暖會引起冰雪融化、凍土消融、海平面上升、極端天氣頻發(fā)等,其嚴(yán)重威脅了全球自然生態(tài)系統(tǒng),乃至人類的生存[1-6]。為此,開展針對全球氣溫的精細(xì)化預(yù)報(bào)研究具有重要現(xiàn)實(shí)意義。

        近年來,監(jiān)督類機(jī)器學(xué)習(xí)(樹模型、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等)和深度學(xué)習(xí)算法等各類機(jī)器學(xué)習(xí)算法已在氣象短臨[1]、中短期[2]乃至長期預(yù)報(bào)[3]等領(lǐng)域發(fā)揮了積極的重要作用,其在相關(guān)領(lǐng)域中的表現(xiàn)要顯著優(yōu)于統(tǒng)計(jì)和主觀經(jīng)驗(yàn)等傳統(tǒng)方法。相較于其他方法而言,監(jiān)督類機(jī)器學(xué)習(xí)算法能夠更有效綜合應(yīng)用來自觀測、數(shù)值模式等多源數(shù)據(jù),據(jù)此可更有效地提取大氣的非線性演化特征,進(jìn)而提升數(shù)值模式的天氣預(yù)報(bào)效果。然而,受地形、模式參數(shù)化方案等不確定性因素的共同影響,目前數(shù)值預(yù)報(bào)模式對氣溫的預(yù)報(bào)尚存在一定的偏差,尤其對于中小城市、偏遠(yuǎn)以及具有復(fù)雜地形的地區(qū)而言,預(yù)報(bào)方法通常僅依賴于數(shù)值模式,且缺乏有效的補(bǔ)充與優(yōu)化方法。韶關(guān)地區(qū)地處南嶺山脈南麓,屬于亞熱帶季風(fēng)氣候區(qū),夏無酷暑,冬無嚴(yán)寒,雨量充沛,日照溫和,氣候條件優(yōu)越,生態(tài)與旅游資源豐富,并且是廣東省重要的糧食蔬菜供應(yīng)地、農(nóng)業(yè)大市。因此,針對韶關(guān)地區(qū)等中小城市氣溫預(yù)報(bào)業(yè)務(wù)算法的開發(fā)對推動氣象業(yè)務(wù)的精細(xì)化預(yù)報(bào)具有重要意義。為此,僅利用1965—2017年韶關(guān)地區(qū)8個站點(diǎn)的日平均氣溫觀測資料,構(gòu)建了基于歷史數(shù)據(jù)驅(qū)動與機(jī)器學(xué)習(xí)方法的短期氣溫預(yù)報(bào)模型,以期為中小城市乃至偏遠(yuǎn)地區(qū)的氣溫業(yè)務(wù)預(yù)報(bào)的改進(jìn)提供參考,為當(dāng)?shù)厣鷳B(tài)環(huán)境的改善、社會經(jīng)濟(jì)的發(fā)展提供科學(xué)決策依據(jù)。

        1 資料和方法

        1.1 資料介紹

        基于1965—2017年韶關(guān)地區(qū)8個臺站(南雄、曲江、樂昌、仁化、乳源、始興、翁源和新豐)的日平均氣溫,求取上述8個站點(diǎn)日平均氣溫的平均值。臺站的基本信息見表1。

        表1 韶關(guān)地區(qū)各個臺站基本信息

        1.2 方法介紹

        本文用于短期氣溫預(yù)報(bào)的算法分別有傳統(tǒng)回歸方法——逐步多元線性回歸法和機(jī)器學(xué)習(xí)方法——LightGBM(light gradient boosting machine)和BP-NN(back propagation neural network)。短期日平均氣溫預(yù)報(bào)的流程主要可概括如下:(1)將連續(xù)nd的日平均氣溫(T1,T2, ……,Tn)作為自變量,將第n+1,n+2,n+3天所分別對應(yīng)的日平均氣溫Tn+1,Tn+2,Tn+3作為因變量來構(gòu)建預(yù)報(bào)Tn+1,Tn+2,Tn+3的模型。(2)n是決定Tn+1,Tn+2,Tn+3預(yù)報(bào)精度的重要參數(shù),因此在1~365 d的范圍內(nèi)對n進(jìn)行遍歷,最終確定了n=7時(shí)可使T8,T9,T10的預(yù)報(bào)效果達(dá)到最優(yōu)。即將過去連續(xù)7 d的日平均氣溫(T1,T2, ……,T7)作為自變量,以未來3 d日平均氣溫(T8,T9,T10)作為因變量,來構(gòu)建相應(yīng)的日平均氣溫預(yù)報(bào)模型。

        1.2.1 逐步多元線性回歸 逐步多元線性回歸[4]是基于最優(yōu)的自變量來構(gòu)建回歸模型,其較好地解決了傳統(tǒng)多元線性回歸法中所存在的共線性問題[5],從而有利于回歸模型獲得更加精確的計(jì)算效果。目前,多元逐步線性回歸法已被廣泛應(yīng)用于氣象領(lǐng)域,其詳細(xì)流程可詳見文獻(xiàn)[4]。

        1.2.2 LightGBM(light gradient boosting machine)算法 LightGBM[6]是微軟在2017年提出的基于GBDT的算法。相較于傳統(tǒng)樹模型而言,LightGBM預(yù)報(bào)精度更高、模型泛化性更強(qiáng)、計(jì)算效率更快,適用于大規(guī)模數(shù)據(jù)集的并行計(jì)算。LightGBM算法的原理參照文獻(xiàn)[6]。

        1.2.3 BP-NN(back propagation neural network)算法 BP-NN算法的原理參照文獻(xiàn)[7]。為避免權(quán)重參數(shù)過多而引起過擬合,本文的BP-NN僅5層,由1層輸入層、3層隱藏層、1層輸出層組成,其中隱藏層的特征維度為100。為了增強(qiáng)BP-NN的訓(xùn)練/預(yù)報(bào)效果,采用如下優(yōu)化機(jī)制。(1)Kaiming初始化方案[8];(2)Relu激活層[9];(3)L2正則化方案[10],權(quán)重衰減系數(shù)為0.000 1;(4)Adam優(yōu)化算法;(5)余弦退火的學(xué)習(xí)率衰減策略:學(xué)習(xí)率隨訓(xùn)練迭代次數(shù)的增大而呈現(xiàn)余弦的周期形態(tài)變化,變化的周期為100次迭代,學(xué)習(xí)率最大值為0.001,最小值為0.000 01;(6)均方誤差(mean square error, MSE)的損失函數(shù);(7)自變量與因變量均采用最大最小值歸一化。

        2 結(jié)果與分析

        2.1 Tn+1, Tn+2, Tn+3與T1~n之間的相關(guān)性

        表2為Tn+1,Tn+2,Tn+3與T1~n(n=7)之間的相關(guān)性,從表2可見,隨著自變量與因變量之間時(shí)間間隔的增大,其對應(yīng)的相關(guān)性逐漸降低,但總體仍十分顯著。因此,其顯著的相關(guān)性為以歷史日平均氣溫作為自變量來預(yù)報(bào)未來短期內(nèi)的日平均氣溫奠定了基礎(chǔ)。

        表2 未來日平均氣溫與歷史日平均氣溫之間的相關(guān)性

        2.2 三種短期日平均氣溫預(yù)報(bào)模型的構(gòu)建

        取1965—2014年的日平均氣溫作為逐步多元線性回歸法建模數(shù)據(jù)集,并作為LightGBM與BP-NN模型的訓(xùn)練集,2015—2016年的作為兩種機(jī)器學(xué)習(xí)模型的驗(yàn)證集,2017年的則作為上述三種模型適用性分析的測試集。其中訓(xùn)練集用于訓(xùn)練構(gòu)建上述三種模型,驗(yàn)證集用于監(jiān)控機(jī)器學(xué)習(xí)模型的訓(xùn)練情況。當(dāng)LightGBM與BP-NN超過100次的訓(xùn)練迭代而驗(yàn)證集誤差不再下降時(shí)則停止訓(xùn)練,以防過擬合。兩種模型均訓(xùn)練迭代1 000次,訓(xùn)練結(jié)束后保存驗(yàn)證集誤差最低的模型。

        2.2.1 基于逐步多元線性回歸的模型 日平均氣溫之間顯著的相關(guān)性(表2)極易帶來共線性問題,進(jìn)而導(dǎo)致普通線性回歸方法存在計(jì)算的不穩(wěn)定性問題。為此,本文采用了逐步線性回歸方法來構(gòu)建短期日平均氣溫預(yù)報(bào)模型。

        通常情況下,可認(rèn)為方差膨脹因子≤10時(shí)不存在明顯的共線性[5]。據(jù)此,預(yù)報(bào)未來1~3 d短期日平均氣溫的多元逐步線性回歸方程如下。

        T8=0.656+0.967T7,

        (1)

        T9=1.024+0.757T7+0.192T2,

        (2)

        T10=1.551+0.645T7+0.278T3。

        (3)

        通過逐步多元線性回歸分析發(fā)現(xiàn),在滿足方差膨脹因子≤10的條件下,T8的自變量因子僅為T7,也表明T1~6與T7之間存在顯著的共線性;T9的自變量因子為T7和T2,其對應(yīng)的方差膨脹因子均為3.545;T10的自變量因子則為T7和T3,其對應(yīng)的方差膨脹因子均為3.876。可見時(shí)間間隔更久遠(yuǎn)的氣溫反而可能是未來氣溫的重要影響因子。建模數(shù)據(jù)集的擬合結(jié)果表明,式(1)、式(2)和式(3)的計(jì)算值與實(shí)測值之間的擬合相關(guān)系數(shù)分別為0.97、0.93、0.90,擬合平均絕對誤差(mean absolute error, MAE)分別為1.32、2.04、2.42 ℃。

        2.2.2 基于LightGBM的模型 利用LightGBM算法計(jì)算的訓(xùn)練集T8,T9,T10與實(shí)測值之間的擬合R分別為0.98、0.95、0.93,MAE則分別為1.09、1.68、2.00 ℃。

        2.2.3 基于BP-NN的模型 利用BP-NN算法計(jì)算的訓(xùn)練集T8,T9,T10與實(shí)測值之間的擬合R分別為0.97、0.93、0.91,MAE分別為1.22、1.94、2.30 ℃。

        2.3 三種模型的適用性

        從2.2節(jié)針對三種短期日平均氣溫預(yù)報(bào)模型的建模結(jié)果可知,LightGBM的預(yù)報(bào)效果最優(yōu),BP-NN次之,逐步多元線性回歸最差。將上述三種算法應(yīng)用于2017年的測試集,就各自在短期日平均氣溫預(yù)報(bào)中的適用性展開系統(tǒng)分析。

        首先分別繪制了上述三種算法日平均氣溫預(yù)報(bào)值與實(shí)測值之間的時(shí)間序列圖(圖1)。從圖1可知,針對T8的預(yù)報(bào)效果而言,逐步多元線性回歸、LightGBM、BP-NN的預(yù)報(bào)值與實(shí)測值之間的R分別為0.97、0.98、0.97,MAE分別為1.25、1.17、1.22 ℃;T9的R分別為0.93、0.94、0.93,MAE則分別為1.88、1.76、1.87 ℃;T10的R分別為0.89、0.93、0.91,MAE則分別為2.22、1.96、2.12 ℃??梢娙N算法在測試集上的預(yù)報(bào)效果與訓(xùn)練集表現(xiàn)基本一致,具有優(yōu)良的泛化性,其中LightGBM的預(yù)報(bào)效果最優(yōu),BP-NN次之,逐步多元線性回歸最差。

        圖1 三種模型日平均氣溫預(yù)報(bào)值與實(shí)測值的時(shí)間序列(a 逐步多元線性回歸;b LightGBM;c BP-NN)

        在實(shí)際的氣溫預(yù)報(bào)業(yè)務(wù)中,當(dāng)氣溫的預(yù)報(bào)誤差小于2 ℃時(shí)可認(rèn)為預(yù)報(bào)正確。為此,分別統(tǒng)計(jì)了三種算法日平均氣溫預(yù)報(bào)值的準(zhǔn)確率及其與實(shí)測值之間的MAE(表3)。從表3可知,就T8的預(yù)報(bào)結(jié)果而言,三者預(yù)報(bào)準(zhǔn)確率可分別高達(dá)83.29%、84.38%、82.73%,MAE為1.25、1.17、2.22 ℃;就T9而言,三種模型的差異性明顯體現(xiàn),三者預(yù)報(bào)準(zhǔn)確率分別為64.38%、69.86%、63.56%,MAE為1.88、1.76、1.87 ℃;就T10而言,三者預(yù)報(bào)準(zhǔn)確率分別為56.44%、61.37%、59.18%,MAE為2.22、1.96、2.12 ℃。

        表3 三種模型日平均氣溫的預(yù)報(bào)結(jié)果評價(jià)指標(biāo)

        綜上可見,相較于逐步多元線性回歸法和BP-NN而言,LightGBM不僅在相關(guān)系數(shù)以及精確度上更占優(yōu)勢,并且具有更高的預(yù)報(bào)正確率。尤其隨著預(yù)報(bào)時(shí)效的增大,LightGBM具有更優(yōu)的預(yù)報(bào)效果,而BP-NN與逐步線性回歸法的預(yù)報(bào)效果則均急劇下降,說明LightGBM具有最優(yōu)的預(yù)報(bào)穩(wěn)定性。推測樣本數(shù)量較少可能是三種模型預(yù)報(bào)效果存在顯著差異的最主要原因。傳統(tǒng)的機(jī)器學(xué)習(xí)模型,如LightGBM、Xgboost、Catboost等更適用于百萬級以下的樣本量。

        明確模型預(yù)報(bào)誤差的時(shí)間分布情況對于提高氣溫的預(yù)報(bào)精度具有重要意義。為此,繪制了三種模型日平均氣溫預(yù)報(bào)值與實(shí)測值之間絕對誤差(absolute error, AE)的時(shí)間序列圖(圖2)。從圖2可見,相同預(yù)報(bào)時(shí)效,三種模型所表現(xiàn)的AE波動形態(tài)基本一致。但總體而言,LightGBM的AE及其波動幅度最小,其預(yù)報(bào)未來3 d氣溫絕對誤差的標(biāo)準(zhǔn)差(standard deviation,STD)分別為1.09、1.53、1.65 ℃;BP-NN次之,STD分別為1.15、1.66、1.97 ℃;逐步線性回歸最大,STD則分別為1.23、1.73、2.00 ℃。此外,逐步多元線性回歸以及BP-NN的AE及其波動幅度均隨著預(yù)報(bào)時(shí)效的增大而顯著增大,但LightGBM則相對最為穩(wěn)定。另外從圖2不難看出,三種模型AE的大值區(qū)基本位于0~100日以及240~365日,即處于冬春季以及秋冬季。結(jié)合圖1可推測,該時(shí)期氣溫較大的波動性會加大機(jī)器學(xué)習(xí)模型的訓(xùn)練難度,進(jìn)而導(dǎo)致AE的總體偏大。

        圖2 三種模型針對未來1~3 d日平均氣溫預(yù)報(bào)的絕對誤差(AE)時(shí)間序列

        綜合上述分析可知,LightGBM和BP-NN機(jī)器學(xué)習(xí)方法在預(yù)報(bào)準(zhǔn)確性,擬合效果(R)以及穩(wěn)定性(AE)方面均要優(yōu)于逐步多元線性回歸法。

        3 結(jié)論和討論

        (1)通過對過去1~365 d的日平均氣溫進(jìn)行遍歷測試,確定將過去連續(xù)7 d的日平均氣溫分別作為逐步多元線性回歸、LightGBM以及BP-NN算法的自變量可最準(zhǔn)確地預(yù)報(bào)出未來1~3 d的日平均氣溫,據(jù)此構(gòu)建了短期氣溫預(yù)報(bào)模型。該最優(yōu)自變量的確定方法是以結(jié)果為導(dǎo)向,其中所表征的科學(xué)背景仍有待進(jìn)一步探索。

        (2)從預(yù)報(bào)準(zhǔn)確率(絕對誤差小于2 ℃的天數(shù)占比),相關(guān)系數(shù)和絕對誤差來看,三種模型均能較準(zhǔn)確地預(yù)報(bào)出未來1~3 d的短期日平均氣溫,其中LightGBM最優(yōu),BP-NN次之,逐步多元線性回歸最差。以LightGBM為代表的傳統(tǒng)機(jī)器學(xué)習(xí)模型適用于非圖像領(lǐng)域百萬級左右的數(shù)據(jù)集,而對于雷達(dá)回波外推以及空間降尺度等圖像領(lǐng)域, 則要以神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)方法更為適用。

        (3)數(shù)據(jù)的質(zhì)量決定了預(yù)報(bào)效果的上限,而模型只是協(xié)助逼近該上限。因此,增加更多的觀測與模式預(yù)報(bào)資料,通過采用特征工程等方法,將有助于進(jìn)一步提升算法的預(yù)報(bào)性能。

        猜你喜歡
        效果模型
        一半模型
        按摩效果確有理論依據(jù)
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        迅速制造慢門虛化效果
        抓住“瞬間性”效果
        中華詩詞(2018年11期)2018-03-26 06:41:34
        3D打印中的模型分割與打包
        模擬百種唇妝效果
        Coco薇(2016年8期)2016-10-09 02:11:50
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        3D—DSA與3D—CTA成像在顱內(nèi)動脈瘤早期診斷中的應(yīng)用效果比較
        40岁大乳的熟妇在线观看 | 国内无遮码无码| 国产成人vr精品a视频| 国产又爽又黄的激情精品视频| 亚洲色成人网一二三区| 亚洲AV日韩AV高潮喷潮无码 | 国产精品高清国产三级国产av| 少妇被粗大进猛进出处故事| 人妻少妇精品久久久久久| 手机看片久久国产免费| 人妻无码一区二区三区四区| 狠狠躁夜夜躁人人爽天天 | 国产在线精彩自拍视频| 沐浴偷拍一区二区视频| 国产亚洲欧洲aⅴ综合一区| 无码国产精品一区二区免费式直播| 久久精品无码免费不卡| 国产夫妻av| 国产精品亚洲精品日韩动图 | 免费观看性欧美大片无片| 污污污污污污WWW网站免费| 亚洲色图视频在线观看网站| 美女被插到高潮嗷嗷叫| 伊人久久大香线蕉av五月| 国产动作大片中文字幕| 亚洲欧美在线观看| 亚洲自拍另类制服在线| 久久亚洲国产精品五月天| 国产大片在线观看91| 精品女同一区二区三区| 四虎影视免费永久在线观看| 五十路熟女一区二区三区| 国产尤物二区三区在线观看| 精品少妇一区二区三区四区| 99久久免费看精品国产一| 精品国产麻豆免费人成网站| 性高朝久久久久久久| 国产成人福利在线视频不卡| 能看不卡视频网站在线| 日本视频二区在线观看| 色欲色欲天天天www亚洲伊|