亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林算法的福建省降雨預(yù)測(cè)

        2023-08-20 06:26:00朱宏宇
        黑龍江科學(xué) 2023年14期
        關(guān)鍵詞:云量誤差率南平

        朱宏宇,劉 群

        (閩南師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,福建 漳州 363000)

        福建省沿海地形較平坦,對(duì)夏季風(fēng)抬升作用相對(duì)較弱,降水較少一些,西部有武夷山脈,對(duì)夏季風(fēng)阻擋抬升作用較強(qiáng),武夷山東南側(cè)降水較多,故福建省的降雨量空間分布特征為東南沿海降水偏少,向西北內(nèi)陸方向降雨增多,降水分布不均衡[1]。利用隨機(jī)森林算法[2-4],對(duì)福建省是否降雨進(jìn)行預(yù)測(cè)研究。

        1 數(shù)據(jù)集

        使用的數(shù)據(jù)來(lái)自美國(guó)國(guó)家大氣研究中心、計(jì)算與信息系統(tǒng)實(shí)驗(yàn)室公開(kāi)網(wǎng)站,其檔案中的NCEP GDAS/FN(https://rda.ucar.edu/datasets/ds094.0/#sfol-wl-/data/ds094.0?p=33)業(yè)務(wù)為全球分析及訂正數(shù)據(jù)。該數(shù)據(jù)為水平分辨率0.5×0.5的網(wǎng)格氣象數(shù)據(jù),時(shí)間頻率為每1 h從原始數(shù)據(jù)集sfluxgrbl中通過(guò)經(jīng)緯度選取整個(gè)福建省的氣象數(shù)據(jù),時(shí)間跨度為2021年6月1日24時(shí)至2022年5月31日24時(shí),為每小時(shí)觀測(cè)數(shù)據(jù),共記錄8760個(gè)數(shù)據(jù)。通過(guò)經(jīng)緯度網(wǎng)格劃分,網(wǎng)格精度水平分辨率為0.5×0.5,將福建省劃分為5大區(qū)域,分別為龍巖、南平、福州寧德、泉州莆田三明及廈門(mén)漳州。使用變量見(jiàn)數(shù)據(jù)集sfluxgrbl。

        選取云層氣象數(shù)據(jù)具有更好的特征,對(duì)降雨的影響可解釋性更高。各區(qū)域數(shù)據(jù)量及特征數(shù)量如表1所示。

        表1 各區(qū)域原始降雨數(shù)據(jù)

        2 研究方法

        隨機(jī)森林(random forest)的基本組成單元是決策樹(shù),又稱(chēng)為分類(lèi)回歸樹(shù)(CART)[5]。分類(lèi)回歸樹(shù)的基本思想是一種二分遞歸分割方法,在計(jì)算過(guò)程中充分利用二叉樹(shù),在一定的分割規(guī)則下將當(dāng)前樣本集分割為兩個(gè)子樣本集,令生成的決策樹(shù)的每個(gè)非葉節(jié)點(diǎn)都有兩個(gè)分枝,這個(gè)過(guò)程在子樣本集上重復(fù)進(jìn)行,直至不可再分為葉節(jié)點(diǎn)為止。由于單棵決策樹(shù)精度不高,容易出現(xiàn)過(guò)擬合的問(wèn)題,故需通過(guò)聚集多個(gè)模型來(lái)提高訂正精度。隨機(jī)森林采用Bagging[6-7]方法來(lái)組合決策樹(shù),利用Bootstrap[8]重抽樣方法從原始樣本中抽取多個(gè)樣本,對(duì)每個(gè)樣本進(jìn)行決策樹(shù)建模,組合多棵決策樹(shù)的預(yù)測(cè),通過(guò)投票得出最終預(yù)測(cè)結(jié)果。

        圖1 隨機(jī)森林示意圖Fig.1 Schematic diagram of random forest

        3 分類(lèi)模型的建立與評(píng)估

        3.1 隨機(jī)森林分類(lèi)模型的建立

        按照經(jīng)緯度,將福建省一年之間的逐小時(shí)氣象數(shù)據(jù)劃分為5個(gè)區(qū)域,分別為南平、福州寧德、龍巖、泉州莆田三明及廈門(mén)漳州。其中,福州寧德與廈門(mén)漳州兩大區(qū)域除目標(biāo)特征label(是否降雨)之外,有54個(gè)氣象特征,南平、龍巖及泉州莆田三明三大區(qū)域除目標(biāo)特征label之外,有84個(gè)氣象特征。每個(gè)區(qū)域降雨(非降雨)數(shù)據(jù)量分布如表2所示。

        表2 各區(qū)域降雨(非降雨)數(shù)據(jù)量分布

        對(duì)各區(qū)域數(shù)據(jù)建立隨機(jī)森林分類(lèi)模型,將5個(gè)區(qū)域的數(shù)據(jù)通過(guò)隨機(jī)抽樣分別按照7∶3的比例隨機(jī)劃分,其中70%作為訓(xùn)練數(shù)據(jù),30%作為測(cè)試數(shù)據(jù)。分別選取10%特征數(shù)、30%特征數(shù)、50%特征數(shù)、70%特征數(shù),CART決策樹(shù)從0~200變化時(shí)觀察模型的誤差變化情況[如圖2、圖3、圖4、圖5所示(南平區(qū)域)]。圖中橫坐標(biāo)表示決策樹(shù)的數(shù)量,縱坐標(biāo)表示模型的分類(lèi)誤差率,其中error0實(shí)線(xiàn)表示非降雨(標(biāo)簽為0)的誤差率,error1短虛線(xiàn)表示降雨的誤差率(標(biāo)簽為1),errorOOB長(zhǎng)虛線(xiàn)表示袋外數(shù)據(jù)兩種類(lèi)別綜合的誤差率。觀察圖2、圖3、圖4、圖5、圖6,隨著決策樹(shù)數(shù)量的增加,袋外數(shù)據(jù)的誤差率先減小后趨于穩(wěn)定。對(duì)比各特征數(shù)的模型,選取決策樹(shù)100棵、50%特征作為最終模型。

        圖2 10%特征數(shù)Fig.2 10% feature number

        圖3 30%特征數(shù)Fig.3 30% feature number

        圖4 50%特征數(shù)Fig.4 50% feature number

        圖5 70%特征數(shù)Fig.5 70% feature number

        圖6 南平區(qū)域變量重要性排序Fig.6 Importance ranking of variables in Nanping Region

        隨機(jī)森林模型在擬合數(shù)據(jù)后會(huì)對(duì)數(shù)據(jù)特征有一個(gè)重要性的度量,對(duì)應(yīng)隨機(jī)森林模型認(rèn)為訓(xùn)練特征的重要程度。圖6展現(xiàn)的是隨機(jī)森林分類(lèi)模型對(duì)南平區(qū)域的數(shù)據(jù)擬合后生成的變量重要性的排序,取前30個(gè),橫坐標(biāo)為平均下降基尼系數(shù)(Mean Decrease Gini),計(jì)算每個(gè)變量對(duì)分類(lèi)樹(shù)每個(gè)節(jié)點(diǎn)上觀測(cè)值異質(zhì)性的影響,該值越大表示變量的重要性越大。

        對(duì)5個(gè)區(qū)域輸出影響是否降雨的前30個(gè)特征,結(jié)果表明,每個(gè)區(qū)域的重要性均不同,按重要性排序(選取影響較大的特征),福州寧德區(qū)域?yàn)榈驮莆豢傇屏?、邊界層總云量、中云位總云量、大氣總云量、大氣晴空頂部向上長(zhǎng)波通量,龍巖區(qū)域?yàn)榈乇斫邓俾?、大氣柱云功函?shù)、中云位總云量、低云位總云量、地表植物冠層地表水,泉州莆田三明區(qū)域?yàn)榈乇肀┯甑乇韽搅?、低云位總云量、中云位總云量、地表植物冠層地表?廈門(mén)漳州區(qū)域?yàn)橹性莆豢傇屏?、低云位總云量、大氣頂部晴空向上長(zhǎng)波通量,南平區(qū)域?yàn)榈乇碇参锕趯拥乇硭?、中云位總云量、地表暴雨地表徑流、低云位總云量?/p>

        3.2 性能評(píng)估

        建立隨機(jī)森林分類(lèi)模型后,對(duì)比各區(qū)域誤差率在不同特征下隨著決策樹(shù)數(shù)量的變化,選取誤差率最小的參數(shù)訓(xùn)練模型,如表3所示,其中南平、龍巖兩個(gè)區(qū)域選取50%特征數(shù)用來(lái)訓(xùn)練模型,福州寧德與泉州莆田三明兩個(gè)區(qū)域選取30%特征數(shù),廈門(mén)漳州區(qū)域選取70%特征數(shù)。決策樹(shù)數(shù)量南平、福州寧德、泉州莆田三明3個(gè)區(qū)域均選取100棵,廈門(mén)漳州區(qū)域取130棵決策樹(shù),龍巖區(qū)域選擇150棵決策樹(shù)作為最終的模型參數(shù)。

        表3 各區(qū)域隨機(jī)森林分類(lèi)模型參數(shù)

        表4為模型在5個(gè)區(qū)域袋外數(shù)據(jù)的混淆矩陣及各類(lèi)別上的錯(cuò)誤率、訓(xùn)練集袋外數(shù)據(jù)的誤差率及測(cè)試集的準(zhǔn)確率。觀察表4可知,各區(qū)域的測(cè)試集準(zhǔn)確率均達(dá)到96%以上,其中龍巖區(qū)域的OOB誤差在1%以下,測(cè)試集準(zhǔn)確率達(dá)到99.5%,訂正效果最好。

        表4 各區(qū)域袋外數(shù)據(jù)混淆矩陣及準(zhǔn)確率

        4 結(jié)論

        利用隨機(jī)森林分類(lèi)算法對(duì)福建省降雨進(jìn)行預(yù)測(cè)研究,得出了以下結(jié)論:隨機(jī)森林在對(duì)是否降雨的分類(lèi)預(yù)測(cè)上能夠表現(xiàn)出較好的效果,對(duì)福建省各區(qū)域是否降雨的判斷準(zhǔn)確率均達(dá)到96%以上。在是否降雨的預(yù)測(cè)上,不同區(qū)域的特征重要性程度不一,其中中云位總云量、低云位總云量、地表植物冠層地表水3個(gè)特征對(duì)各個(gè)區(qū)域是否降雨的影響較重要。

        猜你喜歡
        云量誤差率南平
        贛州地區(qū)云量變化特征及其與降水的關(guān)系
        ASC200型地基雙波段全天空云量自動(dòng)觀測(cè)儀云量比對(duì)分析
        氣象科技(2022年2期)2022-04-28 09:35:46
        南平:婦聯(lián)干部當(dāng)好“五員”助力婦女脫貧增收
        海峽姐妹(2020年6期)2020-07-25 01:26:04
        生化檢驗(yàn)全程中質(zhì)量控制管理方式及應(yīng)用意義
        健康大視野(2020年1期)2020-03-02 11:33:53
        降低評(píng)吸人員單料煙感官評(píng)分誤差率探討
        1971—2010年虎林市云量與氣溫、降水的年際變化特征分析
        無(wú)線(xiàn)傳感器網(wǎng)絡(luò)定位算法在環(huán)境監(jiān)測(cè)中的應(yīng)用研究
        電工儀表測(cè)量中容易忽略的幾個(gè)問(wèn)題
        基于CBERS數(shù)據(jù)的福建南平地質(zhì)災(zāi)害動(dòng)態(tài)遙感解譯
        中國(guó)天山區(qū)域云量的變化及其與降水的關(guān)系
        国产成本人片无码免费2020| 亚洲女同系列在线观看| av影院在线免费观看不卡| 免费a级毛片18以上观看精品| 国产女人18毛片水真多| 国产亚洲成年网址在线观看 | 中文字幕亚洲综合久久菠萝蜜| 国模一区二区三区白浆| 99久久99久久久精品蜜桃| 亚洲春色在线视频| 国产精品露脸张开双腿| 黑人一区二区三区啪啪网站| 亚洲av不卡一区男人天堂 | 好大好爽我要高潮在线观看| 日韩亚洲欧美中文在线| 国产免费一级在线观看| 久久这黄色精品免费久| 天天综合网网欲色| 51久久国产露脸精品国产| 久久精品国产精品亚洲婷婷| 免费看片的网站国产亚洲| 亚洲午夜成人精品无码色欲 | 欧美日韩亚洲国产精品| 欧美精品日韩一区二区三区| 永久免费观看的黄网站在线| 久久久久久久久毛片精品| 亚洲国产精品尤物yw在线观看| 一本大道久久精品一本大道久久| 水蜜桃精品视频在线观看| 99精品国产一区二区三区| 最新国产午夜福利| 一区二区三区日本美女视频| 精品久久久久久无码专区| 久久久久亚洲精品天堂| 欧美在线Aⅴ性色| 国产精品一区二区黄色| 久久亚洲精品无码va白人极品| 亚洲精品成人av观看| 久久99精品综合国产女同| 国产精品中文久久久久久久| 色丁香在线观看|