亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于自適應(yīng)提升隨機(jī)森林算法的煤炭鐵路發(fā)運(yùn)量預(yù)測

        2023-04-07 02:25:54鄭海濤
        中國新技術(shù)新產(chǎn)品 2023年1期
        關(guān)鍵詞:運(yùn)量決策樹煤炭

        鄭海濤

        (華北電力大學(xué),北京 102206)

        0 引言

        2021 年出現(xiàn)了罕見的供電缺口。這是由于在全球供應(yīng)鏈緊缺加上國內(nèi)復(fù)工復(fù)產(chǎn)的環(huán)境下,中國外貿(mào)進(jìn)出口貿(mào)易激增,工商業(yè)用電量均大幅增加,煤炭需求量激增。又疊加電廠季節(jié)性型增加庫存,導(dǎo)致煤炭鐵路出現(xiàn)運(yùn)力不足,電廠存在煤炭短缺的情況。因此鐵路發(fā)運(yùn)量預(yù)測對穩(wěn)定電力生產(chǎn)具有重要意義。

        很多研究者對影響煤炭鐵路發(fā)運(yùn)量進(jìn)行了分析。在經(jīng)濟(jì)環(huán)境方面,有研究者將鐵路沿線的電廠發(fā)電用煤需求作為影響發(fā)運(yùn)量的關(guān)鍵因素[1],同時北方港口吞吐量對鐵路運(yùn)輸也具有替代作用[2]。在運(yùn)輸成本方面,有研究者分別從鐵路運(yùn)價與煤炭聯(lián)運(yùn)的全程物流總成本[3]角度進(jìn)行了煤炭鐵路運(yùn)輸量的分析。

        而在通過煤炭供需環(huán)境對煤炭鐵路發(fā)運(yùn)量進(jìn)行預(yù)測幾乎沒有人研究,也幾乎沒有研究者將機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘方法加入對煤炭鐵路發(fā)運(yùn)量的預(yù)測當(dāng)中。該文通過構(gòu)建煤炭鐵路發(fā)運(yùn)量相關(guān)數(shù)據(jù)集,利用隨機(jī)森林算法的高精度與決策可視化的優(yōu)點構(gòu)建煤炭鐵路運(yùn)輸量預(yù)測模型,利用自適應(yīng)提升法提高模型的精度與穩(wěn)定性,利用模型找出與發(fā)運(yùn)量相關(guān)的關(guān)鍵變量,并與其他傳統(tǒng)算法進(jìn)行精度與穩(wěn)定性的對比分析。

        1 煤炭鐵路發(fā)運(yùn)量相關(guān)數(shù)據(jù)集構(gòu)建

        在該研究中,利用大數(shù)據(jù)挖掘的思想,從煤炭的供需數(shù)據(jù)、運(yùn)輸價格、港口發(fā)運(yùn)量和各環(huán)節(jié)煤炭庫存等構(gòu)建用于預(yù)測的煤炭鐵路發(fā)運(yùn)量相關(guān)數(shù)據(jù)集。

        在煤炭供給方面,包括全國煤炭產(chǎn)量、各省煤炭產(chǎn)量、各種煤炭進(jìn)口量、港口煤炭庫存、全國煤礦庫存和全國重點發(fā)電企業(yè)煤炭庫存等。在煤炭的需求方面,包括全國二、三產(chǎn)業(yè)增加值與同比增長率、各省與全國的發(fā)電量、各省的火力發(fā)電量、各省的水力和風(fēng)力發(fā)電量、各類型發(fā)電設(shè)備的裝機(jī)容量、各地區(qū)的氣溫變動、各省的生鐵產(chǎn)量以及各省的水泥產(chǎn)量等。在價格成本方面,包括了鐵路運(yùn)價、港口煤炭價格與山西煤炭現(xiàn)貨價格。在運(yùn)量方面,包括了各大港口煤炭吞吐量、太原局鐵路發(fā)運(yùn)量、大秦鐵路發(fā)運(yùn)量、朔黃鐵路發(fā)運(yùn)量以及合計鐵路發(fā)運(yùn)量等。

        2 基于Ada-RF 的煤炭鐵路發(fā)運(yùn)量模型

        該文將隨機(jī)森林算法作為鐵路發(fā)運(yùn)量的底層預(yù)測算法對其進(jìn)行回歸分析。作為一個機(jī)器學(xué)習(xí)算法,和傳統(tǒng)的線性回歸模型和應(yīng)對時間序列數(shù)據(jù)的自回歸模型相比,隨機(jī)森林算法有眾多優(yōu)點。除模型的精度與穩(wěn)定性更高外,它可以通過模型內(nèi)的損失函數(shù)與給輸入變量設(shè)置權(quán)重的方法選取相關(guān)的變量進(jìn)行回歸或分類分析。和其他的黑箱模型相比,隨機(jī)森林模型算法可以進(jìn)行可視化,有一定的可解釋性。隨機(jī)森林是一種將多個決策樹組合在一起的集成方法,通常用Bagging 或者pasting 方法訓(xùn)練[4],和其他生成單一模型的算法相比,將多個模型整合的隨機(jī)森林具有一定的先天優(yōu)勢。算法從原始樣本中提取不同的多個樣本,根據(jù)每個樣本數(shù)據(jù)分別建立決策樹模型,最終通過投票得到最終結(jié)果[5]。

        隨機(jī)森林回歸模型是由多個決策樹回歸器組成的,每個決策樹(CART)使用單個特征k、閾值與最小化成本函數(shù)將訓(xùn)練集分成2 個子集,成本函數(shù)如公式(1)所示。

        式中:n為訓(xùn)練集中樣本數(shù)量;nL、nR分別為特征分解閾值YkYk左、右兩端樣本數(shù)量。

        公式(1)中,每個節(jié)點在分解子集時通過計算在利用k特征分解時閾值Yk左、右兩端(或節(jié)點)的均方誤差(MSEL與MSER)和最小【表意不明,請修改】,得到該節(jié)點最優(yōu)特征k與最優(yōu)閾值YkYk。通常情況下,在決策樹模型做分類時會將基尼不純度或信息熵作為成本函數(shù)中均方誤差的替換項。

        某節(jié)點的MSE 的結(jié)果是由該節(jié)點所有樣本中變量y 的均值與每個y的實際值的差進(jìn)行平方和計算得到的。

        由于單一學(xué)習(xí)器導(dǎo)致誤差較大,因此基于大數(shù)定理提高學(xué)習(xí)器的預(yù)測精度需要將多個弱分類器結(jié)合成一個強(qiáng)分類器,即將多個決策樹模型結(jié)合為一個模型(隨機(jī)森林模型)。其中結(jié)合多個模型的方法為Bagging 算法。Bagging 的基本流程是采樣出M個含有n個訓(xùn)練樣本的采樣集,然后基于每個采樣集訓(xùn)練出一個CART 學(xué)習(xí)器,再將這些CART 學(xué)習(xí)器進(jìn)行結(jié)合。對預(yù)測輸出進(jìn)行結(jié)合時,Bagging 對回歸任務(wù)使用簡單平均法。

        為了進(jìn)一步提高模型的預(yù)測精度,該研究選用自適應(yīng)提升法對隨機(jī)森林算法進(jìn)行模型精度與穩(wěn)定性的提升。隨機(jī)森林模型對訓(xùn)練集預(yù)測后,在每個樣本上都會產(chǎn)生一個不同預(yù)測誤差,AdaBoost 算法[6]會為每個樣本重新設(shè)置權(quán)重,針對預(yù)測誤差較高的樣本模型,在下一次的迭代中,算法會針對這一部分的樣本模型進(jìn)行進(jìn)一步的優(yōu)化提升。它使用更新后的權(quán)重訓(xùn)練第二個隨機(jī)森林學(xué)習(xí)器,并再次對訓(xùn)練集進(jìn)行預(yù)測和更新權(quán)重,直到訓(xùn)練出較為合適數(shù)量(N)的隨機(jī)森林學(xué)習(xí)器[7]。AdaBoost 使用權(quán)重aj對它們進(jìn)行加權(quán),最后得到的大多數(shù)加權(quán)投票的預(yù)測結(jié)果就是最終模型給出的預(yù)測結(jié)果,如公式(3)所示。

        式中:M為學(xué)習(xí)器數(shù)量;k為第j個學(xué)習(xí)器的預(yù)測值。

        這在一定程度上解決了一般模型容易發(fā)生過擬合的問題。由于數(shù)據(jù)樣本量較少,同時為了提高模型的精準(zhǔn)度與穩(wěn)定性,避免過擬合,因此需要在模型訓(xùn)練過程中降低決策樹的自由度,即對模型中n_estimators(決策樹數(shù)量)、max_depth(決策樹深度)等超參數(shù)進(jìn)行正則化。

        利用網(wǎng)格搜索最終確定該模型的超參數(shù)。網(wǎng)格搜索是對每個超參數(shù)選擇一個較小的有限集去探索,這些超參數(shù)笛卡爾乘積得到若干組超參數(shù),然后網(wǎng)格搜索使用每組超參數(shù)訓(xùn)練模型,挑選驗證集誤差最小的超參數(shù)作為最好的超參數(shù)。

        模型構(gòu)建流程圖如圖1 所示。

        圖1 Ada-RF 模型構(gòu)建技術(shù)路線圖

        該研究分別對太原局鐵路發(fā)運(yùn)量、大秦鐵路發(fā)運(yùn)量、朔黃鐵路發(fā)運(yùn)量和合計鐵路發(fā)運(yùn)量4 個變量構(gòu)建模型,利用網(wǎng)格搜索分別對這4 個模型尋找超參數(shù),最終確定的超參數(shù)見表1。

        表1 模型超參數(shù)設(shè)置表

        3 模型預(yù)測結(jié)果對比分析

        為驗證模型的預(yù)測精度,分別構(gòu)建自適應(yīng)提升的隨機(jī)森林模型、隨機(jī)森林模型(RF)、自適應(yīng)提升的決策樹模型(Ada-Tree)、線性回歸模型(LR)與決策樹模型(Tree)分別對太原局鐵路發(fā)運(yùn)量、大秦鐵路發(fā)運(yùn)量、朔黃鐵路發(fā)運(yùn)量與合計鐵路發(fā)運(yùn)量進(jìn)行預(yù)測。為客觀評估各預(yù)測模型的精度與穩(wěn)定性,該研究選擇平均絕對誤差(Mean Absolute Error,簡稱MAE)驗證模型的精度,用均方誤差(Mean Square Error,簡稱MSE)驗證模型的平穩(wěn)性,計算公式如公式(4)、公式(5)所示。

        式中:n 為樣本數(shù)量;為樣本i 中被鐵路發(fā)運(yùn)量真實值;為樣本i 中被鐵路發(fā)運(yùn)量預(yù)測值。

        使用5 折交叉驗證方法驗證各模型預(yù)測精度,結(jié)果見表2。

        表2 模型預(yù)測精度與穩(wěn)定性表

        從表2 可以看出,Ada-RF 模型對各鐵路線發(fā)運(yùn)量預(yù)測誤差均在3.2%以下,其中對太原、大秦、朔黃的合計鐵路發(fā)運(yùn)量的預(yù)測效果最好,預(yù)測精度達(dá)到98.78%,預(yù)測結(jié)果的均方誤差為8.60。其次為對太原局鐵路發(fā)運(yùn)量的預(yù)測,預(yù)測精度達(dá)到98.20%,預(yù)測結(jié)果的均方誤差為12.56。同時Adaboost提升法對隨機(jī)森林模型精度的提升在1.25%至11.92%。相比之下,Ada-RF 在預(yù)測精度與穩(wěn)定性上均強(qiáng)于其他模型,尤其是比傳統(tǒng)線性回歸模型的預(yù)測精度平均提升了7.39%。從總樣本中隨機(jī)選取90%的樣本作為訓(xùn)練集,其余樣本作為測試集,利用上述各模型合計三大鐵路煤炭發(fā)運(yùn)量,結(jié)果如圖2 所示。除線性回歸模型外,其余機(jī)器學(xué)習(xí)模型對鐵路煤炭發(fā)運(yùn)量的預(yù)測效果都是較為理想的,Ada-RF 模型的回歸預(yù)測效果最好,最貼近真實值。

        圖2 各模型預(yù)測效果圖

        機(jī)器學(xué)習(xí)算法可以通過模型內(nèi)置函數(shù)得到不同變量的重要程度,這樣對模型的擬合得到影響鐵路月煤炭發(fā)運(yùn)量的關(guān)鍵性因素,利用大數(shù)據(jù)挖掘的思想,從眾多的相關(guān)變量中篩選出影響其變動的實際的關(guān)鍵因素,太原局鐵路發(fā)運(yùn)量、大秦鐵路發(fā)運(yùn)量、朔黃鐵路發(fā)運(yùn)量與合計鐵路發(fā)運(yùn)量的重要程度排序見表3。

        由表3 可以看出,影響太原局鐵路發(fā)運(yùn)量的關(guān)鍵因素包括各地區(qū)的發(fā)電量、水力發(fā)電占比與進(jìn)港煤炭量等。影響大秦鐵路發(fā)運(yùn)量的關(guān)鍵因素包括港口庫存量、出港煤炭量、火電發(fā)電量量同比增長率與秦皇島港口煤炭價格等。朔黃鐵路發(fā)運(yùn)量主要和各地區(qū)發(fā)電、港口煤炭的庫存及港口進(jìn)出量相關(guān)。而合計鐵路發(fā)運(yùn)量除了同樣受港口情況影響外,還有工業(yè)同比月增長率、山西電煤價格、全國重點電廠庫存等影響因素。

        表3 影響煤炭鐵路發(fā)運(yùn)量的關(guān)鍵影響因素

        4 結(jié)語

        該文通過煤炭鐵路發(fā)運(yùn)量相關(guān)的月度數(shù)據(jù)進(jìn)行數(shù)據(jù)集構(gòu)建。影響煤炭鐵路發(fā)運(yùn)量的影響因素較多,為提升鐵路發(fā)運(yùn)量的預(yù)測精度,尋找影響煤炭鐵路發(fā)運(yùn)量的關(guān)鍵影響因素,該研究中構(gòu)建了自適應(yīng)提升的隨機(jī)森林算法預(yù)測模型,該方法對影響因素較為復(fù)雜的煤炭鐵路發(fā)運(yùn)量的預(yù)測精度較高。先將構(gòu)建的數(shù)據(jù)集訓(xùn)練隨機(jī)森林模型,利用網(wǎng)格搜索找到最優(yōu)超參數(shù),然后利用自適應(yīng)提升法對隨機(jī)森林模型進(jìn)行迭代提升,得到最終的煤炭發(fā)運(yùn)量預(yù)測模型。利用該方法分別對太原局鐵路發(fā)運(yùn)量、大秦鐵路發(fā)運(yùn)量、朔黃鐵路發(fā)運(yùn)量與合計鐵路發(fā)運(yùn)量進(jìn)行預(yù)測,同時選取了多種模型與2 種模型誤差評價指標(biāo),驗證了模型預(yù)測的精度與穩(wěn)定性,同時根據(jù)模型賦予各變量的重要性確定了影響煤炭鐵路發(fā)運(yùn)量的關(guān)鍵影響因素。結(jié)果發(fā)現(xiàn),使用Ada-RF 模型對鐵路發(fā)運(yùn)量的預(yù)測精度與穩(wěn)定性都優(yōu)于其他模型,同時自適應(yīng)提升對煤炭鐵路發(fā)運(yùn)量預(yù)測模型的預(yù)測效果有明顯提升。該研究對鐵路發(fā)運(yùn)量影響因素發(fā)掘、煤炭供應(yīng)鏈的穩(wěn)定和火電廠安全生產(chǎn)具有一定意義。

        猜你喜歡
        運(yùn)量決策樹煤炭
        云南:上半年中越鐵路口岸進(jìn)出口運(yùn)量創(chuàng)4年最佳
        云南畫報(2021年8期)2021-12-02 02:46:12
        消除煤炭:是時候?qū)⒚禾枯d入史冊了 精讀
        英語文摘(2021年3期)2021-07-22 06:30:12
        煤炭
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        煤炭:去產(chǎn)能繼續(xù) 為煤炭正名
        能源(2018年4期)2018-01-15 22:25:25
        基于決策樹的出租車乘客出行目的識別
        煤炭的“未來”
        能源(2015年8期)2015-05-26 09:15:34
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        2月份鐵路貨物運(yùn)輸平穩(wěn)有序
        国产精品无码午夜福利| 成人在线观看视频免费播放| 粉嫩极品国产在线观看免费一区 | 亚洲精品国产成人AV| 日韩中文字幕无码av| 亚洲av色福利天堂久久入口| 久久国产成人精品国产成人亚洲 | 男人和女人做爽爽视频| 永久免费av无码网站性色av| AV熟妇导航网| 日韩av在线不卡一区二区| 97se狠狠狠狠狼鲁亚洲综合色| 亚洲综合一区无码精品| 精品国产迪丽热巴在线| 在线国人免费视频播放| 玩弄丰满奶水的女邻居 | 邻居少妇太爽在线观看| 国产猛烈高潮尖叫视频免费| 精品国内自产拍在线观看| 国产国拍亚洲精品福利| av成人综合在线资源站| 精品伊人久久大线蕉色首页| 丰满人妻妇伦又伦精品国产| 亚洲无码观看a| 免费av日韩一区二区| 国产精品欧美一区二区三区不卡| 精品午夜久久网成年网| 色婷婷一区二区三区四| 亚洲国产婷婷香蕉久久久久久| 8ⅹ8x擦拨擦拨成人免费视频| 日韩精品永久免费播放平台| 福利视频偷拍一区二区| 久久精品国产亚洲av网站| 在线视频一区色| 亚洲视频在线中文字幕乱码| 亚洲av免费手机在线观看| 午夜亚洲www湿好爽| 国产又爽又黄又不遮挡视频| 国产高清精品一区二区| 九九热线有精品视频86| 久久99国产亚洲高清|