亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)ARMA-XGBoost 算法的汽油辛烷值損失預(yù)測(cè)模型

        2022-09-06 08:04:28游長(zhǎng)莉唐成章胡江宇
        時(shí)代汽車(chē) 2022年18期
        關(guān)鍵詞:辛烷值集上汽油

        游長(zhǎng)莉 唐成章 胡江宇

        1.興義民族師范學(xué)院 貴州省興義市 562400 2.武漢紡織大學(xué)機(jī)械工程與自動(dòng)化學(xué)院 湖北省武漢市 430200

        1 引言

        汽油是小型車(chē)輛的主要燃料,車(chē)輛保有量的增加,汽油燃料需求日益增加,燃燒其產(chǎn)生的尾氣污染問(wèn)題也日漸突顯。辛烷值是反映汽油燃燒性能的重要指標(biāo),由于現(xiàn)有脫硫技術(shù)在對(duì)汽油進(jìn)行處理時(shí),都會(huì)降低其辛烷值,進(jìn)而造成巨大的損失。為了汽油得到最優(yōu)的利用,在建模過(guò)程中研究如何滿足操作變量的多樣性、對(duì)原料分析的高要求及過(guò)程優(yōu)化響應(yīng)的及時(shí)性研究如何在滿足汽油脫硫效果的同時(shí)( 硫含量不大于5μg/g),實(shí)現(xiàn)降低汽油辛烷值損失在30% 以上。傳統(tǒng)的汽油辛烷值測(cè)定法采用ASTM-CFR 標(biāo)準(zhǔn)方法對(duì)汽油進(jìn)行分析,操作和維護(hù)運(yùn)行費(fèi)用高,也有許多研究者采用紅外光譜,可用于在線分析、檢測(cè)成本低等優(yōu)點(diǎn),但是得到的操作位點(diǎn)較多,存在許多不確定因素的影響,應(yīng)用受到一定的限制。目前處理汽油辛烷值的方法可以采用基于統(tǒng)計(jì)的方法(如:皮爾森系數(shù)、F 值等) 或者基于模型的方法( 如:決策樹(shù)、隨機(jī)森林等),而采用機(jī)器學(xué)習(xí)中基于模型則更加全面分析降低汽油辛烷值的目的??赏ㄟ^(guò)建立相關(guān)數(shù)學(xué)模型來(lái)對(duì)主要變量進(jìn)行優(yōu)化以達(dá)到降低辛烷值損失值的目的。針對(duì)辛烷值異常數(shù)據(jù)診斷,可對(duì)異常值進(jìn)行整體修復(fù),但魯棒性較低;綜合前期學(xué)者研究,大多針對(duì)辛烷值數(shù)據(jù)修復(fù)研究較為分化,沒(méi)有完整的數(shù)據(jù)處理體系,模型遷移能力有待提高。針對(duì)上述問(wèn)題,本文提出改進(jìn)ARMAXGBoost 算法構(gòu)建出一種綜合數(shù)據(jù)清晰、奇異值、缺失值及異常值處理的辛烷值數(shù)據(jù)集成處理框架對(duì)辛烷值數(shù)據(jù)進(jìn)行處理。

        2 方法

        2.1 數(shù)據(jù)集及整體處理流程

        本文原始數(shù)據(jù)采集來(lái)自某實(shí)時(shí)數(shù)據(jù)庫(kù)。根據(jù)所采集到的原始數(shù)據(jù)進(jìn)行分析,得到多變量大樣本數(shù)據(jù)(325 個(gè)樣本、367個(gè)操作變量),在原樣本中存在一些異常值、缺失值。對(duì)本文所用數(shù)據(jù)提出基于XGBoost 的缺失值填補(bǔ)及基于隨機(jī)森林的異常值檢測(cè)算法兩種算法方案,整體處理流程如圖1 所示。

        圖1 整體框架處理流程

        每個(gè)樣本數(shù)據(jù)包含兩個(gè)小時(shí)內(nèi)354 個(gè)操作點(diǎn)位記錄的實(shí)時(shí)數(shù)據(jù),采樣間隔為三分鐘。首先對(duì)原始數(shù)據(jù)根據(jù)位點(diǎn)操作范圍進(jìn)行閾值篩選,去除在閾值范圍外的數(shù)據(jù),再對(duì)經(jīng)過(guò)篩選的無(wú)超綱數(shù)據(jù)進(jìn)行缺失值填充。根據(jù)位點(diǎn)操作范圍對(duì)超出范圍的數(shù)據(jù)進(jìn)行剔除,再通過(guò)隨機(jī)森林模型對(duì)點(diǎn)位中的部分缺失數(shù)據(jù)進(jìn)行預(yù)測(cè)填補(bǔ)后,使用隨機(jī)森林算法對(duì)數(shù)據(jù)中的異常值進(jìn)行提取,對(duì)提取到的異常值傳入XGBoost 模型進(jìn)行修正,最終得到有效性較高的樣本原始數(shù)據(jù),再對(duì)其求均值后,對(duì)原樣本數(shù)據(jù)進(jìn)行替換。

        2.2 基于XGBoost 回歸模型缺失值處理

        缺失值填充方式主要有單變量缺失值插補(bǔ)和多變量聯(lián)立的缺失值差補(bǔ),針對(duì)存在缺失值的操作位點(diǎn)數(shù)據(jù),使用XGBoost回歸模型的缺失值預(yù)測(cè)模型預(yù)測(cè)的數(shù)據(jù)填補(bǔ)缺失值。與原始GBDT 相比在代價(jià)函數(shù)加入正則化項(xiàng),而且XGBoost 在解決分類(lèi)問(wèn)題及回歸問(wèn)題中都具有較好的表現(xiàn),數(shù)據(jù)預(yù)處理流程如圖2 所示。

        圖2 數(shù)據(jù)預(yù)處理流程圖

        在Boosting 算法中,每次預(yù)測(cè)結(jié)果都和上一次預(yù)測(cè)結(jié)果相關(guān),如(1)式。

        對(duì)公式(2)進(jìn)行泰勒展開(kāi)得:

        其中,

        優(yōu)化 tan項(xiàng)去后得:

        因 為和為復(fù)雜度參數(shù)。決 定XGBoost 的樹(shù)是否繼續(xù)分叉,而控制著正則化的權(quán)重。在設(shè)置時(shí)需要根據(jù)實(shí)際情況而定。

        對(duì)公式(6)進(jìn)一步泰勒展開(kāi)得到:

        為繼續(xù)求解,設(shè)定:

        根據(jù)公式(8),將(7)轉(zhuǎn)化為:

        根據(jù)上述公式獲得第個(gè)葉子的最優(yōu)值和目標(biāo)函數(shù)的最優(yōu)解

        求得最優(yōu)解后,確定穩(wěn)定的XGBoost模型。

        XGBoost 的改進(jìn):關(guān)于和值的設(shè)定,為避免隨機(jī)選擇不確定性消耗大量運(yùn)算時(shí)間,引入網(wǎng)格搜索算法,將和的可能值作為組合產(chǎn)生網(wǎng)格,結(jié)合十折交叉驗(yàn)證方法,對(duì)網(wǎng)格中可能的和組成進(jìn)行搜索優(yōu)化,獲得最優(yōu)的和組合,從而根據(jù)(9)和(10)式快速獲得XGBoost 最優(yōu)解。

        2.3 基于辛烷值損失參數(shù)的異常值填補(bǔ)模型

        2.4 主要變量特征提取

        1)特征提取整體流程

        在篩選特征變量之前,對(duì)樣本數(shù)據(jù)進(jìn)行無(wú)量綱化處理,避免各變量閾值范圍差異過(guò)大導(dǎo)致篩選過(guò)程中產(chǎn)生影響篩選準(zhǔn)確性的噪聲。

        首先根據(jù)拉依達(dá)準(zhǔn)則,對(duì)樣本數(shù)據(jù)中的異常值進(jìn)行剔除。經(jīng)過(guò)拉依達(dá)準(zhǔn)則對(duì)樣本數(shù)據(jù)中的特征變量異常值進(jìn)行檢測(cè)后,部分變量密度曲線及異常值散點(diǎn)圖如圖3所示。散點(diǎn)圖中紅點(diǎn)表示異常數(shù)據(jù)。需對(duì)該數(shù)據(jù)進(jìn)行剔除。

        圖3 部分變量密度曲線及散點(diǎn)圖

        圖4 特征矩陣構(gòu)建流程

        2.5 自回歸滑動(dòng)平均模型(ARMA)

        ARMA 模型曾廣泛應(yīng)用于時(shí)間序列的分析和預(yù)測(cè),基于其公式計(jì)算出未來(lái)時(shí)刻的最大可能發(fā)生的值。嘗試?yán)肁RMA 模型來(lái)捕獲每個(gè)操作位的顯式和隱式特征屬性,每個(gè)特征都由一個(gè)唯一的參數(shù)向量代表,且該向量具備了該特征的序列中的隱含屬性,將顯式和隱式特征屬性均體現(xiàn)在了參數(shù)向量中。在建模過(guò)程中,可根據(jù)具體序列的特性定階,階數(shù)也是模型參數(shù)。利用ARMA 將序列映射到歐氏空間中,并可由其對(duì)應(yīng)的向量唯一確定。為了在后續(xù)步驟中提供盡可能多的方法接口,我們?cè)诖颂幰肓藞D神經(jīng)網(wǎng)絡(luò)模型,并以圖網(wǎng)絡(luò)的形式對(duì)問(wèn)題建模。目的在于尋找354 個(gè)可變操作位中,對(duì)RON 損失影響最大的前n 個(gè)操作位,其中各個(gè)操作位間具有不同程度的聯(lián)系和影響,每個(gè)操作位可視為一個(gè)節(jié)點(diǎn),而操作位間的影響可經(jīng)過(guò)歸一化后視為節(jié)點(diǎn)間邊的權(quán)重。依據(jù)以上,可將全部樣本建模為354+1(354 為可操作變量,1 為目標(biāo)對(duì)象)個(gè)節(jié)點(diǎn)的完全無(wú)向加權(quán)圖,共325 幀。

        利用以上特性,可將多個(gè)特征對(duì)目標(biāo)對(duì)象的影響程度分析并提取主要特征的問(wèn)題,轉(zhuǎn)換成對(duì)一個(gè)維數(shù)為(355,325)的圖中多個(gè)節(jié)點(diǎn)的參數(shù)向量間影響因子的分析并尋找影響程度較大節(jié)點(diǎn)的問(wèn)題。在此問(wèn)題中,我們將對(duì)各個(gè)節(jié)點(diǎn)進(jìn)行圖建模,并利用ARMA 對(duì)各個(gè)節(jié)點(diǎn)進(jìn)行參數(shù)向量求取,最后利用參數(shù)向量分析出各個(gè)節(jié)點(diǎn)對(duì)目標(biāo)對(duì)象的影響程度。我們?cè)O(shè)計(jì)了算法1來(lái)實(shí)現(xiàn)該處細(xì)節(jié), 算法1 如下所示:

        此處,在進(jìn)行ARMA 建模前還需對(duì)原始數(shù)據(jù)進(jìn)行判別和整定,對(duì)于ARMA 建模,需要進(jìn)行數(shù)據(jù)平穩(wěn)化處理,目的在于剔除掉序列中的趨勢(shì)項(xiàng)。在此問(wèn)題中,各個(gè)操作位的特征向量均是按照時(shí)間序列排成的,所以可能在實(shí)際工廠的操作中,會(huì)有時(shí)間趨勢(shì)隱藏在操作位的變化中。該處的各個(gè)序列具有時(shí)間結(jié)構(gòu),所以對(duì)于具有時(shí)間結(jié)構(gòu)的序列,完成數(shù)據(jù)平穩(wěn)性檢測(cè)和處理后,即是對(duì)節(jié)點(diǎn)進(jìn)行ARMA 建模。此處我們的階數(shù)設(shè)置為ARMA(5,0)。確定階數(shù),即可得到對(duì)應(yīng)數(shù)目的參數(shù),并構(gòu)建參數(shù)向量。

        最后,根據(jù)計(jì)算結(jié)果,距離目標(biāo)對(duì)象參數(shù)向量歐氏距離越近的,影響因子越小,表示對(duì)目標(biāo)對(duì)象(產(chǎn)品的RON)影響程度越高。依照此規(guī)則,我們確定了10 個(gè)操作位,各個(gè)操作位與其對(duì)應(yīng)的影響因子。

        3 實(shí)驗(yàn)結(jié)果

        圖5 為辛烷值預(yù)測(cè)值與真實(shí)值部分?jǐn)?shù)據(jù),模型驗(yàn)證訓(xùn)練神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型時(shí),將數(shù)據(jù)集按4:1 的比例切分為訓(xùn)練集、測(cè)試集,該模型在訓(xùn)練集上有非常高的準(zhǔn)確率,現(xiàn)對(duì)模型進(jìn)行驗(yàn)證,由于模型在訓(xùn)練集和測(cè)試集上都能保持較高的準(zhǔn)確率,故認(rèn)為建立該模型是合理的,該模型具有一定的可行性。如圖6 所示為該模型在測(cè)試集上進(jìn)行驗(yàn)證的結(jié)果,由圖7 可知,用該神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型在測(cè)試集上進(jìn)行驗(yàn)證,將產(chǎn)品性質(zhì)中辛烷值(RON)的預(yù)測(cè)值與真實(shí)值進(jìn)行線性擬合,擬合系數(shù)R 值為0.91315,該擬合系數(shù)R 值略低于在訓(xùn)練集上的擬合系數(shù),同樣證實(shí)該模型在測(cè)試集上的效果非常好,預(yù)測(cè)值與真實(shí)值的誤差為0.08685。如圖7 所示為該模型在訓(xùn)練集和測(cè)試集上的綜合驗(yàn)證回歸參數(shù)結(jié)果,進(jìn)行線性擬合所得擬合系數(shù)R 值為97.63%,證實(shí)該模型在訓(xùn)練集和測(cè)試集上的效果較好,預(yù)測(cè)值與真實(shí)值的誤差為0.01123。

        圖5 辛烷值預(yù)測(cè)值與真實(shí)值部分?jǐn)?shù)據(jù)

        圖6 訓(xùn)練集回歸參數(shù)

        圖7 測(cè)試集回歸參數(shù)

        由上圖驗(yàn)證可知,經(jīng)過(guò)處理后的辛烷值數(shù)據(jù)集烯烴、芳烴、溴三參數(shù)所有值均在正常閾值范圍內(nèi)。綜上所述,該神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型在訓(xùn)練集上的準(zhǔn)確率為0.99922,在測(cè)試集上的準(zhǔn)確率為91.31%,在訓(xùn)練集和測(cè)試集上的整體準(zhǔn)確率為97.63%,如圖8 所示。最終驗(yàn)證了該神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的合理性與可行性。

        圖8 綜合驗(yàn)證回歸參數(shù)

        4 結(jié)論

        本文提出一種改進(jìn)ARMA-XGBoost算法的辛烷值的異常數(shù)據(jù)診斷方法,基于ARMA 回歸算法的特征提取思路,經(jīng)過(guò)實(shí)測(cè)數(shù)據(jù)檢驗(yàn),在訓(xùn)練集和測(cè)試集上的整體準(zhǔn)確率為97.63%。本文所構(gòu)建數(shù)據(jù)處理模型較大程度提升數(shù)據(jù)利用率,給辛烷值數(shù)據(jù)的可靠性及有效性提供保證,在未來(lái)的研究中對(duì)降低實(shí)時(shí)的辛烷值損失方面進(jìn)行有效改進(jìn)提供幫助。

        猜你喜歡
        辛烷值集上汽油
        揚(yáng)州市查處一起非法經(jīng)營(yíng)汽油案
        黨建+經(jīng)營(yíng)催化汽油提效
        Cookie-Cutter集上的Gibbs測(cè)度
        質(zhì)量比改變壓縮比的辛烷值測(cè)定機(jī)
        軟件(2020年3期)2020-04-20 01:45:24
        鏈完備偏序集上廣義向量均衡問(wèn)題解映射的保序性
        PNNL開(kāi)發(fā)車(chē)載分離技術(shù)將乙醇從汽油中分離出來(lái)使辛烷值隨需變化
        復(fù)扇形指標(biāo)集上的分布混沌
        研究法辛烷值和馬達(dá)法辛烷值對(duì)直噴汽油機(jī)性能的影響
        大數(shù)據(jù)是“原油”,不是“汽油”
        聲屏世界(2015年8期)2015-02-28 15:20:26
        基于辛烷值調(diào)合效應(yīng)模型的在線更新方法及其應(yīng)用
        国产精品亚洲精品专区| 一本一本久久a久久精品综合| 伊人久久亚洲综合影院首页| 国产大片在线观看三级| 亚洲精品一区三区三区在线| 免费视频成人片在线观看 | 国产狂喷水潮免费网站www| 久久夜色精品国产噜噜亚洲av| 国产爆乳乱码女大生Av| 日韩色久悠悠婷婷综合| 一个少妇的淫片免费看 | 98色花堂国产精品首页| 国产成人精品曰本亚洲| 亚洲国产一区中文字幕| 又黄又爽又色视频| 日本高清色倩视频在线观看| 成人永久福利在线观看不卡| 一区二区精品天堂亚洲av | 亚洲熟妇网| 亚洲av综合日韩精品久久久| 午夜亚洲精品视频在线| 国产精品美女久久久久av福利| 青青草国产成人99久久| 日韩av一区二区三区精品| 日本一区二区三区丰满熟女| 好大好湿好硬顶到了好爽视频 | 国产精品一区二区三区不卡| 精品国产精品三级在线专区| 人妻av鲁丝一区二区三区| 久久精品国产91久久性色tv| 中国av一区二区三区四区| 色综合久久蜜芽国产精品| 天堂√中文在线bt| aⅴ色综合久久天堂av色综合| 午夜国产精品视频在线观看| 亚洲综合色区另类av| 国产高清吃奶成免费视频网站 | а的天堂网最新版在线| 按摩偷拍一区二区三区| 粉嫩av国产一区二区三区| 美女高潮无遮挡免费视频|