亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        柴油餾分碳數(shù)分布的預測研究

        2018-12-11 07:47:24任小甜褚小立田松柏
        石油煉制與化工 2018年12期
        關鍵詞:環(huán)烷烴碳數(shù)烴類

        任小甜,褚小立,田松柏

        (中國石化石油化工科學研究院,北京 100083)

        對于柴油來說,其沸程、密度等各項物性以及十六烷值、潤滑性、低溫流動性等使用性能都與其分子組成有關[1],不同來源(不同產(chǎn)地的原油和不同的加工工藝)的柴油分子組成差別較大,其從根本上決定了柴油的各項性質及其使用性能。傳統(tǒng)的表征方法只能得到柴油餾分的烴類組成,為了滿足目前清潔、優(yōu)質柴油的生產(chǎn)需求,需要從分子水平上深入認識柴油的詳細組成,探究其各項物性及使用性能和分子組成的關系。目前,基于軟電離技術的氣相色譜飛行時間質譜(GC-TOF MS)是一種快速有效的柴油分子組成的表征方法[2-3]。但該儀器平臺價格昂貴,分析過程比較復雜,需要專業(yè)的技術人員進行操作,不能滿足工業(yè)生產(chǎn)中快速實時分析的要求。而柴油的基本物性由常規(guī)分析手段就可以得到,大多數(shù)煉油廠都具備這樣的分析條件;另外,由柴油餾分的基本物性數(shù)據(jù),尤其是近紅外光譜數(shù)據(jù)又可以準確計算其烴類組成信息[4]。如果能夠利用這些常規(guī)物性和組成數(shù)據(jù)快速預測柴油餾分的詳細碳數(shù)分布信息,將對石油的分子水平煉制產(chǎn)生重要影響。

        現(xiàn)有文獻已經(jīng)報道了一些基于常規(guī)物性計算來預測柴油餾分的分子組成包括碳數(shù)分布組成的方法[5-6],其基本研究思路是預先設定一個虛擬分子庫,確定每個虛擬分子的各項物性數(shù)據(jù),再利用混合規(guī)則來計算柴油餾分的宏觀物性,最后通過優(yōu)化各項宏觀物性的損失函數(shù)來確定各分子的含量,以這些虛擬分子的組成來表示柴油。這種方法存在很大的局限性,首先,虛擬分子的設定不一定準確,而且需要確定大量單體分子的各項物性數(shù)據(jù),許多物性存在缺失的情況,準確度也不能保證;另一方面,從優(yōu)化計算的角度來講,虛擬分子的數(shù)量遠大于宏觀物性的數(shù)目,這樣會導致計算結果不唯一,即使引入人為簡化的分布函數(shù)減少變量個數(shù),其本質也是一個非凸優(yōu)化的過程,求解難度很大,準確度也不夠高。

        本研究從機器學習的角度出發(fā)建模,以一定數(shù)量的柴油樣本為基礎,確定其標準的物性數(shù)據(jù)和烴類組成數(shù)據(jù)作為特征,以其詳細的碳數(shù)分布組成數(shù)據(jù)作為輸出,結合最近鄰回歸算法(KNR)和過采樣技術建立回歸模型,實現(xiàn)由柴油餾分的物性數(shù)據(jù)和烴類組成數(shù)據(jù)快速預測其詳細碳數(shù)分布組成信息。

        1 算法原理

        1.1 KNR算法

        最近鄰算法(KNN)是一種有監(jiān)督的機器學習算法,不同于其它算法的是,其屬于消極學習,即模型不需要訓練,無需估計參數(shù),根據(jù)輸出目標種類的不同又分為KNR和最近鄰分類算法(KNC)。該算法的基本思想是距離相近的樣本具有相似的屬性,預測時先分別計算待測樣本到每個訓練集樣本在特征空間中的歐式距離,找出距離最近的k個樣本,再利用最鄰近的這k個樣本進行決策,對于分類問題,k個樣品中哪種類別的訓練樣本占多數(shù),待測樣本就屬于這一類,對于回歸問題,則將k個樣本屬性的平均值作為待測樣本的屬性。對于柴油餾分,假設各項物性數(shù)據(jù)和烴類組成相似的樣本,其本質上就是相似的,反映到分子組成上就是其碳數(shù)分布組成信息都是類似的。所以,本研究選擇KNR算法建模,即先根據(jù)物性數(shù)據(jù)和烴類組成找到與待測樣本距離最近的k個訓練樣本,將這幾個樣本的碳數(shù)分布組成數(shù)據(jù)按照距離的不同進行加權線性加和,即同時得到待測樣本的包含300多項集總含量的碳數(shù)分布信息。其中,引入高斯函數(shù)來計算不同距離樣本的權重ω,計算式如下:

        (1)

        (2)

        式中:k為最近樣本的個數(shù),Si表示第i個最近樣本的高斯函數(shù)值;ωi為第i個最近樣本對應的權重;di為待測樣本和第i個最近樣本的歐式距離;σ為高斯函數(shù)的參數(shù),本研究取值為10。待測樣本的碳數(shù)分布組成數(shù)據(jù)的預測計算式如下:

        (3)

        式中:y為待測樣本的碳數(shù)分布組成數(shù)據(jù),yi為k個最近樣本中第i個樣本的碳數(shù)分布組成數(shù)據(jù)。

        1.2 過采樣技術

        對于KNR算法,庫中的訓練樣本越多,越能找到與待測樣本距離更近的樣本,即碳數(shù)分布組成信息相似的樣本,從而保證預測結果的準確性。而在實際應用場景中,收集大量組成數(shù)據(jù)和物性數(shù)據(jù)都完備的樣本是比較困難的,尤其是對于分析成本較高的性質,如碳數(shù)分布組成信息等。另外,對于不同待測樣本,尤其是不同種類的樣本,很難保證在庫中能找到距離足夠近的樣本來滿足KNR的計算。所以,本研究利用過采樣技術來解決訓練樣本不足的問題。該算法的基本思想是,先從庫中找到與待測樣本距離最近的幾個樣本,然后將這幾個近鄰樣本按照任意質量比進行混合,這樣可以得到大量的虛擬樣本,同時虛擬樣本的物性數(shù)據(jù)和組成數(shù)據(jù)也可以由線性加和計算得到,其計算式如下:

        (4)

        利用過采樣技術,在每個待測樣本的周圍都生成大量的、物性和組成數(shù)據(jù)完備的虛擬樣本,這樣就可以保證KNR算法能準確地找到最相似的樣本,進而保證預測結果的準確性。需要注意的是,要利用過采樣技術生成虛擬樣本,庫中各樣本的各項屬性都必須滿足線性加和的規(guī)則,或者經(jīng)過數(shù)學轉換后符合線性加和規(guī)則。具體到柴油餾分中,就是要選擇符合線性加和的物性數(shù)據(jù)作為輸入特征,烴類組成數(shù)據(jù)和碳數(shù)分布組成信息自然是滿足線性加和條件的。

        2 實 驗

        2.1 測定樣品數(shù)據(jù)

        收集直餾柴油樣品78個,這些樣品從不同產(chǎn)地的原油分餾而得,具有一定的代表性。用標準方法測定其硫含量、氮含量、酸值,這3項物性能滿足線性加和條件。用氣相色譜-質譜聯(lián)用儀分析柴油樣品的烴類組成信息(SHT 0606),用帶場電離源(FI)的GC-TOF MS測定樣品的詳細碳數(shù)分布信息。

        2.2 數(shù)據(jù)預處理

        以柴油樣本的3個物性數(shù)據(jù)、11個烴類(分別為鏈烷烴、單環(huán)環(huán)烷烴、雙環(huán)環(huán)烷烴、三環(huán)環(huán)烷烴、烷基苯、茚滿四氫萘、茚類、萘類、苊類、苊烯類和三環(huán)芳烴)的組成信息作為模型的輸入特征X。對于碳數(shù)分布信息,根據(jù)標準方法中的模板,用一個由碳數(shù)分布范圍在7~30的13種烴類同系物的族組成的矩陣表示,將該碳數(shù)分布矩陣按照不同的列依次展開,共計312個碳數(shù)項,構成模型的輸出值Y,由此確定模型的數(shù)據(jù)庫。

        對于KNR算法,其中會涉及到樣本間距離的計算,而柴油樣品的物性數(shù)據(jù)和烴類組成數(shù)據(jù)的量綱不同,取值范圍也有很大的差異,所以要對樣本的輸入特征X進行標準化預處理,消除量綱的影響,進一步保證預測結果的準確性。

        2.3 建立預測模型

        上述庫中的78個樣本作為訓練集。模型計算的流程如下:取一個待測樣本,首先將其輸入特征X進行標準化預處理,再計算其與庫中各樣本的歐式距離,找出最近的6個樣本,利用過采樣技術生成5 000個虛擬樣本,將待測樣本周圍的特征空間密集化;然后通過KNR算法,從生成的虛擬樣本中找出最近鄰的k個樣本,然后通過線性加權求和計算出碳數(shù)分布組成的預測值,并與實驗值進行比對。

        3 結果與討論

        3.1 相似度分析

        本研究的模型以柴油的3項物性和11個烴類組成數(shù)據(jù)作為輸入特征,這些特征能否充分反映出樣本的本質區(qū)別是模型準確預測的先決條件,即通過這些特征從庫中找出兩個相似樣本,在碳數(shù)分布組成上也必須保持基本一致的相似度。為此,本研究考察了樣本在特征和碳數(shù)分布組成上的相似度,隨機抽取一個柴油樣本CY656,從庫中找出與其歐氏距離最近的3個樣本(CY540,CY621,CY624),分別計算這3個近鄰樣本和待測樣本CY656在特征和碳數(shù)分布組成上的相似度(sd1、sd2),計算結果如表1所示。其中相似度的計算式如下:

        (5)

        式中:sd表示兩個樣本之間的相似度;d表示樣本之間的歐式距離;m表示特征的維度。

        表1 近鄰樣本的相似度比較

        計算結果表明,待測樣本CY656與近鄰樣本CY540,CY621,CY624在特征和碳數(shù)分布組成上的相似度基本一致,根據(jù)直餾柴油的14項特征可以從庫中找出與待測樣本碳數(shù)分布組成基本相似的樣本,進而可以用這些近鄰樣本擬合計算待測樣本的碳數(shù)分布組成,因此本研究的預測模型能保證足夠的準確度。

        3.2 模型的超參數(shù)

        KNR模型中一般有一個重要的超參數(shù)需要優(yōu)化,即最近鄰樣本數(shù)目k,若k值太小,模型的泛化性能則很差,很可能在庫中找不出k個最近鄰樣本;假如k值太大,則可能找出不是最相似的樣本,模型的準確性又下降。本研究利用交叉驗證的方法來確定模型中k的最優(yōu)取值。在庫中任意抽取5個樣本,利用過采樣技術在這5個樣本之間生成5 000個虛擬樣本,然后用這些樣本構建KNR的10折交叉驗證模型。首先將樣本平均分為10份,依次取出1份作為測試集,剩下的9份作為訓練集,接著利用KNR算法分別對每1份測試集的碳數(shù)分布組成進行計算,并計算這些訓練集樣本的平均標準偏差(RMSECV)。選定不同的k值(1~15),依次進行上述的計算,根據(jù)RMSECV的取值最小確定模型的最佳k值。超參數(shù)k的交叉驗證計算的結果如圖1所示。由圖1可知,當k=5時,RMSECV的取值最小,說明模型的最佳k值為5。

        圖1 k值的10折交叉驗證計算

        3.3 待測樣本的預測分析

        新取一個待測樣本,用標準方法測定其硫含量、氮含量、酸值以及11項烴類組成數(shù)據(jù),將這14個輸入特征X進行標準化預處理,然后代入上述的預測模型進行碳數(shù)分布組成的計算。將14個輸入特征進行主成分分析,選取前兩個主成分的得分(PC1、PC2)進行作圖,樣本在特征空間中的分布如圖2所示,其中紅色的點為待測樣本,黑色的點為與待測樣本相似的6個庫中真實樣本,藍色的點表示由這6個近鄰樣本生成的5 000個虛擬樣本。由圖2可知,通過過采樣技術,可以將待測樣本周圍的空間有效地密集化,進而滿足算法的要求,保證預測模型的準確性。

        圖2 樣本在特征空間中的分布

        石油中的化合物類型通常用缺氫數(shù)Z加上雜原子來表示,分子中每增加1個雙鍵或者1個環(huán),Z值就減少2,如苯并噻吩類化合物可由-10S表示。柴油的碳數(shù)分布組成數(shù)據(jù)中一般包括13種分子類型,分別為鏈烷烴、單環(huán)環(huán)烷烴、雙環(huán)環(huán)烷烴、三環(huán)環(huán)烷烴、烷基苯、茚滿四氫萘、茚類、苯并噻吩、萘類、苊類、苊烯類、二苯并噻吩和三環(huán)芳烴,對應的Z值分別為+2,0,-2,-4,-6,-8,-10,-10S,-12,-14,-16,-16S,-18。待測樣本的飽和烴、單環(huán)芳烴、雙環(huán)芳烴和三環(huán)芳烴的碳數(shù)分布對比如圖3所示,其中折線為模型的預測值,散點為實測值。從圖3可以看出,飽和烴和雙環(huán)及三環(huán)芳烴的碳數(shù)分布的預測偏差都比較小,預測值和實測值都比較吻合,單環(huán)芳烴在低碳數(shù)處有一定的預測偏差,總的來說,本研究所建立模型的預測精度較高。圖4為整個碳數(shù)分布矩陣預測值和實測值的氣泡圖對比。從圖4可以看出,所有氣泡基本都能完全契合,只是在少數(shù)含量很低的高碳數(shù)組分處出現(xiàn)了一定的偏差。上述結果表明,本研究的模型預測精度高,能得到和標準分析方法基本一致的結果,具有一定的應用價值。此外,在預測時發(fā)現(xiàn),當待測樣本處于界外,即在庫中找出的近鄰樣本相距都較遠時,就會出現(xiàn)預測偏差增大的情況,在樣本的空間分布圖上也會顯示出虛擬樣本不能包圍覆蓋待測樣本,所以必須保證庫中有大量樣本,在后續(xù)的模型維護中,主要的工作就是增加各類型的柴油餾分樣本。

        這種模型不需要訓練,沒有參數(shù)估計,方便部署,計算速度快,準確度高,可以一次性計算出多達312項的碳數(shù)分布信息,另一方面,模型的維護也比較容易,面對一個新的應用環(huán)境時,不需要再進行訓練,直接在庫中增加樣本即可。同時,對于不同種類的柴油餾分,也不需要分別單獨建模,只要保證庫中有足夠的各類型樣本,再結合過采樣技術同步在待測樣本周圍生成虛擬樣本,就可以給出比較準確的預測。

        模型預測值: —鏈烷烴; —單環(huán)烷烴; —雙環(huán)烷烴; —三環(huán)烷烴。實測值: ▲—鏈烷烴; 單環(huán)烷烴; ●—雙環(huán)烷烴; ★—三環(huán)烷烴

        模型預測值: —烷基苯; —茚滿或四氫萘; —茚類; —苯并噻吩。實測值: ▲—烷基苯; 茚滿或四氫萘; ●—茚類; ★—苯并噻吩

        模型預測值: —萘類; —苊類; —苊烯類; —二苯并噻吩; —三環(huán)芳烴。

        圖4 碳數(shù)分布的預測值和實驗值氣泡圖

        4 結 論

        (1)結合KNR算法和過采樣技術提出了一種由物性數(shù)據(jù)和烴類組成數(shù)據(jù)快速預測柴油餾分中碳數(shù)分布組成的方法。

        (2)利用上述算法,對直餾柴油進行了建模研究,以柴油的硫含量、氮含量、酸值以及11項烴類組成(分別為鏈烷烴、單環(huán)環(huán)烷烴、雙環(huán)環(huán)烷烴、三環(huán)環(huán)烷烴、烷基苯、茚滿四氫萘、茚類、萘類、苊類、苊烯類和三環(huán)芳烴)信息作為模型的輸入特征進行模型計算,結果表明該方法預測精度高,能一次性快

        速地計算出直餾柴油中312項碳數(shù)分布組成信息,同時模型維護簡單,通過增加庫中的樣本就可以擴大模型的適用范圍,具有一定的實用價值。

        猜你喜歡
        環(huán)烷烴碳數(shù)烴類
        氣相色譜-質譜聯(lián)用技術測定噴氣燃料烴類碳數(shù)分布
        催化裂化柴油加氫生產(chǎn)高密度噴氣燃料過程研究
        氣相色譜六通閥在正構烷烴及碳數(shù)分布測定中的應用
        云南化工(2021年11期)2022-01-12 06:06:30
        碳四烴類資源綜合利用現(xiàn)狀及展望
        云南化工(2021年5期)2021-12-21 07:41:18
        煤直接液化循環(huán)溶劑中飽和烴的分子組成及分布特點
        煤炭轉化(2020年2期)2020-04-24 03:08:40
        蘭州市低碳數(shù)正構烷烴組分特征及大氣化學反應活性分析
        α-烯烴組成對PAO性質影響的研究
        烴類高考常見考點直擊
        切削油液專用環(huán)烷基基礎油的開發(fā)及其應用研究
        潤滑油(2016年4期)2016-11-04 18:11:46
        有關烴類燃燒重要規(guī)律剖析
        99久久99久久久精品齐齐| 国产精品亚洲综合天堂夜夜| 日韩av无码午夜福利电影| 美国又粗又长久久性黄大片| 国产一区二区三区色哟哟| 国产爆乳美女娇喘呻吟| 激情影院内射美女| 國产一二三内射在线看片| 国产对白刺激在线观看| 青青草是针对华人绿色超碰| 精品人妻av区乱码色片| 欧美亚洲国产一区二区三区| 区久久aaa片69亚洲| 亚洲欧美日韩国产综合专区 | 久久久精品国产亚洲av网不卡| 国产一区二区精品人妖系列在线| 国产乱人无码伦av在线a | 久久久久国产精品片区无码| 国产又色又爽的视频在线观看91| 久久亚洲国产精品123区| 亚洲av一区二区网址| 国产亚洲精品90在线视频| 日韩精品成人无码专区免费| 无码国产一区二区三区四区| 国产成人无精品久久久| 国产美女一区三区在线观看| 亚洲av日韩av激情亚洲| 国产顶级熟妇高潮xxxxx| 久久频精品99香蕉国产| 亚洲综合网中文字幕在线| 久久一二区女厕偷拍图| 亚洲国产成人片在线观看| 国产偷国产偷亚洲清高| 男女上床视频在线观看| 中文字幕高清不卡视频二区| 乱码丰满人妻一二三区| 中国丰满熟妇xxxx性| 亚洲色大成网站www在线观看| av永远在线免费观看| 国产av一区二区亚洲精品| 亚洲va国产va天堂va久久|