楊 帆,周 敏,戴超男,曹 軍
(1.聯(lián)想數(shù)據(jù)智能應(yīng)用實驗室,四川 成都 610041;2.四川理工學(xué)院 過程裝備與控制工程四川省高校重點實驗室,四川 自貢 643000;3.華東理工大學(xué) 機(jī)械與動力工程學(xué)院,上海 200237)
催化裂化是重質(zhì)油在酸性催化劑存在下,在500 ℃左右、1×105~3×105Pa的壓力下發(fā)生以裂化反應(yīng)為主的一系列化學(xué)反應(yīng)生成輕質(zhì)油、氣體和焦炭的過程。目前,我國催化裂化裝置生產(chǎn)的柴油和汽油約占成品柴油和汽油總量的30%和70%左右,已經(jīng)成為重油加工的最重要方法之一[1-5]。催化裂化的工藝過程和產(chǎn)品收率優(yōu)化的建模分析一直是石油加工領(lǐng)域研究的熱點和難點。目前常用的催化裂化過程建模方法有機(jī)理建模法[6-8]和統(tǒng)計建模法[9-11]。由于催化裂化是一個高度非線性和相互強(qiáng)關(guān)聯(lián)的系統(tǒng),其中原料油性質(zhì)、反應(yīng)再生催化劑性質(zhì),以及反應(yīng)操作工況條件等因素都會影響到反應(yīng)過程和產(chǎn)物收率,使用傳統(tǒng)的機(jī)理模型很難全面地去描述,大數(shù)據(jù)技術(shù)則是解決這一問題的有力工具。
目前,大數(shù)據(jù)技術(shù)正處于其應(yīng)用的高速發(fā)展期,并已經(jīng)在電子商務(wù)[12]、電力[13]、航空[14]以及醫(yī)療[15]等領(lǐng)域取得了巨大的成功。隨著石化行業(yè)生產(chǎn)過程的自動化控制水平日益提高和工藝流程控制系統(tǒng)的不斷完善,各種原料數(shù)據(jù)、催化劑性能數(shù)據(jù)以及操作工況參數(shù)等都能從裝置的數(shù)據(jù)庫平臺中實時采集。這些數(shù)據(jù)記錄了反應(yīng)過程的特征、性能和變化,反映了反應(yīng)過程的本質(zhì),大大改進(jìn)了原來數(shù)據(jù)收集的不完整。已經(jīng)積累的海量過程數(shù)據(jù)為數(shù)據(jù)挖掘技術(shù)在石化領(lǐng)域的應(yīng)用提供了良好的基礎(chǔ)條件。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于石化反應(yīng)過程,建立完善的統(tǒng)計學(xué)分析模型,可縮短新工藝的開發(fā)研究周期、優(yōu)化工程設(shè)計方案、優(yōu)化裝置操作和實現(xiàn)裝置的在線優(yōu)化,多角度全方位地對反應(yīng)過程及其影響機(jī)制進(jìn)行分析,從而可進(jìn)一步提高原料利用率和所需產(chǎn)品的產(chǎn)率,具有傳統(tǒng)機(jī)理分析優(yōu)化方法無法比擬的優(yōu)勢[16]。這一優(yōu)勢在催化裂化工藝操作工況的優(yōu)化和產(chǎn)品收率的預(yù)測方面體現(xiàn)的更為明顯。
目前,已有研究者將神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等人工智能算法應(yīng)用于優(yōu)化催化裂化工藝。Zahedi等[17]使用誤差反向傳播神經(jīng)網(wǎng)絡(luò)和徑向基神經(jīng)網(wǎng)絡(luò)建立了催化重整的預(yù)測模型,并采用單變量優(yōu)化方法優(yōu)化了溫度和壓力等工藝參數(shù),使汽油收率從80%增加到82%。李鵬等[18]在中國石化開發(fā)的煉油技術(shù)分析與遠(yuǎn)程診斷平臺上,運(yùn)用大數(shù)據(jù)數(shù)據(jù)處理技術(shù)和積累的海量的催化運(yùn)行數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘與分析,對催化裂化裝置報警、結(jié)焦等問題進(jìn)行深入探索研究與分析,解決了催化裂化裝置報警問題、結(jié)焦問題和收率問題,從而進(jìn)一步提升了催化裂化裝置運(yùn)行水平。陳露[19]通過整理大量原油評價數(shù)據(jù),建立了原油性質(zhì)和催化裂化反應(yīng)產(chǎn)物分布數(shù)據(jù)之間的模型,并采用化學(xué)計量學(xué)校正了該模型,結(jié)果表明所建立的原油評價模型具有較好的適用性。孔金生等[20]對催化裂化數(shù)據(jù)進(jìn)行了預(yù)處理并建立了粗汽油干點的神經(jīng)網(wǎng)絡(luò)模型,結(jié)果證明該模型具有可靠性。方偉剛[21]以中國石化九江分公司催化裂化裝置提供的實時過程數(shù)據(jù)為基礎(chǔ),進(jìn)行了產(chǎn)品收率優(yōu)化的研究,建立了合適的原料油性質(zhì)聚類模型和產(chǎn)品收率神經(jīng)網(wǎng)絡(luò)模型,并使用優(yōu)化算法對操作條件進(jìn)行了優(yōu)化。
筆者以某煉化公司催化裂化裝置提供的實時過程數(shù)據(jù)為基礎(chǔ),建立了合適的原料油性質(zhì)聚類模型和產(chǎn)品收率預(yù)測模型,然后使用優(yōu)化算法對操作條件進(jìn)行優(yōu)化。計算分析的結(jié)果有助于進(jìn)一步提升催化裂化裝置的汽油收率,進(jìn)而增加企業(yè)經(jīng)濟(jì)效益,并為工業(yè)操作提供可靠的技術(shù)支持。
筆者使用的數(shù)據(jù)均采集自某石化企業(yè)的LIMS(Laboratory information management system)及DCS(Distributed control system)系統(tǒng)。通過LIMS系統(tǒng)可采集到原料油和再生催化劑性質(zhì)的相關(guān)數(shù)據(jù),其分析頻次為1次/周。為了采集到足夠多的樣本,LIMS數(shù)據(jù)采集時間段從2016年8月4日至2018年3月20日共近2年。通過DCS系統(tǒng)可采集到操作變量和系統(tǒng)物料平衡數(shù)據(jù),每隔15 s記錄1次,裝置數(shù)據(jù)采集時間段從2017年10月21日至2018年 4月25日共6個月。將DCS和LIMS的數(shù)據(jù)按“時間戳[分割符]指標(biāo)值”的格式整理,每條數(shù)據(jù)由時間戳和指標(biāo)值兩個字段構(gòu)成。為了方便進(jìn)一步清洗以及計算,將所有數(shù)據(jù)按時間戳升序進(jìn)行排序。
由于一些客觀的裝置條件以及人為因素,例如數(shù)據(jù)采集系統(tǒng)出現(xiàn)問題、數(shù)據(jù)存儲/傳輸過程中發(fā)生錯誤等,采集到的數(shù)據(jù)可能存在部分?jǐn)?shù)據(jù)缺失、重復(fù)、不完整、噪音、異常等情況;除此之外,原始數(shù)據(jù)中還存在部分冗余數(shù)據(jù)。為了保證訓(xùn)練數(shù)據(jù)的正確性和有效性,同時提高模型運(yùn)算的效率,需要對數(shù)據(jù)進(jìn)行清洗。對于不同類型的數(shù)據(jù)異常,相應(yīng)的清洗方法如下:
①數(shù)據(jù)格式錯誤。每條數(shù)據(jù)必須滿足給定的格式,其中第一個字段是timestamp類型,第二個字段是float類型??梢灾苯觿h除格式錯誤的數(shù)據(jù)。
②數(shù)據(jù)值異常。計算每個指標(biāo)的均值μ和標(biāo)準(zhǔn)差σ,使用萊特準(zhǔn)則,將(μ±3σ)范圍外的數(shù)據(jù)定義為異常值,并使用時間臨近的數(shù)據(jù)做加權(quán)平均作為替代。
③數(shù)據(jù)重復(fù)。同一指標(biāo)的數(shù)據(jù)中可能存在多條相同的時間戳記錄,需要選擇其中合法的數(shù)值并取均值。
④數(shù)據(jù)缺失。缺少某些應(yīng)有時刻的數(shù)據(jù),可以將缺省數(shù)據(jù)點看作異常值,使用時間臨近的數(shù)據(jù)做加權(quán)平均。
針對不同的分析指標(biāo),其監(jiān)控采集頻率可能不同。為了便于數(shù)據(jù)分析與計算,需要將這些數(shù)據(jù)在時間上對齊:即對所有分析指標(biāo)使用統(tǒng)一的時間間隔。通過分析數(shù)據(jù)的特點,筆者將60 min作為參考時間間隔。對于采集時間間隔小于60 min的數(shù)據(jù),需要做采樣處理,通過設(shè)置60 min大小的時間窗口,取該時間窗口里的數(shù)值的均值。對于采集時間間隔大于60 min的參數(shù),需要做插值處理。根據(jù)不同系統(tǒng)的采集頻率,一般DCS系統(tǒng)采集到的數(shù)據(jù)需要進(jìn)行采樣處理,而由LIMS系統(tǒng)收集到的數(shù)據(jù)則需要進(jìn)行插值處理。筆者采用3種插值方法:
①直接使用前一次的測量值插值。
②線性插值。
③二階B樣條插值。
以監(jiān)測點指標(biāo)數(shù)據(jù)“混合原料密度(20 ℃)”在2016年11月至2017年3月30日之間的數(shù)據(jù)為例,該數(shù)據(jù)的原始分布如圖1所示。
按照以上思路分別使用3種插值方法計算,結(jié)果數(shù)據(jù)如圖2、3及4所示。其中:圖2為直接使用前一次的測量值插值所得數(shù)據(jù);圖3為線性插值處理結(jié)果;圖4為二階B樣條插值處理結(jié)果。3種插值方法都可以彌補(bǔ)時間間隔內(nèi)的缺省值,且處理得到的結(jié)果相似。
圖3 對圖1數(shù)據(jù)線性差值處理結(jié)果Fig.3 Results of processing linear interpolation for data of Fig.1
圖4 對圖1數(shù)據(jù)二階B樣條插值處理結(jié)果Fig.4 Results of processing quadratic B-spline interpolation for data of Fig.1
利用機(jī)器學(xué)習(xí)模型預(yù)測產(chǎn)品收率的方法已經(jīng)被一些文獻(xiàn)提及或使用,其中較大比例采用神經(jīng)網(wǎng)絡(luò)構(gòu)建模型[20]。神經(jīng)網(wǎng)絡(luò)的優(yōu)點在于擬合能力非常強(qiáng),理論上能逼近任意非線性映射,且自學(xué)習(xí)與自適應(yīng)性強(qiáng)。另一方面,由于在神經(jīng)網(wǎng)絡(luò)模型中有較多超參數(shù)需要確認(rèn),往往需要較長時間的反復(fù)調(diào)參,才能取得好的效果;同時,其可解釋性較差,不利于研究輸入向量各分量之間以及它們與輸出的相關(guān)性。
根據(jù)以上分析,筆者決定采用另一種擬合能力較強(qiáng)的模型:由多棵決策樹構(gòu)成的集成學(xué)習(xí)模型。樹模型對于真實分布的擬合效果較好,具有一定的可解釋性,且可以用于特征篩選。多決策樹模型的典型代表是使用bagging方式集成的隨機(jī)森林模型和通過boosting方式集成的梯度提升決策樹(Gradient boosting decision tree,GBDT)模型。通過對比這兩種模型在實際數(shù)據(jù)集上的應(yīng)用,發(fā)現(xiàn)GBDT在產(chǎn)品收率上的表現(xiàn)更好。因此,本研究選擇使用GBDT構(gòu)建預(yù)測模型。
GBDT是一種迭代的決策樹算法,通過采用加法模型(即基函數(shù)的線性組合),不斷減小訓(xùn)練過程產(chǎn)生的殘差來完成數(shù)據(jù)分類或者回歸。在訓(xùn)練過程中,每輪迭代開始時,計算損失函數(shù)的負(fù)梯度在當(dāng)前模型的值,將其作為殘差的估計去擬合一個回歸樹;每次迭代都會生成一顆新的決策樹,將每輪訓(xùn)練得到的樹加權(quán)求和,可以得到輸出的最終模型。GBDT的主要特點,即是通過在每輪訓(xùn)練中讓損失函數(shù)盡可能快地減小,以便盡快地收斂達(dá)到局部最優(yōu)解或者全局最優(yōu)解。
篩選DCS與LIMS系統(tǒng)中與汽油產(chǎn)率正負(fù)相關(guān)性較強(qiáng)的指標(biāo)是一個優(yōu)化模型特征選擇的過程。它們的測量值變化與汽油收率線性相關(guān)系數(shù)較高,一定程度上可以更好地反映或逼近真實收率的變化趨勢,可能是影響汽油收率的關(guān)鍵指標(biāo)。在模型的構(gòu)建中,考慮將這些潛在的關(guān)鍵指標(biāo)作為特征,可以有效降低訓(xùn)練數(shù)據(jù)集的維度,同時提高模型的學(xué)習(xí)性能。
采集到的LIMS和DCS數(shù)據(jù)中包括近2000個分析指標(biāo),其中大部分不適用于產(chǎn)品收率預(yù)測,因此需要對已有的分析指標(biāo)進(jìn)行篩選。首先,使用大數(shù)據(jù)分析的方法,篩選出與產(chǎn)品收率相關(guān)性較高的指標(biāo)。使用Pearson系數(shù)作為考察相關(guān)性的依據(jù),將采集到的指標(biāo)與汽油收率按60 min的時間粒度,依照2.2節(jié)中介紹的方法進(jìn)行時間對齊后,計算Pearson相關(guān)系數(shù)。其中,DCS數(shù)據(jù)中與汽油收率正相關(guān)性較高的27個指標(biāo)如表1所示,負(fù)相關(guān)性較高的22個指標(biāo)如表2所示。
對于LIMS系統(tǒng)中的數(shù)據(jù),由于無法明確LIMS數(shù)據(jù)中各個指標(biāo)在監(jiān)測間隔里的變化過程,基于現(xiàn)有數(shù)據(jù)無法比較3種不同插值方法的優(yōu)劣。考慮到僅采用一種插值方法得到的數(shù)據(jù)可能有一定偏差,筆者選擇同時使用3種插值方法分別處理數(shù)據(jù)。LIMS系統(tǒng)中計算得到的正相關(guān)性較強(qiáng)的21個指標(biāo)如表3所示,負(fù)相關(guān)性較強(qiáng)的25個指標(biāo)如表4所示。
除此之外,由于催化裂化反應(yīng)的特性,可以從工業(yè)經(jīng)驗角度考慮,篩選出影響產(chǎn)品收率的關(guān)鍵指標(biāo)作為模型特征。根據(jù)催化裂化產(chǎn)品的生成過程,并結(jié)合工業(yè)經(jīng)驗,可以篩選出部分線性相關(guān)性不高,卻對產(chǎn)品收率有重要影響的經(jīng)驗指標(biāo),包括提升管反應(yīng)器出口溫度、原料中飽和烴與膠質(zhì)含量、汽提蒸汽流量、催化劑活性指數(shù)等[20]。將這些重要指標(biāo)作為參照指標(biāo),計算其與產(chǎn)品收率的相關(guān)性作為參照相關(guān)性,用于從以上正負(fù)相關(guān)性較強(qiáng)的指標(biāo)中篩選出相關(guān)性大于或接近參照相關(guān)性的指標(biāo)。作為參考的重要因素的相關(guān)性如表5、6所示。
經(jīng)過篩選的指標(biāo)的因變量需要進(jìn)行人工去除。整理篩選出的正負(fù)相關(guān)性較強(qiáng)指標(biāo),并結(jié)合工業(yè)經(jīng)驗參考指標(biāo),共同作為候選原始特征。通過對所得的原始特征做尺度變換、多項式交叉、差分等特征工程處理,得到可以應(yīng)用于GBDT算法模型的新的特征。
表1 DCS數(shù)據(jù)中與汽油收率正相關(guān)性較高的指標(biāo)Table 1 Factors with high positive correlations for gasoline yield in DCS data
表2 DCS數(shù)據(jù)中與汽油收率負(fù)相關(guān)性較高的指標(biāo)Table 2 Factors with high negative correlations for gasoline yield in DCS data
表3 LIMS數(shù)據(jù)中與汽油收率正相關(guān)性較高的指標(biāo)Table 3 Factors with high positive correlations for gasoline yield in LIMS data
表4 LIMS數(shù)據(jù)中與汽油收率負(fù)相關(guān)性較高的指標(biāo)Table 4 Factors with high negative correlations for gasoline yield in LIMS data
表5 DCS數(shù)據(jù)中參照指標(biāo)與汽油收率的相關(guān)性Table 5 The correlations between reference factors and gasoline yield in DCS data
表6 LIMS數(shù)據(jù)中參照指標(biāo)與汽油收率的相關(guān)性Table 6 The correlations between reference factors and gasoline yield in LIMS data
目前普遍用于構(gòu)建產(chǎn)品收率預(yù)測模型的算法都為神經(jīng)網(wǎng)絡(luò)算法,少有研究使用樹類模型對收率進(jìn)行預(yù)測。相比之下,樹類模型的可解釋性與對模型特征的篩選作用,使得其在解釋特征在模型中的重要性與工業(yè)優(yōu)化方面更有潛力與優(yōu)勢。筆者選擇樹類模型中的GBDT算法構(gòu)建預(yù)測模型,模型構(gòu)建的框架如下所示,其中模型輸入為訓(xùn)練數(shù)據(jù)集T={(x1,y1),(x2,y2),…,(xN,yN)},xi∈Rn,yi∈R,迭代的次數(shù)為t,損失函數(shù)為L(y,f(x)),輸出GBDT模型:
(1)特征選擇:根據(jù)特征的權(quán)重w從特征集中抽取p比例的特征。
(2)初始化基學(xué)習(xí)器:
(1)
(3)對于迭代次數(shù)t=1,2,…,T:
a.對訓(xùn)練樣本i=1,2,…,N,計算負(fù)梯度(rti):
(2)
b.利用rt擬合1個回歸樹,得到第t棵回歸樹 (Treet),并對于葉子區(qū)域計算最佳擬合值。
c.更新模型ft(x)=ft-1(x)+Treet。
(4)得到模型:
(3)
GBDT算法的主要特點在于在訓(xùn)練中將損失函數(shù)的負(fù)梯度在當(dāng)前模型的值作為殘差估計,并利用線性搜索估計回歸樹葉結(jié)點區(qū)域的值,使損失函數(shù)最小化,從而更新回歸樹并得到最終的模型。它的每一次迭代都會在殘差減少的梯度方上建立新模型,因此GBDT算法會更關(guān)注梯度比較大的樣本。
筆者采用GBDT模型的開源模塊實現(xiàn)lightGBM回歸方法進(jìn)行學(xué)習(xí)。為了保證篩選出的所有特征指標(biāo)都有合理的數(shù)據(jù),截取2017年10月21日至2018年3月20日的數(shù)據(jù)作為整體數(shù)據(jù)集,選擇前4個月的特征數(shù)據(jù)和實測收率值作為訓(xùn)練樣本,剩余的數(shù)據(jù)作為預(yù)測樣本用以驗證模型的準(zhǔn)確性。通過經(jīng)驗與局部網(wǎng)格搜索的方式調(diào)整其超參數(shù)并對比其交叉驗證的結(jié)果,最終使用平均絕對誤差MAE作為目標(biāo)函數(shù)進(jìn)行訓(xùn)練,設(shè)置回歸樹棵數(shù)為106,對應(yīng)學(xué)習(xí)率為0.065,其余參數(shù)使用默認(rèn)數(shù)值。其中,可由式(4)計算MAE:
(4)
使用現(xiàn)有采集監(jiān)控數(shù)據(jù),對相對于訓(xùn)練集的未來時間節(jié)點進(jìn)行預(yù)測,并對比預(yù)測值與真實值,可以有效檢驗構(gòu)建模型的擬合程度。如果需要對真實未來的產(chǎn)品收率進(jìn)行預(yù)測,同樣需要對相同時間段內(nèi)的指標(biāo)數(shù)據(jù)進(jìn)行采集。
(5)
2016年9月至2017年11月之間真實汽油收率和處理掉其中的異常值后汽油收率的分布如圖5所示,圖6為圖5(b)的數(shù)值分布。由圖6可以看出,真實汽油收率主要分布在47%左右,基本呈現(xiàn)左右平衡的態(tài)勢,近似正態(tài)分布,且分布相對較為集中,說明汽油收率的整體輸出范圍較小。在這種情況下,即使使用汽油收率的均值來進(jìn)行預(yù)測,其準(zhǔn)確率也能夠達(dá)到98%左右。
圖5 2016年9月至2017年11月之間實際的汽油收率和去掉異常值后的汽油收率Fig.5 Actual gasoline yield and gasoline yield without outliers between September 2016 and November 2017(a)Actual gasoline yield;(b)Gasoline yield without outliers
圖6 對圖5(b)的統(tǒng)計收率分布Fig.6 Statistical yield distribution for Fig.5(b)
針對真實汽油收率的整體輸出特點,通常意義的回歸準(zhǔn)確率,并不能很好地反映預(yù)測模型的擬合效果。結(jié)合原評估方法,考慮去掉收率的均值對變化程度的影響來考察模型對收率變化的預(yù)測能力。筆者選擇同時使用決定系數(shù)R2作為評估標(biāo)準(zhǔn),R2是對模型進(jìn)行回歸后,評價回歸模型系數(shù)的擬合優(yōu)度,其計算方法如式(6)所示。
(6)
R2的取值范圍一般為負(fù)無窮到1,預(yù)測值與真實值的殘差平方和越小,該值越接近1,表明預(yù)測值對真實值的擬合優(yōu)度越大,可解釋程度越高。該標(biāo)準(zhǔn)可以反映模型輸出對真實產(chǎn)率的擬合程度。與Pearson相關(guān)系數(shù)不同的是,相關(guān)系數(shù)一般用來描述變量間的線性關(guān)系,其絕對值越接近1,表明變量間的相關(guān)性越顯著;但R2可以用于描述非線性的相關(guān)關(guān)系。當(dāng)R2小于0的時候,需要借助其他評估方法來評價擬合程度。
利用GBDT算法構(gòu)造的預(yù)測模型對催化裂化的汽油收率進(jìn)行預(yù)測,得到的汽油收率預(yù)測結(jié)果與實際工業(yè)數(shù)據(jù)的對比如圖7所示。由圖7可以看出,模型的預(yù)測值總體趨勢與工業(yè)數(shù)據(jù)吻合較好,少有出現(xiàn)偏差較大的預(yù)測值。
由式(5)和式(6)計算預(yù)測結(jié)果的準(zhǔn)確率和R2系數(shù),并與參考準(zhǔn)確率對比分析。計算得到,預(yù)測模型的準(zhǔn)確率達(dá)到98.9%,明顯高于98%即參考準(zhǔn)確率,驗證了該模型的可行性和有效性;預(yù)測模型的R2系數(shù)為0.236,而該指標(biāo)的參考值為0,表明預(yù)測模型對汽油收率的擬合程度較好,分析得到的特征指標(biāo)可以用來解釋汽油收率的變化程度。同時,根據(jù)以上結(jié)果,由式(4)計算平均絕對誤差(MAE)。
圖7 利用GBDT算法得到的汽油收率預(yù)測結(jié)果與實際工業(yè)數(shù)據(jù)的對比Fig.7 Comparisons between gasoline yield predictions of GBDT and actual gasoline yield
計算可得,基于模型計算得到的汽油產(chǎn)率預(yù)測值和實際值的平均絕對誤差為0.531%。因此,無論是從預(yù)測結(jié)果的準(zhǔn)確性還是擬合度上來看,由GBDT構(gòu)建的預(yù)測模型對汽油產(chǎn)率能夠起到良好的預(yù)測效果。
基于某石化企業(yè)的LIMS及DCS系統(tǒng)中的工業(yè)生產(chǎn)數(shù)據(jù),通過分析監(jiān)控指標(biāo)與實際汽油收率的相關(guān)性,篩選出了相關(guān)性高的分析指標(biāo),進(jìn)一步明確了影響催化裂化裝置汽油收率的因素。在此基礎(chǔ)上,利用梯度提升決策樹GBDT算法構(gòu)建了催化裂化汽油收率的預(yù)測模型,并預(yù)測了相應(yīng)的汽油收率。結(jié)果發(fā)現(xiàn),由GBDT算法構(gòu)建的汽油收率預(yù)測模型預(yù)測結(jié)果的準(zhǔn)確率為98.9%,R2系數(shù)為0.236,平均絕對誤差為0.531%。模型預(yù)測結(jié)果與實際汽油收率相比,誤差率小于1%,表明構(gòu)建的模型能精確預(yù)測催化裂化裝置中汽油等產(chǎn)品收率,對裝置操作工況的優(yōu)化改進(jìn)具有良好的指導(dǎo)意義,有助于在實際生產(chǎn)中進(jìn)一步提升催化裂化裝置的經(jīng)濟(jì)性。