楊杰
(青島科技大學(xué) 數(shù)理學(xué)院,山東 青島 266100)
C4烯烴是重要的化工原料,常被用來合成橡膠原料、制作潤滑油添加劑、生產(chǎn)有機物等[1]。以乙醇為原料制備C4烯烴具有清潔低耗的特點,然而溫度和催化劑組合往往會對C4烯烴的選擇性和收率產(chǎn)生影響。確定乙醇偶合制備C4烯烴的最佳工藝條件,使得烯烴收率最大化,有利于我國化工產(chǎn)業(yè)與石油工業(yè)進一步發(fā)展。
近年來,乙醇偶合制備烯烴工藝的參數(shù)優(yōu)化領(lǐng)域涌現(xiàn)大量研究成果。李艷春[2]采用傳統(tǒng)控制變量優(yōu)化法及對照實驗矩陣,通過交叉對比得到使C4烯烴收率盡可能高的工藝條件;任濤等人[3]基于方差分析與隨機森林算法篩選影響因子,并通過L-M算法與粒子群算法得到烯烴收率最優(yōu)值;張中城等人[4]采用控制變量及逐步回歸分析,建立規(guī)劃模型求得最優(yōu)解,并對目標(biāo)函數(shù)進行擬合效果評估,驗證結(jié)果合理性;Wang等人[5]利用Logistic模型分析了溫度與乙醇轉(zhuǎn)化率和烯烴選擇性的關(guān)系,然后通過構(gòu)建神經(jīng)網(wǎng)絡(luò)逼近催化劑組合與溫度對C4烯烴收率的非線性關(guān)系,訓(xùn)練模型預(yù)測烯烴產(chǎn)率的最大值。
由已有成果可知,常用的優(yōu)化方式主要為多元回歸后建立單目標(biāo)優(yōu)化模型或采用各啟發(fā)式算法,實際中,兩類方法都存在許多難點。優(yōu)化效率很大程度取決于輸入反應(yīng)物劑量與表型關(guān)系的模型建立是否準(zhǔn)確,目前對于現(xiàn)有的多種模型選擇和建立方法在不同應(yīng)用條件下系統(tǒng)性的優(yōu)劣研究比較不足。基于催化劑組合作用曲面往往為非線性且非多項式的曲面,如建立的回歸模型精度不高,則難以準(zhǔn)確擬合,不利于進一步參數(shù)優(yōu)化。啟發(fā)式算法有時無法有效處理約束條件,表現(xiàn)不穩(wěn)定易陷入局部最優(yōu)解,導(dǎo)致搜索精度降低。同時,在大多數(shù)化工系統(tǒng)中,設(shè)計尋求條件最優(yōu)解實驗時往往忽略了系統(tǒng)過程的目標(biāo)最大化,使得所建立的模型與實際系統(tǒng)有偏差。
本文的研究方法主要為將回歸預(yù)測數(shù)學(xué)模型與搜索算法相結(jié)合,可在一定程度上互相彌補缺點,提高優(yōu)化效率。具體工作可表示為基于反應(yīng)過程性能數(shù)據(jù),利用多元回歸與BP神經(jīng)網(wǎng)絡(luò)模型擬合一定數(shù)量的輸入輸出變量,分別建立預(yù)測模型,近似地反映工藝參數(shù)與烯烴收率之間的關(guān)系,分析對比模型預(yù)測誤差,基于精度更高的模型進行下一步優(yōu)化。考慮乙醇轉(zhuǎn)化率與烯烴收率同時最大為目標(biāo)函數(shù)建立雙目標(biāo)優(yōu)化模型,采用NSGA-II求解多目標(biāo)優(yōu)化模型的Pareto最優(yōu)集,并結(jié)合BP網(wǎng)絡(luò)模型進一步預(yù)測最優(yōu)集工藝參數(shù)對應(yīng)的烯烴收率,確定最優(yōu)方案。
本文應(yīng)用的數(shù)據(jù)集為某化工實驗室針對不同催化劑在不同溫度下做的一系列乙醇偶合制備C4烯烴實驗的化學(xué)反應(yīng)性能(包括催化劑組合、溫度、乙醇轉(zhuǎn)化率、C4烯烴及其他附加生成物選擇性)數(shù)據(jù),根據(jù)催化劑組合的不同可分為13組,每一組又包含在若干不同溫度下的多組實驗數(shù)據(jù),總計69組,部分樣本信息如表1所示。
表1 反應(yīng)性能數(shù)據(jù)樣本信息
已知烯烴收率計算公式為乙醇轉(zhuǎn)化率與C4烯烴選擇性的乘積,則可計算出任一組反應(yīng)數(shù)據(jù)對應(yīng)的烯烴收率值。催化劑組合包含Co負載量、Co/SiO2和HAP裝料比及乙醇濃度,由于本文主要目的為探究乙醇偶合制備C4烯烴的最優(yōu)催化劑組合與溫度條件,裝料比以比值形式存在不利于數(shù)據(jù)處理,則為了利于后續(xù)分析計算,將催化劑組合拆開,得到Co/SiO2的質(zhì)量、HAP質(zhì)量、Co負載量與乙醇單位時間進量四個指標(biāo),與溫度一起共同作為影響烯烴收率的5個自變量。
多元回歸分析是一種用來研究隨機變量間相關(guān)性的統(tǒng)計學(xué)方法。在對變量的實際觀測進行分析和計算的過程中,對模型的參數(shù)進行確定,構(gòu)建出一個變量與另一組變量之間的量化關(guān)系,即所謂的回歸方程。在經(jīng)過了統(tǒng)計測試被認定為具有明顯的回歸效果之后,可被用來對因變量的變化趨勢進行預(yù)測和控制,所構(gòu)建的數(shù)學(xué)模型就是所謂的回歸模型[6]。
基于數(shù)據(jù)預(yù)處理后的數(shù)據(jù),建立反應(yīng)條件與烯烴收率的多元回歸模型。設(shè)定Co/SiO2的質(zhì)量、HAP質(zhì)量、Co負載量與乙醇單位時間進量,溫度分別為x1、x2、x3、x4、x5,C4烯烴收率y作為因變量,選取數(shù)據(jù)集中前12組不同催化劑組合下共59條數(shù)據(jù)作為訓(xùn)練集,其余數(shù)據(jù)作為試驗集,以備后續(xù)回歸預(yù)測檢驗。表2給出了相關(guān)數(shù)據(jù)集所做回歸方程的回歸參數(shù),其回歸方程如下:
表2 回歸方程模型參數(shù)
(1)
由表2可知,決策系數(shù)R2為0.92,調(diào)整后為0.897>0.7,可認為催化劑組合溫度條件與烯烴收率擬合效果較好,各助劑條件與溫度可解釋烯烴收率變化情況的92%,自變量與因變量間相關(guān)性程度高,模型可信。德賓-沃森檢驗值接近于2,可認為回歸模型各解釋變量數(shù)據(jù)相互獨立,不存在自相關(guān)性,可以進行線性回歸分析。此外,表3進一步給出上述回歸方程的方差分析及顯著性檢驗結(jié)果。
表3 回歸方程模型方差分析
由表3可知,F=54.781>F0.05=2.61,P=0.000<0.05,則回歸方程模型有統(tǒng)計學(xué)意義,且在0.05水平上,該模型有顯著意義,故可認為該多元非線性回歸方程有效,可用來模擬催化劑組合條件與溫度對烯烴收率的影響關(guān)系。
BP(Back Propagation,即反向傳播)網(wǎng)絡(luò)主要分正向傳播與反向計算誤差兩個過程。正向傳播中根據(jù)權(quán)重wi和閾值bj對輸入值加權(quán)求和計算,最終經(jīng)Sigmoid函數(shù)映射到(0,1)區(qū)間得到輸出值。逆誤差計算則是通過計算輸出值與目標(biāo)值之間的平方損失函數(shù),對各層神經(jīng)元連接權(quán)進行鏈?zhǔn)角髮?dǎo),更新權(quán)值并不斷迭代傳播過程,直至損失函數(shù)計算所得誤差最小,學(xué)習(xí)訓(xùn)練次數(shù)使用完畢。
2.2.1 參數(shù)設(shè)置
本文主要采用三層BP神經(jīng)網(wǎng)絡(luò)構(gòu)建模型,輸入層為催化劑組合與溫度,隱藏層為多個神經(jīng)元,輸出層為烯烴的產(chǎn)率,最終預(yù)測結(jié)果為輸入不同的催化劑組合和溫度條件,輸出網(wǎng)絡(luò)模型下與目標(biāo)值間誤差最小的烯烴收率預(yù)測值。將提出的BP神經(jīng)網(wǎng)絡(luò)模型的參數(shù)初始化如下:確定輸入層節(jié)點為5,隱含層網(wǎng)絡(luò)層數(shù)為1,隱含節(jié)點數(shù)為5,輸出層節(jié)點為1,學(xué)習(xí)率為0.01,誤差閾值為0.000 001,迭代次數(shù)為1 000次。
2.2.2 迭代計算
首先對13組不同催化劑組合實驗數(shù)據(jù)集進行劃分,總計69組實驗數(shù)據(jù)中,采用48條數(shù)據(jù)用于訓(xùn)練樣本,11條數(shù)據(jù)用于驗證,10條數(shù)據(jù)用于測試。利用Matlab神經(jīng)網(wǎng)絡(luò)工具箱編程進行數(shù)據(jù)訓(xùn)練與測試,烯烴預(yù)測結(jié)果如圖1、2所示,圖3進一步展示了BP網(wǎng)絡(luò)對三個數(shù)據(jù)集非線性回歸擬合的效果。
圖1 訓(xùn)練集預(yù)測結(jié)果對比
圖2 測試集預(yù)測結(jié)果對比
圖3 訓(xùn)練、驗證和測試的結(jié)果圖
由圖1、2可知,訓(xùn)練集預(yù)測結(jié)果中兩條折線高度重合且均方根誤差為298.377 6,可認為BP神經(jīng)網(wǎng)絡(luò)對前59組實驗數(shù)據(jù)回歸預(yù)測效果較好。在測試集預(yù)測結(jié)果對比圖中,可觀察到測試集中除4號和5號樣本外,其余樣本預(yù)測值皆與真實值差距較小,可認為BP網(wǎng)絡(luò)對測試集數(shù)據(jù)對應(yīng)的工藝參數(shù)具有精度較高的烯烴收率預(yù)測結(jié)果。
由圖3可知,實線與虛線接近重合,樣本數(shù)據(jù)經(jīng)BP網(wǎng)絡(luò)訓(xùn)練后的輸出值與目標(biāo)值擬合情況較好,且R值都在0.9以上表明神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)集訓(xùn)練充分,網(wǎng)絡(luò)具有良好的性能。
經(jīng)多元回歸與BP網(wǎng)絡(luò)模型對實驗數(shù)據(jù)集回歸預(yù)測,分別得到測試集的10組數(shù)據(jù)集在兩類模型下的烯烴收率預(yù)測值,其與真實值的對比結(jié)果如表4所示。同時,本文選取3個評價指標(biāo)進一步分析比較兩類模型對測試集的預(yù)測精度(表5所示),這三個指標(biāo)包括平均絕對誤差(MAE)、平均偏差誤差(MBE)和均方根誤差(RMSE),其計算公式如下:
表4 模型預(yù)測結(jié)果對比
表5 測試集預(yù)測結(jié)果誤差對比
(2)
(3)
(4)
MAE與RMSE的范圍為[0,+∞),當(dāng)預(yù)測值與真實值完全吻合時等于0,即完美模型;誤差越大,兩個值越大,值越小,說明預(yù)測模型擁有更好的精確度。MBE可確定模型存在正偏差還是負偏差。
從表4和表5可以看出,通過對比兩種預(yù)測模型的烯烴收率預(yù)測結(jié)果以及各指標(biāo)數(shù)值,可知經(jīng)BP網(wǎng)絡(luò)模型得到的烯烴收率預(yù)測值的誤差整體上要明顯小于多元非線性回歸模型,表明BP神經(jīng)網(wǎng)絡(luò)在當(dāng)前數(shù)據(jù)的情況下,對烯烴收率的預(yù)測值有較高的精準(zhǔn)度。BP神經(jīng)網(wǎng)絡(luò)更適用于處理復(fù)雜的非線性系統(tǒng),受樣本分布影響較小。通過逆誤差傳播算法不斷調(diào)整內(nèi)部權(quán)重,提高網(wǎng)絡(luò)優(yōu)化效果[7]。相比多元回歸模型,BP神經(jīng)網(wǎng)絡(luò)在預(yù)測烯烴收率方面精度更高,應(yīng)用范圍更廣。
NSGA-II(Non-dominated Sorting Genetic Algorithm-II,即非支配排序遺傳算法)是在NSGA基礎(chǔ)上改進的一種基于支配的多目標(biāo)優(yōu)化算法,這是一種基于Pareto最優(yōu)概念的遺傳算法。其擁有一系列智能優(yōu)化算法的優(yōu)勢,魯棒性高,計算高效,被廣泛用來解決多目標(biāo)優(yōu)化問題,具有極強的適用性。利用非支配排序技術(shù),其能確保搜索所得解更接近真實Pareto前沿,同時引入擁擠度距離,使得非支配解的多樣性顯著提高。精英化策略給出最優(yōu)當(dāng)前解的前提下保留了最優(yōu)父代解,提高了算法收斂性[8-9]。
多目標(biāo)優(yōu)化問題通常由決策變量、約束條件及目標(biāo)函數(shù)組成。在該類問題中,滿足各目標(biāo)的最優(yōu)解一般不同,即在實際問題中各目標(biāo)互相制約,不存在單個最優(yōu)解[10]。因此,采用NSGA-II算法求解多目標(biāo)優(yōu)化問題有利于得到各目標(biāo)函數(shù)與期望值偏離最小的Pareto最優(yōu)解?;谏衔亩嘣貧w與BP神經(jīng)網(wǎng)絡(luò)模型對烯烴收率回歸預(yù)測誤差的分析比較結(jié)果,選用BP神經(jīng)網(wǎng)絡(luò)模型作為求解多目標(biāo)優(yōu)化模型最優(yōu)集工藝參數(shù)對應(yīng)烯烴收率的預(yù)測模型,有助于提高預(yù)測精度并確定誤差最小的最優(yōu)方案。
在乙醇催化偶合制備C4烯烴實驗過程中,首要目標(biāo)是使烯烴收率達到最大。同時考慮化學(xué)反應(yīng)過程的具體情況,生成物中除C4烯烴外還存在大量副產(chǎn)物,如乙烯、乙醛、脂肪醇等其他有機物,此類雜質(zhì)的存在將大大影響目標(biāo)產(chǎn)物的選擇性與收率。在化學(xué)反應(yīng)過程中,隨著時間的推移化學(xué)反應(yīng)將逐漸達到化學(xué)平衡,即反應(yīng)物消耗速率等于生成物生成速率,當(dāng)生成物濃度增加到一定值時化學(xué)反應(yīng)會逆向移動,導(dǎo)致反應(yīng)物消耗減少、化學(xué)產(chǎn)物降低。因此,在建立模型求解優(yōu)化目標(biāo)時,應(yīng)同時重視化學(xué)反應(yīng)實際系統(tǒng)的動態(tài)過程與模型預(yù)測系統(tǒng)輸出的能力,從實際生產(chǎn)的角度出發(fā),使得底物轉(zhuǎn)化率與目標(biāo)產(chǎn)物同時最大化。結(jié)合乙醇偶合制備烯烴化學(xué)反應(yīng)過程與相關(guān)數(shù)據(jù),本文建立以下多目標(biāo)優(yōu)化模型:
1)決策變量:依據(jù)反應(yīng)條件信息,將Co/SiO2的質(zhì)量、HAP質(zhì)量、Co負載量與乙醇單位時間進量、溫度作為五個決策變量,分別為x1、x2、x3、x4、x5。
2)約束條件:依據(jù)反應(yīng)過程相關(guān)數(shù)據(jù),可知各決策變量邊界范圍如下:
(5)
3)目標(biāo)函數(shù):分別設(shè)乙醇轉(zhuǎn)化率為γ、烯烴收率為δ,乙醇轉(zhuǎn)化率定義為乙醇在偶合制備C4烯烴實驗過程中的消耗質(zhì)量比率,與催化劑組合與溫度條件存在緊密聯(lián)系;烯烴收率定義為乙醇轉(zhuǎn)化率與C4烯烴選擇性的乘積,乙醇轉(zhuǎn)化率與C4烯烴選擇性皆隨反應(yīng)條件的變化而波動,則烯烴收率也直接受其影響。考慮到應(yīng)保證化學(xué)反應(yīng)過程中底物轉(zhuǎn)化率及目標(biāo)產(chǎn)物收率盡量高,據(jù)此給出下列雙目標(biāo)函數(shù):
(6)
采用NSGA-II求解上述多目標(biāo)優(yōu)化模型可由如下具體步驟實現(xiàn)[11-13]:
1)染色體編碼:實際問題中五個決策變量的一組排列組合信息皆位于一條染色體上,分別占據(jù)一個基因位,采用二進制編碼進行數(shù)據(jù)處理。
2)初始化種群與適應(yīng)度計算:隨機生成初始種群,并將目標(biāo)函數(shù)乙醇轉(zhuǎn)化率與烯烴收率最大取相反數(shù)轉(zhuǎn)換成求最小值,作為適應(yīng)度函數(shù),對新生成的種群與父代一同進行快速非支配排序,多次迭代得Pareto前沿。
3)精英策略選擇:通過非支配排序與擁擠度計算,選擇個體生成新代種群,進行交叉變異。
4)迭代終止:達到設(shè)定最大迭代次數(shù)時算法終止,輸出結(jié)果。
在進行計算時,算法相關(guān)參數(shù)設(shè)置為:初始種群大小N=69,交叉概率Pc=0.7,變異概率Pm=0.3,最大迭代次數(shù)M=100。采用Matlab 2016b編程實現(xiàn)NSGA-II,在軟件中運行算法程序可得圖4示二維Pareto前沿。
圖4 Pareto前沿解集
由圖4可知,該算法具有良好的收斂性,可以得到分布均勻的Pareto最優(yōu)解集。本文多目標(biāo)優(yōu)化模型為兩個目標(biāo)函數(shù),則其Pareto前沿呈一條線,可看出乙醇轉(zhuǎn)化率與烯烴收率存在相互制約關(guān)系,一方數(shù)值增長必然存在另一方數(shù)值下降。分別從Pareto前沿解集中隨機選取5個最優(yōu)解,其對應(yīng)的催化劑組合、溫度條件與對應(yīng)的乙醇轉(zhuǎn)化率和烯烴收率結(jié)果見表6。
表6 NSGA-II最優(yōu)結(jié)果
對于NSGA-II算法求得的Pareto最優(yōu)解集,還需要進一步驗證結(jié)果的可靠性。圖5展示了五組數(shù)據(jù)集的BP網(wǎng)絡(luò)預(yù)測迭代情況。基于BP網(wǎng)絡(luò)模型強大的非線性映射能力,將上文求得的Pareto最優(yōu)集組合作為輸入?yún)?shù)代入BP網(wǎng)絡(luò)模型進行烯烴收率預(yù)測,最終預(yù)測精度最高的解集將作為最佳催化劑溫度組合。同時,將所得到的結(jié)果進一步與經(jīng)典遺傳算法優(yōu)化 BP網(wǎng)絡(luò)(GABP)方法得到的預(yù)測結(jié)果進行比較分析,來驗證NSGA-II算法的精確度與卓越性。將選出的五組Pareto最優(yōu)集數(shù)據(jù)中五個決策變量首先進行歸一化處理,并利用BP網(wǎng)絡(luò)模型迭代訓(xùn)練,得到預(yù)測及誤差結(jié)果如表7所示。
圖5 Pareto最優(yōu)集BP網(wǎng)絡(luò)預(yù)測迭代過程
表7 Pareto最優(yōu)集BP網(wǎng)絡(luò)預(yù)測結(jié)果
由圖5可知,BP網(wǎng)絡(luò)模型迭代10次,誤差曲線呈階梯形變化,整個迭代過程是穩(wěn)健的,計算過程逐步逼近最優(yōu)解??傉`差為0.000 01,有效性檢查為6,學(xué)習(xí)效果良好,表明對五組Pareto最優(yōu)解數(shù)據(jù)所預(yù)測的結(jié)果為全局最優(yōu)解,可作為有效結(jié)果進行誤差分析從而篩選最優(yōu)解。
由表7可知,第二組工藝參數(shù)經(jīng)BP網(wǎng)絡(luò)映射后輸出的烯烴收率預(yù)測值與目標(biāo)值誤差最小,精度最高。因此,該組解集對應(yīng)的催化劑與溫度條件可作為乙醇偶合制備烯烴的最佳方案。結(jié)果表明,當(dāng)Co/SiO2質(zhì)量為33 mg,HAP質(zhì)量為168.28 mg,Co負載量為0.5%,乙醇進量為0.3 mL/min,溫度為400 ℃,乙醇轉(zhuǎn)化率與烯烴收率可達最大,分別為64.67%,35.921%。
為進一步比較NSGA-II和經(jīng)典遺傳算法分別優(yōu)化BP網(wǎng)絡(luò)模型獲得的烯烴收率預(yù)測誤差,將五組Pareto最優(yōu)集數(shù)據(jù)分別運用BP與GABP算法進行烯烴收率的回歸預(yù)測,兩類方法預(yù)測對比結(jié)果如圖6所示。表8進一步展示了最優(yōu)方案工藝參數(shù)在兩類算法下對應(yīng)的烯烴收率誤差情況。由對比結(jié)果可知,NSGA-II結(jié)合BP算法的輸出值與目標(biāo)值間均方根誤差小于GABP,對烯烴收率的預(yù)測值更符合實際,可認為本文所運用的算法具有良好的適用性與精確度。
圖6 Pareto最優(yōu)集預(yù)測結(jié)果對比
表8 兩種預(yù)測方法結(jié)果對比
基于乙醇偶合制備C4烯烴實驗性能數(shù)據(jù),建立了回歸預(yù)測與多目標(biāo)優(yōu)化模型,得到實現(xiàn)乙醇轉(zhuǎn)化率與烯烴收率最大的工藝條件,可實現(xiàn)較高的生產(chǎn)收率。采用NSGA-II算法與BP網(wǎng)絡(luò)模型相結(jié)合的方法,有助于提高反應(yīng)變量間映射關(guān)系及預(yù)測的準(zhǔn)確性,確保在全局中搜索最優(yōu)解。后續(xù)將對該模型算法進一步完備參數(shù)設(shè)定處理與仿真驗證,提高實際應(yīng)用效果。