劉 佳,邵 誠(chéng),朱 理
(大連理工大學(xué)先進(jìn)控制技術(shù)研究所,遼寧 大連 116024)
?
基于遷移學(xué)習(xí)工況劃分的裂解爐收率PSO-LS-SVM建模
劉佳,邵誠(chéng),朱理
(大連理工大學(xué)先進(jìn)控制技術(shù)研究所,遼寧 大連 116024)
乙烯裂解爐收率的實(shí)時(shí)預(yù)測(cè)對(duì)于生產(chǎn)的先進(jìn)控制及節(jié)能降耗具有重要意義。實(shí)際生產(chǎn)過(guò)程中,不同工況的收率具有較大差別,采用單一工況、單一模型無(wú)法滿足生產(chǎn)需要??紤]到裂解爐不同運(yùn)行過(guò)程中的相似性,同時(shí)為了減小建模過(guò)程中典型樣本的采集成本,有效利用歷史數(shù)據(jù),輔以遷移學(xué)習(xí)算法實(shí)現(xiàn)工況的高精度劃分。不同工況采用泛化能力強(qiáng)、訓(xùn)練速度高的最小二乘支持向量機(jī)建模,并利用粒子群算法對(duì)LS-SVM的參數(shù)尋優(yōu),進(jìn)一步提高模型精度,從而實(shí)現(xiàn)了多工況、多模型的高精度收率預(yù)測(cè)?;谀骋蚁S現(xiàn)場(chǎng)數(shù)據(jù)的實(shí)驗(yàn)結(jié)果表明,多工況、多模型的預(yù)測(cè)效果更準(zhǔn)確合理,PSO優(yōu)化LS-SVM建立的裂解爐收率模型預(yù)測(cè)精度更高,趨勢(shì)跟蹤性能良好。
預(yù)測(cè);模型;優(yōu)化;工況劃分;收率;遷移學(xué)習(xí);PSO-LS-SVM算法;乙烯裂解爐
DOI:10.11949/j.issn.0438-1157.20151745
乙烯是重要的化工原料,其生產(chǎn)水平是衡量一個(gè)國(guó)家或地區(qū)石油化工發(fā)展的主要標(biāo)志。裂解爐是乙烯生產(chǎn)中的核心設(shè)備,對(duì)裂解爐產(chǎn)率準(zhǔn)確預(yù)測(cè)進(jìn)而實(shí)施先進(jìn)控制、操作優(yōu)化[1]等任務(wù),對(duì)節(jié)能降耗、提高經(jīng)濟(jì)效益有重要意義。目前,乙烯工業(yè)中通常利用工業(yè)色譜儀在線測(cè)量乙烯裂解爐收率,但工業(yè)色譜儀設(shè)備投資大,而且存在運(yùn)行成本高、需要定期維護(hù)、測(cè)量滯后等問(wèn)題,因此亟待新的方法能夠更好地在線實(shí)時(shí)預(yù)測(cè)乙烯裂解爐的收率。
乙烯裂解爐是一個(gè)復(fù)雜的非線性系統(tǒng),變量繁多且相互關(guān)聯(lián),因此很難對(duì)乙烯裂解爐進(jìn)行機(jī)理建模。隨著軟測(cè)量技術(shù)的不斷發(fā)展,以數(shù)據(jù)為基礎(chǔ)的智能預(yù)測(cè)模型正逐漸成為乙烯裂解爐優(yōu)化建模的方法,并在理論和生產(chǎn)實(shí)踐中取得了諸多成果。楊爾輔等[2]以石腦油為原料,針對(duì)SRT-IV型裂解爐建立PCA-RBF神經(jīng)網(wǎng)絡(luò)多輸入輸出軟測(cè)量模型,并加入在線校正部分,理論上實(shí)現(xiàn)了工業(yè)裂解爐收率的在線預(yù)測(cè),但實(shí)際生產(chǎn)中,原料成分復(fù)雜,假設(shè)只有石腦油成分不成立,同時(shí)RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間長(zhǎng),易陷入局部最優(yōu)。針對(duì)軟測(cè)量的泛化能力和精度問(wèn)題,賈曉軍等[3]提出基于Fletcher--Reeves修正的變梯度學(xué)習(xí)算法,優(yōu)化離散過(guò)程神經(jīng)網(wǎng)絡(luò)從而建立乙烯收率模型,優(yōu)化后的效果明顯優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),可解決大量與時(shí)間有關(guān)的生產(chǎn)過(guò)程參數(shù)的軟測(cè)量問(wèn)題。陳如清[4]利用新型差分進(jìn)化粒子群混合優(yōu)化算法建立乙烯產(chǎn)率軟測(cè)量模型,混合算法在整體性能上強(qiáng)于基本的粒子群和差分進(jìn)化算法,精度更高,泛化能力更好。Kamyar等[5]利用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)建立了以石腦油為原料的裂解爐模型,并與傳統(tǒng)的動(dòng)力學(xué)模型作對(duì)比,遺傳算法模型較動(dòng)力學(xué)模型的精度和泛化能力都得到了提高。以上在建立收率模型時(shí)都是基于大量數(shù)據(jù),針對(duì)樣本數(shù)據(jù)較少的問(wèn)題,吳文元等[6]采用支持向量回歸方法建立了裂解產(chǎn)物收率的軟測(cè)量模型,并采用微粒群優(yōu)化算法進(jìn)行支持向量機(jī),從而提高了建模效率和模型精度。周書(shū)恒等[7]不僅考慮少量數(shù)據(jù),還分析了裂解爐運(yùn)行的連續(xù)性和半周期性,利用不同工況歷史數(shù)據(jù)輔助遷移學(xué)習(xí)算法實(shí)現(xiàn)裂解爐產(chǎn)率高精度預(yù)測(cè),但是沒(méi)有對(duì)工況進(jìn)行詳細(xì)劃分,而且遷移學(xué)習(xí)用來(lái)建模,時(shí)間復(fù)雜度也較高。
實(shí)際乙烯生產(chǎn)過(guò)程中,根據(jù)進(jìn)料和裂解深度等不同分為多種設(shè)計(jì)工況,通常情況下,由于采集成本較高等原因新工況的數(shù)據(jù)較少,工況的劃分精度得不到保證。通過(guò)分析不同工況下的內(nèi)在機(jī)理,得出不同工況之間裂解溫度、停留時(shí)間等仍存在一定的相似性[7]。針對(duì)此問(wèn)題,本文提出一種基于遷移學(xué)習(xí)算法工況劃分的PSO-LS-SVM裂解爐收率多模型建模方法,即利用少量新工況數(shù)據(jù),輔以遷移學(xué)習(xí)算法利用不同工況的相似性挖掘歷史數(shù)據(jù)的價(jià)值,完成工況的高精度劃分,再利用PSO算法優(yōu)化的LS-SVM算法對(duì)各個(gè)工況進(jìn)行建模,從而實(shí)現(xiàn)多工況、多模型的裂解爐產(chǎn)率的高精度建模。
傳統(tǒng)機(jī)器學(xué)習(xí)假設(shè)數(shù)據(jù)同分布且訓(xùn)練數(shù)據(jù)充分。然而,在許多情況下,新領(lǐng)域的數(shù)據(jù)非常難得,同分布假設(shè)也并不滿足,盡管訓(xùn)練數(shù)據(jù)已經(jīng)過(guò)期,但仍然可能存在部分相似性,利用遷移學(xué)習(xí)將從一個(gè)環(huán)境中學(xué)到的知識(shí)用來(lái)幫助新環(huán)境中的學(xué)習(xí)任務(wù)[8]。實(shí)例遷移是最基本、最直觀的遷移學(xué)習(xí)方法?;趯?shí)例遷移的經(jīng)典方法有Transductive[9]、TrAdaBoost[10],以及多源的MS-TrAdaBoost[11]。本文采用TrAdaBoost,該算法中AdaBoost[12]被用在目標(biāo)訓(xùn)練數(shù)據(jù)中,用以保證分類模型在源數(shù)據(jù)上的準(zhǔn)確性,Hedge(β)[12]被應(yīng)用在輔助訓(xùn)練數(shù)據(jù)上,用以自動(dòng)調(diào)節(jié)輔助訓(xùn)練數(shù)據(jù)的重要度。
設(shè)Xb為目標(biāo)樣例空間,即需要被分類的樣例空間,Xa為輔助樣例空間,設(shè){0,1} Y=為類空間,本文將問(wèn)題簡(jiǎn)化為二分類問(wèn)題,對(duì)于多分類問(wèn)題,可以從二分類問(wèn)題推廣得之。訓(xùn)練數(shù)據(jù),定義布爾函數(shù):cXY→,將樣本xX∈映射到其真實(shí)的類標(biāo)()cxY∈上去。輔助數(shù)據(jù)集;目標(biāo)數(shù)據(jù)集其中,;訓(xùn)練數(shù)據(jù)集
可定義為
測(cè)試數(shù)據(jù)集定義為
TrAdaBoost算法描述如下。
(3)循環(huán)操作1,,tN=…
① 設(shè)置t
p分布,用于選出訓(xùn)練樣本
② 調(diào)用分類器,根據(jù)訓(xùn)練數(shù)據(jù)T以及T上的權(quán)重分布t
③ 分類器th在測(cè)試數(shù)據(jù)上的分類誤差
其中,tε必須小于1/2,當(dāng)1/2 tε=;④ 設(shè)置β和tβ
tε>時(shí),令1/2⑤ 設(shè)置新的權(quán)值向量
(4)輸出最終分類器
2.1最小二乘支持向量機(jī)
最小二乘支持向量機(jī)是Suykens等[13]提出在標(biāo)準(zhǔn)支持向量機(jī)上的一種改進(jìn),LS-SVM具有更強(qiáng)的泛化能和更高的訓(xùn)練速度,因此該算法越來(lái)越受到軟測(cè)量研究領(lǐng)域的關(guān)注[14-16]。
其中,?(xi)是非線性核空間映射函數(shù),ei為誤差變量,γ>0為正則化參數(shù)或懲罰因子。
式(10)中的非線性映射函數(shù)?(x)將輸入空間變量映射到高維特征空間中,再采用拉格朗日法來(lái)求解此優(yōu)化問(wèn)題,為了將約束優(yōu)化問(wèn)題變成無(wú)約束的二次規(guī)劃問(wèn)題,在此引入拉格朗日乘子iα
求解線性方程組,其中核函數(shù)滿足Mercer準(zhǔn)則。
2.2粒子群算法
粒子群算法(PSO)最早由Kennedy等[18]提出,是在模擬鳥(niǎo)類飛行運(yùn)動(dòng)的基礎(chǔ)上提出的群體智能優(yōu)化算法。粒子群算法的核心原則:隨機(jī)初始一個(gè)種群,每個(gè)粒子代表問(wèn)題的一個(gè)解向量并帶入到適應(yīng)度函數(shù)中,粒子的優(yōu)劣根據(jù)適應(yīng)度函數(shù)值來(lái)評(píng)判,并通過(guò)個(gè)體和全局最優(yōu)學(xué)習(xí)來(lái)不斷更新粒子的位置和速度,從而實(shí)現(xiàn)全局最優(yōu)。
PSO算法隨機(jī)初始化一個(gè)含有n個(gè)粒子的種群,通過(guò)數(shù)次迭代學(xué)習(xí)找到最優(yōu)解。粒子的位置和速度可以分別表示為
Rand()為介于(0,1)之間的隨機(jī)數(shù);bP為個(gè)體最優(yōu)值,bG為全局最優(yōu)值。
2.3PSO優(yōu)化LS-SVM模型參數(shù)
影響LS-SVM模型精度的主要參數(shù)為懲罰因子γ和徑向基核參數(shù)σ,不同的參數(shù)值對(duì)LS-SVM的學(xué)習(xí)能力和泛化能力有很大的影響[19]。本文采用PSO對(duì)這兩個(gè)參數(shù)進(jìn)行尋優(yōu),避免了依靠主觀經(jīng)驗(yàn)選擇的盲目性,并且縮短了尋找時(shí)間,提高了模型的預(yù)測(cè)精度?;诹W尤簝?yōu)化算法優(yōu)化LS-SVM參數(shù)的具體步驟如下。
(1)根據(jù)現(xiàn)場(chǎng)數(shù)據(jù),建立訓(xùn)練集和測(cè)試集。
(2)PSO參數(shù)進(jìn)行初始化,包括種群的數(shù)目、學(xué)習(xí)因子、最大迭代次數(shù)、慣性權(quán)重、粒子的初始位置和速度等。
(3)對(duì)訓(xùn)練樣本進(jìn)行預(yù)測(cè)建模,并將各個(gè)粒子的預(yù)測(cè)誤差作為適應(yīng)度函數(shù)。
(4)找到各個(gè)粒子自身最優(yōu)的位置,并且將其和群體最優(yōu)位置比較,假如更優(yōu),則將其作為群體最優(yōu)位置。
(5)并由式(12)更新粒子的位置和速度。
(6)判斷是否滿足PSO結(jié)束條件,若滿足則找到最優(yōu)的(γ,σ)值;否則,返回步驟(3),開(kāi)始新一輪的搜索。
(7)利用最優(yōu)的參數(shù)組合和訓(xùn)練樣本建立LS-SVM預(yù)測(cè)模型。
3.1基于TrAdaBoost算法的工況劃分
某乙烯廠根據(jù)進(jìn)料中是否含有減一/減頂油、輕烴和加氫C5分為3種工況,不同工況下裂解爐的部分操作條件和產(chǎn)率存在較大差異。若只對(duì)單工況建模,用該模型預(yù)測(cè)其他工況的產(chǎn)率會(huì)產(chǎn)生較大誤差,對(duì)先進(jìn)控制和節(jié)能降耗具有嚴(yán)重影響,因此分工況建模十分必要。
分工況建模的前提是工況劃分,本文選取不同進(jìn)料為劃分依據(jù),某乙烯廠進(jìn)料為石腦油、減一/減頂油、加氫尾油、輕烴、加氫C5,其中無(wú)輕烴進(jìn)料設(shè)為工況1,無(wú)輕烴、無(wú)加氫C5設(shè)為工況2,無(wú)減一/減頂油設(shè)為工況3。實(shí)際生產(chǎn)過(guò)程中,不同進(jìn)料主要體現(xiàn)在進(jìn)料流量等方面,通過(guò)理論和數(shù)據(jù)分析,以進(jìn)料流量、稀釋蒸汽流量、燃料氣流量、汽烴比4個(gè)為劃分變量。乙烯廠的數(shù)據(jù)采集工作量大且成本高,在獲取3個(gè)工況的劃分變量數(shù)據(jù)過(guò)程中,由于生產(chǎn)的連續(xù)性,臨界工況的數(shù)據(jù)被剔除,某乙烯廠以工況1為基礎(chǔ),工況2、3的數(shù)據(jù)相對(duì)較少,通過(guò)PCA篩選后數(shù)據(jù)會(huì)進(jìn)一步減少,在一定的情況下甚至影響工況劃分的精度,因?yàn)槠胀ǚ诸惙椒ǖ木仁且詳?shù)據(jù)充足為保證的。因此,需要最有效地利用采集數(shù)據(jù),最大限度地提高少量數(shù)據(jù)的劃分精度。本文通過(guò)詳細(xì)分析發(fā)現(xiàn)不同工況下,雖然進(jìn)料流量、稀釋蒸汽流量等具有一定的差異,但影響裂解爐收率的反應(yīng)溫度、停留時(shí)間及烴分壓等條件卻有一定的相似性,利用不同工況的相似性輔以TrAdaBoost遷移學(xué)習(xí)算法,實(shí)現(xiàn)少量數(shù)據(jù)的高精度劃分。
本文選取兩個(gè)典型工況即無(wú)輕烴進(jìn)料的工況1(記為{0}Y=)和無(wú)輕烴、無(wú)加氫C5進(jìn)料的工況2(記為{1}Y=)進(jìn)行遷移劃分研究,多種工況的劃分可以推廣得之,實(shí)驗(yàn)數(shù)據(jù)通過(guò)ORACLE數(shù)據(jù)庫(kù)獲取。以乙烯的產(chǎn)量X為輸入,以對(duì)應(yīng)的工況劃分Y為輸出進(jìn)行研究。兩個(gè)工況的數(shù)據(jù)差異分布用散度[20]表示,在特征空間X下,設(shè)兩個(gè)工況的數(shù)據(jù)集分別用P和Q表示,兩個(gè)工況下的散度可表示為
式中,P(x)、Q()x分別為數(shù)據(jù)集P、Q中隨機(jī)變量的概率密度函數(shù)。
式中,maxx和minx分別為觀測(cè)樣本中的最大值和最小值;x′為處理后的值。
模型分類誤差采用均方誤差MSE指標(biāo)來(lái)評(píng)價(jià)模型的性能和預(yù)測(cè)效果。MSE越小,表明模型分類性能越好,評(píng)價(jià)模型計(jì)算公式為
TrAdaBoost遷移學(xué)習(xí)與目標(biāo)數(shù)據(jù)量比例緊密聯(lián)系,選1%~40%的目標(biāo)數(shù)據(jù)用于訓(xùn)練,將無(wú)遷移學(xué)習(xí)與TrAdaBoost算法工況劃分的均方誤差作對(duì)比,效果如圖1所示。
由圖1可知,當(dāng)目標(biāo)數(shù)據(jù)量小于18%時(shí),遷移效果明顯,隨著目標(biāo)數(shù)據(jù)的增加遷移效果減弱;當(dāng)目標(biāo)數(shù)據(jù)的比例小于20%時(shí),遷移學(xué)習(xí)是很有必要的。
圖1 有無(wú)遷移學(xué)習(xí)劃分MSE對(duì)比效果Fig.1 MSE comparison result of transferred and
圖2 未遷移學(xué)習(xí)劃分效果Fig.2 Simulation result of un-transferred learning
圖3 未遷移工況劃分后BP預(yù)測(cè)效果Fig.3 Simulation result of un-transferred learning classification based on BP
圖4 遷移學(xué)習(xí)后劃分效果Fig.4 Simulation result of transferred learning
由式(13)計(jì)算得出輔助數(shù)據(jù)與目標(biāo)數(shù)據(jù)的散度為0.867,散度越大數(shù)據(jù)間距離即差異性越大,為了驗(yàn)證TrAdaBoost算法的有效性,目標(biāo)數(shù)據(jù)比例越小越好;但考慮圖1的遷移效果,經(jīng)過(guò)試驗(yàn)選取目標(biāo)數(shù)據(jù)比例為5%進(jìn)行研究?;贚S-SVM算法無(wú)遷移的工況劃分MSE為0.974,工況劃分效果如圖2所示,利用BP神經(jīng)網(wǎng)絡(luò)對(duì)無(wú)遷移工況劃分的數(shù)據(jù)建模,預(yù)測(cè)結(jié)果如圖3所示。利用TrAdaBoost遷移學(xué)習(xí)算法,遷移次數(shù)50N=,工況劃分的MSE為0.475,工況劃分效果如圖4所示。
BP網(wǎng)絡(luò)對(duì)TrAdaBoost遷移工況劃分?jǐn)?shù)據(jù)建模,預(yù)測(cè)結(jié)果如圖5所示。由圖2和圖3可以看出當(dāng)數(shù)據(jù)量少時(shí),未遷移學(xué)習(xí)的劃分精度低,且劃分后模型預(yù)測(cè)偏差非常大,預(yù)測(cè)結(jié)果無(wú)法跟隨實(shí)際值的變化;由圖4和圖5看出,遷移學(xué)習(xí)后劃分精度有了顯著提高,且實(shí)現(xiàn)了收率的較準(zhǔn)確預(yù)測(cè);由圖2~圖5可以得出結(jié)論:對(duì)于少量數(shù)據(jù),遷移學(xué)習(xí)較普通分類方法精度有顯著提高。
圖5 遷移學(xué)習(xí)劃分工況的BP預(yù)測(cè)效果Fig.5 Simulation result of transferred learning classification based on BP
3.2基于PSO-LS-SVM算法的裂解爐產(chǎn)率預(yù)測(cè)
工況進(jìn)行劃分后需要對(duì)多種工況分別進(jìn)行建模實(shí)現(xiàn)裂解爐產(chǎn)率的準(zhǔn)確預(yù)測(cè),本文針對(duì)某乙烯廠USC型管式裂解爐工況1進(jìn)行研究,其他工況的建??梢来送茝V得之,共采集工況1數(shù)據(jù)150組,結(jié)合工藝機(jī)理分析和生產(chǎn)經(jīng)驗(yàn),選取影響該裂解爐產(chǎn)率的20個(gè)過(guò)程變量以及對(duì)應(yīng)時(shí)間的乙烯產(chǎn)物數(shù)據(jù)進(jìn)行分析,通過(guò)PCA主元分析法對(duì)變量進(jìn)行歸納篩選處理,最后選出原料進(jìn)料流量、出口溫度、稀釋蒸汽流量、燃料氣流量、汽烴比、裂解爐出口壓力,裂解深度6個(gè)過(guò)程變量作為輸入,以乙烯產(chǎn)率為輸出進(jìn)行建模。數(shù)據(jù)通過(guò)上述工況劃分的處理后,以5%的目標(biāo)數(shù)據(jù)為例,利用PSO優(yōu)化的LS-SVM進(jìn)行研究建模。
為了比較PSO-LS-SVM的性能,分別用BP神經(jīng)網(wǎng)絡(luò)、LS-SVM算法進(jìn)行建模,通過(guò)訓(xùn)練得到劃分工況的PSO-LS-SVM的參數(shù)γ=5.6745e +02、徑向基核參數(shù)σ=9.6407+003,BP神經(jīng)網(wǎng)絡(luò)的隱含層數(shù)為25,訓(xùn)練網(wǎng)絡(luò)迭代次數(shù)為100,LS-SVM的懲罰因子10γ=、徑向基核參數(shù)20σ=,以MSE和平均相對(duì)誤差絕對(duì)值MAPE指標(biāo)評(píng)價(jià)預(yù)測(cè)效果,MAPE越小,表明模型分類性能越好,評(píng)價(jià)模型計(jì)算公式為
BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)效果如圖5所示,BP網(wǎng)絡(luò)預(yù)測(cè)結(jié)果與實(shí)際值趨勢(shì)一致,但有一定誤差,MSE達(dá)到2.910, MAPE為8.227×10-3; LS-SVM預(yù)測(cè)和實(shí)際輸出值如圖6所示,與BP預(yù)測(cè)效果圖5對(duì)比可知,針對(duì)小樣本、維數(shù)高、非線性復(fù)雜的問(wèn)題,LS-SVM較BP神經(jīng)網(wǎng)絡(luò)具有更高的預(yù)測(cè)精度,MSE達(dá)到2.315,MAPE為1.437×10-4;PSO-LS-SVM的預(yù)測(cè)效果如圖7所示,經(jīng)PSO優(yōu)化后的LS-SVM對(duì)實(shí)際輸出值跟蹤效果良好,MSE達(dá)到1.864,MAPE為4.765×10-5。劃分工況后選取100組訓(xùn)練數(shù)據(jù),50組測(cè)試數(shù)據(jù),PSO-LS-SVM模型、LS-SVM模型、BP 3個(gè)模型的MSE、MAPE性能測(cè)試表如表1所示,測(cè)試性能用MSE和MAPE衡量,值越小說(shuō)明優(yōu)化性能越佳。通過(guò)對(duì)比圖并與表1結(jié)合分析可知:PSO-LS-SVM算法較LS-SVM算法、BP神經(jīng)網(wǎng)絡(luò)泛化能力,預(yù)測(cè)精度有了明顯的提高,跟隨效果良好。
圖6 劃分工況的LS-SVM預(yù)測(cè)效果Fig.6 Simulation result of classification based on LS-SVM
圖7 劃分工況的PSO-LS-SVM預(yù)測(cè)效果Fig.7 Simulation result of classification based on PSO-LS-SVM
表1 R3種建模方法的誤差比較Table 1 Error contrast of three models
本文通過(guò)分析單一工況、單一模型無(wú)法滿足生產(chǎn)需求的現(xiàn)狀,針對(duì)乙烯產(chǎn)率建模過(guò)程中模型精度低、數(shù)據(jù)不足和采集成本高、工作量大的問(wèn)題,利用少量數(shù)據(jù),根據(jù)進(jìn)料不同劃分生產(chǎn)工況,考慮不同工況間的相似性,輔助遷移學(xué)習(xí)算法對(duì)工況進(jìn)行高精度劃分,利用粒子群算法優(yōu)化最小二乘支持向量機(jī)參數(shù),完成多工況、多模型高精度建模。利用某乙烯廠現(xiàn)場(chǎng)數(shù)據(jù)驗(yàn)證得出,當(dāng)目標(biāo)數(shù)據(jù)小于20%時(shí),輔助遷移學(xué)習(xí)算法能夠明顯提高工況的劃分精度;分工況建模過(guò)程中,利用粒子群算法優(yōu)化最小二乘支持向量機(jī)參數(shù)建立的模型較BP神經(jīng)網(wǎng)絡(luò)、LS-SVM算法等非線性回歸建模方法具有更高的精度和泛化能力,其預(yù)估值能在很大范圍內(nèi)準(zhǔn)確跟蹤實(shí)際值的變化,對(duì)裂解爐產(chǎn)率的先進(jìn)控制、操作優(yōu)化以及節(jié)能降耗等具有十分重要的指導(dǎo)意義。
References
[1]王漢松, 何細(xì)藕. 乙烯工藝技術(shù) [M]. 北京: 中國(guó)石化出版社,2009: 134-140. WANG H S, HE X O. Ethylene and Operation and Technology [M]. Beijing: China Petrochemical Press, 2009: 134-140.
[2]楊爾輔, 周強(qiáng), 胡益鋒, 等. 基于PCA-RBF神經(jīng)網(wǎng)絡(luò)的工業(yè)裂解爐收率在線預(yù)測(cè)軟測(cè)量方法 [J]. 系統(tǒng)仿真學(xué)報(bào), 2001, 31 (z1):194-197. YANG E F, ZHOU Q, HU Y F, et al. A soft-sensing approach to on-line predict the yields of industrial pyrolysis furnace based on PCA-RBF neural networks [J]. Journal of System Simulation, 2001,31 (z1): 194-197.
[3]賈曉軍, 贠衛(wèi)國(guó). 基于離散過(guò)程神經(jīng)元的乙烯生產(chǎn)裝置軟測(cè)量 [J].電腦知識(shí)與技術(shù), 2009, 5 (10): 2701-2703. JIA X J, YUN W G. Soft sensing of ethylene plant based on the discrete process neural [J]. Computer Knowledge and Technology,2009, 5 (10): 2701-2703.
[4]陳如清. 基于差分進(jìn)化粒子群混合優(yōu)化算法的軟測(cè)量 [J]. 化工學(xué)報(bào), 2009, 60 (12): 3052-3057. CHEN R Q. Soft sensor modeling based on differential evolution-particleswarm optimization based hybrid optimization algorithm [J]. C1ESC Journal, 2009, 60 (12): 3052-3057.
[5]KAMYAR K, MEHDI S, JAFAR T. Genetic algorithm model development for prediction of main products in thermal cracking of naphtha: comparison with kinetic modeling [J]. Chemical Engineering Journal, 2012, 209 (2012): 255-262. DOI: 10.1016/j.cej.2012.07.130.
[6]吳文元, 熊智華, 呂寧, 等. 支持向量回歸在乙烯裂解產(chǎn)物收率軟測(cè)量中的應(yīng)用 [J]. 化工學(xué)報(bào), 2010, 61 (8): 2046-2050. WEN W Y, QIONG Z H, Lü N, et al. Soft-sensor of product yields in ethylene pyrolysis based on support vector regression [J]. C1ESC Journal, 2010, 61 (8): 2046-2050.
[7]周書(shū)恒, 杜文莉. 基于遷移學(xué)習(xí)的裂解爐產(chǎn)率建模 [J]. 化工學(xué)報(bào),2014,65 (12):4921-4928. DOI: 10.3969/j.issn.0438-1157.2014.12.037. ZHOU S H, DU W L. Modeling of ethylene cracking furnace yields based on transfer learning [J]. C1ESC Journal, 2014, 65(12):4921-4928. DOI: 10.3969/j.issn.0438-1157.2014.12.037.
[8]DAI W Y, YANG Q, XUE G R, et al. Boosting for transfer learning[C]//Proceedings of the 24th International Conference on Machine Learning. 2007: 193-200.
[9]王雪松, 潘杰, 程玉虎, 等. 基于相似度衡量的決策樹(shù)自適應(yīng)遷移[J]. 自動(dòng)化學(xué)報(bào), 2013:39 (12):2186-2192. DOI: 10.3724/SP.J.1004. 2013.02186. WANG X S, PAN J, CHENG Y H, et al. Self-adaptive transfer for decision trees based on similarity metric [J]. Acta Automatica Sinica,2013:39 (12):2186-2192. DOI: 10.3724/SP.J.1004.2013.02186.
[10]CECI M, APPICE A, BARILE N, et al. Transductive learning from relational data[C]//Proceedings of the 5th International Conference on Machine Learning and Data Mining in Pattern Recognition. Leipzig. Advances in Machine Learning I. Germany: Springer-Verlag, 2007:324-338.
[11]YAO Y, DORETTO G. Boosting for transfer learning with multiple sources [C]//Proceedings of the 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Francisco. USA: IEEE, 2010. 1855-1862.
[12]FREUND Y, SHAPIRE R E. A decision-theoretic generalization of on-line learning and an application to boosting [J]. Journal of Computer and System Sciences, 1997, 55 (1):119-139.
[13]SUYKENS J A K, VANDEWALLE J. Least squares support vector machines classifiers [J]. Neural Networks Letters, 1999, 19 (3):293-300.
[14]鄭小霞, 錢(qián)鋒. 基于證據(jù)框架的最小二乘支持向量機(jī)在精對(duì)苯二甲酸生產(chǎn)中的應(yīng)用 [J]. 化工學(xué)報(bào), 2006, 57 (7): 1612-1616. ZHENG X X, QIAN F. Application of least squares support vector machine within evidence frame work in PTA process [J]. Journal of Chemical Industry and Engineering (China), 2006, 57 (7): 1612-1616.
[15]劉函, 劉丁, 鄭崗, 等. 基于最小二乘支持向量機(jī)的天然氣負(fù)荷預(yù)測(cè) [J]. 化工學(xué)報(bào), 2004, 55 (5): 828-832. LIU H, LIU D, ZHENG G, et al. Natural gas load forecasting based on least squares support vector machine [J]. Journal of Chemical Industry and Engineering (China), 2004, 55 (5): 828-832.
[16]林碧華, 顧幸生. 基于差分進(jìn)化算法-最小二乘支持向量機(jī)的軟測(cè)量建模 [J]. 化工學(xué)報(bào), 2008, 59 (7): 1681-1685. LIN B H, GU X S. Soft sensor modeling based on DE-LSSVM [J]. Journal of Chemical Industry and Engineering (China), 2008, 59 (7):1681-1685.
[17] VAPNIK V. The Nature of Statistical Learning Theory [M]. New York: Springer, 1999: 162-165.
[18]KENNEDY J. EBERHART R C. Particle swam optimization[C]//Proceedings of the IEEE International Conference on Neural Network. Piscataway, NJ. USA: IEEE, 1995: 1942-1948.
[19]陳貴華, 王昕, 王振雷, 等. 基于模糊核聚類的乙烯裂解深度DE-LSSVM多模型建模 [J]. 化工學(xué)報(bào), 2012, 63 (6):1790-1796. DOI: 10.3969/j.issn.0438-1157.2012.09.019. CHEN G H, WANG X. WANG Z L, et al. Multiple DE-LSSVM modeling of ethylene cracking severity [J]. C1ESC Journal, 2012, 63(6): 1790-1796. DOI: 10.3969/j.issn.0438-1157.2012.09.019.
[20]PAN S J, KWOK J T, YANG Q, et al. Adaptive localization in a dynamic WiFi environment through multi-view learning[C]//Proceedings of the 22nd AAAI Conference on Artificial Intelligence. 2007:1108-1113.
Modeling of cracking furnace yields with PSO-LS-SVM based on operating condition classification by transfer learning
LIU Jia, SHAO Cheng, ZHU Li
(Institute of Advanced Control Technology, Dalian University of Technology, Dalian 116024, Liaoning, China)
The prediction of ethylene cracking furnace yields on line is significant in industrial production for advanced control and energy efficiency. Due to the great differences between different operating conditions, single condition and modeling may not satisfy the requirement of practical process. Considering the similarity of cracking furnace and the reduction of acquisition cost, the history data are utilized assisting transfer learning to improve the accuracy of operating condition classification. Least squares support vector machines (LS-SVM) is employed in modeling cracking furnace yields in different operating conditions, which enjoy stronger generalization ability and faster convergence speed compared with standard SVM. The accuracy is further improved by optimizing parameters of LS-SVM with particle swarm optimization (PSO), and thus establishing different operating condition models for yields prediction. The simulations and operating condition classifications are given based on the real industrial data to demonstrate that the operating condition classification is more reasonable. The prediction of LS-SVM optimized with PSO is more accuracy and behaves good trend tracking performance.
prediction; modeling; optimization; operating condition classification; yields; transfer learning; PSO-LS-SVM algorithm; ethylene cracking furnace
date: 2015-11-20.
ZHU Li, zhuli@dlut.edu.cn
supported by the National High Technology Research and Development Program of China (2014AA041802-2).
TP 273
A
0438—1157(2016)05—1982—07
2015-11-20收到初稿,2016-01-30收到修改稿。
聯(lián)系人:朱理。第一作者:劉佳(1990—),女,碩士研究生。
國(guó)家高技術(shù)研究發(fā)展計(jì)劃項(xiàng)目(2014AA041802-2)。