李 慧 , ?;i, 董 博, 秦 偉
(1.長(zhǎng)春工業(yè)大學(xué) 電氣與電子工程學(xué)院, 吉林 長(zhǎng)春 130012;2.長(zhǎng)春工業(yè)大學(xué) 汽車工程研究院, 吉林 長(zhǎng)春 130012;3.吉林大學(xué) 通信工程學(xué)院, 吉林 長(zhǎng)春 130012)
隨著人們對(duì)天然物質(zhì)的青睞以及全球回歸自然潮流的興起,特別是中藥現(xiàn)代化、國(guó)際化進(jìn)程的迫近,分子蒸餾技術(shù)在高沸點(diǎn)、熱敏性天然物質(zhì)的分離方面得到了迅速發(fā)展[1]。但是分子蒸餾過程強(qiáng)耦合、非線性和大滯后的特點(diǎn)很難對(duì)其進(jìn)行優(yōu)化控制,1978年Brosillow.C B提出可以通過過程中容易直接測(cè)量的變量(控制變量)建立軟測(cè)量數(shù)學(xué)模型推導(dǎo)出所需的主導(dǎo)變量(狀態(tài)變量)[2],并在化工過程中得到了廣泛應(yīng)用。刮膜式分子蒸餾作為一種應(yīng)用最廣的分子蒸餾方式,利用高速轉(zhuǎn)動(dòng)的刮板在蒸發(fā)面上形成并更新既均勻又薄的液膜,加強(qiáng)了蒸發(fā)效果,但也使蒸發(fā)過程變得更加復(fù)雜,雖然Cvengro?等[3-4]利用Navier-Stokes方程、Boltzmann方程和熱量衡算關(guān)系式對(duì)氣相中的重力下的液膜流動(dòng)的傳熱傳質(zhì)過程進(jìn)行了建模,Mckenna等[5]也通過將流體的物性參數(shù)以及設(shè)備的結(jié)構(gòu)參數(shù)聯(lián)系起來建立了液膜非穩(wěn)態(tài)的數(shù)學(xué)模型,但是蒸發(fā)過程機(jī)理的復(fù)雜性以及隨著工況以及環(huán)境的改變發(fā)生變化,預(yù)測(cè)性能也大大降低,普適性較差,軟測(cè)量神經(jīng)網(wǎng)絡(luò)模型非線性擬合能力強(qiáng),且不需要對(duì)象的先驗(yàn)知識(shí),對(duì)處理復(fù)雜過程的建模問題具有獨(dú)到的優(yōu)勢(shì)[2],但是存在預(yù)測(cè)精度差、收斂速度慢、穩(wěn)定性差等問題,基于此,Huang提出了序貫極限學(xué)習(xí)機(jī)[6-7](Onlin Sequential Extreme Learning Machine, OS-ELM),其具有以下特點(diǎn):用于實(shí)現(xiàn)學(xué)習(xí)算法的訓(xùn)練數(shù)據(jù)是順序的,可以是一個(gè)基于時(shí)間的數(shù)據(jù),也可以是固定長(zhǎng)度的批量數(shù)據(jù),還可以是變化長(zhǎng)度的批量數(shù)據(jù),任何時(shí)刻只對(duì)新來的數(shù)據(jù)進(jìn)行學(xué)習(xí),一旦對(duì)新的數(shù)據(jù)學(xué)習(xí)結(jié)束,就丟棄掉這些數(shù)據(jù),不需要先驗(yàn)知識(shí)來確定這種算法需要多少訓(xùn)練樣本。大大提高了軟測(cè)量模型的可靠性和預(yù)測(cè)精度。
文中通過建立基于數(shù)據(jù)的OS-ELM軟測(cè)量模型,并采用ADHDP對(duì)各影響蒸發(fā)效率的控制變量進(jìn)行學(xué)習(xí)尋優(yōu),得到了最優(yōu)的狀態(tài)變量,實(shí)現(xiàn)了對(duì)刮膜式分子蒸餾系統(tǒng)的優(yōu)化控制。
刮膜式分子蒸餾器的旋轉(zhuǎn)軸和安裝在旋轉(zhuǎn)軸上的輥筒共同組成刮膜器,物料沿壁面從頂部進(jìn)入,蒸發(fā)液膜在刮板的旋轉(zhuǎn)作用下不斷更新,當(dāng)旋轉(zhuǎn)軸轉(zhuǎn)動(dòng)時(shí),輥筒在離心力的作用下緊貼在蒸發(fā)器表面,物料在輥筒與蒸發(fā)面共同的作用下在蒸發(fā)器表面形成一層液膜。頭波與之前形成的液膜不斷地進(jìn)行混合更新,這種不斷混合更新有利于液膜內(nèi)濃度分布均勻,增加了傳熱和傳質(zhì)效果[8-9]。刮膜式分子蒸餾器的結(jié)構(gòu)如圖1所示。
圖1 刮膜式分子蒸餾器的內(nèi)部結(jié)構(gòu)
在蒸發(fā)工藝工程中,提純物純度是一個(gè)很重要的指標(biāo),在刮膜蒸發(fā)過程穩(wěn)定的情況下,與狀態(tài)變量純度存在強(qiáng)耦合關(guān)系,并可以直接獲得的控制變量主要有以下幾個(gè)[8-12]:
1)進(jìn)料速度。進(jìn)料速度直接影響著液膜的更新及其薄厚,以及在蒸發(fā)面上停留的時(shí)間,合適的進(jìn)料速率能使蒸發(fā)面積得到充分利用,有效提高蒸發(fā)速率。
2)刮膜電機(jī)轉(zhuǎn)速。刮膜電機(jī)的轉(zhuǎn)速?zèng)Q定了液膜更新速度的快慢以及液體的平均停留時(shí)間,進(jìn)而影響到狀態(tài)量純度。
3)真空度。合理增大系統(tǒng)的真空度能夠減少分子間的碰撞,降低輕分子因碰撞而發(fā)生的氧化可能性,保證了被提純物的原有屬性。
4)蒸發(fā)溫度。如果蒸發(fā)溫度過高,液膜就容易發(fā)生氧化、聚合等現(xiàn)象,而溫度低的情況下會(huì)降低分子活躍度,影響蒸發(fā)速率與分離效率,還會(huì)影響產(chǎn)品的純度。
OS-ELM原理:
一個(gè)標(biāo)準(zhǔn)的具有N個(gè)任意不同樣本(xj,tj)的單隱層前饋網(wǎng)絡(luò),其中xj=[xj1,xj2,…,xjn]T∈Rn,tj=[tj1,tj2,…,tjm]T∈Rm,激活函數(shù)為g(·),假設(shè)具有L個(gè)隱層神經(jīng)元,可記為:
(1)
βi——隱層第i個(gè)神經(jīng)元和輸出層神經(jīng)元之間的輸出權(quán)值;
bi——隱層第i個(gè)神經(jīng)元的閾值;
wi·xj——wi和xj的內(nèi)積。
單隱層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的目標(biāo)是使輸出的誤差最小,可以表示為:
(2)
即存在wi、xj和bi使得:
(3)
i=1,2,…,L
這等價(jià)于最小化損失函數(shù)
(4)
H-1=(HTH-1)HT
(5)
(6)
(7)
(8)
(9)
所以
其中
(11)
由此可知:
(12)
由此可以得到遞推公式
(13)
(14)
(15)
由上面的推導(dǎo)可知,OS-ELM在建立軟測(cè)量模型時(shí),輸入的數(shù)據(jù)數(shù)量可以變化,在隨著工況不斷變化的同時(shí),新的輸入數(shù)據(jù)也會(huì)及時(shí)修正模型,并且在舍棄了舊的輸入數(shù)據(jù)的情況下,提高了運(yùn)行速度,軟測(cè)量模型的準(zhǔn)確性和可靠性得到顯著提高[13]。
設(shè)刮膜蒸發(fā)過程的離散時(shí)間非線性動(dòng)態(tài)系統(tǒng)
x(k+1)=f[x(k),u(k),k]
k=0,1,…
(16)
式中:x∈Rn——系統(tǒng)的狀態(tài)向量;
x∈Rm——控制動(dòng)作;
f——系統(tǒng)函數(shù)。
系統(tǒng)性能指標(biāo)函數(shù)為:
(17)
式中:U——效用函數(shù);
γ——折扣因子,0<γ≤1;
J——依賴于初始時(shí)間k和初始狀態(tài)x(k)的性能指標(biāo)函數(shù)。
ADHDP的目標(biāo)是選出最優(yōu)的控制序列u(i),i=k,k+1,…,使得式(17)定義的函數(shù)最小化。
ADHDP控制器結(jié)構(gòu)包含3個(gè)典型網(wǎng)絡(luò)。模型網(wǎng)絡(luò)(Model Network)用來估計(jì)下一時(shí)刻的系統(tǒng)狀態(tài);評(píng)價(jià)網(wǎng)絡(luò)(Critic Network)用來近似最優(yōu)性能指標(biāo)函數(shù);執(zhí)行網(wǎng)絡(luò)(Action Network)為狀態(tài)變量到控制變量之間的映射[14]。ADHDP學(xué)習(xí)控制器結(jié)構(gòu)如圖2所示。
圖2 ADHDP學(xué)習(xí)控制器結(jié)構(gòu)
圖2中Q函數(shù)是對(duì)性能指標(biāo)函數(shù)的預(yù)估,可以寫成如下表達(dá)式
Q(x(k))=U(x(k),u(x(k)))+Q(x(k+1))
(18)
式中:u(x(k))——反饋控制變量;
Q(x(k)),Q(x(k+1))——性能指標(biāo)函數(shù),評(píng)價(jià)網(wǎng)絡(luò)的輸出。
如果評(píng)價(jià)網(wǎng)絡(luò)的權(quán)值設(shè)為Wc,可以令式的右式為:
D(x(k),Wc)=U(x(k),u(x(k)))+Q(x(k+1),Wc)
(19)
同時(shí),式(19)的左式可以寫為Q(x(k),Wc),因此可以通過調(diào)節(jié)評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)權(quán)值最小化均方誤差函數(shù)
(20)
獲得最優(yōu)性能指標(biāo)函數(shù)根據(jù)最優(yōu)性原理,最優(yōu)控制應(yīng)滿足一階微分必要條件,所以有
(21)
因此得到最優(yōu)控制
(22)
ADHDP控制器包含由BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的執(zhí)行網(wǎng)絡(luò)和評(píng)價(jià)網(wǎng)絡(luò),以及刮膜蒸發(fā)過程的OS-ELM軟測(cè)量模型。執(zhí)行網(wǎng)絡(luò)和評(píng)價(jià)網(wǎng)絡(luò)的隱藏層采用雙極性sigmoidal函數(shù),輸出層采用線性函數(shù)purelin,推導(dǎo)評(píng)價(jià)網(wǎng)絡(luò)和執(zhí)行網(wǎng)絡(luò)的具體實(shí)現(xiàn)方法。
評(píng)價(jià)網(wǎng)絡(luò)輸出為性能指標(biāo)函數(shù)Q(k),應(yīng)滿足式(18),其訓(xùn)練最小化誤差為:
(23)
ec(k)=Q(k)-U(k+1)-Q(k+1)
(24)
為了獲得較快的收斂速度,將效用函數(shù)U(k)定義為二次型形式,定義如下:
U(k)=x(k)Ax(k)T+u(k)Bu(k)T
(25)
式中:A、B——分別為2維與4維的單位矩陣。
權(quán)值更新過程推導(dǎo)如下:
(26)
Wc2(k+1)=Wc2(k)+ΔWc2(k)
(27)
式中:lc——評(píng)價(jià)網(wǎng)絡(luò)的學(xué)習(xí)率;
ch2(k)——隱含層的輸出值。
(28)
式中:C(k)——評(píng)價(jià)網(wǎng)路的輸入矩陣;
ch1(k)——隱含層的輸入值。
Wc1(k+1)=Wc1(k)+ΔWc1(k)
(29)
執(zhí)行網(wǎng)絡(luò)用于計(jì)算控制量,以使Q(k)最小為目標(biāo)。
Ea(k)=Q(k)=γQ(k+1)+U(k+1)
(30)
權(quán)值更新過程推導(dǎo)如下:
?
(31)
式中,Wa為執(zhí)行網(wǎng)絡(luò)權(quán)值,Wc1u=Wc1(1:m,:),即Wc1的前m行,這里m=4,即與控制量對(duì)應(yīng)的部分權(quán)值,la為執(zhí)行網(wǎng)絡(luò)的學(xué)習(xí)率。
Wa2(k+1)=Wa2(k)+ΔWa2(k)
(32)
(33)
Wa1(k+1)=Wa1(k)+ΔWa1(k)
(34)
綜上,ADHDP控制器的實(shí)現(xiàn)步驟如圖3所示。
文中訓(xùn)練OS-ELM軟測(cè)量模型的數(shù)據(jù)來源于刮膜式分子蒸餾裝置針對(duì)東北地道藥材五味子分離提純過程的數(shù)據(jù)。刮膜式三級(jí)分子蒸餾裝置由前級(jí)脫氣、分子蒸餾1和分子蒸餾2三大部分組成,控制和監(jiān)控各級(jí)工藝參數(shù)分別由PID儀表和計(jì)算機(jī)實(shí)現(xiàn),第一、第二兩級(jí)用于除去五味子原料油中水分和雜質(zhì)且相關(guān)工藝參數(shù)固定,采集第三級(jí)的控制量、狀態(tài)量的離線和在線數(shù)據(jù)。
圖3 ADHDP訓(xùn)練流程圖
選擇系統(tǒng)壓力、溫度、進(jìn)料流量和刮膜電機(jī)轉(zhuǎn)速作為控制變量,純度作為狀態(tài)變量,設(shè)定網(wǎng)絡(luò)輸入為6,輸出為2,選取600組作為訓(xùn)練數(shù)據(jù),150組數(shù)據(jù)用來進(jìn)行預(yù)測(cè),OS-ELM網(wǎng)絡(luò)與BP網(wǎng)絡(luò)的仿真結(jié)果對(duì)比如圖4所示。
.
(a) OS-ELM純度預(yù)測(cè)
(b) BP純度預(yù)測(cè)
具體性能參數(shù)對(duì)比見表1。
表1 OS-ELM與BP模型網(wǎng)絡(luò)性能對(duì)比
從表1可以看出,OS-ELM軟測(cè)量模型的誤差和訓(xùn)練時(shí)間都遠(yuǎn)遠(yuǎn)小于BP軟測(cè)量模型,并且隨著數(shù)據(jù)的更新持續(xù)地對(duì)模型進(jìn)行修正,證明了OS-ELM模型的優(yōu)越性。
參數(shù)設(shè)置會(huì)在一定程度上影響算法的收斂速度。經(jīng)過實(shí)驗(yàn)選取BP-ADHDP與OSELM-ADHDP的評(píng)價(jià)網(wǎng)絡(luò)和執(zhí)行網(wǎng)絡(luò)的結(jié)構(gòu)均為6-14-2和2-5-4,學(xué)習(xí)率為0.1,折扣因子為0.5,迭代步數(shù)為50,在刮膜蒸發(fā)過程中對(duì)系統(tǒng)壓力、溫度、進(jìn)料流量、刮膜電機(jī)轉(zhuǎn)速和純度參數(shù)的尋優(yōu)結(jié)果對(duì)比分別如圖5~圖9所示。
圖5 控制量溫度變化曲線圖
圖6 控制量進(jìn)料速度變化曲線圖
圖7 控制量刮膜電機(jī)轉(zhuǎn)速變化曲線
圖8 控制量壓力變化曲線圖
由仿真結(jié)果可以看出,BP-ADHDP與OSELM-ADHDP大約都在13時(shí)步左右趨于穩(wěn)定,但是,OSELM-ADHDP最優(yōu)狀態(tài)量純度為95.58%,要遠(yuǎn)大于BP-ADHDP的89.93%,優(yōu)化的狀態(tài)量純度得到了顯著提高,并且OSELM-ADHDP模型網(wǎng)絡(luò)更加準(zhǔn)確可靠,能夠?qū)崿F(xiàn)更好的控制優(yōu)化效果。
BP-ADHDP與OSELM-ADHDP最優(yōu)控制量與狀態(tài)量對(duì)比見表2。
分子蒸餾系統(tǒng)本身的多參數(shù)、強(qiáng)耦合、非線性決定其難以獲得精確數(shù)學(xué)模型,在刮膜蒸發(fā)過程中的重要參數(shù)只能依賴于人工經(jīng)驗(yàn),以致難以實(shí)現(xiàn)穩(wěn)定有效的控制,采用基于數(shù)據(jù)驅(qū)動(dòng)的OS-ELM軟測(cè)量模型,可以根據(jù)實(shí)際工況對(duì)模型進(jìn)行調(diào)整,運(yùn)用ADHDP對(duì)刮膜蒸發(fā)過程進(jìn)行優(yōu)化控制,仿真結(jié)果表明,系統(tǒng)訓(xùn)練時(shí)間短、超調(diào)量小,能夠快速達(dá)到穩(wěn)定狀態(tài),對(duì)提高刮膜蒸發(fā)過程的穩(wěn)定性和高效性具有一定的指導(dǎo)意義。
表2 BP-ADHDP與OSELM-ADHDP最優(yōu)控制量與狀態(tài)量對(duì)比
參考文獻(xiàn):
[1] 連錦花,孫果宋,雷福厚.分子蒸餾技術(shù)及其應(yīng)用[J].化工技術(shù)與開發(fā),2010,39(7):32-38.
[2] 曹鵬飛,羅雄麟.化工過程軟測(cè)量建模方法研究進(jìn)展[J].化工學(xué)報(bào),2013,64(3):788-800.
[3] Cvengro? J, Badin V, Pollák S. Residence time distribution in a wiped liquid film [J]. Chemical Engineering Journal and the Biochemistry Engineering Journal,1995(5):259-263.
[4] Cvengro J, Pollá K, Micov M. Film wiping in the molecular evaporator [J]. Chemical Engineering Journal,2001(1/2/3):9-14.
[5] Mckenna Timothy F. Design model of a wiped film evaporator applications to the devolatilisation of polymer melts [J]. Chemical Engineering Science,1995(3):453-467.
[6] Rong H J, Huang G B, Sundararajan N. Online sequential fuzzy extreme learning machine for function approximation and classification problems [J]. IEEE Transactions on Systems Man and Cybernetics Part B,2009,39(4):1067-1072.
[7] Liang N Y, Huang G B, Paramasivan S, et al. A fast and accurate online sequential learning algorithm for feedforward netwroks[J]. IEEE Transactionson Neural Networks,2006,17(6):1411-1423.
[8] 徐暢,許松林.刮膜式分子蒸餾停留時(shí)間分布的CFD模擬研究[J].安徽師范大學(xué)學(xué)報(bào),2013,36(2):141-145.
[9] 王燕飛.刮膜式分子蒸餾過程流體流動(dòng)的模擬與驗(yàn)證[D].天津:天津大學(xué),2007.
[10] 王玲.刮膜式分子蒸餾器液膜停留時(shí)間分布及傳熱研究[D].天津:天津大學(xué),2012.
[11] 李慧,王珂鑫.刮膜式分子蒸餾傳質(zhì)模型及其仿真[J].化工學(xué)報(bào),2015,66(3):1026-1034.
[12] 李慧,李秀歌,王佳增.負(fù)壓低溫蒸餾裝置的溫度控制[J].長(zhǎng)春工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2014,35(5):516-523.
[13] 楊易旻.基于極限學(xué)習(xí)的系統(tǒng)辨識(shí)方法及應(yīng)用研究[D].長(zhǎng)沙:湖南大學(xué),2013.
[14] 林小峰,宋紹劍,宋春寧.基于自適應(yīng)動(dòng)態(tài)規(guī)劃的智能優(yōu)化控制[M].北京:科學(xué)出版社,2013.
[15] 羅艷紅.基于神經(jīng)網(wǎng)絡(luò)的非線性系統(tǒng)自適應(yīng)優(yōu)化控制研究[D].沈陽(yáng):東北大學(xué),2008.