湯舒淇,薄翠梅,俞輝,李俊,張登峰,張泉靈,金曉明
(1南京工業(yè)大學(xué)電氣工程與控制科學(xué)學(xué)院,江蘇南京 211816;2南京工業(yè)大學(xué)智能制造研究院,江蘇南京 210009;3浙江大學(xué)控制科學(xué)與工程學(xué)院,浙江杭州 310027)
隨著現(xiàn)代社會對多品種、高質(zhì)量、精細(xì)化大宗化工產(chǎn)品的迫切需求,當(dāng)前我國石化行業(yè)的生產(chǎn)正向著原料多元化、產(chǎn)品高值化發(fā)展。由于間歇、半間歇的生產(chǎn)模式更適合生產(chǎn)小批量、多品種、高附加值的產(chǎn)品,因此更受青睞[1-2]。間歇、半間歇生產(chǎn)與連續(xù)生產(chǎn)的區(qū)別主要在于它的生產(chǎn)操作范圍不局限于傳統(tǒng)意義上的穩(wěn)態(tài)點,同時因為間歇生產(chǎn)的時間有限性,必須對整個生產(chǎn)過程進(jìn)行有效的排產(chǎn),這給生產(chǎn)帶來了靈活性,但也給過程優(yōu)化控制帶來了困難[3]。
目前大部分優(yōu)化與控制理論方法都是以連續(xù)過程為研究對象,通過將批次反應(yīng)的終端狀態(tài)固定,終端狀態(tài)作為優(yōu)化的終端約束,可將用于連續(xù)過程的優(yōu)化控制方法應(yīng)用到批次生產(chǎn)中,從而解決批次過程經(jīng)濟(jì)優(yōu)化問題[4]。批次過程優(yōu)化問題的求解通常采取直接法或間接法。間接法指利用變分法等最優(yōu)化原理得到問題的數(shù)學(xué)解析解。例如采用基于龐特里亞金最大原理的優(yōu)化方法,以求取在批次生產(chǎn)周期終點固定時間下產(chǎn)物濃度最大化的最佳操作曲線軌跡[5]。直接法是將狀態(tài)變量或輸入變量離散化,把原動態(tài)優(yōu)化問題轉(zhuǎn)化為非線性規(guī)劃問題(nonlinear programming,NLP)。例如因非線性約束導(dǎo)致的解析解計算困難,可對控制輸入變量進(jìn)行參數(shù)化以找到最佳的批次過程操作條件[6],或用有限元正交配置法徹底離散化優(yōu)化問題[7]。而離散化后的NLP則可以用各類基于梯度或隨機(jī)搜索算法計算求解,如文獻(xiàn)中將改進(jìn)的蟻群算法用于發(fā)酵過程中基質(zhì)流加率控制軌跡的動態(tài)優(yōu)化[8]。
由于不確定的干擾會導(dǎo)致反應(yīng)持續(xù)時間不確定,因此固定的批次終端優(yōu)化方法在很多場合不再適用。在不確定干擾下固定終端約束對于批次補料過程是不經(jīng)濟(jì)的[9]。這是因為預(yù)先設(shè)定生產(chǎn)目標(biāo)的條件并不適用于外部條件改變后的生產(chǎn)。例如,在不確定的系統(tǒng)參數(shù)下,將分批發(fā)酵過程的自由終端時間和反應(yīng)物初始濃度作為優(yōu)化調(diào)節(jié)變量,根據(jù)發(fā)酵的實時狀態(tài)變化隨時調(diào)控操作參數(shù),獲取最佳的發(fā)酵品質(zhì)[10]。對于多批次迭代學(xué)習(xí)進(jìn)行計算的情況,不固定終端將帶來批次不等長的情況,通過搜索相似的模式分別構(gòu)造它們對應(yīng)的置信區(qū)域[11-12]。抑或通過混合時間標(biāo)度策略可將自由終端時間的優(yōu)化問題轉(zhuǎn)化為固定終端時間的優(yōu)化問題[13],為解決不等長批次的批間學(xué)習(xí)提供了較好的參考。
在沒有終端約束的情況下,對于間歇生產(chǎn)的操縱優(yōu)化而言,操縱變量可行域通常會增加。對于計算量過大且無法通過相關(guān)約束縮小可行域簡化計算的大型化工生產(chǎn)過程來說,通常采用貫序優(yōu)化或雙層優(yōu)化的結(jié)構(gòu)[14]。雙層優(yōu)化是指上層通過經(jīng)濟(jì)優(yōu)化計算操縱變量的最佳操作軌跡[15];底層以上層的優(yōu)化結(jié)果作為固定參數(shù),通過基于優(yōu)化的最佳操作區(qū)域內(nèi)尋底層局部最優(yōu)控制,例如用模型預(yù)測控制(MPC)實現(xiàn)快速跟蹤控制[16]。該結(jié)構(gòu)成功地將經(jīng)濟(jì)優(yōu)化問題和控制問題分離開,以降低解決問題的復(fù)雜性,已廣泛應(yīng)用于復(fù)雜化工過程優(yōu)化系統(tǒng)。然而雙層優(yōu)化結(jié)構(gòu)的潛在缺點是上下層所采用的不同模型會導(dǎo)致優(yōu)化效果偏離預(yù)期[17]。因此,近年提出將操作優(yōu)化和最優(yōu)控制集成到同一層的單層優(yōu)化控制方法。為了提高單層優(yōu)化控制的魯棒性,設(shè)計了魯棒的狀態(tài)估計和退避約束的方法[18];另外一些研究者采用了一種復(fù)合優(yōu)化目標(biāo)函數(shù),同時考慮了過程產(chǎn)量和目標(biāo)函數(shù)敏感性[19]。文獻(xiàn)[20]還提出了一種基于NMPC和DRTO的批次協(xié)同優(yōu)化控制方法,使NMPC更加適用于批次生產(chǎn)過程,可以同時考慮批次生產(chǎn)長度對經(jīng)濟(jì)的影響。在單層的優(yōu)化控制中,應(yīng)用了滾動時域控制(receding horizon control,RHC)的單層優(yōu)化控制又可以視為一種經(jīng)濟(jì)模型預(yù)測控制(economic model predictive control,EMPC),應(yīng)用于反應(yīng)過程中的研究[21-24]。例如文獻(xiàn)[25]通過為同一過程制定不同的EMPC經(jīng)濟(jì)目標(biāo)函數(shù),以實現(xiàn)不同的經(jīng)濟(jì)優(yōu)化效果。也有文獻(xiàn)研究了非固定終端的收斂性問題[26-27],但利用EMPC目標(biāo)函數(shù)的多樣性,將非固定終端約束應(yīng)用于批次經(jīng)濟(jì)優(yōu)化控制研究成果并不夠充分。
因此在上述研究的基礎(chǔ)上,提出了一種應(yīng)用于分批補料的非固定終端經(jīng)濟(jì)優(yōu)化控制方法,用于考慮批次生產(chǎn)長度對經(jīng)濟(jì)的影響,解決批次周期不確定約束優(yōu)化控制問題。本文基于經(jīng)濟(jì)模型預(yù)測控制方法,提出了非固定終端的經(jīng)濟(jì)優(yōu)化問題;提出控制變量差異參數(shù)化的方法提高優(yōu)化計算效率;采用內(nèi)點罰函數(shù)法求解帶非線性等式、不等式約束的優(yōu)化問題;給出了基于滾動時域的優(yōu)化控制方法及其流程圖;在苯胺加氫分批補料工藝中進(jìn)行了實驗測試,并與多回路復(fù)雜PI控制進(jìn)行了對比研究,以驗證該方法的有效性。
任意被控對象動態(tài)過程,反應(yīng)過程可以寫成如下常微分方程組(ordinary differential equations,ODEs)形式:
令優(yōu)化求解的初值x(ts)=xs,u(ts)=us,ts為優(yōu)化時的當(dāng)前時刻,定義一個包含(xs,us)的不變集Ω,且Ω?X×U,則x(t),u(t)∈Ω代表在約束內(nèi)u(t)的作用下x(t)也處于約束內(nèi)。
在連續(xù)過程中,EMPC通過在滾動時域算法中求解含經(jīng)濟(jì)目標(biāo)函數(shù)的最優(yōu)化問題,實時更新系統(tǒng)的運行條件。該優(yōu)化問題形式通常如下:
但將EMPC應(yīng)用到間歇生產(chǎn)過程時,則需要考慮如下問題:(1)間歇生產(chǎn)無穩(wěn)態(tài)點,也因此不存在預(yù)測范圍內(nèi)需要達(dá)到的設(shè)定點;(2)間歇生產(chǎn)的生產(chǎn)時間有限,如果預(yù)測范圍PEMPC保持不變,隨著時間的滾動,預(yù)測范圍將超過生產(chǎn)時間范圍。
因此考慮將針對連續(xù)過程提出的EMPC應(yīng)用于間歇生產(chǎn)過程,并且對間歇生產(chǎn)模式提出有針對性的改進(jìn)。EMPC策略在連續(xù)過程中的收斂性通常通過增加預(yù)測時域范圍來保證。根據(jù)文獻(xiàn)[26],隨著優(yōu)化范圍的增長,系統(tǒng)性能會收斂到最佳狀態(tài),相較于無限時域優(yōu)化有指數(shù)級誤差衰減。因此優(yōu)化時域應(yīng)當(dāng)在可計算范圍內(nèi)足夠長。對于批次反應(yīng)過程來說,最長的有效預(yù)測時域即批次的終端,則優(yōu)化預(yù)測時域P=Tf-ts,以獲得足夠的收斂性能。假定間歇生產(chǎn)的一個批次周期為Tf,用批次結(jié)束時間的產(chǎn)量約束x(Tf)=xf代替預(yù)測范圍內(nèi)的設(shè)定點,以達(dá)到預(yù)先設(shè)定的生產(chǎn)目標(biāo)。因此在每個采樣點要解決一個固定終端的最優(yōu)控制問題,如式(5)所示:
終端時間放寬后,對于經(jīng)濟(jì)目標(biāo)函數(shù)的定義也能不局限于最小化控制輸入。原本的生產(chǎn)計劃指標(biāo)是通過一個終端等式約束達(dá)到的,給求解計算帶來了很大的復(fù)雜度。由于實際生產(chǎn)中的經(jīng)濟(jì)目標(biāo)通常是利益最大化。
通過將目標(biāo)函數(shù)以最大化利益的方式設(shè)置,即可將原本的生產(chǎn)計劃指標(biāo)的等式約束轉(zhuǎn)化為產(chǎn)品收入項;將原本的最小化控制輸入目標(biāo)函數(shù),轉(zhuǎn)化為生產(chǎn)成本項。最終達(dá)到最大化利益生產(chǎn)的目標(biāo)。而根據(jù)間歇過程的生產(chǎn)特點,產(chǎn)品收益通常在一個批次生產(chǎn)完成之后才會產(chǎn)生,即在目標(biāo)函數(shù)中只有終端項。而生產(chǎn)成本則是在生產(chǎn)前有一次性成本,在整個生產(chǎn)過程中有連續(xù)累積的成本,因此既有終端項又有積分項。完整的經(jīng)濟(jì)目標(biāo)函數(shù)形式應(yīng)當(dāng)如下:
其中,Veconomic、V1、V2、V3分別為過程經(jīng)濟(jì)利益函數(shù)、累積成本函數(shù)、產(chǎn)品收益函數(shù)、生產(chǎn)前一次性成本去量綱后的函數(shù),V3通常是一個常數(shù)。經(jīng)過改進(jìn)后非固定終端的優(yōu)化控制問題如式(7)所示。
在t時刻的最優(yōu)控制輸入序列集為Φ,它是一系列控制變量的集合。這是因為當(dāng)終端不固定的情況下,不同的操縱變量有不同的離散化規(guī)則,具體在1.2節(jié)中介紹。
可以觀察到,上述表達(dá)式計算的是一個動態(tài)經(jīng)濟(jì)優(yōu)化問題,且通過計算動態(tài)經(jīng)濟(jì)優(yōu)化和在每個采樣時刻更新系統(tǒng)狀態(tài),將開環(huán)優(yōu)化轉(zhuǎn)化為反饋控制策略。當(dāng)不考慮過程干擾以及模型失配等不確定性因素,該優(yōu)化問題在最初一次求解得到的最優(yōu)終端時間與后續(xù)過程中計算得到的最優(yōu)終端時間應(yīng)當(dāng)是一致的。而發(fā)生擾動后,經(jīng)濟(jì)最優(yōu)的情況會使Tf趨向更有利的區(qū)間。而反應(yīng)最終的產(chǎn)物x(Tf)將由優(yōu)化問題根據(jù)過程情況與經(jīng)濟(jì)條件調(diào)整。
式(7)的動態(tài)優(yōu)化問題通過優(yōu)化計算的目標(biāo)函數(shù)來優(yōu)化控制輸入變量,可以最大程度地降低過程成本。但是,由于該優(yōu)化中存在較大的可行域區(qū)間,所得的控制輸入的最佳軌跡并不一定適合化工生產(chǎn)的實際過程。操縱變量的反復(fù)大跳動與引起的狀態(tài)變量急劇增減可能會在運行過程中損壞設(shè)備,或使具有高敏感度的系統(tǒng)進(jìn)入失控狀態(tài)。為限制狀態(tài)變量或操縱變量的跳變,可在約束中加入導(dǎo)數(shù)或累積上限。但是如果遇到確實需要較大跳變才能抵消的大擾動,該約束會限制控制動作的行為,以至于控制可行性不高。因此,在原目標(biāo)函數(shù)加入限制重要系統(tǒng)狀態(tài)變量的導(dǎo)數(shù)和操縱變量的累積差項,這樣當(dāng)經(jīng)濟(jì)項大到可以忽略控制平穩(wěn)項時,意味著需更新控制動作。更新的目標(biāo)函數(shù)如下:
其中,α和β分別是維度為nx與nu的加權(quán)因子向量,α的第k個和β的第i個分量分別對應(yīng)系統(tǒng)狀態(tài)變量平緩變化的程度和控制輸入變量的穩(wěn)定變化強(qiáng)度。
在解決式(7)的優(yōu)化問題中,使用控制變量參數(shù)化法(control variables parameterization,CVP)描述控制變量的軌跡。在控制變量參數(shù)化方法中,只有控制變量被離散化,而其他變量則仍然按照連續(xù)的考慮??刂谱兞康膮?shù)化給無限維的優(yōu)化問題轉(zhuǎn)化為有限維的NLP提供可能,而保留其他向量的連續(xù)特性又大幅度降低了求解規(guī)模。
面對批次反應(yīng)過程的反應(yīng)周期不定的情況,使用傳統(tǒng)的固定網(wǎng)格化離散方法固然是一種可行的方法,然而該方法下,并不能根據(jù)過程動態(tài)特性自主選擇不同控制變量的微調(diào)精度。另外,若要更精確地逼近最優(yōu)控制軌跡,就要將網(wǎng)格寬度設(shè)置得短一點,也增加了網(wǎng)格數(shù)量,且加大了NLP的維數(shù)和計算量。因此對于不同控制變量的參數(shù)化定義方法非常重要,這里選擇了根據(jù)控制變量動態(tài)特性合理確定網(wǎng)格,并且隨著迭代實時更新的控制序列分段方法,如圖1所示。
圖1 控制變量的獨立參數(shù)化示意圖Fig.1 Schematic diagram of control vectors respectively parameterized
由于批次終端時間并不事先可知,因此當(dāng)優(yōu)化所得的批次終端時間變化時,需要在每個優(yōu)化問題求解之前(即當(dāng)前時刻ts)時更新分割參數(shù),如式(9)和式(10)所示。
這兩個更新公式分別對應(yīng)于控制范圍超過預(yù)期的終止時間和控制范圍與預(yù)期終止時間的比例小于ωi。其中ωi是一個無量綱參數(shù),表示第i個控制變量的控制時域在一個批次周期中合適的占比。
為解決優(yōu)化問題,本文將采用內(nèi)點最優(yōu)化法(interior point optimizer,IPOPT)進(jìn)行求解,它通過在目標(biāo)函數(shù)中添加障礙項消去不等式約束,并通過迭代減小障礙權(quán)重,不斷逼近最優(yōu)解。通過控制變量參數(shù)化方法將式(8)中的優(yōu)化問題轉(zhuǎn)化為NLP后即可以直接求解,但所需求解的問題是一個含有非線性等式約束、不等式約束的較為復(fù)雜的約束優(yōu)化問題。為了降低求解難度,采用了ODE求解集成和障礙函數(shù)法分別解決等式、不等式約束,將有約束的NLP轉(zhuǎn)化為無約束的NLP來求解。
式(7)問題中的等式約束即過程模型的微分方程,將微分方程的求解記作算子D(·),則t>ts階段的狀態(tài)變量的預(yù)測值,通過ODE求解器所求的解可以表達(dá)成如下形式:
其中,邊界條件x(ts)=xs,且ts<σ
考慮到一些優(yōu)化問題的極小值點可能位于可行域的邊界上,為得到這樣的極小值點,內(nèi)點罰函數(shù)需要在迭代過程中不斷調(diào)整罰因子來逐步削弱障礙函數(shù)對最優(yōu)值點的影響,從而使算法產(chǎn)生的點列在可行域內(nèi)部逐步逼近原規(guī)劃問題的極小值點。本方法適合處理求解最優(yōu)解在可行域邊界上但在靠近可行域邊界時有次最優(yōu)解的問題??紤]如式(12)所示的優(yōu)化問題,通過控制變量參數(shù)化后優(yōu)化操縱變量為m=[u'1,…,u'nu,Tf]',不等式約束條件用fi表示,ncon是約束條件的個數(shù),即可行域內(nèi)點集為:
建立懲罰項
其中,π是懲罰障礙權(quán)重,fbarrier為障礙函數(shù),為了獲得連續(xù)梯度,選取對數(shù)形式:
給定初始π0>0,m0∈X,權(quán)重衰減系數(shù)γ>1,允許誤差δ>0。求解P(mk,πk)的近似最優(yōu)解,即|?m P(mk,πk)|≤δ,如果fbarrier(mk)/πk>δ則令πk+1=γπk,否則結(jié)束迭代計算,而近似最優(yōu)解即為mk。
假設(shè)存在最優(yōu)解m*,則同時存在對偶最優(yōu)變量λ*與原始操縱變量一同滿足Karush-Kuhn-Tucker(KKT)條件:
在這個問題中,λi可相當(dāng)于
且
則當(dāng)π→∞時,互補松弛條件成立,即內(nèi)點法產(chǎn)生的最優(yōu)解相當(dāng)于滿足KKT條件。
非固定終端經(jīng)濟(jì)優(yōu)化控制遵循滾動時域優(yōu)化控制,直到滿足終止條件為止。如圖2所示,在初始化系統(tǒng)后,根據(jù)式(8)的目標(biāo)函數(shù)和式(7)中的等式、不等式約束,形成一個動態(tài)優(yōu)化問題。根據(jù)當(dāng)前的測量信息[x(ts),u(ts),d(ts)],用式(11)將ODE求解器集成到目標(biāo)函數(shù)的計算中,用以根據(jù)當(dāng)前時刻狀態(tài)估計未來時刻狀態(tài)變量的值。通過CVP離散化操縱變量,將動態(tài)優(yōu)化問題轉(zhuǎn)化為NLP。通過IPOPT方法求解帶有邊界約束的NLP,從而獲得最優(yōu)批次生產(chǎn)時間Tf*與最優(yōu)操縱變量序列uij*,以ΔtOC執(zhí)行操縱變量,依據(jù)式(9)、式(10)更新Nu,并且向前推進(jìn)ts。通過判斷Nu的個數(shù)判斷所剩時間是否不足以進(jìn)行一次優(yōu)化控制,如果小于1則不再進(jìn)行優(yōu)化求解,再根據(jù)時間ts是否達(dá)到Tf結(jié)束一批次的生產(chǎn),否則,重新測量當(dāng)前狀態(tài)信息,在下一時刻重新求解優(yōu)化問題。
圖2 非固定終端經(jīng)濟(jì)優(yōu)化控制流程Fig.2 Flow chart of economic optimization control with unfixed terminal
根據(jù)流程圖,非固定終端經(jīng)濟(jì)優(yōu)化控制的具體步驟如下:
(1)初始化參數(shù)設(shè)置與初始操作條件;
(2)從時間ts開始,根據(jù)優(yōu)化問題式(12)求解出最優(yōu)控制參數(shù)集(Φ*)和最佳批次終端時間(Tf*),并計算終端狀態(tài)與該時刻下的經(jīng)濟(jì)目標(biāo)函數(shù);
本算法使用的測試案例來自文獻(xiàn)[28]的苯胺(aniline,A)加氫制環(huán)己胺(cyclohexylamine,CHA)模型,其反應(yīng)方程式如下:
苯胺加氫通常采取批次生產(chǎn)的模式,在連續(xù)攪拌釜式反應(yīng)器內(nèi)一次性加入苯胺,然后以批次或半批次的方式加入氫氣,反應(yīng)是放熱的,需要對反應(yīng)器降溫以帶走多余的熱量。反應(yīng)所需的夾套換熱反應(yīng)器如圖3所示。
圖3 分批進(jìn)料反應(yīng)器示意圖Fig.3 Schematic diagramof fed-batch reactor
描述該系統(tǒng)的動態(tài)數(shù)學(xué)模型由總質(zhì)量平衡、3個成分的平衡、反應(yīng)器液體上的能量平衡和夾套能量平衡組成。
假設(shè)密度恒定,質(zhì)量平衡如下:
其中,F(xiàn)in是氫氣進(jìn)料的體積流量,VR是容器內(nèi)反應(yīng)物的體積。
成分平衡如下:
反應(yīng)器的能量平衡如下:
夾套的能量平衡如下:
反應(yīng)器壓力由溫度和液體組成計算得出,苯胺和環(huán)己胺的蒸氣壓常數(shù)以及氫的亨利定律常數(shù)是使用Chao-Seader物理性能數(shù)據(jù)包從Aspen Plus獲得的數(shù)據(jù)計算得出。
其中,Xa、Xb、Xc分別為苯胺、氫氣、環(huán)己胺在反應(yīng)器中的摩爾分?jǐn)?shù)。
苯胺加氫過程的經(jīng)濟(jì)目標(biāo)函數(shù)設(shè)置如下:
其中,上角標(biāo)“f”代表t=Tf時各種變量的值,從其物理意義中可以看出,經(jīng)濟(jì)目標(biāo)函數(shù)的值即過程加料、冷卻水消耗和一次性投料的成本減去產(chǎn)品收益。然而由于實際上的目標(biāo)函數(shù)還有關(guān)于穩(wěn)定運行的項,因此會將經(jīng)濟(jì)函數(shù)的數(shù)量級縮放到0~1之間,即在Veconomic外乘系數(shù)ε=1/Vmax,Vmax是理論上能達(dá)到的最大收益,即不需要任何成本,將所有一次性投料都轉(zhuǎn)化為產(chǎn)品所能獲得的收益。然而實際上這是不存在的,所以經(jīng)濟(jì)項永遠(yuǎn)小于1。
在約束條件的問題上,各個操縱變量、狀態(tài)變量的邊界約束不僅包括生產(chǎn)時的物理約束、安全約束,還包括根據(jù)實際化工過程經(jīng)驗所得的可行約束。即根據(jù)所需產(chǎn)品的質(zhì)量,估計推導(dǎo)出操縱變量的操縱范圍,并作為過程約束加在優(yōu)化問題中。由于無終端約束,收緊了過程約束,因此求解的速度大幅度提升。在無擾動發(fā)生時,生產(chǎn)目標(biāo)的可達(dá)性有了新的保障。而大的擾動發(fā)生時,生產(chǎn)指標(biāo)達(dá)到的概率急劇降低,此時基于最大化收益的優(yōu)化方法也能極力止損。
進(jìn)料流量的變化會引起苯胺加氫反應(yīng)過程系統(tǒng)狀態(tài)發(fā)生更大的變化,而系統(tǒng)狀態(tài)變量中需要進(jìn)行安全約束的主要就是氫氣濃度和反應(yīng)器溫度,反應(yīng)器壓力和冷卻劑出口溫度也幾乎完全分別取決于這兩個變量,因此為了限制溫度上升的速度需要對溫度經(jīng)行斜率限制。除此以外,開環(huán)下整個批次的時間大約在300 min以內(nèi),取控制范圍在預(yù)測范圍的1/10左右,為了對過程速率有更加細(xì)致的控制,將氫氣進(jìn)料的控制變量離散化參數(shù)設(shè)置得比冷卻劑進(jìn)料參數(shù)更細(xì)膩。因此針對α、β、Nu、ΔTu四個參數(shù)的整定結(jié)果見表2。
表2 優(yōu)化過程的參數(shù)整定Table 2 Tuning parameter settings of the optimized control
基于上述苯胺加氫反應(yīng)模型,采用C++語言進(jìn)行批次反應(yīng)過程控制與優(yōu)化仿真,實現(xiàn)環(huán)己胺制備過程的單批次周期的最優(yōu)化。為了測試本方法在變批次長度上的優(yōu)勢,將優(yōu)化控制與選擇與分程結(jié)構(gòu)的多回路PI控制進(jìn)行了對比。PI控制的條件設(shè)定參照文獻(xiàn)[29]用離線優(yōu)化得到的最佳參數(shù)運行,分別用冷卻液進(jìn)料與氫氣進(jìn)料進(jìn)行獨立回路控制,再為氫氣進(jìn)料增加低選控制結(jié)構(gòu),避免進(jìn)料導(dǎo)致壓力過大,而溫度控制采用兩種輸入的分程控制結(jié)構(gòu)。PI控制的參數(shù)調(diào)節(jié)依據(jù)文獻(xiàn)[30-31],為KcTC=0.05,TiTC=10 min,KcPC=0.3,TiPC=30 min。在50 min時對冷卻劑入口溫度加入了擾動,從350 K升高到400 K,分別測試了有無擾動狀況下的兩種方法控制輸出情況對比,見圖4~圖9。
圖4 有擾動下冷卻水流量曲線對比Fig.4 Comparison of coolant flow with disturbance
控制穩(wěn)定性如圖4和圖5所示。在PI控制下所需的冷卻劑用量明顯多于優(yōu)化控制下,擾動發(fā)生時控制變量也發(fā)生了振蕩。相比本文提出的優(yōu)化控制方法的控制曲線一直處在可接受的變化速率中。從圖6和圖7中在擾動發(fā)生時溫度、壓力這兩個重要被控變量曲線來看,PI控制下的壓力曲線在擾動發(fā)生時總是會出現(xiàn)振蕩。實際上,在反復(fù)調(diào)試PID參數(shù)后發(fā)現(xiàn)擾動帶來的振蕩是與反應(yīng)機(jī)理模型相關(guān)的,是單回路閉環(huán)控制不可避免的。而優(yōu)化控制采用一種滾動優(yōu)化控制的策略,通過求解一連串控制序列和預(yù)測狀態(tài)變量可以很好地避免振蕩的發(fā)生。
圖5 有擾動下進(jìn)料流量曲線對比Fig.5 Comparison of feed flow with disturbance
圖6 溫度控制抗擾動Fig.6 Anti-disturbance comparison of temperature control
圖7 壓力控制抗擾動Fig.7 Anti-disturbance comparison of pressure control
反應(yīng)終止時間如圖8和圖9所示。在擾動的影響下批次的反應(yīng)明顯變緩慢了,這是因為溫度升高后必須降低送料速度,以避免反應(yīng)器內(nèi)溫度超標(biāo)。因此兩種控制方法下批次終止時間都變長了。除此以外,可以觀察到PI控制下的反應(yīng)在接近反應(yīng)結(jié)束時,反應(yīng)速率急劇下降。根據(jù)式(22)可以推斷出,此刻反應(yīng)器中的苯胺濃度較低,則反應(yīng)速度會下降,為了促使反應(yīng)的繼續(xù),則需要提高另一種反應(yīng)物的濃度,即需要向反應(yīng)器中加入大量的氫,促使反應(yīng)速率保持在較高的水平,這也是反應(yīng)器中壓力在這段時間驟然升高的原因。在PI選擇控制的策略下,壓力過高時選擇犧牲溫度控制。對于優(yōu)化控制而言所有變量都在同一個優(yōu)化中求解,因此壓力過高的情況在預(yù)測、優(yōu)化中被避免了。
圖8 反應(yīng)器內(nèi)苯胺濃度變化Fig.8 Changes of aniline concentration
圖9 反應(yīng)器內(nèi)環(huán)己胺濃度變化Fig.9 Changesof cyclohexylamine concentration
兩種控制下的反應(yīng)經(jīng)濟(jì)情況如表3所示。其中的凈收入計算方法是:凈收入=反應(yīng)產(chǎn)物獲益-反應(yīng)過程消耗(包括一次性投入物料、加料、冷卻等消耗)。可以看到無擾動情況下,PI控制的凈收入甚至比優(yōu)化控制要高,因為在無擾動的情況下PI控制的反饋控制足夠?qū)⒎磻?yīng)穩(wěn)定在較優(yōu)的操作區(qū)間。但是算上時間成本后,PI控制的平均收益則略低于優(yōu)化控制。在有擾動的情況下,兩種控制下的經(jīng)濟(jì)收益均低于無擾動,且PI控制的凈收入下降了45%,相比之下優(yōu)化控制凈收入降低了25%的情況較好。
表3 兩種控制下的經(jīng)濟(jì)情況對比Table 3 Economic profitability of two kinds of control
除此以外,對于分批補料過程的特性,當(dāng)容器內(nèi)的一次性投料的反應(yīng)物濃度低時,需要反應(yīng)速率大幅下降,大量的投入消耗和時間成本對反應(yīng)物產(chǎn)量的提升不大。因此在終端不固定的情況下可以獲得更多方面的收益。
本文提出了一種分批補料過程的非固定終端的經(jīng)濟(jì)優(yōu)化控制方法,該方法將非固定終端經(jīng)濟(jì)優(yōu)化與多變量協(xié)同控制集成在滾動時域控制結(jié)構(gòu)中,可以更好地實現(xiàn)單批次內(nèi)生產(chǎn)利益最大化。由于將批次生產(chǎn)過程的關(guān)鍵操縱變量和批生產(chǎn)周期的持續(xù)時間都視為優(yōu)化和控制問題的自由度,因此可以較為準(zhǔn)確地管理批次生產(chǎn)的終止時間,在反應(yīng)條件允許范圍內(nèi)最大程度壓縮低效率的生產(chǎn)階段。基于目標(biāo)函數(shù)去預(yù)測評估優(yōu)化最佳操縱變量和操作時間,能夠穩(wěn)定地將過程中發(fā)生的不確定擾動引起的偏移盡快反饋調(diào)控現(xiàn)有條件下經(jīng)濟(jì)更優(yōu)的操作區(qū)間,不斷更新關(guān)鍵操縱變量的控制分段函數(shù)的分割數(shù)及其寬度,從而可靈活優(yōu)化操縱變量和操作時間的軌跡。單層的經(jīng)濟(jì)優(yōu)化控制算法避免了雙層優(yōu)化控制的滯后性,并且基于懲罰函數(shù)內(nèi)點法的實時優(yōu)化在有效范圍能最快地求解最優(yōu)軌跡線,解決單批次周期的優(yōu)化和控制問題,與復(fù)雜多回路PI控制對比分析發(fā)現(xiàn),本方法明顯更靈活有效,測試結(jié)果明顯優(yōu)于基于選擇-分程的復(fù)雜控制方法,通過優(yōu)化計算每個批次生產(chǎn)的最佳操作條件及其生產(chǎn)周期,實現(xiàn)批次反應(yīng)過程生產(chǎn)時間與經(jīng)濟(jì)效益的最優(yōu)化管理。
符號說明
——分別為反應(yīng)器內(nèi)苯胺、氫氣、環(huán)己胺的初始濃度,kmol/m3
——冷卻液的比熱容,kJ/(kmol?K)
DR——反應(yīng)器底部直徑,m
Fin,0——加料流量初值,m3/s
Fj0——冷卻液流量初值,m3/s
Fjmax,F(xiàn)jmin——分別為冷卻液流量的最大、最小值,m3/s
Fin,max,F(xiàn)in,min——分別為加料流量的最大、最小值,m3/s
ΔHR——反應(yīng)放熱,kJ/kmol
k0——反應(yīng)速率常數(shù),m3/(s?kmol)
Tin——反應(yīng)物進(jìn)料溫度,K
Tjin——冷卻液入口溫度,K
Tjout,0——冷卻液出口初始溫度,K
TRmax,TRmin——分別為反應(yīng)器溫度的最大、最小值,K
TR0——反應(yīng)器溫度的初值,K
Vj——冷卻液體積,m3
VRmax,VRmin——分別為反應(yīng)器內(nèi)反應(yīng)物體積的最大、最小值,m3
——反應(yīng)器內(nèi)反應(yīng)物初始體積,m3
θa,θb,θc,θj——分別為苯胺、氫氣、環(huán)己胺、冷卻液的經(jīng)濟(jì)參數(shù),CNY/mol
ρj——冷卻液的密度,kg/m3