宋春寧 王保錄 周曉華,2
(廣西大學電氣工程學院1,廣西 南寧 530004;廣西工學院電子信息與控制工程系2,廣西 柳州 545006)
澄清工段是糖廠制糖過程中一個十分重要的生產(chǎn)工藝環(huán)節(jié)。澄清工藝中,將中和pH值和清汁pH值控制在要求的范圍內是實現(xiàn)澄清技術優(yōu)化的主要指標。該指標對于獲得高質量的清汁和提高糖回收率有著重要作用。而澄清工段是一個復雜的非線性系統(tǒng),具有非線性、多約束、時變大時滯、多輸入等特點,這些特點對pH值的控制和澄清過程都有非常大的影響[1-3]。在分析糖廠澄清工段工藝流程和各種pH值影響因素的基礎上,提出了一種利用模糊神經(jīng)網(wǎng)絡模型的自適應動態(tài)規(guī)劃方法,從而解決了糖廠澄清工段中和pH值難以實現(xiàn)穩(wěn)定控制的問題。
目前,我國大多數(shù)糖廠的澄清工段采用的是亞硫酸法生產(chǎn)工藝。在這個工藝過程中,蔗汁的pH值是一個很重要的指標,它將直接影響白糖的產(chǎn)量和質量[1]。經(jīng)過壓榨工段得到的混合汁含有大量的雜質,如多糖、蛋白質、各種氨基酸與有機酸,此外還含有很多的蔗屑和泥沙,成分非常復雜。澄清工段就是盡量分離去除非糖成分,得到純凈的蔗汁,并取得較好的糖分收回率。
亞硫酸法澄清過程是一個復雜的物理化學過程,可分為預灰、加熱、中和反應、沉降過濾四個階段[2]。其過程流程如圖1所示。
圖1 蔗汁澄清過程流程圖Fig.1 Flow process of clarification wrokshop section in sugar refinery
影響中和pH值控制的因素主要有以下幾個。
①蔗汁流量不穩(wěn)定將直接影響后續(xù)的操作控制,如加石灰乳、SO2和H3PO4等操作。
②預灰pH值偏高或偏低,將對硫熏中和控制造成困難。
③石灰乳、SO2流量的影響。加入石灰量和SO2量過少或過多,則會使中和反應不完全,使清汁中殘留的鈣鹽增加,導致輕質純度下降。加入石灰量過多或硫熏不足,會導致蔗汁中還原糖的分解,清汁色值升高、純度降低。
上述是幾個客觀存在的影響因素,控制好這幾個因素是穩(wěn)定中和pH值的關鍵。
建立糖廠澄清工段模型主要有兩方面作用:①作為啟發(fā)式動態(tài)規(guī)劃(heuristic dynamic programming,HDP)控制器的被控對象;②作為HDP控制器的模型網(wǎng)絡部分。在工業(yè)運行數(shù)據(jù)中,包含反應輸入條件及操作參數(shù)與工藝指標之間關系的信息。在處理和解決問題時,模糊神經(jīng)網(wǎng)絡不需要給出對象的精確數(shù)學模型,它通過改變網(wǎng)絡結構,逐步適應外界各種影響因素的作用,在高度非線性和不確定性的系統(tǒng)建模方面具有很大的潛力[5-7]。
根據(jù)糖廠澄清工段工藝機理分析,影響中和pH值這一工藝指標的因素主要包括甘蔗榨量、蔗汁流量、預灰pH值、一次加熱溫度、硫熏強度、加灰量和二次加熱溫度等參數(shù)。因此,本文設計的模糊神經(jīng)網(wǎng)絡結構如圖2所示。
圖2 模糊神經(jīng)網(wǎng)絡結構Fig.2 Structure of fuzzy neural network
模糊神經(jīng)網(wǎng)絡模型對于非線性問題具有較強的擬合能力,但對于大時滯、參數(shù)分布和時變性等存在復雜的工業(yè)過程,特別是訓練的樣本數(shù)據(jù)不足時,僅依賴于模糊神經(jīng)網(wǎng)絡模型很難達到模型精度的要求。在正常的生產(chǎn)條件下,基于大量的工業(yè)運行數(shù)據(jù)建立的模糊神經(jīng)網(wǎng)絡能夠很好地描述這一生產(chǎn)過程。而工況的判斷需要通過歷史數(shù)據(jù)獲得,令樣本數(shù)為M,某輸入變量xi的取值區(qū)間為Q,將Q分為m個子區(qū)間{Q1,Q2,…,Qm},由于大多數(shù)樣本是在生產(chǎn)正常的情況下獲得的,故可認為某個子區(qū)間的樣本越多,其工況越正常。因此,根據(jù)各子區(qū)間所包含的樣本數(shù)占總樣本數(shù)的比例,糖廠澄清工段的工況歸納為以下三類。
其中,εmin和εmax是根據(jù)經(jīng)驗確立的樣本比例參數(shù),在實際的工業(yè)生產(chǎn)中,正常的區(qū)間只有一個。輸入量的模糊隸屬度函數(shù)如圖3所示。其中 a2min、a1min、a1max和 a2max可通過歷史數(shù)據(jù)統(tǒng)計獲得,在 [a1min,a1max]內,工況正常;在(a2min,a1min)及(a1max,a2max)內,工況比較正常;其余范圍都屬于異常。由此可定義輸入變量xi的模糊論域為Ex,Ex表示適用模糊神經(jīng)網(wǎng)絡模型處理的范圍。Ex的隸屬函數(shù)形式為:
圖3 輸入量的模糊隸屬度函數(shù)Fig.3 Fuzzy membership functions of input
采用加權法計算模型的權重為:
式中:μi分別為模糊神經(jīng)網(wǎng)絡中r個輸入變量的隸屬度;βi為隸屬度權系數(shù),滿足0< βi<1且 β1+β2+…+βr=1,βi表示輸入變量對模型預測結果的影響程度,可通過對歷史數(shù)據(jù)的統(tǒng)計結果得到。
建立的糖廠澄清工段模型只有具有足夠的樣本數(shù)據(jù),才能反映出系統(tǒng)的內在特性。根據(jù)采集的廣西某糖廠澄清工段1 000組實時數(shù)據(jù)的輸入輸出關系,可以采用神經(jīng)網(wǎng)絡建立其模型。部分實時數(shù)據(jù)如表1所示。
式中,X1,第一主成分變量;X2,第二主成分變量。將標準化后的反應速率常數(shù)k2與X1和X2之間建立多元線性回歸模型,得到的回歸模型如式(5)所示:
表1 某糖廠澄清工段部分實時數(shù)據(jù)Tab.1 Partial real-time data of the clarifying workshop section in certain sugar refinery
將網(wǎng)絡的結構、樣本數(shù)據(jù)作預處理和歸一化后,在Matlab7.0環(huán)境下,采用 Levenberg-Marquardt算法對網(wǎng)絡進行訓練,得到糖廠澄清工段模糊神經(jīng)網(wǎng)絡模型的訓練曲線如圖4所示。
圖4 訓練曲線Fig.4 Training curves
自適應動態(tài)規(guī)劃(adaptive dynamic programming,ADP)是指所有在擾動或不確定條件下隨時間變化的最優(yōu)化神經(jīng)網(wǎng)絡設計,目的是近似貝爾曼動態(tài)規(guī)劃方程中的代價函數(shù)(cost-to-go),從而避免“維數(shù)災”問題[8-9]。其基本思想是通過估計代價函數(shù)(cost-to-go)(或/和代價對狀態(tài)的微分函數(shù))來避免每個階段內針對所有狀態(tài)和控制變量進行精確計算,并通過與實際或仿真系統(tǒng)的相互作用來減少對模型的依賴性,提高上述估計的精度,從而更好地指導最優(yōu)(次優(yōu))策略的求取。自適應動態(tài)規(guī)劃典型結構包含評價網(wǎng)絡、模型網(wǎng)絡和執(zhí)行網(wǎng)絡三部分[10]。根據(jù)評價網(wǎng)絡輸出的函數(shù)不同,現(xiàn)有的自適應動態(tài)規(guī)劃方法主要有三種類型:啟發(fā)式動態(tài)規(guī)劃HDP、雙啟發(fā)式動態(tài)規(guī)劃DHP和全局雙啟發(fā)式動態(tài)規(guī)劃(global dual heuristic dynamic programming,GDHP)[11-12]。本文將使用 HDP 方法來控制糖廠澄清工段中和pH值。
HDP控制器結構如圖5所示,它由評價網(wǎng)絡、模型網(wǎng)絡和執(zhí)行網(wǎng)絡三個基本模塊組成,每個網(wǎng)絡模塊都包含有前饋單元和反饋單元[10-13]。
圖5 HDP控制器結構圖Fig.5 Structure of the HDP controller
圖5中,實線表示信號流向,虛線表示調整評價網(wǎng)絡和執(zhí)行網(wǎng)絡參數(shù)的反向傳播路徑。執(zhí)行網(wǎng)絡接收系統(tǒng)的狀態(tài)參數(shù)x(t),產(chǎn)生當前狀態(tài)下的控制信號u(t),u(t)與系統(tǒng)當前狀態(tài)參數(shù)x(t)一起送入模型網(wǎng)絡;由模型網(wǎng)絡預測新的狀態(tài)x(t+1),x(t+1)信號作為評價網(wǎng)絡的唯一輸入信號;最后評價網(wǎng)絡輸出J函數(shù)的近似值。受控對象為糖廠澄清工段模糊神經(jīng)網(wǎng)絡模型,它既作為控制器的被控對象(或受控系統(tǒng))受到執(zhí)行網(wǎng)絡輸出的控制信號u(t)的控制,也作為模型網(wǎng)絡預測新的狀態(tài)參數(shù)x(t+1)。此外,圖5中的U(t)為效用函數(shù),γ為折扣因子,Z-1為延遲環(huán)節(jié)。
評價網(wǎng)絡的輸入僅為模型網(wǎng)絡預測輸出的受控系統(tǒng)的狀態(tài)參數(shù)x(t+1)。由于系統(tǒng)的狀態(tài)參數(shù)只有中和pH值這一個量,所以評價網(wǎng)絡的輸入也只有一個量。令評價網(wǎng)絡的輸出為代價函數(shù)J,HDP的中心思想是訓練評價網(wǎng)絡,以近似貝爾曼最優(yōu)化方程中的代價函數(shù)J:
式中:γ為折扣因子,取值范圍是[0,1],在此取0.95;U(t)為效用函數(shù),用于給控制對象發(fā)出控制信號。在工業(yè)生產(chǎn)中,U(t)的選取決定了動態(tài)優(yōu)化控制的優(yōu)劣。因此,為設計滿足系統(tǒng)要求的優(yōu)化控制器,U(t)必須能夠反映控制系統(tǒng)中各種各樣的問題??紤]到不同的控制問題效用函數(shù)的形式也是不同的,本文的控制對象是糖廠澄清工段中和pH值,目標是將中和pH值穩(wěn)定在7.0~7.4,因此選擇的效用函數(shù)如下:
式中:X(t)為中和pH值;U(t)為效用函數(shù)。
采用評價網(wǎng)絡輸出代價函數(shù)J,使下面的誤差函數(shù)達到最小:
評價網(wǎng)絡的最小化目標函數(shù)為:
采用式(6)所示的最小化目標函數(shù)作為訓練目標,可以訓練一個評價網(wǎng)絡。采用梯度下降法,其權值的更新規(guī)則滿足以下公式:
式中:lc為評價網(wǎng)絡學習率,它是一個大于0小于1的數(shù);γ為折扣因子;wc為評價網(wǎng)絡的權值。
執(zhí)行網(wǎng)絡是HDP控制器的執(zhí)行者,其獲得系統(tǒng)的狀態(tài)參數(shù)后,執(zhí)行網(wǎng)絡輸出的控制信號不僅要改變系統(tǒng)的狀態(tài),還要與當前系統(tǒng)的狀態(tài)參數(shù)一起送入評價網(wǎng)絡,由評價網(wǎng)絡對其控制作用作出相應的評價。
執(zhí)行網(wǎng)絡的訓練最終是要確定權值矩陣Wa1和Wa2的值。與評價網(wǎng)絡訓練不同,執(zhí)行網(wǎng)絡的訓練目標是最小化評價網(wǎng)絡輸出的代價函數(shù)J。通過評價網(wǎng)絡的輸出誤差,并經(jīng)過評價網(wǎng)絡反向傳播到執(zhí)行網(wǎng)絡來更新執(zhí)行網(wǎng)絡的權值,其算法如下:
式中:la為執(zhí)行網(wǎng)絡的學習率;wa為執(zhí)行網(wǎng)絡的權值。
模型網(wǎng)絡直接采用糖廠澄清工段的模糊神經(jīng)網(wǎng)絡模型,因此,其模型是確定的,不需再作訓練。
利用澄清工段pH值模擬試驗裝置分析試驗結果,樣汁在反應罐中與中和液中和,經(jīng)pH值檢測槽流到存儲罐進行加熱。玻璃電極置于檢測槽內,測量中和后的混合汁pH值。本試驗采用的樣汁pH值為6.5,堿液的pH值取12.27。pH值中和過程控制的目標是使中和pH值為7.2,得到的中和pH值控制曲線結果如圖6所示。
圖6 中和pH值控制曲線Fig.6 Control curve of the neutralization pH value
從圖6可以看出,混合汁pH值從6.5上升到7.2的過程中,pH值的上升速度很快,且超調量較小。在18:03時,向反應罐中加大堿液的流量會造成劇烈的干擾。當遇到劇烈干擾時,系統(tǒng)的反應速度非??欤軌蚴筽H值迅速回到目標值。
在系統(tǒng)地分析糖廠澄清工段工藝流程的基礎上,基于模糊神經(jīng)網(wǎng)絡模型和HDP控制器,構建了模糊神經(jīng)網(wǎng)絡模型。試驗表明,系統(tǒng)取得了較好的控制效果。
[1]陳維鈞,許斯欣.甘蔗制糖原理與技術第二分冊-蔗汁清凈[M].北京:中國輕工業(yè)出版社,2001.
[2]Blackwell J.Recent developments in the sugar industry[J].International Sugar Journal,2001(102):43-60.
[3]Beck K,Peters L,Papur P,et al.Application of soft-computing techniques in optimization and control of complex processes in sugar industry[J].International Sugar Journal,2002,1245(104):390-400.
[4]霍漢鎮(zhèn).低溫磷浮法——21世紀的制糖新工藝[J].廣西輕工業(yè),2001(1):21-26.
[5]周開利,康耀紅.神經(jīng)網(wǎng)絡模型及其MATLAB仿真程序設計[M].北京:清華大學出版社,2005.
[6]李國勇,智能控制及其MATLAB實現(xiàn)[M].北京:電子工業(yè)出版社,2005.
[7]張德豐.MATLAB神經(jīng)網(wǎng)絡應用設計[M].北京:機械工業(yè)出版社,2009.
[8]黃偉,魏鏡搜,王庭有,等.模糊智能控制在磨礦分級系統(tǒng)中的應用研究[J].昆明理工大學學報:理工版,2009,34(4):96-100.
[9]于軍琪,吳濤,黃永宣,等.磨礦分級系統(tǒng)溢流濃度的模糊智能控制[J].西安交通大學學報:自然科學版,1999,33(9):1-9.
[10]Werbos P J.Stable adaptive control using new critic designs[EB/OL].[2011 - 09 - 18].http://arxiv.org/abs/adaporg/9810001v1.
[11]Prokhorov D V,Wunsch D C.Adaptive critic designs[J].IEEE Transactions on Neural Networks,1997,8(5):997-1007.
[12]Paul J.Tutorial on neural control,control theory and related techniques:from back propagation to brain-like intelligent systems[C]∥12th ICMCM & SC,1999.
[13]Liu W X,Venayagamoorthy G K,Wunsch D C.A heuristic-dynamicprogramming-based power system stabilizer for a turbogenerator in a single-machine power system[J].IEEE Transactions on Industry Applications,2005,41(5):1377-1385.