,,,
(江蘇大學(xué) 電氣信息工程學(xué)院,江蘇 鎮(zhèn)江 212013)
發(fā)酵過程涉及微生物生長繁殖,過程呈現(xiàn)高度非線性和不確定性;同時隨著發(fā)酵進行,發(fā)酵最適條件參數(shù)隨時間發(fā)生改變,使得傳統(tǒng)的傳感器方法難以實時在線檢測發(fā)酵過程關(guān)鍵參數(shù),從而造成無法對發(fā)酵過程進行優(yōu)化控制,自動化水平遠低于其他工業(yè)生產(chǎn)過程。因此“軟測量”建模被提出和廣泛應(yīng)用在發(fā)酵工業(yè)中[1]。
最小二乘支持向量機(LS-SVM)建模方法采用結(jié)構(gòu)風(fēng)險最小化原則和核參數(shù)技術(shù),同時建模速度較快,在解決小樣本的建模過程中有很好的表現(xiàn)[2-5]。實踐表明,LS-SVM模型過程中徑向基寬度和懲罰系數(shù)對建模性能影響很大。LU 等[6]采用量子粒子群算法來完成支持向量機參數(shù)選擇,并運用在發(fā)酵過程成中,取得很好測量效果;劉瑞蘭等[7]提出用遺傳算法對模型進行稀疏化以及參數(shù)尋優(yōu)。這些算法不僅縮短了計算時間,而且降低了對初值選取的依賴度,但算法都比較復(fù)雜。差分進化(DE)算法利用隨機選擇的不同個體進行差分矢量運算對原始個體進行迭代優(yōu)化,它是優(yōu)化LS-SVM模型參數(shù)的一種合適的方法,它在收斂性和穩(wěn)定性上都比其他算法有優(yōu)勢。隨著差分進化算法迭代的進行,最優(yōu)解容易陷入局部最優(yōu)[8-10]。為了克服差分進化的缺陷,增加種群的規(guī)模是常用手段,該方法沒有從根本上解決早熟收斂的問題,增加種群規(guī)模同時增加算法了的運算時間。為了跳出局部收斂,改善DE算法的性能,本文針對差分進化中的局部最優(yōu)解和交叉概率因子進行了優(yōu)化。
在發(fā)酵過程中,隨著發(fā)酵過程的進行,發(fā)酵參數(shù)隨之改變,單一回歸模型不再適應(yīng)新的工況,因此采用模糊C均值聚類(FCM)將數(shù)據(jù)劃分,再建立多個模型的多模型軟測量建模則顯得更加合理。梅從立等[11]將FCM與高斯過程回歸相結(jié)合,運用在紅霉素的生產(chǎn)發(fā)酵中,取得很好的效果。由于傳統(tǒng)FCM方法會導(dǎo)致某一聚類樣本過多,而另一類過少,從而分類的有效性下降。引入正定核函數(shù),將輸入樣本數(shù)據(jù)映射到高維特征空間,得到基于核的模糊C均值聚類方法解決這一問題[12]。錢曉山等[13]將KFCM和LS-SVM相結(jié)合得出一種多模型軟測量建模方法,運用在蒸發(fā)過程的軟測量中,證明了KFCM對數(shù)據(jù)分類的有效性。陳貴華等[14]將多模型軟測量方法運用在乙烯裂解過程中,證明了多模型方法具有更好的精度和泛化能力。
本文將核模糊C均值聚類算法與AMDE-LSSVM相結(jié)合,提出的方法應(yīng)用于秸稈發(fā)酵生產(chǎn)燃料乙醇過程中關(guān)鍵參量的測量,建立一種多模型(KFCM-AMDE-LSSVM)秸稈發(fā)酵過程軟測量模型,通過實際發(fā)酵工廠進行離線采集的數(shù)據(jù),進行了軟測量仿真實驗。
假設(shè)存在樣本集:X={x1,x2,…,xn},創(chuàng)建聚類c,對于數(shù)據(jù)中與樣本集X相似的為一組;不相似的盡可能不在一組。通過求目標(biāo)函數(shù)的最小值J來對數(shù)據(jù)進行分類[15-16]。
(1)
(2)
其中:c為聚類個數(shù),vj為聚類中心,uij為數(shù)據(jù)xi對第j個聚類中心的隸屬度值,m為加權(quán)數(shù)。
引入非線性映射φ:x→φ(x),特征空間的樣本距離定義為:
‖φ(xi)-φ(xj)‖2=K(xi,xj)+K(vj,vj)-2K(xi,vj)
(3)
其中:K為核函數(shù)。這里討論一種條件正定核:
K(x,y)=-(‖x-y‖2+b2)1/2,b∈R
(4)
令b=1,將正定核引入式(3),可得目標(biāo)函為:
(5)
構(gòu)造拉格朗日函數(shù),分別對v,u求偏導(dǎo),得到的vj和U的更新公式如下:
(6)
1.2.1 最小二乘支持向量機
給定數(shù)據(jù)集{(xi,yi)|i=1,2,3....l},xi∈Rn為n維樣本輸入,yi∈R為樣本輸出。通過對樣本數(shù)據(jù)逼近,函數(shù)擬合問題可以描述為最優(yōu)化問題[17-18]:
(7)
式中,C為懲罰系數(shù),e為允許誤差。引入拉格朗日算子對上式求解,得到
(8)
根據(jù)KKT條件,式(8)的一階導(dǎo)數(shù)為:
(9)
式(9)消去變量w、e,得線性方程組:
(10)
Q=[1,…,1]T,a=[a1,a2,…,al]T,y=[y1,y2,…,yl]T,
K為核函數(shù)矩陣。根據(jù)Mercer條件可以得核函數(shù)為:
K(xi,xj)=φ(xi)Tφ(xj)
(11)
綜上可以得到最終輸出為:
(12)
采用徑向基函數(shù)(RBF):
(13)
其中:σ為徑向基寬度。
1.2.2 差分進化算法
差分進化算法是一種保留最優(yōu)的貪婪算法,它由變異、交叉和選擇操作組成[19-20]。
(14)
其中:F為縮放因子。h1,h2,h3∈(1,2,…,NP)是互不相同且與i不同的隨機數(shù)。
(15)
其中:CR為范圍在[0,1]之間的交叉算子,rand(j)為[0,1]之間的隨機數(shù)。
3)在選擇操作中,按式(16)選擇新的種群個體。
(16)
其中:f(·)為目標(biāo)函數(shù)。
1.2.3 自適應(yīng)變異差分進化
本文選擇DE/best/2/bin策略。個體變異操作的方程為:
(17)
1.2.3.1 自適應(yīng)二次變異思想
定義1 群體適應(yīng)度方差為:
(18)
fi為第i個個體的適應(yīng)度,favg顯示適應(yīng)的程度,式中,f中是歸一化定標(biāo)因子,其作用是限制群體適應(yīng)度方差的大小,具體公式如下:
(19)
(20)
1.2.3.2 時變交叉概率因子CR。
由DE交叉操作可知,在搜索初期需要保持全局搜索能力,從而需要較小的CR,保持種群的多樣性;搜索的后期因已確定最優(yōu)范圍,需要對局部進行精確搜索,從而需要較大的CR以保證搜索后期的搜索速度[9]。基于這種思想,在前期設(shè)定較小交叉概率因子CR,隨著搜索時間的增加而加大交叉概率因子CR。本文時變交叉概率因子CR由下式得到:
(21)
在算法設(shè)定初始交叉概率CRmin和最大交叉概率CRmax
1.2.4 基于AMDE-LSSVM建模
在LS-SVM中,懲罰系數(shù)C和徑向基寬度σ對模型的泛化能力有著很大的影響,因此尋求模型最佳懲罰系數(shù)與徑向基寬度是十分重要的。本文利用AMDE對LS-SVM建模中的參數(shù)進行選擇。
AMDE-LSSVM軟測量建模步驟如下:
2)初始化種群NP、變異算子F、最大迭代次數(shù)Gmax、初始交叉率CRmin、最大交叉概率CRmax、終止閾值、懲罰系數(shù)C和徑向基寬度σ的上、下值。令G=0,根據(jù)C和σ的上、下限產(chǎn)生一組隨機的[C1,σ1]。
5)G=G+1。
6)對[C,σ]進行變異、交叉、選擇操作。產(chǎn)生新的[C,σ],返回步驟3)。
7)得到最優(yōu)懲罰系數(shù)C和徑向基寬度σ作為建模參數(shù),進行軟測量建模。
基于KFCM和AMDE-LSSVM軟測量建模思想在于:利用核模糊C均值聚類算法的有效分類,將采集的樣本數(shù)據(jù)集X分成{Xi|i=1,2,…,c},c個聚類。對每一個Xi分別采用AMDE-LSSVM進行訓(xùn)練,得到每一類的輸出為:
(22)
采用模糊隸屬度來綜合最后的結(jié)果:
(23)
式中uik為第k個樣本對應(yīng)的第i類模糊隸屬度,fi(x)為第i個子模型。
秸稈發(fā)酵關(guān)鍵參量的多模型軟測量建模如圖1,步驟可如下描述:
步驟1:對采集數(shù)據(jù)進行預(yù)處理。
步驟2:將處理后的樣本用核模糊C均值聚類進行劃分為c個不同的子集。
步驟3:對每個聚類的樣本運用AMDE-LSSVM進行建模,得到c個秸稈發(fā)酵關(guān)鍵參量軟測量子模型。
步驟4:求得各個隸屬度,由式(19)得到最終的多模型軟測量輸出。
圖1 建模過程
我國是世界上農(nóng)作物秸稈類資源最多的國家,2015達到10.4億噸,其中20%為二次利用,而剩余大部分以堆積焚燒的方式處理。就地焚燒的處理方法,不僅給環(huán)境帶來極大污染,而且浪費了秸稈類資源的生物質(zhì)能量。通過發(fā)酵的方式得到可保存的氣體或液體燃料,例如酒精、氫氣、柴油等,熱效率提升20%以上[22-23]。這樣不僅解決了污染問題,而且使農(nóng)民得到了創(chuàng)收。近年來,秸稈發(fā)酵制取燃料乙醇規(guī)?;蔀檠芯康臒狳c。乙醇濃度、總糖濃度、菌體濃度是觀察秸稈發(fā)酵過程的重要參數(shù),但是無法通過物理傳感器檢測,制約了自動化水平的提升。因此將本文設(shè)計的多模型軟測量方法用于秸稈發(fā)酵的關(guān)鍵參量的測量中。
在建立秸稈發(fā)酵關(guān)鍵參量軟測量之前,必須對發(fā)酵機理進行分析,選取合適的輔助變量。秸稈發(fā)酵過程如圖2所示。根據(jù)課題組已有的成果選取:溶解氧、發(fā)酵液酸堿度、電機攪拌速度、空氣流量作為輔助變量。按照工藝要求,過程中罐溫控制在36 ℃±1 ℃,攪拌機轉(zhuǎn)速控制在120~180 r/min,通氣量為0.2 L/min,發(fā)酵罐壓控制在0.2 MPa±0.01 MPa。每隔1 h取樣并離線采集化驗乙醇濃度、總糖含量、菌體濃度??偣膊杉?0批數(shù)據(jù),其中前9批數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),另外1批數(shù)據(jù)作為測試數(shù)據(jù)。軟測量模型建立完畢后,利用C語言編程實現(xiàn),并嵌入到計算機中,當(dāng)待預(yù)測罐批的輸入向量,經(jīng)測量儀表讀入計算機后,利用軟測量程序計算得到關(guān)鍵狀態(tài)變量的預(yù)測值,并將預(yù)測結(jié)果經(jīng)數(shù)據(jù)通道傳送到計算機上顯示,供操作人員進行觀察和控制發(fā)酵過程。
圖2 秸稈發(fā)酵過程
設(shè)定分類個數(shù)c=3,加權(quán)數(shù)m=2,求出不同類相應(yīng)的聚類中心v和隸屬度矩陣U。應(yīng)用AMDE-LSSVM建立3個子模型。模型1的懲罰系數(shù)C=101.56,徑向基寬度σ=5.65;模型2的懲罰系數(shù)C=45.88,徑向基寬度σ=18.467;模型3的懲罰系數(shù)C=78.19,徑向基寬度σ=2.678。多模型輸出采用隸屬度加權(quán)策略。表1為幾種優(yōu)化算法對比,表中的數(shù)據(jù)可見,AMDE算法在選擇LS-SVM的核參數(shù)優(yōu)于交叉驗證和傳統(tǒng)DE算法,證明了AMDE算法的全局尋優(yōu)能力。對比3種尋優(yōu)方法的運行時間,AMDE和DE算法明顯要優(yōu)于交叉驗證的方法。由于AMDE在結(jié)構(gòu)上引入了時變的交叉概率因子,在算法搜索期間有不同的交叉概率因子,前期提高全局搜索能力后期提高局部搜索能力,從而加快了搜索時間。對于不同結(jié)果的標(biāo)準差分析可以發(fā)現(xiàn),AMDE的標(biāo)準差最低,反映出設(shè)計的自適應(yīng)二次變異思想有效地跳出傳統(tǒng)DE算法的早熟收斂。
基于KFCM和AMDE-LSSVM軟測量仿真結(jié)果如圖5所示,圖中顯示了離線化驗值、多模型軟測量預(yù)測值和DE-LSSVM軟測量預(yù)測值。從圖中可以明顯看出,DE-LSSVM軟測量方法預(yù)測值雖然在趨勢上接近離線化驗值,但是在發(fā)酵前期和后期有很大的誤差,這是因為在發(fā)酵秸稈發(fā)酵各個時期所表現(xiàn)的發(fā)酵最適條件不同,導(dǎo)致單一的模型失效。多模型軟測量方法預(yù)測值在發(fā)酵各個階段都表現(xiàn)出了良好的擬合精度,誤差更小,這是因為多模型方法是對秸稈發(fā)酵過程進行劃分得到多個模型,使得預(yù)測模型更加精確。發(fā)酵實際值與軟測量值的誤差如圖6所示,該圖進一步顯示了優(yōu)化后的多模型軟測量方法在秸稈發(fā)酵關(guān)鍵參量的預(yù)測中表現(xiàn)更好。
表1 優(yōu)化方法對比
圖5 軟測量結(jié)果比較圖
圖6 相對誤差比較曲線
表2和表3是幾種不同算法下的性能比較。與BP、SVM、DE-LSSVM相比,改進后的多模型軟測量方法在乙醇濃度、總糖含量、菌體濃度的預(yù)測上標(biāo)準誤差分別只有0.64%、1.85%、0.75%,與其他單一預(yù)測方法有了明顯的提高,并且訓(xùn)練時間大幅度降低。詳細分析表2和表3中的DE-LSSVM建模和多模型建模,可以看出單一LS-SVM建模需要10.7 s,而本研究中建立3個子LS-SVM模型得到多模型雖然在時間上稍稍多于單個LS-SVM建模,但是在測量精度上要遠遠由于DE-LSSVM建模,可以滿足實際秸稈發(fā)酵過程關(guān)鍵參數(shù)測量的需要。
表2 不同算法的性能比較 %
表3 不同算法的訓(xùn)練速度
針對發(fā)酵過程的復(fù)雜性、時變性,本文提出了發(fā)酵關(guān)鍵參量的多模型軟測量建模,運用KFCM將數(shù)據(jù)劃分為三類,分別建立LS-SVM模型,對于LS-SVM建立軟測量模型的不精確和常規(guī)交叉方法對選擇LS-SVM建模中懲罰系數(shù)C和徑向基寬度σ的盲目性和耗時性問題,本文引入DE算法對LS-SVM的參數(shù)進行尋優(yōu);同時針對DE算法存在易陷入局部最優(yōu)和早熟收斂問題,提出一種自適應(yīng)變異差分進化(AMDE)算法,該方法采用自適應(yīng)變異操作和時變交叉概率因子對DE算法進行改進優(yōu)化。通過仿真實驗顯示可以得到合適的懲罰系數(shù)C和徑向基寬度σ,并且提高了訓(xùn)練的速度,最終得到的預(yù)測值的準確率有了明顯的提高。然而,本文算法的一個局限性就是使用的傳統(tǒng)KFCM算法對初始聚類中心初始值的設(shè)定的過分依賴性,通常的聚類算法往往對于不同的初始聚類中心會得到不同的聚類結(jié)果;二是需要預(yù)先設(shè)定聚類數(shù)目,這增加了算法的不確定性。因此下一步的研究方向可以針對這兩個問題進行開展。