范慶麗,秦國(guó)輝,章 力
(1.黑龍江省科學(xué)院技術(shù)物理研究所,哈爾濱 150086;2.黑龍江省科學(xué)院科技孵化中心,哈爾濱 150090;3.黑龍江省科學(xué)院,哈爾濱 150001)
大型沼氣工程日漸成為利用厭氧發(fā)酵技術(shù)開(kāi)發(fā)綠色生物質(zhì)能源的熱點(diǎn)和重點(diǎn),是消除畜禽養(yǎng)殖廢棄物污染的重要手段之一,其經(jīng)濟(jì)環(huán)境效益顯著。然而,目前尚無(wú)精確的在線測(cè)量手段來(lái)測(cè)量發(fā)酵過(guò)程中關(guān)鍵生物參量,直接影響發(fā)酵過(guò)程控制和優(yōu)化水平的提高,制約了沼氣工程的發(fā)展。因此,通過(guò)發(fā)酵過(guò)程建模,對(duì)不可在線測(cè)量的參量進(jìn)行測(cè)量就顯得非常重要。
發(fā)酵過(guò)程是一個(gè)大滯后、不確定的多變量輸入輸出關(guān)聯(lián)系統(tǒng),涉及生命體的生長(zhǎng)繁殖過(guò)程,機(jī)理十分復(fù)雜,具有高度的非線性和時(shí)變性,很難建立以過(guò)程動(dòng)力學(xué)為基礎(chǔ)的準(zhǔn)確機(jī)理模型,且未知原因的擾動(dòng)對(duì)生化系統(tǒng)也有很大影響[1]。而使用較多的數(shù)據(jù)驅(qū)動(dòng)模型,過(guò)分依賴樣本的數(shù)量和質(zhì)量,所建模型適應(yīng)性差,且物理意義無(wú)法解釋[2]。針對(duì)上述問(wèn)題,筆者從多尺度考慮建模問(wèn)題,在減少系統(tǒng)噪聲和未建模誤差的干擾基礎(chǔ)上,從先驗(yàn)知識(shí)和過(guò)程機(jī)理分析、統(tǒng)計(jì)學(xué)習(xí)等尺度上來(lái)建立新的測(cè)量混合模型,并著重研究了該混合模型在牛糞高溫厭氧發(fā)酵過(guò)程在線監(jiān)測(cè)中的應(yīng)用。
依據(jù)牛糞發(fā)酵過(guò)程的時(shí)變動(dòng)態(tài)行為,建立描述牛糞發(fā)酵過(guò)程的動(dòng)力學(xué)模型,根據(jù)文獻(xiàn)[3-4]得到如下牛糞厭氧發(fā)酵過(guò)程動(dòng)力學(xué)模型:
1 )菌體生長(zhǎng)動(dòng)力學(xué)模型
2 )產(chǎn)物形成動(dòng)力學(xué)模型
3 )基質(zhì)消耗動(dòng)力學(xué)模型
式中:X、P、S分別為菌體質(zhì)量濃度(g/L)、產(chǎn)物質(zhì)量濃度(g/L)、基質(zhì)質(zhì)量濃度(g/L);μmax為菌體生長(zhǎng)最大比生長(zhǎng)速率(h-1);Xmax為最大菌體質(zhì)量濃度(g/L);μmax和Xmax反映菌體生長(zhǎng)速率和菌體質(zhì)量濃度的關(guān)系;k1與k2分別為菌體生長(zhǎng)速率、產(chǎn)酸速率與基質(zhì)質(zhì)量濃度變化速率關(guān)系參數(shù);k3為總酶活力,其值越大,總酶活性越強(qiáng),有利于谷氨酸生長(zhǎng);k4為菌體活力系數(shù),直接影響長(zhǎng)菌速度和發(fā)酵周期。
采用牛糞發(fā)酵機(jī)理模型對(duì)發(fā)酵過(guò)程狀態(tài)預(yù)估存在偏差E(實(shí)測(cè)值與采用動(dòng)力學(xué)模型輸出值之差)。偏差產(chǎn)生原因較為復(fù)雜,不好把握,所以模型不能實(shí)時(shí)適應(yīng)以及把握環(huán)境因子、發(fā)酵條件、發(fā)酵批次等出現(xiàn)的變化和漂移。即由于發(fā)酵過(guò)程的時(shí)變特性,模型的通用能力有限,不利于實(shí)現(xiàn)實(shí)時(shí)控制。
支持向量機(jī)是從線性可分情況下的最優(yōu)分類面發(fā)展而來(lái)的,基本思想可用圖1的兩維情況說(shuō)明。在圖1中,實(shí)心點(diǎn)和空心點(diǎn)代表兩類樣本,H為分類線,H1、H2分別為過(guò)各類中離分類線最近的樣本且平行于分類線的直線,它們之間的距離叫作分類間隔(margin)。最優(yōu)分類線就是要求分類線不但能將兩類正確分開(kāi)(訓(xùn)練錯(cuò)誤率為0),而且使分類間隔最大。分類線方程為wc·x+b=0,可以對(duì)它進(jìn)行歸一化,使得對(duì)線性可分的樣本集(xi,yi),i=1,…,n,x∈{+1,-1},滿足
此時(shí)分類間隔等于2/‖wc‖,使間隔最大等價(jià)于使最小。滿足條件式(4)且使最小的分類面就叫作最優(yōu)分類面,H1、H2上的訓(xùn)練樣本點(diǎn)就稱作支持向量。
圖1 線性可分情況下的最優(yōu)分類線Fig.1 Optimum classification line when linearly separable
應(yīng)用該技術(shù),巧妙解決了算法復(fù)雜度與輸入向量維數(shù)密切相關(guān)的問(wèn)題。支持向量機(jī)算法采用了等式約束,并將求解優(yōu)化問(wèn)題轉(zhuǎn)化為求解線性方程,這大大減少了算法的復(fù)雜度,然而該計(jì)算效果嚴(yán)重依賴于懲罰參數(shù)γ,γ為一常數(shù),無(wú)論誤差大小,它對(duì)超出誤差樣本的懲罰程度是不變的。由于對(duì)超出誤差的極端樣本(較大或較小的樣本)的懲罰力度較弱,致使訓(xùn)練精度和推廣能力的改善欠佳[5]。為了解決此問(wèn)題,引入峰值識(shí)別,以峰值識(shí)別系數(shù)vi對(duì)誤差進(jìn)行分析,有效地解決了較大或較小樣本懲罰力度弱的問(wèn)題,得到了非線性回歸函數(shù)的解為:
支持向量機(jī)(SVM)是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的統(tǒng)計(jì)學(xué)習(xí)方法,能夠避免人工神經(jīng)網(wǎng)絡(luò)方法的過(guò)擬合、容易陷入局部極小等缺陷[6]。由于支持向量機(jī)不但較好地解決了以往困擾很多學(xué)習(xí)方法的小樣本、過(guò)學(xué)習(xí)、高維數(shù)、局部最優(yōu)等實(shí)際難題,而且具有很強(qiáng)的泛化能力,因此,支持向量機(jī)在函數(shù)估計(jì)和軟測(cè)量建模方面逐步得到應(yīng)用。支持向量機(jī)是一種新的機(jī)器學(xué)習(xí)算法,該方法由于采用了結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,與傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,在最小化學(xué)習(xí)誤差的同時(shí)可以保證具有較小的泛化誤差。因此,對(duì)發(fā)酵過(guò)程中無(wú)法直接建立機(jī)理模型的部分即辨識(shí)建模部分,采用支持向量機(jī)理論,研究基于支持向量機(jī)的建模方法,實(shí)現(xiàn)基于SVM的測(cè)量補(bǔ)充方程的建立。
SVM模型雖已有較高的擬合精度,但建模中未使用已知的機(jī)理知識(shí),且訓(xùn)練樣本有限,難以全面反映發(fā)酵過(guò)程中質(zhì)量和能量的平衡關(guān)系,這些都將影響所建模型的泛化能力??紤]到動(dòng)力學(xué)模型在表達(dá)過(guò)程機(jī)理方面的優(yōu)勢(shì)和SVM較強(qiáng)的推廣能力,筆者擬將改進(jìn)支持向量機(jī)模型與典型的發(fā)酵動(dòng)力學(xué)模型相結(jié)合,將SVM和動(dòng)力學(xué)模型取長(zhǎng)補(bǔ)短,構(gòu)建混合支持向量機(jī)模型,以提高模型的精度和其推廣能力。
動(dòng)力學(xué)方程式反映了過(guò)程的變量變化關(guān)系,由此可求得離散解式(6)。
當(dāng)μ確定后,即可由X(t)算出X(t+△t)。從機(jī)理出發(fā),可計(jì)算μ,該式認(rèn)為底物將通過(guò)滲透酶在細(xì)胞內(nèi)外進(jìn)行傳遞,但實(shí)際情況是底物在細(xì)胞內(nèi)外的傳遞方式可以有多種形式,因此假設(shè)與實(shí)際不盡一致,而參數(shù)μmax需由觀測(cè)數(shù)據(jù)回歸估算。筆者采用改進(jìn)支持向量機(jī)方式估算,再由式(5)預(yù)測(cè)X(t+△t),構(gòu)建混合支持向量機(jī)模型,如圖2所示。混合支持向量機(jī)模型既考慮了SVM對(duì)μ的估計(jì),也考慮到μ的動(dòng)力學(xué)模型的作用,是用SVM來(lái)彌補(bǔ)單一的動(dòng)力學(xué)模型對(duì)μ不能有效估計(jì)。
圖2 混合支持向量機(jī)模型Fig.2 The hybrid support vector machine model
根據(jù)上述知識(shí),建立發(fā)酵過(guò)程混合模型,包括2個(gè)狀態(tài)變量:分別為菌體質(zhì)量濃度(X)、產(chǎn)物質(zhì)量濃度(P)。該發(fā)酵過(guò)程混合模型由下面的狀態(tài)方程和測(cè)量方程兩部分組成。
狀態(tài)方程:
由式(7)和式(8)建立起了基于支持向量機(jī)的混合模型。
測(cè)量方程:
為了驗(yàn)證所提出的發(fā)酵過(guò)程混合測(cè)量模型的正確性和有效性,首先通過(guò)MATLAB軟件建立其發(fā)酵仿真機(jī)理模型,然后用仿真模型所得到的過(guò)程狀態(tài)數(shù)據(jù)作為訓(xùn)練樣本,分別求得菌體質(zhì)量濃度估計(jì)值?;旌夏P偷玫降慕Y(jié)果和仿真模型的結(jié)果對(duì)比見(jiàn)圖3?;旌夏P椭袪顟B(tài)與仿真模型相比的誤差為0.0968。
圖3 發(fā)酵混合模型與仿真模型結(jié)果對(duì)比Fig.3 Comparison of hybrid model values with simulator values
從圖3和誤差結(jié)果可以看出所建立的混合模型能夠很好地和仿真模型的數(shù)據(jù)相吻合,這說(shuō)明所建立的混合模型能夠表達(dá)復(fù)雜機(jī)理模型的幾乎全部特性。混合模型不但具有適應(yīng)性,而且能在線跟蹤加入系統(tǒng)噪聲后狀態(tài)的變化,對(duì)發(fā)酵過(guò)程混合模型的結(jié)果進(jìn)行在線修正,得到準(zhǔn)確的過(guò)程狀態(tài)估計(jì)值。
采用Visual C++6.0和Matlab7軟件,依據(jù)筆者提出的混合模型建立方法,設(shè)計(jì)混合預(yù)測(cè)模塊,該模塊主要實(shí)現(xiàn)的功能有:①能夠進(jìn)行現(xiàn)場(chǎng)數(shù)據(jù)的采集;②分析和選取數(shù)據(jù),確定數(shù)據(jù)的有效性;③建立測(cè)量混合模型;④在線軟件利用模型得到輸出;⑤利用先前的數(shù)據(jù)不斷校正模型。其結(jié)構(gòu)框圖如圖4所示,由于以模塊的形式開(kāi)發(fā)因此其他軟件可方便地調(diào)用此模塊進(jìn)行預(yù)估。
圖4 測(cè)量模塊結(jié)構(gòu)圖Fig.4 Structure of sensor model
數(shù)據(jù)來(lái)自杜爾伯特沼氣發(fā)電系統(tǒng)提供的牛糞高溫厭氧發(fā)酵過(guò)程數(shù)據(jù),通過(guò)調(diào)用混合預(yù)測(cè)模塊,獲得了菌體質(zhì)量濃度、基質(zhì)質(zhì)量濃度的估計(jì)結(jié)果,如圖5、圖6所示。從圖中可以看到混合模型能較好地描述發(fā)酵過(guò)程中狀態(tài)變量的變化趨勢(shì)。
圖5 菌體質(zhì)量濃度估計(jì)Fig.5 Cell concentration estimates
圖6 基質(zhì)質(zhì)量濃度估計(jì)Fig.6 Substrate concentration estimates
為了驗(yàn)證混合模型具有更好的估計(jì)性能,筆者利用同樣的數(shù)據(jù)建立單純的動(dòng)力學(xué)模型估計(jì),并與混合模型比較進(jìn)行,具體結(jié)果見(jiàn)表1。
表1 兩種建模方法預(yù)測(cè)效果比較Tab.1 Prediction effect of two kinds of modeling
牛糞發(fā)酵過(guò)程是一個(gè)復(fù)雜的生化工程,建立其精確模型對(duì)生化過(guò)程的優(yōu)化控制具有十分重要的作用。單純運(yùn)用一種方法建模難以取得較好的效果,因此采用混合建模的方法,結(jié)合兩類建模方法的各自優(yōu)勢(shì)。基于此筆者提出了一種新的混合建模方法,以機(jī)理模型為基礎(chǔ),通過(guò)支持向量機(jī)來(lái)描述系統(tǒng)未知因素的影響。從應(yīng)用的結(jié)果看,此方法對(duì)于牛糞發(fā)酵過(guò)程監(jiān)測(cè)取得了較好的效果,證明了方法的有效性,因此可以將此方法進(jìn)行推廣,應(yīng)用到其他的生化反應(yīng)過(guò)程中。
[1]李曉紅.微生物發(fā)酵非線性系統(tǒng)的穩(wěn)定性與最優(yōu)控制[D].大連理工大學(xué),2005.
[2]張智煥.復(fù)雜系統(tǒng)預(yù)測(cè)控制算法及其應(yīng)用研究[D].浙江大學(xué),2002.
[3]王建林,于濤.發(fā)酵過(guò)程生物量軟測(cè)量技術(shù)的研究進(jìn)展[J].現(xiàn)代化工,2005,25(6):22-25.
[4]XIONG ZH,ZHANG J.Neural network model based on-line re-optimization control of fed-hatch processes using a modified iterative dynamic programming algorithm[J].Chemical Engineering and Processing,2005,44(4):477-484.
[5]HAMRITA T.K AND WANG S.Patten recognition for modeling and online diagnosis of bioprocesses,IEEE Trails,On Industry Applications,2000,36(5),1295-1299.
[6]劉國(guó)海,周大為,徐海霞,等.基于SVM的微生物發(fā)酵過(guò)程軟測(cè)量建模研究[J].儀器儀表學(xué)報(bào),2009,30(6):1228-1232.