孫麗娜, 鄧玲黎, 劉 駿, 黃永紅
(1.蘇州工業(yè)園區(qū)職業(yè)技術(shù)學(xué)院 機(jī)電工程系,江蘇 蘇州 215123;2.江蘇大學(xué) 電氣信息工程學(xué)院,江蘇 鎮(zhèn)江 212013)
海洋生物酶發(fā)酵過程具有非線性和時(shí)變性的特點(diǎn),由于受市場(chǎng)上檢測(cè)裝備和技術(shù)的束縛,其發(fā)酵過程的關(guān)鍵生物參數(shù),如基質(zhì)濃度、菌體濃度、產(chǎn)物濃度很難及時(shí)在線測(cè)量,致使對(duì)整個(gè)發(fā)酵過程進(jìn)行優(yōu)化控制變得十分艱難,解決上述問題的有效途徑之一是軟測(cè)量技術(shù)[1~6]。
在軟測(cè)量建模中,大多采用靜態(tài)前饋神經(jīng)網(wǎng)絡(luò),如反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)[7,8]。由于海洋生物酶發(fā)酵過程具有高度時(shí)變性、非線性,若用靜態(tài)前饋神經(jīng)網(wǎng)絡(luò)對(duì)一個(gè)動(dòng)態(tài)的發(fā)酵過程進(jìn)行辨識(shí),就將動(dòng)態(tài)建模問題轉(zhuǎn)換為靜態(tài)建模,使得預(yù)測(cè)精度較差。Elman神經(jīng)網(wǎng)絡(luò)可使系統(tǒng)具有順應(yīng)時(shí)變特性的能力,能夠直接動(dòng)態(tài)反映動(dòng)態(tài)過程系統(tǒng)的特性[9,10]。另外,在軟測(cè)量建模過程中,輔助變量的選擇也是非常重要的,若將一些不重要的自變量引入神經(jīng)網(wǎng)絡(luò),會(huì)使模型的精度降低。平均影響值(mean impact value,MIV)認(rèn)為是在神經(jīng)網(wǎng)絡(luò)中評(píng)價(jià)變量相關(guān)性最好的指標(biāo)之一[11,12],為此,本文提出一種基于MIV-Elman神經(jīng)網(wǎng)絡(luò)的軟測(cè)量建模方法,即結(jié)合Elman神經(jīng)網(wǎng)絡(luò)應(yīng)用MIV方法進(jìn)行變量篩選,找到對(duì)主導(dǎo)變量有較大影響的輸入項(xiàng)作為Elman神經(jīng)網(wǎng)絡(luò)的輸入,關(guān)鍵生物參數(shù)作為Elman神經(jīng)網(wǎng)絡(luò)的輸出,建立了MIV-Elman神經(jīng)網(wǎng)絡(luò)軟測(cè)量模型。結(jié)果表明構(gòu)建的軟測(cè)量模型結(jié)構(gòu)簡(jiǎn)單,建模精度高,實(shí)用性好。
Elman神經(jīng)網(wǎng)絡(luò)的輸入層、隱含層(中間層)和輸出層的連接和前饋網(wǎng)絡(luò)基本一致,承接層用來記憶隱含層單元前一時(shí)刻的輸出值并返回給網(wǎng)絡(luò)的輸入,其結(jié)構(gòu)如圖1所示。
圖1 Elman神經(jīng)網(wǎng)絡(luò)模型
對(duì)n維自變量X,進(jìn)行m次觀測(cè),得到向量空間X=(x1,x2,…,xm)T,與每個(gè)樣本點(diǎn)所對(duì)應(yīng)的因變量可以寫為Y=(y1,y2,…,ym)T。以X作為Elman神經(jīng)網(wǎng)絡(luò)的輸入,Y作為Elman神經(jīng)網(wǎng)絡(luò)的輸出,進(jìn)行網(wǎng)絡(luò)學(xué)習(xí),保存訓(xùn)練好的網(wǎng)絡(luò)參數(shù)。將X進(jìn)行如下變換,得到具有2i(i=1,2,…,n)個(gè)元素的向量空間
(1)
重新將式(1)作為訓(xùn)練好的Elman神經(jīng)網(wǎng)絡(luò)的輸入,其輸出為樣本點(diǎn)中第i(i=1,2,…,n)個(gè)變量指標(biāo)變化時(shí)與之對(duì)應(yīng)的2n個(gè)輸出向量
(2)
(3)
(4)
式中MIVi為變化樣本中第i變量指標(biāo)對(duì)輸出結(jié)果的平均影響值,i=1,2,…,n,其符號(hào)代表自變量與因變量相關(guān)的方向,絕對(duì)值大小代表自變量對(duì)因變量影響的相對(duì)重要性。
以典型的海洋生物酶—海洋蛋白酶為例,選擇菌體濃度X、基質(zhì)濃度S、相對(duì)酶活P作為軟測(cè)量模型的主導(dǎo)變量,即Elman神經(jīng)網(wǎng)絡(luò)的輸出。通過剖析發(fā)酵過程中菌體細(xì)胞生長(zhǎng)代謝的進(jìn)化過程,考慮將空氣流量l,溫度t,攪拌轉(zhuǎn)速r,pH值,發(fā)酵罐壓力p,溶解氧濃度Do,反應(yīng)器體積v,基質(zhì)進(jìn)給速率u,CO2濃度作為軟測(cè)量模型的最初輔助變量,即Elman神經(jīng)網(wǎng)絡(luò)的輸入。
表1 輸入變量的MIV計(jì)算結(jié)果
由表1可知,各個(gè)輸入變量對(duì)輸出變量的影響權(quán)重不一致。l,t,r,pH值,v對(duì)基質(zhì)濃度影響很大,其中l(wèi),r,v與基質(zhì)濃度呈負(fù)相關(guān)。l,r,pH值,Do濃度,v對(duì)菌體濃度和相對(duì)酶活的影響很大,l,Do濃度與菌體濃度和相對(duì)酶活呈負(fù)相關(guān)。其余輸入變量相對(duì)于以上變量的權(quán)重值而言顯得非常小,幾乎可以忽略不計(jì)。
綜合以上篩選結(jié)果,結(jié)合海洋蛋白酶發(fā)酵過程的機(jī)理分析,確定以l,r,pH值,Do濃度,v作為軟測(cè)量模型最終的輔助變量,即Elman神經(jīng)網(wǎng)絡(luò)的輸入;菌體濃度X、基質(zhì)濃度S、相對(duì)酶活P作為軟測(cè)量模型的主導(dǎo)變量,即Elman神經(jīng)網(wǎng)絡(luò)的輸出。由于采集到的樣本數(shù)據(jù)變化范圍較大,需要利用premnmx()函數(shù)對(duì)樣本數(shù)據(jù)進(jìn)行[-1,1]歸一化處理。在MATLAB環(huán)境下,用newelm()函數(shù)建立網(wǎng)絡(luò),主要參數(shù)設(shè)置:隱含層神經(jīng)元傳遞函數(shù)設(shè)置為S型正切函數(shù)tansig,輸出層神經(jīng)元傳遞函數(shù)設(shè)置為線性函數(shù)purelin,網(wǎng)絡(luò)的訓(xùn)練函數(shù)采用貝葉斯正則化算法trainbr[13]。設(shè)置最大訓(xùn)練次數(shù)為1 000,訓(xùn)練誤差為0.000 1。通過結(jié)合隱含層節(jié)點(diǎn)選擇的原則以及試驗(yàn)湊試法,尋找最佳隱含層節(jié)點(diǎn)數(shù),最終確定隱含層節(jié)點(diǎn)數(shù)為20,即網(wǎng)絡(luò)結(jié)構(gòu)為5—20—3。
為了檢驗(yàn)本文所提出的MIV-Elman神經(jīng)網(wǎng)絡(luò)軟測(cè)量模型的有效性,用第10個(gè)批次的數(shù)據(jù)作為測(cè)試樣本集對(duì)軟測(cè)量模型進(jìn)行驗(yàn)證。并與Elman神經(jīng)網(wǎng)絡(luò)(網(wǎng)絡(luò)輸入變量為表1中的9個(gè)變量,隱含層節(jié)點(diǎn)數(shù)為16,輸出層節(jié)點(diǎn)數(shù)為3,其余參數(shù)設(shè)置與MIV-Elman神經(jīng)網(wǎng)絡(luò)相同),RBF神經(jīng)網(wǎng)絡(luò)(輸入輸出變量與Elman神經(jīng)網(wǎng)絡(luò)相同,網(wǎng)絡(luò)設(shè)計(jì)函數(shù)為newrb(),均方誤差目標(biāo)設(shè)置為0.000 1,徑向基函數(shù)的擴(kuò)展常數(shù)設(shè)置為0.7),BP神經(jīng)網(wǎng)絡(luò)(輸入輸出變量與Elman神經(jīng)網(wǎng)絡(luò)相同,網(wǎng)絡(luò)構(gòu)建函數(shù)為newff(),隱含層節(jié)點(diǎn)數(shù)為20,網(wǎng)絡(luò)訓(xùn)練函數(shù)采用Levenberg_Marquardt算法trainlm,隱含層與輸出層神經(jīng)元傳遞函數(shù)與MIV-Elman神經(jīng)網(wǎng)絡(luò)相同)進(jìn)行了對(duì)比。
從圖2中可以看出,MIV-Elman神經(jīng)網(wǎng)絡(luò)的軟測(cè)量值能很好的逼近基質(zhì)濃度S、菌體濃度X、相對(duì)酶活P的真實(shí)值(離線化驗(yàn)值),曲線基本重合,這說明MIV-Elman神經(jīng)網(wǎng)絡(luò)軟測(cè)量模型有很好的逼近非線性函數(shù)的能力,具有很高的預(yù)測(cè)精度,明顯滿足海洋生物酶發(fā)酵過程中關(guān)鍵生物參數(shù)的測(cè)量要求。
圖2 軟測(cè)量值和離線化驗(yàn)值比較
表2中采用平均絕對(duì)誤差(mean absolute deviation,MAD)和均方根誤差(root mean square error,RMSE)這兩個(gè)預(yù)測(cè)性能的評(píng)價(jià)指標(biāo)來反映模型的預(yù)測(cè)效果。
表2 預(yù)測(cè)誤差
從表2中可以看出,對(duì)于基質(zhì)濃度、菌體濃度來說,MIV-Elman神經(jīng)網(wǎng)絡(luò)軟測(cè)量模型的MAD和RMSE比Elman神經(jīng)網(wǎng)絡(luò)的小,對(duì)于相對(duì)酶活而言,雖然MIV-Elman神經(jīng)網(wǎng)絡(luò)軟測(cè)量模型的RMSE和Elman神經(jīng)網(wǎng)絡(luò)的相差不大,但MIV-Elman神經(jīng)網(wǎng)絡(luò)軟測(cè)量模型的MAD比Elman神經(jīng)網(wǎng)絡(luò)的小,這驗(yàn)證了MIV-Elman神經(jīng)網(wǎng)絡(luò)變量篩選的有效性。
圖3~圖5可以看出,MIV-Elman神經(jīng)網(wǎng)絡(luò)和Elman神經(jīng)網(wǎng)絡(luò)軟測(cè)量模型的預(yù)測(cè)誤差比RBF神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)小的多,這說明由于Elman動(dòng)態(tài)回歸神經(jīng)網(wǎng)絡(luò)能直接動(dòng)態(tài)反映動(dòng)態(tài)過程系統(tǒng)的特性,具有適應(yīng)時(shí)變特性的能力,使得Elman神經(jīng)網(wǎng)絡(luò)比靜態(tài)前饋神經(jīng)網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò))更能適用于海洋生物酶發(fā)酵過程關(guān)鍵生物參數(shù)的軟測(cè)量建模。
圖3 菌體濃度預(yù)測(cè)誤差
圖4 基質(zhì)濃度預(yù)測(cè)誤差
圖5 相對(duì)酶活預(yù)測(cè)誤差
本文將MIV和Elman神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出一種基于MIV的Elman神經(jīng)網(wǎng)絡(luò)軟測(cè)量建模方法,并應(yīng)用于海洋生物酶發(fā)酵過程中。用預(yù)測(cè)樣本進(jìn)行了仿真驗(yàn)證,并與Elman神經(jīng)網(wǎng)絡(luò),RBF神經(jīng)網(wǎng)絡(luò),BP神經(jīng)網(wǎng)絡(luò)進(jìn)行了比較,結(jié)果表明,MIV-Elman神經(jīng)網(wǎng)絡(luò)建模方法可以很好地篩選出對(duì)網(wǎng)絡(luò)作用顯著的變量,具有適應(yīng)時(shí)變特性的能力和令人滿意的預(yù)測(cè)效果。