鄭蓉建,潘豐
?
基于PLS-LSSVM的谷氨酸發(fā)酵產(chǎn)物濃度預(yù)測(cè)建模
鄭蓉建1,2,潘豐1
(1江南大學(xué)輕工過程先進(jìn)控制教育部重點(diǎn)實(shí)驗(yàn)室,江蘇無錫 214122;2淮陰工學(xué)院自動(dòng)化學(xué)院,江蘇淮安 223003)
針對(duì)谷氨酸發(fā)酵過程關(guān)鍵生化參數(shù)難以在線檢測(cè)給發(fā)酵優(yōu)化控制帶來困難問題,基于谷氨酸5 L發(fā)酵罐發(fā)酵過程,建立基于偏最小二乘(PLS)和最小二乘向量機(jī)(LSSVM)相結(jié)合的谷氨酸濃度預(yù)測(cè)模型;利用PLS對(duì)輸入變量進(jìn)行特征提取降低維數(shù)和消除相關(guān)性,以簡(jiǎn)化模型和提高模型精度。為確定谷氨酸發(fā)酵最佳預(yù)測(cè)模型,簡(jiǎn)化后的預(yù)測(cè)模型與發(fā)酵動(dòng)力學(xué)模型進(jìn)行比較;實(shí)驗(yàn)結(jié)果表明,簡(jiǎn)化后的耦合模擬退火(coupled simulated annealing, CSA)對(duì)參數(shù)進(jìn)行優(yōu)化的LSSVM模型具有最好預(yù)測(cè)性能,相對(duì)PLS預(yù)測(cè)模型和發(fā)酵動(dòng)力學(xué)模型具有明顯優(yōu)勢(shì),均方根誤差分別為1.597、8.49和2.934,可以為谷氨酸發(fā)酵過程操作及時(shí)調(diào)整及優(yōu)化控制提供有效指導(dǎo)。
谷氨酸;發(fā)酵;預(yù)測(cè);偏最小二乘;最小二乘向量機(jī);反應(yīng)動(dòng)力學(xué);模型簡(jiǎn)化
谷氨酸已在食品、藥品和其他工業(yè)中廣泛使用,也是調(diào)味品工業(yè),特別是味精工業(yè)的主體,發(fā)酵產(chǎn)品每年超過220萬噸,是世界上產(chǎn)量最大的氨基酸,主要通過發(fā)酵生產(chǎn)[1-2]。谷氨酸發(fā)酵過程是一個(gè)復(fù)雜的高度非線性時(shí)變過程,滯后性和不確定性都較為嚴(yán)重,谷氨酸濃度、基質(zhì)濃度和菌體濃度等發(fā)酵過程關(guān)鍵生化參數(shù),由于生物傳感器實(shí)時(shí)在線測(cè)量成本和可靠性等方面原因,實(shí)踐中一直沒有很好地解決在線測(cè)量問題[3],只能離線化驗(yàn)分析且時(shí)間滯后較長(zhǎng),不能實(shí)時(shí)指導(dǎo)發(fā)酵過程。鑒于發(fā)酵過程的特點(diǎn),很難建立精確的機(jī)理模型及時(shí)反映實(shí)際生化過程的變化,通過時(shí)間、pH、溶氧等在線可測(cè)輔助變量來估計(jì)關(guān)鍵生化參數(shù)的軟測(cè)量方法是解決過程主導(dǎo)變量難以測(cè)量的有效手段[4-5],軟測(cè)量方法已經(jīng)成功應(yīng)用于化學(xué)、生物、制藥過程等領(lǐng)域[6]。
發(fā)酵過程建模是發(fā)酵過程控制和優(yōu)化的基礎(chǔ)和前提,目前發(fā)酵過程建模主要有:發(fā)酵動(dòng)力學(xué)模型、代謝網(wǎng)絡(luò)模型、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)等。發(fā)酵動(dòng)力學(xué)模型對(duì)發(fā)酵過程本質(zhì)把握較好,比較常用,但不能適應(yīng)發(fā)酵環(huán)境條件等變化。代謝網(wǎng)絡(luò)模型對(duì)發(fā)酵本質(zhì)把握好,但建模比較困難。人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等計(jì)算智能方法對(duì)發(fā)酵過程特征把握較好,較常用。文獻(xiàn)[7]用RBF神經(jīng)網(wǎng)絡(luò)建立軟測(cè)量模型來預(yù)測(cè)海洋蛋白酶發(fā)酵過程生物參數(shù);文獻(xiàn)[8]通過多神經(jīng)網(wǎng)絡(luò)的貝葉斯組合分別超前4 h和8 h預(yù)報(bào)2-KGA發(fā)酵濃度;但神經(jīng)網(wǎng)絡(luò)易陷入局部極小值點(diǎn)并出現(xiàn)過擬合現(xiàn)象。與神經(jīng)網(wǎng)絡(luò)相比,SVM是一種基于VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化的統(tǒng)計(jì)學(xué)習(xí)方法,較好地解決了局部最優(yōu)、非線性、小樣本訓(xùn)練等問題,能有效避免局部最小化等問題[9]。文獻(xiàn)[10]采用遺傳模擬退火算法來優(yōu)化參數(shù)的SVM方法來預(yù)測(cè)紅霉素發(fā)酵過程生物量濃度;文獻(xiàn)[11]比較了神經(jīng)網(wǎng)絡(luò)和SVM在固體發(fā)酵過程中生物量參數(shù)軟測(cè)量預(yù)測(cè)效果,結(jié)果表明SVM優(yōu)于MLP神經(jīng)網(wǎng)絡(luò);但SVM的預(yù)測(cè)性能與參數(shù)選擇密切相關(guān),限制其實(shí)際應(yīng)用。Suykens等[12]提出了最小二乘支持向量機(jī)(LSSVM)用于求解非線性函數(shù)的回歸問題,它將標(biāo)準(zhǔn)SVM 的學(xué)習(xí)問題轉(zhuǎn)化為解線性方程組問題,減少訓(xùn)練時(shí)間和計(jì)算復(fù)雜性,加快求解速度,改善了SVM在建模中所存在的問題[13]。因此,文獻(xiàn)[14]使用LSSVM建立諾西肽發(fā)酵混合模型來預(yù)測(cè)生化參數(shù),并使用改進(jìn)粒子群優(yōu)化諾西肽發(fā)酵過程來改善最終產(chǎn)量。文獻(xiàn)[15]建立了一種混沌最小二乘支持向量機(jī)模型來預(yù)測(cè)青霉素發(fā)酵過程的產(chǎn)物。
偏最小二乘法(PLS)是一種多因變量對(duì)多自變量的多元統(tǒng)計(jì)數(shù)據(jù)分析方法,能夠?qū)⒅鞒煞址治?principal component analysis, PCA)與典型相關(guān)及多元線性回歸分析有機(jī)地結(jié)合起來,尤其適用于變量多重相關(guān)性小樣本等情況下的回歸分析[16]。PLS已在化工[17-19]、造紙[20]等行業(yè)有廣泛應(yīng)用,據(jù)日本相關(guān)化工企業(yè)已使用的軟測(cè)量裝置數(shù)量調(diào)查顯示,multiple linear regression(MLR)仍然占據(jù)主導(dǎo)地位,PLS次之,artificial neural network (ANN)很少[21]。
本文采用PLS和LSSVM來預(yù)測(cè)谷氨酸發(fā)酵產(chǎn)物濃度,將發(fā)酵工藝和PLS相結(jié)合的輸入變量分析選擇方法[19],利用PLS對(duì)發(fā)酵過程的輔助變量進(jìn)行特征提取,消除輸入變量的相關(guān)性,降維后的輸入變量作為L(zhǎng)SSVM模型的輸入,以提高泛化性能,降維簡(jiǎn)化后的PLS和LSSVM預(yù)測(cè)模型與發(fā)酵動(dòng)力學(xué)模型進(jìn)行比較以選擇谷氨酸發(fā)酵最佳預(yù)測(cè)模型??紤]到最小二乘向量機(jī)的參數(shù)選擇會(huì)對(duì)預(yù)測(cè)結(jié)果產(chǎn)生較大影響,利用耦合模擬退火(coupled simulated annealing, CSA)對(duì)參數(shù)進(jìn)行優(yōu)化。應(yīng)用5 L谷氨酸發(fā)酵罐實(shí)驗(yàn)數(shù)據(jù)進(jìn)行仿真以驗(yàn)證所提方法的有效性和預(yù)測(cè)效果。
1.1 偏最小二乘
設(shè)自變量=(1,2,…,x),因變量=(1,2,…,y),標(biāo)準(zhǔn)化處理后,表達(dá)式矩陣0=[1,2,…,e],0=[1,2,…,f]。在0中提取第1個(gè)成分1,使1=01。式中1為1,2,…,x的線性組合,1為矩陣對(duì)應(yīng)于′00′00矩陣最大特征值的特征向量。因變量關(guān)于1的回歸使得
0=1′1+1(1)
0=1′1+1(2)
式中
用殘差陣1和1代替0和0,使用同樣步驟求第2個(gè)成分2,按照同樣方法求得剩下的成分3,…,t,最終有
(3)
因1,2,…,t都可以表示為1,2,…,的線性組合,式(4)可以還原成*=0k關(guān)于*=0k的回歸方程,即
(5)
式(5)中,=1,2,…,,是殘差陣的第列。
1.2 最小二乘向量機(jī)
1999年,Suykens等[12,22]對(duì)SVM的二次優(yōu)化問題進(jìn)行了改進(jìn),提出LSSVM,降低了計(jì)算的復(fù)雜度,利用最小二乘方法將SVM的學(xué)習(xí)轉(zhuǎn)為求解線性方程組問題。
設(shè)定樣本集
式中,x為輸入數(shù)據(jù),y為相應(yīng)的目標(biāo)值,()將低維樣本映射到高維特征空間H,在高維特征空間構(gòu)造最優(yōu)決策函數(shù)=T()+(∈R是權(quán)向量,∈是偏差)。
對(duì)于樣本外的輸入,有|-T()-|≤,尋找參數(shù)T和,則最小二乘支持向量機(jī)的優(yōu)化問題為
s.t.(7)
用拉格朗日法求解優(yōu)化問題
式中,是拉格朗日乘子。
根據(jù)KKT條件
消去和,則式(9)可改寫為
(10)
式中,(.,.)是核函數(shù),滿足
式(11)中,(.)表示高維特征空間H中的點(diǎn)積。解矩陣方程,求得和,最終得到LSSVM回歸模型
(12)
本文采用常用的RBF核函數(shù)
式中,是核函數(shù)寬度。
2.1 谷氨酸發(fā)酵過程
谷氨酸發(fā)酵通常經(jīng)歷3個(gè)階段:長(zhǎng)菌階段、過渡階段和產(chǎn)酸階段,在30~40 h產(chǎn)酸基本停止。化學(xué)反應(yīng)計(jì)量方程式為[23]
式中,GDH是谷氨酸脫氫酶,LDH是乳酸脫氫酶。
發(fā)酵裝置系統(tǒng)圖如圖1所示[24],配備有溫度、攪拌轉(zhuǎn)速、消泡、pH、DO 等測(cè)量控制探頭,并與尾氣分析儀相連接。通過軟件可得到發(fā)酵過程優(yōu)化與控制所需的各種代謝特征的參數(shù),如攝氧速度(OUR)、二氧化碳生成速度(CER)、呼吸商(RQ)等。其中影響谷氨酸產(chǎn)品濃度的因素有:發(fā)酵溫度、發(fā)酵液pH、發(fā)酵罐壓力、發(fā)酵體積、攪拌速率AG、氨水消耗量AR、溶氧DO、攝氧速度OUR、CO2生成速度CER等。
1—defoamer;2—glucose;3—ammonia water;4—electronic balance;5—peristaltic pump;6—pH electrode;7—DO electrode
2.2 谷氨酸發(fā)酵動(dòng)力學(xué)模型
根據(jù)相關(guān)文獻(xiàn)提出的谷氨酸發(fā)酵動(dòng)力學(xué)模型[1,25-26],文中以非結(jié)構(gòu)動(dòng)力學(xué)模型對(duì)谷氨酸發(fā)酵過程進(jìn)行仿真模擬和預(yù)測(cè)。
2.2.1 菌體生長(zhǎng)動(dòng)力學(xué)模型 Logistic方程是典型的S形曲線,能較好地反映分批補(bǔ)料發(fā)酵中菌體的生長(zhǎng),將其應(yīng)用到谷氨酸的菌體生長(zhǎng)中。Logistic方程為[27]
式中,max為最大菌體濃度,g·L-1,m為菌體最大比生長(zhǎng)速率;為菌體濃度。
2.2.2 產(chǎn)物形成動(dòng)力學(xué)模型 谷氨酸發(fā)酵過程為部分偶聯(lián),采用Luedeking-Piret方程
式中,為產(chǎn)物濃度,g·L-1;、為動(dòng)力學(xué)模型參數(shù)。右側(cè)第1項(xiàng)表示與菌體生長(zhǎng)率相關(guān)的產(chǎn)物形成率,第2項(xiàng)是非伴隨菌體生長(zhǎng)的產(chǎn)物形成率。
2.2.3 基質(zhì)消耗動(dòng)力學(xué)模型 常用模型為
式中,1、2分別為菌體生長(zhǎng)速率、產(chǎn)酸速率與基質(zhì)濃度變化速率相關(guān)參數(shù)。
2.2.4 動(dòng)力學(xué)模型求解 結(jié)合實(shí)驗(yàn)數(shù)據(jù)理論計(jì)算、仿真求解機(jī)理模型參數(shù),對(duì)于發(fā)酵動(dòng)力學(xué)模型參數(shù)的求取有simplex法、Powell法和遺傳算法等。
將上面3個(gè)動(dòng)力學(xué)方程分別積分得
(19)
(20)
目標(biāo)函數(shù)為
式中,、、、、、分別為菌體、基質(zhì)和谷氨酸濃度的實(shí)際測(cè)量值和模型計(jì)算值。使用遺傳算法對(duì)目標(biāo)函數(shù)進(jìn)行估計(jì),使得偏差平方和最小,獲得待估參數(shù)max=40.1,m=0.3748,=0.0748,=0.0641,1=0.6259,2=1.3027。
2.3 PLS-LSSVM預(yù)測(cè)模型
PLS-LSSVM預(yù)測(cè)模型如圖2所示。在進(jìn)行特征提取降維過程中采用非線性迭代算法(nonlinear iterative partial least squares, NIPALS)[28-30],具體步驟見文獻(xiàn)[28]。LSSVM模型初始參數(shù)和核寬度2利用耦合模擬退火(CSA)進(jìn)行優(yōu)化。
3.1 性能指標(biāo)
文中使用均方根誤差(RMSE)和決定系數(shù)2作為模型的評(píng)價(jià)指標(biāo),再引入Pearson相關(guān)系數(shù)來評(píng)價(jià)模型預(yù)測(cè)值與實(shí)際測(cè)量值的變化趨勢(shì),其表達(dá)式分別為
(23)
(24)
式中,為樣本數(shù);y為實(shí)際測(cè)量值;為模型預(yù)測(cè)值。
3.2 輸入輸出變量選擇
根據(jù)谷氨酸發(fā)酵機(jī)理過程分析,發(fā)酵罐壓力變化影響溶解氧濃度的變化,與攪拌速率AG也存在偶聯(lián)關(guān)系,在發(fā)酵過程中變化不大,另外發(fā)酵體積變化不大,這兩個(gè)因素可不予考慮。因此預(yù)測(cè)模型選擇發(fā)酵時(shí)間、發(fā)酵溫度、發(fā)酵液pH、攪拌速率AG、氨水消耗量AR、溶氧DO、攝氧速度OUR、CO2生成速度CER作為輸入變量。谷氨酸濃度等關(guān)鍵生化參數(shù)每2 h才離線化驗(yàn)一次,測(cè)量結(jié)果滯后,將它作為預(yù)測(cè)模型的輸出變量,預(yù)測(cè)模型為=1(,,pH,AG,AR,DO,OUR,CER)。
3.3 仿真分析
取10批共180組谷氨酸發(fā)酵過程數(shù)據(jù),每批都表示一個(gè)完整的發(fā)酵過程,相關(guān)分析降維前形成180×8維輸入量樣本數(shù)據(jù)矩陣和180×1維輸出量矩陣。9批數(shù)據(jù)作為訓(xùn)練,其余1批數(shù)據(jù)作為測(cè)試。為了消除量綱的影響,常將數(shù)據(jù)做標(biāo)準(zhǔn)化處理。
3.3.1 PLS和LSSVM模型比較 采用PLS預(yù)測(cè)模型對(duì)10批180組谷氨酸發(fā)酵數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)值和實(shí)際測(cè)量值比較結(jié)果如圖3所示,從圖3可以看出,圖中三角形點(diǎn)分布在直線兩側(cè),具有良好預(yù)測(cè)性能,Pearson相關(guān)系數(shù)為0.9547。
同時(shí),為了進(jìn)一步分析模型的預(yù)測(cè)性能,分別采用PLS和LSSVM預(yù)測(cè)模型對(duì)10批谷氨酸發(fā)酵數(shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試。隨機(jī)采用某一批次發(fā)酵數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖4、圖5所示,誤差對(duì)比如圖6所示,比較結(jié)果見表1。其中LSSVM預(yù)測(cè)模型采用RBF核函數(shù),先用CSA進(jìn)行全局優(yōu)化選擇合適初始參數(shù)為449.458和核寬度2為13.986,然后用網(wǎng)格搜索算法和交叉驗(yàn)證對(duì)參數(shù)進(jìn)行微調(diào),最終確定正則化參數(shù)為3989.421和核寬度2為135.219,從LSSVM模型對(duì)谷氨酸濃度的預(yù)測(cè)結(jié)果看,CSA優(yōu)化參數(shù)的LSSVM預(yù)測(cè)模型預(yù)測(cè)精度較好。
從圖4~圖6和表1中數(shù)據(jù)可以看出,LSSVM模型的均方根誤差為3.529,明顯小于PLS模型的7.98,決定系數(shù)為0.984,相對(duì)PLS具有明顯優(yōu)勢(shì)。
表1 預(yù)測(cè)性能比較
3.3.2 預(yù)測(cè)模型降維簡(jiǎn)化 如果將所有輔助變量都作為預(yù)測(cè)模型的輸入,雖然會(huì)使訓(xùn)練精度較小,但會(huì)降低模型泛化性能,預(yù)測(cè)速度減慢;利用PLS進(jìn)行特征提取降維可以克服傳統(tǒng)因素分析方法的弊端,通過殘差閾值[28-29]來確定主成分個(gè)數(shù)。隨著主成分增加,當(dāng)變化的方差解釋信息小于閾值時(shí)NIPALS停止分解,提取4個(gè)主成分時(shí)有95%的因變量被解釋,前4個(gè)主成分方差解釋如圖7所示,回歸系數(shù)直方圖如圖8所示。
根據(jù)輸入輔助變量對(duì)生化參數(shù)菌體濃度、基質(zhì)濃度和產(chǎn)物濃度影響的特征提取和主成分相關(guān)分析,結(jié)合谷氨酸發(fā)酵機(jī)理,將發(fā)酵時(shí)間、發(fā)酵溫度、攝氧速度OUR、CO2生成速度CER作為輸入變量,谷氨酸產(chǎn)物濃度為輸出變量,降維后預(yù)測(cè)模型為=2(,,OUR,CER)。
發(fā)酵數(shù)據(jù)經(jīng)相關(guān)分析降維后為180×4維輸入量樣本數(shù)矩陣和180×1維輸出量矩陣。9批數(shù)據(jù)作為訓(xùn)練,其余1批數(shù)據(jù)作為測(cè)試。降維后的PLS和LSSVM預(yù)測(cè)模型與動(dòng)力學(xué)模型對(duì)比如圖9~圖11和表2所示,誤差對(duì)比如圖12所示。
表2 降維后預(yù)測(cè)性能比較
從圖9~圖12和表2可以看出,降維后的LSSVM模型的預(yù)測(cè)值在大部分發(fā)酵時(shí)間能夠很好地跟蹤實(shí)際測(cè)量值,預(yù)測(cè)誤差很小,僅在發(fā)酵初期和臨近結(jié)束時(shí),誤差相對(duì)大一點(diǎn)。由分析可知,發(fā)酵初期主要是菌體生長(zhǎng)期,基本不產(chǎn)酸。
表3 10次預(yù)測(cè)平均值性能比較
同時(shí)考慮到隨機(jī)性,降維后的PLS和LSSVM模型分別留一交叉驗(yàn)證獨(dú)立運(yùn)行10次,表3給出了10次實(shí)驗(yàn)后的平均值作為對(duì)比。
從表3可以看出,降維后的LSSVM仍然具有很好跟蹤實(shí)際測(cè)量值的性能,預(yù)測(cè)誤差很小,精度很好,可以為發(fā)酵操作及時(shí)調(diào)整和控制提供指導(dǎo)。
(1)針對(duì)谷氨酸發(fā)酵產(chǎn)品濃度在線檢測(cè)困難問題,建立基于PLS-LSSVM模型對(duì)谷氨酸濃度進(jìn)行預(yù)測(cè)。
(2)結(jié)合機(jī)理知識(shí)和發(fā)酵過程數(shù)據(jù)建立了預(yù)測(cè)模型,為了滿足預(yù)測(cè)的精度和快速性的要求,通過對(duì)輸入在線可測(cè)輔助變量進(jìn)行特征提取相關(guān)分析降維以簡(jiǎn)化模型結(jié)構(gòu)、提高模型性能,采用PLS和最小二乘向量機(jī)模型進(jìn)行預(yù)測(cè),并與發(fā)酵動(dòng)力學(xué)模型進(jìn)行比較以選擇最佳預(yù)測(cè)模型,實(shí)驗(yàn)結(jié)果表明經(jīng)PLS特征提取降維后的LSSVM預(yù)測(cè)模型建模精度高,均方根誤差為1.597,2為0.996,可以為谷氨酸發(fā)酵過程生產(chǎn)操作及時(shí)調(diào)整提供有效指導(dǎo)。
(3)耦合模擬退火算法對(duì)LSSVM參數(shù)進(jìn)行全局優(yōu)化,然后用網(wǎng)格搜索和交叉驗(yàn)證對(duì)參數(shù)進(jìn)行微調(diào)具有較好的效果,利用優(yōu)化后的參數(shù)模型預(yù)測(cè)發(fā)酵過程預(yù)測(cè)精度很高。
[1] KHAN N S, MISHRA I M, SINGH R P,. Modeling the growth of corynebacterium glutamicum under product inhibition in L-glutamic acid fermentation[J]. Biochemical Engineering Journal, 2005, 25(2): 173-178.
[2] CAO Y, MPOFU E, SHI Z P. A novel metabolic model incorporating directed signal flow diagram with enzymatic activities data for evaluating glutamate yield in glutamate fermentation[J]. Biochemical Engineering Journal, 2013, 77(8): 136-146.
[3] VELOSO A C A, ROCHA I, FERREIRA E C. Monitoring of fed-batchfermentations with software sensors[J]. Bioprocess Biosyst. Eng., 2009, 32: 381-388.
[4] 賀彥林, 王曉, 朱群雄. 基于主成分分析改進(jìn)的極限學(xué)習(xí)機(jī)方法的精對(duì)苯二甲酸醋酸含量軟測(cè)量[J]. 控制理論與應(yīng)用, 2015, 32(1): 80-85.HE Y L, WANG X, ZHU Q X. Modeling of acetic acid content in purified terephthalic acid solvent column using principal component analysis based improved extreme learning machine[J]. Control Theory & Applications, 2015, 32(1): 80-85.
[5] KANEKO H, FUNATSU K. Ensemble locally weighted partial least squares as a just-in-time modeling method[J]. AIChE Journal, 2016, 62(3): 717-725.
[6] 袁小鋒, 葛志強(qiáng), 宋執(zhí)環(huán). 基于時(shí)間差分和局部加權(quán)偏最小二乘算法的過程自適應(yīng)軟測(cè)量建模[J].化工學(xué)報(bào), 2016, 67(3): 724-728.YUAN X F, GE Z Q, SONG Z H. Adaptive soft sensor based on time difference model and locally weighted partial least squares regression[J]. CIESC Journal, 2016, 67(3): 724-728.
[7] 黃永紅, 孫麗娜, 孫玉坤, 等. 海洋蛋白酶發(fā)酵過程生物參數(shù)的軟測(cè)量建模[J]. 信息與控制, 2013, 42(4): 506-510.HUANG Y H, SUN L N, SUN Y K,. Soft sensor modeling based on biological variables of marine protease fermentation process[J]. Information and Control, 2013, 42(4): 506-510.
[8] WANG T, SUN J W, ZHANG W D,. Prediction of product formation in 2-keto-l-gulonic acid fermentation through Bayesian combination of multiple neural networks[J]. Process Biochemistry, 2014, 49: 188-194.
[9] 陳進(jìn)東, 潘豐. 基于在線支持向量回歸的非線性模型預(yù)測(cè)控制方法[J].控制與決策, 2014, 29(3): 460-464.CHEN J D, PAN F. Online support vector regression-based nonlinear model predictive control[J].Control and Decision, 2014, 29(3): 460-464.
[10] LIU G H, ZHOU D W, XU H X,. Model optimization of SVM for a fermentation soft sensor[J].Expert Systems with Applications, 2010, 37(4): 2708-2713.
[11] ACUNA G, RAMIREZ C, CURILEM M. Software sensors for biomass concentration in a SSC process using artificial neural networks and support vector machine[J]. Bioprocess Biosyst. Eng., 2014, 37(1): 27-36.
[12] SUYKENS J A K, VANDEWALLE J. Least squares support machine classifiers[J]. Neural Processing Letters, 1999, 9(3): 293-300.
[13] WANG X F, CHEN J D, LIU C B,. Hybrid modeling of penicillin fermentation process based on least square support vector machine[J]. Chemical Engineering Research and Design, 2010, 88: 415-420.
[14] NIU D P, JIA M X, WANG F L,. Optimization of Nosiheptide fed-batch fermentation process based on hybrid model[J].Industrial & Engineering Chemistry Research, 2013, 52: 3373-3380.
[15] 熊偉麗, 姚樂, 徐保國(guó). 混沌最小二乘支持向量機(jī)及其在發(fā)酵過程建模中的應(yīng)用[J]. 化工學(xué)報(bào), 2013, 64(12): 4585-4591.XIONG W L, YAO L, XU B G. Chaos least squares support vector machine and its application on fermentation process modeling [J]. CIESC Journal, 2013, 64(12): 4585-4591.
[16] 陶勁松, 楊亞帆, 李遠(yuǎn)華. 基于PLS 和SVM 的紙張抗張強(qiáng)度建模比較[J].華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2014, 42(7): 132-137.TAO J S, YANG Y F, LI Y H. Comparison of paper tensile strength prediction models based on PLS and SVM methods[J]. Journal of South China University ofTechnology (Natural Science Edition), 2014, 42(7): 132-137.
[17] TAE C P, TAE Y K, YEONG K Y. Prediction of the melt flow index using partial least squares and support vector regression in high-density polyethylene (HDPE) process[J]. Korean J. Chem. Eng., 2010, 27(6): 1662-1668.
[18] FACCO P, DOPLICHER F, BEZZO F,. Moving average PLS soft sensor for online product quality estimation in an industrial batch polymerization process[J]. J. Process Control, 2009, 19(3): 520-529.
[19] KANEKO H, ARAKAWA M, FUNATSU K. Development of a new soft sensor method using independent component analysis and partial least squares[J]. AIChE J, 2009, 55(1): 87-98.
[20] 湯偉, 于東偉, 張怡真. 基于遞推PLS 的置換蒸煮終點(diǎn)軟測(cè)量建模研究[J]. 中國(guó)造紙學(xué)報(bào), 2015, 30(3): 47-50. TANG W, YU D W, ZHANG Y Z. Research on cooking end point modeling based on recursive PLS for displacement cooking[J]. Transactions of China Pulp and Paper, 2015, 30(3): 47-50.
[21] FUJIWARA K, SAWADA H, KANO M. Input variable selection for PLS modeling using nearest correlation spectral clustering[J]. Chemometrics and Intelligent Laboratory Systems, 2012, 118: 109-119.
[22] 趙朋程, 劉彬, 高偉, 等. 用于水泥熟料fCaO預(yù)測(cè)的多核最小二乘支持向量機(jī)模型[J]. 化工學(xué)報(bào), 2016, 67(6): 2480-2487.ZHAO P C, LIU B, GAO W,. Multiple kernel least square support vector machine model for prediction of cement clinker lime content[J]. CIESC Journal, 2016, 67(6): 2480-2487.
[23] XIAO J, SHI Z P, GAO P,. On-line optimization of glutamate production based on balanced metabolic control by RQ[J]. Bioprocess Biosyst. Eng, 2006, 29(2): 109-117.
[24] 董傳亮. 谷氨酸發(fā)酵過程的故障診斷研究[D]. 無錫: 江南大學(xué), 2008.DONG C L. Study on fault diagnosis for glutamic acid fermentation process [D]. Wuxi: Jiangnan Univercity, 2008.
[25] ZHENG X W, SUN T, SUN Z Y,. Time-dependent kinetic models for glutamic acid fermentation[J].Enzyme and Microbial Technology, 1998, 22: 205-209.
[26] 蔡煜東, 陳常慶.用遺傳算法辨識(shí)發(fā)酵動(dòng)力學(xué)模型參數(shù)[J].化工學(xué)報(bào), 1995, 46(3): 338-342.CAI Y D, CHEN C Q. Recognition of parameters in fermentation dynamics model by genetic algorithm[J]. Journal of Chemical Industry and Engineering(China), 1995, 46(3): 338-342.
[27] 肖玲玲, 黃瑞, 郭金玲, 等. 木聚糖酶的發(fā)酵動(dòng)力學(xué)研究與分批補(bǔ)料控制 [J]. 可再生能源, 2015, 33(11): 1700-1705.XIAO L L, HUANG R, GUO J L,. Study on the dynamics of xylanase fermentation and control of fed-batch[J]. Renewable Energy Resources, 2015, 33(11): 1700-1705.
[28] BAFFI G, MARTIN E B, MORRIS A J. Non-linear projection to latent structures revisited: the quadratic PLS algorithm[J]. Computers & Chemical Engineering, 1999, 23(3): 395-411.
[29] 呂游, 劉吉臻, 楊婷婷, 等. 基于PLS 特征提取和LS-SVM 結(jié)合的NO排放特性建模[J]. 儀器儀表學(xué)報(bào), 2013, 34(11): 2418-2424.Lü Y, LIU J Z, YANG T T,. NOemission characteristic modeling based on feature extraction using PLS and LS-SVM [J].Chinese Journal of Scientific Instrument, 2013, 34(11): 2418-2424.
[30] 熊富強(qiáng), 桂衛(wèi)華, 陽春華, 等. 基于PLS-LSSVM方法的濕法煉鋅過程預(yù)測(cè)建模[J].儀器儀表學(xué)報(bào), 2011, 32(4): 941-948. XIONG F Q, GUI W H, YANG C H,. Forecasting modeling of zinc hydrometallurgy process based on PLS-LSSVM approach[J]. Chinese Journal of Scientific Instrument, 2011, 32(4): 941-948.
Prediction of product concentration in glutamate fermentation process using partial least squares and least square support vector machine
ZHENG Rongjian1,2, PAN Feng1
(1Key Laboratory ofAdvanced Process Control for Light Industry (Ministry of Education), Jiangnan University, Wuxi 214122, Jiangsu, China;2Faculty of Automation, Huaiyin Institute of Technology, Huai’an 223003, Jiangsu, China)
Considered that key variables in glutamate fermentation process could not be measured inline, which would make it difficult to control and optimize the fermentation process, a model for glutamate concentration prediction in a 5 L fermentation tank was established on the basis of partial least squares (PLS) and least square support vector machine (LSSVM). PLS was applied first to extract features of input variables, to reduce number of variable dimensions, and to eliminate correlations such that model complexity was simplified and performance was improved. Coupled simulated annealing (CSA) arithmetic was later combined with grid search to determine model parameter values of LSSVM for improved prediction accuracy. Further model simplification was completed by deleting parameters with weak correlation to glutamate concentration. The simplified model was compared to kinetic model in order to select the best model of glutamate fermentation. Experimental results showed that the simplified LSSVM model equipped with CSA parameter optimization outperformed both PLS and kinetic models,which root mean square errors (RMSE) were 1.597, 8.49 and 2.934 respectively. The LSSVM prediction model had excellent performance with high accuracy, so it would be more suitable for online prediction of glutamate concentration and offer an effective guidance for control and optimization of the glutamate fermentation process.
glutamate; fermentation; prediction; partial least squares; least squares support vector machine; reaction kinetics; model simplification
10.11949/j.issn.0438-1157.20161533
TP 274
A
0438—1157(2017)03—0976—08
國(guó)家自然科學(xué)基金項(xiàng)目(61273131);江蘇省普通高校研究生科研創(chuàng)新計(jì)劃項(xiàng)目(CXZZ12_0741);中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金(JUDCF12034)。
2016-10-31收到初稿,2016-11-07收到修改稿。
聯(lián)系人及第一作者:鄭蓉建(1971—),男,博士,講師。
2016-10-31.
ZHENG Rongjian, rjmzheng@163.com
supported by the National Natural Science Foundation of China (61273131), the Graduate Innovation of Jiangsu Province (CXZZ12_0741) and the Fundamental Research Funds for Central Universities (JUDCF12034).