張衛(wèi)國,王維杰
(1.揚(yáng)中市威柯特生物工程設(shè)備有限公司,江蘇揚(yáng)中 212200;2.江蘇大學(xué)電氣信息工程學(xué)院,江蘇鎮(zhèn)江 212000)
海洋蛋白酶在發(fā)酵領(lǐng)域受到了廣泛關(guān)注,相比陸生菌種產(chǎn)生的蛋白酶,其具有耐高壓和耐低溫的特性,被廣泛運(yùn)用于食品[1]、醫(yī)學(xué)[2-3]、紡織[4-5]等領(lǐng)域。然而,海洋蛋白酶復(fù)雜的發(fā)酵過程令大規(guī)模工業(yè)生產(chǎn)受到限制,最主要的原因是其細(xì)胞生長情況復(fù)雜,并且關(guān)鍵生物參量沒有對應(yīng)的生物傳感器,很難進(jìn)行在線觀測[6]。為了獲取這些關(guān)鍵生物參量,通常采用人工取樣方法,然后進(jìn)行離線測量。離線檢測具有較高的專業(yè)性,但在時(shí)間上嚴(yán)重滯后,容易造成較大的測量誤差,若操作不當(dāng),甚至?xí)肴藶槲廴?,造成?yán)重后果。為了能夠反映海洋堿性蛋白酶發(fā)酵過程中的相關(guān)狀態(tài),并進(jìn)行實(shí)時(shí)調(diào)節(jié)與控制,研究者們運(yùn)用了基于軟測量的各種控制策略。其中,模糊神經(jīng)網(wǎng)絡(luò)(Fuzzy Neural Network,F(xiàn)NN)由于具有較好的性能,得到了廣泛運(yùn)用[7]。
軟測量技術(shù)的主要思想是通過構(gòu)造不可直接測量的關(guān)鍵參量與直接可測參量之間的數(shù)學(xué)模型,用計(jì)算機(jī)軟件實(shí)現(xiàn)對關(guān)鍵參量的預(yù)測[8]。其中,模糊神經(jīng)網(wǎng)絡(luò)應(yīng)用廣泛,針對模糊邏輯和神經(jīng)網(wǎng)絡(luò)的缺陷,將模糊理論與神經(jīng)網(wǎng)絡(luò)相結(jié)合,同時(shí)兼具兩者的優(yōu)勢,不僅能將信息模糊化,之后進(jìn)行模糊推理,而且具有良好的自適應(yīng)能力,所以被廣泛運(yùn)用于復(fù)雜非線性系統(tǒng)的軟測量建模中[8-10]。國內(nèi)外不少學(xué)者對此展開了深入研究,并取得了諸多成果。如王永海等[11]采用混合群智能算法優(yōu)化FNN,得到了結(jié)構(gòu)簡單、精度更高的模型;鄒海英等[12]對建模參數(shù)進(jìn)行特征提取,挑選合適的參數(shù)建立自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò),將其應(yīng)用于腎小球?yàn)V過率預(yù)測,結(jié)果表明,模型誤差較小,泛化能力增強(qiáng);孫玉坤等[13]提出在動態(tài)遞歸模糊神經(jīng)網(wǎng)絡(luò)中運(yùn)用免疫遺傳算法,并將該方法應(yīng)用于賴氨酸發(fā)酵過程菌體濃度檢測中,展示了較高的預(yù)測精度。之后也有不少發(fā)酵領(lǐng)域的學(xué)者對此進(jìn)行了補(bǔ)充,取得了理想的預(yù)測效果[14-18]。
然而,由于海洋堿性蛋白酶是一種新型生物酶,相關(guān)專家經(jīng)驗(yàn)是嚴(yán)重不全,甚至缺失的,以上方法在建立模糊神經(jīng)網(wǎng)絡(luò)初始模型時(shí),其中的規(guī)則數(shù)和權(quán)值都沒有可靠數(shù)據(jù)作為參考,因此不但會延長收斂時(shí)間,而且可能降低預(yù)測精度?;诖?,本文提出一種FCM-IGA-FNN 軟測量模型,利用模糊C 均值(Fuzzy C-means,F(xiàn)CM)對數(shù)據(jù)進(jìn)行特征提取,并運(yùn)用混沌算法優(yōu)化遺傳算法(Improved Genetic Algorithm,IGA)彌補(bǔ)了專家經(jīng)驗(yàn)的缺失,避免了傳統(tǒng)遺傳算法后期陷入局部收斂的問題,然后將其應(yīng)用于海洋蛋白酶發(fā)酵過程關(guān)鍵生物量預(yù)測中。仿真結(jié)果表明,對于缺乏經(jīng)驗(yàn)知識的海洋蛋白酶發(fā)酵過程,該方法具有良好的建模精度與較強(qiáng)的實(shí)用性。
基于FCM-FNN 的軟測量建模流程如圖1 所示。首先利用模糊C 均值對發(fā)酵過程中關(guān)鍵生物參量的樣本數(shù)據(jù)空間進(jìn)行聚類分析,每一個(gè)樣本數(shù)據(jù)都可通過公式計(jì)算得出其與聚類中心相關(guān)數(shù)據(jù),如兩者間距離和隸屬度關(guān)系等,根據(jù)這些數(shù)據(jù)挑選出更優(yōu)的聚類中心,如此反復(fù)運(yùn)算,當(dāng)數(shù)據(jù)不再變化時(shí)迭代停止,對相關(guān)數(shù)據(jù)進(jìn)行去模糊化處理,提取模糊規(guī)則;然后利用計(jì)算得到的初始參量構(gòu)造初始模糊神經(jīng)網(wǎng)絡(luò),并用混沌算法修飾免疫遺傳算法,優(yōu)化模糊神經(jīng)網(wǎng)絡(luò)的梯度信息獲取。將該模型應(yīng)用于海洋蛋白酶發(fā)酵過程中的關(guān)鍵生物參量在線預(yù)測,以驗(yàn)證提出的軟測量建模方法的有效性。
Fig.1 Soft sensor modeling process based on FCM-FNN圖1 基于FCM-FNN 的軟測量建模流程
首先設(shè)定c個(gè)初始聚類中心,計(jì)算數(shù)據(jù)集中其它數(shù)據(jù)與c個(gè)初始聚類中心的歐氏距離函數(shù)以及隸屬度關(guān)系,反復(fù)循環(huán)迭代。當(dāng)聚類中心保持不變時(shí),其劃分結(jié)果達(dá)到最優(yōu)。記錄此時(shí)的模糊組,再通過一定規(guī)則使模糊聚類去模糊化,由此得到模糊規(guī)則數(shù)M[19-20]。FCM 規(guī)則流程如圖2所示。
Fig.2 Flow of FCM rules圖2 FCM 規(guī)則流程
考慮如下形式的模糊規(guī)則:
Rl:如果x1為,…,xn為,則y為Gl。
其中,,……,和Gl分別為u∈R與v∈R上的模糊集合,且x=(x1,x2,…,xn)T∈u1×u2× …×un和y∈R是語言變量;l=1,2,…,M,M為模糊規(guī)則庫中包含的模糊規(guī)則總數(shù),x、y分別為模糊邏輯系統(tǒng)的輸入和輸出。
設(shè)數(shù)據(jù)x={x1,x2,…,xn}是n個(gè)待聚類樣本,算法如下:
(1)固定聚類數(shù)c和模糊加權(quán)指數(shù)b(1 <b<!),隨機(jī)設(shè)置v(0),置k=1,取ε>0。
(2)計(jì)算隸屬度矩陣u(k)如下所示:
(3)計(jì)算新的聚類中心v(k+1)如下:
利用FCM 算法對海洋蛋白酶發(fā)酵過程的樣本數(shù)據(jù)空間進(jìn)行聚類分析,聚類個(gè)數(shù)M取12,并通過反復(fù)迭代,直到數(shù)值不再改變,求解得到聚類中心。每一個(gè)樣本點(diǎn)都與聚類中心存在偏差,通過該偏差可獲得隸屬度函數(shù)的寬度,構(gòu)建的最終隸屬度函數(shù)如圖3 所示。
Fig.3 Initial membership function圖3 隸屬度函數(shù)
1.2.1 模糊神經(jīng)網(wǎng)絡(luò)
通過以上FCM 算法可得到用于搭建模糊神經(jīng)網(wǎng)絡(luò)的初始參數(shù)。本系統(tǒng)采用經(jīng)典的模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(見圖4),該結(jié)構(gòu)共有4 層,第1 層將控制變量x1、x2、…、xn輸入網(wǎng)絡(luò);第2 層對輸入數(shù)據(jù)x1、x2、…、xn進(jìn)行模糊化處理,對應(yīng)的隸屬度函數(shù)采用exp(-(x-a)2/b2);第3 層對應(yīng)模糊推理;第4 層對應(yīng)去模糊化。該網(wǎng)絡(luò)各層之間的相互關(guān)系如下所示:
其中,xi為網(wǎng)絡(luò)輸入和wi為網(wǎng)絡(luò)連接權(quán)值,其中規(guī)則數(shù)M是由前面的模糊C 均值算法確定的,即M=12。
1.2.2 改進(jìn)型免疫遺傳算法設(shè)計(jì)與實(shí)現(xiàn)
針對模糊神經(jīng)網(wǎng)絡(luò)在收斂過程中往往難以獲得相應(yīng)梯度信息的問題,遺傳算法不依賴梯度信息的特性很好地彌補(bǔ)了這一缺陷。免疫遺傳算法IGA 基于生物體中的免疫原理對遺傳算法加以改進(jìn),當(dāng)外來抗原入侵生物系統(tǒng)時(shí),對其進(jìn)行識別,判斷“異己”,從而產(chǎn)生對應(yīng)的抗體以抵抗抗原。通過兩者間的相互刺激與抑制,解除抗原對抗體的威脅,并有部分產(chǎn)生抗體的細(xì)胞以記憶細(xì)胞的形式保留下來,能更好、更快地處理相應(yīng)抗原。
免疫遺傳算法大體步驟如下:①隨機(jī)獲取初始群體;②計(jì)算抗體濃度及適應(yīng)度;③對抗體進(jìn)行促進(jìn)與抑制處理;④群體更新(交叉和變異)。
雖然IGA 在避免“早熟”方面有了很大提升,但還存在收斂于局部值的缺陷,對此采用混沌算法加以補(bǔ)充,并在算法結(jié)束前進(jìn)行早熟判斷并作相應(yīng)處理。具體方法如下:
采用混沌算法對初始種群進(jìn)行優(yōu)化:
當(dāng)?shù)螖?shù)不斷增加時(shí),“聚集現(xiàn)象”難以避免,只能對早熟現(xiàn)象加以判斷并作相關(guān)處理,計(jì)算單獨(dú)粒子在群體中的適應(yīng)度方差:
其中,fi是第i個(gè)粒子的適應(yīng)度值,fv是當(dāng)前粒子群體的平均適應(yīng)度值。引入因子f對作歸一化處理,使其取值在[ 0,1 ]之間。
設(shè)ε、fep分別為適應(yīng)度定值和適應(yīng)度精度,若滿足條件,連續(xù)有N0代符合δ2<ε,且>fep,則可判斷算法陷入局部最優(yōu)。
當(dāng)算法陷入局部最優(yōu)時(shí),可按照式(5)調(diào)節(jié)變異因子FG。其中,g為種群迭代次數(shù),gm為最大迭代次數(shù),從而擺脫局部最優(yōu)。
在改進(jìn)的免疫遺傳算法中,染色體由3 組基因組成,分別由神經(jīng)網(wǎng)絡(luò)中的參數(shù)wij、aik、bik表示。參數(shù)選擇如下:取抗體種群規(guī)模Mpop=34,交叉與變異概率分別為Pc=0.80,pm=0.02,進(jìn)化截止代數(shù)為100;在抗體濃度計(jì)算中,取親和力常數(shù)為0.9。
實(shí)驗(yàn)室使用100L 容積的小型發(fā)酵罐作為海洋蛋白酶發(fā)酵裝置,根據(jù)發(fā)酵機(jī)理及相關(guān)經(jīng)驗(yàn)選擇電機(jī)轉(zhuǎn)速、溶氧量、溫度、pH 值、碳源(瓊脂粉)流加速率fap(u1)、氮源(蛋白胨)流加速率fp(u2)、無機(jī)鹽(K2HPO4)流加速率fk(u3)作為輸入量,菌體濃度X(x1)、相對酶活P(x3)和基質(zhì)濃度S(x2)作為輸出量。根據(jù)海洋蛋白酶發(fā)酵的工藝要求,發(fā)酵罐內(nèi)壓強(qiáng)維持在0.1MPa,pH 穩(wěn)定在9.5 左右,溫度控制在25℃。每2h 取樣一次,并離線分析菌體濃度、產(chǎn)物濃度及相對酶活。
共采用10 批次數(shù)據(jù),4 組作為訓(xùn)練數(shù)據(jù),其中2 組數(shù)據(jù)用來確定FCM 算法中的模糊規(guī)則數(shù)和隸屬度函數(shù),2 組用來確定模糊神經(jīng)網(wǎng)絡(luò)初始結(jié)構(gòu);再取4 組數(shù)據(jù)用于網(wǎng)絡(luò)模型測試,建立FCM-IGA-FNN 軟測量模型;最后2 組數(shù)據(jù)作為驗(yàn)證數(shù)據(jù),檢測網(wǎng)絡(luò)模型的泛化能力并計(jì)算預(yù)測誤差。兩種不同預(yù)測模型仿真結(jié)果如圖5-圖7 所示(彩圖掃OSID 碼可見)。
Fig.5 Prediction results of bacterial concentration圖5 菌體濃度預(yù)測結(jié)果
Fig.6 Prediction results of matrix concentration圖6 基質(zhì)濃度預(yù)測結(jié)果
為了更好地進(jìn)行評估,本文從數(shù)據(jù)上比較FCM-IGAFNN 模型與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的性能,指標(biāo)為均方誤差(RMSE),具體對比結(jié)果如表1 所示。
通過仿真圖中的曲線對比可知,基于模糊C 均值的模糊神經(jīng)網(wǎng)絡(luò)模型具有更好的擬合精度和泛化能力。通過均方誤差的對比分析可知,F(xiàn)CM-FNN 方法相較于傳統(tǒng)FNN,對于菌體濃度、基質(zhì)濃度和相對酶活的預(yù)測精度分別提高了0.234、0.190 和1.00,體現(xiàn)出較好的預(yù)測精度。
Fig.7 Relative enzyme activity prediction results圖7 相對酶活預(yù)測結(jié)果
Table 1 Comparison of RMSE for two different models表1 兩種不同模型均方誤差對比
本文提出一種基于模糊C 均值的免疫遺傳模糊神經(jīng)網(wǎng)絡(luò)軟測量建模方法,用于海洋蛋白酶發(fā)酵過程參量預(yù)測。該方法首先利用模糊C 均值對輸入及輸出數(shù)據(jù)進(jìn)行處理,運(yùn)用改進(jìn)的免疫遺傳算法調(diào)整隸屬度函數(shù)參數(shù)和模糊神經(jīng)網(wǎng)絡(luò)連接權(quán)值,然后建立模糊神經(jīng)網(wǎng)絡(luò)模型,解決了其過早收斂的問題。將提出的FCM-IGA-FNN 方法應(yīng)用于海洋蛋白酶發(fā)酵過程關(guān)鍵生物量預(yù)測,并與傳統(tǒng)模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行比較,仿真結(jié)果表明,F(xiàn)CM-IGA-FNN 方法的預(yù)測精度更高,魯棒性更強(qiáng),對海洋蛋白酶的發(fā)酵過程具有指導(dǎo)意義。另外,在發(fā)酵關(guān)鍵參量預(yù)測研究中,動態(tài)優(yōu)化問題將是未來的研究重點(diǎn)。