朱湘臨 顧雯煒 王博
摘要:針對丁醇生產(chǎn)過程中發(fā)酵產(chǎn)物品質(zhì)參量難以實時測量,現(xiàn)有測量方法精度不高、測量結(jié)果受不確定因素影響較大的問題,提出一種基于貝葉斯推斷和支持向量回歸( Support vector machine regression,SVR)的多層軟測量建模方法。首先應(yīng)用貝葉斯推斷計算后驗概率、篩選偏置數(shù)據(jù),并對偏置數(shù)據(jù)校準,建立第一層SVR模型:然后利用貝葉斯推斷進行二次校準,建立第二層SVR模型,對第一層SVR模型輸出進行修正,得到最終預測結(jié)果,克服干擾和偏差引起的模型不準確問題。將基于貝葉斯推斷的多層支持向量回歸( Bi-SVR)預測模型應(yīng)用于丁醇發(fā)酵過程,仿真及實驗結(jié)果表明,相較于傳統(tǒng)SVR預測模型,系統(tǒng)在低干擾的情況下預測精度提高了4.52%,在高干擾時預測精度提高了5.37%。
關(guān)鍵詞:微生物發(fā)酵;貝葉斯推斷;支持向量機回歸;軟測量
中圖分類號:TP319
文獻標識碼:A
文章編號:1672-7800( 2020)004-0183-06
0 引言
隨著科技的進步,各國能源開采和研究逐漸轉(zhuǎn)向可再生方向,生物能源以其可再生和低污染等優(yōu)點成為現(xiàn)代能源研究的熱點。乙醇是美國石油危機以來最先進行研究的生物燃料,經(jīng)過長期研究發(fā)現(xiàn),和乙醇相比,丁醇具有更高的能量密度和燃燒值,能夠以任意比例和汽油混合使用,并且原有燃機不需要作任何改動就可直接使用,擁有廣闊的研究前景[1]。但是丁醇發(fā)酵過程復雜,涉及許多生物量,實現(xiàn)丁醇工業(yè)化生產(chǎn)需要克服其在線精準測量難題。
基于過程數(shù)據(jù)和預測能力的軟測量技術(shù)因其良好的測量能力得到學術(shù)界和工業(yè)界的關(guān)注[2]。軟測量方法可以歸結(jié)為兩種:①基于生物機理進行建模;②基于歷史數(shù)據(jù)驅(qū)動進行建模。前一種方法需要基于生物機理知識開發(fā)模型,這些模型用于闡明過程與結(jié)果這兩個變量之間復雜的物理、化學或生物關(guān)系[3]。因此基于機理知識的軟測量建模需要耗費很大的精力在機理研究上,極易影響軟測量建模的準確性。因此,僅取決于歷史數(shù)據(jù)的數(shù)據(jù)驅(qū)動軟測量技術(shù)更有研究和發(fā)展前景[4]。
早期軟測量技術(shù)的數(shù)據(jù)驅(qū)動建模方法集中于多元統(tǒng)計技術(shù),例如偏最小二乘法( Partial least squares,PLS)。這類方法可以處理變量的共線性,但是PLS本質(zhì)上是線性模型,不能處理非線性過程,除非內(nèi)核函數(shù)等特定的非線性變化被整合[5]。人工神經(jīng)網(wǎng)絡(luò)( Artificial neural networks,ANNs)已應(yīng)用于構(gòu)建非線性過程的軟測量模型。一些學者研究將神經(jīng)網(wǎng)絡(luò)與PLS等多元統(tǒng)計技術(shù)結(jié)合用于非線性系統(tǒng)的軟測量技術(shù)[6]。利用人工神經(jīng)網(wǎng)絡(luò)模擬過程中的非線性關(guān)系,PLS用來處理測量數(shù)據(jù)的共線性以及替換缺失值問題[7]。盡管ANN技術(shù)已被證明能夠處理系統(tǒng)非線性和代表過程知識,但其需要龐大的數(shù)據(jù)庫支撐,因此所訓練的一般模型預測效果較差。另外,神經(jīng)網(wǎng)絡(luò)也可能會收斂到局部最小值,從而影響軟測量結(jié)果的準確性[8]。
獨立分量分析(Independent component analysis,ICA)和支持向量機( Support Vector Machines,SVM)也應(yīng)用于軟測量技術(shù)開發(fā)。ICA可基于高階統(tǒng)計量提取相互獨立的分量,并識別傳統(tǒng)PLS方法無法處理的非高斯過程特征[9]。現(xiàn)有的一些軟測量建模方法沒有充分考慮到實際生產(chǎn)中可能產(chǎn)生的不確定情況,包括缺失值、外部干擾所導致的測量誤差和漂移、樣本延遲和數(shù)據(jù)長度不規(guī)則等[10-11]。貝葉斯推斷作為處理系統(tǒng)不確定性的強大概率技術(shù)已經(jīng)引起人們對過程系統(tǒng)各個領(lǐng)域的興趣,包括軟測量建模[12-13]。Yan等[14]提出用貝葉斯推斷法選擇SVM模型參數(shù)值并優(yōu)化軟測量模型。之后有很多研究人員將貝葉斯推斷與SVM相結(jié)合進行建模,取得了良好的預測效果[15]。
本文將支持向量回歸與貝葉斯推斷相結(jié)合,借鑒神經(jīng)網(wǎng)絡(luò)的深度學習方法思路進行多層建模,用于非線性生物丁醇發(fā)酵過程中的軟測量開發(fā)。首先,在預處理步驟中展開和縮放多路數(shù)據(jù)矩陣;然后,將過程變量的測量數(shù)據(jù)用于貝葉斯推斷,以此估計模型輸入空間內(nèi)所有樣本的后驗概率,對相應(yīng)后驗概率小于預定義置信水平的樣本子集用貝葉斯標識和校準估算。將處理過的輸入樣本與第一層輸出數(shù)據(jù)一起用于構(gòu)建第一層支持向量回歸模型。同樣,用貝葉斯推斷篩選在置信度界外的后驗概率偏置數(shù)據(jù);最后,由第一層預測模型的校準輸入和輸出數(shù)據(jù)進行擬合構(gòu)建第二層SVR模型,得到準確的預測值。參數(shù)C的一組值。通過最小化平均根均值、多重交叉驗證,最后確定C=10,;σ=1是最佳選擇。
2 基于貝葉斯推斷的多層軟測量建模
為處理測量過程中可能出現(xiàn)的干擾、噪聲、樣本延遲和缺失值等問題,將貝葉斯推斷與支持向量回歸相結(jié)合,建立軟測量預測模型。假設(shè)過程變量的多路輸入數(shù)據(jù)矩陣是X(Ix Jx×L),輸出矩陣是Y(/x Jy×L)。這里L表示批數(shù),Jx和JY表示輸入及輸出變量的數(shù)目,L是每次發(fā)酵的觀測數(shù)。首先,利用動態(tài)時間規(guī)整( Dynamic time warping,DTW)技術(shù)對齊和同步不等長度的輸入數(shù)據(jù);然后沿著每組變量列的不同采樣時刻進行數(shù)據(jù)堆疊,將多路輸入和輸出數(shù)據(jù)矩陣展開成兩維矩陣X(IL×Jx)和Y(IL×JY)[16-17],如圖1所示。
利用貝葉斯推理對輸入和輸出測量進行校準,構(gòu)造第二層SVR模型,并將修正的輸入測量值反饋給該模型以預測最終輸出。對于任何一組測量數(shù)據(jù),需要計算在任意采樣時刻,。上的同步數(shù)據(jù)向量的后驗概率,從而確定數(shù)據(jù)不確定性的重要性。對于任何有偏差的測量,可以應(yīng)用基于貝葉斯推理的數(shù)據(jù)校準,將校準數(shù)據(jù)向量作為輸入直接發(fā)送到第二層SVR模型,以獲得不同質(zhì)量屬性的預測。需要注意的是,第一層SVR模型僅是在訓練階段用于輸出數(shù)據(jù)校準,而第二層SVR才是作為學習和預測的主要軟測量模型。設(shè)計的貝葉斯推理方法能夠處理不同類型測量的不確定性,包括缺失值、傳感器偏差和漂移。與此同時,采用支持向量回歸方法對過程變量和輸出之間的非線性關(guān)系進行建模。
對基于貝葉斯推斷的多層支持向量回歸軟測量建模方法總結(jié)如下:①分別為輸入和輸出變量形成兩個多路訓練數(shù)據(jù)矩陣x和v;②使用動態(tài)時間彎曲技術(shù)對齊和同步數(shù)據(jù)長度;③對多路輸入和輸出數(shù)據(jù)矩陣進行可變智能展開,并將它們轉(zhuǎn)換成二維矩陣;④計算輸入樣本的后驗概率。對于相應(yīng)的后驗概率小于顯著性水平a%的樣本標記為具有顯著不確定性的有偏測量;⑤基于貝葉斯推理對偏置輸入測量進行校準;⑥使用校準的輸入數(shù)據(jù)連同原始輸出樣本建立第一層SVR模型;⑦利用來自第一層SVR模型的預測輸出值,估計所有輸出樣本的后驗概率,并使用與步驟④相同的統(tǒng)計規(guī)則識別偏差測量;⑧對偏差輸出測度進行貝葉斯修正;⑨使用校準的輸入和輸出數(shù)據(jù)構(gòu)建第二層SVR模型;⑩對于任何新的過程測量樣本,計算同步輸入向量的后驗概率并確定其是否顯著偏置;(11)偏置輸入測量數(shù)據(jù)校正,實現(xiàn)基于貝葉斯推理;(12)將無偏置或校準的輸入數(shù)據(jù)發(fā)送到第二層SVR模型,以獲得相應(yīng)的質(zhì)量變量預測。
圖2為該方法流程。
3 丁醇發(fā)酵多層軟測量應(yīng)用
現(xiàn)代計算機技術(shù)的迅猛發(fā)展為發(fā)酵生產(chǎn)智能化奠定了良好基礎(chǔ),準確和可靠的在線參數(shù)測量是不可或缺的環(huán)節(jié),既可實時觀測和記錄生產(chǎn)數(shù)據(jù),又可實現(xiàn)發(fā)酵生產(chǎn)中的精準控制。本文以丁醇發(fā)酵為例,應(yīng)用多層軟測量建模方法進行數(shù)據(jù)的預測實驗,并與常規(guī)SVR方法下的預測結(jié)果進行比較分析。
3.1 丁醇發(fā)酵工藝
丁醇發(fā)酵不同于乙醇的“一步法”發(fā)酵,需要經(jīng)過“兩步法”:先將木質(zhì)纖維水解再向水解液中加入拜氏梭菌進行發(fā)酵生產(chǎn),在發(fā)酵過程中會產(chǎn)生有毒物質(zhì)抑制發(fā)酵[18]。實驗表明加入適量的碳酸鈣可實現(xiàn)脫毒效果,同時加入適量丁酸能起到促進丁醇生產(chǎn)的作用。發(fā)酵罐是發(fā)酵過程中的主要設(shè)備,需要提供微生物生長必需的養(yǎng)分、水、空氣和適宜的溫度[19]。在該過程中分別通過操縱酸/堿和水溫控制發(fā)酵罐中的pH值和溫度。根據(jù)丁醇發(fā)酵工藝,酸堿平衡添加物分別為碳酸鈣和丁酸控制發(fā)酵過程中的pH值。碳酸鈣起到抑制劑作用,丁酸起到促進丁醇生產(chǎn)的作用[20]剛。丁醇發(fā)酵過程如圖3所示。
在此過程中,選擇生產(chǎn)丁醇的4個最關(guān)鍵濃度變量作為軟傳感器輸出,其它6個測量變量用作輸人[21],輸入和輸出變量分別標記為I1-16和O1-O3,如表1所示。
3.2 多層軟測量預測結(jié)果比較
為形成訓練數(shù)據(jù)集,隨機取30次發(fā)酵數(shù)據(jù),每次持續(xù)72小時。測試分為兩次,每次添加不同的干擾以驗證軟測量模型性能。因為丁醇發(fā)酵具有非線性、時變性和多相特征等特點,所以本文采用RMSE指數(shù)評估軟測量模型性能:
其中( )和( )分別是第,個輸出變量的實際值與估計測量值。在低干擾情況下兩種不同類型的軟測量模型最終得到的預測結(jié)果如圖4、圖5和圖6所示。
同時,對SVR和Bi-SVR方法的軟測量建模及預測結(jié)果進行定量比較,見表3。
從軟測量預測結(jié)果可以看出,在所有3個輸出變量的預測精度方面,所提出的Bi-SVR方法優(yōu)于傳統(tǒng)的SVR方法。在圖5中,SVR預測的菌體濃度與實際測量值有一定偏差,走勢基本一致但是缺乏精度。相比之下,Bi-SR方法的預測與實際測量值的軌跡基本吻合,偏差較小。由表3可知,Bi-SVR方法訓練和測試樣本的RMSE指數(shù)值均小于SVR法,表明所提出的Bi-SVR方法能夠有效處理干擾問題并糾正偏置測量。傳統(tǒng)的SVR方法會將偏置數(shù)據(jù)進行模型擬合從而導致模型的準確度下降。Bi-SVR方法可以利用貝葉斯推斷刷新偏置數(shù)據(jù),并對具有偏差的輸入輸出進行校準。對于圖6中的葡萄糖濃度預測,SVR軟傳感器預測值與實際值偏差較大。相比之下,Bi-SVR方法在貝葉斯框架下具有最小的誤差。圖7中丁醇濃度的預測值在SVR和Bi-SVR方法下初期表現(xiàn)相差不大。當干擾出現(xiàn)時預測結(jié)果會出現(xiàn)波動,偏離實際值。可以看出,除了利用貝葉斯推斷進行偏置數(shù)據(jù)的校正之外,在貝葉斯框架中還保留了支持向量回歸機的固有泛化能力。
為了進一步驗證Bi-SVR方法在具有偏差測量數(shù)據(jù)下的性能,在第二個測試樣本中加入更高干擾。圖7、圖8和圖9比較了輸出變量的預測。
如圖8、圖9和圖10所示,SVR方法的預測值與實際輸出的測量值具有較大誤差,該模型對隨機誤差或干擾的響應(yīng)較差,當高干擾出現(xiàn)時預測會出現(xiàn)明顯偏差,與實際值偏離較大,不能準確進行輸出預測。Bi-SVR方法在高干擾情況下也會出現(xiàn)一些波動,但其預測值與實際值相差較小,只是穩(wěn)定性有所下降。
表4為兩種軟測量方法在高干擾情況下的預測輸出RMSE值。雖然在高干擾測試中Bi-SVR方法的RMSE值比低干擾大,但是對比所有的輸出變量,它們?nèi)匀恍∮赟VR方法的預測值。與SVR方法相比,Bi-SVR方法在丁醇濃度的平均預測RMSE低達0.025,遠小于0.144。其它兩個輸出變量預測結(jié)果更差,而Bi-SVR方法在這兩種情況下始終保持良好的預測結(jié)果。該測試很好地證實了Bi-SVR方法處理實際問題過程中,對不同程度干擾和測量非線性、時變性系統(tǒng)的超強能力和有效性。
4 結(jié)語
本文提出一種新的基于貝葉斯推斷的多層支持向量機回歸框架,用于丁醇發(fā)酵的多層軟測量建模。該方法將貝葉斯推斷與第一層SVR模型結(jié)合起來,以篩選出具有偏差的輸入和輸出值。第二層SVR模型建立在校準之后的數(shù)據(jù)樣本之上,有效避免了干擾和偏差引起的模型不準確問題。而傳統(tǒng)的SVR方法受此影響,其預測能力因測量偏差和誤差而顯著降低。
將所提出的Bi-SVR方法應(yīng)用于丁醇發(fā)酵過程中,并將其性能與常規(guī)SVR方法的軟測量預測能力進行比較,兩次測試樣本具有不同水平干擾。預測結(jié)果表明,Bi-SVR方法能夠得到更準確的預測輸出,優(yōu)于傳統(tǒng)SVR方法,具有更高的魯棒性。以貝葉斯推斷的自我協(xié)調(diào)能力與非線性處理能力,結(jié)合從支持向量機繼承強大的泛化能力集成的Bi-SVR方法,有望成為微生物發(fā)酵過程的優(yōu)選軟測量建模方法。
參考文獻:
[1] 高越,郭曉鵬,楊陽,等.生物丁醇發(fā)酵研究進展[J].生物技術(shù)通報,2018,34(8):27-34.
[2] 姜哲宇,劉元清,朱湘臨,等.基于KFCM和AMDE-LSSVM的軟測量建模方法[J].計算機測量與控制,2018,26(8):46-50,92.
[3] 高世偉,趙力.一種基于支持向量機的軟測量建模方法[J].自動化儀表,2017,38(7):42-45.
[4] 張亞男.基于相關(guān)向量機的軟測量建模技術(shù)及應(yīng)用研究[D].無錫:江南大學,2017.
[5]潘宇雄,任章,李清東.動態(tài)貝葉斯最小二乘支持向量機[J].控制與決策,2014,29( 12):2297-2300.
[6]邱禹,劉乙奇,吳菁,等.基于深層神經(jīng)網(wǎng)絡(luò)的多輸出自適應(yīng)軟測量建模[J].化工學報,2018.69( 7):3101-3113.
[7]LIU S T, GAOX W, QIWH, et al. Soft sensor modelling of propyleneconversion based ona Takagi-Sugeno fuzzy neural net,vork optimizedwith independent component analysis and mutual information [J].Transactions of the Institute of Measurement and Control, 2019. 41 (3):193-199.
[8]秦云月.基于支持向量機和神經(jīng)網(wǎng)絡(luò)模型的識別[J].電子技術(shù)與軟件工程,2018(13):247-248.
[9] 楊凱,孫玉梅,王莉,等.基于ICA變量分組的集成軟測量方法研究[J].北京理工大學學報,2018,38(6):631-636.
[10]ZHENG W,CHENG S,LI Z.Soft-sensing modeling and intelligentoptimal control strategy for distillation vield rate of atmospheric distil-lation oil refining process[ J]. Chinese Journal of Chemical Engineer-ing, 2018(6):964-968.
[11]湯文超.基于貝葉斯網(wǎng)絡(luò)和支持向量機的尾礦庫潰壩風險預警方法研究[D].武漢:武漢理工大學,2017.
[12] 陳若曦.基于貝葉斯證據(jù)框架優(yōu)化的LS-SVM預測模型在空間電力負荷預測方法中的應(yīng)用研究[D].天津:天津理工大學,2017.
[13]YU X K, LI J X, XU J.Nonlinear filtering in unknown measurementnoise and target tracking system by variational bayesian inference[J]. Aerospace Science and Technology, 2018(5):175-179.
[14]YU J.A nonlinear kernel gaussian mixture model based inferentialmonitoring approach for fault detection and diagnosis of chemical pro-cesses[Jl. Chemical Engineering Science, 2012, 68(1):506-519.
[15]夏莘媛,戴靜,潘用科,等.基于貝葉斯證據(jù)框架下SVM的油層識別模型研究[J].重慶郵電大學學報(自然科學版),2016, 28(2):260-264. 272.
[16] 方云錄,苗茹.時間規(guī)整耦合線性判別分析的動作識別算法[J].計算機工程與設(shè)計,2018.39(11):3468-3474, 3499.
[17] 馬科,符春曉,劉建,等.基于DTW的貝葉斯方法在睡眠和喚醒分類中的應(yīng)用[J].計算機系統(tǒng)應(yīng)用,2018,27(1):195-200.
[18]蔡的.連續(xù)發(fā)酵生產(chǎn)生物丁醇新工藝[D].北京:北京化工大學, 2013.
[19] 圣亞春.拜氏梭菌F-6合成丁醇發(fā)酵工藝優(yōu)化及其動力學研究[D].哈爾濱:哈爾濱工業(yè)大學,2017.
[20]ZHOU Q, LIU Y, YUAN W Q.Kinetic modeling of lactic acid andacetic acid effects on butanol fermentation bv clostridium saccha-roperbutylacetonicum[ Jl. Fuel, 2018( 226): 1050-1057.
[21] MYUNC OH JANG, GYUNCHYUN CHOI. Techno-economic analy-sis of hutanol production from lignocellulosic biomass bv concentrat-ed acid pretreatment and hydrolysis plus continuous fermentation[J].Biochemical Engineering Journal, 2018( 134): 957-963.
(責任編輯:杜能鋼)
作者簡介:朱湘臨(1963-),男,江蘇大學電氣信息工程學院教授、碩士生導師,研究方向為微生物發(fā)酵設(shè)備及其檢測技術(shù);顧雯煒(1995-),男,江蘇大學電氣信息工程學院碩士研究生,研究方向為工業(yè)過程檢測與優(yōu)化控制;王博(1982-),男,博士,江蘇大學電氣信息工程學院副教授、碩士生導師,研究方向為復雜工業(yè)過程的建模與優(yōu)化控制。