徐圓,盧玉帥,才軼
(北京化工大學信息與科學技術學院,北京 100029)
隨著過程工業(yè)生產(chǎn)規(guī)模不斷擴大和生產(chǎn)要求不斷提高,生產(chǎn)系統(tǒng)日益呈現(xiàn)出高度復雜化、大規(guī)?;头蔷€性化的特點,為了保證工業(yè)生產(chǎn)過程能安全可靠的運行,避免生產(chǎn)系統(tǒng)發(fā)生故障造成不必要的財產(chǎn)損失和人員傷亡情況,故要求系統(tǒng)在出現(xiàn)故障之前就能提供故障的檢測和隔離。近年來,過程工業(yè)故障預測[1-3]已成為當前研究熱點問題,基于數(shù)據(jù)驅(qū)動的故障預測方法更是受到了國內(nèi)廣大學者的關注。張正道等[4-5]提出了基于未知輸入觀測器和神經(jīng)網(wǎng)絡的非線性時間序列故障預報模型,通過對系統(tǒng)變量狀態(tài)線性擬合達到故障預測的目的,但此方法只針對了單變量時序進行預測,忽略了多元變量時序的相關性問題。而系統(tǒng)的運行狀態(tài)通常由多元相關時序共同決定,該多元時間序列隨著時間推移可由系統(tǒng)運行累積得到。多元相關時序相比單變量時序包含了系統(tǒng)更多的動態(tài)信息,具有一定的信息確定性和完備性,能更好地表征系統(tǒng)的運行狀態(tài)。文獻[6-7]從多元相關變量的角度出發(fā)對系統(tǒng)進行了故障預測,通過優(yōu)化和改進預測模型提高了預測的準確度。同時一些學者針對系統(tǒng)的退化階段進行了建模預測,Si等[8]通過在時變系統(tǒng)中引入衰變因子,提出了一種基于動態(tài)證據(jù)推(dynamic evidential reasoning,DER)算法,有效地解決了時變系統(tǒng)的動態(tài)融合問題。文獻[9]提出了一種基于健康概率評估(health state probability estimation)故障預測方法,通過利用 SVM 分類器評價軸承退化階段的健康狀態(tài)概率,從而為系統(tǒng)提供一個長期的預測。
對于一些復雜的非線性系統(tǒng)而言,系統(tǒng)的整個運行周期可以劃分為正常工作階段、潛在故障階段和故障階段。有效地對系統(tǒng)運行狀態(tài)進行分段,能更好地利用系統(tǒng)的動態(tài)機理信息對系統(tǒng)進行故障預測,有利于提高系統(tǒng)故障預測的準確度。一般情況下,系統(tǒng)主要處于正常運行狀態(tài),運行期間產(chǎn)生大量的正常數(shù)據(jù),這類數(shù)據(jù)包含較少的故障信息,增加了實時在線監(jiān)測的工作量;同時,數(shù)據(jù)量過多可能導致信息冗余,由此加大了系統(tǒng)建模的難度和預測模型的計算復雜度,使得模型預測精度和可靠度大幅度降低。
本文提出了一種基于多元時序驅(qū)動的全流程故障預測方法。首先,為了降低系統(tǒng)變量的維數(shù),提高系統(tǒng)故障預測的精度,利用k-近鄰互信息方法對多元時序變量進行相關性選擇,得到一組相關變量集;其次利用改進的趨勢分析方法對相關變量集中的目標變量運行狀態(tài)趨勢進行監(jiān)測,通過與正常情況下變量的運行趨勢比較、分析確定目標變量發(fā)生突變的時刻并記錄,定義此時刻對應的樣本點為系統(tǒng)進入潛在故障階段的突變點,將系統(tǒng)的正常運行階段和潛在故障階段進行區(qū)分;最后,提取系統(tǒng)在潛在故障階段產(chǎn)生的數(shù)據(jù)并通過 ELM 神經(jīng)網(wǎng)絡進行故障預測。本研究以青霉素發(fā)酵過程為仿真對象,實驗驗證提出方法的有效性。
互信息[10-11]作為一種描述變量相關性的常用的方法,能準確地表述出變量間線性、非線性相關性。本文引用文獻[12]中多提到的k-近鄰互信息方法對變量進行相關性提取。
設X={X1,X2,…,XM}為輸入變量,Y為輸出變量(目標變量),輸入變量的維數(shù)用M表示。計算各輸入變量與輸出變量間的互信息I(Xi,Y),i=1,2,…,M。
考慮到輸入變量Xi和目標變量Y的相關性,如果輸入變量Xi滿足
則可認為輸入變量Xi是目標變量Y的相關變量;如果不滿足式(3),則說明輸入變量Xi中包含了較少或者不包含關于目標變量Y的信息,可認為輸入變量Xi與目標變量Y不相關,其中δ(δ∈[0,1])為相關性閾值,I(Y,Y)表示目標變量Y的自信息量。根據(jù)式(3)可確定與目標變量Y相關變量Xi,與目標變量Y一起可組成相關變量集合F,F(xiàn)={Xi,Y∣I(Xi,Y)>δI(Y,Y)}。
為了快速判定系統(tǒng)是否進入到潛在故障階段,采用趨勢提取的方法對特征變量在線實時監(jiān)測,通過分析變量趨勢的斜率變化,確定系統(tǒng)是否進入潛在故障階段。傳統(tǒng)的趨勢提取方法[13-14]主要分為 4個步驟:①在線數(shù)據(jù)的線性分段;②片段的分類,把片段分成7個有時間相關的趨勢;③ 分類片段的半定性轉(zhuǎn)換;④ 相鄰片段的整合??紤]到本次研究對象數(shù)據(jù)波動小的特點,也為了減少算法的復雜度,對算法做以下簡化和修改。
假定某段數(shù)據(jù)經(jīng)最小二乘法擬合得到的數(shù)學模型如下所示
式中,Δt為采樣時間,t1為未來某個時刻,k=1,2,3,…,外推值與真實值的誤差為
記 cusum(t1+kΔt)為(t1+kΔt)時刻誤差的累積和,則有
預設定一個閾值參數(shù)th1,如滿足|cusum(t1+kΔt)|<th1,則認為(t1+kΔt)時刻的數(shù)據(jù)能被此曲線模型所接受;如滿足|cusum(t1+kΔt)|≥th1,則從t1+kΔt時刻開始,提取未來10個時刻的數(shù)據(jù)進行下一次曲線的擬合,得到下一個線性片段,cusum被重置為 0,進行下次判斷。分段完成后,設相鄰的兩片段斜率分別為p1、p2(假設p1>p2),若滿足
則把相鄰的兩片段進行整合,得到整個信號的運行趨勢,最后通過對趨勢片段斜率的分析比較確定出系統(tǒng)的突變點,式(8)中α∈(0~1)。
ELM神經(jīng)網(wǎng)絡具有訓練速度快、精度高,泛化能力強等特點,選用 ELM 構(gòu)建故障預測模型,能有效地提高預測精度[15-17]。本文將 ELM 分別用于多元時間序列預測和故障識別兩個部分,并通過子網(wǎng)1和子網(wǎng)2實現(xiàn)其功能。
在進行多元時間序列預測時,子網(wǎng)1的輸入輸出層節(jié)點數(shù)可根據(jù)第1.2節(jié)得到的相關變量集F的維數(shù)確定,輸入樣本為集合X
子網(wǎng) 1實際輸出為O={O1,O2,…,Os},訓練時期望輸出設為Oe。
式中,t表示輸入樣本的起始時刻,n為輸入樣本數(shù),P為預測步長,s為子網(wǎng)1的輸入層和輸出層的節(jié)點數(shù)。
故障識別部分,子網(wǎng) 1 的實際輸出O={O1,O2,…,Os}作為子網(wǎng)2的輸入,子網(wǎng)2的隱含層節(jié)點數(shù)為b,子網(wǎng)2 的輸出y1,y2,…,ym分別代表m種故障類型。
圖1為將ELM同時用于多元時間序列預測和故障識別的模型結(jié)構(gòu)。
圖1 ELM神經(jīng)網(wǎng)絡故障預測模型結(jié)構(gòu)Fig.1 ELM neural network fault prediction model
青霉素發(fā)酵過程由Pensim仿真平臺模擬實現(xiàn),其模型結(jié)構(gòu)主要是由 Birol等[18-20]根據(jù)前人的實驗數(shù)據(jù)對Bajpai 模型進行改進而來。該模型可以模擬各種操作條件下生物量,CO2、青霉素、碳源、氧氣和熱量產(chǎn)生的濃度,其中生物量濃度作為青霉素生產(chǎn)過程中的一個關鍵變量,過程中所產(chǎn)生的數(shù)據(jù)已被廣泛應用于過程的故障監(jiān)控和預測。圖2所示為青霉素發(fā)酵過程的流程圖。
青霉素發(fā)酵過程一共包括 15個變量,如表 1所示。本研究中,取關鍵變量生物量濃度(XV7)用于青霉素發(fā)酵過程的狀態(tài)監(jiān)測。
圖2 青霉素發(fā)酵過程流程Fig.2 Flow diagram of penicillin fermentation process
表1 青霉素發(fā)酵過程變量Table 1 Variables of penicillin fermentation process
表2 發(fā)酵過程故障Table 2 Failures of fermentation process
基于Pensim仿真平臺的青霉素發(fā)酵仿真過程,實驗仿真時間設定為200 h,采樣時間間隔為0.04 h,定義的故障類型如表2所示。
正常操作情況,取 1000組數(shù)據(jù)對相關變量進行選擇。變量 7(生物量濃度)作為目標變量,其余14個變量作為輸入變量。在本實驗中,設定k-近鄰距離為50,相關性閾值δ=0.4366,互信息相關性分析結(jié)果如圖3所示。
圖3 目標變量與各變量之間的互信息量Fig.3 Mutual information between target variable and other variables
從圖3可以看出,變量5(物料濃度)、變量6(溶氧濃度)、變量13(產(chǎn)熱)、變量14(冷卻水流量率)與目標變量7(生物量濃度)的相關性比較強,和目標變量一起組成相關變量集F={XV5,XV6,XV7,XV13,XV14}。各變量與目標變量的互信息如表3所示。
表3 各變量與目標變量的互信息Table 3 MI between target variable and other variables
在線監(jiān)測目標變量的變化趨勢確定系統(tǒng)的運行狀態(tài),分別針對故障類型 1~3分別做了仿真分析。設定閾值參數(shù)th1=0.01,式(8)中參數(shù)α=0.5。圖4為系統(tǒng)正常目標變量趨勢分析結(jié)果以及系統(tǒng)處于故障1、2、3時的目標變量趨勢分析結(jié)果。
針對故障類型1的目標變量趨勢進行分析,由實驗數(shù)據(jù)可得,目標變量在第2504樣本處,也就是在時刻tc1=100.16 h時發(fā)生了突變,因此可認為系統(tǒng)在此時刻進入了潛在故障階段,實驗數(shù)據(jù)還得出了故障類型2和故障類型3的目標變量的突變時刻分別為tc2=100.24 h,tc3=100.12h。為了更好地評價趨勢分析的有效性以及對系統(tǒng)潛在故障階段和故障階段進行區(qū)分,在本研究中,取TH=μ±3σ作為青霉素發(fā)酵仿真過程中的故障閾值,忽略系統(tǒng)對集合F外其他變量和運行在滯后期的影響,故障類型1~3最先超過閾值控制線的變量分別為變量 5,變量 6和變量 13,發(fā)生故障時刻分別為tf1=104.32h、tf2=105.72h、tf3=107.04h,也就是說系統(tǒng)在發(fā)生故障1~3時,分別在時刻tf1~tf3進入到了故障工作階段。趨勢分析方法帶來的誤差ei(i=1,2,3)可由式(11)求得
式中,數(shù)字100表示在仿真研究過程中加入干擾的時刻,由式(11)可計算得到 3種故障類型的誤差分別為e1=0.0370、e2=0.0420、e3=0.0170,3種故障類型誤差都在允許的誤差范圍內(nèi),由此驗證了方法的有效性。
圖4 目標變量趨勢分析結(jié)果Fig.4 Target variable trend analysis
構(gòu)建ELM神經(jīng)網(wǎng)絡預測模型,從時刻100 h開始,分別從故障類型1~3各取500組數(shù)據(jù)作為輸入訓練樣本,取44組數(shù)據(jù)進行泛化,預測步長P=6,預測模型神經(jīng)網(wǎng)絡結(jié)構(gòu)為5-100-5。本文分別以故障類型1和故障類型2的變量6為例做數(shù)據(jù)預測,預測如圖5、圖6所示。
各故障的變量的預測均方根誤差如表4所示。
圖5 故障1的變量6數(shù)據(jù)預測Fig.5 Data prediction of variable 6th of fault 1
圖6 故障2的變量6數(shù)據(jù)預測Fig.6 Data prediction of variable 6th of fault 2
表4 各變量的均方根誤差Table 4 RMSE of variables
表5 故障識別結(jié)果Table 5 Results of fault identification
本文從全流程的角度出發(fā),提出了一種基于多元時序驅(qū)動的復雜過程故障預測方法。通過提取過程特征變量,提出改進趨勢分析方法在線監(jiān)測系統(tǒng)的運行狀態(tài),并提取系統(tǒng)潛在故障階段的數(shù)據(jù)進行建模實現(xiàn)對系統(tǒng)進行故障預測。通過青霉素發(fā)酵過程的仿真結(jié)果表明,所提方法滿足在線預測的要求,能夠至少提前12 min對系統(tǒng)故障做出預報,給操作員提供了足夠的反應時間,方便其及時檢測到并排除故障,保證了復雜過程工業(yè)安全可靠的生產(chǎn),具有重要的現(xiàn)實意義。
[1]Ai Hong(艾紅), Zhou Donghua(周東華). Fault prediction approach for dynamic system [J].Journal of Huazhong University of Science and Technology:Natural Science Edition(華中科技大學學報:自然科學版), 2009, 37(1): 222-225
[2]Sun Qiang(孫強), Yue Jiguang(岳繼光). Review on fault prognostic methods based on uncertainty [J].Control and Decision(控制與決策),2014, 29(5): 1-10
[3]Xu Yuan(徐圓), Liu Ying(劉瑩), Zhu Qunxiong(朱群雄). A complex process fault prognosis approach based on multivariate delayed sequences [J].CIESC Journal(化工學報), 2013, 64(12): 4290-4295
[4]Zhang Zhengdao(張正道), Hu Shousong(胡壽松). Fault prediction for nonlinear time series based on unknown input observer [J].Control and Decision(控制與決策), 2005, 20(7): 769-772
[5]Hu Shousong(胡壽松), Zhang Zhengdao(張正道). Fault prediction for nonlinear time series based on neural network [J].Acta Automatica Sinica(自動化學報), 2007, 33(7): 744-748
[6]Zhang Zhengdao(張正道), Cui Baotong (崔寶同). On-line fault prediction of system based on hiding semi Markov model [J].Control and Decision(控制與決策), 2010, 25(12): 1853-1856
[7]De Carvalho A B, Pozo A, Vergilio S R. A symbolic fault-prediction model based on multiobjective particle swarm optimization [J].Journal of Systems and Software, 2010, 83(5): 868-882
[8]Si X S, Hu C H, Yang J B,et al. On the dynamic evidential reasoning algorithm for fault prediction [J].Expert Systems with Applications,2011, 38(5): 5061-5080
[9]Kim H E, Tan A C C, Mathew J,et al. Bearing fault prognosis based on health state probability estimation [J].Expert Systems with Applications, 2012, 39(5): 5200-5213
[10]Herman G, Zhang B, Wang Y,et al. Mutual information-based method for selecting informative feature sets [J].Pattern Recognition, 2013,46(12): 3315-3327
[11]Lü Ning(呂寧), Yu Xiaoyang(于曉洋). Fault diagnosis in TE process based on feature selectionviasecond order mutual information [J].CIESC Journal(化工學報), 2009, 60(9): 2252-2258
[12]Liu Xiaoxin(劉曉欣). Correlation analysis and variable selection for multivariate time series based on mutual information [D]. Dalian :Dalian University of Technology, 2013
[13]Charbonnier S, Garcia-Beltan C, Cadet C,et al. Trends extraction and analysis for complex system monitoring and decision support [J].Engineering Applications of Artificial Intelligence, 2005, 18(1): 21-36
[14]Charbonnier S, Portet F. A self-tuning adaptive trend extraction method for process monitoring and diagnosis[J].Journal of Process Control, 2012, 22(6): 1127-1138
[15]Gao Guangyong(高光勇), Jiang Guoping(蔣國平). Prediction of multivariable chaotic time series using optimized extreme learning machine [J].Acta Physica Sinica(物理學報), 2012, 61(4): 1-9
[16]Wong P K, Yang Z, Vong C M,et al. Real-time fault diagnosis for gas turbine generator systems using extreme learning machine [J].Neurocomputing, 2013, 128(3): 249-257
[17]Peng Di(彭荻), He Yanlin(賀彥林), Xu Yuan(徐圓), Zhu Qunxiong(朱群雄). Research and chemical application of feature extraction based AANN-ELM neural network [J].CIESC Journal(化工學報), 2012,63(9): 2920-2925
[18]Liu Yi(劉毅), Wang Haiqing(王海清). Pensim simulator and its application in penicillin fermentation process [J].Journal of System Simulation(系統(tǒng)仿真學報), 2007, 18(12): 3524-3527
[19]Birol G, ündey C, Cinar A. A modular simulation package for fed-batch fermentation: penicillin production [J].Computers &Chemical Engineering, 2002, 26(11): 1553-1565
[20]Xiong Weili(熊偉麗), Wang Xiao(王肖), Chen Minfang(陳敏芳), Xu Baoguo(徐保國). Modeling for penicillin fermentation process based on weighted LS-SVM [J].CIESC Journal(化工學報), 2012, 63(9):2913-2919