羅 靜,胡瑾秋
自適應綜合指標的化工過程參數(shù)報警閾值優(yōu)化方法研究
羅 靜,胡瑾秋*
中國石油大學(北京)機械與儲運工程學院,北京 102249
面臨日益復雜的化工過程生產(chǎn)裝置,提高化工過程報警系統(tǒng)的性能有著重要的指導意義。傳統(tǒng)的化工過程參數(shù)報警閾值設(shè)置方法一般只考慮誤報警,并沒有同時考慮誤報警和漏報警,導致報警系統(tǒng)產(chǎn)生大量的錯誤報警。針對上述問題,提出自適應綜合指標的報警閾值優(yōu)化方法。采用核密度估計方法、基于歷史數(shù)據(jù)對過程報警狀態(tài)進行估計,綜合考慮誤報警率和漏報警率,從而建立優(yōu)化報警閾值的目標函數(shù),將數(shù)值優(yōu)化算法內(nèi)嵌于粒子群算法形成新的算法進行求解。案例分析中將此方法應用于TE過程,結(jié)果表明,用此方法設(shè)置的報警閾值監(jiān)測誤報率為0,漏報率為0.78%。與傳統(tǒng)的3σ法相比,此方法能夠在保證低漏報率的條件下有效降低誤報警率,提高化工過程報警系統(tǒng)的性能,減輕現(xiàn)場操作人員的工作壓力,減少人員生命財產(chǎn)損失。
自適應;綜合指標;誤報警;漏報警;核密度估計;粒子群算法
化工生產(chǎn)過程日益復雜,具有大量的過程數(shù)據(jù),及時準確地判斷這些過程數(shù)據(jù)的異常狀況關(guān)乎到化工生產(chǎn)過程的安全性與可靠性,進而關(guān)乎到人員生命財產(chǎn)安全。因此,提高過程參數(shù)報警系統(tǒng)的性能具有重大意義。當前工業(yè)過程中存在著報警數(shù)目多的問題,根據(jù)WIT的研究[1],操作員有效處理的報警為每天150個(每10分鐘1個報警),一天最多處理300個報警(每5分鐘1個報警),而在實際過程中則遠遠超出這個數(shù)字。報警數(shù)目多的直接原因是報警閾值設(shè)置的不合理,閾值范圍設(shè)置得過小會產(chǎn)生過多的報警,其中大部分為誤報警[2-4]。相反,如果閾值范圍設(shè)置得過大可能會漏掉重要報警,報警系統(tǒng)將失去作用。
常見的過程參數(shù)報警閾值的設(shè)置分為3類:(1)基于模型的方法;(2)基于知識的方法;(3)基于統(tǒng)計的方法。文獻[5]建立了在線和離線模型進行報警閾值的優(yōu)化;文獻[6]根據(jù)數(shù)據(jù)的伯努利分布特性,在多變量統(tǒng)計過程中構(gòu)建統(tǒng)計量的二級的控制限,減少了誤報警;文獻[7]將模糊神經(jīng)網(wǎng)絡(luò)和遺傳算法用于閾值估計的訓練;文獻[8]提出核密度估計方法得到多元統(tǒng)計量的概率密度函數(shù),之后由等概率密度曲線得到數(shù)據(jù)分布的正常區(qū)間。在實際工業(yè)過程中應用最多的是3σ閾值設(shè)定方法,它是根據(jù)過程參數(shù)在正常狀態(tài)的歷史數(shù)據(jù),計算分別得到其均值μ和方差σ,將閾值范圍設(shè)在區(qū)間內(nèi)。根據(jù)概率論知識,落在此區(qū)間內(nèi)的概率為99.73%,而落在此范圍外的概率僅為0.27%,屬于小概率事件。然而,以上方法在設(shè)置閾值時一般只考慮誤報警,并沒有同時考慮漏報警,導致報警系統(tǒng)產(chǎn)生大量的錯誤報警。
鑒于此,提出自適應綜合指標的報警閾值優(yōu)化方法。采用核密度估計方法、基于歷史數(shù)據(jù)對過程報警狀態(tài)進行估計,綜合誤報警率和漏報警率,建立優(yōu)化報警閾值的目標函數(shù),將數(shù)值優(yōu)化算法內(nèi)嵌于粒子群算法形成新的算法進行求解。此方法能夠有效減少誤報警和漏報警次數(shù),提高化工過程報警系統(tǒng)的性能,在減少現(xiàn)場操作人員工作壓力的同時又能夠捕捉到重要報警信息,保證現(xiàn)場安全,減少人員生命財產(chǎn)損失。
1.1 核密度估計
為了構(gòu)造報警閾值優(yōu)化的目標函數(shù),需要利用核密度估計方法來估計過程參數(shù)的報警狀態(tài),以確定誤報警和漏報警。核密度估計(Kernel Density Estimation, KDE)是一類基于概率密度函數(shù)的非參數(shù)估計法,它從數(shù)據(jù)樣本本身出發(fā)研究數(shù)據(jù)分布的特征。KDE基于歷史數(shù)據(jù)估計未知總體的概率密度函數(shù),使估計的密度函數(shù)與真正的密度函數(shù)間的均方積分誤差最小。KDE的表達式為:
式中,xi為歸一化后的自變量;f(x)為自變量概率密度的估計值,取f(x)=0.99時的自變量,返歸一化后得到自變量閾值δ;r為樣本數(shù);d為空間的維數(shù);f(x)為核函數(shù),本文選用高斯核函數(shù);h為窗寬,一維最優(yōu)窗寬的計算公式為
選定樣本后,根據(jù)式(1)和(2)計算每個樣本點的概率密度值,以其作為縱坐標,樣本點作為橫坐標,運用KDE方法得到過程參數(shù)概率密度函數(shù)曲線(如圖1所示)。圖中,左側(cè)曲線為正常數(shù)據(jù)分布曲線,右側(cè)曲線為異常數(shù)據(jù)分布曲線,豎線所對應的橫坐標為參數(shù)報警閾值,異常數(shù)據(jù)分布曲線下低于報警閾值部分的區(qū)域面積是漏報率的概率,正常數(shù)據(jù)分布曲線下超出報警閾值部分的區(qū)域面積是誤報率的概率。
圖1 過程參數(shù)概率密度Fig. 1 Process parameters probability density
根據(jù)最小錯誤率貝葉斯決策理論[16],誤報警和漏報警發(fā)生的概率可以通過式(3)、(4)計算:
式中,f(x|ω1)為正常情況下的概率密度函數(shù);f(x|ω2)為異常情況下的概率密度函數(shù);t為報警閾值??梢姡魣缶撝翟O(shè)置過大,誤報警的概率變小,而漏報警的概率變大;反之,誤報警的概率增大,而漏報警的概率減小。
1.2 數(shù)值優(yōu)化算法
本文選用最常見的數(shù)值優(yōu)化算法來尋找最佳閾值[1]。誤報警和漏報警均屬于錯誤報警,因此,將錯誤報警率作為數(shù)值優(yōu)化算法的目標函數(shù),建立如下報警閾值優(yōu)化問題
式中,f(x)是錯誤報警率;P1(e)是誤報警率;P2(e)是漏報警率;t是選擇的閾值;n是樣本點個數(shù);h是KDE的窗寬,由式(2)計算。
數(shù)值優(yōu)化算法的實現(xiàn)步驟如下:
(1)在區(qū)間[a,b],構(gòu)造兩點x1=a+q(b-a ),x2=a+(1-q)(b-a ),式中,q和(1-q)分別是算法的兩個系數(shù)一般取q=0.382;
(2)若F(x1)<F(x2),則搜索區(qū)間縮小為[a,x2], b=x2,判斷是否成立,如果成立轉(zhuǎn)到步驟(4),否則返回步驟(1);
(3)若F(x1)≥F(x2),則搜索區(qū)間縮小為[x1,b], a=x1,判斷是否成立,如果成立轉(zhuǎn)到步驟(4),否則返回步驟(1);
然而,數(shù)值優(yōu)化算法的系數(shù)q和(1-q)是人為設(shè)置的,并不能保證算法尋優(yōu)結(jié)果接近全局最優(yōu)。因此,本文采用粒子群(Particle Swarm Optimization, PSO)算法對系數(shù)q進行優(yōu)化,使尋優(yōu)結(jié)果接近全局最優(yōu)。
1.3 粒子群算法
粒子群(PSO)算法最早在1995年被提出,是一種從生物活動中得到啟發(fā)而模擬自然界生物集群現(xiàn)象的進化算法。在PSO算法中,每個優(yōu)化問題的潛在解都稱為“粒子”,所有的粒子都有一個由被優(yōu)化的函數(shù)決定的適應值(Fitness Value),每個粒子還有一個速度決定它們移動的方向和每一步的位移。然后粒子們就追隨當前的最優(yōu)粒子在解空間中搜索。PSO算法需要初始化一群隨機粒子(隨機解),然后通過迭代找到最優(yōu)解,在每一次迭代中,粒子通過跟蹤兩個“極值”來更新自己。第一個就是粒子本身所找到的最優(yōu)解,這個解稱為個體極值。另一個是整個種群目前找到的最優(yōu)解,這個解稱為全局極值。
假設(shè)在一個N維的目標搜索空間中,有m個粒子組成一個群落,將第i個粒子的位置表示為一個N維的向量,記為每一個粒子都是潛在的解,將帶入一個目標函數(shù)就可以計算出其適應值,根據(jù)適應值大小衡量的優(yōu)劣。第i個粒子的移動速度也是一個N維的向量,記為速度決定粒子在搜索空間單位迭代次數(shù)的位移。記第i個粒子迄今為止搜索到的最優(yōu)位置為整個粒子群迄今為止搜索到的最優(yōu)位置為粒子根據(jù)以下公式來更新其速度和位置
式中,i=1,2,…,m ;n=1,2,…,N;速度權(quán)重w隨機取值于[-1,1];學習因子c1和c2是非負常數(shù);r1和r2是介于[0,1]之間的隨機數(shù);vin是第i個粒子速度向量的第n維是常數(shù),根據(jù)實際情況設(shè)定。
迭代終止條件一般選為最大迭代次數(shù)或粒子群迄今為止搜索到的最優(yōu)化位置滿足適應閾值。因為是整個粒子群的最優(yōu)值,因此上述PSO算法也稱為全局PSO算法。
針對傳統(tǒng)閾值優(yōu)化方法僅考慮誤報警,并沒有綜合考慮誤報警和漏報警從而造成大量漏報的問題,提出自適應綜合指標報警閾值優(yōu)化方法。綜合考慮誤報警和漏報警兩個方面建立目標函數(shù),并用數(shù)值優(yōu)化算法內(nèi)嵌入PSO算法形成新的算法對報警閾值尋優(yōu),力求達到降低錯誤報警次數(shù)的目的,從而減輕現(xiàn)場操作人員的工作壓力。自適應綜合指標報警閾值優(yōu)化方法的工作流程如圖2所示,具體步驟如下:
步驟1:選擇化工過程某參數(shù)的正常樣本X∈R1×NS和故障樣本Y∈R1×NS。其中,NS是樣本點個數(shù),根據(jù)實際情況選??;
步驟2:繪制概率密度曲線,設(shè)置解區(qū)間?;跀?shù)據(jù)樣本X和Y,利用式(1)和(2)分別估算過程參數(shù)正常條件下和故障條件下的概率密度,以其作為縱坐標,樣本點作為橫坐標,繪制過程參數(shù)概率密度曲線,并設(shè)置解的區(qū)間[a,b]。若求報警閾值上限的區(qū)間,a=max(X )-3σ,b=max(X )+3σ;若求報警閾值下限的區(qū)間,a=min(X)-3σ,b=min(X)+3σ。式中,σ為正常樣本X的標準差;
步驟4:設(shè)置PSO算法的參數(shù)。粒子速度的慣性權(quán)重w隨機取值于[-1,1];粒子速度的最大值vmax=0.5;粒子個體最優(yōu)的學習因子c1=cθ1,其中,c=(2w+2)θ2,θ1和θ2均隨機取值于[0,1];粒子群體最優(yōu)的學習因子c2=c-c1;算法最大迭代次數(shù)M=200;種群個體數(shù)目m=50;算法精度e=0.000 1。
步驟5:初始化粒子的位置和速度。用系數(shù)iq對應的一維向量來標記第i個粒子在一維搜索空間中的位置。第i個粒子的移動速度也是一個一維的向量,記為設(shè)置第i個粒子的初始位置粒子的初始速度其中,3θ和4θ均是隨機取值于[0,1]的值。此時,記粒子代數(shù)1k=。
步驟7:粒子的位置和速度的更新。1kk=+,根據(jù)式(5)計算第i個粒子更新后的速度判斷當代第i個粒子的速度是否成立:1)若成立,令若不成立,判斷是否成立,若成立,令若不成立,根據(jù)式(6)計算第i個粒子更新后的位置使得
3.1 TE過程
由伊斯曼公司設(shè)計的TE(Tennessee Eastman)過程是一個基于實際工業(yè)過程的仿真平臺,共包含了反應器、冷凝器、壓縮機、分離器和汽提塔等5個操作單元,涉及到12個操作變量和41個測量變量。TE過程的工藝流程圖如圖3所示,部分測量變量如表1所示。
3.2 閾值監(jiān)測
以反應堆溫度為例,用自適應綜合指標的化工過程參數(shù)報警閾值優(yōu)化方法設(shè)置變量閾值,進行溫度監(jiān)測。與化工生產(chǎn)中常見的3σ法進行對比,證明該方法能夠降低錯誤報警率,優(yōu)化報警系統(tǒng)的性能。
3.2.1 自適應綜合指標報警閾值優(yōu)化方法
選擇TE過程反應堆溫度測量變量作為研究對象,運行過程512時刻,在第256時刻加入干擾,使反應堆冷卻水閥粘滯,前256時刻過程為正常狀態(tài),后256時刻過程為故障狀態(tài)。選取反應堆溫度前256組數(shù)據(jù)作為正常訓練樣本X∈R1×256,后256組數(shù)據(jù)作為故障訓練樣本Y∈R1×256。保持同樣的操作條件,運行過程256時刻,在第161時刻加入同樣的干擾,獲得測試樣本Z∈R1×256(反應堆溫度曲線如圖4所示);
根據(jù)數(shù)據(jù)訓練樣本X和Y,采用式(2)計算得反應堆溫度正常數(shù)據(jù)核密度估計的窗寬h1=0.382 8,反應堆溫度故障數(shù)據(jù)核密度估計的窗寬h2=0.729 9。根據(jù)式(2)分別估算反應堆溫度正常條件下和故障條件下的概率密度,以其作為縱坐標,樣本點作為橫坐標,繪制反應堆溫度的概率密度曲線(如圖5所示)。分別設(shè)置閾值上限的取值區(qū)間[120.449 2,120.450 8]和閾值下限的取值區(qū)間[120.349 2,120.350 8];
其中,F(xiàn)1(x)和F2(x)是錯誤報警率,t1和t2是選擇的閾值,KDE窗寬h1=0.382 8,h2=0.729 9。
運行報警閾值優(yōu)化算法:
(1)報警閾值上限優(yōu)化
圖2 自適應綜合指標報警閾值優(yōu)化方法步驟Fig. 2 Steps of the adaptive composite-indicator alarm threshold optimization method
圖3 TE工藝流程圖Fig. 3 Flowchart of the tennessee eastman process
表1 部分TE過程測量變量表Table 1 Part of TE process measured variables
設(shè)置PSO的參數(shù):粒子速度的慣性權(quán)重w=0.909 6,粒子速度的最大值vmax=0.5,粒子個體最優(yōu)的學習因子c1=0.562 3,粒子群體最優(yōu)的學習因子c2=0.561 9,算法最大迭代次數(shù)M=200,種群個體數(shù)目m=50,算法精度e=0.000 1。
調(diào)用閾值優(yōu)化算法進行迭代計算,算法共運行5次,輸出最優(yōu)報警閾值上限t1=120.450 3,最優(yōu)數(shù)值優(yōu)化算法參數(shù)q1=0.005 6,適應度G(q1)=0.001 0。
(2)報警閾值下限優(yōu)化
設(shè)置PSO的參數(shù):粒子速度的慣性權(quán)重w=-0.341 0,粒子速度的最大值vmax=0.5,粒子個體最優(yōu)的學習因子c1=0.022 0,粒子群體最優(yōu)的學習因子c2=0.380 5,算法最大迭代次數(shù)M=200,種群個體數(shù)目m=50,算法精度e=0.000 1。
圖4 反應堆溫度曲線Fig. 4 Reactor temperature curve
圖5 反應堆溫度的概率密度曲線Fig. 5 The probability density curve of reactor temperature
調(diào)用閾值優(yōu)化算法進行迭代計算,算法共運行6次,輸出最優(yōu)報警閾值下限t2=120.350 3,最優(yōu)數(shù)值優(yōu)化算法參數(shù)q2= 0.010 1,適應度G(q2)= 0.001 0。
用最優(yōu)的報警閾值[120.350 3,120.450 3]對反應堆溫度測試數(shù)據(jù)Z進行監(jiān)測,監(jiān)測結(jié)果如圖6所示
圖6 自適應綜合指標法監(jiān)測結(jié)果Fig. 6 Monitoring results of the adaptive comprehensive-index method
3.2.2 3σ法
計算反應堆溫度正常樣本X均值μ=120.400 4,標準差σ=3.533 3e-3。由3σ法求得報警閾值[μ-3σ,μ+3?]=[120.390 0,120.411 2],并用該閾值對測試數(shù)據(jù)Z進行監(jiān)測,監(jiān)測結(jié)果如圖7所示。
3.3 結(jié)果對比
自適應綜合指標報警閾值優(yōu)化方法與3σ法的誤報警和漏報警情況對比如下:
由表2可知,與3σ法相比,自適應綜合指標報警閾值優(yōu)化方法所設(shè)閾值誤報警率降低了51.95%,漏報警率僅為0.78%,接近于0,誤報警和漏報警次數(shù)之和減少131次,證明該方法可以有效減少誤報警次數(shù),提高報警系統(tǒng)性能,減少操作人員工作壓力。
(1)傳統(tǒng)的化工過程參數(shù)報警閾值設(shè)置方法一般只考慮誤報警,并沒有同時考慮誤報警和漏報警這兩個問題,導致報警系統(tǒng)產(chǎn)生大量的錯誤報警。針對這個問題,提出自適應綜合指標的報警閾值優(yōu)化方法。該方法采用核密度估計方法、基于歷史數(shù)據(jù)對過程報警狀態(tài)進行估計,綜合誤報警率和漏報警率,從而建立優(yōu)化報警閾值的目標函數(shù),并創(chuàng)新地將數(shù)值優(yōu)化算法內(nèi)嵌于粒子群算法形成新的算法進行求解。
(2)案例分析中,將新方法應用于TE過程的反應堆溫度監(jiān)測,分別優(yōu)化報警閾值上下限,并進行閾值監(jiān)測。
圖7 3σ法監(jiān)測結(jié)果Fig. 7 Monitoring results of the 3σ method
表2 TE過程反應堆溫度監(jiān)測的誤報次數(shù)和漏報次數(shù)Table 2 The number of false positives and false negatives of TE process reactor temperature monitoring
(3)自適應綜合指標報警閾值優(yōu)化方法所求的報警閾值監(jiān)測誤報率為0,漏報率為0.78%。與傳統(tǒng)的3σ法相比,此方法能夠在保證低漏報率的條件下有效降低誤報警率,提高化工過程報警系統(tǒng)的性能,減輕現(xiàn)場操作人員的工作壓力,減少人員生命財產(chǎn)損失。
[1]WIT J D.EEMUA recommendations for the design and construction of refrigerated liquefed gas storage tanks[J].Cryogenics, 1998, 28(12):800-804.
[2]FOONG O M, SUZIAH, ROHAYA D, et al. ALAP: Alarm prioritization system for oil refnery[J].Proceedings of the World Congresson Engineering and Computer Science, 2009, (2):1012-1017.
[3]CHAO C S, LIU A C. An alarm management framework for automated network fault identifcation[J].Computer Communications, 2004, 27(13):1341-1353.
[4]EBERHART R C, KENNEDY J.A new optimizer using particle swarm theory[C]. Sixth International Symposium on Micro and Human Science, 4-6 Oct.1995, (2): 39-43.
[5]JIANG R. Optimization of alarm threshold and sequential inspection scheme[J].Reliability Engineering and System Safety, 2010, 95:208-215.
[6]CHEN T. On reducing false alarms in multivariate statistical process control[J].Chemical Engineering Research and Design, 2010, 88(4): 430-436.
[7]MEZACHE A, SOLTANI F.A novel threshold optimization of ML-CFAR detector in Weibull clutter using fuzzy-neural networks[J]. Signal Processing, 2007, 87:2100-2110.
[8]MARTIN E B, MORRIS A J. Non-parametric confdence bounds for process performance monitoring charts[J].Process Control, 1996, 6(6):349-358.
A study of adaptive composite-indicator alarm threshold optimization of chemical process parameters
LUO Jing, HU Jinqiu
School of Mechanical & Storage and Transportation Engineering, China University of Petroleum-Beijing, Beijing 102249, China
Faced with increasingly complex chemical process plants, improving the performance of chemical process alarm systems is important. The traditional chemical process parameters alarm threshold setting method generally considers only false positives, but not taking both false positives and false negatives into account, leading to a lot of false alarms in alarm systems. To solve these problems, we used the alarm threshold optimization method based on an adaptive composite indicator. We used the kernel density estimation method to estimate the state of the process alarm based on historical data, integrating the false positives rate and false negatives rate to establish an objective function for optimal alarm thresholds. The numerical optimization algorithm was embedded in a particle swarm optimization algorithm, forming a new algorithm to solve the function. In case, this method was applied to the TE process. The results showed a false positive rate of 0, and a false negative rate of 0.78%. Compared with the traditional 3σ method, this method can effectively reduce the rate of false positives with a low false negative rate, and improve the performance of the chemical process alarm system. This will reduce stress on site operators, as well as the risks of loss of life and property.
adaptive; composite-indicator; false positives; false negatives; kernel density estimation; particle swarm optimization algorithm
2016-11-15
10.3969/j.issn.2096-1693.2016.03.036
(編輯 付娟娟)
羅靜, 胡瑾秋. 自適應綜合指標的化工過程參數(shù)報警閾值優(yōu)化方法研究. 石油科學通報, 2016, 03: 407-416
LUO Jing, HU Jinqiu. A study of adaptive composite-indicator alarm threshold optimization of chemical process parameters. Petroleum Science Bulletin, 2016, 03: 407-416. doi: 10.3969/j.issn.2096-1693.2016.03.036
*通信作者, hujq@cup.edu.cn