高慧慧,徐圓,朱群雄
(北京化工大學信息科學與技術學院,北京 100029)
報警系統(tǒng),作為過程工業(yè)裝置的首道保護層[1]及核心組成,其性能優(yōu)劣直接關系到過程安全、產(chǎn)品質量、生產(chǎn)成本甚至人員傷亡。不合理的報警管理系統(tǒng)極易產(chǎn)生報警泛濫,大大超出操作員的處理能力,淹沒關鍵或重要報警。此外,報警系統(tǒng)信息冗余繁雜,未能挖掘有價值信息實現(xiàn)高效可視化監(jiān)控,報警系統(tǒng)缺乏定期性能評估,這些都將導致報警系統(tǒng)喪失應有功能甚至產(chǎn)生錯誤導向[2]。最終,微小可控的異常事件會擴大為重大事故,甚至升級為嚴重災難。為保證報警系統(tǒng)設計合理化,實現(xiàn)報警規(guī)范管理,工業(yè)界已產(chǎn)生了一些參考和指導性文件[3-6]。ISA-18.02標準指出,過程報警管理是一個連續(xù)過程,對于已經(jīng)存在的報警系統(tǒng),連續(xù)的系統(tǒng)監(jiān)控與常規(guī)的性能評估是改善與提升報警系統(tǒng)性能的有效方法,也是基本原則。
利用數(shù)據(jù)可視化技術[7],將知識和數(shù)據(jù)進行有機融合,可以有效監(jiān)控、分析和處理大量報警信息,實現(xiàn)非圖形化形式所不能實現(xiàn)的目的,如模式挖掘、聚類、異常監(jiān)測等,幫助操作員理解過程信息及報警狀態(tài),及時做出正確響應,減少或避免人為失誤。除了過程變量趨勢曲線、報警總貌畫面、報警分組畫面等工業(yè)上普遍存在的可視化圖形外,有學者提出了高密度報警圖[8]、報警相似度色彩圖[9]、相關色彩圖[10]、時間序列剖面數(shù)據(jù)矩陣[11]、報警爆發(fā)率圖[12]等可視化工具,并采用凝聚層次聚類樹形結構對報警進行可視化聚類、分組,實現(xiàn)報警頻繁模式、關聯(lián)模式挖掘,從而幫助操作員快速識別滋擾報警以及過程不穩(wěn)定等異常。但上述可視化方法仍存在一些不足:①單張圖譜顯示的報警信息過多,非常雜亂,并不利于操作員檢查分析;②僅僅基于數(shù)據(jù)驅動,利用報警數(shù)據(jù)和過程數(shù)據(jù)進行分析,未能和過程知識進行有機融合和相互驗證,資源利用不充分;③未能對報警等級進行劃分及分層分級展示,無法識別關鍵報警,未能解決操作員處理報警的盲目性;④無法展示動態(tài)報警信息,無法快速識別報警根源。因此,需設計合適的報警信息可視化圖像,提高操作員對報警系統(tǒng)管理的效率。
為解決上述問題,本文對報警系統(tǒng)可視化監(jiān)控技術進行了一定研究,并設計構建了一些新型的可視化工具:基于信息融合的解釋結構模型(information fusion based interpretative structural modelling,IFISM),層次高密度報警圖(hierarchical high density alarm plot,HHDAP),層次優(yōu)先級圖(hierarchical priority plot,HPP),報警系統(tǒng)性能水平趨勢圖(performance level trend plot,PLTP)。以采用自尋優(yōu)控制策略的TE過程為例[13],清晰闡明了本文提出的新型可視化監(jiān)控技術的特色和優(yōu)勢。
報警系統(tǒng)監(jiān)控的目的就是識別報警系統(tǒng)中存在的問題,并采取糾正措施解決問題。監(jiān)控技術及工具的可靠性、可視性及可理解性直接影響報警系統(tǒng)監(jiān)控過程的效率,進而影響報警系統(tǒng)性能甚至過程安全。
在實際化工過程中存在著大量能量流、質量流、信號流以及物理連接路徑,而異常事件會沿著上述連接路徑進行傳播、擴散,導致大量報警信號產(chǎn)生。過程拓撲信息的有效獲取及表達對挖掘故障傳播路徑,識別報警變量間的因果關系非常重要。有學者依據(jù)過程知識,建立符號有向圖[14]、多級流模型[15]、計算機輔助工程交換模型[16]等實現(xiàn)過程拓撲信息和異常傳播路徑獲取,也有學者基于數(shù)據(jù)驅動,利用互相關分析[10]、傳遞熵計算[17]、貝葉斯網(wǎng)絡[18]等建立因果模型。但上述模型未實現(xiàn)過程知識和過程數(shù)據(jù)兩種信息的有機融合,缺乏層次特性和傳播路徑動態(tài)可視性。解釋結構模型(interpretive structural model,ISM)可以有效識別復雜過程中不同元素之間的內(nèi)在關系,通過添加元素之間的有向連接,可將模糊、不清晰的系統(tǒng)模型轉變?yōu)榍逦⒖梢暤膶哟文P?,目前已得到了廣泛成功應用[19]。因此,本文首先利用過程數(shù)據(jù)建立初始解釋結構模型,然后利用過程知識對該模型進行修正,最終生成基于信息融合的解釋結構模型IFISM,實現(xiàn)過程拓撲模型的構建,即靜態(tài)解釋結構模型。在實際生產(chǎn)過程中,依據(jù)報警先后順序,實時標注各變量的報警信息,由此形成了一種動態(tài)IFISM模型,處于相同或不同層次的報警變量構成了一條或多條因果鏈,不僅有利于操作員及時掌握過程信息,更有利于操作員進行報警根源分析,實現(xiàn)因果報警識別。
1.1.1 靜態(tài)IFISM模型 靜態(tài)IFISM模型旨在實現(xiàn)過程拓撲結構的層次可視化,其建立過程可分為以下幾個步驟:
(1)識別要研究的過程工業(yè)變量,剔除不重要或冗余變量;
(2)采集過程變量穩(wěn)態(tài)運行數(shù)據(jù),計算變量之間的偏相關系數(shù),建立初始結構鄰接矩陣(structural adjacent matrix,SAM);
(3)利用過程知識僅需對變量之間的雙向連接和直接連接關系進行修正,生成最終SAM;
(4)根據(jù) SAM 產(chǎn)生可達矩陣(reachability matrix),根據(jù)可達矩陣實現(xiàn)層次劃分,并添加有向邊連接。
1.1.2 動態(tài)IFISM模型 動態(tài)IFISM模型是在靜態(tài)IFISM模型的基礎上,實時標記報警變量信息,建立規(guī)則如下:對于連續(xù)反應過程的每一時刻t,分別記錄當前時刻的報警變量集合R(t),對于R(t)的任意變量x,且x不屬于R(t?1),若:
(1)x與R(t?1)中的某一變量存在直接因果關系時,在IFISM模型中使用色彩標記變量x的報警信息以及對應的有向連接路徑。
(2)x僅與R(t?1)中的某一變量通過中間變量y存在間接因果關系時,若變量y在時間間隔T內(nèi)產(chǎn)生了報警,則采用如(1)相同的方法標記;若變量y在T內(nèi)始終未報警,則x為誤報,不予標記。
(3)x與R(t?1)中任何變量都不存在連接關系時,則認定該變量為新的報警根源變量,并用色彩標記。若R(t)含多個變量,則表明此時有多個報警根源。
重復以上建立過程,當過程變量恢復到正常狀態(tài)時,即可消除報警標記。
依據(jù)IFISM模型層次劃分結果,對報警變量進行層間排序。針對每一個報警變量,以10 min間隔為單位,對報警次數(shù)進行色彩編碼。相比高密度報警圖,HHDAP不僅可識別裝置異常時間、抖振報警,還可對所有報警變量進行層次展示,便于直觀分析關聯(lián)報警。
報警優(yōu)先級劃分,有助于操作員在任意時刻快速識別關鍵報警和重要報警,尤其在報警活躍或報警泛濫時期,操作員可針對優(yōu)先級高的報警及時采取必要措施,保證過程安全,減少損失。報警變量層次優(yōu)先級圖HPP,按照報警變量的優(yōu)先級數(shù)值大小進行分層降序排列,可以更加鮮明形象化的表征各變量的重要性,以及重要程度。針對優(yōu)先級確定方法,有學者利用模糊差異驅動算法對報警變量進行排序[20-21],也有學者構建包含潛在危害發(fā)生概率P、影響程度I和過程安全時間三者在內(nèi)的綜合模型對報警變量進行優(yōu)先級排序[22-23]。本文采用改進的李克特量表,計算各報警變量的相對重要性指數(shù)作為重要性度量值,從而構建層次優(yōu)先級圖。
由于傳感器老化、過程條件改變或者報警管理政策不到位,極有可能導致報警系統(tǒng)惡化。為明確現(xiàn)有報警系統(tǒng)性能是否合乎要求,需對報警系統(tǒng)進行定期性能評估。本文基于EEMUA NO.191提出的五級性能水平模型,通過計算報警系統(tǒng)在特定時間內(nèi)的3個KPIs數(shù)值,確定目前的報警系統(tǒng)性能水平,描繪性能水平趨勢圖 PLTP,便于及時獲知報警系統(tǒng)性能信息,提早采取解決措施。
TE過程[24]是由美國 Eastman化學公司創(chuàng)建的一個模仿實際工業(yè)過程的仿真模型,已成為過程控制、過程監(jiān)控、故障診斷和報警優(yōu)化等領域的主要研究對象。由于TE過程開環(huán)不穩(wěn)定,目前已有多種控制結構和策略可以實現(xiàn)有效控制。本文以采用自尋優(yōu)控制策略的TE過程[13]為例對上述可視化技術和工具進行分析研究,并做如下兩點說明:
(1)為減少冗余和不必要報警,首先排除 19個成分變量和壓縮機功率測量值,壓縮機循環(huán)閥門、汽提塔蒸汽閥門、攪拌速度在控制方案中保持不變,也可忽略;余下的9個操作變量分別和各自的連續(xù)測量變量值相一致,也可忽略;因此,最終選取21個連續(xù)測量變量作為TE過程的報警設置點即IFISM模型變量,并對其進行編號:①物料A流量;②物料D流量;③物料E流量;④物料A和C混合流量;⑤回收流量;⑥反應器進料率;⑦反應器壓力;⑧反應器液位;⑨反應器溫度;⑩放空率;分離器溫度;分離器液位;分離器壓力;分離器出流量;汽提塔液位;汽提塔壓力;汽提塔出流量;汽提塔溫度;汽提塔蒸汽流量;反應器冷卻水出口溫度;分離器冷卻水出口溫度。
(2)對IFISM模型中的21個變量設定高報、低報兩種類型報警,報警限設置采用工業(yè)上常用的3σ方法。
依據(jù)1.1.1節(jié)所述的4個步驟構建TE過程的靜態(tài)IFISM模型,如圖1。
由圖 1可知,TE過程層次拓撲模型共包含 3層,分別為Ⅰ、Ⅱ、Ⅲ。處于頂層即Ⅰ層的變量僅受與其可達的上游變量影響,而不會影響其他變量;處于底層即Ⅲ層的變量僅會影響與其可達的下游變量,而不受其他變量影響,處于中間層即Ⅱ層的變量既受上游或同層變量影響,同時也會影響下游或同層變量。進一步分析處于Ⅱ層的所有 18個變量,每一個變量都可通過直接或間接連接路徑到達其余 17個變量,即該層的所有變量處于同一個環(huán)路當中。靜態(tài)IFISM模型充分利用過程數(shù)據(jù)和過程知識實現(xiàn)了過程拓撲結構的層次可視化,方便操作員掌握變量之間的直接和間接有向影響關系及連接路徑,從而有助于報警根源分析。
圖1 TE過程靜態(tài)IFISM模型Fig.1 Static IFISM model of TE process
圖2 動態(tài)IFISM模型——IDV(1)Fig.2 Dynamic IFISM model of TE process under IDV(1)
運行TE仿真模型達到平穩(wěn)后,施加階躍干擾IDV(1)(流量4中A/C比率變化,B恒定),依據(jù)時長為2000 min的實時報警數(shù)據(jù)構建動態(tài)IFISM模型,分析報警根源,如圖2所示。
根據(jù)圖 2,可方便得知因果報警傳遞路徑(加粗紅線),利用該路徑進行反向檢驗,處于路徑根部變量即為報警根源。對于圖2,變量4為報警根源,與施加的干擾源相一致。
利用時長為2000 min的實時數(shù)據(jù)(在6 bin時刻施加IDV(1)干擾:之前為正常工況,之后為異常工況),建立層次高密度報警圖,如圖3。該圖像對21個報警變量進行了分層次展示,列出了每10 min內(nèi)的總報警次數(shù)(Sum),并進行了色彩編碼,一目了然。從 6 bin時刻起,Tag1、Tag4、Tag5、Tag6等變量報警次數(shù)明顯增加,總報警次數(shù)Sum明顯超過10次,表明裝置運行出現(xiàn)了異常。Tag5和Tag6報警次數(shù)相當,明顯為關聯(lián)報警,事實上,由圖 2也可看出,兩者為因果報警。有些變量的報警次數(shù)在短時間內(nèi)發(fā)生突變,極有可能為抖振報警,如Tag9、Tag20等。
圖3 層次高密度報警圖——IDV(1)Fig.3 Hierarchical high density alarm plot under IDV(1)
圖4 層次優(yōu)先級圖Fig.4 Hierarchical priority plot
利用施加IDV(1)后時長為2000 min的報警數(shù)據(jù)建立李克特量表,計算各個層次內(nèi)報警變量的相對重要性指數(shù),建立層次優(yōu)先級圖,如圖4所示。
數(shù)值越大,優(yōu)先級越高。根據(jù)ISA18.02標準,優(yōu)先級設定比例為高:中:低=80%:15%:5%,位于Ⅱ層的 Tag4優(yōu)先級最高,Tag1、Tag18、Tag11依次為中優(yōu)先級,其余的為低優(yōu)先級。層次優(yōu)先級圖可以幫助操作員識別各個層次的關鍵報警,減少處理盲目性,同時對于處于低優(yōu)先級的報警變量,可延時處理甚至抑制報警,減少了報警數(shù)量。
依據(jù)實時報警數(shù)據(jù),計算報警系統(tǒng)在30 d內(nèi)的3個關鍵性能指標:平均報警率、峰值報警率和超出期望報警率的時間百分比,確定報警系統(tǒng)的性能水平級別,描繪性能水平趨勢圖。該趨勢圖共包含4個子圖:第1個子圖為性能水平定性趨勢,分為5個等級;位于子圖1下方的3個子圖為決定性能水平的3個關鍵性能指標定量趨勢。如圖5所示。
在第2 d,施加干擾,3個關鍵性能指標值驟然增大,產(chǎn)生報警泛濫,報警系統(tǒng)性能水平發(fā)生惡化,由Level5—predictive降為Level2—reactive,喪失了報警原有功能,極易導致危險發(fā)生,此時應采取必要的優(yōu)化措施,并對異常進行排查處理。此時采用本文提出的解決報警泛濫的方法及可視化工具對現(xiàn)有報警系統(tǒng)進行優(yōu)化,識別冗余報警、關聯(lián)報警以及抖振報警,找出報警根源,并且優(yōu)先處理關鍵報警,最終報警系統(tǒng)性能水平穩(wěn)定在 Level4—robust,在一定程度上解決了報警泛濫問題,提升了報警系統(tǒng)性能水平。
圖5 性能水平趨勢Fig.5 Performance level trend plot
針對目前報警系統(tǒng)中普遍存在的也是較難解決的報警泛濫問題以及報警可視化監(jiān)控存在的問題,本文分別從過程遞階模型建立、因果報警等滋擾報警識別、報警優(yōu)先級劃分3個主要方面入手,設計并構建了新型可視化工具:基于信息融合的解釋結構模型(靜態(tài)、動態(tài))IFISM、層次高密度報警圖HHDAP、層次優(yōu)先級圖HPP,幫助操作員快速、及時、準確地掌握過程報警信息并做出響應。在可視化監(jiān)控的同時,還需對報警系統(tǒng)進行常規(guī)性能評估,為此,本文還構建了報警系統(tǒng)性能水平趨勢圖 PLTP,以實現(xiàn)報警系統(tǒng)可視化性能測量及評估,幫助決策者采取早期修正措施。以TE過程為例,分別闡明了上述可視化工具的優(yōu)勢,從一定程度上減少了報警數(shù)量,緩解了報警泛濫現(xiàn)象。
報警系統(tǒng)可視化監(jiān)控及性能評估是報警管理生命周期的重要階段。除了本文提出的可視化技術及工具外,還存在很多問題值得研究與探索。
(1)目前報警優(yōu)先級劃分多為靜態(tài)優(yōu)先級,未考慮過程狀態(tài)變化時優(yōu)先級的動態(tài)調(diào)整。根據(jù)EEMUA NO.191標準,應根據(jù)過程演變對報警變量設定動態(tài)優(yōu)先級,實時保證過程安全。
(2)將統(tǒng)計分析方法和數(shù)據(jù)挖掘算法相結合,對報警泛濫模式進行充分挖掘、提取,并建立可視化圖形,幫助操作員了解報警發(fā)生的規(guī)律,制定并采取響應措施。
(3)現(xiàn)有的可視化工具開發(fā)缺乏對操作員影響因素的充分考慮,致使工具可視性及可理解性差,未能有效幫助操作員處理報警。因此,應基于人體工程學理念設計可視化圖形,同時結合報警系統(tǒng)性能指標,將操作員滿意度融入到報警系統(tǒng)性能評估當中,加強系統(tǒng)柔性管理。
[1]Stauffer T, Clarke P. Using alarms as a layer of protection //AIChE 8th Global Congress on Process Safety [C]. Houston, TX, 2012
[2]Zhu Qunxiong (朱群雄), Gao Huihui (高慧慧), Liu Feifei (劉菲菲),et al. Research progress of alarm systems in the process industries [J].Computers and Applied Chemistry(計算機與應用化學), 2014, 31(2): 129-134
[3]Hollifield B R, Habibi E. The Alarm Management Handbook: A Comprehensive Guide [M]. Huston, Texas: PAS, 2006
[4]EEMUA. Alarm Systems: A Guide to Design, Management, and Procurement [M]. 2nd ed. London, UK: EEMUA, 2007
[5]Rothenberg D H. Alarm Management for Process Control [M]. New York: Momentum Press, 2009
[6]ISA. Management of Alarm Systems for the Process Industries [R].Technical Report ANSI/ISA -18.2-2009, 2009
[7]Ghaoui C. Encyclopedia of Human Computer Interaction [M]. IGI Global, 2006
[8]Kondaveeti S R, Izadi I, Shah S L,et al. Graphical tools for routine assessment of industrial alarm systems[J].Computers & Chemical Engineering, 2012, 46: 39-47
[9]Akatsukaa S, Nodab M. Similarity analysis of sequential alarms in plant operation data by using Levenshtein distance//Proceedings of the 6th International Conference on Process Systems Engineering(PSE ASIA)[C]. 2013, 25: 27
[10]Yang F, Shah S L, Xiao D,et al. Improved correlation analysis and visualization of industrial alarm data [J].ISA Transactions, 2012, 51(4): 499-506
[11]Chen Y, Lee J. Autonomous mining for alarm correlation patterns based on time-shift similarity clustering in manufacturing system//Prognostics and Health Management (PHM), 2011 IEEE Conference on [C]. IEEE, 2011: 1-8
[12]Ahmed K, Izadi I, Chen T,et al. Similarity analysis of industrial alarm flood data [J].Automation Science and Engineering,IEEE Transactions on, 2013, 10 (2): 452-457
[13]Larsson T, Hestetun K, Hovland E,et al. Self-optimizing control of a large-scale plant: the Tennessee Eastman process [J].Industrial &Engineering Chemistry Research, 2001, 40 (22): 4889-4901
[14]Yang F, Shah S L, Xiao D. SDG (Signed Directed Graph)based process description and fault propagation analysis for a tailings pumping process//Proceedings of the 13th IFAC Symposium on Automation in Mining, Mineral and Metal Processing [C]. Cape Town,South Africa, 2010: 50-55
[15]Dahlstrand F. Consequence analysis theory for alarm analysis[J].Knowledge-Based Systems, 2002, 15 (1): 27-36
[16]Schleburg M, Christiansen L, Thornhill N F,et al. A combined analysis of plant connectivity and alarm logs to reduce the number of alerts in an automation system [J].Journal of Process Control, 2013,23 (6): 839-851
[17]Bauer M, Cox J W, Caveness M H,et al. Finding the direction of disturbance propagation in a chemical process using transfer entropy[J].Control Systems Technology,IEEE Transactions on, 2007, 15 (1):12-21
[18]Dey S, Stori J A. A Bayesian network approach to root cause diagnosis of process variations [J].International Journal of Machine Tools and Manufacture, 2005, 45 (1): 75-91
[19]Ansari M F, Kharb R K, Luthra S,et al. Analysis of barriers to implement solar power installations in India using interpretive structural modeling technique [J].Renewable and Sustainable Energy Reviews, 2013, 27: 163-174
[20]Zhu Q X, Geng Z Q. A new fuzzy clustering-ranking algorithm and its application in process alarm management [J].Chinese Journal of Chemical Engineering, 2005, 13 (4): 477-483
[21]Geng Z, Zhu Q, Gu X. A fuzzy clustering–ranking algorithm and its application for alarm operating optimization in chemical processing[J].Process Safety Progress, 2005, 24 (1): 66-75
[22]Chang Y, Khan F, Ahmed S. A risk-based approach to design warning system for processing facilities [J].Process Safety and Environmental Protection, 2011, 89 (5): 310-316
[23]Ahmed S, Gabbar H A, Chang Y,et al. Risk based alarm design: a systems approach//Advanced Control of Industrial Processes (ADCONIP),2011 International Symposium on [C]. IEEE, 2011: 42-47
[24]Downs J J, Vogel E F. A plant-wide industrial process control problem[J].Computers & Chemical Engineering, 1993, 17 (3): 245-255