賴紅軍,王志芳,謝文奮
(1.中國石油天然氣股份有限公司 獨(dú)山子石化公司 科技信息處,新疆維吾爾自治區(qū) 獨(dú)山子區(qū) 833699;2.獨(dú)山子石化公司 信息網(wǎng)絡(luò)公司,新疆維吾爾自治區(qū) 獨(dú)山子區(qū) 833699)
工業(yè)控制系統(tǒng)的過程報警作為工藝操作輔助手段和重要的安全措施之一,在現(xiàn)代工業(yè)生產(chǎn)過程中扮演著不可或缺的角色。作為工業(yè)過程的首道保護(hù)層,報警系統(tǒng)的性能優(yōu)劣直接關(guān)系到過程安全、產(chǎn)品質(zhì)量、生產(chǎn)成本甚至人員傷亡。國內(nèi)外研究顯示,異常情況下出現(xiàn)的報警過載是常見問題,這通常意味著報警系統(tǒng)在最需要的時候效果最差。
報警系統(tǒng)設(shè)計不當(dāng)?shù)耐怀霰憩F(xiàn):設(shè)置數(shù)量不合理、優(yōu)先級配置不當(dāng)、參數(shù)配置不當(dāng)、無法識別和阻止報警洪水等問題,導(dǎo)致報警泛濫,超出操作人員承受能力。DCS 實際處于“報而不警”的狀態(tài)是目前石化行業(yè)普遍存在的問題[1]。
統(tǒng)計公司某裝置連續(xù)3 天的報警為23 萬多條,其中重復(fù)報警占到80%。工藝人員處于繁忙的確認(rèn)和診斷報警中,有效報警識別困難,錯過重要報警的機(jī)會增加,大量的異常報警如不能加以有效控制,一旦應(yīng)對不及時,就可能造成生產(chǎn)波動,帶來效益損失,存在很大的安全隱患。
1)缺乏報警系統(tǒng)頂層設(shè)計
缺乏報警理念的科學(xué)統(tǒng)一認(rèn)識,缺乏有效的理論和方法指導(dǎo),缺乏可持續(xù)的管控機(jī)制。在裝置建設(shè)初期,工藝設(shè)計以及DCS 系統(tǒng)的報警組態(tài)設(shè)計階段,沒有報警需求規(guī)格書遵循,各方參與人員對于報警優(yōu)化問題不夠重視,設(shè)計和DCS 組態(tài)隨意性較大,仍然集中于單變量獨(dú)立簡單設(shè)計,并未充分考慮過程變量之間的關(guān)聯(lián)性和邏輯性,并且只考慮正常工況;在裝置后期運(yùn)行過程中,從來未開展過報警性能評估和報警合理化分析,報警值、報警級別設(shè)置混亂,沒有依據(jù);DCS 增加報警幾乎沒有成本,報警只增不減,報警管理幾乎失控。
2)缺乏報警系統(tǒng)性能監(jiān)控,沒有有效的技術(shù)分析工具和手段,關(guān)鍵評價指標(biāo)不夠明確
裝置每周產(chǎn)生的報警信息數(shù)量有成千上萬條之多,多者甚至達(dá)到每周五六十萬條,裝置技術(shù)人員要每天統(tǒng)計DCS 報警情況,進(jìn)行原因分析和整改??渴止ね瓿山y(tǒng)計工作,不僅工作量大,而且工作效率低下,誤差較大,僅能統(tǒng)計出報警次數(shù)、報警位號等簡單信息,報警信息利用價值并沒有被充分地挖掘出來,一方面工藝人員無法及時篩選出重要報警加以解決,另一方面給DCS 系統(tǒng)維護(hù)工程師帶來很大負(fù)擔(dān),裝置報警系統(tǒng)性能無法準(zhǔn)確評估。
從20 世紀(jì)90 年代開始,世界著名石化企業(yè)、工程公司和專業(yè)公司共同對報警系統(tǒng)進(jìn)行了研究及實踐,運(yùn)用先進(jìn)報警管理的理念,推出了相關(guān)的國際規(guī)范和工程導(dǎo)則。通過先進(jìn)報警管理系統(tǒng)的實踐,證明可提高報警系統(tǒng)的有效性和安全性,對工業(yè)領(lǐng)域報警管理產(chǎn)生很大影響。
目前國際廣泛認(rèn)可的報警管理標(biāo)準(zhǔn)或最佳實踐主要包括:ANSI /ISA 18.2-2009 Management of Alarm System for the Process Industries[3]和IEC 62682-2014 Management of Alarm system for the Process Industries[4]。PAS 公司于2016 年發(fā)行了《報警管理手冊》,填補(bǔ)了流程工業(yè)中一個重要技術(shù)領(lǐng)域的空白,是對報警管理影響最大的專著。遵從國際標(biāo)準(zhǔn)及最佳實踐是實現(xiàn)建立和持續(xù)保持高水準(zhǔn)報警管理的最佳途徑。這一系列標(biāo)準(zhǔn)著作為創(chuàng)新報警管理提供了理論基礎(chǔ)和實踐參考。
學(xué)習(xí)研究國際規(guī)范(國際自動化協(xié)會:ISA18.2《過程工業(yè)報警系統(tǒng)管理》和英國工程設(shè)備和材料用戶協(xié)會:EEMUA191《報警系統(tǒng)設(shè)計、管理和采購指南》),借鑒國外專業(yè)管理公司的最佳實踐,確定報警治理目標(biāo)和分步實施方案。
第1 步:對標(biāo)ISA18.2,利用信息化手段收集分析報警數(shù)據(jù),實時掌握各裝置報警現(xiàn)狀。對報警系統(tǒng)改進(jìn)前必須進(jìn)行全面而完整的報警信息收集和分析,更清楚地了解現(xiàn)有缺陷,為精確查明存在的問題并提出最高效的解決方案提供依據(jù)。
第2 步:基層單位成立專家團(tuán)隊,組織進(jìn)行不良報警、高頻報警分析,精準(zhǔn)施策。持續(xù)開展報警合理化工作,從報警設(shè)置的目的、報警值和報警級別的優(yōu)化、操作人員的響應(yīng)等方面,考慮長效治理措施。
第3 步:對標(biāo)評價控制系統(tǒng)的報警性能,完善報警管控機(jī)制。
第4 步:總結(jié)報警治理經(jīng)驗,制定和遵守企業(yè)報警導(dǎo)則。
1)將DCS 系統(tǒng)報警和過程報警完全分開,系統(tǒng)報警對于操作人員來說并沒有多大的意義,不需要他們響應(yīng),在操作站的操作界面中,不顯示系統(tǒng)報警信息。利用短信推送功能,將系統(tǒng)報警信息實時推送給DCS 系統(tǒng)維護(hù)工程師,確保了系統(tǒng)報警實時響應(yīng)。
2)搭建DCS 報警信息采集和實時監(jiān)測管理平臺,從DCS 原始日志入手解析報警記錄的時間順序,通過分析報警、恢復(fù)、確認(rèn)時間,分析不同時段的報警次數(shù)、報警響應(yīng)時間,精準(zhǔn)定位不良報警(瞬閃報警、重復(fù)報警、陳舊報警等)。經(jīng)過統(tǒng)計分析和大數(shù)據(jù)挖掘,將復(fù)雜多變的報警信息轉(zhuǎn)變?yōu)榭梢远攘康臄?shù)字、數(shù)據(jù),為裝置的報警統(tǒng)計分析、優(yōu)化提供決策支持,便于管理者對裝置報警優(yōu)化情況實時掌握。開發(fā)的主要應(yīng)用功能,實現(xiàn)報警KPI 對比、報警泛濫統(tǒng)計、裝置每日(月)報警數(shù)對比、TOP10 報警閉環(huán)處置、裝置報警性能評價等數(shù)據(jù)可視化展示,為裝置報警優(yōu)化治理提供了強(qiáng)大的數(shù)據(jù)支撐。
3)充分利用網(wǎng)絡(luò)和短信技術(shù),依托移動短信平臺,建立報警推送統(tǒng)一管理系統(tǒng),將報警信息分級分專業(yè)精準(zhǔn)推送到指定人員手機(jī)短信,提醒裝置各級技術(shù)和管理者關(guān)注裝置異常變動。另外當(dāng)裝置發(fā)生報警泛濫(10min 內(nèi)報警超過10 次)時,通常意味著裝置出現(xiàn)波動,也會發(fā)送短信給相應(yīng)裝置和運(yùn)行部管理人員,便于管理人員及時掌握生產(chǎn)波動信息,實現(xiàn)儀表運(yùn)維、質(zhì)量管控、環(huán)保監(jiān)測、工藝管理、設(shè)備管理等專業(yè)異常故障信息分級管理,重要關(guān)鍵點(diǎn)全天候?qū)崟r報警管控,推動生產(chǎn)管控向智能化運(yùn)維轉(zhuǎn)型。
4)圍繞報警合理化,精準(zhǔn)施策,優(yōu)化設(shè)計。報警合理化分析的基本方法非常簡單,對每個報警的配置和用途進(jìn)行審查,各單位組建由相關(guān)專業(yè)技術(shù)人員參與的專家團(tuán)隊,針對系統(tǒng)中的報警點(diǎn)主要進(jìn)行以下工作:
①討論該點(diǎn)上每個已組態(tài)和可能組態(tài)的報警。
②驗證任何所組態(tài)的報警是否確實應(yīng)該存在。通過工藝流程圖、基礎(chǔ)數(shù)據(jù)、功能說明、工藝安全分析、保護(hù)層分析及事故調(diào)查報告等資料,根據(jù)報警設(shè)置的原則確認(rèn)需要有足夠的時間響應(yīng)。
③驗證一個報警不會復(fù)制在相同條件下發(fā)生的另外一個類似的報警。如果出現(xiàn)復(fù)制的情況,保留最能夠說明異常條件根本原因的那個報警。
④確定每個報警的正確優(yōu)先級。報警優(yōu)先級的確定是根據(jù)偏差產(chǎn)生的后果和人員需要響應(yīng)的時間共同決定的(見表3)。通常,后果越嚴(yán)重,所需響應(yīng)時間越短,報警的優(yōu)先級越高。
⑤根據(jù)工藝歷史數(shù)據(jù)、相關(guān)操作程序、設(shè)備和安全系統(tǒng)規(guī)范等,確定報警的正確設(shè)定值。報警值設(shè)定的基礎(chǔ)要考慮到響應(yīng)報警的時間足夠防止偏差后果的發(fā)生,并且恢復(fù)至報警設(shè)定點(diǎn)和報警死區(qū)的正常范圍內(nèi)。
⑥對于具有不同操作狀態(tài)的工藝來說,是否需要多個不同的報警值和報警抑制的條件。
報警合理化分析是報警生命周期活動中的重要一步,是一個持續(xù)、動態(tài)、循環(huán)的過程。通過合理化分析,實現(xiàn)了在現(xiàn)有系統(tǒng)上配置正確的報警、糾正錯誤配置的系統(tǒng),以提高性能,消除重復(fù)報警等;報警合理化分析的結(jié)果,為裝置報警優(yōu)化提供依據(jù)。
借助報警平臺的統(tǒng)計和報警合理化分析的結(jié)果,占無效報警總數(shù)大約70%的不良報警(重復(fù)、陳舊、瞬閃、震蕩等)和高頻報警(裝置每天報警超過5 次的)被迅速定位。結(jié)合DCS 歷史趨勢和組態(tài),可以精準(zhǔn)判斷其屬于哪一類不良報警,從而采取針對性的措施。
按照表1 中的不良報警治理方法,通過優(yōu)化報警上下限,修改報警死區(qū),優(yōu)化報警級別等可以很快見效,總體報警事件平均減少50%以上,而改進(jìn)工作量相對最少。
表1 典型不良報警的治理方法Table 1 Treatment methods of typical bad alarm
5)多工況高級報警技術(shù)應(yīng)用[5]。對于聚合、橡膠、裂解爐等間歇式工藝,生產(chǎn)裝置通常處于多個工況,如開停工、原料和產(chǎn)品切換、設(shè)備維修。針對同一個儀表位號在不同配方、不同過程階段或操作模式下,報警的需求通常是不同的。通過按不同工況進(jìn)行抑制,不同工況報警值設(shè)置的技術(shù)手段,解決開停工和檢修期間報警泛濫。
6)完善報警系統(tǒng)性能綜合評價機(jī)制,ISA18.2 標(biāo)準(zhǔn)中建議的報警性能指標(biāo)主要有:基于至少30 天的數(shù)據(jù)的日均每崗、10min 內(nèi)報警的最大數(shù)目、報警泛濫時長占比、抖振報警和瞬閃報警的數(shù)目、陳舊報警的數(shù)量等。在實踐中單一的指標(biāo),如峰值報警和平均報警并不能準(zhǔn)確反映報警系統(tǒng)性能,不能簡單地直接用于評價考核。公司創(chuàng)造性地用日報警次數(shù)、不良報警(重復(fù)報警、瞬閃報警、陳舊報警等)的治理效果、報警泛濫程度等指標(biāo)進(jìn)行綜合考量。
7)明確新建裝置的DCS 組態(tài)原則,從源頭治理報警,如:死區(qū)、濾波、延遲的設(shè)置;設(shè)置多工況報警抑制和動態(tài)修改;系統(tǒng)報警不推送到前臺;報警點(diǎn)的選擇,尤其是DI 點(diǎn)。
8)編制報警管理規(guī)范文件,企業(yè)報警導(dǎo)則是國外專業(yè)管理公司的最佳實踐[6]——報警管理七步法中最基礎(chǔ)的一環(huán),是企業(yè)針對報警的制定、實施和修改而編制的一套綜合性指導(dǎo)方針,明確“如何正確執(zhí)行與設(shè)定報警”,為報警的選擇、優(yōu)先級設(shè)置、組態(tài)、響應(yīng)、處理方法、系統(tǒng)監(jiān)控以及許多其他主題提供一個最理想的規(guī)則。國內(nèi)的石油石化行業(yè)中建立企業(yè)報警導(dǎo)則的很少,參考ISA-18.2 的要求和公司的報警治理實踐,編制的公司報警導(dǎo)則,作為新裝置報警系統(tǒng)設(shè)計、老裝置報警治理的指南,為報警選擇、優(yōu)先級設(shè)置、配置、響應(yīng)、處理方法、系統(tǒng)監(jiān)測提供了最佳依據(jù)。主要內(nèi)容包括報警點(diǎn)的選擇、報警優(yōu)先級的確定、報警的設(shè)置、報警的處理方法、報警系統(tǒng)性能的監(jiān)控、不良報警的解決方案,以及如何進(jìn)行合理化分析等。為了更好地發(fā)揮報警導(dǎo)則的指導(dǎo)作用,將總結(jié)的DCS 報警組態(tài)的原則和報警治理的基本方法納入其中。
2020 ~2021 年,報警管理關(guān)鍵性能指標(biāo)——日均每崗報警次數(shù)從2019 年治理優(yōu)化前的400 次持續(xù)下降到目前的35 次,降幅達(dá)90%,其中不良報警數(shù)量降幅達(dá)83.3%,日均每崗報警次數(shù)遠(yuǎn)低于國際標(biāo)準(zhǔn)KPI 可接受數(shù)量(150 次),如圖1。裝置檢修及開停工期間的報警也得到很好管控,全廠各裝置報警基本達(dá)到平衡,并持續(xù)降低,個別裝置存在小幅波動。與此同時,操作人員的操作數(shù)量也明顯下降。數(shù)據(jù)統(tǒng)計顯示,報警治理前后操作次數(shù)降幅達(dá)50%,有效降低了操作人員的操作強(qiáng)度,減少了誤操作的可能性,生產(chǎn)運(yùn)行更加平穩(wěn)。
圖1 2021年每崗位報警次數(shù)統(tǒng)計Fig.1 Statistics of alarm times per post in 2021
以制度和信息化工具的方式使傳統(tǒng)基于經(jīng)驗的報警管理方式向系統(tǒng)化、規(guī)范化的方式轉(zhuǎn)變,無效報警數(shù)量大幅下降,DCS 報警系統(tǒng)作用充分體現(xiàn)??煽康膱缶到y(tǒng)不能直接產(chǎn)生經(jīng)濟(jì)效益,但合理的報警設(shè)置和及時正確的操作響應(yīng)有效提高了裝置的安全性和可操作性,提升了操作人員異常情況處置能力,防止因報警未及時響應(yīng)處理而產(chǎn)生的工藝波動,從而提高裝置整體運(yùn)行效能。