馬棟梁,陳輝,朱延海,蔣園
(1.河北金融學院信息工程與計算機學院,河北保定 071051;2.淮北申能發(fā)電有限公司,安徽淮北 235066;3.國能陳家港發(fā)電有限公司生產(chǎn)技術部,江蘇鹽城, 224631)
隨著各種發(fā)電機組的發(fā)電參數(shù)日益提高,發(fā)電系統(tǒng)的運行設備也更加復雜,對機組運行和檢修維護人員的要求也就更高。在發(fā)電廠正常運行的過程中,系統(tǒng)中的任何一個部位出現(xiàn)異常,均可能影響發(fā)電機組的正常運行。發(fā)電機組非計劃停機事件,是指發(fā)電機組由于各種內(nèi)部或外部的原因,導致機組不能正常持續(xù)對電網(wǎng)輸出電功率負荷,而被迫停止運行的事件。非計劃停機事件的發(fā)生,對發(fā)電廠的安全穩(wěn)定和經(jīng)濟效益均會造成不同程度的負面影響,因此各個發(fā)電企業(yè)均將非計劃停機事件作為衡量機組安全健康運行的關鍵指標之一。而導致機組非計劃停機事件的因素多種多樣,其中很大一部分是因為機組發(fā)生故障而造成發(fā)電設備的可靠性降低。針對發(fā)電機組發(fā)生非計劃停機事件的故障特點,夏克晁等[1]對發(fā)電廠發(fā)生的148 起熱控系統(tǒng)故障進行了整理和分類。張學延等[2]針對因為檢修失誤而造成的大型汽輪發(fā)電機組的故障案例進行了經(jīng)驗總結(jié)與分析。于彥寶等[3]針對汽輪發(fā)電機組液壓油系統(tǒng)典型故障案例進行了分析,并給出了相應的處理措施。楊勤等[4]介紹了相似性原理建模技術,并通過該技術對發(fā)電設備故障狀態(tài)預警系統(tǒng)和狀態(tài)檢修進行了分析。李建鋒等[5-7]對920次火電機組非計劃停運事件和持續(xù)時間進行了統(tǒng)計和分析。而大數(shù)據(jù)和機器學習等計算分析技術不斷成熟[8-11],已經(jīng)開始逐漸在智慧電廠及在線故障診斷等方面發(fā)揮越來越重要的作用。得益于大數(shù)據(jù)分析在發(fā)電系統(tǒng)中應用的逐漸深入,通過眾多發(fā)電機組非計劃停機事件數(shù)據(jù),可以對導致發(fā)電廠非計劃停機事件的數(shù)據(jù)因素特征進行更加深入抽象的提取和分析,進而探究影響發(fā)電機組非計劃停機事件中更加本質(zhì)的影響因素特征。而在眾多機器學習算法中,貝葉斯網(wǎng)絡是有向無環(huán)的網(wǎng)絡分析圖,可以用來描述不確定性事件中的各種影響因素的依賴作用關系,適合進行事件因果關系的推理和分析,特別是整合來自不同方面的資料以分析復雜事件現(xiàn)象產(chǎn)生的原因。貝葉斯網(wǎng)絡目前已經(jīng)被廣泛應用于能源、交通、金融等各種事件安全分析領域[12-15]。在能源領域,已經(jīng)有學者應用貝葉斯網(wǎng)絡算法對光伏發(fā)電等電力系統(tǒng)的可靠性進行相關研究和分析[16-17]。但目前由于發(fā)電系統(tǒng)設備所涉及的各種系統(tǒng)故障狀態(tài)復雜而多變,運用貝葉斯網(wǎng)絡算法對其進行相對更為抽象概況的非停事件原因分析方面的研究目前仍然相對較少。因此,本文利用歷年來各種原因造成的非計劃停機事件的分析報告數(shù)據(jù)資料,對其進行抽象概況和整理之后,通過貝葉斯網(wǎng)絡分析方法,對影響發(fā)電機組非計劃停機事件的原因進行推理和預測分析,以便采取措施提高發(fā)電機組正常運行的可靠性。
本文以部分發(fā)電廠2000―2020 年火力發(fā)電機組發(fā)生的停機事件分析報告為研究對象,選取520次非計劃停機跳閘事件,總結(jié)提煉其中影響火力發(fā)電機組非計劃停機事件的影響因素特征,并利用貝葉斯網(wǎng)絡對影響發(fā)電廠非計劃停機事件的特征進行分析。
按照影響因素將影響火電機組非計劃停機的主要因素劃分為外部因素、人為因素、設備因素和邏輯因素,再將這4 種影響因素進一步劃分為17 個變量因素,具體劃分情況見表1。在對火電機組非計劃停機事件進行貝葉斯網(wǎng)絡分析之前,首先逐次分析每次跳閘事件發(fā)生時,表1 中的影響因素在該次事件發(fā)生過程中是否出現(xiàn)。如某一影響因素在該次事件中存在,則取值為1,反之則取值為0。外部環(huán)境惡劣包括雷電暴雨天氣、大風天氣、氣候潮濕、外部網(wǎng)頻波動、外部施工及外部周邊環(huán)境設備改造等具體情況;基建安裝工藝差指在該發(fā)電機組基建安裝過程中存在原始缺陷,如焊縫工藝差、施工電纜未固定、設備熱處理工藝步驟缺失、管道安裝存在熱應力、設備膨脹間隙不足、未使用密封膠密封等;結(jié)構(gòu)設計不合理指系統(tǒng)設備在圖紙設計規(guī)劃時因未考慮實際情況的影響而存在缺陷;煤質(zhì)變化指燃煤的灰分、濕度、熱值、硬度、粒徑等發(fā)生顯著變化等。
表1 非計劃停機事件主要影響因素變量劃分Table 1 Main influencing factors of unplanned shutdown
將停機事件分別按照停機發(fā)生的月份、已投產(chǎn)運行年限分別進行統(tǒng)計,得到非計劃停機的時間特征如圖1及圖2所示。
圖1 非計劃停機月份分布Fig.1 Month distribution of unplanned shutdowns
圖2 非計劃停機發(fā)生次數(shù)與機組投產(chǎn)運行年限Fig.2 Times of the unplanned shutdowns and service life of units
由圖1可見,7月發(fā)生非計劃停運事件的次數(shù)最多,其次是1 月,超過平均停機次數(shù)的月份還有3 月和8 月。這是因為7 月國內(nèi)氣候最為炎熱潮濕,同時伴有較頻繁的雷雨天氣,而炎熱的溫度環(huán)境和雷雨、雷電等氣候現(xiàn)象均會對火電機組的正常運行造成較大影響。而1 月氣候寒冷,儀表管路非常容易凍結(jié)、凍裂。由此可見,機組非計劃停機事件的發(fā)生與自然氣候環(huán)境變化的影響是密切相關的。
由圖2 可見,在機組剛投產(chǎn)的第1 年,發(fā)生非計劃停機事件的次數(shù)最多,隨后幾年逐年下降。這是因為機組在最初投產(chǎn)運行時,運行維護人員對于機組設備特性和運行特性還不夠熟悉。而隨著機組逐年經(jīng)過運行檢驗之后,一些比較復雜特殊的工況或者潛在的設備缺陷會逐漸暴露出來。而當這些設備固有的缺陷被消除,并且機組運行維護人員對設備運行特性比較熟悉之后,就會使機組發(fā)生非計劃停機事件的次數(shù)逐漸降低。但是隨著機組運行時間進一步增長,機組發(fā)生非計劃停機事件的次數(shù)又有所反彈。尤其是在機組運行了6~8 年時,機組發(fā)生非計劃停機事件的次數(shù)反彈較為明顯。這說明在機組運行6~8 年后,部分機組設備的可靠性開始降低,通常表現(xiàn)為設備電子元器件老化。尤其是當設備長期處于高溫、潮濕、腐蝕、多塵等較為惡劣的工作環(huán)境中時,發(fā)生老化而產(chǎn)生故障的概率會迅速升高。
貝葉斯網(wǎng)絡模型是一種典型的機器學習算法模型,基于后驗概率的貝葉斯定理,是一種概率圖論的模型,用條件概率表達各個信息要素之間的相互作用關系。貝葉斯定理[18]的計算公式如下
式中:C和X分別表示存在條件依賴關系的不同事件,通過統(tǒng)計停機事件的數(shù)據(jù)計算在某種條件狀態(tài)X下的事件C發(fā)生的概率;使P(X|Ci)最大的假設Ci稱為最大似然假設,其計算公式為
該公式為事件C在不同條件狀態(tài)下的概率乘積形式的事件X發(fā)生的聯(lián)合概率。貝葉斯網(wǎng)絡由事件節(jié)點和連接節(jié)點組成。每個節(jié)點都帶有定量概率信息。在貝葉斯網(wǎng)絡中各個事件之間通過鏈條和箭頭[19]連接起來,用來表示各個因素之間的條件依賴作用關系。
利用已有的發(fā)電機組非計劃停機事件分析報告,根據(jù)表1 中17 種影響非計劃停機的因素,最終形成判斷機組發(fā)生非計劃停機事件的貝葉斯網(wǎng)絡結(jié)構(gòu)圖。根據(jù)各種事件因素之間發(fā)生的因果關系,結(jié)合機組非計劃停機事件數(shù)據(jù)訓練得到的初始貝葉斯網(wǎng)絡圖,經(jīng)過因果特征因素關系修正完善之后,最終得到火電機組非計劃停機的貝葉斯網(wǎng)絡結(jié)構(gòu),如圖3所示。
圖3 非計劃停機貝葉斯網(wǎng)絡Fig.3 Bayesian network of unplanned shutdowns
圖3 中每個圓圈表示某一種事件發(fā)生的狀態(tài),不同事件狀態(tài)通過方向箭頭連接表示相互之間的作用關系。如果某2 個事件因素之間存在因果關系,則在二者之間加一個箭頭,箭頭起始位置的參數(shù)表示事情發(fā)生的原因,箭頭指向位置的參數(shù)表示事件發(fā)生的結(jié)果。如果沒有箭頭指向某參數(shù),則表示該參數(shù)為整個事件分析中的外部因素變量,需要初始化該參數(shù)各種狀態(tài)發(fā)生的概率值,在圖中用綠色對外部變量進行填充表示。在非計劃停機這一事件分析中,外部變量參數(shù)共有5個,分別為管理不當、環(huán)境因素、安裝工藝、結(jié)構(gòu)設計和煤質(zhì)變化情況。而最終需要分析的事件結(jié)果,則為是否會發(fā)生非計劃停機,在圖中用紅色填充表示。在上述影響因素中,會直接導致非計劃停機事件發(fā)生的因素包括設備故障、冗余設備失效、檢修不當、保護信號誤發(fā)、報警不完善和運行操作不當。這6 個直接因素如果發(fā)生,會直接導致非計劃停機事件的發(fā)生,在圖中用黃色填充表示。而其余一些因素則介于直接因素和外部因素之間,屬于影響非停事件發(fā)生的中間因素,在圖中用淺藍色填充表示。非計劃停機事件貝葉斯網(wǎng)絡結(jié)構(gòu)圖的形成,可以提煉出導致非停事件的抽象概念因素,進而對非計劃停機事件進行較為直觀的影響因素因果分析。
利用非計劃停機事件貝葉斯網(wǎng)絡結(jié)構(gòu)圖,結(jié)合發(fā)生非計劃停機事件的各種影響因素狀態(tài)概率值,可以得到影響非計劃停機事件的貝葉斯網(wǎng)絡概率圖,如圖4所示。
圖4 非計劃停機貝葉斯網(wǎng)絡概率Fig.4 Bayesian network probability distribution of unplanned shutdowns
圖4表明了每種影響因素是否會發(fā)生的概率情況。為了對事件進行簡化分析,所有的影響因素判定狀態(tài)條件均只有Yes 和No 2 種。當狀態(tài)為Yes時,表明在某次非計劃停機事件中,該影響因素的事件發(fā)生;當狀態(tài)為No 時,表明在某次非計劃停機事件中,該影響因素的事件未發(fā)生。圖中的數(shù)值表示某一事件狀態(tài)參數(shù)會發(fā)生的可能性概率。該數(shù)值越接近1,表明該事件參數(shù)發(fā)生某種狀態(tài)的可能性越大;反之,則該事件發(fā)生某種狀態(tài)的可能性越小。而同一影響因素事件狀態(tài)為Yes 和狀態(tài)為No的概率值之和為1,即某種事件狀態(tài)只能為Yes 或No 中的一種,而不可能是其他某種狀態(tài)。由圖4 可見,影響非計劃停機事件最為重要的事件因素為檢修不當,當非計劃停機事件發(fā)生時,有76%的概率可能是由于檢修不當導致的。設備發(fā)生故障導致非計劃停機的概率也非常高,達到68%。而當“檢修不當”情況出現(xiàn)時,一方面可能由于風險措施沒有執(zhí)行到位而導致發(fā)生誤操作,另一方面也有較大概率導致設備出現(xiàn)人為原因的故障缺陷。檢修不當和設備故障之間的連接線較粗,表明這兩者之間的因果關系程度也更為密切。
利用貝葉斯網(wǎng)絡概率圖可以假定某一事件的狀態(tài)為存在或不存在時,其他相關因素事件的發(fā)生概率變化情況。由于影響非計劃停機事件發(fā)生概率最大的因素為“檢修不當”,因此假設當“檢修不當”這一事件因素發(fā)生的概率為0,即檢修維護人員“檢修不當”狀態(tài)為No 的概率為100%時,觀察其他影響因素的各種狀態(tài)概率變化情況,如圖5所示。
圖5 檢修不當?shù)臓顟B(tài)為No時發(fā)生非計劃停機的后驗概率Fig.5 Posterior probability of the unplanned shutdown without improper maintenance
在圖5 中,當“檢修不當”為No 的狀態(tài)概率為100%時,即不存在檢修不當?shù)男袨闋顟B(tài)時,導致其他影響因素的概率變化情況,在圖中用深藍色表示。可見檢修不當?shù)臓顟B(tài)概率發(fā)生變化之后,設備故障的概率隨之發(fā)生了較大變化,從最初的68%降至18%,說明檢修不當這一因素與設備是否發(fā)生故障的關系非常密切。同時,“老化評估不足”這一事件發(fā)生的概率從最初的15%降至7%,“冗余設備失效”這一事件發(fā)生的概率從最初的9%降至6%,而最終“非計劃停機事件”發(fā)生的概率從最初的87%降至57%。說明檢修工作會從各方面對發(fā)電廠非計劃停機事件的發(fā)生造成非常大的影響,如果在日常工作中有效加強各方面的工作質(zhì)量,就可以有效降低機組非計劃停機事件發(fā)生的概率。
在機組的日常檢修維護過程中,檢修工作不僅僅需要當設備出現(xiàn)故障缺陷時被動地進行維修和維護。尤其是隨著機組運行時間逐步變長,各種設備逐漸發(fā)生老化,如果不能對運行設備進行正常工作壽命的有效評估,則會發(fā)生設備老化狀態(tài)評估不足的現(xiàn)象?,F(xiàn)在假設當“老化評估不足”為Yes的狀態(tài)發(fā)生概率為100%時,其他各影響因素的狀態(tài)概率變化情況,如圖6所示。
圖6 老化評估不足的狀態(tài)為Yes時發(fā)生非計劃停機的后驗概率Fig.6 Posterior probability of the unplanned shutdown with an insufficient aging status evaluation
在圖6 中,對老化評估不足的Yes 狀態(tài)直接設置為100%,用紫色表示老化評估不足和其導致的相關影響因素??梢姰斃匣u估不足的狀態(tài)一直存在時,設備發(fā)生故障的概率從68%升至93%,冗余設備失效的概率從9%升至10%,而非計劃停機事件發(fā)生的概率則從87%升至94%。說明設備的老化狀態(tài)評估對機組的設備故障和非計劃停機事件的發(fā)生會造成較大影響。而且由圖2 可見,當機組運行時間達到6~8年時會因為設備老化評估的不足而導致非計劃停機事件發(fā)生的次數(shù)出現(xiàn)明顯反彈。而由于不同設備的正常運行壽命周期不同,隨著機組運行時間分別達到13 年和17 年時,又會由于設備老化評估不足等原因而導致機組非計劃停機事件發(fā)生次數(shù)再次增多。隨著機組運行時間的增長和運維人員對機組運行各種狀態(tài)特性的熟悉和了解,機組發(fā)生非計劃停機事件次數(shù)的總體變化趨勢是逐年降低的,而這也與運維人員對機組設備的壽命狀態(tài)更加熟悉密切相關。
利用2000 —2020 年發(fā)生的520 次發(fā)電廠非計劃停機事件分析報告資料,對其進行影響發(fā)電機組非計劃停機事件的因素數(shù)據(jù)進行匯總和歸納分析,最終形成了影響發(fā)電廠非計劃停機事件的貝葉斯網(wǎng)絡分析圖。研究表明,當對于設備的老化評估不足時,由于設備故障而導致停機事件發(fā)生的概率會大幅提升。檢修不當,則會從各個方面對機組發(fā)生非計劃停機事件造成廣泛而直接的影響。隨著未來能源大數(shù)據(jù)技術的不斷深入發(fā)展,在匯集更加全面豐富的機組正常運行影響因素數(shù)據(jù)之后,有可能對發(fā)電機組的正常運行數(shù)據(jù)進行進一步的提取和推理分析,從而有效減少機組發(fā)生非計劃停機事件,提高發(fā)電機組設備的安全性、穩(wěn)定性、可靠性。