林 穿,徐啟峰,黃奕釩
(福州大學 電氣工程與自動化學院,福建 福州 350108)
電力安全事故(下文簡稱:電力事故)始終是電網(wǎng)運行中需要關注的重點。在電力生產中,作業(yè)人員必須遵守《電業(yè)安全工作規(guī)程》等章程,但是多年來電力事故屢禁不止。據(jù)國家能源局統(tǒng)計,2017年至2020年間,全國年均發(fā)生電力人身傷亡事故約42起,反映出國內電力安全生產中的不足,例如:安全法規(guī)執(zhí)行不到位、預防措施不到位、預警不及時等。針對電力事故問題,《電力安全事故應急處置和調查處理條例》(國務院令第599號)中明確規(guī)定事故調查處理措施:必須理清事故發(fā)生的過程、原因與事故性質,并規(guī)定事故相關單位和有關人員應當吸取事故教訓,防止事故再次發(fā)生。
在電力生產過程,眾多影響因素相互誘發(fā)、轉換、耦合,最終可能演化為電力事故。文獻[1]基于關聯(lián)規(guī)則挖掘電力事故的關鍵誘因,通過實例驗證了該方法對電力生產安全決策控制的有效性;文獻[2]借鑒“海因里希法則”從隱患因素角度出發(fā),構建安全事故比例模型用于確定未來隱患數(shù)量并進行隱患消除;文獻[3]利用多級模糊評判對評價指標量化賦權,基于貝葉斯網(wǎng)絡訓練發(fā)電企業(yè)的安全生產風險預警模型,分析主要風險因素、有針對地提出控制措施。上述方法雖然能夠預測電力事故的多種影響因素,指導企業(yè)做出防范,但忽略了事故發(fā)展中多種因素之間的關聯(lián)關系,未能清晰地刻畫事故發(fā)展的邏輯演化關系。
事理圖譜[4]的概念,開啟了人工智能2.0時代嶄新的研究領域。事理圖譜從認知智能角度出發(fā),重點剖析事件之間的順承關系、因果關系和上下位等事理邏輯。相比單純靜態(tài)的實體知識圖譜,事理圖譜能夠刻畫事件的動態(tài)性,具有更強大的應用價值。文獻[5]提出構建事理圖譜框架,揭示突發(fā)事件新聞的演化模式和規(guī)律;文獻[6]針對網(wǎng)絡輿情事件摘要構建可視化事理圖譜,從4個不同維度解讀輿情事件的演化路徑;文獻[7]采用深度神經網(wǎng)絡抽取航空安全事故因果關系創(chuàng)建事理圖譜,深入分析事故發(fā)生過程;文獻[8]構建政策影響事理圖譜,梳理政策對利益相關者及市場的影響,發(fā)現(xiàn)關鍵節(jié)點并予以控制。但事理圖譜的核心技術及應用模式尚處于探索階段[9],在電力安全領域的應用尚未取得顯著進展。
基于此,本文以國家能源局公布的全國電力安全生產情況為研究對象,通過對文本數(shù)據(jù)的知識抽取、知識融合以及知識加工,采用圖數(shù)據(jù)庫Neo4j構建電力事故事理圖譜。最后,基于事理圖譜從歷史事故演化路徑[10]以及新事故推演路徑驗證該方法的有效性。
電力事故事理圖譜構建包含5個階段,如圖1所示,分別為:數(shù)據(jù)獲取與預處理、抽取事件鏈與事件槽關系、泛化事件槽、構建事理圖譜和新事件推演預測。
圖1 研究框架Fig.1 Research framework
階段1:通過python編程,獲取電力事故數(shù)據(jù),調用哈爾濱工業(yè)大學自然語言處理平臺LTP工具[11]的Pyltp模塊對文本進行分句分詞、去除停用詞、詞性標注和句法分析等預處理。
階段2:電力事故文本為半結構化數(shù)據(jù),1條事故文本包含1條事故事件鏈,事件鏈由若干事件槽組成。通過設計標識詞抽取文本中每個事故的事件鏈,依據(jù)句型結構劃分事件槽,并編寫規(guī)則模板判斷事件槽的關聯(lián)關系。
階段3:利用Word2vec訓練事件槽的詞向量并采用相似度計算泛化事件槽。
階段4:運用熱力圖矩陣記錄泛化為同一類事件槽的次數(shù)權重(下文簡稱:權重),利用Neo4j圖數(shù)據(jù)庫構建以事件槽為節(jié)點、事件槽的關聯(lián)關系為邊、權重為邊屬性的電力事故事理圖譜。
階段5:對于新事件,采用階段2和階段3的方式進行事件槽泛化歸類,再利用已經構建的事故事理圖譜推演預測后續(xù)可能發(fā)生的事件。
電力事故文本的每1條事故描述均為半結構化數(shù)據(jù)文本,描述了[事故概率]、[作業(yè)種類]、[事故原因]、[事故類型]和[事故結果]。其中,[作業(yè)種類]、[事故原因]、[事故類型]以及[事故結果]的句子構成1條事件鏈,是需要保留的有效信息,而[事故概況]需要剔除。根據(jù)文本特點,設計事件標識詞,事件標識詞如表1所示,用于識別事件鏈。
表1 事件標識詞Table 1 Event identifier words
半結構化文本事件鏈中含有明確的因果關系和順承關系,通過標識詞的句法模式設計規(guī)則模板[12-13]的方式抽取因果事件槽對和順承事件槽對。
1.3.1 因果關系事件槽對抽取
假設電力事故事件鏈表示為E={w1,w2…,wm},是由m個詞語w組成的集合,詞性標注后的集合為E={w1/pog1,w2/pog2,…,wm/pogm}。根據(jù)“造成、導致、由于”等因果關系標識詞,設計以
表2 因果關系抽取規(guī)則模板Table 2 Rule template of causal relation extraction
1.3.2 順承關系事件槽對抽取
假設電力事故事件鏈表示為E={e1,e2…,en},是由n個事件槽e組成的集合。根據(jù)“在…時、在…期間”等順承關系標識詞設計了以
表3 順承關系抽取規(guī)則模板Table 3 Rule template of continuation relation extraction
1.4.1 概念圖譜
通過規(guī)則模板抽取的事件槽可能屬于同一類表達含義,進行事件槽的泛化能夠更高層次地表示出事件槽之間的關系且能簡化圖譜。實體圖譜泛化形成的概念事理圖譜的過程如圖2所示(下文所述事理圖譜均為概念事理圖譜)。例如:事件槽e31和e32經過泛化后形成概念圖譜中的同一類事件槽e3。事件槽之間的關系用箭頭表示,箭頭邊上的數(shù)字表示泛化為同一類的事件槽權重。
圖2 概念圖譜Fig.2 Concept graph
1.4.2 相似度算法
聚類分析法常用于事件的泛化,但電力事故作業(yè)種類多、事故原因復雜,運用聚類法時聚類簇將隨之增多,聚類簇選取困難。因此,本文改進文獻[14]的句子相似度算法用于泛化電力事故事件槽。
1)詞語相似度
每個事件槽分詞后可表示為e={w1,w2,…,wi},每個分詞w通過Word2Vec可轉化為對應的詞向量vec,通過余弦相似度計算可求得2個詞語的相似度,如式(1)所示:
(1)
式中:sim(wi,wj)為2詞語相似度;i和j為序號;vecik為詞向量veci的第k個分量值;vecjk為詞向量vecj的第k個分量值;x為詞向量分量個數(shù)。
2)事件槽相似度
文獻[14]的方法考慮了所有詞語,而事實上事件的每個分詞并非全部具有價值信息,必然造成信息冗余。本文在詞語相似度的基礎上重新定義事件槽相似度,如式(2)所示:
(2)
以國家能源局公布的2014至2020年間的307起人身傷亡事故的電力事故文本數(shù)據(jù)為研究對象。
根據(jù)事件標識詞和規(guī)則模板提取事件鏈和事件槽,形成422條因果事件槽對和686條順承事件槽對。
泛化流程示意如圖3所示。
圖3 泛化流程示意Fig.3 Schematic diagram of generalization process
步驟1:在運用事件槽相似度算法前,對事件槽中描述公司名、地點、數(shù)字和時間等干擾詞語進行停用,提高泛化精度。
步驟2:隨機選取一事件槽,運用式(2)計算該事件槽與其他事件槽相似度,相似度大于0.70的泛化為同一類。
步驟3:從剩余事件槽中隨機再選一事件槽,重復步驟2,完成所有事件槽的泛化。
電力事故事理圖譜的構建采用Neo4j圖數(shù)據(jù)庫顯示[15],事件槽泛化后,共計371個節(jié)點,553條邊,局部電力事故事理圖譜如圖4所示。
圖4 電力事故事理圖譜(局部)Fig.4 Event evolutionary graph of power accidents(partial)
基于Neo4j構建的事理圖譜,通過Cypher語言能夠可視化查詢歷史事故發(fā)生的演化路徑。例如:在Neo4j瀏覽器界面輸入Cypher語句“MATCH p=( )←(n:‘作業(yè)種類’{name:‘線路改造’})→( )→( )→( ) RETURN p”,將顯示[線路改造]作業(yè)的事故演化路徑,如圖5所示。
由圖5可知,[線路改造]作業(yè)順承20種事故原因,其造成的事故類型有[墜落]、[觸電事故]和[燒傷]3種,可能導致[死亡]和[死亡重傷]2種事故結果。采用熱力圖矩陣記錄關系邊的權重,局部示意如圖6所示。
圖5 線路改造作業(yè)事故演化路徑Fig.5 Evolutionary paths of accidents in line reconstruction operation
由權重大小可以直觀把握事故的關鍵風險節(jié)點。例如:由圖6可知,[線路改造]可能發(fā)生[誤入帶電間隔]、[相距不足放電]等事件槽,其中[電桿抱桿傾倒]權重10最高,可認定為關鍵風險點。事故鏈[線路改造]→[電桿抱桿傾倒]→[墜落]→[死亡]應得到電力企業(yè)的重視,在作業(yè)前著重確認并加固電桿抱桿的穩(wěn)定性,杜絕[墜落]事故的發(fā)生。
圖6 “作業(yè)種類—事故原因”熱力圖矩陣示意Fig.6 Schematic diagram of thermodynamic diagram matrix of “operation type” and “accident cause”
以2021年1月份公布的1起新的電力事故為例,說明基于事理圖譜的電力事故預控方案。新事故描述為:“2021年1月16日,某發(fā)電有限公司發(fā)生一起人身傷亡事故,1人死亡。該公司勞務分包單位1名作業(yè)人員,在清掃備用石膏排放輸送皮帶機上散落的石膏過程中,倒臥在備用石膏排放輸送皮帶機尾部機架上,經搶救無效死亡?!?/p>
該事故事件鏈為[清掃備用石膏排放輸送皮帶機上散落的石膏過程](記為E1)→[倒臥在備用石膏排放輸送皮帶機尾部機架上]→[無效死亡]。新事故路徑推演和預控流程如圖7所示。
圖7 新事故推演與預控流程Fig.7 Deduction and pre-control process of new accident
將作業(yè)種類事件槽E1與所建事理圖譜中的事件槽進行相似度計算,將匹配到[真空脫水機旁進行下槽石膏清理]事件槽(記為E2),2者相似度為0.88。通過Cypher語言查詢E2,將顯示后續(xù)事件鏈[暈倒在人行通道上]→[死亡],該事故發(fā)生于2019年7月17日,與新事故高度相似。石膏的清理工作一般處于粉塵污染較大的環(huán)境中,作業(yè)人員容易發(fā)生暈倒、倒臥的情況,最終將引發(fā)事故發(fā)生。
基于事理圖譜的電力事故預測對提前采取防范措施、降低事故發(fā)生率有重要作用。在本例中,假設當作業(yè)人員接到E1任務時,事先通過歷史事理圖譜的事故映射推演,獲悉面臨的暈倒風險,作業(yè)人員與企業(yè)就能夠采取必要的預控措施,有效地抑制事故的發(fā)生。
1)以國家能源局公布的電力事故文本為研究數(shù)據(jù),應用事件標識詞和規(guī)則模板提取事故事件鏈、事件槽以及事件槽間的順承與因果關系,通過相似度算法泛化事件槽構建電力事故事理圖譜。
2)通過事故事理圖譜事件槽的熱力圖矩陣權重可以捕捉到事件鏈中的關鍵風險節(jié)點。
3)通過事理圖譜可以推演歷史事故的發(fā)展路徑、動態(tài)分析事故的發(fā)展過程。
4)在完成新的電力作業(yè)之前,可以通過事理圖譜推演出歷史相似事故的演化路徑,為電力作業(yè)提供風險警示,主動制定必要的防控措施。