李 欣,馮小芳,金福才
(1.北京經(jīng)緯信息技術有限公司,北京 100081;2.中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081)
鐵路調度應急預案是鐵路調度應急指揮的指導性方案,是鐵路調度人員應對突發(fā)事件的行動指南。鐵路調度應急預案管理水平關系調度應急指揮的效率及應急處置的成效。鐵路應急處置大多是由多工種業(yè)務人員共同參與、配合完成,但全面掌握相關業(yè)務知識的專業(yè)人員極少,導致應急預案編制缺乏系統(tǒng)性;另一方面,現(xiàn)有的鐵路調度應急預案對多源應急信息資源缺乏系統(tǒng)梳理和有效組織,造成相關信息資源整合困難,制約了鐵路調度應急預案管理能力。
目前,國內針對鐵路應急預案數(shù)字化方案已開展了一些研究。文獻[1]提出融合本體與深度學習的應急預案數(shù)字化方法,運用深度學習算法,從應急事件消息文本中提取關鍵信息,并用本體方法對事件處理流程進行分析和梳理,自動生成數(shù)字化鐵路應急預案;文獻[2] 研究提取應急預案指定要素核心內容的數(shù)字化預案轉化方法,利用工作流引擎實現(xiàn)應急預案編寫、評審、發(fā)布、使用、修訂、廢止的全生命周期管理,提高應急預案的適用性與可操作性。
知識圖譜(Knowledge Graph)本質上是一種揭示實體之間關系的語義網(wǎng)絡,為海量、異構、動態(tài)數(shù)據(jù)的表達、組織、管理及利用提供一種非常有效方式,可快速、準確地實現(xiàn)信息關聯(lián)搜索。目前,知識圖譜廣泛地應用于醫(yī)療、政務、電商、金融等領域,為智能問答、商品推薦、金融風險識別等提供實用工具。文獻[3]通過語義匹配、圖神經(jīng)網(wǎng)絡、路徑多跳、邏輯多跳等知識圖譜多跳問答推理方法,研究智能問答的解決方式;文獻[4]提出“預訓練+知識向量服務”模式,設計知識圖譜預訓練模型,極大地提高了商品分類、同類商品挖掘、商品推薦等應用的性能;文獻[5]通過圖分析、圖挖掘等技術,發(fā)現(xiàn)深層風險關聯(lián),增強風險賬戶識別能力。
本文研究運用知識圖譜概念和方法,結合鐵路應急救援場景,對鐵路調度應急預案所涉及的多源信息資源進行分析和整合,實現(xiàn)相關信息的關聯(lián)存儲與有序組織,為鐵路調度應急預案的綜合展示與規(guī)范化管理提供有利條件。
知識圖譜采用可視化方式,系統(tǒng)、形象地展示領域知識的整體框架、核心概念實體及其關聯(lián)關系,是一種綜合應用數(shù)學、圖形學、信息可視化技術、信息學等學科的理論方法。
知識圖譜是由節(jié)點和邊組成的圖,節(jié)點表示各個知識點,邊是知識點之間的關聯(lián)關系,形成網(wǎng)狀知識結構,能夠顯式、直觀地表達知識的關聯(lián)關系,可有效避免信息遺漏,也便于快速檢索相關知識。
通常,知識圖譜采用圖數(shù)據(jù)庫實現(xiàn)領域知識的關聯(lián)存儲,相較于關系型數(shù)據(jù)庫,圖數(shù)據(jù)庫更適于構建復雜關系網(wǎng)絡,使機器具備認知、理解領域知識的能力,實現(xiàn)智能解決業(yè)務問題的目的。
知識圖譜的構建過程主要包括知識抽取、知識融合、知識存儲3 個步驟,從多源信息中抽取概念、屬性、關系,并封裝成知識單元,融合語義表達不同但表示同一對象的概念、屬性,將整理的知識及其關聯(lián)存儲為圖。一般將知識圖譜劃分為實體層和數(shù)據(jù)層2 個層面,采用自頂向下和自底向上相結合的方法進行構建,基本流程如圖1 所示。
圖1 知識圖譜構建流程
依照知識圖譜的一般構建方法,鐵路調度應急預案知識圖譜構建過程為:先識別出鐵路調度應急預案涉及的相關實體概念,定義其屬性及其關系,然后完成鐵路調度應急預案數(shù)據(jù)的抽取、融合與存儲。
實體指的是事物基礎、本源的規(guī)范化概念,是實際存在的起作用的組織或機構、行為的發(fā)起者或執(zhí)行者。實體是概念、屬性、關系的集合,根據(jù)經(jīng)驗知識進行概念層次劃分、要素屬性識別、關聯(lián)關系定義,完成實體層的構建。
2.1.1 主要實體概念
在鐵路調度應急預案中,實體概念主要為應急處置任務的4 個核心要素,包括應急事件、與應急處置相關的機構崗位職責、應急處置流程、應急處置評價。
(1)應急事件是因自然災害、設備故障等因素對列車運行造成影響,需要調度人員采取故障處置、現(xiàn)場救援等措施實施干預的事件。
(2)機構崗位職責主要以調度所和應急指揮中心為核心,以二者的管轄機構、平行單位為輻射半徑,會合與鐵路應急處置相關的路外其他行業(yè)機構,機構內設置有應急處置的崗位職責。
(3)應急處置流程是指對于發(fā)生的應急事件,有關部門按其崗位職責需完成的指定任務。按照應急處置流程的不同階段,將應急處置任務劃分為事前、事發(fā)、事中、事后4 個層次,可為每個階段設定不同的目標和任務[6],如表1 所示。
表1 應急處置流程概念實體的層次劃分
(4)應急處置評價是對應急事件綜合處理情況的各項評定,包括應急處置流程核心階段的完成情況評價、相關部門履職情況評價等。
2.1.2 實體屬性定義
每個實體具有多個基本屬性,其每個基本屬性可設置一到多個屬性值。
(1)應急事件實體的屬性包括事件類型、等級、發(fā)生時間、線路地點、發(fā)生原因、影響情況、應急措施等。
(2)機構崗位職責實體的屬性包括部門名稱、部門職責、崗位名稱、崗位職責、人員信息等。
(3)應急處置流程實體的屬性包括流程名稱、流程內容、流程進度等。
(4)應急處置評價實體的屬性包括評價項目、評價標準、評價結果、評價分析等。
2.1.3 實體關系定義
鐵路調度應急預案中,除因果、跟隨、并發(fā)、互斥、順序等一般實體關系外,還包括表達隸屬、協(xié)同、信息指令傳達等領域業(yè)務邏輯的實體關系[7],各類關系的含義,如表2 所示。按照上述實體關系的定義,梳理出如圖2 所示的鐵路調度應急預案知識圖譜實體層結構。
表2 鐵路調度應急預案實體關系含義說明
圖2 鐵路調度應急預案知識圖譜實體層結構
按照不同知識來源,將鐵路調度應急預案涉及的多源異構信息資源進行數(shù)據(jù)抽取、數(shù)據(jù)融合與知識存儲,構建鐵路調度應急預案知識圖譜數(shù)據(jù)層。
2.2.1 數(shù)據(jù)抽取
鐵路調度應急預案涉及的數(shù)據(jù)來源較多,數(shù)據(jù)類型多樣。除信息系統(tǒng)的結構化數(shù)據(jù)外,還有諸如從氣象局網(wǎng)站獲取的天氣信息這類半結構化數(shù)據(jù),以及處置現(xiàn)場圖像、視頻、事后總結分析等的非結構化數(shù)據(jù)。
(1)結構化數(shù)據(jù)一般存儲于關系型數(shù)據(jù)庫,因字段定義明確,一般通過設置字段映射規(guī)則,實現(xiàn)從數(shù)據(jù)庫中自動抽取實體、屬性及關系。
(2)半結構化數(shù)據(jù)本身存在一定結構但需要進一步提取整理,可利用包裝器(Wrapper)進行抽取,由包裝器從HTML 網(wǎng)頁中爬取數(shù)據(jù),并重新組裝為結構化數(shù)據(jù)。
(3)非結構化數(shù)據(jù)一般通過已知實體對非結構化內容進行標注,轉化為有監(jiān)督學習的問題[8-9]。圖像、視頻類非結構型數(shù)據(jù)可通過實體標注后進行分類抽?。晃谋拘头墙Y構化數(shù)據(jù)的抽取較為困難,以最小粒度的實體概念屬性進行語義相似度校驗,將關鍵信息抽取出來,例如應急規(guī)章制度文件中抽取具體場景的規(guī)章制度條款。
2.2.2 數(shù)據(jù)融合
對于非結構化文本數(shù)據(jù),因中文描述的多樣性,相同的內容可能存在多種表述,導致抽取的數(shù)據(jù)存在冗余??赏ㄟ^計算語義相似度,對孤立的實體概念、屬性和關系進行數(shù)據(jù)融合處理[10]。以地點和天氣為例,非結構化文本數(shù)據(jù)融合結果前后對比,如表3所示。
表3 非結構化文本數(shù)據(jù)融合示例
2.2.3 知識存儲
將結構各異的多源數(shù)據(jù)轉化為由開始節(jié)點、關系、結束節(jié)點3 個元素組成的結構化數(shù)據(jù),建立關系三元組<實體1,實體關系,實體2>。以跟隨關系為例,應急處置流程總是跟隨應急事件發(fā)生,對應的三元組關系可表示為<應急處置流程,跟隨,應急事件>,以此建立實體關系集合。
對于屬性和關系較為豐富的結構化數(shù)據(jù),采用圖數(shù)據(jù)庫方式存儲更有優(yōu)勢[11]。將關系三元組<實體1,實體關系,實體2>中的實體1 和實體2 存儲為節(jié)點,屬性關系、語義關系存儲為邊,將結構化知識三元組映射為圖中的節(jié)點和邊,以便于使用圖查詢語言和圖挖掘算法實現(xiàn)基于知識圖譜的具體應用[12-13]。
以自然災害啟動應急預案為例,采用上述方法完成應急事件、機構崗位職責、處置流程、應急評價等應急預案核心實體概念及關聯(lián)關系的形式化表達,將相對孤立、零散的多源數(shù)據(jù)轉化為相互關聯(lián)的知識結構體,構建鐵路調度應急預案的知識圖譜。
鑒于鐵路調度應急預案的核心要素與環(huán)節(jié)較多,內部關系復雜,采用實體結構圖對鐵路調度應急預案知識體系進行梳理。以自然災害霧天行車場景為例,對處置過程中各部門崗位職責、關聯(lián)信息以及外部資源等進行剖析,形成應急預案知識體系,如圖3 所示。
圖3 霧天行車場景的應急預案相關實體結構圖
根據(jù)應急預案的相關概念實體結構圖,對應急預案場景涉及的多源異構數(shù)據(jù)進行抽取、融合及存儲,形成鐵路調度應急預案知識圖譜。以霧天行車場景為例,鐵路調度應急預案知識圖譜如圖4 所示。
圖4 霧天行車場景的應急預案知識圖譜
針對霧天行車場景的應急預案知識圖譜構建好之后,可以便利地綜合展示預案相關信息,減少人工查找和匯集信息的工作量,應用如圖5 所示。
圖5 霧天行車場景的應急預案展示
在大霧天氣啟動應急預案的應用場景中,通過將應急事件與對應場景處置的應急專家、相應故障的應急規(guī)章、歷史案例及處置流程等多項信息建立起關聯(lián),實現(xiàn)了特定類型的應急預案的綜合管理。在啟動應急響應后,可以迅速參照響應規(guī)章制度進行工作部署,按照處置流程的提示逐步執(zhí)行;處置過程中遇到難題時,能馬上聯(lián)系到具有相應應急救援場景處置經(jīng)驗的專家,召開分析會診,快速查閱到可供參考歷史案例等。
總之,知識圖譜可以根據(jù)信息的內在關聯(lián)性實現(xiàn)應急預案相關信息資源的整合和結構化展示,實現(xiàn)鐵路調度應急預案的綜合管理,使應急預案相關信息資源的使用更加便利化,更好地支持應急指揮快速決策,支持應急處置工作從容有序開展。
知識圖譜概念和方法為領域知識的提取、融合和組織管理提供了有效的方法。依照知識圖譜的構建方法,本文研究提出鐵路調度應急預案的概念層次劃分、要素屬性識別、關聯(lián)關系定義,將鐵路調度應急預案相關信息資源組織成概念明確、結構清晰、聯(lián)系緊密的知識體系;在此基礎上,研究鐵路調度應急預案的數(shù)據(jù)抽取、數(shù)據(jù)融合與知識存儲方法,實現(xiàn)異構多源數(shù)據(jù)的規(guī)范、有序組織與存儲,為應急預案相關信息資源的有效利用與綜合展示提供良好條件。
鐵路調度應急預案涉及的信息多種多樣,目前還沒有度量各類信息與應急預案關聯(lián)的緊密程度,由此造成信息大量存儲,不利于數(shù)據(jù)的高效利用。因此,今后需要對如何量化應急預案數(shù)據(jù)關聯(lián)性開展深入研究,以提高鐵路調度應急預案的綜合管理、自主學習、關聯(lián)性分析水平,為鐵路應急調度指揮提供更加完備、有效的決策參考。