張文祥,陸文宇,王仕安
(1.上海市電力公司,上海 200122;2.上海久隆信息工程有限公司,上海 200082)
應急管理不僅關注突發(fā)事件發(fā)生后,啟動預案實施干預,解決問題,而且關注事前的風險防范,也就是預防預控。準確的預防預控是建立在大量歷史突發(fā)事件的實踐經(jīng)驗和評估總結(jié)基礎上的。這些實踐經(jīng)驗和評估總結(jié)信息包括與突發(fā)事件相關的各類問題、主題,以及響應過程中的行動指南、技術措施、規(guī)章制度、應急資源等所有影響到組織決策的信息。目前這些信息采用較為簡單的文本化管理,相對于綜合性知識化管理要求仍存在一定距離。針對上海市電力公司(以下簡稱“公司”)對應急信息知識化管理的需求特點,需要對當前應急管理相關的文本化資料的結(jié)構及特征進行解析,研究按主題對應急信息進行結(jié)構化的方法,設計從文本集合中快速查詢主題知識的模型,策劃應急體系知識庫系統(tǒng)解決方案,以滿足應急信息知識化管理要求,應用信息化管理手段在響應決策中合理調(diào)配各種資源,按照既定程序處置突發(fā)事件。
上至國家和政府相關機構,下至各種科研院所、咨詢機構及IT企業(yè),為促進應急管理更科學更高效,從應急管理機制研究、管理模式轉(zhuǎn)變等宏觀方面的研究和應用,到應急管理中的具體技術的探索和嘗試,均做了大量的工作,其中基于知識的應急管理目前正成為研究及應用熱點。
科學決策作為應急管理的核心,知識庫便是決策系統(tǒng)的必要基礎。應急知識庫可以為決策者提供突發(fā)事件的相關知識,通過知識組織應急管理中的資源,合理調(diào)配資源,通過知識對突發(fā)事件的處置進行科學決策,解決應急問題。
目前,公司的應急知識庫在業(yè)務應用和技術手段等方面都還處于持續(xù)探索階段,需要不斷完善現(xiàn)有應急管理信息平臺,全面實現(xiàn)各類應急信息的橫向貫通,形成結(jié)構化的應急知識庫,并通過對應急知識庫的挖掘和應用,實現(xiàn)應急信息知識化管理,為風險防控和應急指揮決策提供有力支持。
使用結(jié)構化方法將非結(jié)構化文本轉(zhuǎn)化為結(jié)構化文本,然后在知識檢索過程中通過建立抽象模型,在結(jié)構化文本與知識庫中的實例之間建立聯(lián)系,通過計算相似度得到實例與查詢問題的相關程度,從而提高查詢效率和準確度,其解決方案如圖1所示。
應急信息的知識化過程包括2個主要任務。
(1)通過結(jié)構化方法和模型將電子化文本轉(zhuǎn)化為結(jié)構化文本。
(2)通過抽象模型,將結(jié)構化文本轉(zhuǎn)變?yōu)閼敝R庫。
從文本中獲取知識,最典型的方法就是基于類自然語言理解的文本知識自動結(jié)構化技術。用領域文法描述文本,將該領域問答轉(zhuǎn)換為描述語句信息的、符合正則表達式規(guī)范的規(guī)則,用該規(guī)則把文本轉(zhuǎn)換為表示知識的語義組,最后形成領域知識庫。
文本結(jié)構化原理如圖2所示。
圖1 應急知識庫解決方案
圖2 文本結(jié)構化原理
對知識的抽取采取四維分解的方式。
(1)X:將文本按照來源和應急用途分類。具體的類型主要為:應急預案、處置方案、培訓資料、演練方案、規(guī)章制度、法律法規(guī)、事故案例、應急人員、應急物資等。
(2)Y:在具體的文本中對段落進行結(jié)構化。不同文本的結(jié)構不同,其具體的結(jié)構化方式也不同。由于與應急相關的文本大多形式比較規(guī)范,可采用分段落形式進行結(jié)構化。其優(yōu)點是:思路清晰,相對簡單,定位準確。
(3)Z:在段落中對提問涉及到的內(nèi)容進行知識點定位。這個過程可以基于分詞技術自動完成。
(4)Q:設置主題知識(也就是問題)與眾多知識點之間按照布爾檢索方法形成一一對應關系。
知識化抽象模型具體見圖3。
圖3 應急體系知識抽象化模型
這種方式需要完成幾項基礎工作。
(1)分類文本集。制定出文本集清晰的分類標準,做到不重復和全面覆蓋。
(2)結(jié)構化段落。段落的結(jié)構化通過標記性語言設計。
(3)知識點設置。通過專業(yè)自動分詞機制設置知識點,能夠保證問題與文本內(nèi)容的比對,并進行抽取和定位。
知識抽取模型最終形成一個四維表格,將應急相關問題與眾多文本集的主題知識相映射。
主題知識是用戶最終的需求結(jié)果,在形式上分為段落集、標題集或文本集。
主題知識索引是完成文本結(jié)構化的各數(shù)據(jù)結(jié)構模型的一個屬性,包括文本主題和段落主題,表達文本和知識段落的主題特征。通過特征索引可以得到用戶需求的文本知識段落。
主題知識查詢模型見圖4。
3.4.1 應急知識庫的基本功能
(1)應急體系相關人員管理功能,包括相關人員的添加、刪除、修改和查詢。
(2)應急體系相關物資管理功能,包括相關物資的添加、刪除、修改和查詢。
(3)應急體系相關文本管理功能,包括相關文本的添加、刪除、修改和查詢。
圖4 主題知識查詢模型
3.4.2 應急知識庫的知識查詢功能
(1)應急體系相關人員、物資和文本三者之間以標記語言為基礎,建立知識索引,合成知識文本。
(2)全面查詢:從整個知識庫進行主題查詢。
(3)精確查詢:從人員、物資或者文本中,進行細分主題查詢,查詢條件之間聯(lián)動,查詢條件與查詢結(jié)果之間聯(lián)動。
(4)圖表查詢:專門針對文本中的圖形和表格進行主題知識查詢。
應急體系知識庫系統(tǒng)功能結(jié)構見圖5。
圖5 應急體系知識庫系統(tǒng)功能結(jié)構
以《上海市電力公司人身傷亡事故專項應急預案》為實例,分析結(jié)構化方法及其應用。
發(fā)生人身傷亡事故時,應急領導小組根據(jù)事故具體情況,輸入問題“死亡人數(shù)30人以上”,知識庫搜索主題與“死亡人數(shù)30人以上”相關的知識點。搜索結(jié)果顯示與“死亡人數(shù)30人以上”相關的所有文本集。文本集包括公司人身傷亡事故專項應急預案、人身傷害相關規(guī)章制度、人身傷害事故相關處置方案、其他涉及到人身傷害的應急預案、演練方案和演練腳本等文本的集合。通過應急知識庫管理系統(tǒng)的“文本合并”功能,將相關的文本集合并起來,構成應急相關人員需要集中收集的文本信息匯總集合。其應急響應簡化流程見圖6,輸入問題界面如圖7所示。
圖6 應急響應簡化流程
圖7 輸入問題界面
檢索結(jié)果是一系列的文本片段,可以選擇是否合成。系統(tǒng)通過內(nèi)部處理邏輯將文本合成一份新的文本。檢索結(jié)果界面如圖8所示。
單擊“打開”按鈕,可以查看到具體某個知識主題的內(nèi)容,其查詢界面如圖9所示。
單擊“返回”按鈕,返回“檢索結(jié)果示意界面”。在“檢索結(jié)果示意界面”單擊“合并”按鈕,進行文本合并,并根據(jù)內(nèi)部邏輯關系推導出應對措施。主題知識合并界面見圖10。
(1)易于信息收集。在日常應急管理過程中,通過統(tǒng)一機制,將相關應急信息集中管理,規(guī)避了收集和展現(xiàn)不夠快速、不夠直觀的弊病,促進決策高效。
圖8 檢索結(jié)果界面
圖9 主題知識查詢界面
圖10 主題知識合并界面
(2)易于知識識別。將當前的應急信息通過信息化工具管理,通過統(tǒng)一標準格式化,對每個文本片段進行分詞,建立思維知識關聯(lián)體系,提供了對應急處置有價值的知識體系,利于決策管理。
(3)易于關聯(lián)信息查找。通過知識片段的廣泛查找與文本合并推導方式,可以多維度地查找關聯(lián)信息,有利于克服信息檢索之困難。
應急信息知識化管理能有效梳理各類應急信息,建立應急知識庫,通過數(shù)據(jù)挖掘輔助領導決策,有利于實現(xiàn)公司“覆蓋全面、運轉(zhuǎn)高效、協(xié)作順暢、保障有力”的應急體系建設愿景,有效落實國家電網(wǎng)公司風險防控的管理要求,對保障公司安全生產(chǎn)具有重要意義。