劉 琴,李佑文,褚紅健
(1.國(guó)電南京自動(dòng)化股份有限公司,江蘇 南京 210032;2.南京國(guó)電南自軌道交通工程有限公司,江蘇 南京 210032)
城市軌道交通行業(yè)復(fù)雜的城市軌道交通網(wǎng)、龐大的客流量、設(shè)施設(shè)備的復(fù)雜多樣性等逐漸成為造成應(yīng)急事件的主要因素,為各軌道交通運(yùn)營(yíng)公司的安全運(yùn)營(yíng)與管理工作帶來了巨大的壓力。由于城市軌道交通在人們的日常出行中起著至關(guān)重要的作用,在運(yùn)營(yíng)階段,任何應(yīng)急事件的發(fā)生都可能對(duì)運(yùn)營(yíng)造成嚴(yán)重的后果,輕則增加運(yùn)營(yíng)成本和耽誤乘客出行,嚴(yán)重的甚至?xí){到乘客的生命和財(cái)產(chǎn)安全。而現(xiàn)狀是城市軌道交通系統(tǒng)在應(yīng)急事件方面還沒有系統(tǒng)化的體系結(jié)構(gòu),無法做到真正的區(qū)域資源共享,往往造成問題解決不及時(shí)、效率低下等問題。因此,為了能在應(yīng)急事件發(fā)生時(shí)盡快解決問題,系統(tǒng)將根據(jù)可能的應(yīng)急事件類型,事先設(shè)計(jì)好應(yīng)急預(yù)案,存儲(chǔ)到預(yù)案庫(kù)中;將系統(tǒng)運(yùn)營(yíng)過程中,實(shí)際發(fā)生過的應(yīng)急事件及其采用的應(yīng)急預(yù)案,存儲(chǔ)在案例庫(kù)中。然而,城市軌道交通應(yīng)急事件類型較多,而且存在很多的不確定性,案例庫(kù)、預(yù)案庫(kù)的信息會(huì)很多,當(dāng)應(yīng)急事件發(fā)生時(shí),如何獲得最佳的應(yīng)急預(yù)案,實(shí)現(xiàn)自適應(yīng)預(yù)案和智能流程,仍然是一個(gè)難題[1]。
基于上述問題,本文提出了一種基于文本分析的應(yīng)急事件輔助決策方法,基于實(shí)時(shí)數(shù)據(jù)和機(jī)器學(xué)習(xí),結(jié)合當(dāng)前應(yīng)急事件與歷史數(shù)據(jù)分析結(jié)果,快速適應(yīng)場(chǎng)景,為站務(wù)人員推送最佳應(yīng)急預(yù)案,實(shí)現(xiàn)自適應(yīng)預(yù)案和智能流程,提高應(yīng)對(duì)復(fù)雜情況的效率與準(zhǔn)確性,解決快速響應(yīng)與靈活流程之間的矛盾,保證軌道交通安全運(yùn)營(yíng)[2]。
應(yīng)急事件發(fā)生后,工作人員將應(yīng)急事件信息匯總,形成一個(gè)文檔,根據(jù)匹配模型,在應(yīng)急預(yù)案庫(kù)中匹配度較高的應(yīng)急預(yù)案。若有匹配度較高的預(yù)案,則采用此預(yù)案,在執(zhí)行過程中對(duì)重要環(huán)節(jié)進(jìn)行人工考證,確保預(yù)案的可行性以及發(fā)現(xiàn)存在的問題并及時(shí)改正。應(yīng)急事件處理結(jié)束后,對(duì)其整個(gè)應(yīng)急處理流程進(jìn)行梳理、分析、總結(jié),對(duì)此次應(yīng)急事件對(duì)應(yīng)的應(yīng)急預(yù)案進(jìn)行修正,進(jìn)一步完善預(yù)案庫(kù)。若沒有匹配度高的預(yù)案,工作人員則根據(jù)現(xiàn)場(chǎng)實(shí)際情況給出一份符合實(shí)況的應(yīng)急預(yù)案。
應(yīng)急事件突發(fā)性強(qiáng),短時(shí)間內(nèi)難以獲得可靠的事件信息,給工作人員留的反應(yīng)時(shí)間短,為了盡可能地減少損失,要盡快地啟動(dòng)應(yīng)急預(yù)案。因此,如何提高預(yù)案匹配的準(zhǔn)確度成為研究的重點(diǎn)。預(yù)案匹配在整個(gè)應(yīng)急輔助決策流程中發(fā)揮著重要的作用,本文將文本分析應(yīng)用到應(yīng)急輔助決策中,提出基于文本分析的應(yīng)急輔助決策方法,具體流程如圖1所示。該方法在預(yù)案匹配中更加合理,從而幫助工作人員快速地找出最優(yōu)的應(yīng)急預(yù)案[3]。
圖1 應(yīng)急輔助決策流程
對(duì)語(yǔ)料庫(kù)中的每個(gè)文檔建立基于Gibbs Sampling的LDA模型,獲得每個(gè)文檔對(duì)應(yīng)應(yīng)急預(yù)案的分布以及每個(gè)文檔中詞的分布,進(jìn)一步獲得每個(gè)文檔中對(duì)應(yīng)于不同應(yīng)急預(yù)案的關(guān)鍵詞。
利用TF-IDF方法,挑選出區(qū)分度較高的關(guān)鍵詞,獲得當(dāng)前應(yīng)急文檔d的關(guān)鍵詞wi的計(jì)算公式為:
從應(yīng)急事件案例庫(kù)、預(yù)案庫(kù)中獲得應(yīng)急事件的文檔數(shù)據(jù),所有的文檔數(shù)據(jù)使用NLPIR漢語(yǔ)分詞系統(tǒng)進(jìn)行分詞處理,對(duì)分詞后的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,將清洗后的數(shù)據(jù)整合成文檔,構(gòu)成一個(gè)大的語(yǔ)料庫(kù)D。
首先,語(yǔ)料庫(kù)中的每篇文檔d中的每個(gè)詞隨機(jī)賦予一個(gè)主題z,其中n表示文檔d中的第n個(gè)詞,z表示主題,Z表示主題數(shù)。統(tǒng)計(jì)每個(gè)主題z中詞的數(shù)量以及每個(gè)文檔下出現(xiàn)主題z中詞的數(shù)量,每輪使用Dirichlet分布的期望公式,計(jì)算P(zn|z-n,d,w),即排除當(dāng)前詞的主題分布,根據(jù)其他所有詞的主題分布估計(jì)當(dāng)前詞分配到各個(gè)主題的概率Wdn;得到當(dāng)前詞屬于所有主題的概率分布后,根據(jù)此概率分布為當(dāng)前詞選定一個(gè)主題;重復(fù)上述步驟,直到Gibbs Sampling收斂,即每個(gè)文檔下主題分布θd和每個(gè)主題下詞的分布βz收斂。統(tǒng)計(jì)語(yǔ)料庫(kù)的主題-詞的共現(xiàn)頻率矩陣,根據(jù)這個(gè)主題-詞的頻率矩陣,獲得所有詞的主題概率分布。
針對(duì)一個(gè)特定文檔d中的第i關(guān)鍵詞wi,令該關(guān)鍵詞對(duì)應(yīng)的應(yīng)急預(yù)案為j,其對(duì)應(yīng)的公式為:pj(wi|d)=p(wi|j)×p(j|d)。
枚舉所有的應(yīng)急預(yù)案,其中j表示應(yīng)急方案,pj(wi|d)表示文檔d中第i關(guān)鍵詞對(duì)應(yīng)某個(gè)應(yīng)急預(yù)案j的概率;p(wi|j)表示應(yīng)急預(yù)案j中出現(xiàn)關(guān)鍵詞wi的概率;p(j|d) 表示文檔d對(duì)應(yīng)應(yīng)急預(yù)案為j的概率。
根據(jù)文檔中實(shí)際采用的應(yīng)急預(yù)案,獲得不同應(yīng)急預(yù)案的關(guān)鍵詞,構(gòu)建不同應(yīng)急預(yù)案關(guān)鍵詞集合T={t1,t2,…,tZ},ti表示對(duì)應(yīng)第i個(gè)應(yīng)急預(yù)案的關(guān)鍵詞集合。每個(gè)關(guān)鍵詞歸屬不同應(yīng)急預(yù)案的比重不同。
按照LDA獲得的文檔A對(duì)應(yīng)每個(gè)應(yīng)急預(yù)案的概率不同,而真實(shí)情況下,文檔A對(duì)應(yīng)的應(yīng)急預(yù)案是確定的,則將PAi(A實(shí)際對(duì)用的應(yīng)急預(yù)案i)修正為1,則將文檔對(duì)應(yīng)每個(gè)應(yīng)急預(yù)案的概率作為對(duì)應(yīng)關(guān)鍵詞集合的隸屬度。
采集當(dāng)前應(yīng)急事件的數(shù)據(jù),整合成一個(gè)文檔,利用TF-IDF方法,獲得該文檔的關(guān)鍵詞條,即此應(yīng)急事件的關(guān)鍵詞。
將關(guān)鍵詞條與案例庫(kù)、預(yù)案庫(kù)數(shù)據(jù)處理獲得的不同應(yīng)急預(yù)案關(guān)鍵詞集合進(jìn)行匹配,通過求和方式獲得與每個(gè)預(yù)案的關(guān)聯(lián)度。
基于3.3節(jié)中獲得某個(gè)應(yīng)急事件文檔d中關(guān)鍵詞wi對(duì)應(yīng)某個(gè)應(yīng)急預(yù)案j的概率pj(wi|d),從而獲得文檔d中所有關(guān)鍵詞對(duì)應(yīng)某個(gè)應(yīng)急預(yù)案j的概率;進(jìn)一步地獲得所有文檔中所有關(guān)鍵詞對(duì)應(yīng)每個(gè)應(yīng)急預(yù)案的概率。
將當(dāng)前應(yīng)急事件的一個(gè)關(guān)鍵詞wi與某個(gè)應(yīng)急預(yù)案j中包含的關(guān)鍵詞集合進(jìn)行匹配,如果應(yīng)急預(yù)案j中存在匹配的關(guān)鍵詞y,則認(rèn)為關(guān)鍵詞wiv歸屬于此應(yīng)急預(yù)案j的概率等于關(guān)鍵詞y歸屬于應(yīng)急預(yù)案j的概率即pj(wi)=pj(y),因此當(dāng)前應(yīng)急事件與某個(gè)應(yīng)急預(yù)案j的關(guān)聯(lián)度如下公式所示:
Cj=∑wk∈Spj(wk)
其中,wk表示當(dāng)前應(yīng)急事件的某些關(guān)鍵詞,S表示當(dāng)前應(yīng)急事件關(guān)鍵詞中與應(yīng)急預(yù)案j的關(guān)鍵詞集合相匹配的關(guān)鍵詞集合。
基于3.5節(jié)中獲得當(dāng)前應(yīng)急事件與所有應(yīng)急預(yù)案的關(guān)聯(lián)度,認(rèn)為與某應(yīng)急預(yù)案關(guān)聯(lián)度越高,采取該應(yīng)急預(yù)案的可能性越強(qiáng),選擇關(guān)聯(lián)度最高的應(yīng)急預(yù)案作為最佳的預(yù)案;而當(dāng)應(yīng)急事件與所有應(yīng)急預(yù)案的關(guān)聯(lián)度都偏低時(shí),則認(rèn)為此應(yīng)急事件未發(fā)生過,沒有相關(guān)的應(yīng)急預(yù)案可以采用,需要現(xiàn)場(chǎng)工作人員根據(jù)實(shí)際情況,制定一份符合實(shí)況的應(yīng)急預(yù)案。
基于3.1節(jié)至3.6節(jié)所闡述的基于文本分析的應(yīng)急輔助決策方法,預(yù)案推送全流程如下:當(dāng)系統(tǒng)監(jiān)聽到信號(hào)產(chǎn)生應(yīng)急事件時(shí),執(zhí)行應(yīng)急輔助決策,匹配出最優(yōu)的應(yīng)急預(yù)案,實(shí)現(xiàn)預(yù)案推送,具體流程如圖2所示。
圖2 應(yīng)急預(yù)案推送流程
本文設(shè)計(jì)基于主題摘要的應(yīng)急事件與預(yù)案相似度評(píng)估方法,建立融合用戶偏好的預(yù)案優(yōu)先級(jí)評(píng)價(jià)機(jī)制,開發(fā)基于相似度評(píng)估和優(yōu)先級(jí)評(píng)價(jià)的預(yù)案推薦決策,支持按事件影響等級(jí)智能化推薦最佳預(yù)案,有效支撐應(yīng)急事件的精準(zhǔn)處置,以期最大程度降低應(yīng)急事件對(duì)運(yùn)營(yíng)單位和乘客可能造成的損失。
然而,本文所提出的一種基于文本分析的應(yīng)急輔助決策方法對(duì)預(yù)案數(shù)據(jù)量的要求較高,語(yǔ)料庫(kù)中的預(yù)案種類越多,應(yīng)急事件的覆蓋面越廣,匹配到的應(yīng)急預(yù)案精確度越高。因此,本文提出的方法還需進(jìn)一步優(yōu)化,實(shí)現(xiàn)預(yù)案的組合和重組,減少人工參與,提高智能匹配的精確度。
隨著城市軌道交通地鐵智能化的發(fā)展,地鐵公司對(duì)地鐵運(yùn)營(yíng)安全性的要求越高。地鐵作為一種大型的公共交通工具,一旦發(fā)生應(yīng)急事件,將直接威脅乘客生命安全和社會(huì)正常運(yùn)行。本文提出的一種基于文本分析的應(yīng)急輔助決策方法,能夠獲取應(yīng)急管理的參考信息,有效提升應(yīng)急輔助決策能力,幫助地鐵運(yùn)營(yíng)及時(shí)做好應(yīng)急處置,降低應(yīng)急事件的影響力度,減少人員損傷。此外,隨著事后的應(yīng)急總結(jié)和事件分析學(xué)習(xí),可以進(jìn)一步完善預(yù)案庫(kù)、案例庫(kù),進(jìn)一步優(yōu)化輔助決策方法。