孔慶瑋,苗 茁,馮小芳,楊國柱,龍 勛
(1.中國鐵道科學(xué)研究院集團有限公司 電子計算技術(shù)研究所,北京 100081;2.中國國家鐵路集團有限公司 運輸調(diào)度指揮中心,北京 100844;3.中國鐵路廣州局集團有限公司 調(diào)度所,廣州 510088)
鐵路調(diào)度命令是鐵路運輸調(diào)度工作的重要組成部分,其中高速鐵路客運調(diào)度命令是進行客運日計劃編制、執(zhí)行與調(diào)整的重要依據(jù)[1]。當(dāng)客運運輸生產(chǎn)需要做出調(diào)整時,中國國家鐵路集團有限公司(以下簡稱“國鐵集團”)與各鐵路局集團公司及時、正確地將調(diào)度命令發(fā)布至相關(guān)單位,由相關(guān)站段及下屬機構(gòu)簽收并執(zhí)行反饋。目前,鐵路調(diào)度系統(tǒng)中的高速鐵路客運調(diào)度命令存在大量文本式和半格式化的調(diào)度命令,調(diào)度員需要讀取大量文本內(nèi)容,人工識別出其中的關(guān)鍵信息,進行人工分析與決策[2],嚴重影響了命令傳遞與執(zhí)行效率。在面對重特大突發(fā)事件,需要臨時組織旅客列車停運和折返時,由于調(diào)度命令管理體系不完善,會直接影響調(diào)度計劃編制和調(diào)整的有效性與時效性。
隨著我國高速鐵路調(diào)度指揮的信息化、智能化發(fā)展,部分鐵路局集團公司和科研機構(gòu)已經(jīng)對調(diào)度命令管理展開了一些研究,各鐵路局集團公司也建立了調(diào)度命令管理系統(tǒng)[3]。但目前大多調(diào)度命令仍為文本式內(nèi)容,且由于不能短時間內(nèi)精確判斷出命令與哪些部門、崗位相關(guān),存在命令下達至無關(guān)受令處所的現(xiàn)象,命令下達后的執(zhí)行監(jiān)管程度也有所欠缺。調(diào)度命令的精細化編制與閉環(huán)管理研究亟需推進。
知識圖譜技術(shù)又稱作知識映射地圖[4],可以有效地將現(xiàn)實世界中的各領(lǐng)域知識進行結(jié)構(gòu)化表示,并實現(xiàn)知識之間的關(guān)聯(lián)。目前,知識圖譜技術(shù)已被運用于鐵路客運產(chǎn)品服務(wù)[5]與鐵路調(diào)度應(yīng)急[6]等領(lǐng)域,取得了良好的應(yīng)用成效。本研究將知識圖譜技術(shù)運用到高速鐵路客運調(diào)度命令管理領(lǐng)域,通過構(gòu)建客運調(diào)度命令相關(guān)知識圖譜,形成不同命令類型與多種調(diào)度場景的關(guān)系網(wǎng)絡(luò),并結(jié)合數(shù)字化調(diào)度命令數(shù)據(jù)快速識別相關(guān)影響內(nèi)容,及時、精準通知有關(guān)人員進行調(diào)整操作,實現(xiàn)調(diào)度命令編制、流轉(zhuǎn)、執(zhí)行、反饋的一體化閉環(huán)管理。
依照知識圖譜構(gòu)建過程,本研究進行了高速鐵路客運調(diào)度命令的知識抽取、知識融合、知識處理。在此基礎(chǔ)上,結(jié)合調(diào)度命令全流程管理,對調(diào)度命令進行關(guān)鍵信息識別解析、關(guān)聯(lián)關(guān)系分析整合,利用格式化數(shù)據(jù)支撐各業(yè)務(wù)域調(diào)度之間的生產(chǎn)信息交互,減少因人工解析調(diào)度命令造成的時間冗余,提高調(diào)度命令執(zhí)行效率,進而提高高速鐵路客運調(diào)度工作的整體效率,為建設(shè)中國高速鐵路智能客運調(diào)度體系提供了有力的技術(shù)支撐。
知識圖譜的概念最早形成于2012 年,其作用旨在解決用戶尋求某一問題解決方案時,提升搜索性能,快速定位到問題答案[7]。知識圖譜分為開放領(lǐng)域知識圖譜與行業(yè)領(lǐng)域知識圖譜,開放領(lǐng)域知識圖譜不限定知識范疇,多用于搜索引擎。行業(yè)領(lǐng)域知識圖譜多用于醫(yī)療、電力、交通運輸?shù)葘I(yè)知識領(lǐng)域[8-10],具有更高的專業(yè)性與針對性,一般用來進行某一專業(yè)問題的輔助決策。
知識圖譜的本質(zhì)是將現(xiàn)實世界中的事物抽象為“實體”,將事物與事物之間的聯(lián)系抽象為“關(guān)系”,構(gòu)建“實體-關(guān)系-實體”的數(shù)據(jù)表現(xiàn)形式,最終形成某一領(lǐng)域信息互聯(lián)的知識網(wǎng)絡(luò)庫[11]。知識圖譜采用可視化的方式,融合信息學(xué)、圖形學(xué)、數(shù)學(xué)等學(xué)科理論,直觀地構(gòu)造網(wǎng)狀知識結(jié)構(gòu),一般以節(jié)點表示各個實體知識點,以便表示各個知識點之間的關(guān)系。由此通過某一知識點快速定位到與之相關(guān)的知識點,提高搜索效率,進而快速找到問題解決路徑。
知識圖譜的構(gòu)建一般包含知識抽取、知識融合、知識處理等系列方法,需要利用自然語言處理、沖突檢測與消解等技術(shù)。知識圖譜構(gòu)建流程如圖1所示。
圖1 知識圖譜構(gòu)建流程Fig.1 Knowledge graph construction process
利用結(jié)構(gòu)化、半結(jié)構(gòu)化與非結(jié)構(gòu)化的數(shù)據(jù),首先進行知識抽取,從專業(yè)領(lǐng)域海量信息中進行實體、屬性、關(guān)系識別;此后,對表述不同但語義相同的實體等進行知識融合處理;最后通過知識處理將實體、關(guān)系進行補全、糾錯,并設(shè)計存儲方式完成各類知識的存儲。段浩等[12]利用此種方法進行了水利領(lǐng)域知識圖譜構(gòu)建,姚劍等[13]利用此種方法進行了鐵路客站設(shè)備管理知識圖譜的構(gòu)建,均證明了知識圖譜構(gòu)建方法的有效性。
高速鐵路調(diào)度命令是調(diào)度員調(diào)整、執(zhí)行調(diào)度計劃的重要依據(jù),調(diào)度命令中存在大量文本信息,這些信息中涉及到車輛、人員、信息系統(tǒng)、執(zhí)行動作等。按照知識圖譜的構(gòu)建流程,首先從高速鐵路客運調(diào)度命令信息中進行實體概念的識別,并定義實體屬性與實體間的關(guān)系。其次,對識別出的實體等信息進行數(shù)據(jù)相似性檢查與融合處理。最后對知識進行補全并存儲,形成調(diào)度命令專業(yè)領(lǐng)域的知識圖譜。
知識抽取是知識圖譜構(gòu)建環(huán)節(jié)中的第一環(huán),其作用是從不同來源、不同結(jié)構(gòu)的數(shù)據(jù)中抽取出可以被計算機理解的格式化數(shù)據(jù)。數(shù)字化的調(diào)度命令數(shù)據(jù)是支撐客運生產(chǎn)信息及時交互的前提。對于高速鐵路客運調(diào)度命令生成依據(jù)來講,知識抽取涉及的數(shù)據(jù)來源較多,包括由運輸調(diào)度管理系統(tǒng)提供的調(diào)度命令文本數(shù)據(jù),由智能綜合調(diào)度系統(tǒng)提供的格式化數(shù)據(jù)[14],由動車組管理系統(tǒng)、客票系統(tǒng)等提供的半結(jié)構(gòu)化數(shù)據(jù),由調(diào)度應(yīng)急系統(tǒng)、防災(zāi)系統(tǒng)等提供的圖像、視頻等非結(jié)構(gòu)化數(shù)據(jù)。
進行高速鐵路客運調(diào)度命令數(shù)據(jù)收集,根據(jù)調(diào)度業(yè)務(wù)需求和周邊各專業(yè)對調(diào)度數(shù)據(jù)的要求,通過格式化模板配置管理與語言分詞、詞性標注、命名實體識別、句法分析等自然語言處理技術(shù),對結(jié)構(gòu)化調(diào)度命令、非結(jié)構(gòu)化調(diào)度命令、半結(jié)構(gòu)化調(diào)度命令數(shù)據(jù)進行知識抽取,為知識圖譜定義做基礎(chǔ),具體包括實體、屬性、關(guān)系識別3部分。
2.1.1 實體識別
高速鐵路客運調(diào)度命令包含命令號、命令類型、發(fā)令人、發(fā)令時間、命令內(nèi)容、受令處所等信息。除文本意義外,還隱含著其涉及到的相關(guān)系統(tǒng)、對調(diào)度指揮造成的影響。根據(jù)命令類型的不同,國鐵集團運輸調(diào)度指揮中心與鐵路局集團公司調(diào)度所下達調(diào)度命令后,相關(guān)受令處所依據(jù)調(diào)度命令內(nèi)容在不同系統(tǒng)進行調(diào)整處理。
根據(jù)《鐵路動車調(diào)度規(guī)則》規(guī)定,不同類型的調(diào)度命令有不同的規(guī)則形式,以申請車型、定員、擔(dān)當(dāng)均不變的更換車底調(diào)度命令申請為例,主要格式如下:
“因(原因),(鐵路局)集團公司申請:(年、月、日)(車次),車底使用(車型、車組號)擔(dān)當(dāng),(重聯(lián)時須注明:(車次)(始發(fā)站)始發(fā)(動車組)在前),車型不變,定員不變(定員人數(shù))?!?/p>
通過分析,進行高速鐵路客運調(diào)度命令知識圖譜實體識別如圖2所示。
圖2 高速鐵路客運調(diào)度命令知識圖譜實體識別Fig.2 Entity recognition of high speed railway dispatching command knowledge graph
2.1.2 屬性識別
調(diào)度命令的每個實體對應(yīng)著多種屬性,進一步分析調(diào)度命令內(nèi)容。
(1)命令實體的屬性包括命令號、命令主類型、命令子類型、發(fā)令人、發(fā)令時間、命令起始時間、命令終止時間等。
(2)車輛實體的屬性包括車次、車型、定員、編組內(nèi)容、發(fā)站、到站、座位席別等。
(3)崗位實體的屬性包括部門名稱、崗位名稱、崗位職責(zé)、用戶名稱等。
(4)流程實體的屬性包括流程進度、流程節(jié)點、流程內(nèi)容等。
(5)處置方案實體的屬性包括系統(tǒng)名稱、處置操作、執(zhí)行情況等。
其中,部分屬性可以由格式化的數(shù)據(jù)直接獲取,如命令號、發(fā)令人、受令處所等,其余大部分屬性包含在命令文本內(nèi)容中。經(jīng)過對文本的分析,抽取高速鐵路客運調(diào)度命令關(guān)鍵字信息,進行調(diào)度命令知識圖譜屬性識別如表1所示。
表1 調(diào)度命令知識圖譜屬性識別Tab.1 Attribute recognition of dispatching command knowledge graph
由于調(diào)度命令內(nèi)容具有較為明顯的格式特征,利用正則表達式可以有效識別出大部分實體屬性信息,以臨時加開類調(diào)度命令為例,構(gòu)建屬性識別正則表達式如圖3所示。
圖3 構(gòu)建屬性識別正則表達式Fig.3 Regular expression construction in attribute recognition
利用該正則表達式可以有效識別90%以上的調(diào)度命令格式化數(shù)據(jù),便于將調(diào)度命令實體屬性信息歸納為便于計算機識別的三元組形式,如<55100,命令類型,臨時加開命令>、<55100,車次,“0G6109,G6109”>、<55100,現(xiàn)車型,“CRH380 AL”>、<55100,受令處所,“長沙動車段,長沙機務(wù)段,長沙客運段,長沙南站”>。
2.1.3 關(guān)系識別
調(diào)度命令各個實體屬性間存在多種關(guān)系,如包含、從屬、因果、互斥、跟隨、協(xié)同等。例如命令來源與命令內(nèi)容間為因果關(guān)系,命令內(nèi)容與命令流程間為并發(fā)關(guān)系,部門與人員之間為從屬關(guān)系等。本研究進行的調(diào)度命令知識圖譜關(guān)系識別如表2所示。
表2 調(diào)度命令知識圖譜關(guān)系識別Tab.2 Relationship recognition of dispatching command knowledge graph
以上內(nèi)容構(gòu)成了調(diào)度命令領(lǐng)域的實體、屬性及關(guān)系,是調(diào)度命令知識圖譜的重要組成部分。
由于調(diào)度命令主體內(nèi)容很大一部分由非格式化文本構(gòu)成,盡管《鐵路運輸調(diào)度規(guī)則》《鐵路動車調(diào)度規(guī)則》中規(guī)定了調(diào)度命令的基本格式,但由于中文表述的多樣性,通過知識抽取得出的數(shù)據(jù)可能存在指代一致、表述不一致的情況。如“9月1日至5日”“九月1,2,3,4,5 日”,“北京西”“北京西站”“北京西車站”,均為語義相同的同義詞。為了優(yōu)化知識圖譜結(jié)構(gòu),減少等價屬性、關(guān)系造成的冗余,需要進行同義詞的知識融合。
調(diào)度命令知識圖譜語義融合示例如表3所示。
表3 調(diào)度命令知識圖譜語義融合示例Tab.3 Examples of semantic fusion of dispatching command knowledge graph
完成知識抽取與知識融合后,需要利用信息技術(shù)手段將知識圖譜進行存儲,以便后續(xù)利用圖譜解決特定場景的業(yè)務(wù)問題。相比較于傳統(tǒng)關(guān)系型數(shù)據(jù)庫,知識圖譜的存儲方案一般采用可以高效查詢實體屬性與復(fù)雜關(guān)系的圖數(shù)據(jù)庫[15]。
目前常見的圖數(shù)據(jù)庫有多種,主要包括Neo4j,Tigergraph,Galaxybase,TuGraph 等。本研究中采用Neo4j進行存儲。
Neo4j 作為一個高性能、開源的圖數(shù)據(jù)庫,可以將結(jié)構(gòu)化的數(shù)據(jù)存儲在網(wǎng)絡(luò)圖中而非表中,具有很大的靈活性,且隨著數(shù)據(jù)量的增加,查詢優(yōu)勢突出[16]。Neo4j 的每個節(jié)點由
以Neo4j 構(gòu)建高速鐵路客運調(diào)度命令知識圖譜如圖4所示。
圖4 高速鐵路客運調(diào)度命令知識圖譜Fig.4 High speed railway dispatching command knowledge graph
利用高速鐵路客運調(diào)度命令知識圖譜,圍繞高速鐵路客運調(diào)度命令管理全流程,可以有效構(gòu)建調(diào)度命令閉環(huán)管理方案,實現(xiàn)命令精細化發(fā)布、精準化執(zhí)行,進而提高運輸生產(chǎn)作業(yè)效率。結(jié)合高速鐵路客運調(diào)度命令業(yè)務(wù)規(guī)則,梳理調(diào)度命令閉環(huán)管理流程,可以將全流程分為需求分析、調(diào)度命令編輯、調(diào)度命令發(fā)布、調(diào)度命令執(zhí)行、調(diào)度命令反饋5 個階段。高速鐵路客運調(diào)度命令閉環(huán)管理方案如圖5所示。
圖5 高速鐵路客運調(diào)度命令閉環(huán)管理方案Fig.5 Closed-loop management scheme of high speed railway dispatching command
旅客承運需求波動、動車組檢修狀態(tài)變化等是調(diào)度命令產(chǎn)生的直接原因,通過知識圖譜,可以將不同類型的需求快速對應(yīng)為不同類型的調(diào)度命令;調(diào)度命令內(nèi)容中包含的關(guān)鍵信息決定了與該調(diào)度命令相關(guān)的單位、崗位與信息系統(tǒng),通過圖譜可以快速進行關(guān)聯(lián)崗位與行為識別;相關(guān)系統(tǒng)通過設(shè)定計劃變更規(guī)則,依據(jù)數(shù)字化的調(diào)度命令內(nèi)容,可以對列車開行計劃、車底運用計劃等進行自動調(diào)整,形成高速鐵路日計劃,同時,相關(guān)崗位人員按照調(diào)度命令內(nèi)容與高速鐵路日計劃進行生產(chǎn)作業(yè)組織;高速鐵路日計劃落成后,將計劃執(zhí)行結(jié)果反饋給關(guān)聯(lián)的管理決策人員,輔助決策人員進行新一輪的需求分析。由此,將高速鐵路客運調(diào)度命令知識圖譜串聯(lián)至客運生產(chǎn)作業(yè)的全流程中,各類調(diào)度命令適用的場景、造成的影響均可快速通過圖譜進行定位,自動判斷有關(guān)聯(lián)的信息系統(tǒng),從而將有效數(shù)據(jù)推送給各個相關(guān)子系統(tǒng)和業(yè)務(wù)用戶,改進了傳統(tǒng)命令管理流程中因為調(diào)度命令下達不精確、管控不細致造成的時間和人力成本浪費。
高速鐵路客運調(diào)度命令知識圖譜構(gòu)建起專業(yè)統(tǒng)一的高速鐵路客運調(diào)度知識庫,描述了客運調(diào)度各個業(yè)務(wù)域中的概念及其相互關(guān)系。通過對數(shù)字化調(diào)度命令內(nèi)容與調(diào)度決策之間的關(guān)聯(lián)分析,輔助提升各崗位調(diào)度人員與管理決策人員的調(diào)度指揮執(zhí)行效率。
以疫情期間客流減少的情景為例,利用知識圖譜完成高速鐵路客運調(diào)度命令的閉環(huán)管理。鐵路局集團公司客運部管理決策人員通過客流分析,提出高速鐵路停運方案,按照知識圖譜進行停運方案相關(guān)調(diào)度命令實體、屬性、關(guān)系的識別,停運命令知識圖譜分析如圖6所示。
圖6 停運命令知識圖譜分析Fig.6 Knowledge graph analysis of stop operation dispatching command
將上述知識圖譜技術(shù)運用到調(diào)度管理信息系統(tǒng)中,自動生成數(shù)字化的停運調(diào)度命令申請,包含調(diào)度命令停運日期、停運原因、停運車次、相關(guān)鐵路局集團公司等關(guān)鍵信息,調(diào)度命令數(shù)字化編制如圖7所示。
圖7 調(diào)度命令數(shù)字化編制Fig.7 Digital compilation of dispatching command
該調(diào)度命令申請通過審核后,進行調(diào)度命令發(fā)布,在圖譜中可以快速定位到停運列車相關(guān)的客運、車輛和機務(wù)擔(dān)當(dāng)單位,同時根據(jù)始發(fā)站、終到站、途經(jīng)站,可以快速識別與停運列車相關(guān)的車務(wù)段等受令處所,向受令處所相關(guān)崗位精準推送調(diào)度命令。調(diào)度命令精準化發(fā)布如圖8所示。
圖8 調(diào)度命令精準化發(fā)布Fig.8 Precise release of dispatching command
同時,通過圖譜識別出該停運命令關(guān)聯(lián)的信息系統(tǒng),如調(diào)度計劃系統(tǒng)、客票系統(tǒng)、行車系統(tǒng)等,并通過格式化數(shù)據(jù)進行計劃調(diào)整,取消停運的列車運行線,為旅客辦理退票手續(xù)等。調(diào)度命令自動化執(zhí)行如圖9所示。
圖9 調(diào)度命令自動化執(zhí)行Fig.9 Automated execution of dispatching command
最后,對調(diào)度命令的簽收、執(zhí)行情況進行結(jié)果統(tǒng)計與反饋,便于客運部管理決策人員進行下一輪的開行方案調(diào)整。
以滿足客運運輸需求和運力資源的合理運用為目標,研究了基于知識圖譜的高速鐵路客運調(diào)度命令閉環(huán)管理方案,實現(xiàn)了高速鐵路客運調(diào)度命令的全流程貫通、精細化發(fā)布,編制、流轉(zhuǎn)、執(zhí)行、反饋的一體化閉環(huán)管理。在保證高速鐵路調(diào)度計劃編制質(zhì)量的同時,全面提升運輸生產(chǎn)各環(huán)節(jié)的作業(yè)效率,提升市場對運力資源支配的能力。
鐵路調(diào)度命令種類繁多,不同命令對應(yīng)的計劃調(diào)整各不相同,本研究涵蓋了常見高速鐵路客運調(diào)度命令管理的全部流程,在未來需要加強特殊情景下調(diào)度命令內(nèi)容和影響的分析,不斷完善知識圖譜,輔助高速鐵路客運調(diào)度管理。在鐵路信息化高速發(fā)展的當(dāng)下,研究內(nèi)容對鐵路運輸調(diào)度管理有重要參考價值,隨著數(shù)字鐵路的建設(shè),未來可以進一步構(gòu)建客運、貨運一體化的運輸調(diào)度全領(lǐng)域知識圖譜,實現(xiàn)調(diào)度命令與客貨運計劃的數(shù)據(jù)貫通、安全卡控,進一步提升調(diào)度精細化、精準化、智能化管理水平。