張亞東,王 碩,李 亞,郭 進(jìn),李科宏
(1.西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,四川 成都 611756;2.西華大學(xué) 管理學(xué)院,四川 成都 610039)
作為列車控制核心技術(shù)裝備之一,列控系統(tǒng)廣泛應(yīng)用于我國高速鐵路和城市軌道交通,主要實現(xiàn)列車移動授權(quán)實時計算、追蹤間隔自動控制、運(yùn)行速度安全防護(hù)等安全苛求功能,在保障行車安全、提高運(yùn)輸效率等方面起到了關(guān)鍵作用。一旦列控系統(tǒng)發(fā)生危險失效,輕則中斷行車影響效率,重則導(dǎo)致重大行車事故。
在控制列車安全、高效運(yùn)行的過程中,列控系統(tǒng)中包含了從注冊啟動到停車注銷共十幾種運(yùn)營場景,不同場景下存在不同的參與主體、交互行為與控制模式,不同場景間又存在復(fù)雜的動態(tài)切換與疊加關(guān)系,這導(dǎo)致列控系統(tǒng)潛在的危險行為及其致因具有隱蔽性、多樣性、復(fù)雜性較強(qiáng)的特征,且致因事件間的關(guān)系呈現(xiàn)非線性特點。因此,對列控復(fù)雜運(yùn)營場景進(jìn)行系統(tǒng)危險分析及安全驗證,對于保障行車安全具有重要意義。
目前在業(yè)界應(yīng)用較為廣泛的系統(tǒng)危險分析方法,主要是基于線性事件鏈的。例如:故障模式影響分析(Failure Mode and Effects Analysis,F(xiàn)MEA)、故障樹分析(Fault Tree Analysis,F(xiàn)TA)、事件樹分析(Event Tree Analysis,ETA)等[1]。這類傳統(tǒng)分析方法認(rèn)為事故是由一系列存在因果關(guān)系的事件線性順序發(fā)生而導(dǎo)致的,其雖有簡單易用等優(yōu)點,但卻難以分析致因事件間呈現(xiàn)復(fù)雜非線性關(guān)系的危險場景[2]。為彌補(bǔ)其不足,美國麻省理工學(xué)院的Nancy Leveson 教授提出系統(tǒng)理論事故模型與過程(System-Theoretic Accident Model and Processes,STAMP)安全理論。該理論基于系統(tǒng)論和控制論,在充分考慮組織管理、系統(tǒng)交互等對系統(tǒng)安全影響的基礎(chǔ)上,將系統(tǒng)視為1種分層控制結(jié)構(gòu),從控制的角度分析安全問題,認(rèn)為安全性是人為因素、系統(tǒng)組件、環(huán)境因素和組織管理因素在非線性相互作用下的1 種整體涌現(xiàn)性。一旦出現(xiàn)外部干擾、組件失效或組件的異常交互未能得到很好地控制等情況,即安全約束失效,則會產(chǎn)生不安全控制行為,導(dǎo)致事故發(fā)生[3]。
基于STAMP 理論,Nancy Leveson 進(jìn)一步提出了用于危險分析的系統(tǒng)理論過程分析方法(Sys?tem-Theoretic Process Analysis,STPA)。與傳統(tǒng)分析方法相比,STPA 方法關(guān)注系統(tǒng)內(nèi)部的控制—反饋過程,可充分分析具有非線性因果關(guān)系的危險致因。當(dāng)前,STAMP 理論及STPA 方法已在航空航天、交通運(yùn)輸、工業(yè)控制等領(lǐng)域安全苛求系統(tǒng)的危險分析中得到逐步運(yùn)用[4-5]。在鐵路領(lǐng)域,閆宏偉等[6]利用STPA 方法對列車進(jìn)站停車運(yùn)營場景進(jìn)行建模與危險致因分析,分析結(jié)果為列控系統(tǒng)設(shè)計提供了理論依據(jù)。OUYANG等[7]基于STAMP理論對“4.28”膠濟(jì)鐵路事故進(jìn)行分析,對事故傳播過程進(jìn)行建模與討論,為事故應(yīng)急管理制定了有效措施。劉宏杰等[8]結(jié)合STPA 方法與XSTAMP軟件,對平交道口控制系統(tǒng)進(jìn)行安全分析,利用線性時序邏輯語言,最終得到形式化的安全需求。劉金濤等[9-10]利用形式化方法對STPA 進(jìn)行擴(kuò)展,實現(xiàn)了對CTCS-3級系統(tǒng)功能的安全分析,并以無線閉塞中心交接為對象,基于STAMP 理論提出1種混成自動機(jī)和對象約束語言O(shè)CL 與STAMP 模型相結(jié)合的方法,分析了需求階段的無線閉塞中心交接危險因素。SPIEGEL 等[11]提出1 種將Petri網(wǎng)形式化模型集成到STAMP中的新方法——形式化STAMP,并將該方法應(yīng)用到“7.23”溫州動車事故的建模與分析中。綜上,基于STAMP 和ST?PA 的系統(tǒng)安全分析方法研究,目前集中在方法的直接應(yīng)用或與形式化方法的結(jié)合等方面,主要解決STAMP 和STPA 分析過程存在的歧義性問題,并利用仿真建模技術(shù)實現(xiàn)系統(tǒng)模型的形式化驗證。而關(guān)于危險分析與仿真技術(shù)相結(jié)合的研究相對少見,能夠仿真驗證STPA危險分析結(jié)果的有效技術(shù)手段也較為缺乏。
智能體是人工智能領(lǐng)域中的重要概念,其模型描述(控制器、感應(yīng)器與執(zhí)行器)與STAMP分層控制結(jié)構(gòu)模型中的控制—反饋回路(控制器、傳感器與執(zhí)行器)在結(jié)構(gòu)上是統(tǒng)一的。在表達(dá)復(fù)雜系統(tǒng)的層次關(guān)系、子系統(tǒng)的自主行為以及子系統(tǒng)間的動態(tài)交互與協(xié)同控制等方面,多智能體模型具有顯著優(yōu)勢[12]。借助多智能體仿真技術(shù)手段,易于實現(xiàn)危險致因和安全約束的分別注入,從而仿真驗證危險致因和安全約束對系統(tǒng)安全的影響。
考慮以上因素,本文將STPA危險分析方法與多智能體仿真技術(shù)相結(jié)合,提出1種列控運(yùn)營場景危險分析及仿真驗證方法;以單電臺的無線閉塞中心(Radio Block Center,RBC)切換場景為研究對象,辨識該運(yùn)營場景下潛在的不安全控制行為,提取其危險致因和安全約束;構(gòu)建多智能體仿真平臺,通過危險致因和安全約束的注入與仿真,驗證提出的列控運(yùn)營場景危險分析及仿真驗證方法的正確性和可行性。
參考文獻(xiàn)[3]和文獻(xiàn)[12],結(jié)合我國高速鐵路列控系統(tǒng)特點,提出1 種列控運(yùn)營場景危險分析及仿真驗證方法。該方法的總體流程可歸納為:基于列控系統(tǒng)運(yùn)營場景的需求描述,分析運(yùn)營場景中的參與主體、交互行為與控制邏輯,結(jié)合STAMP理論與多智能體建模方法,構(gòu)建運(yùn)營場景分層控制多智能體結(jié)構(gòu)模型;基于該模型,利用STPA方法進(jìn)行運(yùn)營場景危險分析;利用多智能體仿真技術(shù),構(gòu)建運(yùn)營場景多智能體仿真平臺,注入危險致因和安全約束,通過仿真,驗證危險分析的正確性。具體流程如圖1所示。
圖1 危險分析及仿真驗證總體流程
根據(jù)列控運(yùn)營場景需求描述,分析特定運(yùn)營場景下的參與主體、交互行為和控制邏輯,將每個參與主體抽象為1 個單獨的智能體,基于STAMP 理論和參與主體間的交互行為,逐步細(xì)化運(yùn)營場景各層次不同智能體間的控制—反饋關(guān)系,明確每個層次通過控制過程向下層施加的約束以及向上層反饋約束的執(zhí)行結(jié)果,構(gòu)建基于特定運(yùn)營場景的分層控制多智能體結(jié)構(gòu)模型(以下簡稱為“結(jié)構(gòu)模型”)。
基于結(jié)構(gòu)模型,利用STPA方法進(jìn)行運(yùn)營場景危險分析,步驟如下。
步驟1:結(jié)合不安全控制行為分類,從以下多個方面,辨識運(yùn)營場景下潛在的系統(tǒng)不安全控制行為。包括:系統(tǒng)未提供所需的安全控制;提供了錯誤的控制行為;在錯誤的時間(過早/過晚)提供控制行為;控制行為結(jié)束過早或持續(xù)過長等。
步驟2:在結(jié)構(gòu)模型中,提取與不安全控制行為相關(guān)的控制—反饋回路,如圖2 所示,并從以下多個方面識別不安全控制行為的危險致因。包括:控制器輸入錯誤/缺失;控制算法不恰當(dāng);過程模型不一致、不完整或不正確;傳感器不恰當(dāng)運(yùn)行造成反饋不正確、不精確、消息延遲/未被提供;執(zhí)行器不恰當(dāng)運(yùn)行造成控制行為不合適、無效或錯誤等。
步驟3:在不安全控制行為及其危險致因辨識的基礎(chǔ)上,針對每1條不安全控制行為的具體危險致因,制定相應(yīng)的系統(tǒng)安全約束。
圖2 基于控制—反饋回路的危險致因辨識
基于構(gòu)建的結(jié)構(gòu)模型,利用多智能體仿真技術(shù)和Mason 開發(fā)工具,構(gòu)建運(yùn)營場景多智能體仿真平臺,實現(xiàn)列控運(yùn)營場景的多智能體仿真以及危險致因注入等功能。在1.2 節(jié)得到的危險致因、安全約束基礎(chǔ)上,結(jié)合結(jié)構(gòu)模型,分析危險致因及對應(yīng)安全約束的發(fā)生位置、持續(xù)時長和注入時機(jī)。在仿真過程中,依據(jù)以上信息,將危險致因和安全約束分別注入仿真平臺,分析危險致因和安全約束對系統(tǒng)安全的影響,驗證危險分析的正確性以及安全約束的可行性。
仿真平臺由控制臺子系統(tǒng)、多智能體仿真子系統(tǒng)、危險致因/安全約束注入子系統(tǒng)、仿真監(jiān)測子系統(tǒng)4 個部分組成,平臺架構(gòu)如圖3 所示。各子系統(tǒng)承擔(dān)的功能分別是:控制臺子系統(tǒng)用于控制仿真進(jìn)程;多智能體仿真子系統(tǒng)用于運(yùn)營場景各個智能體的功能邏輯仿真及其信息交互;危險致因/安全約束注入子系統(tǒng)用于實現(xiàn)仿真過程中的危險致因/安全約束注入;仿真監(jiān)測子系統(tǒng)用于監(jiān)測記錄仿真狀態(tài)以及可視化展示。
圖3 列控運(yùn)營場景多智能體仿真平臺
無線閉塞中心(RBC)切換場景是CTCS-3級列控系統(tǒng)14 種典型運(yùn)營場景之一,分雙電臺切換和單電臺切換2 種情況。考慮到單電臺RBC 切換場景參與主體多、交互邏輯復(fù)雜、安全性要求高,本文以這一運(yùn)營場景為例,將其代入前述危險分析及多智能體仿真驗證方法,進(jìn)行建模與危險分析。
單電臺RBC切換場景如圖4所示,描述了列車在2個不同RBC的邊界處,實現(xiàn)行車許可控制的安全切換過程。其中,RBC1 負(fù)責(zé)向RBC2 發(fā)送切換預(yù)告信息、進(jìn)路請求信息、列車數(shù)據(jù)等;RBC2 負(fù)責(zé)向RBC1發(fā)送進(jìn)路信息、接管列車信息等。該場景下,當(dāng)列車最小安全末端越過切換點后,車載設(shè)備根據(jù)RBC1 的命令切斷與RBC1 的通信連接,才開始呼叫RBC2建立通信會話,獲得新的行車許可。在此過程中,車載設(shè)備使用RBC1先前提供的延伸到RBC2控制區(qū)域的行車許可監(jiān)控列車運(yùn)行。
圖4 單電臺RBC切換場景
根據(jù)單電臺RBC 切換場景,分別定義并編號RBC 切換過程中可能發(fā)生的系統(tǒng)級事故以及導(dǎo)致這些事故發(fā)生的系統(tǒng)級危險,詳見表1和表2。
表1 系統(tǒng)級事故定義
表2 系統(tǒng)級危險定義
分析可知單電臺RBC 切換場景的參與主體包括:列車超速防護(hù)系統(tǒng)(ATP)、移交RBC1、接收RBC2、切換應(yīng)答器組、列車。將每個主體視為1 個智能體(Agent),基于控制模型的構(gòu)建方法,建立單電臺RBC 切換場景下的分層控制多智能體結(jié)構(gòu)模型(以下簡稱為RBC 切換結(jié)構(gòu)模型),如圖5 所示。由圖可知:車載ATP 智能體分別與RBC1智能體、RBC2 智能體、列車智能體、切換應(yīng)答器組智能體間存在控制—反饋回路,RBC1 智能體與RBC2智能體間存在控制—反饋回路。
圖5 RBC切換結(jié)構(gòu)模型
基于RBC 切換結(jié)構(gòu)模型,以RBC1 智能體與車載ATP 智能體之間的控制—反饋回路為例,結(jié)合不安全控制行為分類,辨識潛在的不安全控制行為。由于篇幅所限,僅列出部分辨識結(jié)果見表3。其中,不安全控制行為的編號規(guī)則為:RBC1(智能體1)-ATP(智能體2)-USCA(不安全控制行為的英文首字母縮寫)-序號。
以不安全控制行為RBC1-ATP-USCA-7 為例,進(jìn)行危險致因辨識與安全約束制定。與該不安全控制行為對應(yīng)的控制—反饋回路,如圖6所示。
圖6 RBC1-ATP-USCA-7對應(yīng)的控制—反饋回路
基于控制—反饋回路,利用1.2 節(jié)所述運(yùn)營場景危險分析方法,進(jìn)行危險致因辨識,制定安全約束,由于篇幅所限,僅列出部分分析結(jié)果,見表4。其中,危險致因場景ID的編號規(guī)則為:RBC1-ATP-USCA-7(不安全控制行為編號)-CF(致因因素的英文首字母縮寫)-序號;安全約束ID 的編號規(guī)則為:RBC1-ATP-USCA-7(不安全控制行為編號)-SC(安全約束的英文首字母縮寫)-序號。
表3 RBC1智能體與車載ATP智能體間潛在的不安全控制行為(部分)
表4 危險致因與安全約束(部分)
選取京廣高鐵武漢—廣州段下行線K1 242+041—K1 263+195段進(jìn)行仿真驗證。所選線路全長21.154 km,最高運(yùn)行速度310 km·h-1,線路坡度數(shù)據(jù)見表5,線路曲線數(shù)據(jù)見表6。全線劃分閉塞分區(qū)11個,RBC切換預(yù)告點(LTA)位于K1 243+238,RBC 切換執(zhí)行點(RN)位于K1 249+348。以該段線路的單電臺RBC 切換場景為對象,仿真相關(guān)列控參數(shù)見表7。
仿真列車選取CRH380A 型動車組,動力配置6M2T,編組長度203 m,列車限速350 km·h-1,荷載重量429.2 t,回轉(zhuǎn)系數(shù)0.1。列車牽引、制動性能數(shù)據(jù)分別如圖7和圖8所示。
參照RBC 切換場景技術(shù)規(guī)范,前文提出的RBC 切換結(jié)構(gòu)模型以及仿真參數(shù),利用多智能體仿真工具M(jìn)ason,構(gòu)建列控RBC 切換場景多智能體仿真平臺。仿真平臺主界面如圖9所示,其中軌道區(qū)段不同顏色表示不同含義:藍(lán)色表示空閑、紅色表示正常占用、白色表示移動授權(quán)、紫色表示故障占用。
表5 仿真場景線路坡度
表6 仿真場景線路曲線
表7 仿真場景列控參數(shù)
圖7 列車牽引性能曲線
圖8 列車最大常用制動性能曲線
圖9 仿真平臺主界面
基于仿真平臺,對單電臺RBC 切換場景危險分析進(jìn)行仿真驗證。驗證時,本文以RBC 切換場景中的不安全控制行為RBC1-ATP-USCA-7 為例,選取導(dǎo)致該不安全控制行為的2 種典型危險致因及其對應(yīng)的安全約束,分析其對系統(tǒng)安全的影響,驗證危險分析的正確性以及安全約束的可行性。
1)危險致因RBC1-ATP-USCA-7-CF-1
該危險致因可描述為:切換流程啟動后,RBC2 進(jìn)路授權(quán)范圍內(nèi)有異常占用,RBC1 與RBC2 通信中斷,RBC2 不能向RBC1 發(fā)送縮短的進(jìn)路授權(quán)。
(1)將危險致因注入仿真平臺。列車在RBC1控制區(qū)域內(nèi)運(yùn)行,到達(dá)RBC 切換預(yù)告應(yīng)答器組后,RBC1 向RBC2 請求進(jìn)路(RBC1 與RBC2 通信正常),RBC1 根據(jù)RBC2 提供的進(jìn)路信息,將列車移動授權(quán)延伸至RBC2 管轄范圍內(nèi)(行車許可終點:K1 259+129)。列車越過切換預(yù)告點后危險致因發(fā)生,RBC1 與RBC2 通信中斷,并且RBC2 進(jìn)路授權(quán)范圍內(nèi)的第1 個軌道區(qū)段(K1 249+383—K1 251+347)變?yōu)楣收险加?。由于RBC2 不能向RBC1 發(fā)送縮短的進(jìn)路授權(quán),在未加安全約束條件下,列車將按照通信中斷前的移動授權(quán)繼續(xù)運(yùn)行,如圖10所示,此時列車將會冒進(jìn)該故障軌道區(qū)段,導(dǎo)致行車事故,危及行車安全。
圖10 注入危險致因時的RBC1與RBC2通信中斷仿真結(jié)果
(2)將安全約束RBC1-ATP-USCA-7-SC-1注入仿真平臺。該安全約束可描述為:切換流程啟動后RBC1 與RBC2 通信中斷,RBC1 應(yīng)向車載ATP 發(fā)送縮短至切換邊界的移動授權(quán)。注入安全約束后,RBC1 與RBC2 通信中斷,RBC2 進(jìn)路授權(quán)范圍內(nèi)有異常占用,RBC1 將縮短移動授權(quán)至RBC1 管轄邊界處并發(fā)送給列車,車載將重新計算生成目標(biāo)點在切換點前的目標(biāo)距離速度防護(hù)曲線。仿真結(jié)果如圖11 所示,可以看出,注入安全約束后,行車安全得到了保障。
圖11 注入危險致因及相應(yīng)安全約束時的RBC1與RBC2通信中斷仿真結(jié)果
2)危險致因RBC1-ATP-USCA-7-CF-4
該危險致因可描述為:RBC1 與車載ATP 通信中斷,RBC1 不能向車載ATP 發(fā)送縮短的移動授權(quán)。
(1)將危險致因注入仿真平臺。列車在RBC1控制區(qū)域內(nèi)運(yùn)行,越過RBC 切換預(yù)告應(yīng)答器組后,RBC1 向RBC2 請求進(jìn)路,RBC1 根據(jù)RBC2 提供的進(jìn)路信息,將列車移動授權(quán)延伸至RBC2管轄范圍內(nèi),此時RBC1 與車載ATP 通信中斷,如果RBC2 進(jìn)路授權(quán)范圍內(nèi)的進(jìn)路狀態(tài)發(fā)生變化,例如RBC2 進(jìn)路授權(quán)范圍內(nèi)的第3 個軌道區(qū)段(里程K1 253+303—K1 255+292)變?yōu)楣收险加茫捎赗BC1 不能向車載ATP 發(fā)送縮短的移動授權(quán),在未加安全約束條件下,列車將按照通信中斷前的移動授權(quán)繼續(xù)運(yùn)行,如圖12 所示。此時列車將會冒進(jìn)該故障軌道區(qū)段,導(dǎo)致行車事故,危及行車安全。
圖12 注入危險致因時的車載ATP與RBC通信中斷仿真結(jié)果
(2)將安全約束RBC1-ATP-USCA-7-SC-4注入仿真平臺。該安全約束可描述為:RBC1 與車載ATP 通信中斷超時后,車載ATP 應(yīng)觸發(fā)最大常用制動。注入安全約束后,車載ATP 與RBC1 通信中斷超時后,車載ATP 向列車輸出最大常用制動,當(dāng)列車速度降至CTCS-2 級最大允許速度250 km ·h-1后,自動轉(zhuǎn)換為CTCS-2 級運(yùn)行,列車根據(jù)CTCS-2 級列控系統(tǒng)行車許可(終點為故障軌道區(qū)段入口)繼續(xù)運(yùn)行。仿真結(jié)果如圖13 所示,可以看出,注入安全約束后,行車安全得到了保障。
圖13 注入危險致因及相應(yīng)安全約束時的車載ATP與RBC通信中斷仿真結(jié)果
本文提出1 種基于STPA 與多智能體的列控運(yùn)營場景危險分析及仿真驗證方法,采用分層控制多智能體結(jié)構(gòu)模型描述RBC 切換場景的控制—反饋關(guān)系,結(jié)合STPA 方法辨識RBC 切換場景下潛在的不安全控制行為,基于控制—反饋回路分析導(dǎo)致不安全控制行為的危險致因,進(jìn)而制定系統(tǒng)安全約束。以單電臺RBC 切換場景為研究對象,利用多智能體仿真技術(shù)構(gòu)建仿真平臺,選取危險分析數(shù)據(jù)中的2 條危險致因以及對應(yīng)的安全約束,分別進(jìn)行危險致因和安全約束的注入與仿真,仿真結(jié)果驗證了危險分析的正確性以及安全約束的可行性。該方法不僅支持單危險致因注入的仿真分析,而且未來還可擴(kuò)展為多危險致因耦合的復(fù)雜危險場景仿真驗證,具有一定的應(yīng)用價值與前景。