徐德龍,魯劍鋒,竇 偉,楊 璘
(1.中國鐵道科學研究院集團有限公司通信信號研究所,北京 100081; 2.國家鐵路智能運輸系統(tǒng)工程技術研究中心,北京 100081)
作為保證列車安全運行、控制列車運行速度的高速鐵路信號系統(tǒng),系統(tǒng)結構都很復雜[1-3]。如果用戶要詳細了解系統(tǒng)內(nèi)部狀態(tài),需要額外借助于一個人機接口,即維護終端設備。通過維護終端詳細記錄系統(tǒng)內(nèi)部狀態(tài)數(shù)據(jù),對于故障判斷,傳統(tǒng)的方法為通過收集記錄信息,依靠工作人員的經(jīng)驗,對信息進行人工分析及識別,得出判斷結果,判斷結果往往受人的因素影響大。目前,各行業(yè)對智能診斷方法研究較多,如人工智能應用中的神經(jīng)網(wǎng)絡、貝葉斯網(wǎng)絡技術等[4-6]。信號系統(tǒng)多涉及行車安全,日志信息以記錄信息、開關量信息為主,用戶期望判斷出精準的故障點,人工智能的技術方法適用性不強。為此,以計算機聯(lián)鎖系統(tǒng)(CBI)為例,提出一種基于圖論模型和模糊推理的顯示和故障推理方法,并結合CBI系統(tǒng)網(wǎng)絡方面的監(jiān)測及診斷技術進行實例研究,力圖計算出高質量的診斷結果。
CBI是典型的地面信號系統(tǒng),由負責邏輯運算和控制輸出的聯(lián)鎖機、負責操作顯示的操作機組成[7-8]。系統(tǒng)的可靠性、安全性要求高,系統(tǒng)內(nèi)各組成部分均為冗余設備,各組成部分間為網(wǎng)絡通信或串行通信方式,是一個有著較復雜網(wǎng)絡架構的控制系統(tǒng)[9]。維護終端與聯(lián)鎖機、操作機間為通信接口,其本身無控制功能,僅作為維護管理的手段,其總體架構如圖1所示。
圖1 計算機聯(lián)鎖系統(tǒng)維護終端總體架構
圖1中,維護終端從聯(lián)鎖機接收系統(tǒng)控制對象和采集對象的狀態(tài)信息(驅采對象信息),系統(tǒng)內(nèi)部的設備狀態(tài)、內(nèi)部通道信息,以及系統(tǒng)外部的接口信息和通道信息(網(wǎng)絡狀態(tài)信息),從操作機接收界面顯示信息以及操作命令,并對這些數(shù)據(jù)信息記錄和管理。維護終端設置人機界面,用戶可以通過界面操作查詢以上信息。當前的維護終端僅實現(xiàn)了這些基本信息的記錄和查詢功能,遠不能滿足用戶對智能化的需求。
在智能化方面,網(wǎng)絡監(jiān)測是一個關鍵點,主要包括各主機狀態(tài)及通信通道狀態(tài)。其中,通道狀態(tài)主要包括兩個方面:一個是聯(lián)鎖系統(tǒng)內(nèi)部設備之間的通信狀態(tài),主要包括聯(lián)鎖機、操作機、維護終端之間的通信狀態(tài);另一個是聯(lián)鎖系統(tǒng)與外部設備之間的通信狀態(tài),主要包含聯(lián)鎖系統(tǒng)與列控中心(TCC)、無線閉塞中心(RBC)、相鄰的CBI、調(diào)度集中(CTC)等冗余接口的通信狀態(tài)[10]。CBI系統(tǒng)網(wǎng)絡結構相對復雜,接口數(shù)量大,冗余通道多,且中間存在交換機等轉發(fā)的環(huán)節(jié)。因此,研究CBI系統(tǒng)的網(wǎng)絡監(jiān)測和診斷比較有代表性。
對于維護終端,如果能采用圖形、圖像技術交互式地顯示,并基于圖形作進一步的推理,將大大提升智能化水平。近年來,相關學者對于圖論和推理技術進行了深入研究,為本文研究提供了理論支撐。
圖(Graph)是由節(jié)點及節(jié)點間的關系集合組成的一種網(wǎng)狀模型,用公式表達為G=(V,E)。其中,V是節(jié)點的集合;E是節(jié)點之間關系的集合,也稱為邊。圖分為有向圖(Directed Graph)和無向圖(Undirected Graph)。在有向圖中,兩個節(jié)點u、v是有順序的,用表示從節(jié)點u到節(jié)點v的一條有向邊。在無向圖中,節(jié)點u和節(jié)點v相關聯(lián)的一條邊沒有特定的方向,用(u,v)表示[11]。CBI系統(tǒng)為各主機以及雙向交互數(shù)據(jù)的特定應用系統(tǒng),可將具體主機抽象為節(jié)點,將通信通道抽象為連接兩個節(jié)點的邊,依據(jù)此方法將CBI系統(tǒng)網(wǎng)絡轉化為無向圖模型[12]。
根據(jù)圖論模型搭建的網(wǎng)絡節(jié)點和通道模型示意如圖2(a)所示。其中,A為第1層節(jié)點,B1、B2、B3為第2層節(jié)點,C11、C12、C21等為第3層節(jié)點。本模型中上層節(jié)點和下層節(jié)點為獨立連接,節(jié)點間沒有交叉互通的情況。在CBI系統(tǒng)中,各主機之間的冗余通道存在交叉關聯(lián)的情況。為此,將圖2(a)的模型進一步改進,增加交叉的無向邊。如圖2(b)中虛線部分,B1節(jié)點和C21節(jié)點關聯(lián),B2節(jié)點和C11節(jié)點關聯(lián)。這種情況下的關聯(lián)關系將更復雜,但無論如何交叉互通,采用的方法是相同的。以B1節(jié)點為例,其關聯(lián)的通道有4條,分別為A-B1、B1-C11、B1-C12、B1-C21,如果模型中還存在C13、C14等節(jié)點,也就是還存在第5、6條通道。
圖2 改進前后的網(wǎng)絡節(jié)點和通道示意
推理機是整個推理過程的核心,其關鍵是推理方向和推理方法,推理過程如圖3所示。推理方向包括正向推理、反向推理及正反向混合推理3種[13]。其中,正向推理為從事實出發(fā),推理出目標的方法。反向推理從目標出發(fā),沿著推理路徑回溯到事實,從一般性開始,逐步涉及細節(jié),通過收集越來越詳細的證據(jù)以求證實一種情況或假設。在實際應用中,正向、反向推理應用均比較廣泛。正向推理多應用于節(jié)點、邊狀態(tài)都已知的情況下。反向推理可應用于有未知節(jié)點或邊狀態(tài)的情況下,通過反向多條無向邊分析和推理,推理出未知節(jié)點狀態(tài)。本文的推理方向主要為依據(jù)搭建的圖論模型展開。圖2(b)中的節(jié)點B1,如因條件限制,無法獲取其節(jié)點狀態(tài),這時可對B1節(jié)點反向推理。滿足B1相關的所有節(jié)點的故障判斷后,即多異常節(jié)點的互相驗證后,確定B1節(jié)點狀態(tài)。
圖3 基本推理流程
模糊邏輯是一門數(shù)學學科,它以允許真實度和謬誤度的模糊集理論為基礎[14]。模糊推理是效仿人思維的推理過程,是常用的分析方法之一[15-16]。模糊邏輯方法是基于有著表示判定特征的模糊集,采用IF-THEN語言規(guī)則,針對某一前提推理出結果的過程。其公式表述為式(1)的形式
(1)
其中,M→P,當M′與M滿足一定相似要求時,得出結論P′。模糊推理及控制已經(jīng)應用到控制高階非線性系統(tǒng),不能用數(shù)學描述或由于太復雜而不能分析的系統(tǒng),如飛機飛行控制、電力系統(tǒng)和核反應堆控制等。對于CBI系統(tǒng),當網(wǎng)絡發(fā)生故障時,因通道中有交換機等中間設備,難于精確地判斷出故障點。采用不確定性推理方法對故障信息進行模糊推理,將有助于解決系統(tǒng)網(wǎng)絡故障時節(jié)點或邊判斷的難題。
根據(jù)圖論的原理,網(wǎng)絡監(jiān)測按照系統(tǒng)物理連接的方式進行顯示,反映出系統(tǒng)中所有的物理設備及物理連接通道。所有設備及設備間的連接線纜都能顯示且與實際設備一一對應,做到圖形界面與實物相符,有利于用戶準確地處理故障設備[17]。
(1)節(jié)點設備設計
本文以TYJL-ADX型計算機聯(lián)鎖系統(tǒng)為例,對其二乘二取二冗余結構的設備組成進行分析,梳理出系統(tǒng)內(nèi)各節(jié)點設備,如表1所示[18]。主要包括操作A機狀態(tài)、操作B機狀態(tài)、聯(lián)鎖I系狀態(tài)、聯(lián)鎖II系狀態(tài),以及外部設備CTC-A機狀態(tài)、CTC-B機狀態(tài),以及相鄰的CBI、TCC、RBC主機狀態(tài)。
表1 節(jié)點設備
(2)節(jié)點和通道狀態(tài)庫
根據(jù)表1的節(jié)點設備,建立主機狀態(tài)庫。主機狀態(tài)庫基本信息主要包括節(jié)點編號、設備名稱和節(jié)點狀態(tài),節(jié)點狀態(tài)主要為主控、備用、故障、未知等。
建立通道狀態(tài)庫。計算機聯(lián)鎖系統(tǒng)的網(wǎng)絡監(jiān)測數(shù)據(jù)來源分散,通道數(shù)量大,維護終端只能收集到邏輯通道的狀態(tài)信息,沒有直接反映物理通道狀態(tài)的信息。在軟件實現(xiàn)方面,將所有邏輯通道狀態(tài)按照自定義的存儲格式保存在一片緩存里,自定義的存儲格式舉例如表2所示,通道狀態(tài)為0表示未知,1表示正常,2表示故障。
表2 邏輯通道狀態(tài)庫格式
按照圖論模型和以上分析,并參照航空領域的人因工程相關標準,設計的TYJL-ADX型計算機聯(lián)鎖網(wǎng)絡監(jiān)測實物界面效果如圖4所示。
圖4 TYJL-ADX型計算機聯(lián)鎖節(jié)點和通道邊顯示效果
在圖4中,節(jié)點用方框表示,通道邊用線條表示。節(jié)點的狀態(tài)通過邊框顏色進行區(qū)分,其中綠色表示主控,黃色表示備用,紅色表示故障,灰色表示未知。通道邊的顏色通過連接線顏色反映,其中綠色表示正常,橙色表示部分故障,紅色表示故障,灰色表示未知。在界面中,白色虛框以內(nèi)的節(jié)點和通道邊為CBI系統(tǒng)內(nèi)部設備,虛框以外的節(jié)點和通道邊為外部接口設備[19]。
邏輯通道的狀態(tài)顯示采用二級窗口的方式呈現(xiàn)。當點擊節(jié)點設備框時,彈出相關聯(lián)的邏輯通道狀態(tài)表。圖5為聯(lián)鎖Ⅰ系節(jié)點的邏輯通道狀態(tài)表效果,共包括與操作機、TCC、CBI、RBC的16個邏輯通道狀態(tài)。采用這種兩級界面的顯示方式,實現(xiàn)了基于圖論模型實物關系圖,同時也顯示出了底層狀態(tài)數(shù)據(jù),便于對比分析。
圖5 邏輯通道狀態(tài)顯示效果
(3)通道狀態(tài)計算方法
在通道邊狀態(tài)顯示前,首先要將狀態(tài)庫中的邏輯通道數(shù)據(jù)信息轉換為物理通道狀態(tài)。CBI系統(tǒng)的通道為一段通信線,兩端節(jié)點為主機,或主機與交換機。在網(wǎng)絡模式下,邏輯通道與物理通道存在著本質上的區(qū)別。一是起點、終點節(jié)點的區(qū)別,邏輯通道為主機與主機的狀態(tài),物理通道的兩個端點可能是主機與交換機,僅僅是邏輯通道的一段;二是每個物理通道包含了多個邏輯通道狀態(tài)的一段。物理通道和邏輯通道部分重疊但又不完全相同,逐段逐條一一對應是一個難題。本文提出的計算方法基本原則是,根據(jù)網(wǎng)絡結構,一條物理通道狀態(tài)的顯示綜合考慮該物理通道上所有邏輯通道的狀態(tài)。經(jīng)由該通道的所有邏輯通道都正常,物理通道顯示為正常;所有邏輯通道都故障,物理通道顯示為故障;否則物理通道顯示為部分故障狀態(tài)。以操作A機到交換機A的物理通道為例說明。操作A機通過該物理通道與聯(lián)鎖Ⅰ系、聯(lián)鎖Ⅱ系、維修機分別建立邏輯通信。根據(jù)表2,3個邏輯通道的狀態(tài)在狀態(tài)庫緩存中分別位于第1,9,14位。在初始化該物理通道時,新建一個列表用于保存該物理通道對應所有邏輯通道狀態(tài)的索引值,即將索引值1,9,14保存到該列表中,如表3所示。在計算該物理通道狀態(tài)時,在緩存中遍歷該列表中索引值對應的狀態(tài)值,從而實時獲取操作A機到交換機A的物理通道狀態(tài)。其他物理通道計算方法類似。
表3 物理通道與邏輯通道索引關系
為了實現(xiàn)網(wǎng)絡狀態(tài)的回放,將實時接收到的邏輯通道狀態(tài)按時間順序存儲成文件。在回放網(wǎng)絡狀態(tài)時,讀取狀態(tài)庫文件,重新按以上規(guī)則進行以上計算即可再現(xiàn)歷史時刻的網(wǎng)絡狀態(tài)。
在實際使用過程中,系統(tǒng)中某條線纜或者某個節(jié)點設備故障后,往往出現(xiàn)的現(xiàn)象是,網(wǎng)絡狀態(tài)圖上顯示的故障區(qū)域比實際的范圍要大。如交換機A故障,與交換機A相連的5個通道邊全部顯示為故障,致使從建立的圖論模型上難于直觀看出故障點。
使用者希望能提供一種自動的故障定位功能,引導用戶優(yōu)先排查最可能出現(xiàn)故障的節(jié)點設備或連接通道。采用基于圖論模型和模糊推理方法的混合推理控制策略,從主機節(jié)點追溯網(wǎng)絡狀態(tài),查詢的方式發(fā)送診斷指令,調(diào)取狀態(tài)庫的記錄信息進行識別判斷,追溯到相關的所有節(jié)點。以根據(jù)全部的邏輯通道狀態(tài)及主機節(jié)點工作狀態(tài),通過邏輯判斷和模糊推理方法,最終定位到最可能出現(xiàn)故障的設備或者通道[20]。按照以上需求設計的推理機判定流程如圖6所示。
圖6 網(wǎng)絡故障推理判定流程
在圖6所示的推理工作流程中,對于交換機的故障定位,在具體判別時,還需采用模糊推理的方法。在已知“經(jīng)過交換機所有邏輯通過通信中斷,為交換機故障”大前提后,如對于交換機A故障,根據(jù)具體狀態(tài)庫中邏輯通道狀態(tài)作為小前提,經(jīng)過模糊推理判別出故障點,具體推理如下:
結合本文研究的通道特定計算方法,以及圖6的推理工作流程,經(jīng)過進一步延伸分析,得出圖7所示的聯(lián)鎖Ⅰ系推理流程。
圖7 聯(lián)鎖Ⅰ系至交換機B故障推理處理流程
以聯(lián)鎖Ⅰ系與交換機B的網(wǎng)線故障為例,這是一個較常見的故障情況。在網(wǎng)絡圖中,如圖8所示,交換機B有一各通道顯示為3倍寬度的紅色線條,3個通道顯示為2倍寬度的橙色線條。該故障導致聯(lián)鎖Ⅰ系至交換機B的邏輯通道全部中斷,包括聯(lián)鎖Ⅰ系與操作A機邏輯通道中斷、聯(lián)鎖Ⅰ系與操作B機邏輯通道中斷、聯(lián)鎖Ⅰ系與維修機邏輯通道中斷。此情況下,操作A機、操作B機、維修機經(jīng)過交換機B與聯(lián)鎖Ⅱ系通信正常。按照圖7所示推理過程,從聯(lián)鎖Ⅰ系查詢,推理出聯(lián)鎖Ⅰ系與交換機B的通道邊故障。
圖8 網(wǎng)絡監(jiān)測界面故障顯示
除此之外,對于安全數(shù)據(jù)網(wǎng)故障、與CTC通道故障也能參照以上方法進行推理分析?;诒玖鞒虒BI系統(tǒng)進行了完整的網(wǎng)絡故障推理,覆蓋了所有設備節(jié)點和通道故障判別,現(xiàn)已完成軟件開發(fā)。
基于圖論模型進行設計,并在圖論模型和模糊推理方法的混合推理策略的基礎上,結合計算機聯(lián)鎖系統(tǒng)的網(wǎng)絡監(jiān)測診斷功能進行實例研究,從顯示、故障定位方面對網(wǎng)絡主機節(jié)點、通道邊的故障點分析進行了深入研究。經(jīng)實踐驗證結論如下。
(1)采用圖論模型的信號系統(tǒng)網(wǎng)絡狀態(tài)顯示方式,可視化程度高,可用性強。
(2)基于圖論模型和模糊推理方法的混合推理方法,能夠有效對主機節(jié)點、交換機、通道邊進行精準或區(qū)域故障定位,可行性強。
(3)以上顯示和故障定位方法,可為相關系統(tǒng)的網(wǎng)絡監(jiān)測和診斷提供借鑒。