趙 歡
(天津軌道交通運營集團有限公司,天津 300000)
軌道交通無線通信系統(tǒng)中,在主、備用控制中心設(shè)備配置包括:集群交換控制設(shè)備、鑒權(quán)設(shè)備,調(diào)度服務(wù)器、行車調(diào)度臺、防災(zāi)環(huán)控調(diào)度臺、乘客調(diào)度臺、總調(diào)度臺及中心網(wǎng)管設(shè)備組成。調(diào)度服務(wù)器在其中至關(guān)重要,它與時鐘系統(tǒng)進行校正,解析并轉(zhuǎn)發(fā)到調(diào)度臺(包括行車調(diào)度臺、環(huán)控調(diào)度臺和場調(diào));接收在線列車信息(ATS),信號系統(tǒng)(ATS)連接到調(diào)度服務(wù)器上,調(diào)度服務(wù)器解析后將在線列車信息發(fā)送給行車調(diào)度臺、停車場調(diào)度臺、車輛段調(diào)度臺。調(diào)度臺根據(jù)ATS信號與地鐵運營信息表對應(yīng),這些信息用于顯示、呼叫、短信息和視頻等業(yè)務(wù)操作數(shù)據(jù)。實現(xiàn)多調(diào)度管理列車功能。所以調(diào)度服務(wù)器在主備控制中心需采用熱備方案,解決集群容災(zāi)問題。
為了避免自動切換出現(xiàn)的不可控因素,主備控制中心的調(diào)度服務(wù)器軟件切換方式為手動切換。即通過手動點擊調(diào)度服務(wù)器軟件上面的軟件切換按鈕,實現(xiàn)切換。由于無線調(diào)度服務(wù)器軟件手動切換的時機是以信號系統(tǒng)切換為前提,同時各系統(tǒng)同步切換,確保了無線系統(tǒng)調(diào)度服務(wù)器軟件切換到備用控制中心后,能夠與信號、綜合監(jiān)控、時鐘等系統(tǒng)的接口正常通信,保證無線系統(tǒng)各項功能正常運行。
圖 雙機熱備下的物理組網(wǎng)
雙機熱備下的邏輯連接如上圖,主備調(diào)度服務(wù)器(CAD)同時和大部分外部設(shè)備(除了時鐘服務(wù)器)都建立了TCP 連接,主備調(diào)度服務(wù)器都向時鐘服務(wù)器獲取時鐘信息,使得在進行主備切換時,切換時間在5秒之內(nèi)。
雙機熱備切換分5種場景,下面描述各種場景的監(jiān)測方法,處理方法。
監(jiān)測軟件是獨立于調(diào)度服務(wù)器軟件運行的軟件,其作用是:與調(diào)度服務(wù)器軟件軟件相互監(jiān)測,用于判斷
確認調(diào)度服務(wù)器軟件是否達到切換場景條件,當調(diào)度服務(wù)器軟件發(fā)生異常則進行切換操作;另外,監(jiān)控軟件具備自監(jiān)測功能,若當前程序被任務(wù)管理器關(guān)閉,監(jiān)控軟件重啟自啟動。 監(jiān)控軟件A、B、C、D 是平級的,沒有級別區(qū)分。為了示意 4 個不同的 調(diào)度服務(wù)器上的監(jiān)控軟件,其功能沒有任何區(qū)別。
單中心沒有明確主備定義,當前工作即為主,上電運行根據(jù)監(jiān)測軟件配置指定,主備是邏輯上的主備,誰處于工作狀態(tài)誰就是主服務(wù)狀態(tài)。當工作狀態(tài)下的服務(wù)出現(xiàn)異常時才會執(zhí)行再次切換操作。
(1)監(jiān)測方式。每秒監(jiān)測當前業(yè)務(wù)網(wǎng)口(調(diào)度服務(wù)器上有個網(wǎng)口的網(wǎng)線連接到交換機上,這個網(wǎng)口稱為業(yè)務(wù)網(wǎng)口)的物理狀態(tài),用來監(jiān)測業(yè)務(wù)網(wǎng)口是否正常。監(jiān)測軟件通過 WINDOWS API接口可以獲得業(yè)務(wù)網(wǎng)口的物理狀態(tài),例如業(yè)務(wù)網(wǎng)口的網(wǎng)線拔掉,監(jiān)測軟件可以監(jiān)測到。監(jiān)測到異常的時間是3秒(每秒獲取1次業(yè)務(wù)網(wǎng)口的物理狀態(tài),連續(xù)3次都是異常,則認為業(yè)務(wù)網(wǎng)口有異常)。
(2)處理方式。檢測到當前業(yè)務(wù)網(wǎng)口處于異常狀態(tài),則:
如果當前調(diào)度服務(wù)器為主用調(diào)度服務(wù)器,則啟動主備切換;如果當前調(diào)度服務(wù)器為備用調(diào)度服務(wù)器,則自啟動主備切換,網(wǎng)管會出現(xiàn)這個異常,報警。
(1)監(jiān)測方式。每秒監(jiān)測 ATS 網(wǎng)口的的物理狀態(tài),用來監(jiān)測 ATS 網(wǎng)口是否正常。監(jiān)測軟件通過WINDOWS API接口可以獲得 ATS 網(wǎng)口的物理狀態(tài),例如 ATS 網(wǎng)口的網(wǎng)線拔掉,監(jiān)測軟件可以監(jiān)測到。監(jiān)測到異常的時間是3秒(每秒獲取 1 次 ATS 網(wǎng)口的物理狀態(tài),連續(xù)3次都是異常,則認為ATS網(wǎng)口有異常)。
(2)處理方式。檢測到當前 ATS 網(wǎng)口處于異常狀態(tài),異常包括物理異常和邏輯異常,物理異常包括:網(wǎng)口松動、網(wǎng)線破壞等邏輯異常包括ATS不回復(fù)位置信息,無法建立TCP通信;異常時網(wǎng)關(guān)有告警顯示,統(tǒng)一顯示為ATS未連接;備用服務(wù)器ATS故障時,網(wǎng)管可以監(jiān)測到這些狀態(tài):
如果當前調(diào)度服務(wù)器為主用調(diào)度服務(wù)器,則啟動主備切換;如果當前調(diào)度服務(wù)器為備用調(diào)度服務(wù)器,則自啟動主備切換,網(wǎng)管會出現(xiàn)這個異常報警。
(1)監(jiān)測方式。監(jiān)控軟件通過WINDOWS API接口查詢當前正在運行的進程里是否包含調(diào)度服務(wù)器軟件進程,通過這種方法可以判斷本機的 調(diào)度服務(wù)器 是否在運行。監(jiān)測到異常的時間是1秒(每秒查詢一次,出現(xiàn)調(diào)度服務(wù)器軟件沒有在運行,立刻就可以判斷出這個異常)
(2)處理方式。檢測到本機的調(diào)度服務(wù)器軟件沒有在運行,則:
如果當前調(diào)度服務(wù)器為主用調(diào)度服務(wù)器,則啟動主備切換;如果當前調(diào)度服務(wù)器為備用調(diào)度服務(wù)器,則重啟本機的備用 調(diào)度服務(wù)器 程序。
(1)監(jiān)測方式。監(jiān)測軟件互 ping 其他調(diào)度服務(wù)器,通過這種方式,備可以監(jiān)測主是否死機關(guān)機系統(tǒng)崩潰等;監(jiān)測軟件使用.NET框架下的 ping API來實現(xiàn) ping,根據(jù)返回值來判斷是否ping通,如果ping不通,為了確定是對方死機還是自身原因,需要ping第三方(例如時鐘)的連接。監(jiān)測到異常的時間是3秒。
(2)處理方式。監(jiān)測到其他調(diào)度服務(wù)器系統(tǒng)崩潰或者死機關(guān)機時,則:
如果當前調(diào)度服務(wù)器為主用調(diào)度服務(wù)器,監(jiān)測到其他備機調(diào)度服務(wù)器關(guān)機等,則自啟動主備切換,網(wǎng)管會出現(xiàn)這個異常報警。如果當前調(diào)度服務(wù)器為備用調(diào)度服務(wù)器,監(jiān)測到主用調(diào)度服務(wù)器關(guān)機,則啟動主備切換流程。
(1)監(jiān)測方式。監(jiān)測當前數(shù)據(jù)庫的狀態(tài),用來監(jiān)測數(shù)據(jù)庫服務(wù)是否異常。監(jiān)控軟件周期讀取調(diào)度服務(wù)器數(shù)據(jù)庫中數(shù)據(jù)表的個數(shù),每秒監(jiān)測1次,連續(xù)3秒讀叏數(shù)據(jù)庫表個數(shù)返回值為0,則認為數(shù)據(jù)庫服務(wù)異常。監(jiān)測到異常的時間是3秒。
(2)處理方式。檢測到當前數(shù)據(jù)庫處于斷連狀態(tài),則:
如果當前調(diào)度服務(wù)器為主用調(diào)度服務(wù)器,則啟動主備切換;如果當前調(diào)度服務(wù)器為備用調(diào)度服務(wù)器,則自啟動主備切換,網(wǎng)管會出現(xiàn)這個異常報警。
當前調(diào)度服務(wù)器軟件第一次檢測到主用調(diào)度服務(wù)器時,該調(diào)度服務(wù)器軟件會向主用調(diào)度服務(wù)器申請必要數(shù)據(jù)(列車位置信息、電臺狀態(tài));當主用調(diào)度服務(wù)器接收到電臺狀態(tài)信息發(fā)生改發(fā)時通知所有在線的備用服務(wù)器進行數(shù)據(jù)同步;因為列車位置消息特殊的時效性,其數(shù)據(jù)內(nèi)容是從信號中獲取的所以不需要同步。
當手動修改列車位置時會屏蔽該列車的ATS信號,當主用調(diào)度服務(wù)器發(fā)現(xiàn)被屏蔽的ATS信號的列車其位置収生改發(fā)主用調(diào)度服務(wù)器會通知所有備用調(diào)度服務(wù)器的數(shù)據(jù)庫進行同步。
列車的信息從信號系統(tǒng)獲得,每個調(diào)度服務(wù)器和信號系統(tǒng)建立兩路連接,每路連接都會收到信號系統(tǒng)接收來的數(shù)據(jù),周期是1秒,調(diào)度服務(wù)器對這兩路數(shù)據(jù)都解析,但是只處理其中一路。主備調(diào)度服務(wù)器都是如此,都可以從信號系統(tǒng)獲得車的信息,所以車的信息不用同步。
關(guān)于主備調(diào)度服務(wù)器上車的信息的一致性:如果信號系統(tǒng)給主備調(diào)度服務(wù)器的數(shù)據(jù)是一樣的,那么主備調(diào)度服務(wù)器上關(guān)于車的信息就是一致的;2)如果信號系統(tǒng)給主備調(diào)度服務(wù)器的數(shù)據(jù)不一樣,備用調(diào)度服務(wù)器 上關(guān)于列車的信息沒有必要和主用調(diào)度服務(wù)器上的車信息一致。因為在備機切換成主以后,它處理的還是原來備機連接的那路ATS數(shù)據(jù),會繼續(xù)按原來那路ATS數(shù)據(jù)走。
列車機車臺、固定臺開關(guān)機信息的同步,分兩種同步操作:
(1)主備剛連接上時,備用調(diào)度服務(wù)器從主用調(diào)度服務(wù)器 獲得終端開關(guān)機信息;主調(diào)度服務(wù)器獲得新的開關(guān)機信息時,實時轉(zhuǎn)發(fā)給備調(diào)度服務(wù)器。
此方案經(jīng)過多方論證,現(xiàn)場實測通過,已應(yīng)用到某城市地鐵線路專用無線系統(tǒng)中。