劉文靜
摘 要:AFC系統(tǒng)中的車站服務(wù)器(SC)是與終端設(shè)備緊密相連的設(shè)備,其主要功能是對車站終端設(shè)備進行狀態(tài)監(jiān)控、收集終端產(chǎn)生的交易和審計數(shù)據(jù),規(guī)范系統(tǒng)的數(shù)據(jù)管理、運營管理及系統(tǒng)維護管理的技術(shù)要求。服務(wù)中的車站服務(wù)器向下提供正確的服務(wù)模式、參數(shù)分發(fā)、時鐘同步等,向上提供交易數(shù)據(jù)、運行狀態(tài)、客流報表等,起到了承上啟下的關(guān)鍵作用,所以,車站服務(wù)器的正常運行是終端設(shè)備(TVM、GATE、POST)給乘客提供優(yōu)質(zhì)服務(wù)的保證。本文從增設(shè)硬件備份、應(yīng)用虛擬化技術(shù)、既有設(shè)備復(fù)用的不同實現(xiàn)方式進行對比,研究了車站服務(wù)器在故障時如何能夠快速恢復(fù)其功能,保證車站前后臺正常運行。
關(guān)鍵詞:AFC;SC;服務(wù)器;在線式容災(zāi)
中圖分類號:U231 文獻標識碼:A
0 引言
隨著地鐵建設(shè)的發(fā)展,郊區(qū)線路的建設(shè),使得線路呈分散、里程增長的趨勢,在車站服務(wù)器出現(xiàn)故障時尤其在夜間,技術(shù)人員并不能夠在第一時間趕赴現(xiàn)場維修解決故障,加上故障類型的不確定性,影響數(shù)據(jù)采集的時效性和終端設(shè)備的穩(wěn)定性,基于此種情況,需研究SC故障后如何做到快速恢復(fù)其功能。為確保在車站服務(wù)器故障時終端設(shè)備能夠繼續(xù)為乘客提供服務(wù),南京地鐵準備通過建立一套容災(zāi)備份系統(tǒng),在車站服務(wù)器無法正常工作時實現(xiàn)原服務(wù)器的部分功能,對終端設(shè)備進行接管,確保終端設(shè)備繼續(xù)穩(wěn)定運營。
1 實現(xiàn)方式探究
容災(zāi)系統(tǒng)是在各種災(zāi)難損害發(fā)生后, 仍然能夠最大限度地提供正常應(yīng)用服務(wù)的計算機信息系統(tǒng)。在發(fā)生災(zāi)難時,為了能夠保證業(yè)務(wù)的連續(xù)性, 必須能夠?qū)崿F(xiàn)系統(tǒng)透明的遷移。國內(nèi)AFC系統(tǒng)普遍采用在車站機房放置一臺車站服務(wù)器的建設(shè)方式,通過星型網(wǎng)或者環(huán)網(wǎng)將SC與終端設(shè)備進行連接,SC與線路中心通過通信上層網(wǎng)相連,見圖1AFC系統(tǒng)五層架構(gòu)。此種設(shè)計層次清晰,明確各個層級分工協(xié)作,能夠在線路里程不長的基礎(chǔ)上保證維護的高效性。但是,隨著城市軌道交通的發(fā)展以及郊區(qū)線路的建設(shè),運營維護的問題逐步凸顯,當SC出現(xiàn)故障,技術(shù)人員并不能夠在第一時間趕赴現(xiàn)場維修解決故障,影響設(shè)備監(jiān)控、實時客流數(shù)據(jù)等車站服務(wù)。
根據(jù)AFC系統(tǒng)五層架構(gòu),如果想實現(xiàn)SC在線式容災(zāi)備份系統(tǒng)的建立,可以采用以下兩種方式:一是SC采取雙機熱備。雙機熱備是應(yīng)用于服務(wù)器的一種解決方案,其主要實現(xiàn)方式是為服務(wù)器設(shè)置一主一備形式,主機和備機通過網(wǎng)絡(luò)連接,正常情況下主機處于工作狀態(tài),備機處于監(jiān)視狀態(tài),一旦主機出現(xiàn)異常,備機將會迅速代替主機,完全實現(xiàn)主機的功能。這種形式確實可以解決SC故障時功能受到影響的問題,這就需要為每個車站的SC增加備機,無疑要增加大量的硬件成本,性價比過低,這也是線路在設(shè)計和新建時期沒有采用雙機熱備形式的重要原因。二是應(yīng)用虛擬化技術(shù)。隨著信息化的飛速發(fā)展,IT方面的投入在不斷增加,服務(wù)器越來越多,機房空間越來越小,技術(shù)人員的管理難度也在不斷提升,傳統(tǒng)“一機一應(yīng)用”的模式已跟不上時代的步伐,迫切地需要通過更為高效的信息化手段來實現(xiàn)。虛擬化技術(shù)能有效地實現(xiàn)物理資源的整合,通過共享資源的模式提高現(xiàn)有資源的利用率,減少了數(shù)據(jù)中心的投入,減少了空間需求硬件投入。但是虛擬化技術(shù)的應(yīng)用通常適用于線路中心的各類服務(wù)器整合以取代原有的雙機熱備模式,若應(yīng)用在SC上需要改變既有的架構(gòu)設(shè)計,在線路中心為各SC增設(shè)集中共享設(shè)備,還需要突破車站局域網(wǎng)的限制,存在帶來模式分發(fā)異常的隱患。
2 南京地鐵的實現(xiàn)路徑
通過上一章對SC容災(zāi)實現(xiàn)方式的分析,雙機熱備的形式無論對于既有運營線路的改造還是新建都不太現(xiàn)實,虛擬化技術(shù)作為新興技術(shù)也需要投入大量的硬件成本,后期還需要投入長期維護的成本,不適用于既有線路對SC進行容災(zāi)??紤]到對乘客服務(wù)的優(yōu)質(zhì)要求及維護成本的控制,南京地鐵從不更改原有架構(gòu)設(shè)計、不花費大量成本投入的角度,考慮通過設(shè)計一套AFC車站服務(wù)器在線式容災(zāi)備份系統(tǒng),在SC出現(xiàn)故障無法提供服務(wù)時,實現(xiàn)SC功能的臨時接管。
(1)在線容災(zāi)系統(tǒng)的設(shè)計。基于以上需求,這就需要在既有架構(gòu)中尋求可以替代SC接管其功能的合適的設(shè)備,由于容災(zāi)備份系統(tǒng)的目的是臨時接替原SC的功能,因此對設(shè)備性能和長時間保存數(shù)據(jù)的要求相對較低,最終通過在車站工作站上安裝虛擬機,在虛擬系統(tǒng)中部署容災(zāi)備份應(yīng)用的所有功能,形成一臺容災(zāi)系統(tǒng)計算機(如圖2)。這樣原工作站功能不受影響,并且應(yīng)用程序都可以在相互獨立的空間內(nèi)運行而互不干擾,一旦SC發(fā)生故障,容災(zāi)備份系統(tǒng)可以立即接管,實現(xiàn)在線式容災(zāi)功能。
(2)容災(zāi)系統(tǒng)的切換。SC發(fā)生故障時,技術(shù)人員只需遠程斷開SC與AFC系統(tǒng)的連接,在替代工作站上啟動虛擬機業(yè)務(wù)接入AFC系統(tǒng),該工作站將全面接管故障SC的業(yè)務(wù)功能,實現(xiàn)設(shè)備監(jiān)控、客流監(jiān)控、交易管理、數(shù)據(jù)管理、通信服務(wù)、時鐘管理、參數(shù)管理、設(shè)備管理、日始日終管理,同時可以實現(xiàn)客流數(shù)據(jù)實時銜接、交易文件斷點續(xù)傳、監(jiān)控狀態(tài)瞬間切換,真正實現(xiàn)在線容災(zāi),為車站設(shè)備繼續(xù)提供后臺服務(wù)。設(shè)備故障時,若存在部分交易文件未正常上傳的情況,容災(zāi)備份系統(tǒng)還對設(shè)備交易文件提供補傳機制,確保交易文件上傳。SC故障修復(fù)后,技術(shù)人員只需將在線式容災(zāi)系統(tǒng)斷開,SC開機后即可繼續(xù)工作,災(zāi)備系統(tǒng)轉(zhuǎn)正常系統(tǒng)進行服務(wù)。若要保證SC交易文件和數(shù)據(jù)庫中交易的完整性,只需災(zāi)備系統(tǒng)在故障期間的交易恢復(fù)至SC,對原系統(tǒng)不產(chǎn)生影響。
(3)容災(zāi)系統(tǒng)的維護。在線容災(zāi)系統(tǒng)的日常維護至關(guān)重要,為了在SC故障時能順利接管,必須確保容災(zāi)系統(tǒng)中的業(yè)務(wù)功能與SC保持完全一致,這就需要在SC的業(yè)務(wù)軟件功能包括配置發(fā)生變化時,容災(zāi)系統(tǒng)均需及時進行相應(yīng)更新,與SC保持同步。而更新方式只需要遠程連接容災(zāi)備份系統(tǒng)進行文件的替換即可實現(xiàn),操作便捷。
3 結(jié)束語
通過研究SC在線式容災(zāi)系統(tǒng),實現(xiàn)了利用車站工作站接管故障SC所有業(yè)務(wù)功能的方式進行容災(zāi)備份,確?,F(xiàn)場服務(wù)質(zhì)量和后臺數(shù)據(jù)統(tǒng)計不受影響,也為故障排查爭取足夠的時間,緩解了故障處置的壓力,真正實現(xiàn)了故障處理的“先通后復(fù)”,為“網(wǎng)絡(luò)化運營”新形勢下SC故障快速搶修探索了一種的新模式。
參考文獻:
[1]李輝.基于Vmware虛擬化技術(shù)的服務(wù)器集群的架構(gòu)與應(yīng)用[D].湖南大學(xué),2017.
[2]張金波.容災(zāi)備份與恢復(fù)平臺的設(shè)計與實現(xiàn)[D].大連理工大學(xué),2015.