時(shí)明薇
摘要:縱觀國(guó)內(nèi)AFC系統(tǒng)建設(shè)現(xiàn)狀,建設(shè)方式多數(shù)采用在車站部署一臺(tái)AFC系統(tǒng)機(jī)房,通過星型網(wǎng)或者環(huán)網(wǎng)將SC與終端設(shè)備進(jìn)行連接,既有SC系統(tǒng)不具備災(zāi)備的功能,發(fā)生車站服務(wù)器出現(xiàn)故障時(shí)時(shí),無(wú)法臨時(shí)接管,客流數(shù)據(jù)無(wú)法實(shí)時(shí)銜接,不具備交易文件斷點(diǎn)續(xù)傳,不能監(jiān)控狀態(tài)瞬間切換等功能,造成系統(tǒng)宕機(jī)。如果在車站使用雙擊備份,確實(shí)可以解決這一問題,但建設(shè)成本翻倍??紤]到對(duì)乘客服務(wù)的優(yōu)質(zhì)要求及維護(hù)成本控制,從實(shí)際出發(fā),設(shè)計(jì)出一套AFC車站服務(wù)器在線容災(zāi)備份系統(tǒng)。
關(guān)鍵詞:SC系統(tǒng);容災(zāi);備份;
隨著城市軌道交通的大力發(fā)展,以及郊區(qū)線路的建設(shè),運(yùn)營(yíng)維護(hù)的問題逐步凸顯,當(dāng)SC出現(xiàn)故障,技術(shù)人員并不能夠在第一時(shí)間趕赴現(xiàn)場(chǎng)維修解決故障,影響車站故障監(jiān)控、實(shí)時(shí)客流數(shù)據(jù)。
1.研究思路啟發(fā)
通過數(shù)據(jù)庫(kù)雙機(jī)熱備的啟發(fā),從實(shí)用性,經(jīng)濟(jì)性出發(fā),充分對(duì)比雙機(jī)熱備和在線容災(zāi)的優(yōu)缺點(diǎn),最終確定實(shí)施在線容災(zāi)備份方案。
1)雙機(jī)熱備方案:就是將服務(wù)器安裝成互為備份的兩臺(tái)服務(wù)器,并且在同一時(shí)間內(nèi)只有一臺(tái)服務(wù)器運(yùn)行。當(dāng)正在運(yùn)行的主服務(wù)器出現(xiàn)故障無(wú)法工作時(shí),另一臺(tái)備用服務(wù)器會(huì)立即啟動(dòng)并運(yùn)行,從而保證AFC車站系統(tǒng)的業(yè)務(wù)正常運(yùn)行。針對(duì)現(xiàn)場(chǎng)生產(chǎn)環(huán)境,車站服務(wù)器需增加一臺(tái)。
優(yōu)點(diǎn):技術(shù)改造難度小,故障時(shí)自動(dòng)切換。
缺點(diǎn):需額外增加1臺(tái)服務(wù)器,改造成本大,浪費(fèi)現(xiàn)場(chǎng)可用資源。
2)在線容災(zāi)備份方案:充分利用現(xiàn)有車站工作站環(huán)境和設(shè)備,通過資源整合,將車站服務(wù)器的業(yè)務(wù)部署到車站工作站上虛擬機(jī)上,作為備用服務(wù)器,實(shí)現(xiàn)災(zāi)備的功能。
優(yōu)點(diǎn):最大化節(jié)省成本,充分調(diào)用既有設(shè)備資源,經(jīng)濟(jì)可行。
缺點(diǎn):不能自動(dòng)切換,需人工手動(dòng)切換。
2.基于VirtualBox虛擬機(jī)災(zāi)備方案實(shí)現(xiàn)
3.VirtualBox虛擬機(jī)部署
1)系統(tǒng)安裝:在車站工作站上安裝VirtualBox虛擬機(jī),安裝跟車站服務(wù)器統(tǒng)一的操作系統(tǒng),數(shù)據(jù)庫(kù)環(huán)境以及相應(yīng)服務(wù)包。安裝完成后,修改相關(guān)配置設(shè)置,驗(yàn)證系統(tǒng)通信服務(wù),設(shè)備監(jiān)控、客流監(jiān)控、交易數(shù)據(jù)管理、時(shí)鐘管理、參數(shù)管理、設(shè)備管理、日始日終處理功能是否正常。
驗(yàn)證通過,將該硬盤制作為母盤,克隆出來,復(fù)制至其余車站,修改相應(yīng)車站配置,節(jié)約時(shí)間成本并降低安裝系統(tǒng)及數(shù)據(jù)庫(kù)途中出問題的風(fēng)險(xiǎn)?,F(xiàn)場(chǎng)安裝后,需檢查:主機(jī)防火墻是否已關(guān)閉,時(shí)間,USB口,監(jiān)控工作站功能是否正常。
2)系統(tǒng)切換:將故障車站SC服務(wù)器斷網(wǎng)(服務(wù)器后面網(wǎng)線斷開),監(jiān)控工作站打開VirtualBox虛擬機(jī),啟動(dòng)"SC_Backup" CentOS 5.8 系統(tǒng)。檢查時(shí)間是否一致,進(jìn)入“系統(tǒng)-管理-網(wǎng)絡(luò)” eth0,確認(rèn)IP地址、網(wǎng)關(guān)正確,激活eth0,啟動(dòng)相關(guān)服務(wù)進(jìn)程及服務(wù)。再查看車站監(jiān)控、中央監(jiān)控、文件上傳情況。
3)系統(tǒng)恢復(fù):故障修復(fù)后,關(guān)閉各項(xiàng)進(jìn)程、關(guān)閉數(shù)據(jù)庫(kù)、關(guān)閉虛擬機(jī)系統(tǒng)、關(guān)閉虛擬機(jī)。啟用車站服務(wù)器。
4.系統(tǒng)硬件要求
介于是在原工作站上模擬車站服務(wù)器運(yùn)行環(huán)境,對(duì)內(nèi)存要求較高,因此需根據(jù)原有車站服務(wù)器類型,需增配內(nèi)存條。
5.系統(tǒng)軟件要求
為了提高工作站的性能,建議使用Windows7 64位及以上版本的正版操作系統(tǒng)。其他性能應(yīng)如下:
1)通信服務(wù)
系統(tǒng)實(shí)現(xiàn)LC指終端設(shè)備的通信銜接功能,整個(gè)通信分為外接系統(tǒng)(內(nèi)部和外部系統(tǒng))的消息接入模塊和消息處理模塊。
消息接入模塊接受來自外接的消息報(bào)文,然后轉(zhuǎn)由消息處理模塊處理消息接入模塊主要提供通信服務(wù),包括消息報(bào)文的接受和發(fā)送,分別由通信服務(wù)模塊和通信客戶模塊來完成。通信服務(wù)模塊接受外接系統(tǒng)的連接請(qǐng)求,建立通信連接,接收消息請(qǐng)求報(bào)文,發(fā)送給消息處理模塊。通信服務(wù)模塊從消息處理模塊接收應(yīng)答報(bào)文,發(fā)送到外接系統(tǒng)。通信客戶模塊向外接系統(tǒng)發(fā)送消息請(qǐng)求和接收外接系統(tǒng)的消息應(yīng)答。
消息處理模塊接受來自外部和內(nèi)部接入模塊的各種消息,進(jìn)行業(yè)務(wù)處理后,形成應(yīng)答報(bào)文發(fā)送給外部和內(nèi)部系統(tǒng)系統(tǒng)采用 CORBA通信技術(shù)實(shí)現(xiàn)ZLC到SLE之間的實(shí)時(shí)數(shù)據(jù)通信系統(tǒng)中的各節(jié)點(diǎn)的文件傳輸采用FTP通信協(xié)議。
SC對(duì)單臺(tái)設(shè)備能夠指定特別的FTP登錄信息,便于參數(shù)的下載、應(yīng)用、測(cè)試等。
2)設(shè)備監(jiān)控
服務(wù)器故障后,災(zāi)備系統(tǒng)能夠?qū)崿F(xiàn)車站級(jí)設(shè)備監(jiān)控,對(duì)設(shè)備的監(jiān)控主要包括運(yùn)行模式、設(shè)備狀態(tài)、設(shè)備故障及報(bào)警等各類監(jiān)控信息。各類監(jiān)控信息準(zhǔn)確、實(shí)時(shí),顯示直觀、清晰,監(jiān)控信息分類、分級(jí)顯示,使監(jiān)控人員可以快速判斷和響應(yīng)。其中設(shè)備狀態(tài)包括正常、警告、故障、離線和關(guān)機(jī)狀態(tài),各狀態(tài)以不同顏色的圖標(biāo)顯示。系統(tǒng)可集中控制車站內(nèi)設(shè)備的運(yùn)行,可向某組設(shè)備、某類設(shè)備、某臺(tái)設(shè)備下達(dá)控制指令。這樣的指令主要包括設(shè)備運(yùn)行模式轉(zhuǎn)換指令、設(shè)備數(shù)據(jù)查詢指令、設(shè)備運(yùn)行指令等。
3)客流監(jiān)控
系統(tǒng)監(jiān)視車站的客流情況,以提供制定運(yùn)營(yíng)計(jì)劃的基礎(chǔ)數(shù)據(jù)。所監(jiān)視的客流應(yīng)包括所有設(shè)備處理的客流。所監(jiān)視的客流可按時(shí)間段進(jìn)行查詢,最小時(shí)間段為1分鐘。監(jiān)視范圍可按整個(gè)車站、某組設(shè)備、某類設(shè)備、某臺(tái)設(shè)備進(jìn)行靈活選擇。監(jiān)控內(nèi)容的顯示清晰,圖形多樣化。顯示內(nèi)容主要包括購(gòu)買各類車票人數(shù)、充值人數(shù)、車票更新人數(shù)、各類車票進(jìn)站人數(shù)、各類車票出站人數(shù)、補(bǔ)票人數(shù)等??土鞅O(jiān)視數(shù)據(jù)上傳頻度和內(nèi)容可由參數(shù)或通過系統(tǒng)進(jìn)行設(shè)定??土鞅O(jiān)視還可記錄全線日最高峰記錄,當(dāng)某日客流超過該記錄時(shí),報(bào)警提示,以促進(jìn)車站的疏導(dǎo)工作。
4)交易數(shù)據(jù)管理
災(zāi)備系統(tǒng)收集各類車票交易數(shù)據(jù),并上傳到LC。數(shù)據(jù)包括各種車站設(shè)備對(duì)各種車票的賦值、發(fā)售、充值、扣值、進(jìn)出站、更新、替換、退款等各種交易類型的數(shù)據(jù),交易數(shù)據(jù)可以不解析入本地庫(kù),但需對(duì)傳輸?shù)臄?shù)據(jù)進(jìn)行記錄,并進(jìn)行備份,便于差異跟蹤、分析。
5)時(shí)鐘管理
災(zāi)備系統(tǒng)以LC通信時(shí)鐘服務(wù)器作為主時(shí)鐘源。系統(tǒng)使用SNTP協(xié)議進(jìn)行時(shí)鐘同步。
系統(tǒng)從時(shí)鐘源獲得標(biāo)準(zhǔn)時(shí)鐘后,把自己作為SNTP服務(wù)器,向本區(qū)域中心管理終端提供標(biāo)準(zhǔn)時(shí)鐘。每隔1個(gè)時(shí)間段(由參數(shù)設(shè)置)同步一次,當(dāng)時(shí)鐘出現(xiàn)差異時(shí),在1秒內(nèi)得到同步,其中大于7200秒的差異不能自動(dòng)同步,系統(tǒng)進(jìn)行日志記錄備案,小于5秒的差異不需要同步(閾值可由參數(shù)設(shè)置)。
系統(tǒng)通信中斷的情況下可人工修正時(shí)鐘。對(duì)于不能自動(dòng)同步的終端,可通過強(qiáng)制同步終端時(shí)鐘,并記錄日志。
時(shí)鐘接口、傳輸協(xié)議等應(yīng)與ZLC保持一致。
ZLC-SC-SLE各級(jí)之間的SNTP報(bào)文傳輸采用基于 Socket的TCP聯(lián)機(jī)報(bào)文方式實(shí)現(xiàn),上層為服務(wù)端、下層為客戶端。
各同步終端,將時(shí)鐘狀態(tài)上傳給上級(jí)監(jiān)控,醒目列出時(shí)鐘差異在設(shè)定范圍以外的設(shè)備,并可以發(fā)送命令強(qiáng)制進(jìn)行時(shí)鐘同步。
6)參數(shù)管理
參數(shù)主要包括EOD參數(shù)、黑灰名單和模式履歷。EOD參數(shù)又分為ACC級(jí)參數(shù)和ZLC級(jí)參數(shù)。ACC級(jí)別的參數(shù)在ACC生成,向全線網(wǎng)所有區(qū)域中心發(fā)布。
LC級(jí)別的參數(shù),向本ZLC的下級(jí)SC發(fā)布,SC轉(zhuǎn)發(fā)給下級(jí)設(shè)備。黑灰名單在ACC生成,以文件的形式向全線網(wǎng)所有區(qū)域中心發(fā)布。模式履歷在ACC生成,以文件的形式向全線網(wǎng)所有區(qū)域中心發(fā)布。
災(zāi)備系統(tǒng)能接收LC下達(dá)的系統(tǒng)參數(shù),同時(shí)將參數(shù)下達(dá)到相關(guān)車站設(shè)備。對(duì)于系統(tǒng)參數(shù)應(yīng)能實(shí)現(xiàn)以下功能:
1、正確接收、確認(rèn)并保存ZLC所下達(dá)的系統(tǒng)參數(shù);
2、將系統(tǒng)參數(shù)下載到相關(guān)車站設(shè)備。若與車站設(shè)備通信中斷,在恢復(fù)通信時(shí)能自動(dòng)更新車站設(shè)備的系統(tǒng)參數(shù);
3、災(zāi)備系統(tǒng)每日能自動(dòng)確認(rèn)所保存的系統(tǒng)參數(shù)是否與車站設(shè)備一致,如不致將自動(dòng)更新車站設(shè)備參數(shù);
4、災(zāi)備系統(tǒng)所保存的系統(tǒng)參數(shù)在設(shè)置的參數(shù)生效時(shí)間能進(jìn)行自動(dòng)生效;
5、操作員應(yīng)可查詢或打印ZLC下載的系統(tǒng)參數(shù)。
7)設(shè)備管理
系統(tǒng)實(shí)現(xiàn)如下設(shè)備管理功能:
1、管理設(shè)備數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)中包含系統(tǒng)中所有的設(shè)備信息,但 SC設(shè)備只能查看本站的設(shè)備信息,也不具有設(shè)備信息編輯功能。
2、提供數(shù)據(jù)訪問接口以供其他軟件包訪問設(shè)備信息。
3、監(jiān)視設(shè)備數(shù)據(jù)庫(kù)的改變,當(dāng)改變發(fā)生時(shí),其通知相關(guān)設(shè)備信息敏感模塊。
4、接收來自ZL下發(fā)的系統(tǒng)初始設(shè)備信息及變更的設(shè)備信息。
8)日始處理
系統(tǒng)在每日運(yùn)營(yíng)開始時(shí),自動(dòng)執(zhí)行運(yùn)營(yíng)開始處理程序。
系統(tǒng)具有手動(dòng)配置日始處理任務(wù)的功能,當(dāng)系統(tǒng)到達(dá)設(shè)置的日始程序運(yùn)行時(shí)間后,將啟動(dòng)日始程序。日始步驟如下
1、準(zhǔn)備日始;
2、檢查參數(shù)版本,如果有新版本時(shí)需要下載;
3、下載黑名單文件;
4、下載模式履歷文件;
5、日終處理
系統(tǒng)在每日運(yùn)營(yíng)結(jié)東后,自動(dòng)執(zhí)行運(yùn)營(yíng)結(jié)束處理程序,處理當(dāng)天買有數(shù)據(jù)及文件,并完成運(yùn)行結(jié)束管理工作。
系統(tǒng)具有手動(dòng)配置日終處理任務(wù)的功能,當(dāng)系統(tǒng)到達(dá)設(shè)置的日終程序運(yùn)行時(shí)間后,將啟動(dòng)日終程序。運(yùn)營(yíng)結(jié)程序應(yīng)至少包括:
1、交易、審計(jì)和事件文件流水號(hào)連續(xù)性檢查;
2、如果文件流水號(hào)不連續(xù),索取設(shè)備文件;
3、備份交易數(shù)據(jù);
4、對(duì)超過保存日期的數(shù)據(jù)進(jìn)行清理。
6.結(jié)束語(yǔ)
車站在線容災(zāi)備份系統(tǒng)通過最小成本實(shí)現(xiàn)了車站服務(wù)器故障時(shí)線路的穩(wěn)定運(yùn)營(yíng)。
車站計(jì)算機(jī)故障時(shí),技術(shù)人員進(jìn)行確認(rèn)后斷開車站服務(wù)器連接。災(zāi)備系統(tǒng)提供配置界面,技術(shù)人員對(duì)災(zāi)備系統(tǒng)進(jìn)行配置修改后,接入AFC系統(tǒng)即可。
車站計(jì)算機(jī)故障修復(fù),技術(shù)人員將備份系統(tǒng)斷開,原車站計(jì)算機(jī)繼續(xù)工作,可將災(zāi)備系統(tǒng)在故障期間的交易恢復(fù)至車站計(jì)算及,對(duì)原系統(tǒng)不產(chǎn)生影響。
設(shè)備故障時(shí),實(shí)現(xiàn)車站業(yè)務(wù)正常無(wú)縫無(wú)差別繼續(xù)運(yùn)行,保證了對(duì)車站設(shè)備狀態(tài)的正常監(jiān)控,數(shù)據(jù)正常接收解析,收益客流數(shù)據(jù)正常上報(bào)等,實(shí)現(xiàn)了SC服務(wù)器發(fā)生故障對(duì)業(yè)務(wù)和現(xiàn)場(chǎng)零影響的效果,災(zāi)備系統(tǒng)對(duì)設(shè)備交易文件提供補(bǔ)傳機(jī)制,確保交易文件上傳,數(shù)據(jù)準(zhǔn)確率不低于99.99%。
在以后新線建設(shè)中,各專業(yè)的服務(wù)均可借鑒本次改造的方案,實(shí)現(xiàn)在線容災(zāi)備份,,即提高了服務(wù)器系統(tǒng)的可靠性,也復(fù)用了服務(wù)器資源,為公司節(jié)約新線建設(shè)成本,降低故障影響。
參考文獻(xiàn):
[1]劉韞暉,宋茂強(qiáng).基于消息同步的雙機(jī)熱備份系統(tǒng)[J].北京郵電大學(xué)學(xué)報(bào),1998, 21(2)