李 樊,曹偉濤
(中國(guó)鐵道科學(xué)研究院 電子計(jì)算技術(shù)研究所,北京 100081)
動(dòng)車組管理信息系統(tǒng)監(jiān)控平臺(tái)研究
李 樊,曹偉濤
(中國(guó)鐵道科學(xué)研究院 電子計(jì)算技術(shù)研究所,北京 100081)
隨著動(dòng)車組管理信息系統(tǒng)的廣泛應(yīng)用,系統(tǒng)運(yùn)維的工作難度明顯增加,如何有效地利用運(yùn)維工具提升工作效率成為首要問題。在此基礎(chǔ)上本文提出并設(shè)計(jì)研發(fā)出動(dòng)車組管理信息系統(tǒng)監(jiān)控平臺(tái),通過監(jiān)控組件對(duì)信息系統(tǒng)軟硬件運(yùn)行狀態(tài)的后臺(tái)自動(dòng)監(jiān)控,實(shí)現(xiàn)了重點(diǎn)監(jiān)控對(duì)象的報(bào)警提醒和綜合展示,動(dòng)車組管理信息系統(tǒng)軟硬件臺(tái)賬及現(xiàn)場(chǎng)信息的統(tǒng)一管理,并有效的提升了動(dòng)車組管理信息系統(tǒng)的運(yùn)維工作效率。
動(dòng)車組管理信息系統(tǒng);監(jiān)控平臺(tái);監(jiān)控組件
隨著動(dòng)車組管理信息系統(tǒng)的深入運(yùn)用,各級(jí)用戶在工作生產(chǎn)中對(duì)系統(tǒng)的依賴性不斷提高,這些都對(duì)系統(tǒng)的可靠性提出了更高的要求。為了進(jìn)一步提升動(dòng)車組管理信息系統(tǒng)的售后服務(wù)質(zhì)量,不斷提高售后服務(wù)的及時(shí)性、準(zhǔn)確性和有效性,系統(tǒng)的維護(hù)服務(wù)人員需要在發(fā)現(xiàn)問題后的第一時(shí)間對(duì)問題進(jìn)行處理,降低系統(tǒng)故障給用戶帶來的不便,提升系統(tǒng)用戶滿意度。
目前動(dòng)車組管理信息系統(tǒng)相關(guān)的硬件設(shè)備、服務(wù)器數(shù)量大且部署分散,信息系統(tǒng)的網(wǎng)絡(luò)傳輸及信息上報(bào)也直接影響到系統(tǒng)的可用性。定時(shí)定點(diǎn)查看系統(tǒng)軟硬件情況的維護(hù)方式覆蓋面不夠,時(shí)效性不強(qiáng),不能及時(shí)發(fā)現(xiàn)系統(tǒng)軟硬件運(yùn)行存在的故障和隱患且費(fèi)力費(fèi)時(shí),這都導(dǎo)致了目前動(dòng)車組管理信息系統(tǒng)維護(hù)工作量大、工作效率不高。因此,設(shè)計(jì)并研發(fā)出一套穩(wěn)定、可靠、高效的信息系統(tǒng)監(jiān)控平臺(tái),是提升動(dòng)車組管理信息系統(tǒng)售后服務(wù)質(zhì)量的前提。
1.1 監(jiān)控平臺(tái)需求分析
為減少動(dòng)車組管理信息系統(tǒng)維護(hù)工作中的重復(fù)勞動(dòng),降低錯(cuò)誤率,在不增加維護(hù)人員數(shù)量的前提下提高工作效率,通過對(duì)動(dòng)車組管理信息系統(tǒng)的維護(hù)情況進(jìn)行梳理、歸納及總結(jié),將影響信息系統(tǒng)正常運(yùn)行的軟硬件運(yùn)行狀態(tài)指標(biāo)定為監(jiān)控對(duì)象,通過監(jiān)控平臺(tái)實(shí)現(xiàn)對(duì)這些監(jiān)控對(duì)象的自動(dòng)監(jiān)控及報(bào)警。
動(dòng)車組管理信息系統(tǒng)監(jiān)控平臺(tái)的總體需求包括:
(1)實(shí)現(xiàn)對(duì)信息系統(tǒng)軟硬件運(yùn)行狀態(tài)的后臺(tái)自動(dòng)監(jiān)控
動(dòng)車組管理信息系統(tǒng)服務(wù)器的正常運(yùn)行是系統(tǒng)運(yùn)行的硬件保障,信息系統(tǒng)各類數(shù)據(jù)信息的加載與同步是系統(tǒng)運(yùn)行的軟件保障,信息系統(tǒng)各使用單位至中國(guó)鐵路總公司服務(wù)器的網(wǎng)絡(luò)聯(lián)通是系統(tǒng)運(yùn)行的網(wǎng)絡(luò)保障,動(dòng)車組調(diào)報(bào)信息的上報(bào)是系統(tǒng)運(yùn)行的數(shù)據(jù)保障。所以動(dòng)車組管理信息系統(tǒng)監(jiān)控平臺(tái)要實(shí)現(xiàn)對(duì)服務(wù)器運(yùn)行狀態(tài)、信息系統(tǒng)運(yùn)行狀態(tài)、網(wǎng)絡(luò)聯(lián)通狀態(tài)、數(shù)據(jù)庫備份及調(diào)報(bào)信息上報(bào)的后臺(tái)自動(dòng)監(jiān)控。
(2)實(shí)現(xiàn)對(duì)重點(diǎn)監(jiān)控對(duì)象的綜合展示
動(dòng)車組管理信息系統(tǒng)監(jiān)控平臺(tái)的運(yùn)用應(yīng)改變系統(tǒng)維護(hù)人員原有的定時(shí)定點(diǎn)查看系統(tǒng)運(yùn)行狀態(tài)、網(wǎng)絡(luò)聯(lián)通狀態(tài)及信息上報(bào)狀態(tài)的工作方式,用圖形化界面展示被監(jiān)控對(duì)象的運(yùn)行情況,發(fā)生報(bào)警時(shí),以聲像提醒的方式通知維護(hù)人員解決。
(3)實(shí)現(xiàn)報(bào)警信息的閉環(huán)處理
當(dāng)報(bào)警發(fā)生時(shí),系統(tǒng)維護(hù)人員需對(duì)報(bào)警信息進(jìn)行處理,對(duì)于報(bào)警的處理過程系統(tǒng)需進(jìn)行跟蹤及存儲(chǔ),確保報(bào)警信息得到解決。報(bào)警處理信息能夠按報(bào)警類型、報(bào)警地等條件進(jìn)行查詢與統(tǒng)計(jì),為值班員的工作考核提供依據(jù)。
(4)實(shí)現(xiàn)監(jiān)控地點(diǎn)及報(bào)警閥值的配置
由于各使用單位信息系統(tǒng)服務(wù)器類型及數(shù)量各異,調(diào)報(bào)信息上報(bào)要求也各不相同,監(jiān)控平臺(tái)應(yīng)滿足對(duì)監(jiān)控對(duì)象及監(jiān)控報(bào)警閥值的自由配置。
1.2 監(jiān)控平臺(tái)業(yè)務(wù)分析
1.2.1 后臺(tái)監(jiān)控業(yè)務(wù)分析
對(duì)動(dòng)車組管理信息系統(tǒng)的后臺(tái)監(jiān)控可以分為硬件類監(jiān)控和軟件類監(jiān)控,硬件類監(jiān)控主要實(shí)現(xiàn)對(duì)信息系統(tǒng)的服務(wù)器及網(wǎng)絡(luò)設(shè)備運(yùn)行狀態(tài)的監(jiān)控,這些設(shè)備運(yùn)行正常是動(dòng)車組管理信息系統(tǒng)運(yùn)行的基礎(chǔ);軟件監(jiān)控主要實(shí)現(xiàn)對(duì)信息系統(tǒng)傳輸狀態(tài)、系統(tǒng)運(yùn)行狀態(tài)、數(shù)據(jù)庫狀態(tài)及調(diào)報(bào)信息上報(bào)的監(jiān)控,這些狀態(tài)的正常是動(dòng)車組管理信息系統(tǒng)運(yùn)行的保障。
信息系統(tǒng)的服務(wù)器及網(wǎng)絡(luò)設(shè)備有數(shù)百臺(tái)且分散在鐵路總公司及全路各個(gè)動(dòng)車(車輛)段及運(yùn)用所,對(duì)這些設(shè)備運(yùn)行狀態(tài)的監(jiān)控十分重要,經(jīng)過對(duì)近幾年的系統(tǒng)維護(hù)記錄進(jìn)行整理后發(fā)現(xiàn)目前影響動(dòng)車組管理信息系統(tǒng)最多的硬件因素包括服務(wù)器CPU的占用率、內(nèi)存的占用率、硬盤的占用率、服務(wù)器上IIS的運(yùn)行情況及網(wǎng)絡(luò)聯(lián)通狀況。
動(dòng)車組管理信息系統(tǒng)各使用單位每天進(jìn)行接送車、數(shù)據(jù)上報(bào)、故障同步等操作時(shí)都需要大量數(shù)據(jù)傳輸?shù)借F路總公司,如果數(shù)據(jù)庫、數(shù)據(jù)傳輸、文件裝載等出現(xiàn)問題就會(huì)直接影響到這些模塊的正常運(yùn)行。所以,實(shí)現(xiàn)對(duì)MQ傳輸狀態(tài)、履歷同步狀態(tài)、數(shù)據(jù)庫運(yùn)行狀態(tài)、文件裝載情況及接送車狀態(tài)的監(jiān)控也非常重要。
車組狀態(tài)、開行信息、檢修實(shí)績(jī)、高級(jí)修日?qǐng)?bào),這些信息是鐵路總公司車輛調(diào)度編制交接班日?qǐng)?bào)的基礎(chǔ),直接關(guān)系到動(dòng)車組每日走行公里的累計(jì)及檢修信息的記錄,這些信息的上報(bào)是動(dòng)車組管理信息系統(tǒng)使用的重中之重,也是系統(tǒng)維護(hù)工作最重要的環(huán)節(jié)。所以動(dòng)車組管理信息系統(tǒng)監(jiān)控平臺(tái)也要實(shí)現(xiàn)對(duì)調(diào)報(bào)信息的監(jiān)控。
綜上所述,后臺(tái)監(jiān)控需涵蓋的重要監(jiān)控指標(biāo)有16個(gè),如表1所示。
表1 動(dòng)車組管理信息系統(tǒng)監(jiān)控平臺(tái)監(jiān)控需求
1.2.2 報(bào)警管理業(yè)務(wù)分析
當(dāng)后臺(tái)監(jiān)控的各項(xiàng)監(jiān)控指標(biāo)發(fā)生報(bào)警后首先對(duì)報(bào)警信息進(jìn)行判斷,如果已經(jīng)發(fā)生過相同的報(bào)警且該報(bào)警還未處理完畢則不進(jìn)行重復(fù)報(bào)警。否則,發(fā)出聲像報(bào)警提醒。系統(tǒng)維護(hù)人員可以對(duì)報(bào)警信息進(jìn)行查詢及處理,對(duì)報(bào)警信息的處理操作及處理時(shí)間作為報(bào)警處理記錄進(jìn)行存儲(chǔ)。對(duì)于不同類型的報(bào)警信息,可進(jìn)行推薦解決方案配置,當(dāng)發(fā)生該類報(bào)警時(shí)系統(tǒng)維護(hù)人員可直接查看到推薦解決方案或進(jìn)行解決方案的快速查詢。
2.1 總體架構(gòu)
動(dòng)車組管理信息系統(tǒng)為分布式應(yīng)用,信息系統(tǒng)服務(wù)器分布于全路各地,所以需要通過開發(fā)監(jiān)控組件來實(shí)現(xiàn)對(duì)服務(wù)器、數(shù)據(jù)庫和信息系統(tǒng)運(yùn)行狀態(tài)等監(jiān)控對(duì)象狀態(tài)信息的采集。當(dāng)監(jiān)控對(duì)象的狀態(tài)信息超過報(bào)警閥值后生成報(bào)警信息傳輸給監(jiān)控平臺(tái)服務(wù)器并在監(jiān)控報(bào)警頁面進(jìn)行報(bào)警提醒,提醒維護(hù)人員及時(shí)進(jìn)行處理。系統(tǒng)的總體架構(gòu)圖如圖1所示。
圖1 總體架構(gòu)圖
2.2 功能架構(gòu)
動(dòng)車組管理信息系統(tǒng)監(jiān)控平臺(tái)根據(jù)功能不同劃分為后臺(tái)監(jiān)控、報(bào)警管理、臺(tái)賬管理、用戶管理和綜合展示5個(gè)模塊,系統(tǒng)功能架構(gòu)如圖2所示。
圖2 系統(tǒng)功能框架
后臺(tái)監(jiān)控模塊通過安裝在動(dòng)車組管理信息系統(tǒng)服務(wù)器上的監(jiān)控組件實(shí)現(xiàn)對(duì)信息系統(tǒng)服務(wù)器、數(shù)據(jù)庫及系統(tǒng)運(yùn)行狀態(tài)信息的采集和報(bào)警預(yù)判,將運(yùn)行狀態(tài)信息或報(bào)警信息傳輸?shù)奖O(jiān)控平臺(tái)服務(wù)器。報(bào)警管理模塊實(shí)現(xiàn)報(bào)警提醒、報(bào)警處理和報(bào)警配置功能。臺(tái)賬管理模塊實(shí)現(xiàn)對(duì)動(dòng)車組管理信息系統(tǒng)的軟硬件臺(tái)賬及現(xiàn)場(chǎng)信息的統(tǒng)一管理。用戶管理模塊負(fù)責(zé)對(duì)監(jiān)控平臺(tái)用戶進(jìn)行分級(jí)管理。綜合展示模塊對(duì)后臺(tái)監(jiān)控信息及各類臺(tái)賬信息進(jìn)行展示。
3.1 異構(gòu)系統(tǒng)的硬件監(jiān)控實(shí)現(xiàn)
硬件監(jiān)控主要是監(jiān)控動(dòng)車組管理信息系統(tǒng)服務(wù)器CPU占用率、內(nèi)存占用率、硬盤占用率、IIS進(jìn)程狀態(tài)及網(wǎng)絡(luò)聯(lián)通狀態(tài),通過開發(fā)硬件監(jiān)控組件實(shí)現(xiàn)。由于信息系統(tǒng)服務(wù)器操作系統(tǒng)類型各異,硬件監(jiān)控組件采用Java語言開發(fā)。
硬件監(jiān)控組件根據(jù)服務(wù)器的操作系統(tǒng)類型和監(jiān)控配置文件啟動(dòng)相應(yīng)的監(jiān)控線程,每個(gè)監(jiān)控線程通過監(jiān)控配置文件獲取相應(yīng)的監(jiān)控周期、報(bào)警閥值及報(bào)警確認(rèn)策略,當(dāng)發(fā)生報(bào)警后將相關(guān)的報(bào)警信息及報(bào)警記錄發(fā)送給監(jiān)控平臺(tái)服務(wù)器。
硬件監(jiān)控組件實(shí)現(xiàn)監(jiān)控的流程如圖3所示。
圖3 硬件監(jiān)控組件監(jiān)控流程圖
3.2 多數(shù)據(jù)源的軟件監(jiān)控實(shí)現(xiàn)
軟件監(jiān)控主要是監(jiān)控動(dòng)車組管理信息系統(tǒng)傳輸狀態(tài)、系統(tǒng)運(yùn)行狀態(tài)、數(shù)據(jù)庫運(yùn)行狀態(tài)及調(diào)報(bào)信息上報(bào)狀態(tài),通過開發(fā)軟件監(jiān)控組件實(shí)現(xiàn)。軟件監(jiān)控的內(nèi)容多數(shù)存儲(chǔ)在Oracle數(shù)據(jù)庫中,所以軟件監(jiān)控組件通過Oracle存儲(chǔ)過程實(shí)現(xiàn)。部分監(jiān)控項(xiàng)統(tǒng)計(jì)表如表2所示。
表2 軟件監(jiān)控項(xiàng)統(tǒng)計(jì)表
動(dòng)車組管理信息系統(tǒng)監(jiān)控平臺(tái)的研發(fā)及應(yīng)用顯著提高了動(dòng)車組管理信息系統(tǒng)的維護(hù)工作,減少了各類信息查詢及信息錄入的時(shí)間,在不增加維護(hù)人員的前提下提高了維護(hù)工作效率;實(shí)現(xiàn)了動(dòng)車組管理信息系統(tǒng)軟硬件的自動(dòng)監(jiān)控報(bào)警,有效地減少了維護(hù)工作量,降低了硬件故障對(duì)信息系統(tǒng)運(yùn)行的影響;通過監(jiān)控平臺(tái)的使用還發(fā)現(xiàn)了信息系統(tǒng)中不易被察覺的缺陷,促進(jìn)了信息系統(tǒng)的進(jìn)一步完善和改進(jìn),提升了信息系統(tǒng)的穩(wěn)定性。
[1] 鐵道部運(yùn)輸局.動(dòng)車組管理信息系統(tǒng)總體方案[R].北京:鐵道部運(yùn)輸局,2009.
[2] 鄭紅強(qiáng),王春露.基于B/S架構(gòu)的智能交通信息系統(tǒng)監(jiān)控平臺(tái)的設(shè)計(jì)[J].電子設(shè)計(jì)工程,2010,18(4):44-47.
[3] 史天運(yùn).動(dòng)車組管理信息系統(tǒng)及其關(guān)鍵技術(shù)[C].第七屆中國(guó)智能交通年會(huì)論文集,北京:電子工業(yè)出版社,2012.
責(zé)任編輯 陳 蓉
Monitor Platform of China Electric Multiple Units Management Information System
LI Fan, CAO Weitao
( Institute of Computing Technologies, China Academy of Railway Sciences, Beijing 100081, China )
With the wide application of China Electric Multiple Units Management Information System (EMUs-MIS), the degree of difficulty for system maintenance was significantly increased, how to boost productivity of the maintenance work with maintenance tool became a most important thing. This paper designed Monitor Platform of EMUs-MIS, implemented automatic monitoring for the operating state of EMUs-MIS’s hardware and software, alarmed and displayed the key monitored object, implemented the unified management for standing book of EMUs-MIS’s hardware and software as well as site information, which promoted the maintenance work eff i ciency of EMUs-MIS.
Electric Multiple Units(EMUs); Monitor Platform; monitor component
U279.2∶TP39
A
1005-8451(2014)10-0016-04
2014-04-16
李 樊,副研究員;曹偉濤,助理研究員。