冶文慶 魏翠萍 何鵬
青藏線GSM-R網(wǎng)絡(luò)承載著ITCS列控業(yè)務(wù),會(huì)受到無(wú)線電磁環(huán)境、設(shè)備故障等多方面的影響,導(dǎo)致承載業(yè)務(wù)不定期出現(xiàn)通信故障,從而直接影響正常行車(chē)的安全秩序。目前維護(hù)人員主要通過(guò)每日接口監(jiān)測(cè)數(shù)據(jù)查看、GSM-R網(wǎng)管系統(tǒng)故障分析和通信超時(shí)故障分析等方式來(lái)判斷GSM-R網(wǎng)絡(luò)故障或無(wú)線電磁環(huán)境干擾等,通過(guò)設(shè)備維護(hù)、網(wǎng)絡(luò)優(yōu)化調(diào)整、外網(wǎng)干擾清除等手段進(jìn)行整治處理,避免后續(xù)ITCS通信故障的發(fā)生。但由于青藏線ITCS通信故障分析研判過(guò)程中涉及的GSM-R網(wǎng)管系統(tǒng)、接口監(jiān)測(cè)系統(tǒng)和ITCS地面系統(tǒng)運(yùn)行相對(duì)獨(dú)立,因此需要人工從各個(gè)獨(dú)立系統(tǒng)提取數(shù)據(jù)后逐一分析、綜合研判,導(dǎo)致人工分析數(shù)據(jù)工作量大、故障原因判斷不及時(shí)、后續(xù)整治處理遲滯等問(wèn)題,越來(lái)越難以適應(yīng)鐵路信息化發(fā)展的需求。為此,本文引入智能分析方法,設(shè)計(jì)并實(shí)現(xiàn)了ITCS系統(tǒng)車(chē)地通信故障智能分析系統(tǒng),旨在對(duì)各系統(tǒng)數(shù)據(jù)進(jìn)行整合并深入挖掘,對(duì)通信故障原因進(jìn)行分析,對(duì)各網(wǎng)元的運(yùn)行狀態(tài)進(jìn)行統(tǒng)計(jì)及預(yù)判,并及時(shí)給出建議,從而提高通信故障處理效率,加強(qiáng)ITCS通信系統(tǒng)的運(yùn)用質(zhì)量。
智能分析方法遵從智能化處理的軟件設(shè)計(jì)理念,綜合利用監(jiān)測(cè)、通信、存儲(chǔ)、計(jì)算等技術(shù)構(gòu)建信息系統(tǒng),通過(guò)信息系統(tǒng)實(shí)現(xiàn)一系列的通信故障分析處理工作,替代大量的人工重復(fù)勞動(dòng),提高工作質(zhì)量和效率。進(jìn)行智能分析,首先需要的是原始數(shù)據(jù),一般用于故障分析的數(shù)據(jù)包括接口監(jiān)測(cè)數(shù)據(jù)、車(chē)載日志和ITCS數(shù)據(jù)。目前不同鐵路系統(tǒng)提供的數(shù)據(jù)分散,利用通信技術(shù)手段可將數(shù)據(jù)自動(dòng)匯集到同一個(gè)數(shù)據(jù)處理中心,減少中間環(huán)節(jié);同時(shí),可根據(jù)大量的實(shí)踐經(jīng)驗(yàn)構(gòu)建分析算法和案例庫(kù),直接提取原始數(shù)據(jù)進(jìn)行分析,不僅能夠準(zhǔn)確地分析通信故障原因,而且能夠?qū)νㄐ畔到y(tǒng)的運(yùn)行狀態(tài)進(jìn)行統(tǒng)計(jì)分析,提供趨勢(shì)性預(yù)測(cè)和處理建議,指導(dǎo)維護(hù)人員的下一步工作。
青藏線GSM-R系統(tǒng)原有接口監(jiān)測(cè)系統(tǒng)投入使用較早,存在系統(tǒng)架構(gòu)落后、功能不完善、無(wú)法實(shí)現(xiàn)綜合智能分析、操作體驗(yàn)差等不足,導(dǎo)致維護(hù)人員日常數(shù)據(jù)統(tǒng)計(jì)分析工作量大,容易人為忽略關(guān)鍵故障信息等。為了更好地將智能分析處理技術(shù)應(yīng)用在ITCS通信故障分析處理中,通過(guò)現(xiàn)場(chǎng)深入調(diào)研,總結(jié)相關(guān)需求如下。
1)智能分析系統(tǒng)應(yīng)整體提供良好的用戶(hù)體驗(yàn),杜絕卡頓、閃退等軟件bug。
2)應(yīng)優(yōu)化數(shù)據(jù)庫(kù)結(jié)構(gòu),大幅提升數(shù)據(jù)查詢(xún)速度。
3)實(shí)時(shí)監(jiān)控網(wǎng)絡(luò)連接和服務(wù)器性能,優(yōu)化告警處理,對(duì)系統(tǒng)維護(hù)提出針對(duì)性建議。
4)智能分析系統(tǒng)應(yīng)最大限度地實(shí)現(xiàn)自動(dòng)化、智能化,基于大數(shù)據(jù)實(shí)現(xiàn)相關(guān)網(wǎng)元運(yùn)行情況的趨勢(shì)預(yù)判功能。
5)增加對(duì)GSM-R網(wǎng)絡(luò)的無(wú)線干擾監(jiān)測(cè),能夠?qū)崟r(shí)監(jiān)測(cè)關(guān)鍵站點(diǎn)的電磁環(huán)境變化,為智能分析系統(tǒng)提供干擾監(jiān)測(cè)數(shù)據(jù),更準(zhǔn)確地定位通信故障原因。
ITCS車(chē)地通信故障智能分析系統(tǒng)(以下簡(jiǎn)稱(chēng)智能分析系統(tǒng))是各類(lèi)通信及監(jiān)測(cè)數(shù)據(jù)的分析處理中心,通過(guò)該系統(tǒng)能夠從大量的數(shù)據(jù)中發(fā)掘有價(jià)值的信息,并進(jìn)行分析統(tǒng)計(jì)后呈現(xiàn)給用戶(hù);能夠掌握ITCS系統(tǒng)的整體運(yùn)行狀態(tài),對(duì)通信異常情況進(jìn)行報(bào)警,自動(dòng)分析通信故障并生成分析報(bào)告。智能分析系統(tǒng)由數(shù)據(jù)傳輸網(wǎng)絡(luò)、分析處理中心和智能應(yīng)用終端組成。智能分析系統(tǒng)硬件結(jié)構(gòu)見(jiàn)圖1。
3.1.1 數(shù)據(jù)傳輸網(wǎng)絡(luò)
智能分析系統(tǒng)通過(guò)專(zhuān)屬的數(shù)據(jù)傳輸網(wǎng)絡(luò)與其他能夠提供原始分析數(shù)據(jù)的系統(tǒng)互聯(lián),將車(chē)載日志、監(jiān)測(cè)數(shù)據(jù)、ITCS數(shù)據(jù)等通過(guò)有線或者無(wú)線的方式傳輸至分析處理中心進(jìn)行存儲(chǔ)。
1)有線接入功能。數(shù)據(jù)傳輸網(wǎng)絡(luò)通過(guò)接入交換機(jī)實(shí)現(xiàn)有線接入功能,接入交換機(jī)可安裝各類(lèi)接口模塊,亦可配合使用光電轉(zhuǎn)換模塊、2M模塊、協(xié)議轉(zhuǎn)換器等,支持以太網(wǎng)接口、2M接口和光纖接口的接入,以滿(mǎn)足與各類(lèi)鐵路應(yīng)用系統(tǒng)的互聯(lián)。
圖1 智能分析系統(tǒng)硬件結(jié)構(gòu)
2)無(wú)線接入功能。數(shù)據(jù)傳輸網(wǎng)絡(luò)通過(guò)2種方式實(shí)現(xiàn)無(wú)線接入:一是將有線網(wǎng)絡(luò)通過(guò)鐵路數(shù)據(jù)網(wǎng)延伸至有無(wú)線接入需求的站段,在站段范圍內(nèi)使用無(wú)線AP建立無(wú)線局域網(wǎng),車(chē)載設(shè)備可接入無(wú)線局域網(wǎng)上傳數(shù)據(jù);二是使用公眾移動(dòng)網(wǎng)連接,在接入公網(wǎng)的兩端設(shè)備之間建立專(zhuān)用的VPN通道進(jìn)行通信。
3.1.2 分析處理中心
分析處理中心作為智能分析平臺(tái),對(duì)各類(lèi)數(shù)據(jù)進(jìn)行集中存儲(chǔ)管理,通過(guò)數(shù)據(jù)挖掘、智能分析、綜合統(tǒng)計(jì)等數(shù)據(jù)處理方法獲取有價(jià)值的信息,主要有以下3項(xiàng)功能。
1)數(shù)據(jù)存儲(chǔ)。采用分布式存儲(chǔ)方式建立數(shù)據(jù)倉(cāng)庫(kù),進(jìn)行數(shù)據(jù)的統(tǒng)一存儲(chǔ)管理,有較強(qiáng)的安全性。存儲(chǔ)的數(shù)據(jù)包括原始數(shù)據(jù)、案例庫(kù)、智能分析數(shù)據(jù)、統(tǒng)計(jì)預(yù)測(cè)數(shù)據(jù)和基礎(chǔ)維護(hù)數(shù)據(jù)等。數(shù)據(jù)倉(cāng)庫(kù)對(duì)不同的用戶(hù)進(jìn)行數(shù)據(jù)操作權(quán)限管理,防止非法用戶(hù)任意修改數(shù)據(jù)。
2)預(yù)測(cè)統(tǒng)計(jì)。智能分析平臺(tái)利用大數(shù)據(jù)深度挖掘技術(shù),對(duì)MT模塊和GSM-R網(wǎng)小區(qū)的無(wú)線性能進(jìn)行分析和預(yù)測(cè),自動(dòng)篩選性能呈現(xiàn)惡化趨勢(shì)的MT模塊和GSM-R網(wǎng)小區(qū),給出相關(guān)的處理意見(jiàn),實(shí)現(xiàn)網(wǎng)絡(luò)狀態(tài)的趨勢(shì)預(yù)測(cè)與預(yù)警。同時(shí)根據(jù)路局要求格式,智能分析系統(tǒng)自動(dòng)統(tǒng)計(jì)和生成月、季度、年報(bào)表,對(duì)GSM-R網(wǎng)絡(luò)運(yùn)行情況進(jìn)行綜合分析。
3)智能分析。實(shí)時(shí)對(duì)數(shù)據(jù)進(jìn)行監(jiān)測(cè)分析,根據(jù)通信故障特征進(jìn)行比選,遇到通信異常后自動(dòng)告警提示,對(duì)故障時(shí)間段采集數(shù)據(jù)進(jìn)行處理,自動(dòng)分析故障原因,輸出分析報(bào)告,補(bǔ)充和完善案例庫(kù)。
3.1.3 智能應(yīng)用終端
智能應(yīng)用終端通過(guò)網(wǎng)頁(yè)登錄系統(tǒng)界面,將處理結(jié)果展示給用戶(hù),由管理人員對(duì)系統(tǒng)進(jìn)行維護(hù)管理,主要實(shí)現(xiàn)以下功能。
1)結(jié)果展示。登錄系統(tǒng)后的人機(jī)界面全面、清晰地將分析處理結(jié)果展示給用戶(hù),有較好的用戶(hù)體驗(yàn)。預(yù)測(cè)統(tǒng)計(jì)數(shù)據(jù)能夠按時(shí)間、位置、網(wǎng)元等條件查詢(xún),并以圖表形式直觀顯示;統(tǒng)計(jì)數(shù)據(jù)從不同維度進(jìn)行對(duì)比,為用戶(hù)掌握通信系統(tǒng)運(yùn)行情況提供準(zhǔn)確指導(dǎo);系統(tǒng)能自動(dòng)檢測(cè)通信故障并生成分析報(bào)告,可供用戶(hù)查詢(xún)導(dǎo)出,對(duì)通信故障進(jìn)行統(tǒng)計(jì)分析,將故障的趨勢(shì)預(yù)測(cè)展示給用戶(hù)。
2)異常告警。系統(tǒng)發(fā)現(xiàn)異常上報(bào)告警,終端以聲音和文字的形式發(fā)出提示,并對(duì)告警處理情況進(jìn)行記錄;歷史告警可以按時(shí)間、類(lèi)型等條件查詢(xún)。
3)維護(hù)管理。維護(hù)管理功能包括用戶(hù)權(quán)限管理、系統(tǒng)狀態(tài)監(jiān)控、配置數(shù)據(jù)管理等,根據(jù)使用環(huán)境的變化不斷地對(duì)系統(tǒng)進(jìn)行維護(hù),保證系統(tǒng)的安全性和可用性。
智能分析系統(tǒng)建立在分布式集群平臺(tái)上,集群平臺(tái)利用分布式處理技術(shù)將多臺(tái)硬件設(shè)備提供的數(shù)據(jù)存儲(chǔ)、計(jì)算處理等資源整合為一體,具有較強(qiáng)的數(shù)據(jù)處理能力。通過(guò)數(shù)據(jù)傳輸技術(shù)將車(chē)載日志、監(jiān)測(cè)數(shù)據(jù)、ITCS數(shù)據(jù)匯集到智能分析系統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù),并按統(tǒng)一的格式進(jìn)行存儲(chǔ)管理;將典型的故障處理案例存入系統(tǒng)案例庫(kù),按故障類(lèi)型設(shè)置特征參數(shù),便于進(jìn)行智能比對(duì)分析;對(duì)故障分析方法進(jìn)行數(shù)學(xué)建模,轉(zhuǎn)化為智能分析算法,能夠從數(shù)據(jù)倉(cāng)庫(kù)提取數(shù)據(jù)進(jìn)行篩選和挖掘,進(jìn)一步比對(duì)故障案例庫(kù),準(zhǔn)確分析故障原因;最后將分析結(jié)果自動(dòng)生成分析報(bào)告。系統(tǒng)軟件按照分層化、模塊化的方法設(shè)計(jì),分為基礎(chǔ)層、中間件層和智能應(yīng)用層。智能分析系統(tǒng)軟件架構(gòu)見(jiàn)圖2。
圖2 智能分析系統(tǒng)軟件架構(gòu)
基礎(chǔ)層在硬件平臺(tái)上安裝操作系統(tǒng)及數(shù)據(jù)庫(kù)軟件,構(gòu)建上層軟件的開(kāi)發(fā)環(huán)境,對(duì)數(shù)據(jù)進(jìn)行收集管理,保證數(shù)據(jù)的快速處理和長(zhǎng)期存儲(chǔ);中間件層對(duì)數(shù)據(jù)進(jìn)行挖掘分析、綜合統(tǒng)計(jì),自動(dòng)發(fā)現(xiàn)通信異常情況發(fā)出告警,利用智能分析算法進(jìn)行故障分析,調(diào)閱案例庫(kù)進(jìn)行比對(duì),得出準(zhǔn)確的分析結(jié)果;智能應(yīng)用層主要提供人機(jī)交互接口,將各種智能分析結(jié)果展現(xiàn)出來(lái),并能進(jìn)行原始數(shù)據(jù)導(dǎo)入、案例庫(kù)更新、基礎(chǔ)數(shù)據(jù)管理等操作。
由于無(wú)線環(huán)境具有開(kāi)放性,容易受到干擾信號(hào)的影響,導(dǎo)致通信質(zhì)量惡化、數(shù)據(jù)丟失率增加,此類(lèi)原因引起的通信故障頻繁發(fā)生。無(wú)線干擾監(jiān)測(cè)系統(tǒng)不僅可以加強(qiáng)對(duì)鐵路沿線電磁環(huán)境的管理,還可為通信故障分析提供重要的原始數(shù)據(jù)。無(wú)線干擾監(jiān)測(cè)系統(tǒng)由天線陣、監(jiān)測(cè)站、數(shù)據(jù)中心組成。天線陣具備寬帶信號(hào)接收、無(wú)線信號(hào)測(cè)向等功能,安裝在基站鐵塔二層平臺(tái)上,接收各個(gè)方向的信號(hào);監(jiān)測(cè)站對(duì)無(wú)線信號(hào)進(jìn)行分析處理,進(jìn)行干擾信號(hào)的識(shí)別和判決,并記錄干擾信號(hào)信息,作為進(jìn)一步整治的依據(jù);數(shù)據(jù)中心接收來(lái)自各個(gè)監(jiān)測(cè)站的數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)綜合分析、多點(diǎn)監(jiān)測(cè)交叉定位等功能。
無(wú)線干擾監(jiān)測(cè)系統(tǒng)主要實(shí)現(xiàn)以下功能:①實(shí)時(shí)監(jiān)測(cè)GSM-R無(wú)線信道質(zhì)量,解析GSM-R服務(wù)小區(qū)及周邊小區(qū)參數(shù);②掃描周邊的中國(guó)移動(dòng)、聯(lián)通GSM900頻段無(wú)線網(wǎng)絡(luò)環(huán)境,測(cè)量公網(wǎng)信號(hào)參數(shù)、分析造成的干擾;③進(jìn)行頻譜分析,發(fā)現(xiàn)GSM-R頻段帶內(nèi)干擾及帶外潛在干擾;④識(shí)別干擾類(lèi)型,記錄干擾信號(hào)I/Q數(shù)據(jù);⑤發(fā)現(xiàn)干擾信號(hào)或者電磁環(huán)境異常時(shí)發(fā)出告警。
無(wú)線干擾監(jiān)測(cè)系統(tǒng)結(jié)構(gòu)見(jiàn)圖3。
智能分析系統(tǒng)在處理軟件的支持下,將原始數(shù)據(jù)輸入內(nèi)存處理后存入數(shù)據(jù)倉(cāng)庫(kù)。為了保證對(duì)數(shù)據(jù)的快速處理,提升系統(tǒng)性能,采用多種數(shù)據(jù)處理技術(shù)對(duì)不同類(lèi)型的數(shù)據(jù)進(jìn)行處理存儲(chǔ),包括內(nèi)存數(shù)據(jù)處理、基礎(chǔ)數(shù)據(jù)管理和存儲(chǔ)數(shù)據(jù)庫(kù)。數(shù)據(jù)處理流程見(jiàn)圖4。
內(nèi)存數(shù)據(jù)處理:智能分析系統(tǒng)需要對(duì)大量數(shù)據(jù)進(jìn)行查詢(xún)、轉(zhuǎn)換和關(guān)聯(lián)等操作,特別是在一些對(duì)多并發(fā)、實(shí)時(shí)性要求較高的應(yīng)用中,這些需求尤為常見(jiàn)。例如,網(wǎng)絡(luò)集中告警系統(tǒng)中的告警提示和展現(xiàn)功能,可充分采用內(nèi)存隊(duì)列,減少與普通數(shù)據(jù)庫(kù)的I/O操作頻率,極大地提高了系統(tǒng)性能。
圖3 無(wú)線干擾監(jiān)測(cè)系統(tǒng)結(jié)構(gòu)
圖4 數(shù)據(jù)處理流程
基礎(chǔ)數(shù)據(jù)管理:基礎(chǔ)數(shù)據(jù)是圖形化顯示的根基,也是智能分析的關(guān)鍵參考信息,靈活方便的基礎(chǔ)數(shù)據(jù)管理,有利于轄區(qū)內(nèi)網(wǎng)絡(luò)環(huán)境的展現(xiàn),并能有效地提高故障分析的準(zhǔn)確性。
存儲(chǔ)數(shù)據(jù)庫(kù):存儲(chǔ)數(shù)據(jù)庫(kù)是保存大量原始數(shù)據(jù)和分析處理數(shù)據(jù)的倉(cāng)庫(kù),能夠按照特定數(shù)據(jù)結(jié)構(gòu)對(duì)數(shù)據(jù)進(jìn)行有序的組織和管理。有效的數(shù)據(jù)模型建模有利于大量數(shù)據(jù)的提取、對(duì)比和分析,實(shí)現(xiàn)高效的數(shù)據(jù)維護(hù)和功能模塊體驗(yàn),加快數(shù)據(jù)處理速度,提高系統(tǒng)的整體性能。
青藏線自開(kāi)通已運(yùn)營(yíng)多年,其運(yùn)維模式及系統(tǒng)應(yīng)隨著相關(guān)技術(shù)更新而進(jìn)行升級(jí),日益向自動(dòng)化、智能化發(fā)展,充分發(fā)揮大數(shù)據(jù)、智能化的技術(shù)優(yōu)勢(shì),形成高質(zhì)量的運(yùn)維模式,提升維護(hù)效率。ITCS系統(tǒng)車(chē)地通信故障智能分析系統(tǒng)將智能化處理技術(shù)應(yīng)用到故障分析中,能夠大幅提高通信系統(tǒng)的維護(hù)效率,全面提升GSM-R無(wú)線網(wǎng)絡(luò)運(yùn)用質(zhì)量,為進(jìn)一步降低ITCS通信故障率,保障正常行車(chē)安全秩序提供支撐。