李 燕
【摘要】通過(guò)對(duì)朗訊C網(wǎng)基站現(xiàn)有告警監(jiān)控系統(tǒng)不足之處的分析,文章開(kāi)發(fā)了一種能夠自動(dòng)識(shí)別朗訊基站新告警的系統(tǒng),介紹了其功能、告警監(jiān)控流程與界面所包含的信息。該系統(tǒng)能幫助維護(hù)人員及時(shí)有效地發(fā)現(xiàn)基站各類(lèi)故障,在實(shí)際應(yīng)用中取得了良好的效果。
【關(guān)鍵詞】CDMA 朗訊基站 告警 實(shí)時(shí)監(jiān)控
1 引言
當(dāng)前運(yùn)營(yíng)商越來(lái)越重視用戶(hù)對(duì)網(wǎng)絡(luò)質(zhì)量的感受,要求維護(hù)部門(mén)加強(qiáng)對(duì)設(shè)備運(yùn)行情況的監(jiān)視和管理。除了做好網(wǎng)絡(luò)優(yōu)化和避免故障出現(xiàn)之外,運(yùn)維部門(mén)對(duì)網(wǎng)絡(luò)設(shè)備的支撐還主要體現(xiàn)在故障出現(xiàn)后能夠迅速發(fā)現(xiàn)并排除故障。
在溫州CDMA網(wǎng)絡(luò)中,大量采用了朗訊的基站設(shè)備。在基站故障中,除了斷站故障外,一些板件故障也是非常重要的。這些板件故障雖未引起斷站,但對(duì)用戶(hù)的影響已相當(dāng)于斷站,如TFU(Time Frequency Unit,時(shí)間頻率單元)故障、單CCU(CDMA Channel Units,碼分多址信道單元)故障、CRC(CDMA Radio Controller,碼分多址無(wú)線(xiàn)控制板)故障等。從維護(hù)的角度來(lái)看,若不能夠及時(shí)發(fā)現(xiàn)這些故障,就無(wú)法保證搶修及時(shí),從而造成通信故障。
考慮到價(jià)格和成本控制等多重因素,溫州CDMA運(yùn)營(yíng)商并未向朗訊購(gòu)買(mǎi)專(zhuān)用告警平臺(tái)。而通過(guò)現(xiàn)有的告警平臺(tái),監(jiān)控人員及時(shí)發(fā)現(xiàn)新告警存在一定的困難,必須通過(guò)大量的操作、記錄、對(duì)比才能夠確定是否有新告警產(chǎn)生。為提高監(jiān)控人員的工作效率,本文研究并開(kāi)發(fā)了一種能夠自動(dòng)識(shí)別朗訊基站新告警的系統(tǒng)。
2 朗訊C網(wǎng)基站告警監(jiān)控系統(tǒng)現(xiàn)狀
現(xiàn)行免費(fèi)基站網(wǎng)管告警界面的操作相對(duì)比較復(fù)雜。查詢(xún)基站故障的途徑有在ECP(Executive Cellular Processor,執(zhí)行蜂窩處理器)圖形界面查詢(xún)、在ECP指令界面下執(zhí)行“OP:ALARM”指令兩種方式,但對(duì)于維護(hù)人員來(lái)說(shuō)這兩種方式都存在著很大的不足。
2.1 ECP圖形界面查詢(xún)
基站告警圖形界面如圖1所示,當(dāng)基站出現(xiàn)故障時(shí),此基站標(biāo)紅。但若故障基站在此之前已有故障,則不會(huì)改變基站在界面上的狀態(tài),導(dǎo)致新故障被老故障覆蓋的情況[1]。即這種方式雖然給出了基站故障,但無(wú)法直觀(guān)地發(fā)現(xiàn)多重故障,也無(wú)法知曉相應(yīng)的故障告警的時(shí)間,更無(wú)法添加告警處理說(shuō)明,因而不便于故障的處理和跟蹤。
此外,查詢(xún)一個(gè)基站的故障,需要分別執(zhí)行2131、2136、2138、2139等操作指令,才能避免漏掉這個(gè)基站內(nèi)的告警。若這個(gè)基站有2個(gè)載波,還需要另外多執(zhí)行2條指令??梢?jiàn)操作上是比較繁瑣的。
2.2 在ECP指令界面下執(zhí)行“OP:ALARM”指令
與使用圖形界面查詢(xún)相比,這種方式的優(yōu)點(diǎn)是新告警不會(huì)被覆蓋,能列出故障基站內(nèi)的所有故障。但是此方式同樣存在故障告警無(wú)時(shí)間、無(wú)法對(duì)告警進(jìn)行確認(rèn)、無(wú)法添加處理標(biāo)注等問(wèn)題。
指令執(zhí)行后的顯示見(jiàn)圖2:
現(xiàn)有的這兩種告警監(jiān)控方法,都存在較難及時(shí)有效地發(fā)現(xiàn)故障、需要花費(fèi)網(wǎng)管人員大量的時(shí)間和精力、容易遺漏告警等問(wèn)題。對(duì)此,本文自主開(kāi)發(fā)了一個(gè)朗訊基站告警監(jiān)控系統(tǒng),以及時(shí)有效地對(duì)朗訊基站進(jìn)行監(jiān)控。
3 朗訊C網(wǎng)基站告警監(jiān)控系統(tǒng)功能及設(shè)計(jì)
3.1 朗訊C網(wǎng)基站告警監(jiān)控系統(tǒng)的功能要求
新開(kāi)發(fā)的朗訊基站的告警系統(tǒng)應(yīng)具有以下功能:
(1)及時(shí)自動(dòng)地獲取系統(tǒng)告警信息并分析
告警平臺(tái)能夠?qū)崟r(shí)、自動(dòng)地連接C網(wǎng)1、2局OMP(Operation and Maintenance Platform,運(yùn)行維護(hù)平臺(tái))獲取系統(tǒng)的告警報(bào)告,并對(duì)報(bào)告進(jìn)行分析,提取新告警。
(2)顯示告警內(nèi)容、告警產(chǎn)生時(shí)間、告警恢復(fù)時(shí)間、告警說(shuō)明
告警說(shuō)明相當(dāng)于告警案例庫(kù),對(duì)相應(yīng)的告警自動(dòng)給與處理意見(jiàn)。因告警內(nèi)容與平時(shí)的界面告警存在較大的差別,使用之初比較不適應(yīng),有了告警說(shuō)明就能迅速地做出準(zhǔn)確的判斷;同時(shí)告警說(shuō)明也可幫助沒(méi)有經(jīng)驗(yàn)的網(wǎng)管人員提高處理能力。
(3)對(duì)告警增加、修改備注
網(wǎng)管人員通過(guò)系統(tǒng)發(fā)現(xiàn)告警后,判斷告警并派單。為了避免漏派或重派,在對(duì)應(yīng)告警信息后要增加處理的備注。
(4)出現(xiàn)新告警,系統(tǒng)發(fā)聲提醒
告警的聲音提示,在網(wǎng)管人員繁雜的工作中尤為必要。
3.2 朗訊C網(wǎng)基站告警日志的確定
朗訊OMP系統(tǒng)內(nèi)現(xiàn)有告警日志的信息量過(guò)大,其中不僅有告警信息,還包括話(huà)務(wù)、網(wǎng)優(yōu)等信息,同時(shí)還有事先統(tǒng)計(jì)的所有必要的告警信息。如將此日志作為實(shí)時(shí)告警分析源,則很可能漏掉罕見(jiàn)的基站告警,而每次的大分析量也給系統(tǒng)分析增加了難度。
通過(guò)ECP指令界面下“OP:ALARM”指令可查詢(xún)系統(tǒng)當(dāng)前的基站故障,但此指令顯示的告警沒(méi)有告警產(chǎn)生時(shí)間,外系統(tǒng)自動(dòng)登陸執(zhí)行此命令并收集執(zhí)行報(bào)告的難度也較大。
最方便的方法是在朗訊系統(tǒng)內(nèi)設(shè)置指令,每1分鐘自動(dòng)執(zhí)行一次“OP:ALARM”并接收?qǐng)?bào)告到指定目錄下的指定文件中。即首先用ROOT用戶(hù)名在交換機(jī)的OMP中創(chuàng)建一個(gè)腳本,用來(lái)自動(dòng)執(zhí)行“OP:ALARM”指令,并接收指令執(zhí)行后的內(nèi)容到特定文件,再將指令執(zhí)行的時(shí)間間隔設(shè)置為1分鐘。于是這個(gè)接收了指令執(zhí)行內(nèi)容的文件就是我們所需要的告警日志,監(jiān)控程序只需要每分鐘登錄交換機(jī)的OMP服務(wù)器來(lái)取日志文件分析即可。
4 朗訊基站告警監(jiān)控系統(tǒng)的實(shí)現(xiàn)
本文采用面向?qū)ο蟮某绦蛟O(shè)計(jì)方法,開(kāi)發(fā)和實(shí)現(xiàn)了基站實(shí)時(shí)告警系統(tǒng)[2~4]。
4.1 告警監(jiān)控流程
(1)告警報(bào)告的產(chǎn)生
告警報(bào)告存在于朗訊專(zhuān)業(yè)的OMP服務(wù)器上,告警程序安裝在同局域網(wǎng)的普通計(jì)算機(jī)上,因此需要通過(guò)FTP方式到OMP服務(wù)器上取文件。告警的實(shí)時(shí)性要求是很強(qiáng)的,需要實(shí)現(xiàn)自動(dòng)定時(shí)取報(bào)告。取報(bào)告的間隔是1分鐘,由定時(shí)器來(lái)控制。同時(shí)要將取到的告警報(bào)告格式化并轉(zhuǎn)化為普通的txt格式,以方便分析。
通過(guò)設(shè)定,朗訊OMP服務(wù)器上每日產(chǎn)生一個(gè)新的告警日志文件,并以日期為告警日志文件名,朗訊交換機(jī)每分鐘將當(dāng)前的基站告警信息發(fā)送到這個(gè)告警日志上。告警日志中只顯示了當(dāng)前系統(tǒng)中存在的所有基站告警,而沒(méi)有告警產(chǎn)生的時(shí)間,因此就需要程序進(jìn)行告警日志與數(shù)據(jù)庫(kù)的對(duì)比來(lái)確認(rèn)新告警。程序?qū)敫婢罩緦⒅鏋榕R時(shí)告警記錄表。導(dǎo)入分兩種,即當(dāng)日告警日志的第一次導(dǎo)入和再次導(dǎo)入。若是再次導(dǎo)入,只需要從上次導(dǎo)入的結(jié)束位置開(kāi)始,即可避免進(jìn)行過(guò)多的重復(fù)性工作。
因?yàn)楦婢罩局胁淮嬖诟婢a(chǎn)生時(shí)間,也沒(méi)有告警恢復(fù)記錄,所以需要讀取并分析臨時(shí)告警記錄表的內(nèi)容,把新舊告警進(jìn)行對(duì)比。
(2)對(duì)不同告警的處理
告警包括3種:已恢復(fù)的消失告警,新產(chǎn)生的告警,產(chǎn)生一段時(shí)間而未恢復(fù)的舊告警。
臨時(shí)告警記錄表中的告警只有新產(chǎn)生的告警和已存在的舊告警。通過(guò)對(duì)臨時(shí)告警記錄表與告警信息表的對(duì)比,來(lái)確認(rèn)消失告警、新告警、舊告警。即臨時(shí)告警記錄表沒(méi)有而告警信息表有的告警為已經(jīng)恢復(fù)的消失告警,臨時(shí)告警記錄表有而告警信息表沒(méi)有的告警為新告警,臨時(shí)告警記錄表和告警信息表中都有的告警為舊告警。
需要對(duì)判斷出來(lái)的3種告警進(jìn)行不同的處理:已恢復(fù)的消失告警從告警數(shù)據(jù)庫(kù)中刪除并存入歷史告警信息表;新告警插入告警數(shù)據(jù)庫(kù)中,同時(shí)添加相應(yīng)的告警說(shuō)明及基站相關(guān)信息,并調(diào)用媒體播放程序播放指定聲音文件對(duì)工作人員進(jìn)行提示;舊告警在告警數(shù)據(jù)庫(kù)中已存在,無(wú)需處理。
(3)流程圖
程序流程框圖如圖3所示:
4.2 朗訊基站告警系統(tǒng)
(1)朗訊基站告警監(jiān)控系統(tǒng)主界面
開(kāi)發(fā)完成的朗訊基站告警管理平臺(tái)界面如圖4所示:
此程序界面包含基站編號(hào)、基站名稱(chēng)、告警信息、告警說(shuō)明、告警產(chǎn)生時(shí)間、告警處理說(shuō)明等內(nèi)容,網(wǎng)管人員可方便地查詢(xún)到基站當(dāng)前告警。每條告警都有告警產(chǎn)生時(shí)間,便于關(guān)注最新告警及對(duì)舊告警的跟蹤處理。通過(guò)修改備注,可以對(duì)告警的處理進(jìn)度進(jìn)行標(biāo)注,便于不同班次的網(wǎng)管人員維護(hù)交接。
(2)恢復(fù)告警查詢(xún)界面
已恢復(fù)故障的查詢(xún)界面如圖5所示,通過(guò)基站名稱(chēng)、時(shí)間可方便地查詢(xún)已恢復(fù)的歷史告警。已恢復(fù)的告警可保留一個(gè)月。
5 結(jié)束語(yǔ)
本文基于朗訊C網(wǎng)的基站,開(kāi)發(fā)了便于操作和使用的告警監(jiān)控系統(tǒng)。一旦基站出現(xiàn)故障和告警,本系統(tǒng)可立即給出相應(yīng)的告警信息,便于對(duì)設(shè)備的及時(shí)維護(hù)和搶修;同時(shí),一目了然的告警說(shuō)明、告警處理情況等信息,方便了維護(hù)人員的搶修和投訴反饋。
經(jīng)過(guò)試用,該系統(tǒng)受到了幾乎所有監(jiān)控人員的歡迎。它不僅提高了監(jiān)控人員的工作效率,縮短了C網(wǎng)基站故障持續(xù)時(shí)間;通過(guò)及時(shí)發(fā)現(xiàn)處理小告警,更是降低了大告警的發(fā)生概率,提高了用戶(hù)的網(wǎng)絡(luò)滿(mǎn)意度。
參考文獻(xiàn)
[1]Lucent Technologies. Lucent Technologies OMP-FX System Operations Administration and Maintenance.Student Guide[M]. 2000.
[2]Peter Dyson, Stan Kelly Bootle, John Heilborn. UNIX大全[M]. 北京: 電子工業(yè)出版社, 2000.
[3]馬軍. 精通ASP.NET2.0網(wǎng)絡(luò)應(yīng)用系統(tǒng)開(kāi)發(fā)[M]. 北京: 人民郵電出版社, 2006.
[4]Greg Buczek. MCSD.MCT.ASP應(yīng)用開(kāi)發(fā)指南[M]. 北京: 科學(xué)出版社, 2000.