梁亞雄 徐進(jìn)軍 張煜輝
摘要:對(duì)分散的多機(jī)型的交換機(jī)告警信息集中采集和處理功能進(jìn)行了研究,系統(tǒng)具有告警故障監(jiān)視、告警故障設(shè)置、告警信息統(tǒng)計(jì)和查詢等功能。可以縮短設(shè)備故障歷時(shí),也可以通過(guò)分析和預(yù)處理查找故障隱患,將故障消除在萌芽狀態(tài),從而有效地提高維護(hù)人員的工作效率和網(wǎng)絡(luò)的運(yùn)行質(zhì)量,為企業(yè)創(chuàng)造良好的經(jīng)濟(jì)效益和社會(huì)效益。
關(guān)鍵詞:網(wǎng)管系統(tǒng) 功能設(shè)計(jì) 數(shù)據(jù)拆包 故障采集和處理
近年來(lái),隨著電信網(wǎng)絡(luò)用戶的增加和新型交換設(shè)備的引入,建立功能齊全、使用方便的網(wǎng)絡(luò)管理系統(tǒng)對(duì)各種交換設(shè)備進(jìn)行集中管理和集中維護(hù),提高電信網(wǎng)絡(luò)的運(yùn)行質(zhì)量和效率十分必要。
1.交換機(jī)的傳統(tǒng)網(wǎng)管系統(tǒng)存在的問(wèn)題
目前,電信網(wǎng)中主要有AXE10, EWSD, NEAR-61, SIGMA, SESS和華為CC08等交換機(jī)機(jī)型[1]。由于交換機(jī)告警故障信息的原始報(bào)告類(lèi)型和定義復(fù)雜,不同交換機(jī)型的告警原始報(bào)告的格式和內(nèi)容差異較大,甚至是同一種交換機(jī)機(jī)型,不同軟件版本的告警原始報(bào)告也有差異,傳統(tǒng)網(wǎng)管系統(tǒng)[2-3]為了準(zhǔn)確分析和處理各種機(jī)型的告警原始報(bào)告,在網(wǎng)管接口機(jī)上開(kāi)發(fā)多個(gè)告警分析處理模塊,分別處理一種特定的交換機(jī)機(jī)型的告警原始報(bào)告。告警分析處理模塊的功能包括:實(shí)時(shí)接收告警原始報(bào)告;提取告警原始報(bào)告中的告警時(shí)間、告警交換局、告警關(guān)鍵字、告警內(nèi)容等信息;把處理后的告警信息保存在數(shù)據(jù)庫(kù);同時(shí)通過(guò)Socket連接發(fā)送到前臺(tái)工作站。這種方式使系統(tǒng)具有結(jié)構(gòu)清晰、數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)單、開(kāi)發(fā)過(guò)程簡(jiǎn)單的優(yōu)點(diǎn)。但是對(duì)于新增機(jī)型和新版機(jī)型的告警原始報(bào)告,只要告警原始報(bào)告的格式發(fā)生變化,程序員必須對(duì)告警分析處理模塊進(jìn)行相應(yīng)的程序修改;完全依賴程序員對(duì)交換機(jī)告警原始報(bào)告進(jìn)行分析,歸類(lèi),再轉(zhuǎn)化為計(jì)算機(jī)語(yǔ)言,對(duì)于缺乏交換機(jī)專業(yè)知識(shí)的程序員來(lái)說(shuō)是一個(gè)艱巨的過(guò)程;在時(shí)間上也不適應(yīng)東莞目前多交換機(jī)接入和版本頻繁升級(jí)的現(xiàn)狀。
2.告警信息集中采集和處理
某電信本地網(wǎng)12個(gè)NEC交換機(jī)局點(diǎn)、7個(gè)朗訊5ESS交換局點(diǎn)、10個(gè)C&C08交換機(jī)局點(diǎn)共200萬(wàn)門(mén)的容量的交換設(shè)備,網(wǎng)管系統(tǒng)需要收集和處理的數(shù)據(jù)量巨大,如何保證告警故障信息集中采集和處理的高實(shí)時(shí)性將直接影響到整個(gè)系統(tǒng)的總體性能。在系統(tǒng)的開(kāi)發(fā)過(guò)程中采取了許多措施來(lái)解決該問(wèn)題。
1)所有只能提供串口交換機(jī)設(shè)備的端口首先都通過(guò)10LAN進(jìn)行協(xié)議轉(zhuǎn)換,將RS232轉(zhuǎn)換為T(mén)CP/IP方式再通過(guò)網(wǎng)絡(luò)交換機(jī)接入到拆包服務(wù)器,提供網(wǎng)口方式的交換機(jī)直接通過(guò)網(wǎng)絡(luò)交換機(jī)接入到拆包服務(wù)器進(jìn)行拆包處理,這種布局方式有利于大數(shù)據(jù)流的快速傳輸。
2)采用快速、穩(wěn)定的TCP/IP網(wǎng)絡(luò)。拆包服務(wù)器處理告警信息后必須通過(guò)TCP/IP網(wǎng)絡(luò)把告警信息送到前臺(tái)工作站,拆包服務(wù)器和網(wǎng)管監(jiān)控室(24小時(shí)有專人值班)的計(jì)算機(jī)設(shè)備采用性能較高的3COM 100M網(wǎng)片,并且把所有拆包服務(wù)器與網(wǎng)管監(jiān)控室的前臺(tái)工作站接入同一個(gè)CI SCO 100M網(wǎng)絡(luò)交換機(jī)上,提高網(wǎng)絡(luò)傳輸速率,縮短告警信息在TCP/IP網(wǎng)絡(luò)上的傳輸時(shí)延。
3)提高拆包服務(wù)器的硬件配置,使拆包服務(wù)器擁有強(qiáng)大的處理能力,提高告警信息的處理速度。拆包服務(wù)器采用HP LH3000 PC服務(wù)器,P4 2G CPU,高速SCSI硬盤(pán),內(nèi)存擴(kuò)展為2G。
4)拆包服務(wù)器的系統(tǒng)拆包模塊在處理告警小報(bào)告時(shí),每個(gè)交換機(jī)都有一個(gè)線程專門(mén)負(fù)責(zé)把重要告警信息通過(guò)SOCKET連接發(fā)送到前臺(tái)工作站告警監(jiān)視程序,產(chǎn)生告警;另一個(gè)線程專門(mén)負(fù)責(zé)把告警信息錄入告警數(shù)據(jù)庫(kù)中。兩個(gè)線程并行運(yùn)作,不通過(guò)數(shù)據(jù)庫(kù)提供告警信息,避免了由于數(shù)據(jù)庫(kù)故障而丟失告警信息的危險(xiǎn)和錄入、查詢告警數(shù)據(jù)庫(kù)而產(chǎn)生的時(shí)延。新網(wǎng)管系統(tǒng)通過(guò)SOCKET實(shí)時(shí)連接到交換機(jī)告警端口,并發(fā)送一定的連接信息保持端口的長(zhǎng)時(shí)間連接,如果發(fā)現(xiàn)端口中斷(由于網(wǎng)絡(luò)原因,或交換機(jī)重新啟動(dòng)原因),接收程序立即(1分鐘內(nèi))對(duì)這個(gè)端口進(jìn)行重連,重連三次(次數(shù)和重連開(kāi)始時(shí)間可以通過(guò)配置文件由用戶設(shè)置)。重連三次如果發(fā)現(xiàn)這個(gè)端口還沒(méi)有連接上,系統(tǒng)進(jìn)入等待狀態(tài),等待下次重新連接(如三分鐘后),這樣循環(huán)嘗試,直到連接正常。同時(shí)將接收程序所有與端口有關(guān)的動(dòng)作記錄到日志中,必要時(shí)可以查看接收程序的運(yùn)行情況。
5)拆包服務(wù)器采用熱備份的機(jī)制,盡可能提高系統(tǒng)的安全性,防止告警信息的大量丟失。系統(tǒng)設(shè)有專門(mén)拆包服務(wù)器健康偵察進(jìn)程,如發(fā)現(xiàn)有拆包服務(wù)器停止工作時(shí)間達(dá)到設(shè)定時(shí)間,該拆包服務(wù)器上連接的交換機(jī)將自動(dòng)接入事先在數(shù)據(jù)庫(kù)中設(shè)定的單臺(tái)或多臺(tái)備用拆包服務(wù)器,由備用拆包服務(wù)器負(fù)責(zé)故障拆包服務(wù)器所接入交換機(jī)的信息處理,直到故障拆包服務(wù)器恢復(fù)為止。
6)完善前臺(tái)工作站告警監(jiān)視程序語(yǔ)音告警功能,保證以最快的速度準(zhǔn)確把告警信息通知用戶。前臺(tái)工作站告警監(jiān)視程序能夠按照設(shè)定的告警等級(jí)和告警過(guò)濾條件,把過(guò)濾后的告警信息由重要到次要的順序產(chǎn)生語(yǔ)音告警,使重大故障的告警信息能夠最快的送到網(wǎng)管中心。
3.系統(tǒng)的顯示部分
對(duì)采集到的各類(lèi)告警,系統(tǒng)實(shí)時(shí)地以聲音和圖形界面提供給維護(hù)人員。具體顯示方式有告警監(jiān)視總圖和各種告警列表。用戶可以自由決定某一類(lèi)(根據(jù)告警類(lèi)型、告警級(jí)別等)告警的到來(lái)是否需要聲音指示。在以地圖為背景的全局監(jiān)視圖中,顯示全網(wǎng)所有交換局點(diǎn)的位置。
1)顯示多種告警源:設(shè)備告警、性能告警、網(wǎng)管系統(tǒng)自身告警,從各局點(diǎn)可方便瀏覽到該局點(diǎn)目前各級(jí)別告警的統(tǒng)計(jì)信息,并可切換到設(shè)備告警列表,同時(shí)設(shè)備告警列表自動(dòng)以該局作為過(guò)濾條件以進(jìn)一步查詢?cè)摼贮c(diǎn)當(dāng)前所有設(shè)備告警
2)系統(tǒng)收到告警發(fā)出相應(yīng)級(jí)別的告警音,同時(shí)用相應(yīng)告警級(jí)別的顏色進(jìn)行直觀的閃爍指示,用戶可自定義告警級(jí)別、告警聲音和告警顏色?;顒?dòng)告警得到確認(rèn)后或者接收到對(duì)應(yīng)告警的消除報(bào)告后,停止聲音指示并轉(zhuǎn)變?yōu)樾菝吒婢?。提供聲?閃爍開(kāi)關(guān)控制功能?!?/p>
參考文獻(xiàn):
[1] 陳榕 徐昌華. 電力通信網(wǎng)綜合網(wǎng)管系統(tǒng)實(shí)施策略[J]. 電力系統(tǒng)通信. 2004.25(9)
[2] 匡紅陽(yáng). 初探電信網(wǎng)絡(luò)管理系統(tǒng)的現(xiàn)狀和發(fā)展趨勢(shì)[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2003.3
[3] 周德澤等.計(jì)算機(jī)智能監(jiān)測(cè)控制系統(tǒng)的設(shè)計(jì)及應(yīng)用[M].北京:清華大學(xué)出版社,2002