逄成香 陳玉輝
(中國聯(lián)合網(wǎng)絡(luò)通信有限公司綏化市分公司,黑龍江 綏化 152001;中國聯(lián)合網(wǎng)絡(luò)通信有限公司安達(dá)市分公司,黑龍江 安達(dá) 151400)
電信網(wǎng)中交換機(jī)的集中網(wǎng)管系統(tǒng)的設(shè)計探討
逄成香 陳玉輝
(中國聯(lián)合網(wǎng)絡(luò)通信有限公司綏化市分公司,黑龍江 綏化 152001;中國聯(lián)合網(wǎng)絡(luò)通信有限公司安達(dá)市分公司,黑龍江 安達(dá) 151400)
研究和設(shè)計基于計算機(jī)技術(shù)的交換機(jī)網(wǎng)絡(luò)管理系統(tǒng),可以使維護(hù)人員通過同一操作終端,對電信網(wǎng)絡(luò)的各種交換機(jī)設(shè)備進(jìn)行集中監(jiān)控,從而提高電信網(wǎng)運行效率和運行質(zhì)量,減少維護(hù)管理人員,提高工作效率。
網(wǎng)管系統(tǒng);功能設(shè)計;數(shù)據(jù)拆包;故障采集和處理
目前,電信網(wǎng)中主要有AXE10,EWSD,NEAR-61,SIGMA,SESS和華為CC08等交換機(jī)機(jī)型。由于交換機(jī)告警故障信息的原始報告類型和定義復(fù)雜,不同交換機(jī)型的告警原始報告的格式和內(nèi)容差異較大,甚至是同一種交換機(jī)機(jī)型,不同軟件版本的告警原始報告也有差異,傳統(tǒng)網(wǎng)管系統(tǒng)為了準(zhǔn)確分析和處理各種機(jī)型的告警原始報告,在網(wǎng)管接口機(jī)上開發(fā)多個告警分析處理模塊,分別處理一種特定的交換機(jī)機(jī)型的告警原始報告。告警分析處理模塊的功能包括:實時接收告警原始報告;提取告警原始報告中的告警時間、告警交換局、告警關(guān)鍵字、告警內(nèi)容等信息;把處理后的告警信息保存在數(shù)據(jù)庫;同時通過Socket連接發(fā)送到前臺工作站。
這種方式使系統(tǒng)具有結(jié)構(gòu)清晰、數(shù)據(jù)結(jié)構(gòu)簡單、開發(fā)過程簡單的優(yōu)點。但是對于新增機(jī)型和新版機(jī)型的告警原始報告,只要告警原始報告的格式發(fā)生變化,程序員必須對告警分析處理模塊進(jìn)行相應(yīng)的程序修改。完全依賴程序員對交換機(jī)告警原始報告進(jìn)行分析,歸類,再轉(zhuǎn)化為計算機(jī)語言,對于缺乏交換機(jī)專業(yè)知識的程序員來說是一個艱巨的過程。為解決這個問題,在新系統(tǒng)開發(fā)中,告警故障信息集中采集和處理單元采用全新的設(shè)計方案,使系統(tǒng)具有處理所有交換機(jī)告警故障信息而不用依賴程序員修改程序的高靈活性。這種全新的設(shè)計方案可以處理所有交換機(jī)的告警報告,網(wǎng)管用戶只需通過前臺工作站自行定義告警信息的提取方法,添加、修改或刪除系統(tǒng)數(shù)據(jù)庫的相關(guān)設(shè)置,就能完成新型交換機(jī)或者新版交換機(jī)的網(wǎng)管接入,而不再依賴程序員修改告警分析處理模塊程序來實現(xiàn)。
某電信本地網(wǎng)12個NEC交換機(jī)局點、7個朗訊5ESS交換局點、10個C&C08交換機(jī)局點共200萬門的容量的交換設(shè)備,網(wǎng)管系統(tǒng)需要收集和處理的數(shù)據(jù)量巨大,如何保證告警故障信息集中采集和處理的高實時性將直接影響到整個系統(tǒng)的總體性能。在系統(tǒng)的開發(fā)過程中采取了許多措施來解決該問題。
(1)所有只能提供串口交換機(jī)設(shè)備的端口首先都通過IOLAN進(jìn)行協(xié)議轉(zhuǎn)換,將RS232轉(zhuǎn)換為TCP/IP方式再通過網(wǎng)絡(luò)交換機(jī)接入到拆包服務(wù)器,提供網(wǎng)口方式的交換機(jī)直接通過網(wǎng)絡(luò)交換機(jī)接入到拆包服務(wù)器進(jìn)行拆包處理,這種布局方式有利于大數(shù)據(jù)流的快速傳輸。
(2)采用快速、穩(wěn)定的TCP/IP網(wǎng)絡(luò)。拆包服務(wù)器處理告警信息后必須通過TCP/IP網(wǎng)絡(luò)把告警信息送到前臺工作站,拆包服務(wù)器和網(wǎng)管監(jiān)控室(24小時有專人值班)的計算機(jī)設(shè)備采用性能較高的3COM 100M網(wǎng)片,并且把所有拆包服務(wù)器與網(wǎng)管監(jiān)控室的前臺工作站接入同一個CI SCO 100M網(wǎng)絡(luò)交換機(jī)上,提高網(wǎng)絡(luò)傳輸速率,縮短告警信息在TCP/IP網(wǎng)絡(luò)上的傳輸時延。
(3)提高拆包服務(wù)器的硬件配置,使拆包服務(wù)器擁有強(qiáng)大的處理能力,提高告警信息的處理速度。拆包服務(wù)器采用HP LH3000 PC服務(wù)器,2G雙核CPU,高速SCSI硬盤,內(nèi)存2G。
(4)拆包服務(wù)器的系統(tǒng)拆包模塊在處理告警小報告時,每個交換機(jī)都有一個線程專門負(fù)責(zé)把重要告警信息通過SOCKET連接發(fā)送到前臺工作站告警監(jiān)視程序,產(chǎn)生告警;另一個線程專門負(fù)責(zé)把告警信息錄入告警數(shù)據(jù)庫中。兩個線程并行運作,不通過數(shù)據(jù)庫提供告警信息,避免了由于數(shù)據(jù)庫故障而丟失告警信息的危險和錄入、查詢告警數(shù)據(jù)庫而產(chǎn)生的時延。新網(wǎng)管系統(tǒng)通過SOCKET實時連接到交換機(jī)告警端口,并發(fā)送一定的連接信息保持端口的長時間連接,如果發(fā)現(xiàn)端口中斷(由于網(wǎng)絡(luò)原因,或交換機(jī)重新啟動原因),接收程序立即(1分鐘內(nèi))對這個端口進(jìn)行重連,重連三次(次數(shù)和重連開始時間可以通過配置文件由用戶設(shè)置)。重連三次如果發(fā)現(xiàn)這個端口還沒有連接上,系統(tǒng)進(jìn)入等待狀態(tài),等待下次重新連接(如三分鐘后),這樣循環(huán)嘗試,直到連接正常。同時將接收程序所有與端口有關(guān)的動作記錄到日志中,必要時可以查看接收程序的運行情況。
(5)拆包服務(wù)器采用熱備份的機(jī)制,盡可能提高系統(tǒng)的安全性,防止告警信息的大量丟失。系統(tǒng)設(shè)有專門拆包服務(wù)器健康偵察進(jìn)程,如發(fā)現(xiàn)有拆包服務(wù)器停止工作時間達(dá)到設(shè)定時間,該拆包服務(wù)器上連接的交換機(jī)將自動接入事先在數(shù)據(jù)庫中設(shè)定的單臺或多臺備用拆包服務(wù)器,由備用拆包服務(wù)器負(fù)責(zé)故障拆包服務(wù)器所接入交換機(jī)的信息處理,直到故障拆包服務(wù)器恢復(fù)為止。
(6)完善前臺工作站告警監(jiān)視程序語音告警功能,保證以最快的速度準(zhǔn)確把告警信息通知用戶。前臺工作站告警監(jiān)視程序能夠按照設(shè)定的告警等級和告警過濾條件,把過濾后的告警信息由重要到次要的順序產(chǎn)生語音告警,使重大故障的告警信息能夠最快的送到網(wǎng)管中心。
動態(tài)報表是指從數(shù)據(jù)庫流水表中讀取數(shù)據(jù),用戶不必修改報表程序,而根據(jù)自己的需要自行定義報表,經(jīng)過特定的運算產(chǎn)生個性化的圖表,做到及時了解故障的發(fā)生,又能快捷、準(zhǔn)確地對故障進(jìn)行智能化分析,作為通信設(shè)備維護(hù)工作的重要參考和依據(jù)。系統(tǒng)由報表生成工具和報表使用工具兩大模塊實現(xiàn)動態(tài)報表功能。
對采集到的各類告警,系統(tǒng)實時地以聲音和圖形界面提供給維護(hù)人員。具體顯示方式有告警監(jiān)視總圖和各種告警列表。用戶可以自由決定某一類(根據(jù)告警類型、告警級別等)告警的到來是否需要聲音指示。在以地圖為背景的全局監(jiān)視圖中,顯示全網(wǎng)所有交換局點的位置。
(1)顯示多種告警源:設(shè)備告警、性能告警、網(wǎng)管系統(tǒng)自身告警,從各局點可方便瀏覽到該局點目前各級別告警的統(tǒng)計信息,并可切換到設(shè)備告警列表,同時設(shè)備告警列表自動以該局作為過濾條件以進(jìn)一步查詢該局點當(dāng)前所有設(shè)備告警。
(2)系統(tǒng)收到告警發(fā)出相應(yīng)級別的告警音,同時用相應(yīng)告警級別的顏色進(jìn)行直觀的閃爍指示,用戶可自定義告警級別、告警聲音和告警顏色。活動告警得到確認(rèn)后或者接收到對應(yīng)告警的消除報告后,停止聲音指示并轉(zhuǎn)變?yōu)樾菝吒婢L峁┞曇?閃爍開關(guān)控制功能。
(3)設(shè)備告警列表:設(shè)備告警列表顯示的信息包括:交換機(jī)名稱、告警類型、告警級別和發(fā)生時間、告警確認(rèn)時間等信息??梢园凑战粨Q局類型、局點、告警類型和告警級別等過濾顯示。可用鼠標(biāo)點擊告警以顯示詳細(xì)原始信息,告警列表上實時反映最新的告警,并按告警發(fā)生時間順序滾動顯示。當(dāng)收到新的告警時,系統(tǒng)自動產(chǎn)生對應(yīng)級別的告警音。
通過對分散的多機(jī)型的交換機(jī)告警信息集中采集和處理功能的開發(fā),系統(tǒng)具有了告警故障監(jiān)視、告警故障設(shè)置、告警信息統(tǒng)計和查詢等功能??梢钥s短設(shè)備故障歷時,也可以通過分析和預(yù)處理查找故障隱患,將故障消除在萌芽狀態(tài),從而有效地提高維護(hù)人員的工作效率和網(wǎng)絡(luò)的運行質(zhì)量,為企業(yè)創(chuàng)造良好的經(jīng)濟(jì)效益和社會效益。另外新系統(tǒng)實現(xiàn)了對所有交換機(jī)型的集中監(jiān)控,取消了不同交換機(jī)自帶的網(wǎng)管系統(tǒng),做到各個交換機(jī)房和光纖站無人值守或少人值守,使機(jī)房值守人員大約可以減少60%。
[1]韓瑩.軟交換技術(shù)構(gòu)筑電信網(wǎng)的未來.天津市自動化學(xué)會第十四屆學(xué)術(shù)年會論文集, 2005-12-01.
TP302
B