【摘 要】利用PRTG網(wǎng)管系統(tǒng),預(yù)警網(wǎng)絡(luò)隱患,發(fā)現(xiàn)并分析網(wǎng)絡(luò)沖擊成因,保護網(wǎng)絡(luò)運行安全。
【關(guān)鍵詞】PRTG 分析工具 排除 NGN 隱患
一、軟交換網(wǎng)絡(luò)結(jié)構(gòu)
NGN軟交換網(wǎng)絡(luò)核心側(cè)采用阿爾卡特朗訊公司的A5020MGC及7510TG設(shè)備。這套設(shè)備現(xiàn)為雙平面業(yè)務(wù)分擔(dān)模式 ,共承擔(dān)四十余萬語音用戶。
PRTG網(wǎng)管
PRTG網(wǎng)管系統(tǒng)配置了PRTG主服務(wù)器和探針服務(wù)器兩臺設(shè)備。
探針服務(wù)器放置在NGN核心網(wǎng)內(nèi)部,主要用于使用SNMP、WMI等方式定時采集各節(jié)點設(shè)備數(shù)據(jù),再將采集到的數(shù)據(jù)發(fā)送PRTG主服務(wù)器。
PRTG主服務(wù)器放置在DCN網(wǎng)內(nèi)部,負(fù)責(zé)接收存儲探針服務(wù)器傳來的數(shù)據(jù)并加以分析處理,最終通過HTTPS、app等方式將網(wǎng)管界面呈現(xiàn)給維護人員,可以提供數(shù)據(jù)報表、分析對比、告警通知等多項功能。
應(yīng)用案例
7月23日登陸PRTG網(wǎng)管時發(fā)現(xiàn)多條傳感器異常告警,其中一條為“NGN-2950-2至A5020MGC-IPACC流量異常高于上周平均值”,此條告警提示: NGN第二平面C2950-2交換機至MGC的端口流量大幅增加。
點擊C2950端口傳感器,查看30天流量數(shù)據(jù),發(fā)現(xiàn)從7月19日開始,C2950交換機至NGN MGC IPACC端口的流量值明顯增大,合計流量峰值從日常的700KB/S驟升為7000KB/S以上。此端口主要用來傳送用戶語音網(wǎng)關(guān)與MGC間的控制消息,也就是說PON網(wǎng)關(guān)與NGN的信令數(shù)據(jù)包交互流量上升了十倍。
NGN第二平面使用NetScreen208防火墻來隔離城域網(wǎng)接入側(cè)和軟交換核心側(cè),C2950控制消息流量上升的同時NS208的端口流量也從1800KB/S上升為9000KB/S,cpu占用率從12%上升為35%,接近危險值。
登陸NGN OAM,追蹤PON接入側(cè)與NGN MGC間的H.248消息,發(fā)現(xiàn)了大量504及410錯誤,每秒鐘達數(shù)千次之多。
檢索出錯誤消息的具體交互內(nèi)容如下圖,IP地址10.237.166.26的語音網(wǎng)關(guān)向NGN MGC發(fā)起注冊,MGC認(rèn)為此語音網(wǎng)關(guān)鑒權(quán)失敗,向語音網(wǎng)關(guān)發(fā)送504錯誤,而語音網(wǎng)關(guān)在收到504錯誤后向MGC大量回送410錯誤,MGC在收到語音網(wǎng)關(guān)的410錯誤后,繼續(xù)向語音網(wǎng)關(guān)發(fā)送504錯誤,由此形成大量消息循環(huán),對NGN網(wǎng)絡(luò)造成了嚴(yán)重沖擊。
故障原因分析:
NGN網(wǎng)絡(luò)中的語音網(wǎng)關(guān)應(yīng)采用[domainAddress]方式在MGC中注冊,但此語音網(wǎng)關(guān)錯誤的配置成以