劉慶濤,耿丁蕤
(水利部水利信息中心,北京 100053)
近年來,隨著通信技術(shù)的快速發(fā)展和水利系統(tǒng)通信業(yè)務(wù)需求的增加,水利部通信專網(wǎng)規(guī)模越來越大,系統(tǒng)及設(shè)備種類越來越多,僅在京地區(qū)程控交換網(wǎng)就由 6 個系統(tǒng) 30 余種設(shè)備組成。各系統(tǒng)、不同種類設(shè)備之間網(wǎng)管不統(tǒng)一,無法實現(xiàn)各分系統(tǒng)的集中監(jiān)控和自動告警。此外,通信設(shè)備除部署在水利部中心機房,還分散在水利部周邊 8 個遠(yuǎn)程辦公及宿舍區(qū)。日常維護中,依靠維護人員利用維護終端分別接入遠(yuǎn)程系統(tǒng)查看設(shè)備情況。而傳統(tǒng)人工線路測試方式效率低、強度大、準(zhǔn)確性差,如在非工作時間設(shè)備出現(xiàn)告警,運行維護人員將不能及時發(fā)現(xiàn)故障,延誤了設(shè)備告警排查時間,對防汛調(diào)度及日常辦公生產(chǎn)造成極大安全隱患。
如何高效地管理各系統(tǒng)重要設(shè)備及重保線路,及時發(fā)現(xiàn)并處理各類突發(fā)故障,確保整個通信系統(tǒng)穩(wěn)定運行成為亟待解決的問題。因此,水利部水利信息中心與相關(guān)單位合作開展了研究與實踐,設(shè)計了 1 套集不同種類通信設(shè)備集中監(jiān)控、故障告警、通信線路自動測試等功能于一體的綜合性平臺,基本滿足了目前系統(tǒng)實時監(jiān)控、及時告警,縮小故障排除時間,提高了系統(tǒng)運行維護工作效率。
水利部通信網(wǎng)采用的結(jié)構(gòu)是基于軟交換構(gòu)架結(jié)合 IP PBX(具備 IP 交換能力的程控交換機)方式。即軟交換作為系統(tǒng)核心,實現(xiàn)呼叫控制處理及協(xié)議處理,通過業(yè)務(wù)服務(wù)器提供多媒體通信及增值業(yè)務(wù);通過數(shù)據(jù)庫服務(wù)器及網(wǎng)管系統(tǒng)提供資源管理等功能;通過 BAC(Border Access Controller,接入控制器)和 RTP 代理實現(xiàn) NAT 穿越和用戶認(rèn)證、接入[1]。
水利通信系統(tǒng)結(jié)構(gòu)如圖1 所示。采用 IP PBX 作為水利部機關(guān)及宿舍區(qū)用戶接入設(shè)備,將目前大量的普通模擬電話接入軟交換系統(tǒng),充分利用了現(xiàn)有的模擬線路,避免重新布設(shè)網(wǎng)絡(luò)造成的資源浪費。IP PBX 具備 IP 交換能力,采用 SIP(Session Initiation Protocol,會話起始協(xié)議)接入軟交換網(wǎng)絡(luò),同時 IP PBX 自身具備內(nèi)部交換功能,本地傳統(tǒng)話音業(yè)務(wù)可以通過 IP PBX 進(jìn)行交換,而網(wǎng)間呼叫由軟交換進(jìn)行呼叫處理。
軟交換系統(tǒng)通過 TG(Trunk Gateway,中繼網(wǎng)關(guān))與 PSTN(Public Switched Telephone Network,公共交換電話網(wǎng))、IP 長途公網(wǎng)、水利部衛(wèi)星通信專網(wǎng)、防汛 VoIP 專網(wǎng)及水利部在京地區(qū)直屬單位程控交換機相連;同時 IP PBX 通過數(shù)字中繼與 PSTN 相連,起到至 PSTN 互聯(lián)的路由備份作用。
水利部遠(yuǎn)程辦公區(qū)、分支機構(gòu)可以通過專網(wǎng)經(jīng)AG(Access Gateway,接入網(wǎng)關(guān))或 IAD(Integrated Access Device,綜合接入設(shè)備)將普通模擬電話接入軟交換網(wǎng)絡(luò),將水利部內(nèi)線號碼延伸至部機關(guān)以外的辦公地點,從而實現(xiàn)內(nèi)部短號互通及其它語音通信業(yè)務(wù)。
對于用戶,除可以采用普通話機經(jīng) IP PBX,AG或 IAD 接入軟交換網(wǎng)絡(luò)實現(xiàn)語音通信,還可以通過標(biāo)準(zhǔn)的 SIP 協(xié)議電話及 PC 軟電話(即安裝在電腦上的多媒體客戶端)直接通過局域網(wǎng)接入軟交換系統(tǒng),實現(xiàn)各種多媒體業(yè)務(wù)及增值業(yè)務(wù);而外出人員通過 Internet 網(wǎng)接入 VPN 網(wǎng)關(guān)及防火墻,進(jìn)而經(jīng)軟交換匯接實現(xiàn)多媒體及增值業(yè)務(wù)[2]。
由于系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)較為復(fù)雜,網(wǎng)絡(luò)節(jié)點多,影響或制約系統(tǒng)穩(wěn)定性的不確定因素多,網(wǎng)絡(luò)可靠性偏低。
圖1 水利通信系統(tǒng)結(jié)構(gòu)圖
整個系統(tǒng)中只有中心點交換機可以實時發(fā)布告警信息,遠(yuǎn)端交換機和各類網(wǎng)關(guān)及軟交換服務(wù)器都是維護人員每日定時分別登錄,人工檢測、排查告警信息。尤其是作為整個網(wǎng)絡(luò)匯接點的 3 臺網(wǎng)絡(luò)交換機,因?qū)儆诰W(wǎng)絡(luò)設(shè)備,維護人員以往未接觸過,維護能力上有較大的不足。每日巡檢維護人員都需要花費大量的時間手動進(jìn)行各系統(tǒng)的檢查,對幾十條重保用戶及至專網(wǎng)各流域總機線路進(jìn)行測試,檢測任務(wù)繁重,工作效率較低。
為有效解決上述問題,需開發(fā)研制 1 套即能自動對程控交換機、網(wǎng)絡(luò)交換機等硬件進(jìn)行告警管理,又能自動對重點線路及專網(wǎng)線路進(jìn)行測試的綜合性管理平臺。
其具體需求主要包括監(jiān)視告警系統(tǒng)和線路自動測試功能 2 個方面:1)具有遠(yuǎn)端告警數(shù)據(jù)采集功能,能自動判別告警類型和級別,準(zhǔn)確進(jìn)行定位,對歷史告警進(jìn)行統(tǒng)計分析,將故障告警信息以手機短信形式通知維護人員;2)系統(tǒng)在規(guī)定時間通過交換機語音線路撥打系統(tǒng)預(yù)先設(shè)定的專網(wǎng)號碼,并依據(jù)對方回復(fù)來判斷線路質(zhì)量的有擾測試;對重點線路在空閑時段,通過執(zhí)行操作指令,依據(jù)反饋結(jié)果,判斷線路通斷的無擾測試。
方案包括監(jiān)視告警和線路測試維護系統(tǒng) 2 部分,方案結(jié)構(gòu)如圖2 所示。
圖2 方案結(jié)構(gòu)圖
監(jiān)視告警系統(tǒng)采用分布式網(wǎng)絡(luò)設(shè)計,系統(tǒng)由中心監(jiān)視平臺和信息提取模塊 2 部分組成,2 者采用 LAN 方式進(jìn)行數(shù)據(jù)傳輸,傳輸協(xié)議采用 TCP/IP 協(xié)議族。
告警信息提取模塊負(fù)責(zé)連接與斷開服務(wù);在常連接的基礎(chǔ)上,中心告警監(jiān)視平臺監(jiān)聽多個服務(wù)端口,根據(jù)告警信息提取模塊的請求而啟用不同的服務(wù)進(jìn)程,并將相應(yīng)數(shù)據(jù)返回請求方,同時告警信息提取模塊在收到中心告警監(jiān)視平臺請求后,能立即啟用相應(yīng)服務(wù)進(jìn)程應(yīng)答請求,提供相應(yīng)服務(wù)。整個數(shù)據(jù)傳輸采用請求、應(yīng)答信息雙向加密、報文轉(zhuǎn)化方式進(jìn)行。
告警監(jiān)視平臺采用 B/S 的 3 層體系結(jié)構(gòu)設(shè)計,即整個系統(tǒng)平臺分為接入、應(yīng)用和支撐層,并將該體系結(jié)構(gòu)在 Microsoft 的 .NET 框架上實現(xiàn)。故障告警系統(tǒng)分層結(jié)構(gòu)如圖3 所示。
事務(wù)邏輯被封裝到 .NET 部件內(nèi),可將復(fù)雜的事務(wù)邏輯分成不同的模塊封裝在不同的 .NET 部件內(nèi),1 個 .NET 部件實際上就是 1 個 Assembly,最終形成的是 1 個 DLL 文件。然后將多個 .NET 部件封裝到 1 個 Web Service 之中。
數(shù)據(jù)庫訪問通過 1 個處理所有和 SQL Server 管理的提供者交互的類實現(xiàn)。通過存儲過程訪問存儲在數(shù)據(jù)庫中的數(shù)據(jù)。
線路測試維護系統(tǒng)采用 C/S 數(shù)據(jù)結(jié)構(gòu),是 1 套交換機指令測試處理系統(tǒng),通過 LAN 或 V.24 與交換機系統(tǒng)緊密連接,采用 AMO 指令作為底層指令傳輸,根據(jù)交換機數(shù)據(jù)結(jié)構(gòu),將指令區(qū)分位動作、名稱和參數(shù);將指令作分類歸屬,區(qū)分查詢、添加、修改和刪除;按照交換機指令規(guī)律進(jìn)行線路測試;對指令動作進(jìn)行歸類組合,形成完整的數(shù)據(jù)指令發(fā)送到交換機系統(tǒng);并接收交換機返回信息,確認(rèn)操作指令的正確完成,如果遇到失敗提示則根據(jù)提示信息對操作人員進(jìn)行錯誤提示。
交換機故障告警系統(tǒng)平臺是個開放、交互、一網(wǎng)式系統(tǒng),具有以下特點: 1)實現(xiàn)數(shù)據(jù)共享,使其在 1 個網(wǎng)絡(luò)平臺上工作;2)以服務(wù)為中心,實現(xiàn)用戶服務(wù)的個性化 ;3)基于 Internet 和 Intranet,突破了時間、空間之間的制約; 4)采用先進(jìn)的 B/S 模式的 3 層結(jié)構(gòu)體系;5)采用 ASP.NET,Web Service等先進(jìn)軟件開發(fā)技術(shù),以及 SQL Server 大型數(shù)據(jù)庫系統(tǒng);6)使用了 HTTP,SOAP 和 XML 等開放的協(xié)議;7)用戶端無需安裝專用軟件,使用 IE 瀏覽器即可查詢;8)系統(tǒng)具有堅強的保密性設(shè)計和安全接口,對于數(shù)據(jù)的共享、傳輸、使用提供完整的安全和加密措施。
中心監(jiān)視告警平臺由 1 套告警監(jiān)視系統(tǒng)服務(wù)器(含 1 套短信網(wǎng)關(guān))和 1 個工作站組成。配置網(wǎng)絡(luò)打印機,用于打印各類報表。監(jiān)視告警終端計算機和服務(wù)器分別配置單獨 IP 地址,并與被監(jiān)控的通信設(shè)備在同一地址段內(nèi),方便讀取通信設(shè)備的故障信息。
水利部中心程控交換機提供 2 M 數(shù)字接口,以ISDN 方式的 Q931 或 ETSI 信令格式與監(jiān)視告警系統(tǒng)直接連接;遠(yuǎn)程地區(qū)程控交換機提供 2 M 或 IP 端口通過光傳輸網(wǎng)絡(luò)匯接與監(jiān)視告警系統(tǒng)連接;其它通信設(shè)備通過 IP 接口與監(jiān)視告警系統(tǒng)直接連接。
此外,程控交換機提供語音撥號接口,在 2 M 數(shù)字線路中提供第 1 主叫、被叫,被叫號碼端口和忙閑等信息,以實現(xiàn)線路自動測試功能。
1)告警數(shù)據(jù)采集。實時采集遠(yuǎn)端交換機輸出的所有告警報告,并將告警報告存放在原始日志文件中。支持不同機型的數(shù)據(jù)采集及告警管理。
2)告警地圖顯示。中心監(jiān)視告警平臺配置電子地圖顯示,按照地理位置將交換機圖標(biāo)顯示在地圖上,當(dāng)某點交換機出現(xiàn)告警時,地圖上的圖標(biāo)顏色將發(fā)生變化,同時伴有報警聲。
3)告警類型和級別設(shè)置??蓪收霞墑e和類型分別設(shè)置數(shù)據(jù)表,同時定義故障類型和級別的數(shù)據(jù)字典。可以根據(jù)故障的嚴(yán)重和時效性將故障分為若干級別,在故障級別表中設(shè)置該級別是否需要上報上級網(wǎng)管系統(tǒng)。
4)告警數(shù)據(jù)過濾。通過設(shè)置告警過濾條件(如類型、級別),有針對性地接收和處理告警信息。系統(tǒng)內(nèi)置故障信息對照表,可將常規(guī)故障信息以中文或特定字符標(biāo)記出來,故障內(nèi)容中英文轉(zhuǎn)換,方便管理人員維護。
5)告警實時監(jiān)視。提供告警列表、全網(wǎng)告警監(jiān)視等多個角度來反映告警的當(dāng)前狀態(tài),并伴有顏色、聲音等多種形式的提示。當(dāng)故障發(fā)生時,系統(tǒng)具備手機短信通知和系統(tǒng)聲光告警功能。在接收到告警信息的時候,根據(jù)故障信息中的硬件位置,在圖例化界面的相應(yīng)位置產(chǎn)生閃爍,同時進(jìn)行聲光或語音報警等各種形式的處理。
6)告警歷史信息查詢。在接收到告警信息的同時將告警信息入庫。將局號,故障類型、級別、編碼、時間、位置等信息寫入數(shù)據(jù)表。
7)告警定位。在硬件故障產(chǎn)生的時候,可以通過中心告警監(jiān)視平臺看見該故障對應(yīng)的節(jié)點(遠(yuǎn)端局交換機)產(chǎn)生報警閃爍。網(wǎng)管系統(tǒng)可將故障告警直接定義到設(shè)備故障端口,并顯示相應(yīng)的中英文故障內(nèi)容,從而方便管理人員進(jìn)行故障處理。
8)告警統(tǒng)計分析。故障信息表中的故障信息可以按照節(jié)點、級別、類型、編碼進(jìn)行單一和組合統(tǒng)計,可以顯示和打印統(tǒng)計信息。告警系統(tǒng)可以按設(shè)定好的時間段或設(shè)備運行的實際數(shù)據(jù),進(jìn)行故障信息統(tǒng)計,并形成相應(yīng)的統(tǒng)計報表打印輸出[3]。
1)語音線路測試。系統(tǒng)是利用語音線路,自動呼叫到測試對方,經(jīng)過 IVR 流程,對方按鍵進(jìn)行確認(rèn)后自動記錄到系統(tǒng)中,如果對方確認(rèn)線路正常系統(tǒng)自動判定為測試成功。失敗后將在一定時限內(nèi)重新測試,如果對方確認(rèn)線路問題依舊則系統(tǒng)自動判定為測試失敗,系統(tǒng)會自動將測試失敗的信息進(jìn)行告警提醒并通知給系統(tǒng)管理員。
2)數(shù)字線路測試。將交換機指令進(jìn)行中文解讀,根據(jù)交換機指令特征形成嚴(yán)格的交換機數(shù)據(jù)結(jié)構(gòu),對發(fā)送到交換機數(shù)據(jù)端口的指令信息進(jìn)行數(shù)據(jù)校驗與驗證。根據(jù)維護人員操作內(nèi)容的不同,線路測試維護系統(tǒng)對維護人員操作內(nèi)容進(jìn)行交換機指令數(shù)據(jù)組合,分析交換機指令返回結(jié)果,將返回錯誤的結(jié)果進(jìn)行告警處理。形成完整的交換機指令與交換機進(jìn)行通訊,達(dá)到線路測試目的。此系統(tǒng)可以方便系統(tǒng)管理員進(jìn)行分等級的控制,不需要具體指令就可以實現(xiàn)日常的分機等級維護。
通過交換機對線路的測試,對線路信息進(jìn)行分析查詢,可以得到交換機測試數(shù)據(jù),內(nèi)容有電話號碼、對應(yīng)號碼的端口位置、類別(數(shù)字或模擬)、服務(wù)等級及所涉及的有關(guān)信息,維護人員通過對電話數(shù)據(jù)進(jìn)行瀏覽,可以查看到交換機所管理的電話數(shù)量及每部電話的狀態(tài)信息。
系統(tǒng)可以對各點通信設(shè)備發(fā)送的告警數(shù)據(jù)進(jìn)行分析,通過預(yù)先設(shè)置手機號碼進(jìn)行告警短信的發(fā)送??梢园凑赵O(shè)備節(jié)點進(jìn)行短信告警級別配置,當(dāng)節(jié)點設(shè)備故障時,可以根據(jù)故障級別將故障短信發(fā)送到 1 個人或多人的手機上。
該系統(tǒng)集成度和標(biāo)準(zhǔn)化程度高,便于管理和維護;人機界面友好,操作方便,易學(xué)易用;系統(tǒng)兼容性強,易于擴容升級;具有告警輸出提示,自動判斷告警故障原因、報警資料記錄齊全;采用多種告警提示方式;系統(tǒng)設(shè)備配置靈活、設(shè)置方便。符合集中監(jiān)控系統(tǒng)向分布式和網(wǎng)絡(luò)化發(fā)展方向。該系統(tǒng)的實現(xiàn),使運維人員徹底改變傳統(tǒng)分散式監(jiān)控模式,集中在同一個系統(tǒng)對所有維護終端進(jìn)行監(jiān)視監(jiān)控。該系統(tǒng)告警功能減少了系統(tǒng)故障的發(fā)現(xiàn)、排查時間,線路測試功能節(jié)約了大量的人力,提高了工作效率,確保了水利通信系統(tǒng)更加安全穩(wěn)定的運行。
[1]方明,崔瑞玲,丁軍. 水利程控交換機改造項目初步設(shè)計[R]. 北京:中華人民共和國水利部水利信息中心,2006:16-17.
[2]耿丁蕤,崔瑞玲,周揚. 軟交換在水利通信網(wǎng)中的應(yīng)用[J]. 水利信息化,2011 (4): 20-21.
[3]中華人民共和國信息產(chǎn)業(yè)部. YD 1363.1-2005 通信局(站) 電源、空調(diào)及環(huán)境集中監(jiān)控管理系統(tǒng)規(guī)范[S]. 北京:人民郵電出版社,2005: 12-13.