李 昕
(太鋼工程技術有限公司,山西 太原 030009)
SNMP具有簡單性、擴展管理功能的健壯性和成本低等優(yōu)點,是當今最流行的網(wǎng)絡管理協(xié)議,目前已經(jīng)成為了網(wǎng)絡管理方面的事實標準,許多網(wǎng)絡通訊設備廠商都提供基于SNMP的實現(xiàn)方法,即SNMP Agent(SNMP代理)。
簡單網(wǎng)絡管理協(xié)議(SNMP,Simple Network Management Protocol)是由互聯(lián)網(wǎng)工程任務組(IETF,Internet Engineering Task Force)定義的一套網(wǎng)絡管理協(xié)議。SNMP協(xié)議是基于TCP/IP協(xié)議族上的應用協(xié)議,該協(xié)議由簡單網(wǎng)關監(jiān)視協(xié)議(SGMP,Simple Gateway Monitor Protocol)發(fā)展而來。一般情況下,基于SNMP的網(wǎng)絡監(jiān)控系統(tǒng)包含以下4部分:①網(wǎng)絡管理工作站(Monitor);②網(wǎng)絡代理(Agent);③網(wǎng)絡管理傳輸協(xié)議(SNMP);④網(wǎng)絡管理信息庫(MIB)。在網(wǎng)絡管理系統(tǒng)中,4個模塊相輔相成,缺一不可。
(1)網(wǎng)絡管理工作站由一臺或多臺專職設備構成,一般位于本網(wǎng)絡的一個或多個主機節(jié)點上,是智能網(wǎng)絡管理系統(tǒng)的核心。它在智能網(wǎng)絡管理系統(tǒng)中擔任管理者的角色,是智能網(wǎng)絡管理系統(tǒng)的實體,能夠完成各種網(wǎng)絡管理功能,如從網(wǎng)絡的被管理對象中采集信息數(shù)據(jù)、存儲信息數(shù)據(jù)、分析網(wǎng)絡性能、診斷網(wǎng)絡故障等。由于網(wǎng)絡管理工作站是人機交換的接口,因此其在智能網(wǎng)絡管理系統(tǒng)中不可或缺。
(2)網(wǎng)絡代理是智能網(wǎng)絡管理系統(tǒng)的重要組成部分,一般情況下在一個智能網(wǎng)絡管理系統(tǒng)中有多個網(wǎng)絡代理,分別駐留在各網(wǎng)絡設備中,如小型機、服務器、路由器、交換機、DNS服務器、UPS系統(tǒng)、防火墻、主機、網(wǎng)橋等網(wǎng)絡設備。其作用是根據(jù)網(wǎng)絡管理工作站提出的請求,從網(wǎng)絡管理信息庫中提取相關信息,對網(wǎng)絡管理工作站進行應答,并隨機地為網(wǎng)絡管理工作站報告重要的異常信息。
(3)網(wǎng)絡管理傳輸協(xié)議(SNMP)是基于 TCP/IP的應用協(xié)議,作為IP傳輸協(xié)議的應用層——網(wǎng)絡管理的通信規(guī)則。它描述了網(wǎng)絡代理與網(wǎng)絡管理工作站間的信息傳輸模式與規(guī)范。網(wǎng)絡管理傳輸協(xié)議定義了SNMP協(xié)議的PDU(協(xié)議報文單元)格式與語義。
(4)網(wǎng)絡管理信息庫是智能網(wǎng)絡管理中的重要元素,駐扎在各被管理設備中。它是網(wǎng)絡設備中各種信息集合的動態(tài)專用數(shù)據(jù)庫,存儲系統(tǒng)中的被管理對象及其屬性。其數(shù)據(jù)包括:被管理對象的各種性能數(shù)據(jù)、被管理對象的靜態(tài)信息、被管理對象的配置信息、網(wǎng)絡流量、丟包率等數(shù)據(jù)。網(wǎng)絡管理工作站通過網(wǎng)絡代理查詢網(wǎng)絡管理信息庫,并對其查詢結果進行預處理、存儲、監(jiān)控等操作。
SNMP是建立在TCP/IP通訊協(xié)議上的應用協(xié)議,是基于管理工作站/管理代理模式的。為了增加網(wǎng)絡響應速度、降低網(wǎng)絡開銷,SNMP采用UDP(User Datagram Protocol)通訊協(xié)議,但不能保證報文是否達到。SNMP協(xié)議中管理工作站與代理工作站之間通過有抽象語法(ASN.1,Abstract Syntax Notation One)的基本編碼規(guī)則BER(Basic Encoding Rules)定義的報文數(shù)據(jù)單元(PDU,Protocol Data Unit)進行通訊。
本系統(tǒng)具體業(yè)務需求如下:①網(wǎng)絡管理員能方便地配置網(wǎng)絡設備信息;②能隨時方便查看網(wǎng)絡信息;③實現(xiàn)對網(wǎng)絡的每個節(jié)點進行流量監(jiān)控;④實現(xiàn)對網(wǎng)絡的每個設備進行性能監(jiān)控;⑤實現(xiàn)網(wǎng)絡數(shù)據(jù)信息的快速存儲;⑥實現(xiàn)對網(wǎng)絡中出現(xiàn)的故障進行快速診斷與報警;⑦實現(xiàn)日志功能。
圖1 為智能網(wǎng)絡管理系統(tǒng)功能分析。為確保智能網(wǎng)絡管理系統(tǒng)的完整性,根據(jù)業(yè)務需求本系統(tǒng)設置了以下功能模塊:
(1)設備基本信息配置:將網(wǎng)絡設備信息存于數(shù)據(jù)庫中,包括設備名稱、型號、廠家、購買日期、所屬部門、負責人等基本信息。
(2)設備網(wǎng)絡信息配置:主要是配置相關設備的IP地址、SNMP服務用戶名、密碼、數(shù)據(jù)庫名稱、表名稱等相關信息。
(3)設備性能信息配置:主要提供相關設備所需檢測的OID以及OID對應名稱等相關信息。
圖1 智能網(wǎng)絡管理系統(tǒng)功能框圖
(4)生成配置文件:根據(jù)網(wǎng)絡管理人員對設備的基本信息、網(wǎng)絡信息、性能信息的配置產(chǎn)生一個基本配置文件,是前臺界面與數(shù)據(jù)采集模塊的接口。
(5)物理信息采集:通過SNMP采集網(wǎng)絡設備的各種物理信息,如溫度、濕度等基本數(shù)據(jù)。
(6)流量信息采集:通過SNMP對單個或多個設備的一個或多個端口的數(shù)據(jù)流入、流出、錯誤率、利用率等數(shù)據(jù)進行采集。
(7)性能信息采集:通過SNMP對CPU占用率、內(nèi)存率、磁盤利用率等性能數(shù)據(jù)進行采集。
(8)端口信息采集:通過SNMP對每個端口的活動情況(如正常、錯誤、關閉、測試)進行采集。
(9)數(shù)據(jù)預處理:對采集來的數(shù)據(jù)進行初步處理以及規(guī)格化,為數(shù)據(jù)分析及網(wǎng)絡故障定位做準備工作。
(10)數(shù)據(jù)存儲:將采集來的各種數(shù)據(jù)信息存儲于數(shù)據(jù)庫中,作為數(shù)據(jù)分析與網(wǎng)絡故障診斷分析的原始資源,并可生成日志文件。
(11)數(shù)據(jù)分析:數(shù)據(jù)庫中的信息分為3類,根據(jù)不同特征數(shù)據(jù)采取不同分析策略,為網(wǎng)絡故障定位做最后準備。
(12)網(wǎng)絡故障定位:根據(jù)分析后得到的數(shù)據(jù),進行案例比對、模糊化、反模糊化等策略,診斷網(wǎng)絡是否出現(xiàn)故障。
(13)故障警告:對網(wǎng)絡出現(xiàn)的故障進行警告,以確保網(wǎng)絡管理人員及時處理網(wǎng)絡故障,恢復網(wǎng)絡正常運行。
本系統(tǒng)可應用于任何網(wǎng)絡拓撲結構中,只要提供SNMP通訊服務,即可管理任何廠家、任何型號的網(wǎng)絡管理設備,并進行性能數(shù)據(jù)采集與故障報警;可以實現(xiàn)跨平臺監(jiān)控,無論網(wǎng)絡設備采用何種操作系統(tǒng)(Windows操作系統(tǒng)、Linux操作系統(tǒng))都能不加任何修改即可對其進行網(wǎng)絡管理。系統(tǒng)設計目標如下:
(1)界面友好:方便用戶使用,網(wǎng)絡管理人員無須特殊專業(yè)知識即可操作本系統(tǒng),并能及時發(fā)現(xiàn)網(wǎng)絡異常,并根據(jù)提示采取相應的措施。
(2)通用性:只要提供SNMP通訊服務,即可通過統(tǒng)一接口對網(wǎng)絡中的任何廠家、任何型號設備進行網(wǎng)絡管理,可用于任何網(wǎng)絡拓撲結構的管理系統(tǒng)。
(3)可擴展性:可以快速滿足用戶提出的新需求,例如在本系統(tǒng)中加入資產(chǎn)管理、維修管理等組件。
(4)安全性:網(wǎng)絡管理系統(tǒng)中記錄了許多本網(wǎng)絡的內(nèi)部消息,并且通過本網(wǎng)絡可以修改網(wǎng)絡的各種配置信息,因此必須保證其安全性,防止通過數(shù)據(jù)截取、數(shù)據(jù)篡改等方式影響網(wǎng)絡運行狀態(tài),因此采用多級用戶多種權限的方式進行安全性處理。
(5)維護性:系統(tǒng)無需過多維護,以確保使用最少的人力物力即可對網(wǎng)絡進行總體管理,以達到應用系統(tǒng)的目的。
(6)高效性:系統(tǒng)能夠在短時間內(nèi)響應用戶操作,并且對網(wǎng)絡中的故障做出快速、準確診斷,以保證網(wǎng)絡的正常運行,這是智能網(wǎng)絡管理系統(tǒng)最重要的目標。
本系統(tǒng)網(wǎng)絡拓撲結構如圖2 所示。本拓撲結構由外部網(wǎng)絡與內(nèi)部網(wǎng)絡兩部分組成,外部網(wǎng)絡同時接入網(wǎng)通4Mb/s靜態(tài)光纖和電信2Mb/s靜態(tài)光纖,內(nèi)部網(wǎng)絡由網(wǎng)絡中心(1號工程項目、服務器組)、應用中心(信息中心、營銷中心、電訪、其他)、室外網(wǎng)絡(綜合樓、倉庫)三部分組成。
系統(tǒng)總體結構框圖見圖3 ,分為監(jiān)控網(wǎng)絡的設備信息(圖3 右部分)和管理系統(tǒng)(圖3 左部分)。其管理系統(tǒng)功能如下:
(1)用戶界面:是網(wǎng)絡管理人員與系統(tǒng)數(shù)據(jù)交換的平臺,它可以直觀地設置網(wǎng)絡配置信息,直接反映出當前網(wǎng)絡工作狀況。用戶界面接口是不可缺少的部分,它使系統(tǒng)更加容易使用。
(2)數(shù)據(jù)采集模塊:是智能網(wǎng)絡管理系統(tǒng)的基礎模塊,其功能是采集各網(wǎng)絡設備的接口信息、性能數(shù)據(jù)、流量數(shù)據(jù)等相關信息。采集到的數(shù)據(jù)是整個智能網(wǎng)絡管理系統(tǒng)的基礎。
(3)數(shù)據(jù)庫(數(shù)據(jù)存儲模塊):用來存儲數(shù)據(jù)采集模塊中采集到的數(shù)據(jù),生成日志文件,以及為網(wǎng)絡故障診斷模塊提供基礎數(shù)據(jù)。
(4)網(wǎng)絡故障診斷:是智能網(wǎng)絡管理系統(tǒng)的核心部分,網(wǎng)絡故障診斷按功能不同分為數(shù)據(jù)分析模塊和網(wǎng)絡故障定位模塊兩部分。數(shù)據(jù)分析模塊根據(jù)數(shù)據(jù)特征將數(shù)據(jù)分為3類,即開關量數(shù)據(jù)、普通動態(tài)數(shù)據(jù)、靜態(tài)數(shù)據(jù),根據(jù)不同的數(shù)據(jù)特點采用不同的數(shù)據(jù)分析策略,對數(shù)據(jù)進行分析,為網(wǎng)絡故障定位模塊做最后的數(shù)據(jù)準備。
圖2 系統(tǒng)的網(wǎng)絡拓撲結構
圖3 系統(tǒng)總體結構框圖
網(wǎng)絡故障定位模塊主要運用案例對比庫以及模糊專家系統(tǒng)準確定位網(wǎng)絡故障點,并提供網(wǎng)絡當前可能出現(xiàn)的故障列表,以及各故障的可能解決方案并及時報警,確保網(wǎng)絡管理員快速準確地處理網(wǎng)絡故障。
本文詳細介紹了智能網(wǎng)絡管理系統(tǒng)的總體架構,以及系統(tǒng)開發(fā)的需求分析、總體目標和系統(tǒng)研發(fā)背景,并給出了系統(tǒng)的總體設計架構,對SNMP在實際網(wǎng)絡管理系統(tǒng)的應用研究具有較高的理論價值及實際意義。
[1]陳浩光,陳慶華,張榮.網(wǎng)絡計劃模型中計算安全時差的一種模糊模型[J].系統(tǒng)工程學報,2001(3):192-196.
[2]周振江.基于SNMP的網(wǎng)絡管理系統(tǒng)設計與實現(xiàn)[D].南京:南京航空航天大學,2005:11-13.
[3]白英彩,田小鵬,楊銳.計算機網(wǎng)絡管理系統(tǒng)設計與應用[M].北京:清華大學出版社,1998.
[4]李士勇.模糊控制與智能控制理論[M].哈爾濱:哈爾濱工業(yè)大學出版社,1998.