王能輝
(寶雞文理學院陜西寶雞721013)
網(wǎng)絡管理是保障網(wǎng)絡可靠運行的最重要手段,隨著學校信息化建設的不斷深入,網(wǎng)絡管理系統(tǒng)在日常運維中發(fā)揮著越來越重要的作用。國外,網(wǎng)絡設備管理系統(tǒng)應用較早且發(fā)展較快,在諸多領域中具有廣泛的發(fā)展空間。目前主流的通用型網(wǎng)絡管理解決方案有四種,AT-SNMPc7.0解決方案、惠普公司的HP OpenView方案、CA公司的CA Unicenter方案、IBM Tivoli NetView方案。AT-SNMPcD的特色在于提供兩個SNMP服務器,兩個服務器之間可以相互備份,提高網(wǎng)絡管理系統(tǒng)的安全性[1]。HP OpenView是一套功能非常完善的網(wǎng)絡設備管理系統(tǒng),集成了網(wǎng)絡管理和系統(tǒng)管理的優(yōu)點,能夠及時告知網(wǎng)絡管理人員故障發(fā)生及故障發(fā)生的原因,從而輕松而順利地實現(xiàn)網(wǎng)絡運作從被動無序到主動控制的過渡,幫助網(wǎng)絡運行部及時了解整個網(wǎng)絡當前的真實狀況,掌握主動控制[2]。Unicenter是CA的旗艦產品,其支持所有主流平臺,功能完整。IBM Tivoli NetView獨有的的新的位置敏感性拓撲(Location Sensitive Topology)特性可讓網(wǎng)管人員通過簡單的配置自動生成一些與管理人員對網(wǎng)絡的直觀認識更加貼近的拓撲視圖[3]。國內,也有學者就網(wǎng)管系統(tǒng)展開研究,并取得了一定的成效。唐學文等設計并實現(xiàn)了可用于IPv6網(wǎng)絡的網(wǎng)絡管理系統(tǒng)[4];肖雁鵬根據(jù)Visibroker的C++開發(fā)方法實現(xiàn)了SDH網(wǎng)管系統(tǒng)北向接口[5];步園明設計并實現(xiàn)了一個基于Web技術且支持SNMP協(xié)議的網(wǎng)絡管理系統(tǒng)[6];孟起勝等介紹了一種以基于已經部署的DOCSIS網(wǎng)絡管理系統(tǒng)管理EPON網(wǎng)絡的一種網(wǎng)絡架構方案[7];崔雯雯提出基于嵌入式代理、采用集中管理與分層管理兩種模式結合的HiNoC網(wǎng)絡管理方案,基于此方案,實現(xiàn)了HiNoC網(wǎng)管系統(tǒng)[8];孔祥云等提出了一種基于主成分分析的網(wǎng)絡數(shù)據(jù)挖掘方法,并通過對實際網(wǎng)絡數(shù)據(jù)的分析、比較,驗證了該方法的有效性[9];陳家雄等給出了MSTP網(wǎng)管系統(tǒng)北向接口的設計與實現(xiàn)方案,闡明了北向接口的總體架構、交互機制和功能規(guī)劃等方面的設計思路[10];馬青青提出一種基于Ext JS 4.2.1的嵌入式網(wǎng)絡管理系統(tǒng)設計方案,并完成系統(tǒng)的設計[11]。我?,F(xiàn)有網(wǎng)絡管理系統(tǒng)是2006年開發(fā)的,只支持有線設備的管理,不支持無線AP的管理,而且現(xiàn)有網(wǎng)絡管理系統(tǒng)功能過于簡單,只能判斷網(wǎng)絡設備通斷,無法直接查看網(wǎng)絡設備運行的信息。對服務器或主機進行管理的系統(tǒng)是另外一套管理系統(tǒng),這套管理系統(tǒng)不能同時監(jiān)控所有的服務器設備,只能監(jiān)控同廠家的服務器。針對現(xiàn)有網(wǎng)絡管理系統(tǒng)存在的不足,本研究設計并實現(xiàn)了一套多節(jié)點網(wǎng)絡設備管理系統(tǒng),此系統(tǒng)可實現(xiàn)對所有網(wǎng)絡設備實時監(jiān)控和異常告警,網(wǎng)絡管理人員可以實時查看網(wǎng)絡設備運行信息和告警信息,及時發(fā)現(xiàn)并解決網(wǎng)絡問題。
從系統(tǒng)架構上,分多節(jié)點網(wǎng)絡設備管理系統(tǒng)可分為5層,包括基礎實施層,指的是網(wǎng)絡設備資源;感知層,用于網(wǎng)絡設備運行信息的獲?。粋鬏攲?,采集節(jié)點將采集數(shù)據(jù)發(fā)送到總控節(jié)點所采用的傳輸協(xié)議;服務層,總控節(jié)點啟用WebService服務將獲取的信息發(fā)布出去,應用層,用戶獲取信息的處理和應用。本研究采用分層的思想設計分多節(jié)點網(wǎng)絡設備管理系統(tǒng),具體架構如圖1所示。
圖1 系統(tǒng)架構圖
為了幫助網(wǎng)絡管理人員簡單、直觀、有效的掌握網(wǎng)絡設備的運行狀態(tài)和健康水平,了解網(wǎng)絡設備動態(tài)變化趨勢,及時發(fā)現(xiàn)可能對業(yè)務及用戶造成的威脅,快速查明導致業(yè)務中斷和網(wǎng)絡設備異常的問題源,協(xié)助網(wǎng)絡維護人員及時對網(wǎng)絡故障響應處理,降低學校運營風險,文章設計了多節(jié)點網(wǎng)絡設備管理系統(tǒng)。此系統(tǒng)主要包括網(wǎng)絡拓撲管理、網(wǎng)絡設備管理、網(wǎng)絡設備告警管理、統(tǒng)計報表等4大模塊,其具體功能框架如圖2所示。
圖2 系統(tǒng)功能框架圖
網(wǎng)絡拓撲管理:此功能可快速、有效的的實現(xiàn)二、三層網(wǎng)絡拓撲的自動發(fā)現(xiàn),并通過拓撲圖和網(wǎng)絡設備的運行狀態(tài)、設備信息、流量信息數(shù)據(jù)相關聯(lián),幫助網(wǎng)絡管理人員快速發(fā)現(xiàn)網(wǎng)絡運維中的各種問題,輕松實現(xiàn)網(wǎng)管。網(wǎng)絡拓撲管理包含功能有網(wǎng)絡拓撲的發(fā)現(xiàn)和網(wǎng)絡拓撲的維護。
網(wǎng)絡設備管理:主要對網(wǎng)絡設備各種參數(shù)的實時監(jiān)控,包括網(wǎng)絡設備的指標管理、網(wǎng)絡設備的性能管理和網(wǎng)絡設備的流量管理。
網(wǎng)絡設備告警管理:網(wǎng)絡設備運行異常時,會通過此功能將網(wǎng)絡管理人員定制的告警信息發(fā)送給網(wǎng)絡管理人員。此功能包括:告警信息定制、告警信息查看、告警信息處理。
統(tǒng)計報表功能:統(tǒng)計網(wǎng)絡設備運行時產生的各項信息,方便用戶查看。此功能包括:報表定制和報表查看。
開發(fā)多節(jié)點網(wǎng)絡設備管理系統(tǒng),需要搭建兩個服務器:Web服務器和數(shù)據(jù)庫服務器[12]。Web服務器提供網(wǎng)頁供網(wǎng)絡管理人員登錄和瀏覽;數(shù)據(jù)庫服務器則存儲和管理網(wǎng)絡管理系統(tǒng)中拓撲、網(wǎng)絡設備參數(shù)、告警等信息。可以選擇的Web服務器軟件有很多,如 BEA WebLogic 、IBM WebSphere Server、Apache Tomcat等[13],本研究選用 Apache Tomcat服務器作為Web服務器,數(shù)據(jù)庫服務器選擇微軟公司的SQL Server 2008。
文章中的網(wǎng)絡設備管理系統(tǒng)系統(tǒng)采用JDK(Java Developer Kit,Java開發(fā)工具包)和 JSP代碼編輯工具開發(fā)。目前功能強大的JSP編輯開發(fā)工具,如 Jbuilder、Eclipse、IBM Rational等,鑒于 Eclipse是一個基于Java的、開源的可擴展平臺且有豐富的插件集,文章選用Eclipse開發(fā)平臺[14]。
考慮到實現(xiàn)大規(guī)模網(wǎng)絡設備的監(jiān)控,基于分布式架構的思想,搭建若干個采集節(jié)點采集網(wǎng)絡設備運行數(shù)據(jù),然后通過TCP協(xié)議上傳至主控節(jié)點。用戶不需要與采集節(jié)點直接交互,不需要關心具體由哪個采集節(jié)點來完成數(shù)據(jù)采集的工作,就可以實現(xiàn)具體業(yè)務數(shù)據(jù)的采集。采集節(jié)點上安裝采集SNMP工具來獲取網(wǎng)絡設備運行信息,具體流程圖如圖3所示。
圖3 分布式采集流程圖
在網(wǎng)絡拓撲結構的自動發(fā)現(xiàn)的實現(xiàn)過程中,先使用SNMP協(xié)議搜索路由表信息構造網(wǎng)絡主拓撲,然后使用ARP協(xié)議或者ICMP協(xié)議發(fā)現(xiàn)子網(wǎng)中的終端設備,以實現(xiàn)子拓撲的構建[15],最終可實現(xiàn)網(wǎng)絡拓撲的發(fā)現(xiàn)。
用戶發(fā)起SNMP請求后,主控節(jié)點通過Web服務接收到該請求,然后下發(fā)該請求給采集節(jié)點,采集節(jié)點通過SNMP協(xié)議可獲取網(wǎng)絡設備指標信息。用戶可以通過Web的方式查看監(jiān)控的網(wǎng)絡設備具體信息,可查看的信息一般有設備信息指標和設備性能指標[16]。設備信息指標包括:型號、MAC地址、電源類型、連續(xù)運行時間。設備性能指標有總流量、所有接口發(fā)送丟包數(shù)、CPU利用率、總接收吞吐量、廣播包速率、內存利用率、Ping時延、總發(fā)送吞吐量、所有接口接收丟包數(shù)、發(fā)送廣播包數(shù)、丟包速率、ICMP包速率[17]。以我??萍紭嵌?設備為例,該設備信息指標如圖4所示。
圖4 網(wǎng)絡設備信息指標圖
本系統(tǒng)可通過TELNET(或者SSH)到網(wǎng)絡管理人員想要管理的網(wǎng)絡設備,然后通過FTP協(xié)議或SNMP協(xié)議下載該網(wǎng)絡設備的配置。變更后根據(jù)需要可保存到網(wǎng)絡設備管理系統(tǒng)或將變更后的配置上傳至原來的網(wǎng)絡設備。
設置SNMP輪巡時間,通過SNMP輪巡,一旦發(fā)現(xiàn)某接口故障,可產生告警信息。網(wǎng)絡管理人員可利用設備告警功能,及時發(fā)現(xiàn)設備故障,快速響應,以縮短故障處理時間。
通過查詢數(shù)據(jù)庫可統(tǒng)計一定時間內設備指標報表、告警統(tǒng)計報表、告警授理報表、端口流量報表、流量統(tǒng)計報表[18]。
利用上述多節(jié)點網(wǎng)絡設備管理系統(tǒng)在寶雞文理學院網(wǎng)絡管理中心進行試驗,對學生公寓匯聚交換機RG-S5750(IP地址:10.100.32.1)進行 24 小時監(jiān)控(2017年04月20日),實時CPU利用率、內存利用率、Ping時延、丟包速率、總流量等網(wǎng)絡設備指標信息,利用網(wǎng)絡管理系統(tǒng)統(tǒng)計報表功能導出測試數(shù)據(jù)如表1所示。從表1可以看出,在24小時內,通過多節(jié)點網(wǎng)絡設備管理系統(tǒng)可以實時獲取實時CPU利用率、內存利用率、ICMP包速率、Ping時延、丟包速率、總發(fā)送吞吐量、總接收吞吐量、總流量等網(wǎng)絡設備指標信息。24小時均能采集到設備運行信息,體現(xiàn)了該網(wǎng)絡設備管理系統(tǒng)的穩(wěn)定性。通過瀏覽器訪問主控服務器查看網(wǎng)絡拓撲的平均時間在2 s以內,完全達到了實際使用的要求。
表1 網(wǎng)絡設備指標測試數(shù)據(jù)
網(wǎng)絡設備管理系統(tǒng)作為網(wǎng)絡運維支撐的重要手段,在日常網(wǎng)絡維護中發(fā)揮著重要作用。針對現(xiàn)有的基于單點采集的網(wǎng)絡設備管理系統(tǒng)的不足,文章設計并實現(xiàn)了一種多節(jié)點網(wǎng)絡設備管理系統(tǒng)。該系統(tǒng)已經在項目中得到具體應用,對大規(guī)模網(wǎng)絡設備的管理提供了一種新的思路,對現(xiàn)有的基于SNMP協(xié)議的網(wǎng)絡設備管理系統(tǒng)改造有一定的參考意義。通過實際部署發(fā)現(xiàn),該系統(tǒng)運行穩(wěn)定,能實現(xiàn)大規(guī)模網(wǎng)絡設備的管理,能實現(xiàn)網(wǎng)絡管理軟件應有的功能,能滿足網(wǎng)絡管理人員的需求。