萬(wàn)燕珍 陳思超 高水 楊謝婷
(國(guó)網(wǎng)浙江杭州市蕭山區(qū)供電公司浙江省杭州市310000)
企業(yè)通用型網(wǎng)絡(luò)監(jiān)測(cè)軟件研究
萬(wàn)燕珍 陳思超 高水 楊謝婷
(國(guó)網(wǎng)浙江杭州市蕭山區(qū)供電公司浙江省杭州市310000)
隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,人們的生活、工作都離不開網(wǎng)絡(luò),而數(shù)據(jù)網(wǎng)絡(luò)在企業(yè)中也扮演著越來(lái)越重要的角色。作為公司各項(xiàng)業(yè)務(wù)系統(tǒng)的基礎(chǔ)支撐,保障信息網(wǎng)絡(luò)的穩(wěn)定運(yùn)行具有極為重要的意義。根據(jù)公司的要求,需要對(duì)重要業(yè)務(wù)系統(tǒng)以及終端機(jī)進(jìn)行監(jiān)控,一旦發(fā)生故障,需進(jìn)行及時(shí)的恢復(fù),以不影響正常工作為基本要求。
通用;網(wǎng)絡(luò)監(jiān)測(cè)
21世紀(jì)是信息技術(shù)高速發(fā)展的一個(gè)時(shí)代,信息網(wǎng)絡(luò)已然滲透到了我們生活、工作的方方面面。隨著計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,我國(guó)信息化建設(shè)不斷取得進(jìn)展,各行各業(yè)包括諸如政府、金融、教育、醫(yī)療等企業(yè)都逐漸將核心業(yè)務(wù)移植到網(wǎng)絡(luò)上來(lái)。企業(yè)IT部門的職責(zé)也在潛移默化中轉(zhuǎn)變:由被動(dòng)實(shí)現(xiàn)業(yè)務(wù)需求到主動(dòng)參與業(yè)務(wù)流程的制定、由建設(shè)層次向規(guī)劃層次過渡、由技術(shù)層次向應(yīng)用層次過度等等。在這些企業(yè)中,基礎(chǔ)網(wǎng)絡(luò)往往支撐著多個(gè)重要的業(yè)務(wù)系統(tǒng)和終端,一旦系統(tǒng)故障,可能會(huì)造成不可估量的損失,因此保障網(wǎng)絡(luò)的可靠性、可用性和安全性具有舉足輕重的意義。
目前,筆者公司應(yīng)用的為BTIM北塔網(wǎng)管軟件,能展現(xiàn)實(shí)際的網(wǎng)絡(luò)拓?fù)?,并以圖形化界面展示網(wǎng)絡(luò)通斷情況,能滿足基本的網(wǎng)絡(luò)管理需求。然而,在應(yīng)用該軟件的過程中,我們發(fā)現(xiàn)該軟件有幾個(gè)缺點(diǎn):①故障提醒不夠及時(shí),沒有警示彈窗,且不能將故障定位。②不能對(duì)終端機(jī)進(jìn)行監(jiān)控,監(jiān)測(cè)對(duì)象全但并無(wú)重點(diǎn)。③過于專業(yè)化,在日常管理方面需要一個(gè)網(wǎng)絡(luò)方面的專業(yè)人員才能進(jìn)行網(wǎng)絡(luò)狀況的監(jiān)測(cè)。因此,有可能存在故障發(fā)現(xiàn)不及時(shí)、影響各項(xiàng)業(yè)務(wù)的正常運(yùn)行等問題,為了解決上述問題,增強(qiáng)對(duì)各項(xiàng)重點(diǎn)業(yè)務(wù)的實(shí)時(shí)監(jiān)控,使非專業(yè)人員也能進(jìn)行網(wǎng)絡(luò)情況的監(jiān)測(cè),我們計(jì)劃在基于btim軟件的基礎(chǔ)上自行研制一種企業(yè)通用型網(wǎng)絡(luò)監(jiān)測(cè)小型軟件,只需添加被監(jiān)測(cè)的系統(tǒng)后點(diǎn)擊開始即可完成監(jiān)測(cè)工作。
該監(jiān)測(cè)系統(tǒng)不僅能讓網(wǎng)絡(luò)管理人員隨時(shí)隨地一目了然地了解整個(gè)IT系統(tǒng)的運(yùn)行狀況,而且能從應(yīng)用層面對(duì)IT系統(tǒng)的關(guān)鍵應(yīng)用進(jìn)行實(shí)時(shí)監(jiān)測(cè),一旦系統(tǒng)出現(xiàn)異常,通過手機(jī)短信息的方式及時(shí)通知相關(guān)人員進(jìn)行故障處理,從而盡可能的的減少IT系統(tǒng)出現(xiàn)故障的可能,降低由此可能給單位的損失。完善的報(bào)告更能幫助網(wǎng)絡(luò)管理人員預(yù)防可能出現(xiàn)的故障,同時(shí)為單位網(wǎng)絡(luò)的戰(zhàn)略規(guī)劃提供依據(jù)。
軟件需求分析是開發(fā)軟件的第一步,首先,我們將本次軟件的研發(fā)定位為基于現(xiàn)有的btim軟件進(jìn)行開發(fā),這就意味著我們需要編寫程序后,再與btim系統(tǒng)建立接口,完成整個(gè)開發(fā)過程。
然后,我們將研究的要求進(jìn)行逐步細(xì)化后,得到以下具體功能需求;
(1)結(jié)合btim網(wǎng)管系統(tǒng),針對(duì)公司重點(diǎn)業(yè)務(wù)系統(tǒng)和終端進(jìn)行實(shí)時(shí)監(jiān)測(cè)。
(2)發(fā)生故障時(shí),系統(tǒng)會(huì)彈窗提醒,并向網(wǎng)絡(luò)運(yùn)維人員手機(jī)上發(fā)送短信。
(3)定位故障發(fā)生點(diǎn),將最可能發(fā)生的故障點(diǎn)和可能的故障原因同時(shí)展現(xiàn)在彈窗中。
該軟件由三部分組成:管理器、監(jiān)測(cè)程序和短信網(wǎng)關(guān)。其中,管理器指的就是一個(gè)圖形化界面,采用多窗口的模式的C/S架構(gòu)應(yīng)用程序,主要用于系統(tǒng)參數(shù)的設(shè)置、監(jiān)測(cè)報(bào)告的查看等。
監(jiān)測(cè)程序,主要基于ICMP和SNMP協(xié)議對(duì)預(yù)設(shè)的目標(biāo)IP地址池進(jìn)行網(wǎng)絡(luò)監(jiān)測(cè),可根據(jù)監(jiān)測(cè)結(jié)果判斷出故障發(fā)生點(diǎn),并形成監(jiān)測(cè)報(bào)告和進(jìn)行彈窗提醒。
短信網(wǎng)關(guān),是指安裝在某臺(tái)主機(jī)上的短信收發(fā)網(wǎng)關(guān),它支持包括GSM-MODEM、網(wǎng)絡(luò)接口等方式接收和發(fā)送手機(jī)短信,任何檢測(cè)器需要發(fā)送短信時(shí)都通過它完成。
軟件的開發(fā)過程中需遵從以下幾點(diǎn)原則:
(1)安全性:根據(jù)公司對(duì)信息網(wǎng)絡(luò)的安全要求,提供有效的安全保障。
(2)實(shí)用性:操作方式符合大多數(shù)人的Windows操作習(xí)慣,注重細(xì)節(jié)的人性化設(shè)計(jì),讓操作盡量簡(jiǎn)潔明了。
(3)適應(yīng)性:能適應(yīng)當(dāng)前復(fù)雜的網(wǎng)絡(luò)情況,具有足夠的適用性,并且要充分考慮今后一段時(shí)間內(nèi)網(wǎng)絡(luò)架構(gòu)的變化情況。
(4)靈活性:從系統(tǒng)數(shù)據(jù)初始化、系統(tǒng)操作使用等多方面考慮到系統(tǒng)運(yùn)維的靈活性,使各級(jí)人員的操作盡量簡(jiǎn)單、方便。
了解系統(tǒng)的工作流程是軟件開發(fā)過程中的一個(gè)重要步驟,只有對(duì)系統(tǒng)流程有了充分的理解才能成功開發(fā)出所需求的系統(tǒng)。因此,我們根據(jù)前期的需求分析以及調(diào)研,結(jié)合現(xiàn)有的技術(shù)和條件,對(duì)系統(tǒng)流程進(jìn)行了分析。分析后,我們將該系統(tǒng)的總體流程分為四個(gè)方面,分別為監(jiān)測(cè)計(jì)劃、執(zhí)行監(jiān)測(cè)、異常告警和故障分析,具體流程圖如圖1。
圖1 系統(tǒng)總流程圖
4.1 監(jiān)測(cè)計(jì)劃
在該階段:①我們需明確所監(jiān)測(cè)的對(duì)象,即添加或刪除所需監(jiān)測(cè)對(duì)象的IP地址,如若跳過這一步則視為監(jiān)測(cè)默認(rèn)的對(duì)象。②設(shè)定監(jiān)測(cè)和輪詢的時(shí)間,在該時(shí)間內(nèi),對(duì)所需監(jiān)測(cè)的對(duì)象進(jìn)行不間斷的通斷檢測(cè),以便在故障發(fā)生后的最短時(shí)間內(nèi)進(jìn)行識(shí)別。
4.2 執(zhí)行監(jiān)測(cè)
該步驟是整個(gè)架構(gòu)中的關(guān)鍵,主要實(shí)現(xiàn)的功能是實(shí)現(xiàn)對(duì)重要業(yè)務(wù)系統(tǒng)及終端的監(jiān)測(cè),同時(shí)對(duì)監(jiān)測(cè)結(jié)果進(jìn)行判斷,根據(jù)判斷結(jié)果進(jìn)入到下一階段。
4.3 異常告警
當(dāng)檢測(cè)到系統(tǒng)或者主機(jī)發(fā)生故障后,為了讓技術(shù)人員第一時(shí)間發(fā)現(xiàn)故障,我們采取了兩種告警方式,分別是彈窗告警和短信通知,其中短信通知需通過短信網(wǎng)關(guān)發(fā)送到負(fù)責(zé)人處。
4.4 故障分析
在發(fā)送了告警之后,系統(tǒng)進(jìn)入故障分析階段,通過一定的技術(shù)手段將故障發(fā)生點(diǎn)進(jìn)行大致的定位,同時(shí),通過對(duì)系統(tǒng)的各類反應(yīng)分析出故障的類型,將這些內(nèi)容形成一個(gè)報(bào)告后發(fā)送給管理者,在其進(jìn)行搶修和做出其他應(yīng)急決策時(shí)具有一定的參考價(jià)值。
ping技術(shù):ping是一種電腦工具,用來(lái)測(cè)試數(shù)據(jù)包能否都通過IP協(xié)議到達(dá)特定主機(jī)。Ping的運(yùn)作原理是向目標(biāo)主機(jī)傳出一個(gè)ICMPecho要求數(shù)據(jù)包,并等待接收echo回應(yīng)數(shù)據(jù)包。程序會(huì)按時(shí)間和成功響應(yīng)的次率(丟包率)和數(shù)據(jù)包往返時(shí)間(網(wǎng)絡(luò)時(shí)延)來(lái)確定網(wǎng)絡(luò)的通斷情況。
Tracert(跟蹤路由)技術(shù):用于確定IP數(shù)據(jù)包訪問目標(biāo)所采取的路徑,其工作原理是通過向目標(biāo)發(fā)送不同IP生存時(shí)間(TTL)值的ICMP回應(yīng)數(shù)據(jù)包,跟蹤路由診斷程序會(huì)確定到目標(biāo)所采取的路由。該技術(shù)可以在實(shí)際應(yīng)用中找到網(wǎng)絡(luò)的中斷點(diǎn),便于排查網(wǎng)絡(luò)故障。
SNMP(簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議):SNMP協(xié)議以TCP/IP的協(xié)議為基礎(chǔ),采用網(wǎng)絡(luò)管理站-代理的管理模型。網(wǎng)絡(luò)管理站是SNMP網(wǎng)絡(luò)管理的決策機(jī)構(gòu),它負(fù)責(zé)向遠(yuǎn)程代理發(fā)出請(qǐng)求命令和接收來(lái)自代理的信息以實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)設(shè)備的管理。而代理則運(yùn)行于被管理的設(shè)備的內(nèi)部,負(fù)責(zé)將來(lái)自管理站的一般化信息請(qǐng)求轉(zhuǎn)換為本地?cái)?shù)據(jù)結(jié)構(gòu)的等有效資源,并對(duì)該管理資源實(shí)施操作,然后返回操作結(jié)果,最后回到等待狀態(tài)。另外,代理也可以把在自身系統(tǒng)巾發(fā)生的車件主動(dòng)通知給管理站。
在該系統(tǒng)成功研制之后,我們對(duì)其進(jìn)行了應(yīng)用,針對(duì)營(yíng)業(yè)廳窗口視頻監(jiān)控業(yè)務(wù)、變電站CAC油色譜在線監(jiān)測(cè)業(yè)務(wù)的在線情況進(jìn)行實(shí)時(shí)監(jiān)控,并對(duì)多個(gè)重要的終端機(jī)進(jìn)行了監(jiān)控。在應(yīng)用該成果之后,獲得了良好的安全效益和經(jīng)濟(jì)效益。
圖2 系統(tǒng)軟件架構(gòu)圖
6.1 安全效益
通過本項(xiàng)目的實(shí)施,對(duì)我公司信息網(wǎng)絡(luò)更高的運(yùn)行保障率,及早的發(fā)現(xiàn)網(wǎng)絡(luò)的薄弱點(diǎn)。利用軟件自身判斷的特性,及早提醒運(yùn)維人員網(wǎng)絡(luò)所發(fā)生的故障,提高安全效益。
6.2 經(jīng)濟(jì)效益
本項(xiàng)目的實(shí)施也有利于提高信通專業(yè)網(wǎng)絡(luò)的支撐水平,同時(shí)還提高了生產(chǎn)、經(jīng)營(yíng)的效率,使信息網(wǎng)絡(luò)更好的為全局服務(wù)。保障重要業(yè)務(wù)系統(tǒng)和終端機(jī)的平穩(wěn)運(yùn)行,避免發(fā)生系統(tǒng)中斷,降低公司不必要的經(jīng)濟(jì)損失。
該網(wǎng)絡(luò)監(jiān)測(cè)管理系統(tǒng)實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)整體性能的監(jiān)測(cè),有助于及時(shí)發(fā)現(xiàn)、定位網(wǎng)絡(luò)故障,有助于優(yōu)化網(wǎng)絡(luò)資源的利用,有助于提高了網(wǎng)絡(luò)管理的效率,有助于提高用戶服務(wù)質(zhì)量。該系統(tǒng)滿足筆者公司的管理需要,并且具備一定的推廣價(jià)值,實(shí)現(xiàn)了系統(tǒng)的開發(fā)目標(biāo),并在應(yīng)用中取得了良好的效果。
TP277
A
1004-7344(2016)16-0303-02
2016-5-16