摘 要:隨著高校信息化建設(shè)持續(xù)深入,日益嚴(yán)峻的IT運(yùn)維管理難題已成為高校信息化建設(shè)的攔路虎。使用Nagios和Cacti開源軟件構(gòu)建了IT運(yùn)維管理系統(tǒng)平臺,具有成本低、覆蓋廣、可視化和響應(yīng)快等優(yōu)勢,提高了高校IT服務(wù)的整體效率和服務(wù)水平,用戶的體驗(yàn)也大大提升。
關(guān)鍵詞: IT運(yùn)維管理;Nagios;Cacti
中圖分類號:G642 文獻(xiàn)標(biāo)識碼:A 文章編號:1673-9795(2013)06(b)-0000-00
IT技術(shù)迅猛發(fā)展改變了信息的獲取、處理和傳播方式,高校的教學(xué)、科研、管理和對外交流等業(yè)務(wù)對IT系統(tǒng)的依賴越來越高。隨著高校信息化建設(shè)持續(xù)深入,其網(wǎng)絡(luò)規(guī)模不斷擴(kuò)大、網(wǎng)絡(luò)結(jié)構(gòu)日益復(fù)雜與網(wǎng)絡(luò)應(yīng)用業(yè)務(wù)日新月異,必然要考慮到IT系統(tǒng)的穩(wěn)定性、可靠性與安全性等問題。
高校的IT系統(tǒng)管理面臨著以下問題:監(jiān)控不同的網(wǎng)絡(luò)設(shè)備和業(yè)務(wù)系統(tǒng)可能需要購買幾種監(jiān)控軟件,導(dǎo)致監(jiān)控軟件整體成本較高。這些監(jiān)控軟件各自為政,相互獨(dú)立,導(dǎo)致監(jiān)控覆蓋面斷裂,沒有對整個IT系統(tǒng)的進(jìn)行統(tǒng)一監(jiān)控。由于沒有IT系統(tǒng)管理范圍整體可視化監(jiān)控界面,IT系統(tǒng)管理員很難直接判定問題是出在基礎(chǔ)網(wǎng)絡(luò)、系統(tǒng)服務(wù)器、數(shù)據(jù)庫還是應(yīng)用系統(tǒng)自身,不便于故障的追根溯源。故障難以定位將直接導(dǎo)致業(yè)務(wù)恢復(fù)時間的推遲,影響業(yè)務(wù)系統(tǒng)的正常運(yùn)行,大大降低服務(wù)質(zhì)量,用戶體驗(yàn)較差。日益嚴(yán)峻的IT運(yùn)維管理難題成為高校信息化建設(shè)的攔路虎,建立統(tǒng)一的IT運(yùn)維管理系統(tǒng)平臺迫在眉睫。
1 IT運(yùn)維管理系統(tǒng)的選擇
IT運(yùn)維管理的概念是從傳統(tǒng)的網(wǎng)絡(luò)管理延伸而來的。IT運(yùn)維管理是指單位 IT 部門采用相關(guān)的方法、手段、技術(shù)、制度、流程和文檔等,對IT 運(yùn)行環(huán)境(如硬軟件環(huán)境、網(wǎng)絡(luò)環(huán)境等)、IT 業(yè)務(wù)系統(tǒng)和 IT 運(yùn)維人員進(jìn)行的綜合管理。IT運(yùn)維管理其實(shí)對底層IT基礎(chǔ)設(shè)施、應(yīng)用服務(wù)和業(yè)務(wù)服務(wù)的綜合管理。其中主要包括:主機(jī)管理、網(wǎng)絡(luò)設(shè)備管理、應(yīng)用服務(wù)管理、機(jī)房環(huán)境管理、IT 運(yùn)維人員權(quán)限管理和各類故障預(yù)警告警。
近年來,IT運(yùn)維管理系統(tǒng)主要是在HP OpenView、IBM Tivoli、CA Unicenter和 BMC Patrol這四家商業(yè)軟件的推動之下成長和演變的。但四大商業(yè)軟件的成本較高且難以定制,開源軟件作為一種替代性選擇開始得到越來越多的關(guān)注。最終用戶不光可以免費(fèi)使用,還可以根據(jù)IT系統(tǒng)實(shí)際配置靈活自由的對軟件進(jìn)行定制,并且可以通過開源軟件社區(qū)獲得技術(shù)支持。
Nagios是一個監(jiān)控系統(tǒng)運(yùn)行狀態(tài)和網(wǎng)絡(luò)信息的開源監(jiān)控系統(tǒng)。Nagios所有的監(jiān)控是由插件(Nagios Plugins)完成的,插件將監(jiān)控的結(jié)果返回給Nagios,Nagios分析這些結(jié)果,同時提供相應(yīng)的報(bào)警功能(由插件完成的)。在http://www.nagios.org/上可以下載到Nagios XI和 Nagios Plugins 1.4.16。
Cacti 是一款界面非常友好的開源軟件,是基于PHP、MySQL、SNMP及RRDTool開發(fā)的網(wǎng)絡(luò)流量監(jiān)測圖形分析工具。通過Snmpget來獲取數(shù)據(jù),使用 RRDtool繪畫圖形,以WEB方式很直觀的查看主機(jī)的性能負(fù)載,磁盤利用率等情況。
2 開源IT運(yùn)維管理系統(tǒng)平臺的構(gòu)建
Nagios比較注重于主機(jī)、網(wǎng)絡(luò)、應(yīng)用和機(jī)房的監(jiān)控,并且報(bào)警功能也很強(qiáng)大,其監(jiān)控與報(bào)警功能均由插件完成,Nagios Plugins 1.4.16中包含官方提供的50個Naigos插件,在http://exchange.nagios.org/網(wǎng)站上面還有427個類別3810個擴(kuò)展插件。如果所要監(jiān)控的設(shè)備或應(yīng)用比較特殊,也可編寫自己的插件,只要自定義的插件符合腳本輸出原則與狀態(tài)代碼原則就可以被Nagios支持。但Nagios對像流量這樣的持續(xù)數(shù)據(jù)的展現(xiàn)能力卻比較弱,而這方面是Cacti的強(qiáng)項(xiàng),Cacti比較著重于直觀數(shù)據(jù)的監(jiān)控,易于生成圖形,很容易得到一段時間內(nèi)某項(xiàng)數(shù)據(jù)指標(biāo)的變化趨勢(比如網(wǎng)絡(luò)流量的增長趨勢、服務(wù)器負(fù)載的趨勢等)。利用NPC(Nagios Plugin for Cacti)插件把兩者結(jié)合起來,既可以使報(bào)警機(jī)制高效及時,又可以得到可視化的運(yùn)維管理圖并很容易的查看各項(xiàng)數(shù)據(jù)的情況。本文構(gòu)建的IT開源運(yùn)維管理系統(tǒng)是由Nagios和Cacti兩大部分利用其各自的優(yōu)勢互補(bǔ)組成的。
其中使用Nagios監(jiān)控主機(jī)資源(Windows、Unix、Linux等操作系統(tǒng)的CPU的利用率,磁盤讀寫速率,內(nèi)存占用率,文件系統(tǒng)的利用率,重要的進(jìn)程的啟動、停止和狀態(tài)改變情況,主機(jī)的系統(tǒng)日志等);監(jiān)控網(wǎng)絡(luò)設(shè)備(路由器、交換機(jī)、防火墻、負(fù)載均衡、語音設(shè)備、存儲和入侵檢測系統(tǒng)等設(shè)備可用性、設(shè)備性能、流量等指標(biāo));監(jiān)控應(yīng)用服務(wù)(Web、DNS、文件服務(wù)、郵件系統(tǒng)、數(shù)據(jù)庫、以及各種ERP,CRM系統(tǒng)等可用性、系統(tǒng)資源占用和性能指標(biāo)的管理等);監(jiān)控機(jī)房環(huán)境(機(jī)房的溫度、濕度,UPS電壓電量,精密空調(diào)工作狀態(tài)等),并可以對各監(jiān)控項(xiàng)目設(shè)定多個預(yù)警報(bào)警閾值,利用電子郵件、手機(jī)短信、預(yù)錄語音和即時通訊等方式對不同權(quán)限的IT系統(tǒng)管理員進(jìn)行即時報(bào)警,精確定位故障點(diǎn),迅速完成故障診斷,實(shí)施有效的故障解決方案,實(shí)現(xiàn)降低系統(tǒng)故障率,為用戶提供良好的體驗(yàn)。利用Cacti的Weathermap插件以圖形化地圖的方式直觀地顯示網(wǎng)絡(luò)鏈路的帶寬和負(fù)載狀況。Cacti也提供了非常強(qiáng)大的用戶管理功能,與LDAP結(jié)合進(jìn)行用戶驗(yàn)證,可以指定每一個用戶能查看的樹狀結(jié)構(gòu)、host以及任何一張圖。
3 結(jié)語
利用開源的 Cacti 和 Nagios 軟件,成功搭建了IT運(yùn)維管理系統(tǒng)平臺,實(shí)現(xiàn)了對主機(jī)、網(wǎng)絡(luò)設(shè)備、應(yīng)用業(yè)務(wù)、機(jī)房環(huán)境的運(yùn)行狀態(tài)實(shí)時監(jiān)控,并實(shí)現(xiàn)了系統(tǒng)管理員權(quán)限的管理和多途徑的即時報(bào)警功能。此IT運(yùn)維管理系統(tǒng)平臺使用開源軟件大幅減少了建設(shè)成本,覆蓋全部IT設(shè)備和應(yīng)用服務(wù),可視化的運(yùn)維管理圖可精確定位故障點(diǎn),即時報(bào)警使得系統(tǒng)管理員快速響應(yīng),可迅速完成故障診斷,并實(shí)施有效的故障解決方案。系統(tǒng)管理員由原來的救火隊(duì)員變?yōu)楸=♂t(yī)生,同時提高了高校IT服務(wù)的整體效率和服務(wù)水平,用戶的體驗(yàn)也將大大提升。
參考文獻(xiàn):
[1]何海濤.數(shù)字校園亟需建立IT運(yùn)維管理體系[J].中國教育網(wǎng)絡(luò),2007(8):58-60.
[2]張四海,張萬光. 高校IT運(yùn)維服務(wù)面臨的挑戰(zhàn)與機(jī)遇[J].中山大學(xué)學(xué)報(bào)(自然科學(xué)版),2009(S1):235-237.