郭 旗,曾麒麟,魏光龍,劉 芳
(淄博市氣象局,山東 淄博 255000)
近年來,隨著氣象信息化與氣象現(xiàn)代化工作的不斷推進(jìn),氣象信息網(wǎng)絡(luò)的規(guī)模不斷擴(kuò)大。省-市-縣氣象業(yè)務(wù)內(nèi)網(wǎng)帶寬不斷升級,氣象業(yè)務(wù)平臺逐步更新升級、推陳出新。與此相適應(yīng)的,機(jī)房內(nèi)網(wǎng)絡(luò)設(shè)備逐漸更新?lián)Q代,服務(wù)器資源、存儲資源等氣象業(yè)務(wù)基礎(chǔ)設(shè)施日益增加。而市級氣象部門專門從事信息網(wǎng)絡(luò)工作的人員非常有限,一人負(fù)責(zé)管理近百臺設(shè)備,單純靠人工方式對機(jī)房大量網(wǎng)絡(luò)設(shè)備、服務(wù)器等進(jìn)行維護(hù),十分影響故障監(jiān)控與發(fā)現(xiàn)的時效性,往往難以及時發(fā)現(xiàn)并處理各類故障。
目前,淄博市氣象局還沒有一個系統(tǒng)的平臺,可以將各類網(wǎng)絡(luò)設(shè)備、服務(wù)器等統(tǒng)一納入實時監(jiān)控并提供故障告警,以幫助網(wǎng)絡(luò)系統(tǒng)管理員更清晰地掌握網(wǎng)絡(luò)與各類設(shè)備的實時狀態(tài),并對監(jiān)控到的故障告警及時查看處理。針對這個需求,為了更高效地管理全市氣象信息網(wǎng)絡(luò),我們設(shè)計了一個信息網(wǎng)絡(luò)業(yè)務(wù)監(jiān)控報警系統(tǒng),對淄博市氣象局及各區(qū)縣局的網(wǎng)絡(luò)系統(tǒng)設(shè)備、服務(wù)器等的信息進(jìn)行匯總整合并監(jiān)控,并以Web 頁面的形式訪問,該系統(tǒng)可實時地監(jiān)控各設(shè)備的硬件狀態(tài)、接口信息等,根據(jù)監(jiān)控到的數(shù)據(jù)反映設(shè)備的最新問題,并根據(jù)設(shè)備間的互聯(lián)情況手動設(shè)計網(wǎng)絡(luò)拓?fù)鋱D,直觀地展示各設(shè)備之間互聯(lián)鏈路的通斷情況,從而迅速地反映出網(wǎng)絡(luò)故障,幫助系統(tǒng)管理員更高效地判斷和解決問題。
本文設(shè)計的信息網(wǎng)絡(luò)監(jiān)控系統(tǒng)基于B/S 架構(gòu),服務(wù)器端使用Linux 系統(tǒng),客戶端以Web 頁面形式訪問。系統(tǒng)運行環(huán)境為在服務(wù)器端搭建的Nginx、MySQL 數(shù)據(jù)庫、PHP 以及Zabbix。Nginx 是一個輕量級、高性能的HTTP和反向代理Web 服務(wù)器,它的優(yōu)點是對內(nèi)存和CPU 等系統(tǒng)資源消耗低,且并發(fā)能力強。MySQL 作為數(shù)據(jù)庫,可以存儲平臺監(jiān)控到的數(shù)據(jù),并使用PHP 語言作為服務(wù)器端腳本解釋器。Zabbix 是一個提供分布式系統(tǒng)監(jiān)視以及網(wǎng)絡(luò)監(jiān)視功能的開源解決方案,它能監(jiān)視網(wǎng)絡(luò)設(shè)備與服務(wù)器的各種參數(shù),保證設(shè)備的安全運行,并提供告警信息,以幫助系統(tǒng)管理員快速定位和解決存在的問題。
Zabbix 由Zabbix server 與可選組件Zabbix agent 兩部分組成,服務(wù)器端可通過SNMP、Zabbix agent、ping 等方式對遠(yuǎn)程網(wǎng)絡(luò)設(shè)備、服務(wù)器進(jìn)行監(jiān)視與數(shù)據(jù)收集等,因此被監(jiān)控端可以不使用Zabbix agent,通過SNMP 協(xié)議實現(xiàn)監(jiān)控功能。對于不支持SNMP 的設(shè)備,則可使用Zabbix agent 配合server 進(jìn)行監(jiān)控。
服務(wù)器端配置及環(huán)境搭建完成后,我們可以通過瀏覽器訪問前端Web 界面,添加需要監(jiān)控的網(wǎng)絡(luò)設(shè)備、服務(wù)器等,都可直觀地通過Web 頁面進(jìn)行操作。
我們以華為交換機(jī)為例來說明如何在監(jiān)控平臺上添加網(wǎng)絡(luò)設(shè)備。首先需要在交換機(jī)上開啟SNMP 功能。通過遠(yuǎn)程命令登錄交換機(jī)或直接連接交換機(jī)的console 口,進(jìn)入系統(tǒng)視圖模式。
(1)啟動SNMP 服務(wù):
snmp-agent
(2)配置社區(qū)名稱:
snmp-agent community read cipher huawei@123(其中read 表示只讀權(quán)限,huawei@123 為只讀社區(qū)名稱)
(3)配置SNMP 版本:
snmp-agent sys-info version all(打開所有的SNMP版本)
交換機(jī)配置以上命令后,NMS 可以從設(shè)備讀取告警信息。
(4)繼續(xù)添加以下配置可使設(shè)備主動向NMS 發(fā)送告警信息:
snmp-agent target-host trap address udp-domain 192.168.1.205paramssecurityname huawei@123(IP 填入服務(wù)器的IP 地址,后面寫明社區(qū)名稱)
(5)snmp-agent trap enable(開啟設(shè)備Trap 告警開關(guān),開啟以后主動向NMS 發(fā)送告警信息)
(6)display snmp-agent sys-info(查看已開啟的SNMP 版本)
(7)display snmp-agent target-host(查看NMS 配置信息)
以上步驟配置完成后,就成功開啟了交換機(jī)的SNMP 功能。華為、H3C 的交換機(jī)與路由器配置命令與以上基本一致,其他品牌的設(shè)備進(jìn)行相同的配置操作即可。
網(wǎng)絡(luò)設(shè)備的SNMP 功能開啟后,下一步即可在平臺的Web 頁面添加該網(wǎng)絡(luò)設(shè)備。使用管理員賬戶登錄平臺,在左側(cè)目錄選擇配置-主機(jī)菜單;選擇創(chuàng)建主機(jī)按鈕,跳轉(zhuǎn)到創(chuàng)建主機(jī)頁面。主機(jī)名稱填入設(shè)備的IP 地址,可見的名稱可以自定義,群組選擇設(shè)備將要放入的分組。接口(Interfaces)是用來監(jiān)控設(shè)備的接口,這里選擇SNMP,SNMP 地址填入設(shè)備的IP 地址,其他設(shè)置用默認(rèn)設(shè)置即可。此項完成后繼續(xù)選擇上方的“模板”菜單,進(jìn)行模板選擇。選擇鏈接到新模板(Link new templates),直接在搜索框中輸入模板名稱,如華為交換機(jī)直接輸入huawei,搜索到模板“Huawei VRP SNMP”,選擇該模板名稱即可完成模板添加。這時繼續(xù)選擇上方的“宏”菜單,選擇“繼承以及主機(jī)宏”,找到{$SNMP_COMMUNTITY},修改為自己設(shè)置的社區(qū)名稱,修改完成后選擇添加,即可完成主機(jī)的添加。
接下來我們以Windows server 為例來說明如何在監(jiān)控平臺上添加服務(wù)器。首先需要在服務(wù)器上開啟SNMP服務(wù)。登錄到服務(wù)器后,從服務(wù)器管理器中添加功能“SNMP 服務(wù)”,功能安裝完成后,在服務(wù)器管理器界面選擇配置、服務(wù),找到SNMP 服務(wù)并將其啟動,打開屬性設(shè)置界面,將代理菜單中的服務(wù)項全部啟用;陷阱菜單中填寫社區(qū)名稱(可自定義)并添加,陷阱目標(biāo)填寫部署Zabbix 的服務(wù)器地址;在安全菜單中添加上面自定義的社區(qū)名稱,權(quán)限為只讀,主機(jī)填寫Zabbix 服務(wù)器的地址,保存以上配置后重啟SNMP 服務(wù)。
服務(wù)器的SNMP 功能開啟后,仍需要在平臺的Web頁面添加該服務(wù)器。創(chuàng)建主機(jī)時模板選擇Windows SNMP,其他配置與創(chuàng)建網(wǎng)絡(luò)設(shè)備時一致,這樣就完成了對一臺Windows 服務(wù)器的狀態(tài)監(jiān)控。
其他交換機(jī)、路由器等網(wǎng)絡(luò)設(shè)備以及服務(wù)器都可以通過開啟SNMP 功能后在系統(tǒng)中添加主機(jī)完成監(jiān)控。
本文基于淄博市氣象局現(xiàn)有的網(wǎng)絡(luò)設(shè)備與服務(wù)器等搭建了一個信息網(wǎng)絡(luò)業(yè)務(wù)監(jiān)控報警平臺,實現(xiàn)了對各設(shè)備的硬件狀態(tài)、接口信息等的監(jiān)控。隨后根據(jù)監(jiān)控到的數(shù)據(jù)反映設(shè)備的最新問題,設(shè)計了網(wǎng)絡(luò)拓?fù)鋱D,直觀地展示出各網(wǎng)絡(luò)設(shè)備之間通信鏈路的通斷情況,從而迅速反映出網(wǎng)絡(luò)故障。以下是系統(tǒng)部分功能的展示,如圖1 所示。
圖1 系統(tǒng)主頁
系統(tǒng)主頁也稱為儀表板,主要包含了系統(tǒng)信息、問題分類、問題、數(shù)據(jù)概覽等幾個模塊,上面我們添加的還有拓?fù)鋱D和Zabbix 內(nèi)存占用模塊。各模塊可以自由挪動位置、調(diào)整大小,也可以根據(jù)實際使用需求添加或刪除某些模塊,自定義編輯儀表盤。
在左側(cè)菜單打開監(jiān)測的問題頁面,問題模塊會按照時間軸將系統(tǒng)收集到的所有故障信息展示出來,并且可以通過上方的篩選框,按照某個群組或某個主機(jī)查看其相對應(yīng)的故障信息。當(dāng)某個故障解決后,問題的狀態(tài)會變?yōu)橐呀鉀Q,見圖2。
圖2 問題頁面
在監(jiān)測的最新數(shù)據(jù)頁面,可以展示系統(tǒng)收集到的所有數(shù)據(jù),同樣通過上方的篩選框可以對具體的主機(jī)和監(jiān)控項進(jìn)行篩選,通過歷史記錄或圖形可以直觀地看到數(shù)據(jù)的趨勢,見圖3。
圖3 最新數(shù)據(jù)圖形記錄
在報表的可用性報表頁面,可以查看主機(jī)可用性報表的圖形,按照時間軸直觀地展示出主機(jī)各個監(jiān)控項的可用率,便于發(fā)現(xiàn)問題出現(xiàn)的時間及頻率,見圖4。
圖4 可用性報表
在監(jiān)測的拓?fù)鋱D頁面中,可以自行創(chuàng)建拓?fù)鋱D,將需要添加的主機(jī)作為地圖元素進(jìn)行添加,并在兩個真實連接的主機(jī)之間添加鏈接作為實際存在的鏈路,對應(yīng)其相連的接口的通斷作為該條鏈路的鏈接指示器,并可設(shè)置該條鏈接線的顏色,若鏈路通則為綠色線,若鏈路斷則顯示為紅色線。拓?fù)鋱D創(chuàng)建完成后即可直觀地看到各主機(jī)及鏈路之間的連接情況,見圖5。
圖5 省市縣內(nèi)網(wǎng)拓?fù)鋱D
隨著氣象信息化工作的不斷開展,氣象信息網(wǎng)絡(luò)的規(guī)模日趨龐大,建立一個氣象信息網(wǎng)絡(luò)業(yè)務(wù)監(jiān)控報警系統(tǒng)十分必要,它可以幫助系統(tǒng)管理員快速發(fā)現(xiàn)并定位網(wǎng)絡(luò)及服務(wù)器的故障信息,從而針對故障信息盡快解決問題,大大提高了網(wǎng)絡(luò)保障的及時性,保障氣象信息網(wǎng)絡(luò)安全穩(wěn)定地運行,才能更好地為社會和公眾提供更加快速、便捷、安全的氣象信息服務(wù)。