王曉杭
摘 要 網(wǎng)絡運維管理系統(tǒng)以行業(yè)的事實標準ITIL/ITSM為指導,采用分層設計,實現(xiàn)對IT資源的集中管理,整合監(jiān)測,完成對單位信息系統(tǒng)的可用性評估和可視化展示。最終目的為了達到IT與業(yè)務相結(jié)合,以業(yè)務為核心搭建和管理IT系統(tǒng),形成一個客觀、嚴謹、可量化的系統(tǒng)管理系統(tǒng),為各項業(yè)務平穩(wěn)運行提供技術支持。
關鍵詞 ITIL(IT基礎架構(gòu)庫);ITSM(IT服務管理);SNMP簡單網(wǎng)絡管理協(xié)議
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2018)211-0113-02
在日常IT運行維護過程中,我們也經(jīng)常會遇到如下問題:
1)上報故障無法及時回饋與跟蹤。
2)網(wǎng)絡中設備服務種類繁多無法全面監(jiān)管,設備運行狀態(tài)缺少合適的監(jiān)管方法。
3)由于業(yè)務復雜,支持其正常運行的設備多而復雜,無法抓住其核心節(jié)點,處理故障顧此失彼,在非核心環(huán)節(jié)浪費太多精力。
4)盡管信息化維護人員工作盡心盡責,但是缺少一個最佳的管理方案,造成信息使用者使用滿意度低,因操作失誤引起的故障不斷。
針對上訴問題,信息化團隊急需一套成熟完善的并可持續(xù)改進的緊緊圍繞業(yè)務開展的運維系統(tǒng)。通過構(gòu)建一套信息管理系統(tǒng),強化信息維護的支撐力,實現(xiàn)維護工作精確管理,完成維護可量化,提供高滿意度的信息服務,降低IT基礎設施方面的維護精力和成本。
1 系統(tǒng)概述
基于ITIL網(wǎng)絡運維管理系統(tǒng)以行業(yè)的事實標準ITIL/ITSM為指導,采用分層設計,實現(xiàn)對IT資源的集中管理,整合監(jiān)測,完成對單位信息系統(tǒng)的可用性評估和可視化展示。最終目的為了達到IT與業(yè)務相結(jié)合,以業(yè)務為核心搭建和管理IT系統(tǒng),形成一個客觀、嚴謹、可量化的系統(tǒng)管理系統(tǒng),為我臺各項業(yè)務平穩(wěn)運行提供技術支持。
網(wǎng)絡運維管理系統(tǒng)通過4個層面的功能實現(xiàn)完整的IT運維管理。
1.1 配置管理層面
實現(xiàn)對IT組件及其配置的識別,并形成具有邏輯關系視圖的配置管理數(shù)據(jù)庫(CMDB)和配置基線。在配置管理層面形成了對上層流程的信息支持。
1.2 整合管理層面
依據(jù)配置管理數(shù)據(jù)庫(CMDB)的邏輯信息,對 IT系統(tǒng)進行整合監(jiān)測,形成完整的IT系統(tǒng)事態(tài)管理(Event Mgmt)。IT系統(tǒng)的整合管理包括:網(wǎng)絡系統(tǒng)、服務器主機系統(tǒng)、數(shù)據(jù)庫及中間件系統(tǒng)、存儲系統(tǒng)。
1.3 業(yè)務服務管理層面
依據(jù)配置管理數(shù)據(jù)庫(CMDB)的邏輯信息,形成組織機構(gòu)的業(yè)務應用與IT組件的支撐關系,同時依靠IT組件的整合管理數(shù)據(jù),完成對業(yè)務應用的可用性狀態(tài)感知和容量管理。
1.4 流程管理層面
在具有了配置管理數(shù)據(jù)庫(CMDB)的基礎上,可為IT部門提供依據(jù)ISO \IEC 20000標準的IT運維管理體系,為用戶形成“服務支持中心”和“服務交付中心”。
2 本系統(tǒng)主要特點
2.1 管理理念先進,架構(gòu)設計合理
ITIL(IT基礎架構(gòu)庫)/ITSM(IT服務管理)是一套公開的、基于業(yè)界最佳實踐制定,用于規(guī)范IT服務管理的流程和方法論。
系統(tǒng)以行業(yè)的事實標準ITIL/ITSM為指導,采用分層設計,實現(xiàn)對IT資源的集中管理,整合監(jiān)測,完成對單位信息系統(tǒng)的可用性評估和可視化展示。最終目的為了達到IT與業(yè)務相結(jié)合,以業(yè)務為核心搭建和管理IT系統(tǒng),形成一個客觀、嚴謹、可量化的系統(tǒng)管理系統(tǒng)。
系統(tǒng)幾個關鍵模塊說明:
1)CMDB(configuration management DataBase配置管理數(shù)據(jù)庫):用來存儲IT系統(tǒng)中所要進行管理與監(jiān)測的CI。
2)CI(Configuration Item配置項):所指IT系統(tǒng)中需要管理與監(jiān)測的某單個資產(chǎn),如“機構(gòu)、人員、角色、交換機、服務器、數(shù)據(jù)庫、中間件、OA服務、文檔“等都屬于CI。
3)CI關系(Configuration Item Relationship配置項關系):所指“機構(gòu)、人員、角色、交換機、服務器、數(shù)據(jù)庫、中間件、OA服務、文檔“之間的組成、連接、涉及、使用關系。
2.2 功能強大,使用方便,提升工作效率
系統(tǒng)包含功能模塊有:自動發(fā)現(xiàn)、IT資產(chǎn)與配置管理(CMDB)、整合監(jiān)測,業(yè)務服務管理(BSM)、IT運維流程、報警、報表、視圖展示、系統(tǒng)設置等。操作主體分為四大部分,基本涵蓋了日常運維工作的方方面面。
2.3 B/S模式快速部署,自動發(fā)現(xiàn),及時提醒
B/S模式快速部署,隨時隨地方便查看和使用管理系統(tǒng)。通過SNMP協(xié)議自動發(fā)現(xiàn)IT環(huán)境中設備,并將已發(fā)現(xiàn)的路由器、交換機、服務器、中間件、數(shù)據(jù)庫、應用系統(tǒng)的類型與廠商自動識別,添加到IT基礎監(jiān)視器,對發(fā)現(xiàn)的IT組件進行整合監(jiān)測,形成完整的IT系統(tǒng)事態(tài)管理,通過豐富的顯示模型,展示業(yè)務系統(tǒng)的可用度,完整性。
3 詳細技術內(nèi)容
網(wǎng)絡運維管理平臺是一個綜合性管理平臺,包括配置管理層;整合監(jiān)測層;流程管理層;業(yè)務服務管理層;實現(xiàn)對網(wǎng)絡中IT資源管理,集中監(jiān)測,對業(yè)務可用度評估展示,故障流程處理設定和評估等功能。
3.1 自動發(fā)現(xiàn)
自動發(fā)現(xiàn)及配置向?qū)?。自動發(fā)現(xiàn)IT環(huán)境中已開啟SNMP協(xié)議設備,并將已發(fā)現(xiàn)的路由器、交換機、服務器、中間件、數(shù)據(jù)庫、應用系統(tǒng)的類型與廠商自動識別,識別后自動發(fā)現(xiàn)網(wǎng)絡拓撲圖,自動掃描每類設備的CI添加IT組件基礎監(jiān)視器。不掃描設備,從拓撲發(fā)現(xiàn)開始,自動發(fā)現(xiàn)網(wǎng)絡拓撲圖。CI掃描及監(jiān)視配置向?qū)?,自動發(fā)現(xiàn)路由器、交換機、服務器、中間件、數(shù)據(jù)庫、應用系統(tǒng)的子CI與CI監(jiān)視器。
3.2 IT資產(chǎn)與配置管理(CMDB)
配置CI 即Configuration Item配置項,所指IT系統(tǒng)中需要管理與監(jiān)測的某單個資產(chǎn),如“機構(gòu)、人員、角色、交換機、服務器、數(shù)據(jù)庫、中間件、OA服務、文檔等。設置之間的相關項CI關系。包含有組成關系,連接關系,使用關系,設計關系。
3.3 整合監(jiān)測
根據(jù)IT資產(chǎn)與配置管理部分生成管理數(shù)據(jù)庫(CMDB)的邏輯信息實現(xiàn)對應用、主機、網(wǎng)絡設備、存儲、環(huán)境、日志管理的進行整合監(jiān)測。
3.4 業(yè)務服務管理(BSM)
依靠IT組件的整合管理數(shù)據(jù),在監(jiān)測同時完成對業(yè)務應用的可用性狀態(tài)感知和容量管理。劃分業(yè)務層,包含4個業(yè)務服務層。
1)業(yè)務層,體現(xiàn)機構(gòu)內(nèi)部的業(yè)務部門,如“運維中心”,“技辦室”。
2)服務層,體現(xiàn)機構(gòu)內(nèi)部的業(yè)務服務。如“OA”,“技術區(qū)”。
3)IT基礎設施層,體現(xiàn)機構(gòu)內(nèi)部支撐業(yè)務服務的IT基礎設施,如“服務器、數(shù)據(jù)庫、網(wǎng)絡設備”。
4)運維支撐層,體現(xiàn)對于IT基礎設施中的服務器、數(shù)據(jù)庫、網(wǎng)絡設備提供技術。
3.5 IT運維流程管理
在具有了配置管理數(shù)據(jù)庫(CMDB)的基礎上,實現(xiàn)的IT運維管理體系,完成IT運維流程管理,包含:服務臺、事件管理、問題管理、變更管理、發(fā)布管理、任務管理、巡檢管理等。
1)服務臺:提供對終端用戶提交用戶業(yè)務請求與保修請求。
2)事件管理:提供對于終端用戶所提交的請求與自動監(jiān)測發(fā)現(xiàn)的請求分類集合,并能對事件進行橫向與縱向轉(zhuǎn)交處理。
3)問題管理:提供對一個事件多次發(fā)生,相同事件大范圍發(fā)生類型的事件進行產(chǎn)生根源分析與解決方案制定,并提供知識庫對解決方案分類歸納。
4)變更管理:提供因事件所產(chǎn)生的變更請求遞交與變更風險分析、審核。
5)發(fā)布管理:提供因變更所需要進行實施的工程項提供發(fā)布過程。
6)任務管理:提供對IT環(huán)境中的任務制定。
7)巡檢管理:提供對IT環(huán)境中的業(yè)務服務巡檢,檢查業(yè)務服務狀態(tài)。
3.6 報警
系統(tǒng)通過多種類型報警,是故障信息及時送達到相關維護人員。包含有:1)郵件報警:配置郵件報警可自動將事件發(fā)送給指定郵箱地址。2)短信報警:配置短信報警可自動將事件發(fā)送給指定手機號碼。3)消息報警:配置消息、聲音報警可自動將事件的產(chǎn)生通過聲音提示。
4 應用情況
該系統(tǒng)軟件功能豐富實用;操作簡單、方便、快捷;運行安全、穩(wěn)定、可靠。自2016年初投入至今,使用將近兩年,系統(tǒng)多次提早發(fā)現(xiàn)提醒信息系統(tǒng)故障,為國家廣播電視總局八三一臺各項業(yè)務平穩(wěn)運行提供保障。
參考文獻
[1]尚云云.IT運維服務管理支撐系統(tǒng)的設計與實現(xiàn)[D].北京:北京交通大學,2009.
[2]周宇潔.ITIL管理理論在IT運維服務中的應用[D].上海:上海交通大學,2010.
[3]曾球榮.ITIL在中小型企業(yè)IT運維管理中的應用實踐研究[D].廣州:華南理工大學,2011.