劉權(quán)
(中國移動通信集團南方基地,廣州 510640)
傳統(tǒng)的IT系統(tǒng)故障監(jiān)控一般以單個設備告警為主,缺乏系統(tǒng)層面、業(yè)務層面的監(jiān)控和分析能力,通常僅實現(xiàn)對單個設備的告警進行監(jiān)控,卻無法關聯(lián)到整個系統(tǒng)業(yè)務可用性?,F(xiàn)代IT系統(tǒng)的管理系統(tǒng)已逐漸向面向業(yè)務監(jiān)控的發(fā)展方向演進,通過梳理IT系統(tǒng)每個單個設備或服務器的告警與整個IT系統(tǒng)業(yè)務可用性之間的關系,直接關聯(lián)展示設備告警對IT系統(tǒng)業(yè)務可用性的影響關系,從而判斷生成業(yè)務可用性告警。由于IT系統(tǒng)的一個業(yè)務往往與多個設備相關聯(lián),因此往往要經(jīng)過非常復雜的“點與面”的告警影響關系建模。要做好這個模型,必須梳理清楚設備的每個設備告警與系統(tǒng)業(yè)務可用性之間的影響系數(shù),在實際的IT系統(tǒng)部署情況中不同IT系統(tǒng)業(yè)務影響模型可能都不一樣,每個設備對系統(tǒng)業(yè)務的影響系數(shù)也存在差異,即便是由同一個廠商開發(fā)和承建的系統(tǒng),在不同的省份部署實施,其業(yè)務關系影響模型和系數(shù)也會不盡相同,因此管理系統(tǒng)必須考慮如何準確的建立各個被管IT系統(tǒng)的業(yè)務影響關系模型。如果建模過程中因為缺乏合適的方法理論,缺乏動態(tài)、高效的建模工具,那么建立起來的關系模型就會變得較為機械,適用性差,難以滿足日益變化的IT業(yè)務對象。
CMDB技術的引入可以有效地解決業(yè)務關系建模難的問題,借助CMDB提供的配置信息庫,整個建模過程變得高效化和自動化,并能隨著IT業(yè)務對象的變化而不斷的動態(tài)更新和完善,準確地反映業(yè)務對象本身。
配置管理數(shù)據(jù)庫(CMDB,Configuration Management Database)是ITIL中最核心的概念之一。CMDB在ITIL中的定義是提供IT相關配置信息,存儲與管理企業(yè)IT架構(gòu)中設備的各種配置信息,它與所有服務支持和服務交付流程都密切相聯(lián),支持這些流程的運轉(zhuǎn)、發(fā)揮配置信息的價值,同時依賴于相關流程保證數(shù)據(jù)的準確性。所有為提供IT服務需要的人員、流程、技術實施中涉及到的所有元素,都被稱為配置項CI(Configuration Item),而CMDB就是所有CI信息的集合和存儲。
CMDB模型的描述是為結(jié)構(gòu)中元素定義統(tǒng)一的描述模板,為使其模型具有較強的通用性和可移植性,采用語義透明的模型描繪語言,便于模型的適配,有助于實現(xiàn)管理的自動化,如圖1所示,CMDB模型中包含的配置項域、配置項組、配置項類及其關系等。
圖1 CMDB模型通用結(jié)構(gòu)圖
在網(wǎng)管系統(tǒng)監(jiān)控平臺中引入CMDB模塊,CMDB負責提供統(tǒng)一的公共數(shù)據(jù)模型(CDM),各個模塊理解和共享CDM從而將監(jiān)控平臺的流程、資源和告警數(shù)據(jù)通過CMDB關聯(lián)起來,如圖2所示。CMDB模塊提供業(yè)務構(gòu)件,業(yè)務構(gòu)件封裝所有對配置項的操作,并與流程管理中的每個關鍵業(yè)務步驟相關聯(lián)。通過共享數(shù)據(jù)接口實現(xiàn)業(yè)務構(gòu)件與流程的關系對接,實現(xiàn)應用映射與可視化,完成了CMDB與流程管理的結(jié)合,同時多層次的結(jié)構(gòu)使之結(jié)合具有良好的復用性和可擴展性,實現(xiàn)客戶環(huán)境下模型的擴充。
CMDB通過聯(lián)邦、調(diào)和、復制等技術,統(tǒng)一配置數(shù)據(jù)。CMDB提供溝通渠道,包括靈活的建模工具、豐富的數(shù)據(jù)服務和創(chuàng)新的共享接口等。系統(tǒng)模塊間接口設計如圖3所示。
圖2 系統(tǒng)模塊架構(gòu)圖
為保證監(jiān)控平臺中的資源與CMDB中的資源的一致性、故障定位的準確性,CMDB與監(jiān)控平臺集成時需要進行一次初始化的配置同步,并且建立兩者資源的唯一標示映射,同時在監(jiān)控平臺上記錄CMDB中對配置項的命名,作為和其它系統(tǒng)交換數(shù)據(jù)時對配置項的唯一標識,如圖4所示。
圖3 CMDB與監(jiān)控平臺結(jié)合架構(gòu)圖
圖4 初始化同步的實施過程
網(wǎng)管監(jiān)控平臺與CMDB集成后,設備的入網(wǎng)、升級、退網(wǎng)等以變更管理流程的形式在NMS網(wǎng)管監(jiān)控平臺與CMDB兩者中實現(xiàn)變更同步。如圖5所示。
圖5 同步變更
圖6 CMDB在事件管理中的具體運用
圖7 CMDB資源樹狀圖
CMDB不僅記錄CI的屬性信息,也記錄CI之間的關聯(lián)信息。例如某一個Oracle的運行實體和系統(tǒng)業(yè)務應用之間的關系、業(yè)務應用和業(yè)務的關系等,這樣IT管理人員就能夠在故障發(fā)生時,通過對業(yè)務影響程度的評估,確定排除故障的優(yōu)先級,首先確保關鍵應用的可用性和質(zhì)量。將最高影響級別中的業(yè)務節(jié)點定義為業(yè)務影響根節(jié)點,這個根節(jié)點可能是設備所屬的系統(tǒng)本身,也可能是與之發(fā)生關系的外部系統(tǒng),甚至可能是涉及到的全網(wǎng)。圖6描述了CMDB數(shù)據(jù)模型中各對象與業(yè)務影響模型中各對象的對應關系。
以CMDB中錄入的各級資源對象以及各對象之間的關系為基礎,自動在監(jiān)控平臺中生成出對應的、形象的業(yè)務影響視圖。
在中國移動南方基地全國網(wǎng)管系統(tǒng)監(jiān)控平臺引入CMDB的原理和技術,實現(xiàn)了對被管理的網(wǎng)管系統(tǒng)的業(yè)務告警的監(jiān)控和管理。
根據(jù)被管系統(tǒng)資源對象之間的實際關系,在CMDB配置模塊中選擇合適的關系模型,將資源信息和資源關系錄入到CMDB中,在系統(tǒng)可查看生成每個被管網(wǎng)管系統(tǒng)的資源關系樹狀圖,如圖7所示。
CMDB中的資源信息和資源關系通過接口同步到監(jiān)控平臺中,監(jiān)控平臺中能夠自動根據(jù)CMDB的業(yè)務依賴關系創(chuàng)建業(yè)務影響視圖。從監(jiān)控平臺的告警業(yè)務影響視圖可見,某被管網(wǎng)管系統(tǒng)的應用服務器出現(xiàn)“進程down告警”和“CPU利用率告警”時對網(wǎng)管系統(tǒng)各個功能模塊的影響情況,并且監(jiān)控平臺中的業(yè)務影響視圖能夠根據(jù)CMDB關系的變化而變化,相關對象的告警能夠在業(yè)務影響視圖中傳遞。
[1] 李文璟, 王迎雪, 王穎. 基于分域的IT配置管理數(shù)據(jù)庫信息模型[J]. 北京郵電大學學報, 2009.
[2] 劉鵬. 基于CMDB的網(wǎng)絡管理事件處理系統(tǒng)的設計與實現(xiàn)[D].成都:電子科技大學,2008.