韓峰
摘要:目前上海聯(lián)通在上海各處有華為和中興通訊等多家自建或代建的數(shù)據(jù)中心,每個(gè)數(shù)據(jù)中心都要配備獨(dú)立專業(yè)的運(yùn)維管理人員,而且各個(gè)數(shù)據(jù)中心的監(jiān)管數(shù)據(jù)對(duì)上匯總也比較復(fù)雜,需一套統(tǒng)一的頂層數(shù)據(jù)中心DCIM平臺(tái)來將各個(gè)數(shù)據(jù)中心的管理系統(tǒng)納入到這個(gè)平臺(tái)來進(jìn)行統(tǒng)一的監(jiān)管。
關(guān)鍵詞:數(shù)據(jù)中心;運(yùn)維管理;DCIM平臺(tái);管理系統(tǒng);統(tǒng)一監(jiān)管
1緒論
目前上海聯(lián)通在上海的多個(gè)數(shù)據(jù)中心的管理平臺(tái)中有多個(gè)廠家的管理系統(tǒng),有中興力維,艾默生等多個(gè)廠家的系統(tǒng),管理水平參差不齊,沒有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)化的要求。有些機(jī)房甚至還是采用傳統(tǒng)的人工的方式來日常維護(hù),例如手動(dòng)計(jì)算各種能耗分析,人工抄表式巡檢,點(diǎn)數(shù)式資產(chǎn)盤點(diǎn)等。這些管理手段耗時(shí)耗力,準(zhǔn)確度也很低。在聯(lián)通總部也無法直接獲取到一線數(shù)據(jù)中心的數(shù)據(jù)。隨著上海聯(lián)通業(yè)務(wù)的爆發(fā)式增長,也急需一套綜合智能管理平臺(tái),在人手有限、滿足基本需求前提下,提升運(yùn)維和運(yùn)營的質(zhì)量。
這就需要一個(gè)“集中化、一體化、智能化”的垂直的頂層的DCIM管理平臺(tái)。
2.總體方案設(shè)計(jì)
2 1設(shè)計(jì)原則。方案設(shè)計(jì)本著“實(shí)用、可靠、先進(jìn)、安全、經(jīng)濟(jì)和共享”的建設(shè)原則,系統(tǒng)設(shè)計(jì)需滿足以下原則:
1)整體性、便捷性
各智能化子系統(tǒng)統(tǒng)一界面、統(tǒng)一管理,在同一個(gè)界面上顯示各子系統(tǒng)如動(dòng)環(huán)、門禁、巡更、樓控、廣播、信息發(fā)布等設(shè)備的狀態(tài),并可實(shí)現(xiàn)一體化操作,無需多平臺(tái)跳轉(zhuǎn)。
2)安全性
建立用戶安全機(jī)制,多用戶權(quán)限及強(qiáng)制密碼修改功能
重要設(shè)備如動(dòng)環(huán)監(jiān)控單元采用雙電源冗余,統(tǒng)一管理平臺(tái)服務(wù)采用雙機(jī)備份,重要監(jiān)控點(diǎn)位采集設(shè)備冗余備份
3)開放性、擴(kuò)展性
系統(tǒng)不僅可以向下集成各種軟硬件接口,還可對(duì)外提供各種接口,完全實(shí)現(xiàn)與其他平臺(tái)的無縫對(duì)接
隨著用戶業(yè)務(wù)的拓展,系統(tǒng)能方便的實(shí)現(xiàn)擴(kuò)充與擴(kuò)容,避免因擴(kuò)充而需要更換中心設(shè)備或系統(tǒng)軟件等
4)穩(wěn)定性、可靠性
系統(tǒng)采用分層化、模塊化的設(shè)計(jì),保證各智能化系統(tǒng)在擴(kuò)容、升級(jí)時(shí)不影響其他系統(tǒng),整體綜合平臺(tái)可無間斷安全運(yùn)行。
5)節(jié)能、經(jīng)濟(jì)性
統(tǒng)一管理平臺(tái)的設(shè)計(jì)是對(duì)各子系統(tǒng)管理平臺(tái)的優(yōu)化及集成,各類監(jiān)測數(shù)據(jù)統(tǒng)一管理,避免各子系統(tǒng)管理平臺(tái)的重復(fù)建設(shè),優(yōu)化管理入口及呈現(xiàn)界面,提升管理人員管理效率,節(jié)約人力成本。
2.2系統(tǒng)架構(gòu)
頂層DCIM管理平臺(tái)平臺(tái)建設(shè)需打破傳統(tǒng)運(yùn)維各子系統(tǒng)獨(dú)立分散的垂直管理,將采用“集中化、一體化、智能化”的設(shè)計(jì)模式,實(shí)現(xiàn)主動(dòng)、高效、流程化的運(yùn)維管理。平臺(tái)架構(gòu)采用分層設(shè)計(jì),實(shí)現(xiàn)功能總集成、流程總調(diào)度、資源全監(jiān)控。
3軟件架構(gòu)
3.1呈現(xiàn)層。提供多種用戶交互方式。
組態(tài)通過圖形化界面分多個(gè)層次展現(xiàn)園區(qū)全景,包括園區(qū)組態(tài)、樓棟組態(tài)、樓層組態(tài)、機(jī)房組態(tài)和設(shè)備組態(tài),組態(tài)界面可以通過控件進(jìn)行任意的組合配置,按照用戶的要求形成實(shí)景或抽象的管理界面。
3.2業(yè)務(wù)層。業(yè)務(wù)層包括三個(gè)方面:統(tǒng)一管理功能,運(yùn)維功能和管理功能。
3.3采集層。采集層有三類數(shù)據(jù)來源:
已有DCIM平臺(tái)的從平臺(tái)統(tǒng)一采集;
沒有平臺(tái)的各子系統(tǒng)單獨(dú)對(duì)接采集;
與聯(lián)通自有業(yè)務(wù)系統(tǒng)的對(duì)接;
4管理平臺(tái)功能
4.1事件流管理。以客戶服務(wù)為中心,個(gè)人工作臺(tái)作為運(yùn)維人員的主要工作界面,包含關(guān)鍵參數(shù)展示及運(yùn)維工作任務(wù)事項(xiàng)。
4.1.1關(guān)鍵參數(shù)顯示
關(guān)鍵參數(shù)指標(biāo)包括:能耗數(shù)據(jù)、資產(chǎn)信息、容量信息;
關(guān)鍵參數(shù)指標(biāo)的展示包括曲線圖、柱狀圖、趨勢(shì)圖等圖形化展示;
容量趨勢(shì)圖支持按年、月、日展示空間、電力、制冷容量信息。
4.1.2任務(wù)顯示
任務(wù)顯示模塊有待辦任務(wù)、已辦任務(wù)和我創(chuàng)建的任務(wù),包括任務(wù)名稱、任務(wù)類型、任務(wù)日期、級(jí)別、發(fā)派人等信息,根據(jù)任務(wù)級(jí)別可以區(qū)分任務(wù)的優(yōu)先級(jí),主要級(jí)別有:緊急、重要、標(biāo)準(zhǔn)、次要;
已辦任務(wù)和我創(chuàng)建任務(wù)支持任務(wù)詳情查看功能和按照任務(wù)處理狀態(tài)進(jìn)行查詢功能;
我創(chuàng)建的任務(wù)支持告警或資產(chǎn)工單創(chuàng)建菜單,根據(jù)工單類型跳轉(zhuǎn)至對(duì)應(yīng)的工單創(chuàng)建頁面;
待辦任務(wù)支持任務(wù)快速處理菜單,根據(jù)任務(wù)類型跳轉(zhuǎn)到詳細(xì)的任務(wù)處理頁面,在任務(wù)處理頁面可以查看任務(wù)詳細(xì)信息、任務(wù)指派人信息、任務(wù)處理意見等信息。
4.2告警統(tǒng)一管理。系統(tǒng)告警分為四級(jí):一級(jí)告警、二級(jí)告警、三級(jí)告警和四級(jí)告警(重要程度從高到低),其中,一級(jí)告警以紅色標(biāo)識(shí),二級(jí)告警以橙色標(biāo)識(shí),三級(jí)告警以黃色標(biāo)識(shí),四級(jí)告警以淡藍(lán)色標(biāo)識(shí),告警級(jí)別、告警上下限值可根據(jù)需要更改。
4.3機(jī)房環(huán)境管理。機(jī)房環(huán)境管理提供對(duì)機(jī)房、機(jī)架、機(jī)位的溫濕度數(shù)據(jù)的分析、呈現(xiàn)、和告警等管理功能。動(dòng)環(huán)數(shù)據(jù)綜合分析
動(dòng)環(huán)數(shù)據(jù)綜合分析需要保證動(dòng)環(huán)等系統(tǒng)的接口提供相應(yīng)數(shù)據(jù)(UPS監(jiān)控、精密空調(diào)監(jiān)控、配電柜監(jiān)控、漏水監(jiān)控、電池組監(jiān)控、柴發(fā)監(jiān)控、消防監(jiān)控、冷凍機(jī)監(jiān)控、冷卻塔監(jiān)控、門禁卡監(jiān)控等)。
4.4制冷、配電展示。集中監(jiān)控系統(tǒng)支持按照空間維度(基地-樓宇-模塊-機(jī)房-冷通道-機(jī)列-機(jī)柜)進(jìn)行制冷、配電等的展示。同時(shí)集中監(jiān)控系統(tǒng)把制冷、電力等信息同步給資源管理系統(tǒng),資源管理系統(tǒng)可實(shí)現(xiàn)對(duì)制冷、電力等容量信息進(jìn)行查詢統(tǒng)計(jì)、容量報(bào)表、低容量告警和容量配置等功能。
4.5聯(lián)動(dòng)管理。1、系統(tǒng)支持自動(dòng)保存所有的動(dòng)環(huán)、門禁和視頻之間的聯(lián)動(dòng)記錄,保存的內(nèi)容包括聯(lián)動(dòng)的觸發(fā)事件信息(如××監(jiān)控量告警/消除、時(shí)間)和聯(lián)動(dòng)的結(jié)果(如聯(lián)動(dòng)XX攝像頭錄像、轉(zhuǎn)到預(yù)置位或觸發(fā)××遙控量)。
2.可單獨(dú)查詢聯(lián)動(dòng)日志,可按任意時(shí)間、觸發(fā)條件(單選)和聯(lián)動(dòng)結(jié)果(單選)組合查詢。
3.可以查詢聯(lián)動(dòng)異常情況,如觸發(fā)事件和聯(lián)動(dòng)結(jié)果對(duì)應(yīng)的對(duì)象已經(jīng)刪除等情況??筛鶕?jù)聯(lián)動(dòng)異常情況批量刪除聯(lián)動(dòng)規(guī)則。
4.63D視圖。系統(tǒng)支持機(jī)房仿真3D呈現(xiàn)。查詢定位設(shè)備設(shè)施。支持3D方式呈現(xiàn)機(jī)柜容量信息。支持查看機(jī)房溫度分布云圖,提供顏色一溫度刻度尺。支持歷史溫度云圖播放,鷹眼視圖、3D視角切換、收藏、定位,自動(dòng)巡檢等功能。
4.7問題管理。問題可以提供界面手動(dòng)錄入問題信息,提供統(tǒng)計(jì)、查詢和導(dǎo)出功能。
4.8容量管理。系統(tǒng)具備結(jié)合資產(chǎn)管理對(duì)空間、電力等容量信息進(jìn)行查詢統(tǒng)計(jì)、容量報(bào)表、低容量告警和容量配置等功能。結(jié)合資產(chǎn)管理對(duì)空間、電力容量,冷量??奢敵鋈萘繄?bào)表、高容量告警、容量配置。
4.9資產(chǎn)管理。按照區(qū)域、機(jī)房、樓層、房間展示資產(chǎn)列表,根據(jù)資產(chǎn)維護(hù)日期和維護(hù)人自動(dòng)發(fā)出設(shè)備維護(hù)提醒通知,維護(hù)人員可填寫維護(hù)信息,導(dǎo)出維護(hù)記錄
5某電信公司案例
一個(gè)電信公司的頻統(tǒng)計(jì)可能有100萬個(gè)組合條件。包括:站點(diǎn),設(shè)備類型,監(jiān)控量類型,告警級(jí)別,告警時(shí)間段,告警次數(shù),搜索時(shí)間范圍。
某電信公司A 2013年~2016年,3年歷史數(shù)據(jù)合計(jì)27億條,高速查詢對(duì)比。
某電信公司B 2010-16年,5年歷史數(shù)據(jù):50億條,3萬種報(bào)警類型400萬條左右的報(bào)警數(shù)據(jù)。
由于自有的一些業(yè)務(wù)系統(tǒng)已經(jīng)比較成熟,將其融合到總格管理平臺(tái)內(nèi)能發(fā)揮更大的效益。同樣,自由業(yè)務(wù)系統(tǒng)需要定制對(duì)外接口,即可完成兩平臺(tái)的對(duì)接。
結(jié)語
在IDC領(lǐng)域,高速發(fā)展的IDC數(shù)據(jù)中心,也就意味著數(shù)據(jù)中心管理系統(tǒng)需要提升一個(gè)層次。大數(shù)據(jù)爆發(fā)的時(shí)代背景下,傳統(tǒng)的數(shù)據(jù)中心管理系統(tǒng),只能完成了第一層響應(yīng)響應(yīng)型分析,即收集數(shù)據(jù),報(bào)表統(tǒng)計(jì),高速查閱;而目前設(shè)計(jì)的數(shù)據(jù)平臺(tái),可完成第二層診斷型分析和趨勢(shì)分析;第三層預(yù)測性分析和預(yù)測模型的建立;以及第四層認(rèn)知轉(zhuǎn)換這四個(gè)更高層級(jí)的分析。
后期的發(fā)展可以由聯(lián)通來提出業(yè)務(wù)模式、業(yè)務(wù)流程、業(yè)務(wù)時(shí)間軸,由供應(yīng)商根據(jù)實(shí)際需求來搭建數(shù)據(jù)模型,使得采集的龐大數(shù)據(jù)依附在模型里面發(fā)揮更加實(shí)際更加智能化的效果。