張祖剛, 項(xiàng) 顥, 賈 琨, 張振國(guó)
(中國(guó)電子工程設(shè)計(jì)院有限公司,北京 100142)
信息化建設(shè)的規(guī)模不斷擴(kuò)大,數(shù)據(jù)中心作為支撐信息化建設(shè)的組成部分,發(fā)揮著越來(lái)越大的作用。越來(lái)越多的企業(yè)開(kāi)始建設(shè)自己的數(shù)據(jù)中心以支撐其業(yè)務(wù)的持續(xù)發(fā)展。隨著數(shù)據(jù)中心規(guī)模擴(kuò)大,設(shè)備類(lèi)型增多,需要關(guān)注的監(jiān)測(cè)指標(biāo)也增多。作為業(yè)務(wù)系統(tǒng)的核心之一,基礎(chǔ)設(shè)施一旦出現(xiàn)故障,就會(huì)立刻影響IT系統(tǒng)的運(yùn)行,對(duì)數(shù)據(jù)傳輸、存儲(chǔ)的可靠性、安全性構(gòu)成威脅。目前許多數(shù)據(jù)中心均引入智能運(yùn)維平臺(tái),對(duì)數(shù)據(jù)中心基礎(chǔ)設(shè)施進(jìn)行統(tǒng)一運(yùn)維管理,實(shí)現(xiàn)基礎(chǔ)設(shè)施的科學(xué)有效管理。
在數(shù)據(jù)中心智能運(yùn)維平臺(tái)數(shù)據(jù)采集網(wǎng)關(guān)的設(shè)計(jì)過(guò)程中,不僅需要考慮與一般的工業(yè)網(wǎng)關(guān)設(shè)計(jì)的共通性,即數(shù)據(jù)接入的各種通信方式、數(shù)據(jù)采集與傳輸能力、遠(yuǎn)程控制及報(bào)警功能、可配置功能等,還要考慮到數(shù)據(jù)中心運(yùn)維平臺(tái)的安全性,是關(guān)系到運(yùn)維對(duì)數(shù)據(jù)中心監(jiān)控?cái)?shù)據(jù)采集和故障預(yù)測(cè)的實(shí)時(shí)性、準(zhǔn)確性和可靠性的關(guān)鍵點(diǎn),在數(shù)據(jù)采集網(wǎng)關(guān)設(shè)計(jì)中,更加需要注重?cái)?shù)據(jù)的安全防護(hù),做到內(nèi)外網(wǎng)安全隔離,在網(wǎng)關(guān)中增加數(shù)據(jù)加密及安全通信芯片。本文針對(duì)開(kāi)發(fā)的數(shù)據(jù)中心智能運(yùn)維平臺(tái),設(shè)計(jì)了與之配套的數(shù)據(jù)采集網(wǎng)關(guān),實(shí)現(xiàn)運(yùn)維平臺(tái)與基礎(chǔ)設(shè)施之間的數(shù)據(jù)采集與傳輸,為智能運(yùn)維平臺(tái)提供了硬件支持和數(shù)據(jù)支撐。
數(shù)據(jù)采集網(wǎng)關(guān)是智能運(yùn)維平臺(tái)服務(wù)器與數(shù)據(jù)中心基礎(chǔ)設(shè)施之間的橋梁,為智能運(yùn)維平臺(tái)完成基礎(chǔ)設(shè)施數(shù)據(jù)的采集和接收,并經(jīng)過(guò)解析、重組、加密等處理,將采集到的原始數(shù)據(jù),處理成智能運(yùn)維平臺(tái)規(guī)定的數(shù)據(jù)格式,再傳輸給智能運(yùn)維平臺(tái)服務(wù)器,為智能運(yùn)維平臺(tái)提供數(shù)據(jù)源。其在智能運(yùn)維應(yīng)用系統(tǒng)中的位置如圖1所示。
圖1 數(shù)據(jù)中心智能運(yùn)維應(yīng)用系統(tǒng)
數(shù)據(jù)采集網(wǎng)關(guān)由設(shè)備硬件和嵌入式軟件系統(tǒng)組成,是設(shè)備接入及組網(wǎng)、第三方系統(tǒng)集成、執(zhí)行控制命令并與運(yùn)維平臺(tái)服務(wù)器進(jìn)行雙向通信的硬件設(shè)備。主要功能包括:(1)數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)備數(shù)據(jù)接入及組網(wǎng)功能。(2)數(shù)據(jù)通信功能。通過(guò)設(shè)備驅(qū)動(dòng)庫(kù),實(shí)現(xiàn)數(shù)據(jù)中心基礎(chǔ)設(shè)施的數(shù)據(jù)采集,驅(qū)動(dòng)庫(kù)內(nèi)置主流的數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)備驅(qū)動(dòng),與上層智能運(yùn)維平臺(tái)雙向通信,上傳數(shù)據(jù)和下發(fā)命令。(3)數(shù)據(jù)建模和數(shù)據(jù)挖掘支持。為數(shù)據(jù)中心智能運(yùn)維平臺(tái)及應(yīng)用終端的數(shù)據(jù)建模、數(shù)據(jù)挖掘提供基礎(chǔ)信息支持。(4)設(shè)備仿真模擬功能??蛇M(jìn)行數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)備的運(yùn)行仿真和工作狀態(tài)模擬,用于數(shù)據(jù)中心智能運(yùn)維平臺(tái)及應(yīng)用終端的演示和演練,在仿真模擬時(shí),屏蔽對(duì)現(xiàn)場(chǎng)基礎(chǔ)設(shè)施設(shè)備的控制。(5)遠(yuǎn)程支持功能??蛇h(yuǎn)程配置和維護(hù)數(shù)據(jù)采集網(wǎng)關(guān)參數(shù),以及嵌入式軟件的升級(jí)和更新。
數(shù)據(jù)采集網(wǎng)關(guān)硬件由中央處理器(CPU)、以太網(wǎng)端口模塊、RS485通信模塊、數(shù)據(jù)存儲(chǔ)模塊、視頻接口模塊、音頻接口模塊、電源模塊、狀態(tài)指示模塊、數(shù)據(jù)加密芯片、安全通信芯片等組成,硬件示意框架如圖2所示。
圖2 數(shù)據(jù)采集網(wǎng)關(guān)硬件框架
數(shù)據(jù)采集網(wǎng)關(guān),通過(guò)RS485、RS232、RJ45等通信端口采集各種類(lèi)型(包括標(biāo)準(zhǔn)通信協(xié)議或私有通信協(xié)議)的數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)備相關(guān)數(shù)據(jù),通過(guò)音頻、視頻接口采集音頻、視頻信號(hào),完成采集和接收外部設(shè)備數(shù)據(jù),并經(jīng)過(guò)數(shù)據(jù)解析、轉(zhuǎn)換、加密等處理,將采集到的數(shù)據(jù)處理成運(yùn)維平臺(tái)規(guī)定的數(shù)據(jù)格式,實(shí)現(xiàn)數(shù)據(jù)采集網(wǎng)關(guān)對(duì)數(shù)據(jù)中心基礎(chǔ)設(shè)施相關(guān)數(shù)據(jù)信息的采集。通過(guò)網(wǎng)絡(luò)與數(shù)據(jù)中心智能運(yùn)維平臺(tái)連接,實(shí)現(xiàn)數(shù)據(jù)中心智能運(yùn)維數(shù)據(jù)采集網(wǎng)關(guān)與智能運(yùn)維平臺(tái)的通信。
數(shù)據(jù)中心智能運(yùn)維平臺(tái)數(shù)據(jù)采集網(wǎng)關(guān)的嵌入式軟件由ARM OS、開(kāi)源軟件體系框架、智能運(yùn)維數(shù)據(jù)處理單元等三部分組成。系統(tǒng)結(jié)構(gòu)如圖3所示。
圖3 嵌入式軟件系統(tǒng)結(jié)構(gòu)
(1)ARM OS:支持ARM的嵌入式操作系統(tǒng)。
(2)開(kāi)源軟件體系框架移植到嵌入式操作系統(tǒng)下,根據(jù)數(shù)據(jù)采集網(wǎng)關(guān)板卡接口,開(kāi)發(fā)對(duì)應(yīng)的驅(qū)動(dòng)控制方法。其中組件分為三層:1)初始化組件,完成數(shù)據(jù)采集網(wǎng)關(guān)開(kāi)機(jī)自檢、全局配置等功能,自檢功能主要包括:各個(gè)接口的檢測(cè),如ETHERNETRS2324G5G,電源的自檢等;2)基礎(chǔ)組件層,完成以太網(wǎng)口、串口等輸入輸出端口的數(shù)據(jù)雙向傳輸控制,以及與數(shù)據(jù)處理單元模塊的通信控制;3)功能組件層,完成數(shù)據(jù)采集網(wǎng)關(guān)側(cè)的業(yè)務(wù)功能。
(3)智能運(yùn)維數(shù)據(jù)處理單元,為平臺(tái)服務(wù)器及應(yīng)用層提供數(shù)據(jù)來(lái)源,屏蔽數(shù)據(jù)中心基礎(chǔ)設(shè)施數(shù)據(jù)采集細(xì)節(jié)。從功能上可劃分為數(shù)據(jù)接收、數(shù)據(jù)解析、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)加密、數(shù)據(jù)發(fā)送等幾大功能模塊。其中數(shù)據(jù)接收模塊提供數(shù)據(jù)采集和驅(qū)動(dòng)等處理;數(shù)據(jù)解析模塊提供對(duì)接收到的數(shù)據(jù)信息進(jìn)行解析處理;數(shù)據(jù)轉(zhuǎn)換模塊提供將數(shù)據(jù)信息轉(zhuǎn)換成運(yùn)維平臺(tái)規(guī)定的數(shù)據(jù)格式;數(shù)據(jù)加密模塊提供對(duì)數(shù)據(jù)的加密處理;數(shù)據(jù)發(fā)送模塊提供將數(shù)據(jù)發(fā)送給平臺(tái)服務(wù)器或應(yīng)用終端的處理。另外智能運(yùn)維數(shù)據(jù)處理單元還提供多種通信接口、數(shù)據(jù)接口及傳輸能力的支持。數(shù)據(jù)處理單元系統(tǒng)結(jié)構(gòu)如圖4所示。
圖4 數(shù)據(jù)處理單元系統(tǒng)結(jié)構(gòu)
驅(qū)動(dòng)管理,通過(guò)加載開(kāi)發(fā)的設(shè)備驅(qū)動(dòng),實(shí)現(xiàn)數(shù)據(jù)中心基礎(chǔ)設(shè)施各種設(shè)備數(shù)據(jù)格式的處理;設(shè)備接入,根據(jù)數(shù)據(jù)采集類(lèi)型,數(shù)據(jù)處理單元支持多種類(lèi)型設(shè)備的接入,包括主動(dòng)上報(bào)類(lèi)設(shè)備、輪詢(xún)類(lèi)設(shè)備和網(wǎng)管類(lèi)設(shè)備等;數(shù)據(jù)緩存,在因異常導(dǎo)致數(shù)據(jù)轉(zhuǎn)發(fā)失敗后,緩存解析后的數(shù)據(jù),并根據(jù)后續(xù)需求進(jìn)行處理;日志系統(tǒng),數(shù)據(jù)處理單元記錄包括運(yùn)行日志、調(diào)試日志、故障日志等三類(lèi)。