黃偉雄
(廣州地鐵集團(tuán)有限公司,廣東廣州 510330)
目前,國家電網(wǎng)公司在其總部、各省市分公司的改組優(yōu)化中都已構(gòu)筑起了由數(shù)據(jù)中心、企業(yè)門戶、應(yīng)用集成、數(shù)據(jù)交換等一體化的企業(yè)級信息集成平臺。從電力信息化處理系統(tǒng)本身出發(fā)來看,電力數(shù)據(jù)中心是一個非常重要的組成部分,其運(yùn)行效率的高低和運(yùn)行結(jié)果的好壞對整個電力系統(tǒng)的運(yùn)行效率產(chǎn)生直接影響。促進(jìn)電力數(shù)據(jù)中心的建立和不斷完善,不僅能有效促進(jìn)已有電力系統(tǒng)在生產(chǎn)調(diào)度、資源分配、系統(tǒng)運(yùn)行和維護(hù)方面的改變,更能實(shí)現(xiàn)管理的升級。
21 世紀(jì)以來,我國數(shù)據(jù)大集中的信息化建設(shè)規(guī)模在不斷擴(kuò)大,其普及程度也越來越高,對于所有的社會行業(yè)來說,建設(shè)和完善數(shù)據(jù)中心是目前社會最主要的研究點(diǎn)和關(guān)注點(diǎn),不僅數(shù)據(jù)的集中和統(tǒng)一,不僅能實(shí)現(xiàn)對電力企業(yè)的管理,并在最大程度上促進(jìn)電力市場環(huán)境之下從發(fā)電、輸電到供電再到檢修等多層次多方面的基本管理與安全生產(chǎn)。與此同時,不僅數(shù)據(jù)中心的建立和完善,也能有效促進(jìn)各項基礎(chǔ)數(shù)據(jù)的綜合利用水平與數(shù)據(jù)共享率的提升,幫助管理層及決策層深入分析企業(yè)的各項數(shù)據(jù)并及時處理,為企業(yè)的應(yīng)用提供最基本的保障和較為可靠的服務(wù),幫助企業(yè)提高電力系統(tǒng)整體的管理能力和水平。
相比于傳統(tǒng)的數(shù)據(jù)中心,基于云計算平臺的電力數(shù)據(jù)中心是以云計算平臺為基礎(chǔ)搭建起來的新型數(shù)據(jù)中心,其中采用的都是全新的、蘊(yùn)含較多科學(xué)技術(shù)的智能挖掘分析和虛擬化技術(shù)以及大數(shù)據(jù)的處理系統(tǒng)。但是,在開始設(shè)計新的運(yùn)維體系之前,必須對基于云計算的電力數(shù)據(jù)中心需要面向怎樣的運(yùn)維對象進(jìn)行明確及其需要滿足的相關(guān)要求。
(1)基礎(chǔ)設(shè)施。網(wǎng)絡(luò)、存儲、電力、環(huán)境調(diào)節(jié)、服務(wù)器、安全等設(shè)備共同組成了數(shù)據(jù)中心的硬件資源,其能為系統(tǒng)的計算、儲存、通信提供硬件實(shí)施平臺。要想確保系統(tǒng)運(yùn)行安全、穩(wěn)定,就必須對這些設(shè)備進(jìn)行合理的維護(hù)和使用。
(2)數(shù)據(jù)與系統(tǒng)。操作系統(tǒng)、數(shù)據(jù)庫、中間件、應(yīng)用程序、虛擬機(jī)等都是其中包括的軟件資源,而業(yè)務(wù)數(shù)據(jù)、系統(tǒng)運(yùn)行產(chǎn)生的數(shù)據(jù)、日志、配置文件等都屬于數(shù)據(jù)的范疇。因?yàn)檫@些都屬于系統(tǒng)組成中的重要部件,屬于電力數(shù)據(jù)中心重要的邏輯載體,能促進(jìn)系統(tǒng)內(nèi)各項功能性需求的很好實(shí)現(xiàn),因此,運(yùn)維方式的合理程度能很好地保障系統(tǒng)整體功能的實(shí)效性與靈活性。
(3)管理工具。報表平臺、工作流管理平臺以及基礎(chǔ)設(shè)施設(shè)備的監(jiān)控軟件等都屬于管理工具,它們能很好地幫助管理主體對數(shù)據(jù)中心內(nèi)部各運(yùn)行主體和對象的有效管控,促進(jìn)管理程度向可視化發(fā)展的同時,提高數(shù)據(jù)中心的實(shí)用性和可靠性。
(4)環(huán)境設(shè)施。即電力、網(wǎng)絡(luò)、環(huán)境等各項確保數(shù)據(jù)中心管理設(shè)備運(yùn)轉(zhuǎn)正常的資源。環(huán)境設(shè)施出現(xiàn)故障或問題,很可能使系統(tǒng)停運(yùn)甚至崩潰,而某些依托于此項設(shè)施也會隨即停止運(yùn)轉(zhuǎn)。
(5)工作人員。包含管理、技術(shù)、運(yùn)維、廠商等所有與數(shù)據(jù)中心運(yùn)行有關(guān)的人員。他們是管理對象,也是管理主體,對人員進(jìn)行合理的安排和管理,能為系統(tǒng)提供最大程度的穩(wěn)定服務(wù),促進(jìn)系統(tǒng)的正常運(yùn)行。
圖1 是云平臺基礎(chǔ)上電力數(shù)據(jù)中心運(yùn)維體系的組成框架。
圖1 云平臺基礎(chǔ)上電力數(shù)據(jù)中心運(yùn)維體系的框架
按照相關(guān)標(biāo)準(zhǔn)和要求,平臺基礎(chǔ)上的電力數(shù)據(jù)中心首先需要具備較高的可用性,實(shí)現(xiàn)對設(shè)備故障的提前預(yù)測和及時預(yù)警,并能在故障情況下實(shí)現(xiàn)數(shù)據(jù)的實(shí)時轉(zhuǎn)移和設(shè)備替換;其次需要具備一定的可擴(kuò)展性及可移植性;最后需要管理多種基礎(chǔ)設(shè)施和設(shè)備,幫助網(wǎng)絡(luò)設(shè)備有效提升其自身的穩(wěn)定性和安全性。對分布式存儲系統(tǒng)而言,也需要滿足同樣的需求。
在建設(shè)電力數(shù)據(jù)中心的過程中,甚至建設(shè)工程開始之前,就需要完成硬件設(shè)施設(shè)備的虛擬化。當(dāng)然,建立健全硬件設(shè)施設(shè)備的運(yùn)維對象與運(yùn)維信息,并以深度學(xué)習(xí)算法為基礎(chǔ),可以在最大程度上實(shí)現(xiàn)系統(tǒng)對硬件設(shè)備、數(shù)據(jù)中心自檢測、監(jiān)控等各項數(shù)據(jù)功能的自動采集,同時對設(shè)備的狀態(tài)和各項數(shù)據(jù)信息進(jìn)行自動分析,從而對設(shè)備的運(yùn)行效率和運(yùn)行狀態(tài)進(jìn)行有效判斷。
加強(qiáng)對資源的調(diào)節(jié)和有效監(jiān)控,不僅能減少軟件崩潰的概率,還能為系統(tǒng)提供更可靠的服務(wù)。一般而言,建立軟件運(yùn)維對象并不斷促進(jìn)軟件的升級和模塊化,將運(yùn)維對象的接口接入到模塊之中,是數(shù)據(jù)中心最基礎(chǔ)的作用,且也能實(shí)現(xiàn)對軟件輸出結(jié)果的有效和實(shí)時監(jiān)控,然后再以國家標(biāo)準(zhǔn)和設(shè)計要求為基礎(chǔ)分析得到的結(jié)果,也能有效判斷輸出結(jié)果的最終狀態(tài)和準(zhǔn)確性。除此之外,還需要對軟件本身的運(yùn)行狀態(tài)與性能進(jìn)行一定程度的分析,并不斷監(jiān)控。只有通過采集處理器和系統(tǒng)內(nèi)存各自的占用率并進(jìn)行系統(tǒng)分析,才能以此對軟件運(yùn)行的可靠程度進(jìn)行準(zhǔn)確判斷。
電力數(shù)據(jù)中心具有紛繁復(fù)雜、種類多樣的信息數(shù)據(jù),而每一種數(shù)據(jù)對象的存儲格式又存在一定的差異,所以,針對不同的數(shù)據(jù)資源,數(shù)據(jù)監(jiān)測的標(biāo)準(zhǔn)、要求也有不同的地方。如果電力數(shù)據(jù)中心的運(yùn)維需要按照相關(guān)的標(biāo)準(zhǔn)和要求執(zhí)行時,企業(yè)的管理層就需要將各種數(shù)據(jù)資源當(dāng)成管理對象來進(jìn)行適當(dāng)?shù)墓芾砗蛯Υ?,并以不同的?shù)據(jù)要求和實(shí)際情況為基礎(chǔ),借助閾值、校驗(yàn)等方式對數(shù)據(jù)的可靠性進(jìn)行判斷。如果出現(xiàn)數(shù)據(jù)錯誤,需要對相應(yīng)的設(shè)備進(jìn)行控制并完成數(shù)據(jù)的重新上傳,而且企業(yè)需要對每一份數(shù)據(jù)進(jìn)行備份,以應(yīng)對遭遇突發(fā)狀況時系統(tǒng)內(nèi)數(shù)據(jù)的快速恢復(fù),如果出現(xiàn)某些數(shù)據(jù)丟失的情況,便可以及時從備份數(shù)據(jù)中尋找并補(bǔ)充。
從某種程度上來說,電力數(shù)據(jù)中心的運(yùn)維體系不僅能實(shí)現(xiàn)所有配置信息的有效融合,還能將其集合成一個完整的配置資源池,其能對新加入進(jìn)來的設(shè)備進(jìn)行自動檢測與分析,并在判斷設(shè)備類型的基礎(chǔ)上對設(shè)備進(jìn)行合理選擇,調(diào)動或調(diào)整某些配置程序,從而實(shí)現(xiàn)對設(shè)備的最大利用和重新自動配置。積極對各種配置相適應(yīng)的模型進(jìn)行建立和不斷完善,并進(jìn)行統(tǒng)一管理和實(shí)時更新,借助設(shè)備種類將其索引至不同配置程序的存儲地址。當(dāng)然,也可以通過上層的管理平臺實(shí)現(xiàn)配置信息的收發(fā),有條件的情況下還可以幫助完成配置的儲存和更改。
綜上所述,通過研究分析電力數(shù)據(jù)中心的自動運(yùn)維體系,借助深度學(xué)習(xí)的算法對各項數(shù)據(jù)資源、各類軟硬件設(shè)備進(jìn)行實(shí)時的監(jiān)控,并幫助數(shù)據(jù)中心內(nèi)部的管控平臺處理、下發(fā)各項管理指令給數(shù)據(jù),與此同時,將運(yùn)維對象在橫縱方向上進(jìn)行相互連接,能實(shí)現(xiàn)數(shù)據(jù)中心的數(shù)據(jù)共享和資源動態(tài)分配。這樣不僅能實(shí)現(xiàn)自動管理資源的目標(biāo),也能在很大程度上滿足電力數(shù)據(jù)中心高效運(yùn)維的目的和需求。