陳曉健
摘要
信息技術(shù)的發(fā)展日新月異,移動互聯(lián)網(wǎng)技術(shù)也日趨成熟。智能電網(wǎng)建設(shè)工作如火如荼,利用先進(jìn)的信息技術(shù)來更加有效的助力業(yè)務(wù)發(fā)展已經(jīng)成為行業(yè)共識。本文提出的一體化資源云管理平臺旨在借助最新的云計(jì)算、虛擬化和自動化調(diào)度技術(shù)最大程度上提升電力信息系統(tǒng)運(yùn)維效率,更好的支撐業(yè)務(wù)的發(fā)展。
【關(guān)鍵詞】云計(jì)算 資源調(diào)度 資源管理平臺
1 前言
為適應(yīng)時(shí)代的發(fā)展及業(yè)務(wù)數(shù)據(jù)處理能力的提升,各種高新技術(shù)不斷到被引入到電網(wǎng)信息化建設(shè)的各個環(huán)節(jié),以支撐電網(wǎng)信息中心各個核心業(yè)務(wù)系統(tǒng)的安全穩(wěn)定運(yùn)行。隨著云計(jì)算、虛擬化等技術(shù)的逐步推廣應(yīng)用,傳統(tǒng)運(yùn)維的IT架構(gòu)和服務(wù)管理方式產(chǎn)生了巨大變化。借助新技術(shù),通過快捷的計(jì)算資源和存儲資源供給,安全可靠的網(wǎng)絡(luò)訪問,才能更好的支持電網(wǎng)業(yè)務(wù)不斷向前發(fā)展。
2 現(xiàn)狀分析
目前電力企業(yè)信息系統(tǒng)的建設(shè)已經(jīng)頗具規(guī)模,各類支撐信息系統(tǒng)的IT基礎(chǔ)設(shè)施的種類、數(shù)量快速增長;信息系統(tǒng)的業(yè)務(wù)應(yīng)用范圍、用戶數(shù)量、信息系統(tǒng)數(shù)據(jù)量等也在迅速擴(kuò)大。隨著電力企業(yè)信息系統(tǒng)的建設(shè)步伐越來越快,如何利用有限的資源,高效的開展運(yùn)維工作,將是信息部門需要面對的巨大挑戰(zhàn)。
3 需求分析
電力企業(yè)的業(yè)務(wù)系統(tǒng)眾多,架構(gòu)復(fù)雜,運(yùn)維難度大。業(yè)務(wù)系統(tǒng)的安全穩(wěn)定運(yùn)行關(guān)系國計(jì)民生,需要信息系統(tǒng)提供有力支撐。因此電力企業(yè)迫切需要借鑒先進(jìn)行業(yè)經(jīng)驗(yàn),以應(yīng)用系統(tǒng)為核心,提供跨平臺支持能力;自動發(fā)現(xiàn)和納管IDC各類軟硬件資源,并根據(jù)業(yè)務(wù)發(fā)展需要靈活調(diào)配資源;通過自服務(wù)界面改變資源供給方式,采用自動化部署技術(shù)提升各種IT組件的部署和統(tǒng)籌管理能力。
3.1 服務(wù)器自動化部署
(1)支持主流操作系統(tǒng)平臺的自動化管理(Windows/UNIX/Linux)。
(2)兼容多種虛擬化技術(shù),統(tǒng)一納管各類主流虛擬化平臺。
(3)支持資源自動化發(fā)現(xiàn)與代理程序Agent自動安裝支持無代理模式的資產(chǎn)掃描。。
(4)支持資源管理靜態(tài)分組,或者基于查詢的動態(tài)分組。
(5)支持手動添加資產(chǎn)信息和關(guān)聯(lián)性管理。
(6)能夠提供豐富的的報(bào)表模版,同時(shí)提供便捷的報(bào)表自定義和導(dǎo)出功能。
3.2 應(yīng)用的自動化部署
(1)支持軟件分發(fā)、部署,補(bǔ)丁管理,合規(guī)檢查以及常用的自動化管理操作。
(2)提供軟件定義和軟件配置模板,通過模板方式靈活定義軟件包與硬件、操作系統(tǒng)和其他軟件之間的依賴關(guān)系,以及軟件包靜默安裝所需的配置參數(shù)。
(3)提供自動化部署流程實(shí)現(xiàn)軟件的安裝、卸載、啟動和停止等操作,提供工作流編輯工具,靈活的實(shí)現(xiàn)應(yīng)用軟件部署工作流的更新和編輯。
(4)層次化數(shù)據(jù)傳輸結(jié)構(gòu),在文件服務(wù)器和發(fā)布終端之間部署管理庫,進(jìn)行軟件包存儲轉(zhuǎn)發(fā)和資源控制,實(shí)現(xiàn)數(shù)據(jù)包快速傳輸和動態(tài)交付。
3.3 自動化服務(wù)管理
(1)支持資源申請預(yù)定。在資源實(shí)際投入使用前,資源以瘦供給的方式給出,不占用平臺的實(shí)際資源,有效提供資源利用率。
(2)支持資源全生命周期管理,及時(shí)回收資源。資源使用期限之前,系統(tǒng)提前一個星期通知系統(tǒng)管理員續(xù)期資源。如果續(xù)期,則更新系統(tǒng)資源使用記錄。如果沒有及時(shí)辦理資源續(xù)期,系統(tǒng)資源默認(rèn)會被管理平臺作自動歸檔處理,相關(guān)業(yè)務(wù)關(guān)停;但等待90天后相關(guān)虛擬服務(wù)器和數(shù)據(jù)才會被徹底刪除,以便審計(jì)或回溯使用;在此期間原用戶可重新續(xù)約資源。
(3)提供軟件介質(zhì)和鏡像模版管理。在虛擬化管理環(huán)境中,用戶所申請的服務(wù)(基礎(chǔ)架構(gòu)服務(wù)、平臺服務(wù)、軟件服務(wù))需要符合電網(wǎng)企業(yè)的標(biāo)準(zhǔn)化要求,例如軟件版本和操作系統(tǒng)鏡像。通過標(biāo)準(zhǔn)的介質(zhì)和鏡像供給,保障平臺的標(biāo)準(zhǔn)化水平,有利于提升平臺穩(wěn)定性。
(4)提供客戶自服務(wù)菜單以及標(biāo)準(zhǔn)化的服務(wù)目錄。服務(wù)目錄是資源管理平臺可供給資源的集中展現(xiàn)。通過將計(jì)算資源標(biāo)準(zhǔn)化,以服務(wù)形式提供,以標(biāo)準(zhǔn)套餐的方式展現(xiàn),降低平臺的使用門檻,提升用戶體驗(yàn)。兼容平臺各類業(yè)界通用的虛擬化標(biāo)準(zhǔn),包括KVM,Xen,VMWware,PowerVM等。
一體化資源云管理平臺支持高可用性,以保證管理平臺的連續(xù)穩(wěn)定運(yùn)行,在管理平臺的某些設(shè)備故障時(shí),保證管理平臺的服務(wù)不中斷。
4 建設(shè)思路
—體化資源云管理平臺的建設(shè),采用分布式、可擴(kuò)展的技術(shù)架構(gòu),開源技術(shù)和商業(yè)產(chǎn)品并重,x86和UNIX兼容并包。有機(jī)結(jié)合各種軟硬件資源,創(chuàng)建一個穩(wěn)定、高效、安全的一體化服務(wù)平臺。平臺架構(gòu)如圖1所示。
從基礎(chǔ)架構(gòu)硬件管理層面,一體化資源云管理平臺可以分為服務(wù)器、存儲、網(wǎng)絡(luò)等三部分。根據(jù)處理器架構(gòu)的不同,分為標(biāo)準(zhǔn)機(jī)架式X86服務(wù)器和非開放平臺的UNIX小型機(jī)等。存儲資源包括主流的EMC和IBM磁盤陣列,以及少量的虛擬化存儲資源。
在軟件及應(yīng)用管理方面,首先需要針對基礎(chǔ)架構(gòu)的各種虛擬化管理模塊(如VMware、Hyper-V)、監(jiān)控模塊、配置管理模塊、備份/恢復(fù)軟件等,通過工作流處理引擎驅(qū)動。另外還需要安全套件滿足電網(wǎng)安全合規(guī)管理要求。各個軟硬件產(chǎn)品的關(guān)系如圖2所示。
4.1 服務(wù)器資源池的搭建
服務(wù)器計(jì)算資源作為整個資源云管理平臺的基礎(chǔ),借助業(yè)界主流的虛擬化技術(shù)進(jìn)行資源整合。對于納入平臺管理的x86服務(wù)器,一般將型號和配置相近的服務(wù)器綁定為一個或多個相對統(tǒng)一的資源池,即所謂的計(jì)算資源池;技術(shù)層面一般采用VMWare、kvm或Hyper-v等虛擬化套件具體實(shí)現(xiàn)。而對于高配的UNIX服務(wù)器,單機(jī)性能強(qiáng)焊,RSA特性出眾,往往可以作為一個獨(dú)立的UNIX資源池進(jìn)行管理;業(yè)界一般采用IBM PowerVM或hp vse技術(shù)實(shí)現(xiàn)。計(jì)算資源池化后,再按照不同的業(yè)務(wù)和用戶需求優(yōu)先級,以虛擬服務(wù)器VM的方式供給,用以支撐不同級別的業(yè)務(wù)應(yīng)用;例如一般普通的應(yīng)用服務(wù)器采用x86資源池,負(fù)載較低,部署快速;而數(shù)據(jù)庫服務(wù)器對性能和穩(wěn)定性要求較高,一般建議使用IBM PowerVM技術(shù)的高端計(jì)算資源池,即兼顧性能和又保持一定的靈活性。
規(guī)劃計(jì)算資源池首先需要評估資源池的規(guī)模,評估納管的計(jì)算資源總體情況,梳理各類服務(wù)器的配置,確定分類分級,定制資源池建設(shè)策略。資源歸類的依據(jù)一般可以參考計(jì)算機(jī)的出廠年限,中央處理器架構(gòu)、核心數(shù)量、工作頻率、內(nèi)存資源、機(jī)房物理位置等來綜合考量。為保障故障時(shí)的高可用切換,對虛擬資源池管理平臺而言,屬于同一個資源池的不同服務(wù)器,可視為一組可互相替代的計(jì)算資源,以便減少資源浪費(fèi),同時(shí)確保故障時(shí)計(jì)算資源的切換平滑。最理想的情況是新購一批同一型號配置的新服務(wù)器組建成核心計(jì)算資源池,而企業(yè)現(xiàn)有的配置參差不齊的服務(wù)器可以利舊使用,組合為測試資源池,物盡其用,更好的滿足不同使用用途。
計(jì)算資源池的規(guī)模并非越大越好。一方面是機(jī)房限制,如果所有資源池中的服務(wù)器放在同一個機(jī)房,出現(xiàn)UPS或空調(diào)之類的動環(huán)故障時(shí)容易影響整個平臺的可用性。如果單個資源池太小,無法提升資源的利用率;如果單個資源池的規(guī)模越大,可以為平臺提供更大的靈活性和容錯性,同時(shí)要求更高的運(yùn)維水平支撐。
對于重要級別較低的應(yīng)用,可以分配利舊資源池,雖然故障率較高,但仍然可以提供比單機(jī)系統(tǒng)更高的可用性。對于重要應(yīng)用,例如營銷系統(tǒng)、人力資源系統(tǒng)等高級別的核心系統(tǒng)則盡可能地放在獨(dú)立的新建資源池內(nèi),搭配高端的磁盤陣列設(shè)備,并配備專家工程師和值守人員。
4.2 以太網(wǎng)組網(wǎng)
計(jì)算資源池計(jì)算資源密集,網(wǎng)絡(luò)流量集中,對內(nèi)和對外的通信壓力比普通服務(wù)器更大。網(wǎng)絡(luò)作為基礎(chǔ)通信設(shè)施,在進(jìn)行組網(wǎng)規(guī)劃時(shí),主要考慮其連通性、隔離性、安全性、服務(wù)質(zhì)量(QoS)等,保證整個一體化資源云管理平臺的穩(wěn)定運(yùn)行。
為了提高系統(tǒng)抗風(fēng)險(xiǎn)能力,網(wǎng)絡(luò)安全方面的考量必不可少。資源平臺中的服務(wù)器和業(yè)務(wù)眾多,通過網(wǎng)絡(luò)隔離,確保非必要的網(wǎng)絡(luò)通信相互隔離,網(wǎng)絡(luò)通信不可達(dá),確保網(wǎng)絡(luò)安全。
網(wǎng)絡(luò)連通是最基本的要求,將有需要進(jìn)行互相通信的組件一比如平臺和服務(wù)器之間、服務(wù)器與服務(wù)器之間,以及服務(wù)器與互聯(lián)網(wǎng)等控制節(jié)點(diǎn)、用戶客戶端等的網(wǎng)絡(luò)連通。隨著千兆乃至萬兆網(wǎng)絡(luò)普及,資源集中帶來的網(wǎng)絡(luò)帶寬壓力有所減緩。
QoS網(wǎng)絡(luò)服務(wù)質(zhì)量則需要考慮每一個業(yè)務(wù)應(yīng)用的重要程度,確定其優(yōu)先級,確定業(yè)務(wù)對網(wǎng)絡(luò)帶寬的要求和實(shí)際產(chǎn)生的數(shù)據(jù)通信密度,根據(jù)實(shí)際情況合理規(guī)劃,靈活調(diào)整。最大程度上用有限的資源錯峰使用網(wǎng)絡(luò)帶寬,確保重要業(yè)務(wù)應(yīng)用或者系統(tǒng)作業(yè)的網(wǎng)絡(luò)需求優(yōu)先得到滿足。
通過不同的VLAN,可以簡單快速的實(shí)現(xiàn)所期望的網(wǎng)絡(luò)聯(lián)通和隔離。在研究確定了不同業(yè)務(wù)應(yīng)用和系統(tǒng)作業(yè)的網(wǎng)絡(luò)特性和優(yōu)先級后,為高級別的應(yīng)用或者高數(shù)據(jù)通信密度的應(yīng)用或作業(yè)劃分到專用的獨(dú)立VLAN上或者物理交換機(jī)上,以保證網(wǎng)絡(luò)服務(wù)質(zhì)量,并降低對其他業(yè)務(wù)應(yīng)用和作業(yè)的影響。
4.3 存儲資源池的搭建
不同的磁盤陣列性能容量差異很大。先確定業(yè)務(wù)應(yīng)用重要程度、繁忙程度,對存儲性能和可靠性的要求。對于核心應(yīng)用系統(tǒng),原則上必須分配使用高端存儲資源池,采用高端磁盤陣列,兼顧性能和安全。而對于測試系統(tǒng)、網(wǎng)盤系統(tǒng)或邊緣應(yīng)用系統(tǒng),對容量和靈活性要求較高,對存儲性能要求較低,則應(yīng)該考慮為其優(yōu)先分配主機(jī)內(nèi)置磁盤空間,采用SATA近在線磁盤,或采用利舊存儲虛擬化方案。
數(shù)據(jù)無價(jià),對于核心業(yè)務(wù)應(yīng)用特別需要考慮存儲級別的備份,以及節(jié)點(diǎn)故障時(shí)的數(shù)據(jù)冗余,確保數(shù)據(jù)安全性。關(guān)鍵應(yīng)用生產(chǎn)系統(tǒng)配備高性能的SAN存儲。采用成熟的IBMPPRC或EMCSRDF存儲復(fù)制技術(shù)實(shí)現(xiàn)雙存儲復(fù)制實(shí)時(shí)同步,防止存儲系統(tǒng)成為單點(diǎn)故障,如圖3所示。
4.4 自動化流程處理引擎
一體化資源云管理平臺的各個功能組件相對獨(dú)立工作,但如果要完成連續(xù)性業(yè)務(wù)操作,可能需要切換不同的模塊,過程冗長繁瑣,效率低下容易犯錯,所以自動化流程處理引擎的驅(qū)動能力必不可少。通過接口調(diào)用,將各個功能模塊整合在一起,將一系列原子操作整合成完整的業(yè)務(wù)動作,統(tǒng)一展現(xiàn)給平臺的管理員和最終用戶。從邏輯上看,流程處理引擎的功能可以用圖4表示。
5 結(jié)束語
綜上所述,建立與電網(wǎng)公司信息化發(fā)展相適應(yīng)的云計(jì)算資源管理體系,打造一體化資源云管理平臺,必將有效提高IT資源的運(yùn)行維護(hù)效率,實(shí)現(xiàn)IT資源的快速交付,敏捷響應(yīng)各種業(yè)務(wù)需求,保障業(yè)務(wù)系統(tǒng)安全穩(wěn)定運(yùn)行,從整體上提高電力企業(yè)的IT服務(wù)交付能力和管理水平。
參考文獻(xiàn)
[1]張小慶.基于云計(jì)算環(huán)境的資源提供優(yōu)化方法研究[D].武漢理工大學(xué),2013.
[2]王慶霞.淺談IT運(yùn)維管理的應(yīng)用與實(shí)踐[J].信息安全與技術(shù),2012.
[3]虛擬化與云計(jì)算小組.虛擬化與云計(jì)算[M].北京:電子工業(yè)出版社,2009:133-135.
[4]馬良.IAAS云計(jì)算平臺中資源管理和調(diào)度技術(shù)的研究[D].北京郵電大學(xué),2013.