杜家兵 ,劉勝強 ,龐維欣 ,郇長武 ,于 洋
(1.佛山供電局,廣東佛山,528000;2 煙臺海頤軟件股份有限公司,山東煙臺,264000)
為做好智能電網(wǎng)下云計算技術的研究和應用工作,推進佛山供電局智能電網(wǎng)云計算信息管理平臺的搭建,實現(xiàn)主機、存儲層“私有云”應用架構(gòu)和資源的最大化共享及云計算技術的有效應用,實現(xiàn)不同IT 廠家、相同IT 廠家不同IT 設備的統(tǒng)一管理,構(gòu)建穩(wěn)定、安全、可靠和彈性擴展的數(shù)據(jù)存儲基礎架構(gòu),為智能電網(wǎng)各應用系統(tǒng)提供動態(tài)的云資源服務,結(jié)合佛山供電局實際建設和應用,提出云計算服務全生命周期管理思路。
佛山供電局智能電網(wǎng)云計算信息管理平臺采用全新IBM輕量級的基礎架構(gòu)云計算平臺,能夠有效支持Power、X86 架構(gòu)服務器以及各種刀片服務器,提供多種虛擬化技術,可與現(xiàn)有的虛擬化或非虛擬化基礎設施配合工作。作為完全集成的軟件堆棧,可以通過基礎架構(gòu)云計算平臺使用戶從搭建起平臺虛擬化環(huán)境的“云就緒”狀態(tài)逐步過渡到真正的“云”環(huán)境。
智能電網(wǎng)云計算平臺主要實現(xiàn)內(nèi)容有:創(chuàng)建映像,即將實際存儲簡化映像存儲,采用標準操作系統(tǒng)創(chuàng)建新的系統(tǒng)映像,實現(xiàn)物理機或在不同的系統(tǒng)之間的映像轉(zhuǎn)換節(jié)省存儲空間;部署虛擬機,通過資源和虛擬機隔離確保信息訪問安全,實現(xiàn)動態(tài)容量擴展加快新應用交付使用等;云操作實現(xiàn),通過管理授權給云用戶使用,自動化批復,實現(xiàn)標準化部署和配置,提供直觀界面進服務過程進行管理。
智能電網(wǎng)云計算信息管理平臺根據(jù)邏輯層次,可以分為物理資源層、邏輯資源層、虛擬化管理平臺層、云計算服務管理層。云計算平臺基礎架構(gòu)如圖1 所示。
圖1 云計算平臺基礎架構(gòu)
物理資源層包括服務器、存儲系統(tǒng)和網(wǎng)絡等物理資源;邏輯資源層包括邏輯計算資源的分配,邏輯磁盤分配和管理,網(wǎng)絡VLAN 管理等虛擬化后的邏輯資源,而邏輯資源實際是物理資源跟虛擬化技術的結(jié)合,以便提供更好的可擴展性、可分配性和可調(diào)度性;虛擬化管理平臺層是邏輯資源管理、分配、調(diào)度、監(jiān)控與計量的平臺,提供了針對邏輯計算資源、邏輯存儲資源和邏輯網(wǎng)絡資源的監(jiān)控、管理和調(diào)度功能,實現(xiàn)邏輯資源的自動化管理,為用戶門戶和管理層提供了按需分配的引擎;云計算服務管理層是云平臺的用戶門戶,對于使用云平臺服務的終端用戶,看不到也不需要了解物理或邏輯資源層的構(gòu)成和虛擬化管理平臺層的運作,只需關注虛擬化的資源,使用虛擬化的資源。
云計算平臺基礎架構(gòu)提供了一套從底層硬件到上層服務的完整端到端的云管理能力,核心管理軟件底層具備有分別針對Power 和X86 服務器資源的管理能力,可分別通過PowerVM和VMWare vCenter 接入虛擬化后的計算資源,從而向上層云管理平臺提供動態(tài)資源。在管理層提供了豐富的各種面向服務的功能模塊和完整的服務生命周期管理能力,服務產(chǎn)品管理、服務申請、服務審批、服務供應、服務變更和服務回收。
基于輕量級基礎架構(gòu)云計算解決方案,通過采用硬件設備虛擬化、軟件版本標準化、系統(tǒng)管理自動化和服務流程一體化等手段,建設一個以服務為中心的云計算運行平臺,資源的使用方式從專有獨占方式轉(zhuǎn)變成完全共享方式,運行環(huán)境可以自動部署和調(diào)整資源分配,實現(xiàn)資源隨需掌控,從而為管理者和應用者建立一個基于業(yè)務的資源共享、服務集中和自動化的開放數(shù)據(jù)中心。
通過硬件資源、系統(tǒng)業(yè)務及數(shù)據(jù)的全面整合和梳理,將智能電網(wǎng)下龐大、眾多、分散的存儲環(huán)境統(tǒng)一納入到云計算管理平臺的管理之下。在實際建設中,將電力營銷管理、計量自動化、生產(chǎn)管理、人力資源等系統(tǒng)的海量數(shù)據(jù)納入到云計算平臺中,依托當前的硬件資源并適當擴展,實現(xiàn)異地容災、數(shù)據(jù)備份,實現(xiàn)云計算技術與海量數(shù)據(jù)處理技術的融合,為智能電網(wǎng)相關應用系統(tǒng)提供動態(tài)的云資源服務。
在智能電網(wǎng)云計算平臺實踐建設中,要遵循以下原則:高可靠性原則,即平臺可不間斷持續(xù)可用;資源靈活分配原則,即可根據(jù)業(yè)務需求能夠靈活進行資源動態(tài)分配;可擴展性原則,即可以動態(tài)伸縮,滿足應用和用戶規(guī)模的持續(xù)增長;開放性原則,即可以支持跨平臺統(tǒng)一管理,支持多種虛擬化技術以及異構(gòu)存儲的統(tǒng)一管理。
基于以上原則,智能電網(wǎng)云計算平臺的建設需根據(jù)用戶群及業(yè)務模式的不同,建設中要重點考慮的問題也不一樣,可根據(jù)分步走的規(guī)劃,特別是在初次搭建云平臺的過程中,要重視以下步驟和要點:構(gòu)建“資源池”,云計算平臺采用池化資源管理?!俺亍笔枪操Y源,資源并不屬于某一個應用或業(yè)務,而是根據(jù)具體要求,從公共資源池中劃分資源;采用服務管理流程化、自動化的方式集中管理,減少人為的參與,為平臺的規(guī)?;瘮U展提供條件,業(yè)務系統(tǒng)作為云計算平臺的用戶,不需要關心資源的來源及原理,只需要登陸系統(tǒng)使用資源;當業(yè)務需求變化的時候,可以通過彈性伸縮機制和自動化來快速相應,以適應業(yè)務的變化;平臺所提供的各種資源服務,如存儲、CPU、內(nèi)存、網(wǎng)絡帶寬和軟件許可證等,是可以監(jiān)控、控制和計量的,能夠為服務水平管理提供依據(jù)。平臺建設規(guī)??呻S著業(yè)務類型增加和業(yè)務量的增加而迅速擴展,高可擴展性在建設過程必須得以保證;平臺可通過多副本容錯和計算資源同構(gòu)可互換來提高服務的可靠性,在建設過程中對資源的選擇上,就要采用可靠性高的服務器和存儲
基于上述云計算平臺的基礎性建設,將原來運行于各物理平臺的具體應用,分期分批地向云計算平臺遷移,并做好業(yè)務管理模式上的切換。通過云計算平臺逐漸替代原系統(tǒng)的物理機平臺,這一過程即通過云計算平臺實現(xiàn)智能電網(wǎng)下的系統(tǒng)數(shù)據(jù)和應用服務管理,提高資源整合利用效率,真正為企業(yè)的業(yè)務提升提供強有力的平臺支持。
根據(jù)不同應用的具體特性,所采取的具體步驟有所差異??傮w而言,首先應該對智能電網(wǎng)下的各應用系統(tǒng)進行綜合評估,根據(jù)各種應用特性選擇需要建設或遷移的業(yè)務應用,為其制定適合于該應用建設或遷移的方案。該方案需在云計算平臺的測試環(huán)境上進行驗證,如測試通過,則還需進一步確認該方案的細節(jié)問題,以及擬定失敗以后的回滾方案等,在失敗的情況下能夠根據(jù)回滾方案進行回滾,并對失敗原因進行分析。
在智能電網(wǎng)云計算平臺中,需要實現(xiàn)端到端的流程管理,采用工作流引擎來協(xié)調(diào)企業(yè)內(nèi)各個部門的資源利用,提高管理效率。端到端服務流程包括資源服務申請流程、分配流程、回收流程以及資源使用報告流程、服務監(jiān)控管理流程。通過分析,引入全生命周期管理模式可以有效解決云計算平臺的全過程管理
在實踐過程中,基于SOA 架構(gòu)和Java EE 技術路線實現(xiàn)云服務全生命周期管理。通過全生命周期的管理服務模式,實現(xiàn)云計算資源的充分有效利用,為應用者提供從申請、預留、審批、供給、修改到釋放的全過程服務和管理。基于有效的權限管理,所提供的服務流程都可以在云服務管理平臺界面上通過點擊鼠標方的方式靈活配置和調(diào)用。另外,還可以提供客戶化設置,可以根據(jù)具體應用需求快速搭建系統(tǒng)服務環(huán)境,也可以靈活應對用戶服務流程的修改。云服務全生命周期管理主要功能如下所述。
⑴服務申請流程
業(yè)務管理人員通過審核正在進行服務申請的所有項目信息,確認無誤后對每個項目啟動“服務申請”,進入到資源請求信息頁面。系統(tǒng)管理人員接收所提交的業(yè)務需求申請表單后,根據(jù)項目所需的資源情況,分配資源申請信息,包括:CPU 型號、CPU 大小、硬盤型號、硬盤大小、操作系統(tǒng)和所需軟件等信息,然后專責人員審批環(huán)節(jié)。審批完成后,系統(tǒng)自動將資源申請信息發(fā)送給云管理后臺程序,自動創(chuàng)建相關的服務,同時接收創(chuàng)建完畢后的服務信息。
⑵服務回收流程
服務超過使用期限后,系統(tǒng)可自動對過期服務進行回收,以便釋放該服務所占用的系統(tǒng)資源。如需繼續(xù)使用服務,系統(tǒng)管理人員可以在云服務全生命周期管理監(jiān)控頁面對超期的服務器進行服務續(xù)用申請功能,同樣續(xù)用申請需專責人員審批。
⑶服務暫停流程
如果業(yè)務管理人員申請的服務資源暫時不需要使用,可以提交服務暫停申請,釋放申請的服務資源。
⑷服務啟動流程
如果業(yè)務管理人員申請的服務資源處于暫停狀態(tài)時,需要重新啟用資源,可以提交服務啟動申請,通過審批流程過,系統(tǒng)將自動把需要啟動的服務信息提交云管理后臺程序,啟用相關的服務。
⑸ 服務變更流程
服務變更申請由業(yè)務管理人員填寫服務變更的詳細信息,如磁盤空間變更信息、CPU 變更信息、影像變更信息、變更理由、變更人與變更時間等信息,填寫完變更信息后提交審核,最終由平臺自動啟動變更創(chuàng)建過程。
平臺自動記錄服務全生命周期每個環(huán)節(jié)的執(zhí)行信息,管理人員可以查詢每個服務的相關標識、狀態(tài),監(jiān)控服務所處的里程碑點,同時可以調(diào)閱已完成服務的執(zhí)行情況。
云服務平臺的權限管理主要針對用戶所屬角色的定義和用戶角色對服務的訪問權限的管理。用戶角色定義了用戶或者用戶組對應的角色名稱,一個用戶或者用戶組可以同時擁有多個角色。結(jié)合虛擬化資源管理流程,設立申請人、審批人和管理員3 種角色:
申請人:業(yè)務系統(tǒng)接口人。申請人是資源最終使用者,即云平臺的租戶。申請人通過自服務門戶進行資源的申請、操作、監(jiān)控等。
審批人:評估審批。審核所有提交的服務請求和資源實施方案,并確保潛在影響和風險得到評估,做出批準或拒絕的決定,針對具體服務請求,評估并確定相應資源的分派。
管理員:平臺管理。管理員整體資源的管理和規(guī)劃;資源模板的設計,資源池整體運營情況的評估和優(yōu)化,收集分析應用系統(tǒng)需求和配置,分析應用和業(yè)務的限制條件
在云服務平臺的全生命周期管理中,在定義用戶角色時,對于輸入的用戶應在PKI 或LDAP 系統(tǒng)中進行驗證合法性,若接入系統(tǒng)已有PKI 或LDAP 驗證,則平臺只提供應用系統(tǒng)級的認證,無需到用戶一級的認證,具體應用系統(tǒng)的權限認證由系統(tǒng)各自完成。PKI 認證必須在用戶每次調(diào)用不同服務時進行,只要用戶2 次調(diào)用的不是同一個服務,均需要進行PKI 認證。若考慮到PKI 認證對平臺性能方面的影響,可考慮將PKI 認證信息常駐緩存,提高驗證效率。服務訪問權限的管理可以在系統(tǒng)基礎設施服務平臺中定義訪問某個業(yè)務服務所必須具有的角色。多個角色可以允許訪問同一個服務。
對云服務平臺管理中涉及的相關參數(shù)提供統(tǒng)一維護功能,滿足系統(tǒng)參數(shù)增、刪、改和查的需要,對每項操作都需進行詳細日志記錄,并提供統(tǒng)計查詢和報表分析功能。
通過構(gòu)建智能電網(wǎng)云計算平臺有效提高了資源利用率近3 倍,節(jié)省了存儲空間達60%,同時在服務器及資源應用維護上大大降低了管理成本,資源部署周期從原來的幾個星期減少幾個小時。通過有效的云服務全生命周期管理構(gòu)建了自我服務平臺,可自動響應業(yè)務變化,使IT 服務架構(gòu)與業(yè)務管理緊密聯(lián)系,使資源管理更加規(guī)范性,提高了管理水平。隨著云計算的應用研究以及業(yè)內(nèi)相關構(gòu)建實踐經(jīng)驗的不斷累積,云計算平臺所打造的虛擬化、自動化、服務化技術,很快將成為智能電網(wǎng)的應用與研究方向。
[1]鄭湃,崔立真,王海洋,等.云計算環(huán)境下面向數(shù)據(jù)密集型應用的數(shù)據(jù)布局策略與方法[J].計算機學報,2010,33(8):1472-1480.
[2]李亞瓊,宋瑩,黃永兵.一種面向虛擬化云計算平臺的內(nèi)存優(yōu)化技術[J].計算機學報,2011,34(4):684-693.
[3]劉曉茜,楊壽保,郭良,等.雪花結(jié)構(gòu):一種新型數(shù)據(jù)中心網(wǎng)絡結(jié)構(gòu)[J].計算機學報,2011,34(1):76-85.
[4]劉鵬.實戰(zhàn)Hadoop—開啟通向云計算的捷徑[M].北京:電子工業(yè)出版社,2011.
[5]崔婷婷,孫建鋼.建云數(shù)據(jù)中心需考量生命周期[J].中國經(jīng)濟和信息化,2012(11):95.
[6]匡勝徽,李勃.云計算體系結(jié)構(gòu)及應用實例分析[J].計算機與數(shù)字工程,20l0,38(3):60-63,91