王依群,王劍新
?
虛擬化技術(shù)在數(shù)據(jù)中心遷移中的應(yīng)用研究
王依群,王劍新
(哈爾濱電氣集團(tuán)有限公司,哈爾濱 150040)
云計(jì)算、虛擬化技術(shù)的快速發(fā)展,推動(dòng)大型企業(yè)紛紛在基礎(chǔ)架構(gòu)上進(jìn)行彈性部署、云化。哈電集團(tuán)2015年江北數(shù)據(jù)中心投用,以數(shù)據(jù)中心遷移為契機(jī),充分考慮現(xiàn)有服務(wù)器資源,搭建企業(yè)內(nèi)部虛擬化平臺(tái),對(duì)現(xiàn)有系統(tǒng)進(jìn)行虛擬化改造,并在遷移過(guò)程中直接遷移至云端,既保證了數(shù)據(jù)和系統(tǒng)的安全、快速、穩(wěn)定遷移,同時(shí)對(duì)現(xiàn)有基礎(chǔ)架構(gòu)進(jìn)行了升級(jí),提升了數(shù)據(jù)資源的集約共享能力,做到服務(wù)的快速部署和響應(yīng),提升了系統(tǒng)的穩(wěn)定性。
虛擬化;數(shù)據(jù)中心;遷移;基礎(chǔ)架構(gòu)升級(jí)
哈爾濱電氣集團(tuán)公司由于企業(yè)發(fā)展需要,于2015年在江北科研基地新建了數(shù)據(jù)中心機(jī)房,需要在總部搬遷前將數(shù)據(jù)中心遷移至新機(jī)房。同時(shí),由于近幾年企業(yè)信息化的推進(jìn),新系統(tǒng)上線頻繁,新建系統(tǒng)同時(shí)增加一套服務(wù)器設(shè)備的模式已滿足不了系統(tǒng)快速部署的要求,單機(jī)系統(tǒng)負(fù)載不足造成一定的資源浪費(fèi)。同時(shí),公司業(yè)務(wù)對(duì)信息化的依賴導(dǎo)致對(duì)基礎(chǔ)架構(gòu)可靠性要求越來(lái)越高[1]。云計(jì)算、虛擬化的技術(shù)發(fā)展及業(yè)界實(shí)踐,使得我們認(rèn)為在機(jī)房遷移過(guò)程中同時(shí)采用虛擬化技術(shù),將現(xiàn)有系統(tǒng)遷移虛擬化環(huán)境運(yùn)行,將業(yè)務(wù)中斷時(shí)間大幅縮短,遷移效率大大提高,數(shù)據(jù)安全性得到極大保障。對(duì)服務(wù)器資源進(jìn)行統(tǒng)籌安排,提升基礎(chǔ)環(huán)境可靠性,提高服務(wù)器存儲(chǔ)資源利用率,為日后打造彈性、可快速部署的信息化基礎(chǔ)環(huán)境提供架構(gòu)支撐[2]。
隨著企業(yè)信息化建設(shè)的快速推進(jìn),服務(wù)器、存儲(chǔ)等設(shè)備急劇增加,要求基礎(chǔ)架構(gòu)更加靈活、高效、反應(yīng)快速,對(duì)信息化基礎(chǔ)支撐能力提出了新的挑戰(zhàn)。隨著虛擬化、云計(jì)算技術(shù)的成熟,應(yīng)用的日益廣泛,很多企業(yè)IT部門已經(jīng)將自己的數(shù)據(jù)中心重塑為企業(yè)“私有云”。江北基地?cái)?shù)據(jù)中心建設(shè),集團(tuán)信息化基礎(chǔ)支撐能力大幅提升,為建設(shè)企業(yè)私有云提供了有利條件。以機(jī)房搬遷為契機(jī),充分利用集團(tuán)現(xiàn)有計(jì)算資源,采用最新虛擬化、云計(jì)算技術(shù),搭建集團(tuán)云計(jì)算平臺(tái),增強(qiáng)企業(yè)基礎(chǔ)支撐能力。
集團(tuán)現(xiàn)有基礎(chǔ)架構(gòu)為傳統(tǒng)經(jīng)典架構(gòu),每個(gè)信息系統(tǒng)對(duì)應(yīng)一臺(tái)數(shù)據(jù)庫(kù)服務(wù)器、一臺(tái)應(yīng)用服務(wù)器,每次系統(tǒng)實(shí)施都要經(jīng)歷硬件采購(gòu)、基礎(chǔ)環(huán)境搭建等環(huán)節(jié),基礎(chǔ)架構(gòu)靈活性差。不同信息系統(tǒng)間的計(jì)算資源無(wú)法共享,造成計(jì)算資源浪費(fèi)。硬件資源沒有實(shí)現(xiàn)高可用,單臺(tái)服務(wù)器故障導(dǎo)致系統(tǒng)宕機(jī),可靠性差。
(1)通過(guò)搭建企業(yè)私有云,將企業(yè)現(xiàn)有計(jì)算、存儲(chǔ)資源進(jìn)行整合,充分利用現(xiàn)有硬件資源,減少硬件總成本投入,實(shí)現(xiàn)資源快速響應(yīng),做到計(jì)算資源服務(wù)的快速部署上線;
(2)系統(tǒng)動(dòng)態(tài)分配計(jì)算資源與存儲(chǔ),有效利用企業(yè)服務(wù)器資源,減少物理服務(wù)器數(shù)量;
(3)通過(guò)云計(jì)算高可用技術(shù),可實(shí)現(xiàn)物理服務(wù)器故障后虛擬服務(wù)器自動(dòng)漂移,保障系統(tǒng)持續(xù)運(yùn)行服務(wù)不間斷。
(1)在機(jī)房遷移過(guò)程中,業(yè)務(wù)中斷時(shí)間越短越好,本次業(yè)務(wù)中斷目標(biāo)定在5天;
(2)遷移過(guò)程中,涉及企業(yè)財(cái)務(wù)、人事等核心數(shù)據(jù),要確保數(shù)據(jù)安全,保證核心數(shù)據(jù)不丟失;
(3)系統(tǒng)恢復(fù)運(yùn)行后,要確保虛擬化后的系統(tǒng)性能滿足業(yè)務(wù)需求,在最大并發(fā)數(shù)下能夠保證用戶體驗(yàn)良好;
(4)虛擬化后數(shù)據(jù)集中存儲(chǔ)于存儲(chǔ)中,要確保存儲(chǔ)故障后的數(shù)據(jù)安全。
建立一整套系統(tǒng)管理平臺(tái),對(duì)私有云架構(gòu)進(jìn)行全面的管理。管理重點(diǎn)包括:
(1)虛擬資源池的平臺(tái)的搭建,支持異構(gòu)的虛擬化平臺(tái)
(2)虛擬資源池管理(包含虛擬機(jī)、虛擬存儲(chǔ)、虛擬網(wǎng)絡(luò))
通過(guò)系統(tǒng)管理平臺(tái)能夠讓虛擬機(jī)共享后端資源池中的資源,確保在群集中的主機(jī)均能有效支撐在這之上運(yùn)行的虛擬機(jī),如果主機(jī)資源有限或者出現(xiàn)故障,上面運(yùn)行的虛擬機(jī)就會(huì)遷移至有充足計(jì)算資源的主機(jī)上。同時(shí)通過(guò)服務(wù)管理平臺(tái)和門戶對(duì)用戶進(jìn)行快速服務(wù)交付。
(3)云平臺(tái)運(yùn)行狀態(tài)監(jiān)控
系統(tǒng)管理平臺(tái)可以在第一時(shí)間幫助管理員了解到虛擬終機(jī)資源耗用及監(jiān)控狀況,除了能夠提供主動(dòng)預(yù)警服務(wù)之外,也可以在出現(xiàn)問(wèn)題之后快速診斷問(wèn)題,并可提供遠(yuǎn)程支持。
(4)私有云的安全性
除了存在信息安全泄露的遺患之外,還有可能出現(xiàn)病毒及惡意代碼問(wèn)題,會(huì)影響整個(gè)私有云平臺(tái)及IT基礎(chǔ)架構(gòu)。本次項(xiàng)目中采用集中式虛擬機(jī)部署方式,統(tǒng)一部署防病毒軟件、制定統(tǒng)一的補(bǔ)丁及應(yīng)用程序分發(fā)策略、制定統(tǒng)一的密碼策略和IT安全策略等。
私有云整體架構(gòu)主要包括服務(wù)器虛擬化、資源池設(shè)計(jì)、服務(wù)器群集組設(shè)計(jì)、私有云平臺(tái)管理功能設(shè)計(jì)、軟硬件選擇等。(如圖1所示)
圖1 私有云整體架構(gòu)
私有云系統(tǒng)管理平臺(tái)部分,微軟Windows Server Hyper-V 及系統(tǒng)管理套件SystemCenter來(lái)構(gòu)建虛擬資源池,并進(jìn)行全面的私有云系統(tǒng)管理。
一期應(yīng)用Windows Server Hyper-V實(shí)現(xiàn)虛擬化,二期應(yīng)用SystemCenter 實(shí)現(xiàn)高效管理。
在硬件選擇方面主要會(huì)涉及以下三部分:
服務(wù)器:在架構(gòu)設(shè)計(jì)中,會(huì)建設(shè)3個(gè)高可用群集,分別對(duì)應(yīng)私有云系統(tǒng)、管理平臺(tái)和應(yīng)用業(yè)務(wù)系統(tǒng)。一期只建設(shè)應(yīng)用業(yè)務(wù)系統(tǒng)群集,Windows群集能夠?qū)崿F(xiàn)虛擬機(jī)的高可用性,一旦群集內(nèi)的某臺(tái)宿主服務(wù)器出現(xiàn)故障,可迅速的將虛擬機(jī)遷移到群集其他的節(jié)點(diǎn)上??紤]到服務(wù)器虛擬化對(duì)高可用性的要求,建議在該群集中,專門預(yù)留一到三個(gè)節(jié)點(diǎn)作為專門的備機(jī),以提供更高的高可用性。
存儲(chǔ):考慮到要實(shí)現(xiàn)私有云平臺(tái)的高可用性和高性能,在存儲(chǔ)類型上建議使用IPSAN。根據(jù)對(duì)集團(tuán)現(xiàn)有存儲(chǔ)量統(tǒng)計(jì)為2TB,從可擴(kuò)展性角度考慮,需要存儲(chǔ)容量為10TB并實(shí)現(xiàn)RAID10,實(shí)際可用存儲(chǔ)容量為5TB。
一期需增加一臺(tái)10TB的IPSAN存儲(chǔ)。
私有云資源池由后端構(gòu)成群集組的宿主服務(wù)器構(gòu)成,形成計(jì)算資源的虛擬化池,提供給虛擬化管理平臺(tái),虛擬桌面和虛擬服務(wù)器使用。在本方案中,后端虛擬機(jī)池由Windows Server 2012 Hyper-V來(lái)實(shí)現(xiàn),通過(guò)服務(wù)器虛擬化技術(shù)來(lái)支持上述虛擬機(jī)。
Hyper-V宿主服務(wù)器通過(guò)內(nèi)置在Windows Server 2012上的集群服務(wù)來(lái)構(gòu)建一個(gè)虛擬資源池,不同于單臺(tái)的Hyper-V宿主服務(wù)器,Hyper-V宿主服務(wù)器群集能夠?qū)崿F(xiàn):
可以將多臺(tái)宿主服務(wù)器的資源進(jìn)行整合,可以按照宿主服務(wù)器資源利用情況合理分配虛擬機(jī);
良好的擴(kuò)展性,如果原有數(shù)量的宿主服務(wù)器已經(jīng)存在性能瓶頸,計(jì)算資源已經(jīng)不能滿足要求,可以非常方便的添加新的宿主服務(wù)器到群集組中,從而擴(kuò)展虛擬機(jī)的支持?jǐn)?shù)量;
可有效提高虛擬機(jī)的高可用性,一旦群集組中某一臺(tái)宿主服務(wù)器出現(xiàn)故障或需要進(jìn)行定期運(yùn)行維護(hù)的時(shí)候,運(yùn)行在該宿主服務(wù)器上的虛擬機(jī)會(huì)平滑遷移到群集內(nèi)的其它宿主服務(wù)器上。
整個(gè)遷移過(guò)程分為4個(gè)階段,第1階段為前期準(zhǔn)備,包括將系統(tǒng)進(jìn)行備份、數(shù)據(jù)備份等內(nèi)容;第2階段為停機(jī)備份,將現(xiàn)有系統(tǒng)全面停止服務(wù),進(jìn)行系統(tǒng)虛擬化備份,同時(shí)服務(wù)器等設(shè)備下架、遷移;第3階段為系統(tǒng)恢復(fù)階段,將備份系統(tǒng)在新機(jī)房虛擬環(huán)境下啟動(dòng)、復(fù)原、驗(yàn)證,設(shè)備遷移至新機(jī)房重新上架、恢復(fù),加入云環(huán)境;第4階段為系統(tǒng)集成測(cè)試上線,對(duì)所有系統(tǒng)進(jìn)行集成測(cè)試并進(jìn)入運(yùn)行環(huán)境,業(yè)務(wù)人員測(cè)試。
此階段主要有3部分要點(diǎn):
(1)在新機(jī)房環(huán)境中測(cè)試部分系統(tǒng)運(yùn)行,對(duì)于一些應(yīng)用范圍比較小的系統(tǒng)比如IT內(nèi)部系統(tǒng),提前遷移,測(cè)試環(huán)境可用性和整個(gè)流程;
(2)系統(tǒng)數(shù)據(jù)備份要盡量預(yù)留多份,可以在新環(huán)境中保存兩份,確保數(shù)據(jù)安全;
(3)遷移方案要進(jìn)行細(xì)化,責(zé)任到人,并進(jìn)行系統(tǒng)推演,明確時(shí)間節(jié)點(diǎn),盡量做到周密細(xì)致。
在實(shí)際遷移過(guò)程中,本階段無(wú)差異,按照預(yù)定計(jì)劃完成。
停機(jī)備份階段要點(diǎn)如下:
(1)與業(yè)務(wù)部門充分溝通,保證停機(jī)對(duì)現(xiàn)有業(yè)務(wù)沖擊最小,且數(shù)據(jù)恢復(fù)點(diǎn)得到雙方簽字確認(rèn);
(2)備份過(guò)程要盡量快速,同時(shí)開展機(jī)房設(shè)備搬遷工作,要做到安全有序,防止發(fā)生系統(tǒng)電源切斷等意外;
(3)下架過(guò)程要盡量選用安全可控工作人員,熟悉電子設(shè)備拆卸、搬運(yùn)流程,保證設(shè)備的安全性。
系統(tǒng)恢復(fù)階段要點(diǎn)如下:
(1)系統(tǒng)恢復(fù)要有優(yōu)先級(jí),對(duì)于重要業(yè)務(wù)系統(tǒng)如財(cái)務(wù)、郵件系統(tǒng)要優(yōu)先恢復(fù)并盡快進(jìn)行系統(tǒng)可用測(cè)試,為萬(wàn)一發(fā)生的系統(tǒng)故障處理預(yù)留充足時(shí)間;
(2)對(duì)于系統(tǒng)故障要有一定的預(yù)期,公司網(wǎng)站系統(tǒng)由于服務(wù)器運(yùn)行已經(jīng)10余年,且由于面對(duì)外網(wǎng)開發(fā),無(wú)法進(jìn)入虛擬化環(huán)境,老化設(shè)備搬遷極大可能出現(xiàn)故障,故需與設(shè)備廠商提前聯(lián)系,確保設(shè)備故障后工程師和備品備件快速入場(chǎng)恢復(fù);
(3)系統(tǒng)恢復(fù)要嚴(yán)謹(jǐn)細(xì)致,對(duì)于系統(tǒng)網(wǎng)絡(luò)等配置要按照操作手冊(cè)準(zhǔn)確無(wú)誤,節(jié)省排查系統(tǒng)配置錯(cuò)誤時(shí)間;
(4)對(duì)于虛擬化環(huán)境的性能要實(shí)時(shí)監(jiān)控,系統(tǒng)加入增多,對(duì)共享存儲(chǔ)及網(wǎng)絡(luò)會(huì)產(chǎn)生持續(xù)壓力,實(shí)時(shí)監(jiān)控系統(tǒng)的處理能力,出現(xiàn)過(guò)載情況要及時(shí)進(jìn)行處理,增加相應(yīng)設(shè)備容量。
集成測(cè)試要點(diǎn)如下:
(1)集成測(cè)試主要考察系統(tǒng)的整體運(yùn)行狀況,在系統(tǒng)運(yùn)行穩(wěn)定的情況下,需要開展系統(tǒng)遷移測(cè)試,將一臺(tái)服務(wù)器關(guān)機(jī),測(cè)試系統(tǒng)故障發(fā)生后漂移能力;
(2)業(yè)務(wù)人員測(cè)試盡量選擇相同時(shí)段進(jìn)行,可同時(shí)測(cè)試系統(tǒng)的并發(fā)處理能力,為后期系統(tǒng)運(yùn)維及擴(kuò)容提供相應(yīng)數(shù)據(jù)。
整體遷移過(guò)程安全、快速,無(wú)重大故障發(fā)生,比預(yù)期7天的系統(tǒng)時(shí)間縮短到4天,保證了數(shù)據(jù)的安全性。
以機(jī)房遷移為契機(jī),通過(guò)搭建服務(wù)器高可用集群,可以將企業(yè)現(xiàn)有計(jì)算、存儲(chǔ)資源進(jìn)行整合,充分利用現(xiàn)有硬件資源,減少硬件總成本投入,實(shí)現(xiàn)資源快速響應(yīng)。做到系統(tǒng)遷移的快速、安全、可靠,計(jì)算資源服務(wù)的快速部署上線,系統(tǒng)動(dòng)態(tài)分配計(jì)算資源與存儲(chǔ),有效利用企業(yè)服務(wù)器資源,可極大減少物理服務(wù)器數(shù)量??蓪?shí)現(xiàn)物理服務(wù)器故障后虛擬服務(wù)器自動(dòng)漂移,保障系統(tǒng)持續(xù)運(yùn)行服務(wù)不間斷。項(xiàng)目未來(lái)將對(duì)現(xiàn)有集群進(jìn)行整合,通過(guò)部署私有云管理系統(tǒng),搭建企業(yè)私有云,使哈電集團(tuán)基礎(chǔ)架構(gòu)邁向云時(shí)代。
[1] 周鐵成. 虛擬化技術(shù)在數(shù)據(jù)中心架構(gòu)中的應(yīng)用研究[J]. 現(xiàn)代計(jì)算機(jī), 2009.
[2] 林秀. 虛擬化技術(shù)在企業(yè)數(shù)據(jù)中心中的應(yīng)用[J]. 電信快報(bào), 2011.
The Application Research of Virtualization Technology in the Migration of Data Center
WANG Yiqun, WANG Jianxin
(Harbin Electric Corporation, Harbin 150040, China)
The rapid development of cloud computing and virtualization technology drives large enterprises to deploy cloud on the infrastructure. HPEC Jiangbei 2015 data center put into use, the data center migration as an opportunity to fully consider the existing server resources, build the enterprise virtualization platform, virtual reform of the existing system, and in the migration process of direct migration to virtualized enviroment, both to ensure the safe, rapid and stable data transfer. At the same time, the existing infrastructure to upgrade, enhance the intensive data sharing ability, to achieve the quick deployment of service and rapid response, and enhance the stability of the system.
virtualization; data center; migration; infrastructure upgrading
TK730
A
1000-3983(2018)02-0077-04
2017-11-11
王依群(1965-),1988年畢業(yè)于西安交通大學(xué)工程力學(xué)專業(yè),現(xiàn)從事信息化管理工作,高級(jí)工程師。