元紹華
摘要:雙活數(shù)據(jù)中心能夠有效提升數(shù)據(jù)中心的資源利用率,并在更高層次上提高業(yè)務(wù)連續(xù)性保障能力。但雙活數(shù)據(jù)中心的構(gòu)建是一個系統(tǒng)性工程,實現(xiàn)起來較為復雜。本文介紹了一種基于vSphere FT技術(shù)在雙數(shù)據(jù)中心實現(xiàn)業(yè)務(wù)雙活的通用方法,列舉了其優(yōu)勢和局限性,最后給出方案實施的建議。
關(guān)鍵詞:雙活數(shù)據(jù)中心;vSphere FT
1.引言
近年來,信息化技術(shù)在促進業(yè)務(wù)質(zhì)效提升方面發(fā)揮著越來越重要的作用,企業(yè)對數(shù)據(jù)中心的RTO和RPO也提出了更高的要求,雙活數(shù)據(jù)中心建設(shè)逐漸成為熱門話題。嚴格來說,關(guān)于雙活數(shù)據(jù)中心的定義,目前業(yè)界還沒有統(tǒng)一的標準和規(guī)范,現(xiàn)有的定義主要是一些廠商從基礎(chǔ)架構(gòu)角度提出的理念,最終都體現(xiàn)為業(yè)務(wù)連續(xù)性和資源利用率的提升。
2.vSphere FT簡介
VMware Fault Tolerance是VMware保護虛擬機可用性的一項功能。針對被保護虛擬機——主虛擬機,通過在集群內(nèi)另外一臺主機上創(chuàng)建和維護與之完全相同的輔助虛擬機,提供比HA更高級別的業(yè)務(wù)連續(xù)性保障。
正常情況下,vSphere平臺通過一定機制,實時將內(nèi)存數(shù)據(jù)在內(nèi)的所有信息同步至輔助虛擬機。當主虛擬機所在主機發(fā)生故障時,輔助虛擬機立刻成為主虛擬機并接管業(yè)務(wù),同時在其他可用主機上新建輔助虛擬機,整個切換過程RPO和RTO為0。
3.方案基本原理
二層網(wǎng)絡(luò)打通的情況下,通過在雙數(shù)據(jù)中心搭建跨站點的vSphere集群架構(gòu),將不同業(yè)務(wù)虛擬機分散至雙數(shù)據(jù)中心同時對外提供服務(wù),開啟被保護虛擬機的FT功能,并指定輔助虛擬機所在數(shù)據(jù)中心,從而實現(xiàn)業(yè)務(wù)級數(shù)據(jù)中心雙活。
4.主要做法
一是檢查網(wǎng)絡(luò)環(huán)境,以滿足跨站點FT對網(wǎng)絡(luò)的要求,具體包括兩個數(shù)據(jù)中心間的10Gbit鏈路、二層網(wǎng)絡(luò)互通等;二是調(diào)整虛擬化平臺的部署,在兩個數(shù)據(jù)中心分別構(gòu)建ESXi集群和存儲虛擬化,配置存儲對本數(shù)據(jù)中心及對端數(shù)據(jù)中心集群可見;三是調(diào)整關(guān)鍵業(yè)務(wù)虛擬機的資源配置并部署于主數(shù)據(jù)中心虛擬化平臺,以滿足FT對單主機保護虛擬機數(shù)量的限制,可利用vCenter Operation Manager獲取關(guān)鍵業(yè)務(wù)虛擬機的實際資源需求,進而對其配置進行調(diào)整;四是進行FT相關(guān)配置,包括開啟HA、指定輔助虛擬機所在主機等。
5.方案評價
嚴格意義上的數(shù)據(jù)中心雙活包括網(wǎng)絡(luò)雙活、應(yīng)用雙活和數(shù)據(jù)雙活等,除網(wǎng)絡(luò)雙活技術(shù)已發(fā)展較為成熟外,其他方面都還處在發(fā)展完善階段,且存在“腦裂”、性能下降等風險。
相比之下,本文所提方案具有以下優(yōu)點。
成本低廉:硬件要求與其它數(shù)據(jù)中心雙活解決方案類似,但該方案基于vSphere自帶功能實現(xiàn),無需購買額外的軟件產(chǎn)品。
架構(gòu)簡單:依托網(wǎng)絡(luò)雙活技術(shù),基于vSphere平臺環(huán)境運行,不需要對現(xiàn)有應(yīng)用、數(shù)據(jù)庫進行改造。
運維簡便:類似于常規(guī)的虛擬化運維,不存在“腦裂”、性能下降等風險。
5.1.局限性
目前,vSphere FT功能仍處在一個持續(xù)完善的過程中,在諸多方面有一定的局限性。
5.1.1. 基礎(chǔ)硬件設(shè)施要求高
主要體現(xiàn)在:主機中用于容錯虛擬機的CPU必須與vSpherevMotion兼容,并需要CPU支持硬件MMU虛擬化;需要使用10 Gb日志記錄網(wǎng)絡(luò)并確保網(wǎng)絡(luò)延遲時間非常短。
5.1.2. 軟件許可限制較嚴格
群集中的主機上允許的最大容錯虛擬機數(shù)量為4,并且主虛擬機和輔助虛擬機均計入此限制;跨主機上所有容錯虛擬機聚合的最大vCPU數(shù)量為8,主虛擬機和輔助虛擬機中的vCPU均計入此限制;最高級別的vSphere版本,單個容錯虛擬機支持的vCPU數(shù)量最多為8。
5.1.3. 不支持vSphere部分功能
開啟FT的虛擬機不支持vSphere部分功能,主要包括:不能對已啟用FT的虛擬機執(zhí)行快照;支持為vStorage APIs - Data Protection (VADP)備份而創(chuàng)建的僅磁盤快照,但舊版FT不支持VADP;不能為已啟用FT的虛擬機調(diào)用 Storage vMotion;不能在為鏈接克隆的虛擬機上使用Fault Tolerance,也不能從啟用了FT的虛擬機創(chuàng)建鏈接克隆;不支持磁盤加密、虛擬卷數(shù)據(jù)存儲、基于存儲的策略管理、 I/O 篩選器、TPM、啟用VBS的虛擬機、UPIT。
5.1.4. 不兼容虛擬機部分功能和設(shè)備
開啟FT的虛擬機不能兼容虛擬機部分功能和設(shè)備,主要包括:物理裸磁盤映射、由物理或遠程設(shè)備支持的CD-ROM或虛擬軟盤設(shè)備、USB和聲音設(shè)備、N_Port ID虛擬化(NPIV)、網(wǎng)卡直通、熱插拔設(shè)備、串行或并行端口、啟用了3D的視頻設(shè)備、虛擬EFI固件、虛擬機通信接口(VMCI)、2TB+VMDK。
6.最佳實踐
6.1.主機配置
運行主虛擬機和輔助虛擬機的主機應(yīng)當按照與處理器大致相同的頻率運行,否則輔助虛擬機可能會頻繁地重新啟動。
6.2.主機網(wǎng)絡(luò)配置
按照一定規(guī)則配置主機網(wǎng)絡(luò),以便在不同流量類型的組合和不同數(shù)目的物理網(wǎng)卡的情況下支持FT。
6.3.同類集群
構(gòu)建群集時,所有主機都應(yīng)具有以下配置:對虛擬機所用數(shù)據(jù)存儲的一般訪問權(quán)限、相同的虛擬機網(wǎng)絡(luò)配置、所有主機相同的 BIOS 設(shè)置。
6.4.性能
要為主虛擬機和輔助虛擬機之間的日志記錄通信增加可用帶寬,須使用10千兆位網(wǎng)卡,并允許使用巨幀。
6.5.在共享存儲上存儲 ISO 以連續(xù)進行訪問
對于啟用了FT的虛擬機,其所訪問的ISO應(yīng)存儲在可以供容錯虛擬機的兩個實例訪問的共享存儲上。
6.6.避免網(wǎng)絡(luò)分區(qū)
當vSphere HA群集出現(xiàn)管理網(wǎng)絡(luò)故障,導致某些主機與vCenter Server隔離并且使這些主機彼此隔離時,會出現(xiàn)網(wǎng)絡(luò)分區(qū),有可能降低FT保護。
7.結(jié)語
vSphere FT技術(shù)通過創(chuàng)建和維護與主虛擬機相同、且可在故障發(fā)生時隨時切換的輔助虛擬機,提供了較HA更高等級的業(yè)務(wù)連續(xù)性保障能力。從vSphere最近版本中對FT功能的更新情況可以看出,F(xiàn)T技術(shù)仍然處在不斷發(fā)展進步的過程中,通過合理利用,有望形成一套更為成熟、簡單可靠的雙活數(shù)據(jù)中心解決方案。