顧景民 時(shí)陽(yáng)
【摘 要】本文介紹了vmware ESXI虛擬化集群技術(shù)以及vmware虛擬服務(wù)器的備份和恢復(fù)。
【關(guān)鍵詞】虛擬化;VMware;ESXI;HA;SRM;備份;恢復(fù)
1 服務(wù)器虛擬化技術(shù)
服務(wù)器虛擬化技術(shù)是當(dāng)下流行的一種技術(shù),是指通過(guò)虛擬化技術(shù)將一臺(tái)計(jì)算機(jī)虛擬為多臺(tái)邏輯計(jì)算機(jī)。在一臺(tái)計(jì)算機(jī)上同時(shí)運(yùn)行多個(gè)邏輯計(jì)算機(jī),每個(gè)邏輯計(jì)算機(jī)可運(yùn)行不同的操作系統(tǒng),并且應(yīng)用程序都可以在相互獨(dú)立的空間內(nèi)運(yùn)行而互不影響,從而顯著提高計(jì)算機(jī)資源的利用率。
在虛擬化技術(shù)出現(xiàn)之前,每臺(tái)主機(jī)只能使用一個(gè)操作系統(tǒng),在同一主機(jī)上運(yùn)行多個(gè)應(yīng)用程序通常會(huì)發(fā)生沖突,而采用部署多個(gè)應(yīng)用中間件的方式,將有可能導(dǎo)致主機(jī)系統(tǒng)資源利用率降低,硬件成本高昂而且不夠靈活。通過(guò)采用虛擬機(jī)技術(shù),將管理操作系統(tǒng)和應(yīng)用程序有效分離,分別作為單一的個(gè)體運(yùn)行。并且應(yīng)用程序都可以在相互獨(dú)立的空間內(nèi)運(yùn)行而互不影響,從而顯著提高計(jì)算機(jī)的工作效率。可以實(shí)現(xiàn)IT資源的動(dòng)態(tài)分配、靈活調(diào)度、跨域共享,提高IT資源利用率,使IT資源能夠真正成為社會(huì)基礎(chǔ)設(shè)施,服務(wù)于各行各業(yè)中靈活多變的應(yīng)用需求。
2 利用VMware HA工具實(shí)現(xiàn)服務(wù)器的熱備
VMware,Inc是一家可以提供服務(wù)器、桌面虛擬化的解決方案公司,在虛擬化和云計(jì)算基礎(chǔ)架構(gòu)領(lǐng)域處于全球領(lǐng)先地位,所提供的、解決方案可通過(guò)降低復(fù)雜性以及更靈活、敏捷地交付服務(wù)來(lái)提高IT效率。VMware眾多虛擬化技術(shù)中,HA不僅可以實(shí)現(xiàn)虛擬機(jī)的熱備,還可以實(shí)現(xiàn)虛擬機(jī)的集群,資源的動(dòng)態(tài)分配。
VMware HA將一組物理主機(jī)合并為一個(gè)具有共享資源池的群集,HA監(jiān)控群集中的所有主機(jī)。一旦某臺(tái)主機(jī)發(fā)生故障,VMware HA會(huì)立即響應(yīng),并在另一臺(tái)主機(jī)上重新啟動(dòng)受影響的虛擬機(jī)。每一臺(tái)VMware ESXI服務(wù)器配有一個(gè)HA代理,持續(xù)不斷地檢測(cè)群集中其他主機(jī)的心跳信號(hào)。ESXI主機(jī)每隔五秒就會(huì)通過(guò)服務(wù)主機(jī)的網(wǎng)絡(luò)連接發(fā)送心跳信號(hào)。假如某臺(tái)ESX主機(jī)在連續(xù)三個(gè)時(shí)間間隔后都還沒(méi)有發(fā)出心跳信號(hào),那么該主機(jī)就被默認(rèn)為發(fā)生了故障或者與網(wǎng)絡(luò)的連接出現(xiàn)了問(wèn)題。在這種情況下,原本在該主機(jī)上運(yùn)行的虛擬機(jī)就會(huì)自動(dòng)被轉(zhuǎn)移到群集中的其他主機(jī)上。反之,如果一臺(tái)主機(jī)無(wú)法接收到來(lái)自群集的其他主機(jī)的心跳信號(hào),那么該主機(jī)便會(huì)啟動(dòng)一個(gè)內(nèi)部進(jìn)程來(lái)檢測(cè)自己跟群集中其他主機(jī)的連接是否出現(xiàn)了問(wèn)題。如果真的出現(xiàn)了問(wèn)題,那么就會(huì)中斷在這臺(tái)主機(jī)上所有正在運(yùn)行的虛擬機(jī),并啟動(dòng)預(yù)先設(shè)定好的備用主機(jī)(圖1)。
圖1
VMware HA的群集具有以下功能:
(1)當(dāng)虛擬主機(jī)發(fā)生硬件故障時(shí),將為故障切換容量范圍內(nèi)所有正在運(yùn)行的虛擬機(jī)提供自動(dòng)故障切換??梢栽跓o(wú)需任何人員干預(yù)的情況下自動(dòng)檢測(cè)服務(wù)器故障和重啟虛擬機(jī)。
(2)VMware HA可以提供動(dòng)態(tài)的、智能的資源分配和虛擬機(jī)優(yōu)化。
(3)VMware HA支持易于使用的配置和使用Virtual Center進(jìn)行監(jiān)控。HA確保該容量總是可用的(在指定的故障切換容量限制內(nèi)),以便重啟所有受服務(wù)器故障影響的虛擬機(jī)(基于為虛擬機(jī)配置的資源預(yù)留)。
(4)不間斷地監(jiān)控容量利用率,并“預(yù)留”備用容量以便能夠重啟虛擬機(jī)。當(dāng)未發(fā)生故障時(shí),虛擬機(jī)可以完全利用備用故障切換容量。采用VMware HA后,對(duì)于虛擬主機(jī)的維護(hù)工作將減少50%以上,同時(shí)利用HA的資源監(jiān)控和分派功能在較短的時(shí)間內(nèi)了解具體應(yīng)用對(duì)資源的要求。
3 利用VMware SRM實(shí)現(xiàn)災(zāi)難恢復(fù)
VMware vCenter Site Recovery Manager(SRM)是一個(gè)業(yè)務(wù)連續(xù)性和災(zāi)難恢復(fù)解決方案,可以計(jì)劃、測(cè)試和執(zhí)行一個(gè)站點(diǎn)(受保護(hù)站點(diǎn))和另一個(gè)站點(diǎn)(恢復(fù)站點(diǎn))之間 vCenter 虛擬機(jī)的恢復(fù)。它提供了用于災(zāi)難恢復(fù)管理、無(wú)中斷測(cè)試和自動(dòng)化故障切換的功能,可以自動(dòng)在服務(wù)器群和災(zāi)難恢復(fù)站點(diǎn)之間進(jìn)行自動(dòng)化故障轉(zhuǎn)移,也可以在兩個(gè)包含活動(dòng)工作負(fù)載的站點(diǎn)之間的故障切換。使用SRM能實(shí)現(xiàn)恢復(fù)計(jì)劃的設(shè)置、測(cè)試和執(zhí)行等關(guān)鍵要素的簡(jiǎn)化和自動(dòng)化(圖2)。
圖2
使用SRM實(shí)現(xiàn)災(zāi)難恢復(fù)的流程如下:
(1)設(shè)置恢復(fù)基礎(chǔ)架構(gòu):SRM將指導(dǎo)用戶(hù)完成連接到遠(yuǎn)程站點(diǎn)和正在使用的存儲(chǔ)復(fù)制軟件這一過(guò)程。另外,還可將生產(chǎn)資源(包括計(jì)算和網(wǎng)絡(luò)資源)映射到恢復(fù)站點(diǎn)上的相應(yīng)資源。
(2)創(chuàng)建恢復(fù)計(jì)劃:SRM提供了直觀界面,可幫助用戶(hù)針對(duì)基礎(chǔ)架構(gòu)的各種故障切換情形和不同部分創(chuàng)建恢復(fù)計(jì)劃。用戶(hù)可以將虛擬機(jī)掛起或關(guān)閉,以釋放資源供恢復(fù)過(guò)程使用。用戶(hù)還可以指定虛擬機(jī)的啟動(dòng)順序,設(shè)置自動(dòng)執(zhí)行用戶(hù)定義的腳本,并能根據(jù)需要確定暫?;謴?fù)過(guò)程的位置。
(3)測(cè)試恢復(fù)計(jì)劃:SRM通過(guò)使用存儲(chǔ)陣列的快照功能并將虛擬機(jī)連接到用戶(hù)的隔離測(cè)試網(wǎng)絡(luò),自動(dòng)在恢復(fù)站點(diǎn)上創(chuàng)建無(wú)中斷且隔離的測(cè)試環(huán)境。它會(huì)自動(dòng)執(zhí)行要在實(shí)際故障切換時(shí)使用的恢復(fù)計(jì)劃,并在測(cè)試完成后清除測(cè)試環(huán)境。測(cè)試結(jié)果可保存起來(lái),以便隨時(shí)查看和導(dǎo)出。
(4)自動(dòng)執(zhí)行故障切換:一旦管理員從VMware vCenter Server啟動(dòng)了恢復(fù)計(jì)劃,SRM即會(huì)自動(dòng)執(zhí)行恢復(fù)計(jì)劃中的步驟,以確?;謴?fù)過(guò)程的執(zhí)行與當(dāng)初的設(shè)計(jì)完全一致。管理員可以了解整個(gè)執(zhí)行過(guò)程。但為了保證災(zāi)難恢復(fù)的有效性及可操作性,在部署SRM之前,首先必須對(duì)如下關(guān)鍵的問(wèn)題進(jìn)行仔細(xì)地規(guī)劃,否則將嚴(yán)重影響SRM恢復(fù)的有效性。
3.1 虛擬機(jī)布置
對(duì)于VMware SRM,簡(jiǎn)單地將所有的虛擬機(jī)存儲(chǔ)在一個(gè)SAN當(dāng)中是遠(yuǎn)遠(yuǎn)不夠的。對(duì)于成功的SRM部署,虛擬機(jī)在存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)中的位置也是十分重要的。
為什么虛擬機(jī)位置十分重要?首先,虛擬機(jī)位置可以影響SAN的復(fù)制。VMware SRM依賴(lài)于SAN提供的復(fù)制技術(shù)。VMware SRM不能管理或者提供這種技術(shù);它需要的只是其可用、恰當(dāng)配置和可操作性。大多數(shù)SAN復(fù)制技術(shù)在邏輯單元號(hào)(LUN)層進(jìn)行復(fù)制,意味著只能以整個(gè)LUN決定是是否復(fù)制。這樣的結(jié)果是,組織必須確保需要通過(guò)VMware SRM保護(hù)的虛擬機(jī)被存放于同一個(gè)可被復(fù)制的LUN當(dāng)中(否則SRM將不能提供保護(hù))。一些組織可能會(huì)在第一次安裝和配置SAN復(fù)制時(shí)考慮解決虛擬機(jī)放置問(wèn)題。如果沒(méi)有,就需要在安裝SRM之前解決這個(gè)問(wèn)題??梢允褂肰MwareStorage VMotion實(shí)現(xiàn)在沒(méi)有宕機(jī)的情況下將虛擬機(jī)在數(shù)據(jù)存儲(chǔ)間進(jìn)行遷移。
其次,虛擬機(jī)位置重要的原因是VMware SRM在操作時(shí)需要同時(shí)移動(dòng)整個(gè)LUN(或者數(shù)據(jù)存儲(chǔ))。在SRM故障轉(zhuǎn)移過(guò)程中,有些虛擬機(jī)不能同時(shí)進(jìn)行移動(dòng),就需要將它們放置于不同的數(shù)據(jù)存儲(chǔ)當(dāng)中。只有當(dāng)災(zāi)難恢復(fù)過(guò)程中,位于同一個(gè)數(shù)據(jù)存儲(chǔ)的所有虛擬機(jī)可以同時(shí)進(jìn)行故障轉(zhuǎn)移的情況下,才可以將虛擬機(jī)放置于同一個(gè)數(shù)據(jù)存儲(chǔ)當(dāng)中。同樣,Storage VMotion可以在沒(méi)有產(chǎn)生宕機(jī)的情況下將虛擬機(jī)移動(dòng)到恰當(dāng)?shù)臄?shù)據(jù)存儲(chǔ)之中。
為了解決這個(gè)注意事項(xiàng),組織需要在文檔中明確規(guī)定虛擬機(jī)在SAN中的存儲(chǔ)位置。一旦位置被確定下來(lái),就需要對(duì)一些虛擬機(jī)進(jìn)行遷移,比如將虛擬機(jī)移動(dòng)到可復(fù)制的LUN之中,實(shí)現(xiàn)通過(guò)VMware SRM進(jìn)行保護(hù)。直到SRM實(shí)施過(guò)程中才會(huì)進(jìn)行另一部分必要的遷移。擁有這些文檔可以簡(jiǎn)化之后的遷移過(guò)程。
3.2 規(guī)劃災(zāi)難恢復(fù)計(jì)劃
VMware SRM可以為非虛擬化資源提供集成特性,比如運(yùn)行腳本來(lái)控制網(wǎng)絡(luò)設(shè)備。VMware SRM的正確定位為:災(zāi)難恢復(fù)策略中的一個(gè)組成部分。組織仍然必須定義災(zāi)難恢復(fù)事件,比如怎樣才能構(gòu)成一個(gè)合格的災(zāi)難恢復(fù)事件,組織仍然必須定義多個(gè)角色來(lái)表明災(zāi)難事件中的任務(wù)分配。VMware SRM不能替換這些角色,但是VMware SRM需要組織這些定義來(lái)使得這項(xiàng)技術(shù)可以適用于災(zāi)難恢復(fù)策略。尋求以技術(shù)作為策略的組織最后會(huì)發(fā)現(xiàn)很難達(dá)到項(xiàng)目的成功準(zhǔn)則。
雖然VMware SRM提供了服務(wù)器群資源整合功能,但SRM只是企業(yè)中一個(gè)全面的災(zāi)難恢復(fù)戰(zhàn)略的一部分。仍然需要一個(gè)為數(shù)據(jù)中心余下的物理機(jī)器制定一個(gè)完善的災(zāi)難恢復(fù)計(jì)劃。用戶(hù)必須明確定義災(zāi)難恢復(fù)事件以及處理災(zāi)難事件相關(guān)的各種角色和任務(wù),并將這些內(nèi)容與SRM結(jié)合起來(lái),以便使SRM能根據(jù)企業(yè)的實(shí)際需求制訂模型化的災(zāi)難恢復(fù)戰(zhàn)略。
4 總結(jié)
利用VMware技術(shù)實(shí)現(xiàn)服務(wù)器的虛擬化,以及熱備和恢復(fù),充分發(fā)揮了服務(wù)器的硬件性能,能夠在確保企業(yè)投入成本的同時(shí),提高運(yùn)營(yíng)效率,節(jié)約能源降低經(jīng)濟(jì)成本和空間浪費(fèi),對(duì)于發(fā)展迅速,成長(zhǎng)規(guī)模大的用戶(hù)來(lái)說(shuō),可以通過(guò)服務(wù)器虛擬化技術(shù)帶來(lái)更多的經(jīng)濟(jì)效益。
【參考文獻(xiàn)】
[1]Whats New in VMware Data Recovery 2.0 Technical Whitepaper[M].VMware:Jul 12,2011.
[責(zé)任編輯:王楠]