葉繼強
【摘 要】本文通過分析在企業(yè)有關于混用新舊服務器配置高可用群集的問題,通過采用VMware EVC技術解決這類問題的途徑,并描述了在中核蘇閥科技實業(yè)股份有限公司(以下簡稱“公司”)案例中應用虛擬化平臺技術構建服務器高可用群集(HA)的過程,研究合理的服務虛擬化應用平臺構架。通過實踐證明,基于VMware EVC技術能將新舊服務器組成群集,計算資源得以共享,使虛擬機應用服務可以進行故障自動遷移,提高了服務器的使用率和穩(wěn)定性,降低了公司在服務器設備資金的投入成本和管理成本。
【關鍵詞】服務器高可用群集;虛擬化技術;VMware EVC
中圖分類號: TP302文獻標識碼: A 文章編號: 2095-2457(2019)33-0011-002
DOI:10.19694/j.cnki.issn2095-2457.2019.33.005
0 引言
隨著企業(yè)的不斷擴大,企業(yè)服務器數(shù)量也越來越多。大多服務器只運行一個系統(tǒng)應用,公司采用虛擬化技術很好的解決服務器計算資源閑置的問題,為了使服務器計算資源能夠互通共享,就需要配置服務器高可用群集。
中核蘇閥科技實業(yè)股份有限公司(以下簡稱“公司”)信息中心現(xiàn)有信息化建設起步較早,公司的信息化應用系統(tǒng)分布在不同的物理服務器上,數(shù)據(jù)環(huán)境基本按照“一臺服務器、一個操作系統(tǒng)、一種應用”的模式不斷搭建擴展。公司信息中心機房現(xiàn)有物理服務器數(shù)量三十余臺,但由于服務器建設周期不同,服務器新舊程度存在差異,服務器CPU也有不同平臺等級的問題,對配置服務器高可用群集帶來困難。通過配置增強型vMotion兼容性 (Enhanced vMotion Compatibility,EVC)功能確保群集內(nèi)服務器的兼容性,可以解決新舊服務器混用問題。
1 需求分析與方案設計
公司的虛擬化平臺搭建的是VMware vSphere平臺,服務器搭載的是ESXi6.0u3版本系統(tǒng);計算資源方面,服務器品牌均為HPE服務器,但服務器系列跨度較大,從GEN7至GEN10各個系列的新舊服務器混用;存儲方面,公司使用萬兆網(wǎng)絡連接存儲聚合與數(shù)據(jù)群集,為服務器群集高可用提供基礎。原服務器群集使用VCSA進行統(tǒng)一管理,雖然應用數(shù)據(jù)都與計算資源服務器分離,但由于服務器兼容性問題,無法使用在線遷移功能,計算資源故障后也無法自動遷移至可用服務器上。
由于VMware vSphere平臺虛擬硬件規(guī)格對于啟用高可用群集的CPU有兼容性要求,本次重新構建了一個以3臺ESXi6.5U2的主機的群集并新建vCenter進行管理。VMware EVC具有多種模式,不同的模式所提供的功能有所不同,由服務器硬件規(guī)格差異所支持的模式也有所不同,當具有不同EVC模式支持的主機,創(chuàng)建成同一個群集時,其EVC選型支持以最小的一臺主機的最后一項為準。
群集必須最低具有三臺ESXi主機,本次挑選了2臺HPE DL380 GEN10和1臺DL580 GEN9的服務器進行構建群集。雖然服務器CPU型號不同,但所支持的EVC模式是基本相同的:
新建的服務器群集不對公司原有網(wǎng)絡環(huán)境產(chǎn)生改變,連接公司原有萬兆存儲網(wǎng)絡并掛載存儲聚合卷,3臺服務器分別連接公司核心網(wǎng)絡交換機與災備網(wǎng)絡交換機,完成群集網(wǎng)絡組建。
在不影響各個應用服務連續(xù)性和終端環(huán)境穩(wěn)定性的前提下,使用VEEAM災備系統(tǒng)對公司OA應用、ERP應用、視頻會議系統(tǒng)原有系統(tǒng)進行全環(huán)境備份,并直接恢復至新的虛擬群集中;在新群集上新建備用域及DNS服務器,使全新安裝的虛擬機環(huán)境能在域環(huán)境故障情況下具有一定的容錯能力。
2 服務器高可用群集EVC配置實踐過程
VMware的高可用必須先創(chuàng)建一個群集,然后用主機填充該群集,并在建立故障切換保護之前配置EVC設置。群集構建的基礎是vSphere和vCenter Server的搭建。為3臺服務器安裝相同版本的EXSi6.5U2后,選取第一臺搭建VCSA至服務器本地磁盤上后,確定群集的節(jié)點,配置節(jié)點的網(wǎng)絡連接并掛載共享存儲。
根據(jù)公司原核心網(wǎng)絡VLAN的劃分,為3臺服務器分配配置三個虛擬交換機,一個作為生產(chǎn)網(wǎng)絡、一個作為虛擬機動態(tài)遷移vMotion網(wǎng)絡、另一個作為備份網(wǎng)絡。通過連接萬兆網(wǎng)絡添加兩個存儲聚合卷,完成服務器高可用群集的底層要求。在建立好網(wǎng)絡架構后,將3臺服務器添加到群集并完成高可用配置。
按EVC設置規(guī)則,不同型號的主機按所支持的EVC模式的最后一項為準,在群集配置中選擇為Intel 主機啟用EVC,并將VMware EVC模式選為Intel "Broadwell"Generation模式,此模式可提供事務性同步擴展、監(jiān)控模式訪問防護、多精度帶進位加指令擴展、PREFETCHW和RDSEED等CPU功能,缺點是只支持同等級或更高CPU規(guī)格的服務器加入群集。在開啟了EVC后配置開啟vSphere HA,在出現(xiàn)服務器故障下自動重新啟動虛擬機應用服務,并設置預留一定比例的群集資源來定義故障切換容量。
在完成了群集的基礎搭建后,通過vCenter對群集的計算資源進行整合,并為要遷移的虛擬機應用系統(tǒng)預估劃分計算容量和空間容量。通過不同的遷移方式,將虛擬機遷移至群集上:
通過使用公司VEEAM災備系統(tǒng),將原有虛擬機系統(tǒng)環(huán)境、應用服務、數(shù)據(jù)全部備份并封裝成獨立的備份單元,在群集上直接將備份單元恢復至虛擬環(huán)境里來。完成整體環(huán)境恢復后,恢復網(wǎng)絡服務并測試應用功能。
在群集上新建備用域與DNS服務器,并為群集上的虛擬機配置可切換的備用地址,斷開群集與主域之間的網(wǎng)絡連接,測試備用域與DNS的可用性。
公司視頻會議系統(tǒng)驗證使用的是USB電子狗,由于該USB設備無法進行自動遷移,需在群集上為虛擬機與主機之前建立反向規(guī)則,將視頻會議應用虛擬機綁定至規(guī)定的主機,使其不進行自動故障遷移。
服務器高可用群集配置全部完成后,對群集故障遷移能力進行測試,關閉群集中任意一臺主機,群集檢測到主機故障并自動對虛擬機進行了計算資源遷移,應用服務完全不受虛擬機的在線遷移影響,做到客戶端無感知故障自動遷移。而視頻會議應用由于虛擬機規(guī)則的設置,沒有進行自動遷移。
4 效益分析
通過服務器高可用群集EVC配置,有效地發(fā)揮了公司虛擬化平臺,使新舊服務器可以混用在同一群集中,大幅提高了舊服務器的利用率,有效遏制了物理服務器數(shù)量的增長。
減少了物理服務器的采購數(shù)量,如不使用EVC技術,那每次服務器購置就必須按群集主機基數(shù)進行采購,現(xiàn)在按需對服務器數(shù)量進行更新,對中小型機房的服務器采購節(jié)省了大量更新設備的經(jīng)費,同時也延長了老服務器的可用時間。
利用服務器高可用群集,實現(xiàn)了服務器之間的動態(tài)資源調(diào)配和高可用功能,可使群集有能力進行主機故障自動遷移虛擬機應用服務,保證了應用系統(tǒng)業(yè)務的連續(xù)性。
通過配置EVC技術,成功將原有3臺新舊混搭的物理服務器構建成一個高可用群集,虛擬化應用效果較好。通過服務器虛擬化群集整合,既滿足了公司應用系統(tǒng)穩(wěn)定運行的需求,又有效控制了公司服務器設備購置和管理的成本。