□ 張亞龍
相對(duì)于傳統(tǒng)的服務(wù)器部署模式,一臺(tái)物理服務(wù)器部署一個(gè)應(yīng)用軟件,服務(wù)器的平均利用率僅占本機(jī)性能的10%到15%左右。甚至在很多情況下,空置或者僅提供少量服務(wù),主機(jī)也會(huì)消耗70%以上的額定功耗,造成機(jī)房物理空間和電力的損耗。本文結(jié)合主流虛擬化體系的特點(diǎn),從實(shí)際需求出發(fā),提出基于VMware vSphere 虛擬架構(gòu)的服務(wù)器虛擬化部署方案。此方案滿足多種應(yīng)用情況的服務(wù)器利用率,有效減少了在線服務(wù)器的數(shù)量,從而實(shí)現(xiàn)信息化系統(tǒng)的高可用性,并顯著降低其部署成本。
服務(wù)器虛擬化就是將多臺(tái)物理服務(wù)器資源整合成平臺(tái),按照實(shí)際需求進(jìn)行二次分配計(jì)算資源,從而讓操作系統(tǒng)和應(yīng)用具有更高的可用性。當(dāng)前,虛擬化技術(shù)主要應(yīng)用在服務(wù)器虛擬化、遠(yuǎn)程虛擬桌面、AI 人工智能、大數(shù)據(jù)分析等方面。其中服務(wù)器虛擬化,對(duì)于各級(jí)信息化機(jī)房節(jié)點(diǎn)具有很多現(xiàn)實(shí)意義,它可以減少物理機(jī)的數(shù)量,節(jié)約機(jī)架空間,以及降低網(wǎng)絡(luò)設(shè)備、空調(diào)、電源、存儲(chǔ)單元等相關(guān)設(shè)備的消耗,有效降低日常運(yùn)行的經(jīng)濟(jì)成本。
目前比較成熟的虛擬化技術(shù)體系主要有KVM、XEN、VMware 等,其中 KVM 和 XEN 是開源體系。
KVM 是基于Linux 內(nèi)核的全虛擬化虛擬機(jī)系統(tǒng),其架構(gòu)由KVM 內(nèi)核模塊和QEMU-KVM 模擬模塊組成。KVM內(nèi)核模塊是在Linux 內(nèi)核的基礎(chǔ)上增加的虛擬機(jī)管理模塊,通過調(diào)用Linux 內(nèi)核中已經(jīng)包含的進(jìn)程調(diào)度、I/O 管理等模塊,結(jié)合QEMU-KVM 模擬模塊為虛擬機(jī)提供的虛擬化資源進(jìn)行工作,每一個(gè)虛擬機(jī)都是QEMU-KVM 的一個(gè)進(jìn)程,由Hypervisor 中的進(jìn)程調(diào)度模塊統(tǒng)一管理調(diào)度。由于KVM是虛擬模塊與Linux 內(nèi)核的結(jié)合,模擬的硬件設(shè)備在數(shù)據(jù)交換時(shí)路徑操作比較長(zhǎng),以及多次的上下文切換容易造成資源的損耗和高負(fù)載。KVM 體系支持的客戶機(jī)操作系統(tǒng)包括Linux、Windows 等。由于 KVM 需要 CPU 中虛擬化功能的支持,只可在支持虛擬化功能的CPU 上運(yùn)行,即具有VT功能的Intel CPU 和具有AMD-V 功能的AMD CPU。
XEN 是半虛擬化的虛擬機(jī)系統(tǒng),其架構(gòu)由XEN Hypervisor 和虛擬域兩大部分組成。XEN Hypervisor 負(fù)責(zé)將CPU 和RAM 兩大硬件資源虛擬出互相隔離的資源,供虛擬域使用的同時(shí)管理和監(jiān)控虛擬域的資源和系統(tǒng)運(yùn)行情況。每個(gè)虛擬域就是一個(gè)虛擬機(jī)環(huán)境,其中虛擬域又分為特權(quán)虛擬域和非特權(quán)虛擬域,特權(quán)虛擬域優(yōu)先級(jí)更高。XEN 架構(gòu)簡(jiǎn)約,系統(tǒng)運(yùn)行較快,虛擬化實(shí)現(xiàn)的性能更強(qiáng),但是由于沒有Linux 內(nèi)核的支持,系統(tǒng)更新需要重新編譯整個(gè)體系,后期維護(hù)成本較高,涉及內(nèi)核升級(jí)的安全隱患較大。
VMware vSphere 是一個(gè)不開源的虛擬化系統(tǒng),系統(tǒng)配置流程較完善且獨(dú)立封裝。采用SDS 的核心原則,同時(shí)從控制層面和數(shù)據(jù)層面進(jìn)行虛擬化。虛擬存儲(chǔ)VSAN 采用分布式架構(gòu),配合固態(tài)硬盤實(shí)現(xiàn)高性能的讀寫緩存。同時(shí),外接存儲(chǔ)可以使系統(tǒng)獲得更高的性價(jià)比。vSphere 內(nèi)核的內(nèi)部運(yùn)行,使得數(shù)據(jù)I/O 路徑能提供更高級(jí)別的性能。系統(tǒng)集成的vMotion、HA、DRS、FT 等功能模塊可以實(shí)現(xiàn)通過前期的服務(wù)策略配置達(dá)到存儲(chǔ)任務(wù)自動(dòng)化,后期的管理更為便捷。VMware 的虛擬機(jī)支持Windows、LINUX 等系統(tǒng)。
本方案采用X86 服務(wù)器16 臺(tái),其中全閃存配置ESXi 14 臺(tái),SAS 配置ESXi 2 臺(tái)。全閃存配置的主機(jī)中使用四分之一容量提供緩存層,四分之三容量提供數(shù)據(jù)存儲(chǔ)層。SAS 配置的主機(jī)提供管理平臺(tái)的運(yùn)行。平臺(tái)可用容量有限,后期擴(kuò)容可采用混合集群,即緩存層使用已有閃存,容量層擴(kuò)展,把容量較小的SSD 更換為普通的大容量磁盤。使用讀寫分離的緩存算法,配置緩存層中可用緩存的70%用于存儲(chǔ)需要大量讀取的磁盤塊,配置剩余30%緩存層用于執(zhí)行寫入操作。從而最大限度減少對(duì)讀寫速度較慢的磁盤的訪問,提高磁盤使用壽命和整個(gè)平臺(tái)可用性。
底層的ESXI 主機(jī)采用SATA 接口的DOM 電子硬盤,使數(shù)據(jù)層和底層架構(gòu)分離,提高X86 服務(wù)器的有效空間利用率,降低單一容器造成的系統(tǒng)風(fēng)險(xiǎn)。由于SATADOM 屬于Flash 存儲(chǔ)介質(zhì),主要使用NADA Flash 的Floating Gate 存儲(chǔ)電子實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ),電子多次穿過Floating Gate 后,會(huì)導(dǎo)致介質(zhì)存儲(chǔ)電子能力變?nèi)?,甚至?dǎo)致?lián)舸?,因此要考慮系統(tǒng)運(yùn)行的讀寫數(shù)據(jù)量。通常SATADOM 的讀寫壽命在3000 次左右,在平均使用2500 次以上的時(shí)候要提高警惕。我們的平臺(tái)在上線數(shù)月內(nèi),就遇到SATADOM 的擊穿情況,其后分析原因,把系統(tǒng)日志的存儲(chǔ)進(jìn)行了路徑更改,確保了業(yè)務(wù)的可靠性。
虛擬機(jī)數(shù)據(jù)交換采用千兆交換機(jī)4 臺(tái),后臺(tái)的背板數(shù)據(jù)交換采用萬兆交換機(jī)2 臺(tái)。兩兩做堆疊設(shè)置互備。ESXI6.5 本身支持將千兆和萬兆網(wǎng)絡(luò)接口用于混合配置下的Virtual SAN 網(wǎng)絡(luò)流量。單一使用千兆網(wǎng)絡(luò),系統(tǒng)配置要求設(shè)置獨(dú)立網(wǎng)口,專門用于Virtual SAN 流量。如果使用萬兆網(wǎng)絡(luò),則網(wǎng)口可以與其他類型網(wǎng)絡(luò)流量共享??紤]到主機(jī)遷移的速度和通信流量的穩(wěn)定,本方案選擇萬兆交換機(jī)作為背板交換,千兆交換機(jī)作為Virtual SAN 數(shù)據(jù)交換。
關(guān)于I/O 控制器,Virtual SAN 支持每個(gè)ESXi 主機(jī)使用多個(gè)I/O 控制器。使用多控制器和單控制器配置ESXi主機(jī)的區(qū)別在于,多控制器可以實(shí)現(xiàn)更高的運(yùn)行速度,并且在故障發(fā)生時(shí),可以把故障的存儲(chǔ)空間隔離在最小范圍,降低平臺(tái)數(shù)據(jù)損失的風(fēng)險(xiǎn)。使用單控制器時(shí),主機(jī)中的所有設(shè)備都在同一控制器監(jiān)管之下,因此,控制器故障會(huì)影響主機(jī)上的所有存儲(chǔ)單元。在本方案中,結(jié)合系統(tǒng)可操作性和每臺(tái)ESXI 主機(jī)的實(shí)際磁盤數(shù)量,我們選用單控制器。單控制器造成的磁盤數(shù)據(jù)風(fēng)險(xiǎn),將通過完善存儲(chǔ)策略進(jìn)行規(guī)避。
針對(duì)承載重要業(yè)務(wù)系統(tǒng)的虛擬服務(wù)器,配置HA 功能。在創(chuàng)建集群后,配置HA 模塊,ESXI 主機(jī)將根據(jù)系統(tǒng)形成的邏輯隊(duì)列,對(duì)集群中的其他主機(jī)進(jìn)行持續(xù)的心跳檢測(cè)。當(dāng)某臺(tái)ESXI 主機(jī)在連續(xù)三個(gè)五秒的時(shí)間間隔后仍然沒有釋放出心跳信號(hào),該主機(jī)就被判斷為發(fā)生故障或者網(wǎng)絡(luò)的連接出現(xiàn)了問題。在這種情況下,運(yùn)行在該主機(jī)上的虛擬機(jī)就會(huì)被自動(dòng)轉(zhuǎn)移到平臺(tái)中的其他主機(jī)上。同樣,當(dāng)一臺(tái)主機(jī)無法檢測(cè)到來自群集的其他主機(jī)的心跳檢測(cè),那么該主機(jī)便會(huì)啟動(dòng)內(nèi)部自檢的進(jìn)程來判斷自己跟群集中其他主機(jī)的連接是否出現(xiàn)了問題。如果確實(shí)出現(xiàn)了故障,那么系統(tǒng)會(huì)自動(dòng)終止在這臺(tái)主機(jī)上所有正在運(yùn)行的虛擬機(jī),并啟動(dòng)預(yù)先設(shè)定好的備用主機(jī)。對(duì)于VMware HA 的故障轉(zhuǎn)移,虛擬機(jī)客戶端的操作系統(tǒng)會(huì)識(shí)別為硬件故障而進(jìn)行的重啟,因此,這樣的過程不會(huì)改變操作系統(tǒng)的狀態(tài)。
針對(duì)核心業(yè)務(wù)的服務(wù)器,配置FT 功能,F(xiàn)T 是以集群為基礎(chǔ)的容錯(cuò)機(jī)制。FT 具有比HA 更高的連續(xù)性,占用的資源也更多。在創(chuàng)建虛擬機(jī)后,F(xiàn)T 隨即創(chuàng)建兩個(gè)相同的副本,其中主要副本處于運(yùn)行狀態(tài),接受虛擬機(jī)同步信息,并運(yùn)行程序。次要副本捕捉主要副本的所有非決定性的操作。在虛擬主機(jī)的心跳檢測(cè)或者網(wǎng)絡(luò)連接出現(xiàn)異常時(shí),主副本立即激活,無中斷接管異常虛擬機(jī)中斷的操作,所有關(guān)于虛擬機(jī)的狀態(tài)信息都將被保留。其中,主副本和次副本不允許在同一主機(jī)運(yùn)行。從而避免單一故障。
關(guān)于物理服務(wù)器的遷移,在面對(duì)不同安全等級(jí)的業(yè)務(wù)時(shí)使用不同的遷移方式。Vconverter 支持熱克隆和冷克隆兩種模式。核心業(yè)務(wù)系統(tǒng)或不可中斷的業(yè)務(wù)采用熱克隆,在不關(guān)閉源系統(tǒng)的情況下進(jìn)行操作。由于轉(zhuǎn)換過程中源服務(wù)器繼續(xù)運(yùn)行,生成的克隆體并不是源服務(wù)器的精確克隆,為避免克隆體重要數(shù)據(jù)的遺失,可在Vconverter 中設(shè)置關(guān)閉源服務(wù)器部分系統(tǒng)服務(wù),克隆結(jié)束后需要進(jìn)行執(zhí)行同步,且在同步過程中保證不會(huì)對(duì)源服務(wù)器進(jìn)行重要更改。轉(zhuǎn)換過程結(jié)束后,虛擬服務(wù)器接管源服務(wù)器。重要業(yè)務(wù)和數(shù)據(jù)量較大的服務(wù)器采用冷克隆模式,在關(guān)機(jī)狀態(tài)下進(jìn)行克隆,生成與源服務(wù)器一致的克隆體,系統(tǒng)開機(jī)上線需注意IP 地址的沖突導(dǎo)致服務(wù)錯(cuò)誤。
基于中國(guó)—東盟多語種全媒體融合平臺(tái)的應(yīng)用已經(jīng)部分上線,其中重要的系統(tǒng)包括全媒體采訪系統(tǒng)、全媒體廣播和新媒體導(dǎo)播系統(tǒng)。
全媒體采訪系統(tǒng)是基于虛擬云平臺(tái)的全媒體采編播平臺(tái),實(shí)現(xiàn)移動(dòng)采稿、編輯和審核,通過手機(jī)移動(dòng)端,及時(shí)將國(guó)內(nèi)外的新聞稿件、圖片、視頻上傳到本平臺(tái),審核通過后即形成成品稿件,一鍵同步分享至各個(gè)新聞平臺(tái)。該系統(tǒng)切實(shí)促進(jìn)了新聞時(shí)效,增強(qiáng)了媒體影響力。全媒體廣播是一套基于廣播深度定制的可視化系統(tǒng),將視頻直播與廣播特點(diǎn)深度融合,支持APP 直播和網(wǎng)頁直播,可同時(shí)支持最多12 個(gè)不同機(jī)位在線直播,支持接入攝像頭、手機(jī)、DV等輕量化拍攝設(shè)備。在廣播直播間畫面直播的同時(shí),隨時(shí)接入多路外場(chǎng)視頻,并可靈活切換畫面與在線聽眾互動(dòng)。系統(tǒng)直播流同時(shí)推送至各個(gè)直播平臺(tái)。新媒體導(dǎo)播系統(tǒng)是全媒體采編播系統(tǒng)里的播出終端,具有強(qiáng)大的數(shù)據(jù)采集和多元化的網(wǎng)絡(luò)交互應(yīng)用,實(shí)現(xiàn)了云資源中播出素材共享和協(xié)同,大大提高了廣播節(jié)目的時(shí)效性及聽眾的參與度。
中國(guó)—東盟云平臺(tái)尚處在逐步完善的階段,已經(jīng)對(duì)傳統(tǒng)廣播的媒體融合之路產(chǎn)生了極大的推動(dòng)和促進(jìn)作用。外采記者、導(dǎo)播等特殊崗位的工作效率得到了很大提升,微信等平臺(tái)的在線互動(dòng)量呈現(xiàn)出井噴式的增長(zhǎng)。