王春苗 劉玥
摘要:本文以Citrix PVS產(chǎn)品應(yīng)用為實(shí)例,結(jié)合H3C lRF網(wǎng)絡(luò)虛擬化技術(shù)、雙活域架構(gòu)技術(shù)、雙活DNS和DHCP服務(wù)技術(shù)、數(shù)據(jù)庫(kù)鏡像技術(shù)、分布式存儲(chǔ)技術(shù)、萬(wàn)兆網(wǎng)絡(luò)技術(shù)等,詳細(xì)講述高校數(shù)據(jù)中心在為云桌面虛擬機(jī)、各個(gè)實(shí)訓(xùn)室PC機(jī)提供操作系統(tǒng)流服務(wù)的層面上,如何低成本高效率的實(shí)現(xiàn)客戶機(jī)操作系統(tǒng)在線自動(dòng)故障遷移功能,以及網(wǎng)絡(luò)、存儲(chǔ)和服務(wù)的負(fù)載平衡功能,從而實(shí)現(xiàn)最大化的“雙活架構(gòu)”設(shè)計(jì)標(biāo)準(zhǔn),最終為云桌面、實(shí)訓(xùn)室PC機(jī)等提供穩(wěn)定、高速、可靠透明的操作系統(tǒng)和應(yīng)用軟件流服務(wù),提升教學(xué)質(zhì)量和實(shí)訓(xùn)體驗(yàn)。
關(guān)鍵詞:雙活;Active-Active;數(shù)據(jù)流服務(wù);故障遷移;負(fù)載均衡;網(wǎng)絡(luò)虛擬化
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)22-0028-05
開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼( OSID):
高校計(jì)算機(jī)機(jī)房的管理,從操作系統(tǒng)及軟件部署的技術(shù)角度分析,可分為兩種模式,即“本地存儲(chǔ)模式”和“網(wǎng)絡(luò)發(fā)布模式”。前者,操作系統(tǒng)及軟件存儲(chǔ)于客戶機(jī)本地硬盤(pán)之上,啟動(dòng)時(shí)加載到內(nèi)存中。而后者是客戶機(jī)直接通過(guò)網(wǎng)絡(luò)引導(dǎo)的形式,讀取服務(wù)器中的虛擬磁盤(pán)文件,實(shí)現(xiàn)加載操作系統(tǒng)及軟件到內(nèi)存中。對(duì)于操作系統(tǒng)的“網(wǎng)絡(luò)發(fā)布模式”,傳統(tǒng)的、通俗的命名一般稱作為“無(wú)盤(pán)網(wǎng)絡(luò)”,而隨著網(wǎng)絡(luò)、虛擬化及云計(jì)算技術(shù)的發(fā)展,傳統(tǒng)的“無(wú)盤(pán)網(wǎng)絡(luò)”概念已經(jīng)無(wú)法囊括“網(wǎng)絡(luò)發(fā)布模式”的全部技術(shù)內(nèi)涵,本文根據(jù)其應(yīng)用范圍和技術(shù)特征,賦予該模式一個(gè)全新的命名即“操作系統(tǒng)流服務(wù)”。操作系統(tǒng)和軟件的分發(fā),能夠以數(shù)據(jù)流的形式,從服務(wù)端存儲(chǔ)到達(dá)任何網(wǎng)絡(luò)可達(dá)的目標(biāo),而不論該目標(biāo)是物理PC機(jī)或云桌面虛擬機(jī)。
在Citrix的產(chǎn)品家族中,其云桌面產(chǎn)品“XenDesktop”的核心組件“PVS”(Provisioning Services),不但支持為云桌面虛擬機(jī)、物理PC機(jī)提供操作系統(tǒng)及軟件的數(shù)據(jù)流服務(wù),還能夠結(jié)合鏡像技術(shù)同步數(shù)據(jù)庫(kù)實(shí)現(xiàn)故障遷移功能。本文以Citrix PVS作為操作系統(tǒng)流服務(wù)的應(yīng)用實(shí)例,結(jié)合多項(xiàng)自動(dòng)故障遷移和負(fù)載均衡技術(shù),深入分析和研究基于Citrix PVS的雙活系統(tǒng)架構(gòu)方案以及部署實(shí)現(xiàn)。
1 網(wǎng)絡(luò)模型:基于橫向虛擬化的雙活網(wǎng)絡(luò)設(shè)計(jì)與實(shí)現(xiàn)
1)功能需求分析:作為“操作系統(tǒng)流服務(wù)”的網(wǎng)絡(luò)承載,設(shè)計(jì)一個(gè)滿足“負(fù)載均衡”和“故障遷移”功能的交換網(wǎng)絡(luò)至關(guān)重要。以高校實(shí)訓(xùn)樓為例,其基本的交換網(wǎng)絡(luò)規(guī)劃需求分析:每一個(gè)實(shí)訓(xùn)室內(nèi)需要接人幾十臺(tái)物理PC機(jī)構(gòu)建局域網(wǎng),同時(shí)每個(gè)實(shí)訓(xùn)室需要連接到數(shù)據(jù)中心交換網(wǎng)絡(luò);實(shí)訓(xùn)室PC機(jī)、云桌面虛擬機(jī)要求能夠通過(guò)網(wǎng)絡(luò)引導(dǎo)和加載服務(wù)器上的虛擬磁盤(pán)文件;當(dāng)匯聚交換機(jī)、核心交換機(jī)發(fā)生故障、斷電以及常規(guī)維護(hù)時(shí),對(duì)于客戶端用戶應(yīng)該是透明無(wú)感知的;由于機(jī)房教學(xué)和管理的需要,實(shí)訓(xùn)室內(nèi)部應(yīng)該屬于同一個(gè)VLAN和配置一致的網(wǎng)關(guān)參數(shù)等。
2)傳統(tǒng)網(wǎng)絡(luò)規(guī)劃及缺陷:針對(duì)上述需求,傳統(tǒng)的規(guī)劃設(shè)計(jì)可能是實(shí)訓(xùn)機(jī)房?jī)?nèi)部部署多個(gè)接人交換機(jī)和一個(gè)匯聚交換機(jī),數(shù)據(jù)中心部署一個(gè)核心交換機(jī),各個(gè)交換機(jī)之間通過(guò)單鏈路連接。很顯然,傳統(tǒng)規(guī)劃設(shè)計(jì)存在多個(gè)“單點(diǎn)故障”風(fēng)險(xiǎn),當(dāng)發(fā)生線路故障、交換機(jī)負(fù)載過(guò)大、交換機(jī)硬件故障或電源故障時(shí),會(huì)導(dǎo)致一個(gè)實(shí)訓(xùn)室或多個(gè)實(shí)訓(xùn)室PC機(jī)無(wú)法通過(guò)網(wǎng)絡(luò)加載操作系統(tǒng),以及在線的PC機(jī)發(fā)生宕機(jī)的現(xiàn)象。
3)-種簡(jiǎn)要的改進(jìn)設(shè)計(jì)及缺陷分析:如圖1所示,采用兩臺(tái)核心交換機(jī)、兩臺(tái)獨(dú)立的PVS服務(wù)器、冗余鏈路以及UPS電源。在該方案中,PC-1通過(guò)網(wǎng)絡(luò)引導(dǎo),首先發(fā)送DHCP廣播請(qǐng)求報(bào)文,經(jīng)過(guò)匯聚交換機(jī)-1的廣播轉(zhuǎn)發(fā),再經(jīng)過(guò)核心_1和核心一2的DHCP中繼轉(zhuǎn)發(fā),PVS服務(wù)器1和2都將接收到請(qǐng)求報(bào)文并發(fā)出響應(yīng)報(bào)文,PC-1接收并選擇最先到達(dá)的響應(yīng)報(bào)文,使用其分配的IP地址、掩碼、網(wǎng)關(guān)以及啟動(dòng)服務(wù)器地址等網(wǎng)絡(luò)參數(shù),后續(xù)PC-1向啟動(dòng)服務(wù)器發(fā)送PXE和TFTP服務(wù)請(qǐng)求……直至完成系統(tǒng)加載過(guò)程。該方案具備一定的負(fù)載均衡和故障遷移特性。當(dāng)兩臺(tái)PVS服務(wù)器、兩臺(tái)核心交換機(jī)功能及性能相近的前提下,每個(gè)實(shí)訓(xùn)室PC機(jī)的網(wǎng)絡(luò)引導(dǎo)訪問(wèn)請(qǐng)求和會(huì)話連接近似平均分布于兩臺(tái)PVS服務(wù)器之上;當(dāng)存在一臺(tái)PVS服務(wù)器關(guān)閉或故障時(shí),或存在一臺(tái)核心交換機(jī)關(guān)閉或故障時(shí),PC機(jī)都可以通過(guò)另外一臺(tái)PVS服務(wù)器實(shí)現(xiàn)引導(dǎo)和加載操作系統(tǒng)。
但是,仔細(xì)分析上述方案,可以發(fā)現(xiàn)其仍然存在一定的單點(diǎn)故障和缺陷:①當(dāng)同時(shí)出現(xiàn)核心HH1和PVS服務(wù)器2故障或關(guān)閉的情況,所有實(shí)訓(xùn)室的客戶機(jī)無(wú)法實(shí)現(xiàn)網(wǎng)絡(luò)引導(dǎo);②由于核心_1和核心一2相互獨(dú)立,對(duì)于每個(gè)實(shí)訓(xùn)室來(lái)說(shuō),存在兩個(gè)可選的網(wǎng)關(guān),分別指向核心-1和核心一2,那么當(dāng)核心- 1或核心一2故障或關(guān)閉時(shí),將導(dǎo)致所有網(wǎng)關(guān)指向它們的、已經(jīng)在線的客戶機(jī)宕機(jī),并導(dǎo)致數(shù)據(jù)丟失;③由于兩臺(tái)PVS服務(wù)器完全獨(dú)立,未配置“雙活”系統(tǒng)流服務(wù),當(dāng)某一臺(tái)PVS服務(wù)器故障或關(guān)閉時(shí),同樣將導(dǎo)致所有連接到該P(yáng)VS服務(wù)器的客戶機(jī)宕機(jī)和數(shù)據(jù)丟失;④匯聚交換機(jī)關(guān)閉或故障時(shí),整個(gè)實(shí)訓(xùn)室所有客戶機(jī)宕機(jī)或無(wú)法引導(dǎo)啟動(dòng)。上述的改進(jìn)方案中,無(wú)論是核心交換機(jī)或PVS服務(wù)器,都僅僅實(shí)現(xiàn)了一個(gè)簡(jiǎn)單的“后備式”故障遷移及負(fù)載均衡特性,當(dāng)發(fā)生故障時(shí),在線客戶機(jī)需要被動(dòng)等待連接恢復(fù)甚至必須重啟,導(dǎo)致數(shù)據(jù)丟失和工作中斷。那么,如何設(shè)計(jì)和實(shí)現(xiàn)一個(gè)“在線式雙活”網(wǎng)絡(luò)架構(gòu)呢?接下來(lái)重點(diǎn)分析基于“橫向虛擬化技術(shù)”的網(wǎng)絡(luò)規(guī)劃設(shè)計(jì)。
4)基于橫向虛擬化的網(wǎng)絡(luò)設(shè)計(jì)和分析:虛擬化的概念,可以簡(jiǎn)單理解為物理設(shè)備視圖到虛擬設(shè)備視圖的透明轉(zhuǎn)換。如今的虛擬化概念范疇,已經(jīng)囊括了服務(wù)器虛擬化、桌面虛擬化、存儲(chǔ)虛擬化、網(wǎng)絡(luò)虛擬化等技術(shù)。作為虛擬化技術(shù)的重要組成部分,網(wǎng)絡(luò)虛擬化技術(shù)在主流網(wǎng)絡(luò)設(shè)備上都已得到實(shí)現(xiàn),例如H3C的IRF2和IRF3技術(shù)(橫向和縱向虛擬化)、華為的css和SVF技術(shù)(橫向和縱向虛擬化)以及銳捷的vsu技術(shù)(橫向虛擬化)等。本文以H3C設(shè)備為例,分析和研究通過(guò)IRF2技術(shù)構(gòu)建“在線式雙活”網(wǎng)絡(luò)架構(gòu),如圖2和圖3的拓?fù)浣Y(jié)構(gòu)所示:核心-1和核心一2兩臺(tái)物理交換機(jī)通過(guò)IRF雙鏈路互連并配置IRF功能后,構(gòu)成一個(gè)大的虛擬核心交換機(jī),可以理解為具備“雙主控引擎”“雙業(yè)務(wù)板卡”以及統(tǒng)一的運(yùn)行配置,原核心-1和核心一2的物理接口都屬于該虛擬核心交換機(jī),且相互之間可以進(jìn)行接口聚合。每個(gè)實(shí)訓(xùn)室的匯聚交換機(jī)(圖2)、云桌面承載服務(wù)器(圖3)以及PVS服務(wù)器都通過(guò)聚合鏈路連接到該虛擬核心交換機(jī)的不同業(yè)務(wù)板卡接口上,對(duì)于同一個(gè)實(shí)訓(xùn)室的物理PC機(jī)(或同一個(gè)vlan的云桌面虛擬機(jī)),它們的網(wǎng)關(guān)相同,都指向該虛擬核心交換機(jī)(而在圖1方案中,分別指向核心-1和核心_ -)。
負(fù)載均衡和故障遷移分析:①當(dāng)所有設(shè)備狀態(tài)正常、且配置了雙活操作系統(tǒng)流服務(wù)的前提下,PC機(jī)(或虛擬機(jī))的會(huì)話連接將平均分布于兩臺(tái)PVS服務(wù)器之上(具體見(jiàn)后續(xù)分析);②當(dāng)核心-1或核心一-關(guān)閉或故障時(shí),虛擬核心交換機(jī)繼續(xù)工作,僅僅是所有的聚合鏈路組中的一條成員鏈路出現(xiàn)故障,性能下降,但網(wǎng)關(guān)不變,PC機(jī)(或虛擬機(jī))和虛擬核心交換機(jī)以及PVS服務(wù)器之間的會(huì)話連接繼續(xù)保持,如果所有鏈路采用萬(wàn)兆,那么性能下降帶來(lái)的影響可以忽略不計(jì),故障的發(fā)生對(duì)于PC機(jī)(或虛擬機(jī))來(lái)說(shuō)可以認(rèn)為是透明的;③如果是某一臺(tái)PVS服務(wù)器發(fā)生故障或宕機(jī),在兩臺(tái)PVS服務(wù)器配置了雙活操作系統(tǒng)流服務(wù)的前提下,PC機(jī)(或虛擬機(jī))會(huì)話超時(shí)后,會(huì)根據(jù)引導(dǎo)時(shí)所下載保存的啟動(dòng)服務(wù)器地址列表,自動(dòng)連接到其他PVS服務(wù)器,并重新建立會(huì)話,具體過(guò)程見(jiàn)后續(xù)分析;④如果匯聚交換機(jī)發(fā)生故障或宕機(jī),將仍然會(huì)導(dǎo)致當(dāng)前實(shí)訓(xùn)室的PC機(jī)宕機(jī)或等待恢復(fù)連接,進(jìn)一步縮小故障域的方法,是采用雙匯聚交換機(jī),并配置IRF橫向虛擬化功能,再通過(guò)聚合鏈路連接至多個(gè)接人交換機(jī)。網(wǎng)絡(luò)配置任務(wù)(具體過(guò)程略):①I(mǎi)RF橫向虛擬化配置,推薦通過(guò)萬(wàn)兆以太網(wǎng)接口互連核心一1和核心一-,并分別在兩臺(tái)物理核心交換機(jī)上完成IRF配置;②聚合鏈路配置,分別在匯聚交換機(jī)和虛擬核心交換機(jī)上配置相應(yīng)的聚合鏈路。對(duì)于云桌面,則需要對(duì)虛擬機(jī)的承載服務(wù)器的多個(gè)網(wǎng)卡接口進(jìn)行綁定;③VLAN配置,在虛擬核心交換機(jī)上為每臺(tái)PVS服務(wù)器和每個(gè)實(shí)訓(xùn)室創(chuàng)建不同的VLAN,聚合鏈路組加入相應(yīng)VLAN,并為VLAN虛擬接口配置ip地址,作為各個(gè)實(shí)訓(xùn)室和PVS服務(wù)器的網(wǎng)關(guān)。對(duì)于云桌面,還需要配置相應(yīng)聚合鏈路組的屬性為trunk,且允許相應(yīng)的VIAN-ID通過(guò),因?yàn)橥粋€(gè)VLAN的云桌面虛擬機(jī),一般會(huì)均勻分布于多臺(tái)承載服務(wù)器之上;④DHCPRelay配置,在各個(gè)VLAN虛擬接口視圖下,配置DHCP RelaY,目標(biāo)為兩臺(tái)PVS服務(wù)器的地址;⑤PVS雙活操作系統(tǒng)流服務(wù)配置,見(jiàn)本文后續(xù)分析。網(wǎng)絡(luò)性能設(shè)計(jì):以上都是從網(wǎng)絡(luò)功能的角度,分析雙活網(wǎng)絡(luò)的設(shè)計(jì)和規(guī)劃。從網(wǎng)絡(luò)性能的角度來(lái)看,客戶端從初始加載操作系統(tǒng)鏡像的核心部分至穩(wěn)定運(yùn)行狀態(tài)(如登錄用戶桌面后),以及后續(xù)加載和運(yùn)行應(yīng)用軟件,整個(gè)過(guò)程對(duì)帶寬的要求較高。①客戶端(物理PC機(jī)和虛擬機(jī))網(wǎng)絡(luò)要求為千兆速率;②接人、匯聚和核心交換機(jī)至少要求滿足全千兆接口速率;③核心交換機(jī)推薦配備一定數(shù)量的萬(wàn)兆接口;④PVS服務(wù)器一般安裝4口千兆網(wǎng)卡,推薦安裝雙口萬(wàn)兆網(wǎng)卡;⑤接人和匯聚交換機(jī)之間、匯聚和虛擬核心交換機(jī)之間通過(guò)雙接口或多接口聚合鏈路互連;⑥虛擬核心交換機(jī)和PVS服務(wù)器之間推薦通過(guò)雙口萬(wàn)兆聚合鏈路互連。
2 存儲(chǔ)模型:對(duì)比簡(jiǎn)易分布式存儲(chǔ)與雙活NFS存儲(chǔ)
讀寫(xiě)功能需求分析和存儲(chǔ)模型設(shè)計(jì):一方面,客戶端通過(guò)網(wǎng)絡(luò)引導(dǎo)所加載的操作系統(tǒng),是以虛擬磁盤(pán)鏡像文件的形式保存于服務(wù)端存儲(chǔ),而服務(wù)端存儲(chǔ)位置既可以是PVS服務(wù)器的本地存儲(chǔ),也可以是獨(dú)立部署的基于“文件級(jí)共享”的NFS存儲(chǔ)或基于“塊級(jí)共享”的iSCSI存儲(chǔ)。客戶端加載操作系統(tǒng)的過(guò)程,就是從服務(wù)端存儲(chǔ)位置讀取鏡像文件的過(guò)程;另一方面,客戶端加載完成后,進(jìn)入一個(gè)穩(wěn)定運(yùn)行的階段,此時(shí)需要一個(gè)固定的存儲(chǔ)位置保存客戶端緩存數(shù)據(jù),該存儲(chǔ)位置既可以是服務(wù)端存儲(chǔ),也可以是客戶端本地存儲(chǔ),這是一個(gè)數(shù)據(jù)反復(fù)讀寫(xiě)的過(guò)程。Citrix PVS產(chǎn)品,推薦采用“讀寫(xiě)分離”的方案,即操作系統(tǒng)鏡像文件和客戶端緩存數(shù)據(jù)分別存儲(chǔ)在不同的位置。為了確保實(shí)現(xiàn)故障遷移功能,PVS雙活系統(tǒng)架構(gòu)存儲(chǔ)設(shè)計(jì),一般可采用兩種模型:即“簡(jiǎn)易分布式”存儲(chǔ)模型和“獨(dú)立雙活NFS”存儲(chǔ)模型。兩種存儲(chǔ)模型都能滿足在功能上確保實(shí)現(xiàn)故障遷移,在性能上確保高速1/0,一般可根據(jù)實(shí)際情況(成本、管理復(fù)雜性等)選擇合適的一種或兩種方式混合使用。
1)簡(jiǎn)易分布式存儲(chǔ)模型
該模型中,操作系統(tǒng)鏡像文件存儲(chǔ)于兩臺(tái)或更多PVS服務(wù)器的本地存儲(chǔ)介質(zhì)中(RAID陣列或PCIE SSD),即存在兩個(gè)甚至多個(gè)版本一致的鏡像文件副本。為了實(shí)現(xiàn)在線透明的故障遷移,所有PVS服務(wù)器上的鏡像文件內(nèi)容和絕對(duì)存儲(chǔ)路徑確保完全一致。
客戶端緩存位置的選擇至關(guān)重要,緩存位置既有頻繁的“讀操作”,又有頻繁的“寫(xiě)操作”。當(dāng)客戶端是物理PC機(jī),且安裝了固態(tài)硬盤(pán)和大容量?jī)?nèi)存時(shí),本地讀寫(xiě)性能高,那么緩存位置一般設(shè)置為本地內(nèi)存+固態(tài)硬盤(pán)。在PVS控制臺(tái)中,通過(guò)設(shè)置虛擬磁盤(pán)的緩存類型為“在設(shè)備RAM中緩存并溢出到硬盤(pán)”即可實(shí)現(xiàn)。如果物理PC機(jī)的本地內(nèi)存較小,或本地硬盤(pán)為老舊的、可能包含壞道的機(jī)械硬盤(pán),甚至物理PC機(jī)沒(méi)有安裝本地硬盤(pán),那么應(yīng)該設(shè)置緩存位置為PVS服務(wù)器的本地存儲(chǔ),此時(shí)對(duì)PVS服務(wù)器的存儲(chǔ)性能和整個(gè)網(wǎng)絡(luò)性能要求較高,且必須確?!白x寫(xiě)分離”的原則;當(dāng)客戶端是云桌面虛擬機(jī)時(shí),同樣要綜合考慮虛擬機(jī)的內(nèi)存大小和讀寫(xiě)性能,一般情況下,云桌面虛擬機(jī)的存儲(chǔ)承載都是高性能共享存儲(chǔ)或類似于vmware vSAN的虛擬化存儲(chǔ),性能較高,所以對(duì)于云桌面虛擬機(jī),推薦設(shè)置緩存位置為客戶端本地。
當(dāng)緩存位置設(shè)置在PVS服務(wù)端時(shí),會(huì)極大地增加網(wǎng)絡(luò)帶寬負(fù)載和PVS服務(wù)器本地存儲(chǔ)的讀寫(xiě)壓力,所以設(shè)置緩存到客戶端本地,是最佳的部署方案,這也是“簡(jiǎn)易分布式”存儲(chǔ)模型的最大優(yōu)點(diǎn)。
該存儲(chǔ)模型部署和維護(hù)簡(jiǎn)單,潛在的缺陷是存儲(chǔ)介質(zhì)的穩(wěn)定性,當(dāng)某一臺(tái)PVS服務(wù)器的存儲(chǔ)設(shè)備出現(xiàn)物理壞道、離線等故障時(shí),由于此時(shí)PVS服務(wù)器的流服務(wù)保持正常,所以客戶端并不會(huì)主動(dòng)進(jìn)行故障遷移,可能會(huì)導(dǎo)致連接至該P(yáng)VS服務(wù)器上的所有客戶端出現(xiàn)不穩(wěn)定狀態(tài),如“嚴(yán)重卡頓”現(xiàn)象。解決此問(wèn)題,推薦在PVS服務(wù)器上通過(guò)RAIDIO級(jí)別的陣列形式組織多個(gè)硬盤(pán)(機(jī)械或SSD固態(tài)硬盤(pán)),這樣就同時(shí)確保了數(shù)據(jù)安全和1/0性能;另外一個(gè)推薦的存儲(chǔ)介質(zhì),是采用兩塊PCIE SSD,分別用作讀取設(shè)備和寫(xiě)入設(shè)備。PCIE SSD具備高可靠性、高耐用等級(jí)、高性能等特性,關(guān)鍵是徹底解決了SATA接口的SSD,其trim指令不受大部分陣列卡支持的弊端,從而大幅度提升了SSD的寫(xiě)人性能和使用壽命。另外一個(gè)可能的缺點(diǎn),是系統(tǒng)鏡像文件多個(gè)副本之間的同步,需要通過(guò)手動(dòng)拷貝新增的虛擬磁盤(pán)版本文件來(lái)完成,效率較低。
6 電源系統(tǒng)模型:UPS電源群集設(shè)計(jì)與實(shí)現(xiàn)
中高端的UPS電源系統(tǒng),普遍都支持“并機(jī)模式”,即兩臺(tái)UPS電源系統(tǒng)通過(guò)并機(jī)模塊,共同為服務(wù)器、交換機(jī)、存儲(chǔ)等設(shè)備提供電力。對(duì)于服務(wù)器、交換機(jī)、存儲(chǔ)等重要設(shè)備,也可以通過(guò)配備雙電源模塊,實(shí)現(xiàn)電源的故障轉(zhuǎn)移功能。如果存在多臺(tái)普通的小型UPS電源系統(tǒng)的情況,它們的品牌、型號(hào)、功率都可能不一致,那么并機(jī)是難以實(shí)現(xiàn)的,如何才能充分高效地利用它們呢?最佳的解決方案是通過(guò)多臺(tái)“雙電源轉(zhuǎn)換開(kāi)關(guān)”構(gòu)建UPS電源群集,此類設(shè)備具備雙路電源輸入接口和多路負(fù)載輸出接口,可以同時(shí)連接兩臺(tái)UPS電源,但是其中有一路電源輸入處于“阻斷”狀態(tài),一旦正在供電的UPS電源故障或電池耗盡時(shí),轉(zhuǎn)換開(kāi)關(guān)立即切換到另一路電源輸入,從而確保持續(xù)和穩(wěn)定的功率輸出。另外,兩臺(tái)轉(zhuǎn)換開(kāi)關(guān)的輸出,可以作為第三臺(tái)轉(zhuǎn)換開(kāi)關(guān)的輸入,以此類推,這樣就可以將多臺(tái)不同品牌型號(hào)的UPS電源組成一個(gè)群集電源系統(tǒng),共同為外部負(fù)載提供電力服務(wù)。
7 綜合設(shè)計(jì)部署和分析
綜上所述,整個(gè)PVS系統(tǒng)架構(gòu)達(dá)到“雙活”設(shè)計(jì)標(biāo)準(zhǔn)的前提是群集中各個(gè)組件模塊都達(dá)到“雙活”工作狀態(tài),且任意雙活組件模塊內(nèi)部的“單點(diǎn)故障”對(duì)于依賴于它的其他雙活組件模塊應(yīng)該是透明的,對(duì)于整個(gè)PVS雙活系統(tǒng)架構(gòu)的外部服務(wù)功能也應(yīng)該是透明的。所以,生產(chǎn)環(huán)境的實(shí)際部署過(guò)程,應(yīng)當(dāng)嚴(yán)格遵循相應(yīng)的標(biāo)準(zhǔn),具體分析如下:
1)從時(shí)間維度分析,部署流程首先是從各個(gè)組件模塊開(kāi)始,有些組件與組件之間會(huì)存在一定的依賴關(guān)系(如鏡像數(shù)據(jù)庫(kù)架構(gòu)依賴于域架構(gòu)),所以在部署過(guò)程中,需要遵循相應(yīng)的順序,總體部署原則是“由內(nèi)而外、自底向上、層層遞進(jìn)”,主要的部署流程是“雙活網(wǎng)絡(luò)架構(gòu)一雙活域架構(gòu)一雙活DHCP模型一鏡像數(shù)據(jù)庫(kù)服務(wù)器架構(gòu)一分布式陣列存儲(chǔ)或雙活NFS存儲(chǔ)架構(gòu)一雙活PVS流服務(wù)架構(gòu) 配置鏡像數(shù)據(jù)庫(kù)一模板系統(tǒng)制作和生成虛擬磁盤(pán)映像文件一驗(yàn)證測(cè)試”。
2)從空間維度分析,每一個(gè)雙活組件模塊既可以部署于獨(dú)立的物理服務(wù)器之上,也可以和其他雙活組件模塊共存于相同的物理服務(wù)器之上,分別稱作分布式部署和集中式部署。兩種部署方式各有特點(diǎn),取決于實(shí)際的應(yīng)用場(chǎng)景和部署成本。以分布式部署為例,典型的部署方案是雙活域架構(gòu)、雙活DHCP共同占用兩臺(tái)物理或虛擬服務(wù)器;雙活PVS流服務(wù)架構(gòu)和分布式存儲(chǔ)共同占用兩臺(tái)物理或虛擬服務(wù)器;而數(shù)據(jù)庫(kù)鏡像架構(gòu)則占用三臺(tái)物理或虛擬服務(wù)器,其中見(jiàn)證數(shù)據(jù)庫(kù)服務(wù)和許可證服務(wù)部署于同一臺(tái)服務(wù)器上。分布式部署方式雖然細(xì)化了管理,但是增加了管理的復(fù)雜性和部署成本。本文推薦采用集中式部署方式,即所有的雙活組件模塊共同部署于兩臺(tái)物理服務(wù)器之上,而見(jiàn)證數(shù)據(jù)庫(kù)服務(wù)和許可證服務(wù)共同部署于一臺(tái)虛擬服務(wù)器之上。由于見(jiàn)證數(shù)據(jù)庫(kù)服務(wù)或許可證服務(wù),即使發(fā)生了單點(diǎn)故障,短期內(nèi)不會(huì)影響當(dāng)前的PVS整體雙活系統(tǒng)架構(gòu),所以可以通過(guò)其他方式如虛擬服務(wù)器+離線備份+虛擬機(jī)快照等技術(shù),確保應(yīng)用的快速恢復(fù)。
8 綜合拓?fù)浜凸收限D(zhuǎn)移分析
1)匯聚交換機(jī)故障或接人交換機(jī)故障。很顯然,這種情況僅僅影響某一個(gè)實(shí)訓(xùn)室或?qū)嵱?xùn)室的部分機(jī)器設(shè)備,導(dǎo)致PC機(jī)無(wú)法引導(dǎo)操作系統(tǒng)或宕機(jī)。
2)一臺(tái)核心交換機(jī)故障。此時(shí),所有的聚合鏈路組都有一根鏈路斷開(kāi),基于橫向網(wǎng)絡(luò)虛擬化技術(shù)的核心網(wǎng)絡(luò)仍然有一臺(tái)核心交換機(jī)在線,整個(gè)PVS系統(tǒng)架構(gòu)依然可以繼續(xù)工作,但是整體性能下降。
3)一臺(tái)物理服務(wù)器故障。連接這臺(tái)服務(wù)器的客戶端設(shè)備在超時(shí)后,會(huì)根據(jù)引導(dǎo)列表,自動(dòng)查找和嘗試訪問(wèn)另外一臺(tái)PVS服務(wù)器的流服務(wù);如果原先故障服務(wù)器上的數(shù)據(jù)庫(kù)為主體數(shù)據(jù)庫(kù),見(jiàn)證服務(wù)器自動(dòng)輔助進(jìn)行數(shù)據(jù)庫(kù)故障轉(zhuǎn)移,另外一臺(tái)物理服務(wù)器上的鏡像數(shù)據(jù)庫(kù)轉(zhuǎn)換為主體數(shù)據(jù)庫(kù);雙活域架構(gòu)中的另外一臺(tái)DNS服務(wù)器,域控制器,依然可以提供域名查詢服務(wù)/活動(dòng)目錄查詢服務(wù);雙活DHCP架構(gòu)中,另外一臺(tái)DHCP服務(wù)器,由于實(shí)時(shí)同步的原因,它存儲(chǔ)了一致的IP地址租用信息,且繼續(xù)提供DHCP服務(wù)。但是,在線的客戶端切換PVS流服務(wù)的時(shí)候,可能會(huì)有短暫的卡頓現(xiàn)象,另外,由于只有一臺(tái)PVS服務(wù)器提供流服務(wù),所以整體性能會(huì)下降。
4)第三方虛擬服務(wù)器故障。此時(shí),見(jiàn)證服務(wù)和許可證服務(wù)都將失效。見(jiàn)證服務(wù)的作用是輔助數(shù)據(jù)庫(kù)鏡像架構(gòu)的數(shù)據(jù)同步和故障轉(zhuǎn)移,失效后,主體數(shù)據(jù)庫(kù)和鏡像數(shù)據(jù)庫(kù)之間的數(shù)據(jù)同步暫停,數(shù)據(jù)庫(kù)故障轉(zhuǎn)移失效,但主體數(shù)據(jù)庫(kù)仍然可以繼續(xù)提供服務(wù)。許可證服務(wù)失效后,在線客戶端和剛剛啟動(dòng)的客戶端,都會(huì)收到關(guān)于缺少許可證服務(wù)器的通知,但不影響客戶端運(yùn)行。如果能夠在短時(shí)間內(nèi)(如24小時(shí)內(nèi))解決故障,那么整個(gè)PVS系統(tǒng)架構(gòu)將恢復(fù)到雙活模式。
參考文獻(xiàn):
[1]李芬,數(shù)據(jù)中心網(wǎng)絡(luò)虛擬化技術(shù)應(yīng)用探析[J].中國(guó)新通信,2019(15):85-86.
[2]趙偉.基于銳捷vsu技術(shù)的交換機(jī)虛擬化技術(shù)的研究[J].信息與電腦(理論版),2014(11):185-186.
[3]韓武光.基于IRF虛擬化技術(shù)的校園網(wǎng)可靠性設(shè)計(jì)與實(shí)現(xiàn)[J].網(wǎng)絡(luò)空間安全,2016(8):71-74.
[4]徐華宇,軟件定義存儲(chǔ)的應(yīng)用與分析[J].電腦知識(shí)與技術(shù),2017(28):26-27.
[5]徐建軍,韋娟,雙活存儲(chǔ)技術(shù)在智慧校園建設(shè)中的實(shí)踐及應(yīng)用[J].中國(guó)教育信息化,2018(13):76-78.
[6]侍天航,基于存儲(chǔ)虛擬化技術(shù)的雙活存儲(chǔ)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)探討.網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2019(6):83-84.
[7]張冬.大話存儲(chǔ)終極版[M].清華大學(xué)出版社,2015:56-76.
[8]朱正月.混合VMware和Citrix虛擬化技術(shù)的桌面云平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)[Jl,安慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2017(2):76-80.
[9]顧武雄.詳解數(shù)據(jù)庫(kù)鏡像[J].網(wǎng)絡(luò)安全和信息化,2018(2):73-78。
[10]劉景云.淺議Windows Server 2012容錯(cuò)[Jl.網(wǎng)絡(luò)安全和信息化,2017(2):47-48.
[11]孫志強(qiáng).簡(jiǎn)談地鐵信號(hào)電源的雙UPS并機(jī)方案[J].鐵路通信信號(hào)工程技術(shù),2016(5):76-78.
[12]邱偉杰,基于并機(jī)冗余式UPS的雙總線供電系統(tǒng)分析和應(yīng)用[J].科技創(chuàng)新與應(yīng)用,2018(11):148-149.
【通聯(lián)編輯:王力】
基金項(xiàng)目:安徽省教育廳2019年度高等學(xué)校人文社會(huì)科學(xué)研究項(xiàng)目——大數(shù)據(jù)背景下云計(jì)算技術(shù)在安徽省審計(jì)中的應(yīng)用研究,項(xiàng)目編號(hào):SK20198006
作者簡(jiǎn)介:王春苗(1980-),男,安徽省合肥市人,助理實(shí)驗(yàn)師,本科,主要研究方向?yàn)椤疤摂M化和基于虛擬化的云計(jì)算”“超融合架構(gòu)”“軟件定義存儲(chǔ)”“軟件定義數(shù)據(jù)中心”、信息安全等;劉玥(1987-),女,安徽黃山人,高級(jí)審計(jì)師,碩士,主要研究方向?qū)徲?jì)、會(huì)計(jì)信息化。