譚志遠(yuǎn),宮云平,周文紅
(1.中國(guó)電信股份有限公司廣東研究院 廣州510630;2.中國(guó)電信集團(tuán)公司 北京100032)
云計(jì)算虛擬化技術(shù)的引入為業(yè)務(wù)網(wǎng)絡(luò)演進(jìn)、資源整合提供了新的技術(shù)手段。云計(jì)算虛擬化技術(shù)越來(lái)越成熟,應(yīng)用越來(lái)越廣泛,并經(jīng)過(guò)近兩年來(lái)基于云計(jì)算技術(shù)對(duì)業(yè)務(wù)平臺(tái)進(jìn)行關(guān)停并轉(zhuǎn)的現(xiàn)場(chǎng)試驗(yàn),驗(yàn)證了基于云計(jì)算虛擬化技術(shù)在整合資源、提高資源利用率、降低維護(hù)成本、增加業(yè)務(wù)平臺(tái)的整體容災(zāi)性能等方面的能力,能給現(xiàn)階段業(yè)務(wù)平臺(tái)的運(yùn)營(yíng)維護(hù)帶來(lái)質(zhì)的變化。
現(xiàn)階段對(duì)于重要業(yè)務(wù)平臺(tái)(如WAP網(wǎng)關(guān)、彩信中心、短信中心等),是否進(jìn)行云化始終存在顧慮,因?yàn)檫@些業(yè)務(wù)平臺(tái)其承載的業(yè)務(wù)量大、用戶量多、影響面廣,擔(dān)心云化后可能給這些業(yè)務(wù)平臺(tái)的安全運(yùn)行帶來(lái)諸多不可預(yù)測(cè)的隱患,因此在推進(jìn)重要業(yè)務(wù)平臺(tái)云化方面始終比較慎重。
究竟哪些業(yè)務(wù)平臺(tái)適合云化,哪些業(yè)務(wù)平臺(tái)不適合云化,如何評(píng)估,其評(píng)估的依據(jù)和方法是什么?本文結(jié)合云計(jì)算技術(shù)的特點(diǎn)和業(yè)務(wù)平臺(tái)的實(shí)際情況,探索了一套針對(duì)業(yè)務(wù)平臺(tái)是否可云化的評(píng)估方法,并形成了可量化、可操作的評(píng)估體系,希望能對(duì)業(yè)務(wù)平臺(tái)的云化起到指導(dǎo)作用。
(1)業(yè)務(wù)平臺(tái)云化
業(yè)務(wù)平臺(tái)云化是把現(xiàn)有業(yè)務(wù)平臺(tái)遷移到云計(jì)算資源池承載的簡(jiǎn)稱,即針對(duì)現(xiàn)有業(yè)務(wù)平臺(tái),經(jīng)過(guò)云化評(píng)估后,把可云化的業(yè)務(wù)平臺(tái)通過(guò)P2V(physical-to-virtual,把物理機(jī)中的應(yīng)用系統(tǒng)遷移到虛擬機(jī)中)模式或者新建模式(在云計(jì)算資源池中的虛擬機(jī)上重新部署業(yè)務(wù)平臺(tái)運(yùn)行環(huán)境)把業(yè)務(wù)平臺(tái)遷移到云計(jì)算資源池中。
(2)部分云化
根據(jù)業(yè)務(wù)平臺(tái)的實(shí)際情況或需要,把業(yè)務(wù)平臺(tái)中部分模塊遷移或部署到云資源池中,而業(yè)務(wù)平臺(tái)中的其他模塊保持傳統(tǒng)的承載方式不變(直接使用物理機(jī))。
(3)融合云
本文中融合云的概念是指x86云與小型機(jī)云混合組網(wǎng)的解決方案,即根據(jù)實(shí)際需要,把業(yè)務(wù)平臺(tái)的部分模塊遷移或部署到x86云,部分遷移或部署到小型機(jī)云的混合解決方案。
根據(jù)目前云計(jì)算服務(wù)器虛擬化技術(shù)的發(fā)展,主要存在兩個(gè)不同的發(fā)展方向,即“1變多”和“多變1”兩種方式,兩種方式的比較見(jiàn)表1。根據(jù)現(xiàn)網(wǎng)業(yè)務(wù)平臺(tái)云化實(shí)際應(yīng)用場(chǎng)景和云資源池的建設(shè)情況,本文主要討論“1變多”的情況(大型機(jī)的虛擬化除外),即把一臺(tái)物理服務(wù)器虛擬成多臺(tái)虛擬機(jī)供業(yè)務(wù)平臺(tái)使用。根據(jù)資源池服務(wù)器類型的不同,云資源池也存在如下幾種情況:使用小型機(jī)虛擬化技術(shù)構(gòu)建的云資源池(以下簡(jiǎn)稱小型機(jī)云)、使用x86服務(wù)器構(gòu)建的云資源池(以下簡(jiǎn)稱x86云)以及小型機(jī)云和x86云混合使用構(gòu)建的融合云資源池。
表1 服務(wù)器虛擬化的兩個(gè)方向
服務(wù)器虛擬化后,最顯著的特點(diǎn)是實(shí)現(xiàn)計(jì)算、內(nèi)存、存儲(chǔ)、網(wǎng)絡(luò)等資源的共享,并且各虛擬機(jī)的資源可按需分配。與傳統(tǒng)的業(yè)務(wù)平臺(tái)部署不同,各虛擬機(jī)與底層硬件之間多了如圖1所示的虛擬化層(hypervisor),因此需要結(jié)合這些特征以及業(yè)務(wù)平臺(tái)的實(shí)際情況綜合評(píng)估業(yè)務(wù)平臺(tái)是否可云化,是否適合云化。
圖1 服務(wù)器虛擬化“1變多”
基于云計(jì)算的虛擬化技術(shù)可以把現(xiàn)網(wǎng)設(shè)備老化、資源利用率低、生命周期短、業(yè)務(wù)突發(fā)性高且符合云化條件的各種業(yè)務(wù)平臺(tái)(優(yōu)先考慮對(duì)小業(yè)務(wù)平臺(tái)、短生命周期平臺(tái)、離線分析平臺(tái)、硬件故障率高、過(guò)?;蚓S保即將到期的業(yè)務(wù)平臺(tái))遷移到云平臺(tái)統(tǒng)一承接,實(shí)現(xiàn)業(yè)務(wù)平臺(tái)的資源整合。
根據(jù)現(xiàn)網(wǎng)業(yè)務(wù)平臺(tái)實(shí)際云化的經(jīng)驗(yàn)和云計(jì)算技術(shù)的特點(diǎn),不是所有的業(yè)務(wù)平臺(tái)都適合遷移到云資源池中,業(yè)務(wù)平臺(tái)是否可以云化會(huì)受制于諸多因素,因此在實(shí)施業(yè)務(wù)平臺(tái)云化前務(wù)必做好充分的評(píng)估,什么類型的業(yè)務(wù)平臺(tái)適合云化,需要從哪些方面評(píng)估業(yè)務(wù)平臺(tái)是否可云化。
為了更充分地評(píng)估業(yè)務(wù)平臺(tái)是否可以云化,在評(píng)估前需要先收集現(xiàn)有待云化業(yè)務(wù)平臺(tái)的一些基本數(shù)據(jù),通過(guò)業(yè)務(wù)平臺(tái)的現(xiàn)狀,再結(jié)合云計(jì)算的特點(diǎn)綜合評(píng)估業(yè)務(wù)平臺(tái)是否可云化。
收集待云化平臺(tái)的基本資料,主要包括平臺(tái)設(shè)備使用情況和業(yè)務(wù)特性方面的資料。在物理設(shè)備方面,收集業(yè)務(wù)平臺(tái)的服務(wù)器設(shè)備、網(wǎng)絡(luò)設(shè)備、存儲(chǔ)設(shè)備以及其他特殊設(shè)備(信令卡、加密狗等)等相關(guān)資料,主要包括平臺(tái)涉及服務(wù)器的數(shù)量,各服務(wù)器的操作系統(tǒng)種類和版本、CPU數(shù)量、核數(shù)和CPU利用率、內(nèi)存容量及當(dāng)前平均利用率、已使用磁盤空間大小、使用網(wǎng)絡(luò)帶寬大小,平臺(tái)使用外接存儲(chǔ)資源大小、IP地址情況,使用防火墻情況以及安全控制策略、外接設(shè)備情況等。
業(yè)務(wù)特性方面收集的資料包括業(yè)務(wù)的忙/閑時(shí)情況、業(yè)務(wù)實(shí)時(shí)性要求、業(yè)務(wù)的重要程度、用戶量、業(yè)務(wù)所需的I/O吞吐量等。
待云化業(yè)務(wù)平臺(tái)需要采集的信息包括表2和表3所涉及的評(píng)估數(shù)據(jù)。
收集到待遷移平臺(tái)的資料后,從虛擬化技術(shù)特性、業(yè)務(wù)特性、維護(hù)管理要求等幾個(gè)方面分析是否對(duì)業(yè)務(wù)平臺(tái)進(jìn)行可云化或部分云化評(píng)估。
4.2.1 云計(jì)算技術(shù)制約
根據(jù)表1所示,目前“1變多”虛擬化技術(shù)根據(jù)平臺(tái)架構(gòu)的不同主要有x86云和小型機(jī)云兩種技術(shù)實(shí)現(xiàn)方式(兩者組合可以構(gòu)建融合云),而不同實(shí)現(xiàn)方式下,各廠商的虛擬化產(chǎn)品所實(shí)現(xiàn)的功能是有所差異的,因此在進(jìn)行云化評(píng)估時(shí),首先必須根據(jù)現(xiàn)有資源池所使用虛擬化產(chǎn)品的功能情況進(jìn)行評(píng)估。主要有如下幾個(gè)方面的評(píng)估內(nèi)容。
表2 待云化平臺(tái)資源使用情況匯總(1)
表3 待云化平臺(tái)資源使用情況匯總(2)
(1)平臺(tái)架構(gòu)
待云化的業(yè)務(wù)平臺(tái)如果是x86架構(gòu),可接入x86架構(gòu)的云資源池(如使用VMware、Citrix、RedHat等廠商虛擬化技術(shù)的資源池);非x86架構(gòu)(RISC架構(gòu))的平臺(tái),如可通過(guò)軟件移植方式轉(zhuǎn)換成x86架構(gòu),也可以接入x86架構(gòu)的云資源池,否則只能根據(jù)平臺(tái)所使用操作系統(tǒng)的種類選擇對(duì)應(yīng)廠商的小型機(jī)云(如使用HP UX的業(yè)務(wù)平臺(tái)只能接入HP小型機(jī)云,使用IBM AIX的業(yè)務(wù)平臺(tái)只能接入IBM小型機(jī)云)。
(2)x86資源池支持的客戶操作系統(tǒng)
待接入x86云資源池的業(yè)務(wù)平臺(tái)各模塊或子系統(tǒng)(業(yè)務(wù)平臺(tái)全部云化或部分云化)所使用的操作系統(tǒng)必須是資源池所使用虛擬化軟件支持的客戶操作系統(tǒng)(含版本)。虛擬化產(chǎn)品所支持的客戶操作系統(tǒng)及版本情況可查詢對(duì)應(yīng)公司虛擬化產(chǎn)品支持GuestOS的兼容性列表。
(3)不能虛擬化的特殊外接設(shè)備
對(duì)于業(yè)務(wù)平臺(tái)中使用特殊外接設(shè)備(如信令卡、語(yǔ)音板卡、傳真卡、調(diào)制解調(diào)器、安全軟件狗、硬件加密設(shè)備等)的模塊,當(dāng)服務(wù)器虛擬化軟件不支持對(duì)特殊設(shè)備的虛擬化,且無(wú)法通過(guò)其他技術(shù)(如通過(guò)USB over Network技術(shù)解決虛擬化軟件不支持特殊USB設(shè)備的問(wèn)題)解決業(yè)務(wù)平臺(tái)使用特殊設(shè)備的問(wèn)題時(shí),將無(wú)法云化,這種情況下可對(duì)平臺(tái)中符合條件的模塊進(jìn)行部分云化。
4.2.2 業(yè)務(wù)特性需求制約
云計(jì)算虛擬化“1變多”的技術(shù)就是把物理機(jī)虛擬成多臺(tái)虛擬機(jī)使用,其目的是提高服務(wù)器資源的利用率,但當(dāng)需要把一個(gè)本身對(duì)資源要求高且平時(shí)資源利用率就很高的平臺(tái)遷移到虛擬機(jī)上運(yùn)行時(shí),這就違背了虛擬化的初衷,并且由于實(shí)施虛擬化后物理服務(wù)器上需要運(yùn)行Hypervisor軟件,將更加降低服務(wù)器的利用率。這種業(yè)務(wù)平臺(tái)就不建議遷移到云資源池中。同時(shí)對(duì)于高I/O要求的業(yè)務(wù)平臺(tái)也不建議云化,一方面虛擬化層的增加會(huì)對(duì)I/O處理有所犧牲(雖然虛擬化產(chǎn)品廠商承諾影響較小);另一方面資源池需要使用共享存儲(chǔ)以實(shí)現(xiàn)高可靠性和動(dòng)態(tài)遷移等功能,如果大量高I/O要求的平臺(tái)統(tǒng)一承載在一個(gè)共享存儲(chǔ)上,共享存儲(chǔ)將是一個(gè)較大的瓶頸。另外,鑒于目前云計(jì)算技術(shù)在安全領(lǐng)域尚未給人們足夠的信心,對(duì)于承載安全性比較重要的業(yè)務(wù)平臺(tái),也是必須要評(píng)估的因素。綜上所述,在業(yè)務(wù)特性方面,結(jié)合云計(jì)算的特點(diǎn)建議從如下幾個(gè)方面進(jìn)行評(píng)估。
(1)CPU資源
對(duì)于CPU資源要求非常高的業(yè)務(wù)平臺(tái),如現(xiàn)有系統(tǒng)或應(yīng)用運(yùn)行在8核及以上(因目前虛擬化廠商的產(chǎn)品最大支持8核,今后可根據(jù)虛擬化廠商產(chǎn)品的發(fā)展,修訂評(píng)估依據(jù))的CPU物理服務(wù)器上,且平時(shí)平均利用率超過(guò)50%,暫不建議進(jìn)行虛擬化或把該平臺(tái)對(duì)CPU資源需求低的模塊進(jìn)行部分云化。
(2)I/O吞吐量
對(duì)于I/O吞吐量大的業(yè)務(wù)平臺(tái),如系統(tǒng)或應(yīng)用運(yùn)行在每塊網(wǎng)卡上的平均網(wǎng)絡(luò)帶寬需求超過(guò)100 Mbit/s,對(duì)存儲(chǔ)LUN的平均IOPS大于2 000,平均吞吐量大于100 Mbit/s的DISK I/O暫不建議進(jìn)行虛擬化或采用部分云化吞吐量小的模塊。
(3)安全敏感性
對(duì)于安全等級(jí)高或涉及敏感數(shù)據(jù)的業(yè)務(wù)平臺(tái),暫不建議云化。
4.2.3 維護(hù)管理制約
業(yè)務(wù)平臺(tái)云化后,在日常維護(hù)管理手段和云化可操作性方面也必須進(jìn)行一定的評(píng)估,主要評(píng)估內(nèi)容如下所述。
表4 業(yè)務(wù)平臺(tái)云化評(píng)估
(1)維護(hù)手段或方式
對(duì)于云化后,無(wú)法按照維護(hù)界面要求或無(wú)技術(shù)手段實(shí)現(xiàn)對(duì)業(yè)務(wù)平臺(tái)遠(yuǎn)程監(jiān)控和維護(hù)的平臺(tái),不建議云化。
(2)網(wǎng)絡(luò)遷移的可行性
評(píng)估業(yè)務(wù)平臺(tái)云化后網(wǎng)絡(luò)遷移的可行性,特別是部分云化的業(yè)務(wù)平臺(tái),從效益、效率、可執(zhí)行性方面進(jìn)行組網(wǎng)方案的評(píng)估。
(3)業(yè)務(wù)的忙/閑時(shí)
在實(shí)際云化時(shí),可根據(jù)業(yè)務(wù)平臺(tái)的忙、閑時(shí)的不同,把能實(shí)現(xiàn)錯(cuò)峰填谷效果的業(yè)務(wù)平臺(tái)配置在資源池的同一個(gè)集群中,將能更好地提高資源池的利用率,不建議把峰谷同步的業(yè)務(wù)平臺(tái)整合在一個(gè)集群中承載。
4.2.4 云化評(píng)估
將上述評(píng)估要素整理成評(píng)估模板,見(jiàn)表4,在云化過(guò)程中可根據(jù)業(yè)務(wù)平臺(tái)的實(shí)際情況,對(duì)照評(píng)估模板進(jìn)行評(píng)估,可得到業(yè)務(wù)平臺(tái)是否可云化的結(jié)論。
本文總結(jié)筆者近幾年在實(shí)施業(yè)務(wù)平臺(tái)云化方面的工作經(jīng)驗(yàn),結(jié)合云計(jì)算虛擬化技術(shù)發(fā)展的現(xiàn)狀,根據(jù)業(yè)務(wù)平臺(tái)的實(shí)際情況,摸索出了一套業(yè)務(wù)平臺(tái)云化的評(píng)估方法,探討了在實(shí)施業(yè)務(wù)平臺(tái)云化過(guò)程中需要重點(diǎn)關(guān)注和評(píng)估的3個(gè)方面,并針對(duì)3個(gè)方面的評(píng)估提出了具體的評(píng)估要求和參考指標(biāo),希望能在實(shí)施業(yè)務(wù)平臺(tái)云化工作中給讀者以指導(dǎo)和啟迪。
1 譚志遠(yuǎn),宮云平.云計(jì)算給業(yè)務(wù)平臺(tái)的發(fā)展與運(yùn)維帶來(lái)的機(jī)遇與挑戰(zhàn)探討.電信科學(xué),2011,27(10A):6~10
2 譚志遠(yuǎn).中國(guó)電信移動(dòng)增值業(yè)務(wù)平臺(tái)快速云化解決方案.中國(guó)電信集團(tuán)公司網(wǎng)絡(luò)運(yùn)行維護(hù)事業(yè)部,2012