■ 李楠 聶元丁
在氣象業(yè)務(wù)高速發(fā)展、建設(shè)過程中,系統(tǒng)重復(fù)建設(shè)、IT資源浪費(fèi)、冗余等問題越發(fā)凸顯。為解決上述問題,通過國家氣象信息中心氣象資源池項(xiàng)目的建設(shè),采用虛擬化技術(shù),建立了高效、集約、可動(dòng)態(tài)調(diào)度的計(jì)算存儲資源池,極大提高了物理服務(wù)器和存儲系統(tǒng)的硬件利用率,解決了之前物理服務(wù)器和存儲資源利用率低,系統(tǒng)部署慢等問題,節(jié)約了IT系統(tǒng)基礎(chǔ)設(shè)施的投資成本,達(dá)到集約高效的目的。
虛擬化技術(shù)起源于20世紀(jì)60年代末,當(dāng)時(shí)計(jì)算機(jī)系統(tǒng)較為復(fù)雜、昂貴,一個(gè)學(xué)術(shù)科研機(jī)構(gòu)一般只有一個(gè)或幾個(gè)大型計(jì)算機(jī)系統(tǒng),而且早期操作系統(tǒng)存在只能單任務(wù)處理的問題,為方便多個(gè)用戶/應(yīng)用共享計(jì)算機(jī)資源,發(fā)展出了可以將硬件資源進(jìn)行邏輯劃分的虛擬化技術(shù)。經(jīng)過信息技術(shù)數(shù)十年的發(fā)展和演進(jìn),虛擬化技術(shù)也得到了極大的完善和進(jìn)步,但究其本質(zhì)仍是一種資源管理技術(shù),用于將實(shí)體資源進(jìn)行抽象,打破實(shí)體結(jié)構(gòu)間不可分割的障礙,供用戶更靈活的使用資源。隨著21世紀(jì)云計(jì)算的興起,虛擬化作為其中一項(xiàng)核心技術(shù),在各個(gè)領(lǐng)域均呈現(xiàn)爆發(fā)式增長。氣象行業(yè)由于具有資料量龐大,業(yè)務(wù)系統(tǒng)復(fù)雜等特點(diǎn),在擴(kuò)展性、易用性、功能性等方面對基礎(chǔ)平臺提出較高要求。在傳統(tǒng)基礎(chǔ)設(shè)施平臺難以滿足氣象信息業(yè)務(wù)高速發(fā)展的帶來的技術(shù)需求時(shí),虛擬化技術(shù)的應(yīng)用,可作為有力的技術(shù)驅(qū)動(dòng)力,支撐業(yè)務(wù)發(fā)展。
虛擬化是指將計(jì)算機(jī)、存儲等硬件的各種實(shí)體資源予以抽象、轉(zhuǎn)換,形成可供多個(gè)上層系統(tǒng)、應(yīng)用共享使用的狀態(tài)的過程。根據(jù)對象的不同,可分為平臺虛擬化、應(yīng)用程序虛擬化、內(nèi)存虛擬化、存儲虛擬化、網(wǎng)絡(luò)虛擬化等。當(dāng)前應(yīng)用最為廣泛的是平臺虛擬化,其旨在通過技術(shù)手段將硬件平臺與終端用戶使用的操作系統(tǒng)分開。平臺虛擬化根據(jù)實(shí)現(xiàn)方式的不同,又可以分為完全虛擬化和部分虛擬化。完全虛擬化在硬件和虛擬機(jī)操作系統(tǒng)之間增加軟件層,將兩者進(jìn)行邏輯分離,其優(yōu)勢在于虛擬機(jī)所使用的操作系統(tǒng)無需任何改動(dòng),主要產(chǎn)品有VMware-ESXi、KVM、Xen-HVM等。部分虛擬化利用虛擬化軟件實(shí)現(xiàn)對底層硬件的共享訪問,針對部分特權(quán)指令,用戶虛擬機(jī)可以與硬件進(jìn)行直接交互,其優(yōu)勢在于虛擬機(jī)運(yùn)算執(zhí)行效率高,接近物理機(jī)效能,主要產(chǎn)品有Hyper-V、Xen-PV等。
當(dāng)前,虛擬化在多個(gè)技術(shù)領(lǐng)域均有具體實(shí)現(xiàn),如計(jì)算資源相關(guān)的服務(wù)器虛擬化、桌面云、彈性計(jì)算服務(wù),以及其他資源相關(guān)的SDN、虛擬交換機(jī)、虛擬防火墻、分布式存儲等都是虛擬化技術(shù)應(yīng)用的產(chǎn)物。
氣象業(yè)務(wù)系統(tǒng)的發(fā)展歷程與業(yè)界信息技術(shù)的發(fā)展是高度一致的,未應(yīng)用虛擬化技術(shù)之前,在IT基礎(chǔ)設(shè)施方面,主要使用的有高性能計(jì)算機(jī)、小型機(jī)以及x86服務(wù)器三種硬件架構(gòu)。三種架構(gòu)面向的業(yè)務(wù)功能及運(yùn)行模式不同,在技術(shù)更新?lián)Q代過程中的替代性也有所差異。高性能計(jì)算機(jī)主要用于復(fù)雜的數(shù)值模式計(jì)算,需要消耗海量的計(jì)算資源。由于高性能計(jì)算機(jī)系統(tǒng)的高可靠性和針對特定復(fù)雜問題的高度優(yōu)化特性,使其短時(shí)間內(nèi)無法被其他架構(gòu)取代。小型機(jī)主要用于對性能和可靠性要求較高的業(yè)務(wù)系統(tǒng),如交易系統(tǒng)、核心數(shù)據(jù)庫等,此種平臺優(yōu)勢在于系統(tǒng)穩(wěn)定性高,單機(jī)性能強(qiáng),但在業(yè)務(wù)量爆發(fā)膨脹的情況下,難以實(shí)現(xiàn)橫向擴(kuò)展,業(yè)務(wù)規(guī)模受到單機(jī)能力限制。x86服務(wù)器主要用于網(wǎng)站、數(shù)據(jù)傳輸、軟件開發(fā)等輕量業(yè)務(wù)系統(tǒng)使用,此類業(yè)務(wù)對資源需求量不大,如使用獨(dú)立的服務(wù)器,會(huì)造成較為嚴(yán)重的系統(tǒng)資源浪費(fèi),同時(shí)硬件設(shè)備采購周期較長,不利于業(yè)務(wù)快速上線。為解決或緩解上述軟硬件在業(yè)務(wù)使用中存在的問題,氣象信息系統(tǒng)的建設(shè)過程中引入虛擬化技術(shù),并基于此技術(shù)建設(shè)IT基礎(chǔ)設(shè)施云平臺。
2012年開始,信息中心開始試點(diǎn)使用服務(wù)器虛擬化技術(shù)。采購批量x86架構(gòu)服務(wù)器,通過安裝虛擬化軟件,將CPU和內(nèi)存資源進(jìn)行池化,通過SAN網(wǎng)絡(luò)或以太網(wǎng)與存儲資源進(jìn)行連接,構(gòu)成服務(wù)器虛擬化資源池(圖1)。提供中國氣象局機(jī)關(guān)及直屬單位單位使用,當(dāng)前資源池平臺包括38臺x86服務(wù)器,5套本地存儲,3套網(wǎng)絡(luò)存儲,在局域網(wǎng)、互聯(lián)網(wǎng)兩個(gè)網(wǎng)絡(luò)區(qū)域提供服務(wù)。
圖1 資源池平臺架構(gòu)
其中,業(yè)務(wù)資源池已為中國氣象局機(jī)關(guān)及國家氣象中心、國家氣候中心等八個(gè)直屬單位分配資源,共承載包括CIPAS2.0,強(qiáng)天氣預(yù)報(bào)系統(tǒng),國家級氣象業(yè)務(wù)內(nèi)網(wǎng),中國氣象數(shù)據(jù)網(wǎng),軍事保障平臺等231個(gè)業(yè)務(wù)系統(tǒng)共532臺虛擬機(jī)運(yùn)行。資源池中CPU處于超分配狀態(tài),集約化比(物理服務(wù)器數(shù)量:虛擬服務(wù)器數(shù)量)達(dá)到1:14,集約化效益顯著。業(yè)務(wù)資源池資源分配及使用情況如表1所示。
表1 業(yè)務(wù)資源池資源分配及使用情況
2014年,信息中心小規(guī)模試點(diǎn)桌面云技術(shù),采用4臺刀片服務(wù)器和1套磁盤陣列搭建桌面云平臺,已為61個(gè)用戶創(chuàng)建桌面虛擬機(jī),部分用戶工作環(huán)境已切換為云桌面辦公,工作時(shí)間在線用戶30人以上。
2015年開始,在虛擬化資源池運(yùn)維中發(fā)現(xiàn),本地磁盤陣列存儲擴(kuò)充規(guī)模有限、難以支持大數(shù)據(jù)量存儲需求的情況越發(fā)凸顯,因此,引入分布式存儲技術(shù)。將分布式存儲通過以太網(wǎng),連接至局域網(wǎng),為資源池及其他業(yè)務(wù)提供網(wǎng)絡(luò)存儲服務(wù)。目前分布式存儲系統(tǒng)在局域網(wǎng)和互聯(lián)網(wǎng)區(qū)域均已部署,由于分布式架構(gòu)對橫向擴(kuò)充具有較強(qiáng)的支持能力,經(jīng)過多次擴(kuò)充后,總量已達(dá)到2.4 PB,已分配996.8 TB,使用率為21%,為46個(gè)業(yè)務(wù)提供大容量存儲服務(wù)。
采用服務(wù)器虛擬化技術(shù)帶來多方面效益,從場地環(huán)境方面進(jìn)行考量,38臺4U服務(wù)器需4個(gè)機(jī)柜,如果所有虛擬機(jī)全部采用物理服務(wù)器承載,根據(jù)1.3節(jié)中統(tǒng)計(jì)的虛擬機(jī)分配數(shù)量,則一共需要532個(gè)獨(dú)立物理服務(wù)器,如果假定每個(gè)服務(wù)器為4U,需要至少54個(gè)機(jī)柜,如果以主流的2U服務(wù)器計(jì)算,也需要至少26個(gè)機(jī)柜,因此采用虛擬化技術(shù)節(jié)省了80%以上的場地空間。能耗方面,平均每臺x86服務(wù)器功率約為400 W,38臺物理服務(wù)器相比532臺物理服務(wù)器,一年可節(jié)省電量約173萬度。除場地環(huán)境外,虛擬化技術(shù)也極大縮短了業(yè)務(wù)部署上線周期,將持續(xù)數(shù)月的設(shè)備招標(biāo)、采購、部署流程縮短到數(shù)十分鐘。此外,還可提高IT基礎(chǔ)設(shè)施可靠性,不再因物理設(shè)備故障導(dǎo)致業(yè)務(wù)系統(tǒng)停止服務(wù),通過備份系統(tǒng)對虛擬服務(wù)器進(jìn)行定期整機(jī)備份,在操作系統(tǒng)崩潰或軟件故障時(shí)也可快速恢復(fù)系統(tǒng)。另外,出現(xiàn)資源不足情況后,可快速實(shí)現(xiàn)虛擬硬件(CPU、內(nèi)存、存儲等)擴(kuò)充,避免因硬件能力限制導(dǎo)致業(yè)務(wù)發(fā)展。
通過對基礎(chǔ)設(shè)施資源池中477臺部署代理程序(可提取資源使用率)的虛擬機(jī)進(jìn)行分析統(tǒng)計(jì),虛擬機(jī)CPU平均使用率為0.22%,本地存儲平均使用率為0.28%。如無虛擬化環(huán)境,所有虛擬機(jī)將使用物理機(jī)承載,因此虛擬機(jī)使用率可類比為傳統(tǒng)環(huán)境物理機(jī)使用率。結(jié)合資源池計(jì)算資源使用率12.99%和存儲使用率65.04%進(jìn)行分析,虛擬化技術(shù)的應(yīng)用,使計(jì)算資源使用率提高59倍以上,存儲資源使用率提高232倍以上,體現(xiàn)巨大集約化效益(表2)。
表2 服務(wù)器虛擬化效益分析
桌面虛擬化帶來的效益(表3)是多方面的,首先,方便為新員工、臨時(shí)用戶、測試環(huán)境等快速部署桌面環(huán)境,資源使用緊張時(shí),可在線擴(kuò)充,資源使用完畢后可及時(shí)回收,避免造成辦公電腦閑置問題,增加整體硬件利用率。同時(shí),平臺已為所有桌面虛擬機(jī)提供整機(jī)備份服務(wù),方便故障恢復(fù),不會(huì)因硬件故障導(dǎo)致數(shù)據(jù)丟失。另外由于桌面操作系統(tǒng)運(yùn)行于服務(wù)器中,平臺可支持通過筆記本電腦、平板電腦、手機(jī)等設(shè)備遠(yuǎn)程連接,可實(shí)現(xiàn)移動(dòng)辦公。
表3 桌面虛擬化效益分析
分布式存儲的應(yīng)用,為海量數(shù)據(jù)的在線存儲提供可能。傳統(tǒng)磁盤陣列存儲整機(jī)性能受限于存儲控制器性能限制,一般存儲總量小于10 PB,而且存儲系統(tǒng)總帶寬等于控制器帶寬。分布式存儲基于分布式架構(gòu),可以擴(kuò)充節(jié)點(diǎn)對存儲系統(tǒng)進(jìn)行擴(kuò)容,由于其線性擴(kuò)充特性,單存儲系統(tǒng)可以擴(kuò)充至100 PB以上,并且每個(gè)存儲節(jié)點(diǎn)均可與外部系統(tǒng)進(jìn)行流量交互,使整個(gè)存儲系統(tǒng)的吞吐量可以隨存儲節(jié)點(diǎn)數(shù)量增加呈線性增長(表4)。從容量和吞吐量兩方面,滿足大數(shù)據(jù)訪問需求。
表4 分布式存儲效益分析
通過以上對五年來虛擬化技術(shù)在氣象業(yè)務(wù)中應(yīng)用的情況分析,無論是在服務(wù)器、桌面、存儲等方面的使用,均帶來多重效益,主要體現(xiàn)在資源就緒時(shí)間,資源靈活性和系統(tǒng)可靠性三個(gè)方面。在現(xiàn)今業(yè)務(wù)應(yīng)用開發(fā)、迭代速度加快,數(shù)據(jù)可靠性地位提高的信息技術(shù)背景下,虛擬化技術(shù)應(yīng)用帶來的效益為氣象業(yè)務(wù)應(yīng)用的快速發(fā)展提供了強(qiáng)有力支持。
當(dāng)前虛擬化技術(shù)的應(yīng)用僅僅解決了硬件資源不集約、硬件使用率低等問題,煙囪式的業(yè)務(wù)設(shè)計(jì)模式并未得到有效解決。僅是將物理服務(wù)器部署形式變?yōu)樘摂M服務(wù)器部署,在操作系統(tǒng)和基礎(chǔ)軟件層依然有大量的資源冗余、重復(fù)建設(shè)現(xiàn)象,并未將氣象業(yè)務(wù)人員徹底從系統(tǒng)運(yùn)維工作中解放,仍需進(jìn)行大量基礎(chǔ)維護(hù)工作。
為了解決以上遺存問題,除已經(jīng)應(yīng)用的服務(wù)器虛擬化和存儲虛擬化技術(shù)外,還可引入當(dāng)前技術(shù)成熟度較高,且應(yīng)用較為廣泛的還有容器虛擬化及網(wǎng)絡(luò)虛擬化技術(shù)。通過容器虛擬化,可以使不同應(yīng)用系統(tǒng)復(fù)用操作系統(tǒng)資源,方便業(yè)務(wù)人員對于應(yīng)用系統(tǒng)的調(diào)試和部署,極大減少部署業(yè)務(wù)的時(shí)間成本和人力成本。網(wǎng)絡(luò)虛擬化的部署則可以按需對業(yè)務(wù)進(jìn)行網(wǎng)絡(luò)安全策略發(fā)放,對不同業(yè)務(wù)進(jìn)行安全隔離。未來對于容器及網(wǎng)絡(luò)虛擬化的應(yīng)用,將降低業(yè)務(wù)開發(fā)、部署及網(wǎng)絡(luò)運(yùn)維方面的工作難度,釋放相關(guān)業(yè)務(wù)人員運(yùn)維壓力。
通過服務(wù)器和存儲虛擬化技術(shù)的應(yīng)用,已在氣象業(yè)務(wù)應(yīng)用中取得了巨大效益,解決眾多業(yè)務(wù)對平臺資源的需求問題,節(jié)省大量機(jī)房場地能源成本,實(shí)現(xiàn)部分傳統(tǒng)平臺不具備的功能。未來還將在系統(tǒng)建設(shè)中應(yīng)用其他虛擬化及云計(jì)算相關(guān)技術(shù),解決應(yīng)用級使用問題,滿足氣象業(yè)務(wù)的發(fā)展訴求。
深入閱讀
沈文海, 2012. 從云計(jì)算看氣象部門未來的信息化趨勢. 氣象科技進(jìn)展, 2(2): 49-56.
王彬, 2014. 高性能計(jì)算技術(shù)在氣象部門的應(yīng)用. 計(jì)算機(jī)工程與設(shè)計(jì), 35(4): 1476-1479.
中國信息通信研究院, 2016. 云計(jì)算白皮書(2016年).
Advances in Meteorological Science and Technology2018年1期