黃澤星
(中鐵武漢勘察設(shè)計(jì)研究院有限公司,武漢 430074)
中國鐵路武漢局集團(tuán)有限公司(簡稱武漢局)近年來在信息化建設(shè)中取得了良好效果,但隨著鐵路業(yè)務(wù)逐步拓展,多年分布實(shí)施的信息化建設(shè)存在多種品牌的物理服務(wù)器、虛擬化以及數(shù)據(jù)庫等應(yīng)用系統(tǒng)信息共享程度不高,產(chǎn)生了諸多的“豎井型”和“信息孤島”,導(dǎo)致很多設(shè)備利用率得不到充分發(fā)揮,造成大量資源浪費(fèi),多年分布實(shí)施的信息化系統(tǒng)及設(shè)備給管理帶來的弊端逐步顯現(xiàn)。因此,重新規(guī)劃、升級(jí)武漢局的云管理平臺(tái),保持統(tǒng)一架構(gòu)、統(tǒng)一接口,才能符合鐵路信息化總體規(guī)劃要求。
1)武漢局以私有云模式為基礎(chǔ)設(shè)施層服務(wù)建設(shè)的局級(jí)云管理平臺(tái),能對(duì)局內(nèi)實(shí)現(xiàn)云資源和服務(wù)的自動(dòng)化調(diào)度和部署,并預(yù)留未來與總公司級(jí)云管理平臺(tái)的互聯(lián)互通以及其他系統(tǒng)平臺(tái)對(duì)接的能力。能夠?yàn)橛脩籼峁㊣aaS層服務(wù)、部分PaaS層服務(wù)、云運(yùn)維管理。根據(jù)未來業(yè)務(wù)需求的增加,局級(jí)云管理平臺(tái)能夠根據(jù)需求逐步擴(kuò)容計(jì)算節(jié)點(diǎn)或存儲(chǔ)節(jié)點(diǎn),滿足不斷發(fā)展的業(yè)務(wù)需要。其整體技術(shù)架構(gòu)如圖1所示。
圖1 整體技術(shù)架構(gòu)圖Fig.1 Whole technical architecture diagram
2)虛擬化云計(jì)算管理平臺(tái)升級(jí)以基礎(chǔ)設(shè)施層及部分平臺(tái)服務(wù)層功能升級(jí)為主。
基礎(chǔ)設(shè)施層包括物理層、虛擬化和云操作系統(tǒng)。物理層包含服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)等多種類型的硬件設(shè)備,支持多品牌、多架構(gòu)的硬件設(shè)備;虛擬化是在硬件資源基礎(chǔ)上通過虛擬化技術(shù),實(shí)現(xiàn)包括服務(wù)器、存儲(chǔ)等基礎(chǔ)資源的池化,將資源與物理設(shè)備解耦,資源按需分配和靈活調(diào)度;云操作系統(tǒng)最終調(diào)用這些資源承載相應(yīng)的應(yīng)用業(yè)務(wù)系統(tǒng)。
平臺(tái)服務(wù)層是在基礎(chǔ)設(shè)施層的基礎(chǔ)上,通過軟件實(shí)現(xiàn)基于計(jì)算和存儲(chǔ)的各類服務(wù)、基礎(chǔ)服務(wù)、數(shù)據(jù)服務(wù)平臺(tái)和集成服務(wù)平臺(tái)等其他服務(wù)的能力。云管理平臺(tái)主要是面向用戶和資源管理員,實(shí)現(xiàn)用戶管理、資源管理和調(diào)度等服務(wù)功能,在管理上可靈活按需編排多種服務(wù)目錄并通過云服務(wù)門戶中對(duì)外提供服務(wù),云用戶可以按需自助挑選和使用云服務(wù),基礎(chǔ)設(shè)施和平臺(tái)服務(wù)則通過云管理平臺(tái)展現(xiàn)給用戶。管理平臺(tái)技術(shù)架構(gòu)如圖2所示。
a.物理層
物理層主要包括硬件服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)設(shè)備,通過虛擬化軟件將硬件資源解耦,向上層提供計(jì)算資源、存儲(chǔ)資源、網(wǎng)絡(luò)資源。通過云管理平臺(tái)對(duì)計(jì)算資源池、存儲(chǔ)資源池、網(wǎng)絡(luò)資源池的統(tǒng)一管理、調(diào)度。
b.基礎(chǔ)設(shè)施層(IaaS)
基礎(chǔ)設(shè)施層云引擎可以為用戶提供所有基礎(chǔ)設(shè)施資源的利用,包括虛擬計(jì)算資源(CPU、內(nèi)存)、物理計(jì)算資源、存儲(chǔ)資源(分布式存儲(chǔ)、集中式存儲(chǔ))、網(wǎng)絡(luò)資源(虛擬交換機(jī)、虛擬路由器、VLAN、VXLAN),用戶可以通過云管理平臺(tái)調(diào)度,選擇計(jì)算資源、存儲(chǔ)資源和網(wǎng)絡(luò)資源快速部署Windows、Linux等操作系統(tǒng)及應(yīng)用程序。
c.平臺(tái)服務(wù)層(PaaS)
平臺(tái)服務(wù)層可為生產(chǎn)和開發(fā)提供運(yùn)行支撐環(huán)境,通過IaaS層API向下可以調(diào)用計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源,向上可以提供業(yè)務(wù)管理能力和服務(wù)能力,PaaS層服務(wù)本期項(xiàng)目提供Mysql、Hadoop服務(wù),后期根據(jù)業(yè)務(wù)需求將大數(shù)據(jù)服務(wù)、中間件服務(wù)、應(yīng)用容器服務(wù)、數(shù)據(jù)庫服務(wù)、存儲(chǔ)備份服務(wù)等通用應(yīng)用組件進(jìn)行整合封裝,方便為用戶提供生產(chǎn)和開發(fā)環(huán)境支撐。
圖2 管理平臺(tái)技術(shù)架構(gòu)圖Fig.2 Technical architecture diagram of management platform
d.云安全
云安全提供包括訪問安全、主機(jī)安全、系統(tǒng)安全、數(shù)據(jù)安全、網(wǎng)絡(luò)安全、應(yīng)用安全等,并通過靈活、全面和模塊化設(shè)計(jì)可以為用戶提供全面的保護(hù)能力,保障云管理平臺(tái)數(shù)據(jù)、流程的安全性和完整性,同時(shí)具備對(duì)接其他安全平臺(tái)的能力。
e.云運(yùn)維
云運(yùn)維提供從底層硬件環(huán)境到上層應(yīng)用環(huán)境的全方位綜合智能運(yùn)維管理,用戶可以通過云管理平臺(tái)對(duì)資源進(jìn)行統(tǒng)一運(yùn)維管理,包括資源管理、權(quán)限管理、運(yùn)維管理、全局管理、配置管理、資產(chǎn)管理等功能服務(wù)。
3)計(jì)算資源池
虛擬化技術(shù)能夠提高現(xiàn)有物理服務(wù)器的利用率,大幅削減物理服務(wù)器購置的需求、數(shù)量。通過虛擬化軟件將服務(wù)器中CPU、內(nèi)存、IO等資源建設(shè)成計(jì)算資源池。計(jì)算資源池包括虛擬機(jī)資源池和物理機(jī)資源池。虛擬機(jī)資源池是指通過虛擬化軟件實(shí)現(xiàn)的虛擬服務(wù)器資源集合,如KVM、VMware以及小型機(jī)虛擬化等針對(duì)不同硬件的虛擬化軟件。物理機(jī)資源池是指以X86架構(gòu)為主的各品牌物理服務(wù)器。
升級(jí)計(jì)算資源池包括KVM虛擬機(jī)資源池以及現(xiàn)有VMware虛擬機(jī)資源池。通過新增基于KVM的虛擬化軟件對(duì)現(xiàn)有的物理服務(wù)器進(jìn)行服務(wù)器虛擬化,形成KVM計(jì)算資源池,已有的VMware虛擬化保持不變形成VMware計(jì)算資源池。通過云管理平臺(tái)對(duì)算資源池資源的動(dòng)態(tài)調(diào)度,實(shí)現(xiàn)對(duì)業(yè)務(wù)應(yīng)用資源需求的動(dòng)態(tài)響應(yīng),以服務(wù)的方式提供給使用部門。新增的KVM采用高可用架構(gòu)設(shè)計(jì),云主機(jī)可以在KVM資源池跨物理服務(wù)器動(dòng)態(tài)遷移、調(diào)度等,保證云主機(jī)更好的可用性和可靠性。同時(shí)可以根據(jù)云管理平臺(tái)架構(gòu)的特點(diǎn),高負(fù)載數(shù)據(jù)庫等應(yīng)用系統(tǒng)運(yùn)行到性能更好的物理服務(wù)器。
通過升級(jí)計(jì)算資源池建設(shè)提供現(xiàn)有部分業(yè)務(wù)系統(tǒng)的基礎(chǔ)計(jì)算能力,并提供根據(jù)應(yīng)用、項(xiàng)目的增加,動(dòng)態(tài)的對(duì)計(jì)算資源池橫向擴(kuò)容。
4)存儲(chǔ)資源池
增加分布式存儲(chǔ),使武漢局?jǐn)?shù)據(jù)中心形成集中式存儲(chǔ)與分布式存儲(chǔ)共存,滿足不同應(yīng)用需求,完善基礎(chǔ)架構(gòu)中存儲(chǔ)類型。
分布式存儲(chǔ)主要以提供塊存儲(chǔ)服務(wù)為主,塊存儲(chǔ)是云化過程中最基礎(chǔ)的存儲(chǔ)資源,云管理平臺(tái)在和存儲(chǔ)資源池對(duì)接時(shí),需要能支持高可用部署、鏡像在多后端分別存儲(chǔ)、備份到第三方存儲(chǔ)等特性,對(duì)鐵路內(nèi)部現(xiàn)有存量FC-SAN設(shè)備具有良好兼容性。后期通過升級(jí)可提供對(duì)象存儲(chǔ)、文件存儲(chǔ)。同時(shí)根據(jù)未來業(yè)務(wù)需求,采購標(biāo)準(zhǔn)X86架構(gòu)硬件及分布式存儲(chǔ)軟件,將多個(gè)服務(wù)器硬盤資源整合到一起并抽象化,形成分布式存儲(chǔ)資源池,使X86架構(gòu)硬件平滑擴(kuò)容存儲(chǔ)資源。
5)云管理平臺(tái)網(wǎng)絡(luò)
云管理平臺(tái)網(wǎng)絡(luò)總體上主要基于大二層網(wǎng)絡(luò)搭建,支持跨資源池、跨機(jī)房、數(shù)據(jù)中心虛擬資源的分配使用,同時(shí)保證整個(gè)計(jì)算資源池帶寬充足,以滿足業(yè)務(wù)應(yīng)用靈活部署、按需擴(kuò)展、高效運(yùn)行等基本需求。武漢局未來承載的業(yè)務(wù)復(fù)雜多樣,云管理平臺(tái)網(wǎng)絡(luò)架構(gòu)也應(yīng)根據(jù)業(yè)務(wù)特點(diǎn)和需求進(jìn)行相應(yīng)調(diào)整。
為實(shí)現(xiàn)對(duì)云管理平臺(tái)中的計(jì)算資源、存儲(chǔ)資源和網(wǎng)絡(luò)資源的統(tǒng)一管理和調(diào)度,并提供業(yè)務(wù)服務(wù),需要將服務(wù)器接入的網(wǎng)絡(luò)細(xì)分為對(duì)外業(yè)務(wù)網(wǎng)絡(luò)、對(duì)內(nèi)服務(wù)網(wǎng)絡(luò)、分布式存儲(chǔ)網(wǎng)絡(luò)和云管理網(wǎng)絡(luò)4部分,并根據(jù)實(shí)際情況對(duì)4個(gè)網(wǎng)絡(luò)平臺(tái)做網(wǎng)卡綁定,提高鏈路冗余,并通過劃分不同VLAN實(shí)現(xiàn)。升級(jí)的網(wǎng)絡(luò)物理設(shè)備,部署在武漢局內(nèi)部服務(wù)網(wǎng),云管理平臺(tái)服務(wù)器通過萬兆交換機(jī)接入既有網(wǎng)絡(luò),并上聯(lián)內(nèi)部服務(wù)網(wǎng)匯聚交換機(jī),與原有網(wǎng)絡(luò)安全策略不變。
6)云運(yùn)維管理平臺(tái)
云數(shù)據(jù)中心運(yùn)維管理平臺(tái)由多個(gè)相互支撐的子系統(tǒng)組成,包括資產(chǎn)管理系統(tǒng)、云監(jiān)控系統(tǒng)、運(yùn)維數(shù)據(jù)管理系統(tǒng)、自動(dòng)運(yùn)維系統(tǒng)、運(yùn)維智能分析系統(tǒng)。
云運(yùn)維管理系統(tǒng)通過透明化企業(yè)IT基礎(chǔ)架構(gòu)和透明化企業(yè)IT運(yùn)維過程來滿足IT運(yùn)維工作在操作層、管理層、決策層等不同層次的需求,達(dá)到延長企業(yè)應(yīng)用服務(wù)的在線時(shí)間以及提高客戶對(duì)業(yè)務(wù)服務(wù)的滿意度的目的。
第一步:鐵路局現(xiàn)有的虛擬化平臺(tái)接入交換機(jī)是電口千兆交換機(jī),虛擬機(jī)的遷移和備份速率為50 MB/s,150 GB(標(biāo)準(zhǔn)虛擬機(jī)的物理容量)的數(shù)據(jù)備份需要51 min,而萬兆網(wǎng)絡(luò)則僅需5 min;8 GB(平均傳輸數(shù)據(jù)量)虛擬機(jī)遷移需要近3 min,而萬兆網(wǎng)絡(luò)則僅需十幾s。首先將網(wǎng)絡(luò)帶寬擴(kuò)展到萬兆,無論是對(duì)外提供服務(wù)、數(shù)據(jù)備份,還是虛擬機(jī)切換、恢復(fù)都能更加高效。
第二步:根據(jù)本次平臺(tái)升級(jí)架構(gòu),并結(jié)合平臺(tái)既有服務(wù)器數(shù)量以及占用資源情況,本次升級(jí)需增設(shè)相應(yīng)的管理節(jié)點(diǎn)服務(wù)器和分布式存儲(chǔ)服務(wù)器。
武漢局的應(yīng)用項(xiàng)目都將陸續(xù)遷入到虛擬化平臺(tái),將有更多的應(yīng)用服務(wù)器加入到計(jì)算資源中,需要對(duì)現(xiàn)有的機(jī)位進(jìn)行擴(kuò)充。按照鐵路局計(jì)算資源計(jì)劃規(guī)模,兩個(gè)信息機(jī)房按照各200臺(tái)物理服務(wù)器來規(guī)劃。應(yīng)用服務(wù)器的補(bǔ)充結(jié)合各應(yīng)用系統(tǒng)建設(shè)來逐步實(shí)施。
第三步:在內(nèi)部服務(wù)網(wǎng)建立一套云管理平臺(tái),對(duì)云管理平臺(tái)計(jì)算資源、存儲(chǔ)資源、網(wǎng)絡(luò)資源進(jìn)行統(tǒng)一管理,同時(shí)具備現(xiàn)有VMware環(huán)境和小型機(jī)環(huán)境進(jìn)行統(tǒng)一的納管能力。通過云管理平臺(tái),從資源接管、資源建模、資源申請(qǐng)、資源調(diào)度、資源使用、資源監(jiān)控、資源回收等方面形成閉環(huán)的IT基礎(chǔ)資源管理體系。實(shí)現(xiàn)信息系統(tǒng)軟硬件資源的統(tǒng)一管理、統(tǒng)一分配、統(tǒng)一調(diào)度、統(tǒng)一運(yùn)維,優(yōu)化資源管控模式,提高資源利用率。保證資源容量的可控有序增長,為業(yè)務(wù)應(yīng)用提供穩(wěn)定的、高效的、可動(dòng)態(tài)調(diào)整的基礎(chǔ)設(shè)施資源。
通過對(duì)武漢局現(xiàn)有兩個(gè)機(jī)房軟硬件設(shè)施進(jìn)行調(diào)整、升級(jí)、改造,充分利用并整合現(xiàn)有硬件、VMware虛擬化,初步建成為武漢局提供基礎(chǔ)設(shè)施層服務(wù)的云管理平臺(tái)以及云運(yùn)維管理平臺(tái),解決了現(xiàn)階段部分應(yīng)用系統(tǒng)計(jì)算、存儲(chǔ)需求以及云運(yùn)維需求,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)與底層物理硬件解耦,IT基礎(chǔ)資源集中管理、統(tǒng)一調(diào)度和綜合利用,改善了武漢局信息缺乏統(tǒng)籌利用、分散建設(shè)的局面,降低IT信息系統(tǒng)建設(shè)及運(yùn)營成本,滿足武漢局信息化業(yè)務(wù)快速發(fā)展、資源按需擴(kuò)容的需求。