葉衛(wèi)華 江西省郵電規(guī)劃設(shè)計(jì)院有限公司 南昌市 330002
隨著用戶規(guī)模和業(yè)務(wù)的不斷發(fā)展,運(yùn)營(yíng)商內(nèi)部的IT系統(tǒng)規(guī)模不斷增大,各類數(shù)據(jù)業(yè)務(wù)數(shù)量日益增多,如果沿用傳統(tǒng)的從硬件到應(yīng)用相互獨(dú)立的煙囪式部署方式,IT設(shè)備采購(gòu)和部署將面臨越來(lái)越大的壓力,各類IT設(shè)備的資源將無(wú)法得到有效利用,資源復(fù)用率低,成本投入浪費(fèi)嚴(yán)重。
在新的全業(yè)務(wù)競(jìng)爭(zhēng)形式及運(yùn)營(yíng)商轉(zhuǎn)型要求下,IT系統(tǒng)仍然面臨極大挑戰(zhàn),在IT支撐建設(shè)轉(zhuǎn)型過(guò)程中,首當(dāng)其沖就是要推動(dòng)IT基礎(chǔ)資源建設(shè)層面的集中化、標(biāo)準(zhǔn)化和簡(jiǎn)化工作。因此網(wǎng)管支撐系統(tǒng)基礎(chǔ)資源池的建設(shè)是非常必要的。
本文就以分析某運(yùn)營(yíng)商網(wǎng)管支撐系統(tǒng)現(xiàn)狀中存在的問(wèn)題為契機(jī),試著就網(wǎng)管支撐系統(tǒng)基礎(chǔ)資源池工程建設(shè)思路及關(guān)鍵技術(shù)進(jìn)行探討,希望本文能起到一個(gè)拋磚引玉的作用,能有效指導(dǎo)類似網(wǎng)管支撐系統(tǒng)基礎(chǔ)資源池工程項(xiàng)目的高效建設(shè)。
運(yùn)營(yíng)商的IT支撐網(wǎng)主要分為BSSOSSMSS三個(gè)支撐系統(tǒng),即業(yè)務(wù)支撐系統(tǒng)、網(wǎng)絡(luò)支撐系統(tǒng)、管理支撐系統(tǒng)。業(yè)務(wù)支撐系統(tǒng)包括CRM、 BOSS、經(jīng)營(yíng)分析、BOMC、呼叫中心平臺(tái)、電子渠道、ESOP、VGOP等;網(wǎng)絡(luò)支撐系統(tǒng)包括話務(wù)、傳輸、數(shù)據(jù)、撥測(cè)等專業(yè)網(wǎng)管、資源、監(jiān)控、信令監(jiān)測(cè)、開(kāi)通激活、運(yùn)維等;管理支撐系統(tǒng)包括統(tǒng)一信息平臺(tái)、ERP等。
IT支撐系統(tǒng)涉及了七大類IT基礎(chǔ)資源(小型機(jī)、存儲(chǔ)、帶庫(kù)、SAN交換機(jī)、網(wǎng)絡(luò)設(shè)備、x86服務(wù)器、系統(tǒng)軟件) 和 應(yīng)用軟件以及配套。
(1)跨項(xiàng)目、跨系統(tǒng)間基礎(chǔ)資源共享調(diào)度難,資源利用率有待進(jìn)一步提升。
跨項(xiàng)目、跨系統(tǒng)目間資源共享、資源調(diào)配在具體流程規(guī)范中操作難度大;基礎(chǔ)資源靈活調(diào)度能力不足,資源動(dòng)態(tài)管理與利用率需進(jìn)一步提升;煙囪式部署方式也帶來(lái)運(yùn)維系統(tǒng)困難,另包機(jī)包系統(tǒng)使維護(hù)人員不斷增加。
(2)涉及項(xiàng)目數(shù)量多、流程重復(fù)工作量大、跨部門(mén)工作效率低。
單系統(tǒng)、單項(xiàng)目推進(jìn),項(xiàng)目數(shù)量眾多;每一個(gè)項(xiàng)目,無(wú)論大小,基礎(chǔ)資源均要經(jīng)歷立項(xiàng)、采購(gòu)、工程設(shè)計(jì)、工程驗(yàn)收及轉(zhuǎn)資等內(nèi)部流程;流程各環(huán)節(jié)重復(fù)工作量大,工作效率低,亟待整合。
(3)設(shè)備供貨、建設(shè)周期長(zhǎng),在業(yè)務(wù)轉(zhuǎn)型階段,投產(chǎn)交付慢,支撐不及時(shí)。
基礎(chǔ)資源系統(tǒng)集采化比例高,集團(tuán)一年一次集采,受集采啟動(dòng)時(shí)間晚、采購(gòu)周期長(zhǎng),到貨時(shí)間晚,機(jī)房條件緊張等因素,影響對(duì)業(yè)務(wù)發(fā)展支撐的及時(shí)性。
網(wǎng)管支撐系統(tǒng)作為IT支撐網(wǎng)三大支撐系統(tǒng)之一的OSS,主要實(shí)現(xiàn)對(duì)綜合性網(wǎng)管(資源、監(jiān)控、開(kāi)通、分析,電子運(yùn)維、網(wǎng)絡(luò)投訴、信令檢測(cè)等)、專業(yè)網(wǎng)管(包括話務(wù)、傳輸、數(shù)據(jù)、WLAN、動(dòng)環(huán)、撥測(cè)、智能巡檢、業(yè)務(wù)質(zhì)量檢測(cè)等)和各廠家自帶的OMC性網(wǎng)管系統(tǒng)相關(guān)的基礎(chǔ)資源類需求支撐。
根據(jù)支撐網(wǎng)各系統(tǒng)數(shù)據(jù)庫(kù)、應(yīng)用、備份部署等擴(kuò)容需求,采購(gòu)各類硬件及第三方軟件,構(gòu)建網(wǎng)管支撐系統(tǒng)基礎(chǔ)資源池,結(jié)合支撐網(wǎng)機(jī)房節(jié)點(diǎn)部署、現(xiàn)網(wǎng)系統(tǒng)硬件資源確定組網(wǎng)架構(gòu)。
在統(tǒng)一架構(gòu)下重點(diǎn)打造“業(yè)務(wù)支撐”、“管理支撐”、“網(wǎng)絡(luò)支撐”三個(gè)子池,每個(gè)池包括主機(jī)、存儲(chǔ)、網(wǎng)絡(luò)、備份、x86五個(gè)邏輯部分,IT支撐網(wǎng)整體采用集中、統(tǒng)一的資源池管理平臺(tái)。
網(wǎng)管支撐系統(tǒng)基礎(chǔ)資源池按“集中池構(gòu)建、動(dòng)態(tài)靈活能力提升、標(biāo)準(zhǔn)服務(wù)能力輸出”三階段規(guī)劃演進(jìn)。
2.3.1 主機(jī)虛擬化技術(shù)
服務(wù)器虛擬化(又稱為計(jì)算系統(tǒng)虛擬化)是指在一臺(tái)物理主機(jī)上虛擬出多個(gè)虛擬機(jī)(Virtual Machine,VM),各個(gè)虛擬機(jī)之間相互隔離,并能同時(shí)運(yùn)行相互獨(dú)立的操作系統(tǒng),這些客戶操作系統(tǒng)(Guest OS)通過(guò)虛擬機(jī)管理器(Virtual Machine Monitor,VMM)訪問(wèn)實(shí)際的物理資源,并進(jìn)行管理。
服務(wù)器虛擬化需要滿足一致性、高效性、可控性。一致性是指程序在虛擬機(jī)上運(yùn)行的效果必須與物理主機(jī)上運(yùn)行的效果一致;高效性是指程序在虛擬機(jī)上運(yùn)行造成的性能代價(jià)較低,亦即要求虛擬機(jī)的大部分指令能夠直接在物理主機(jī)上運(yùn)行;可控性是指虛擬機(jī)管理器能夠完全控制物理主機(jī)的資源,保證虛擬機(jī)之間的獨(dú)立性隔離性,同時(shí)虛擬機(jī)管理器能夠收回已分配給虛擬機(jī)的資源。
服務(wù)器虛擬化的核心是虛擬化平臺(tái)(Hypervisor),分為商業(yè)軟件(VMWare ESXi和Citrix XenServer等)和開(kāi)源軟件(Xen和KVM等)兩大陣營(yíng)。商業(yè)軟件成熟、穩(wěn)定、功能豐富、技術(shù)支持能力強(qiáng),但成本較高;開(kāi)源軟件則以免費(fèi)取勝,產(chǎn)品免費(fèi),雖然仍需支付技術(shù)支持費(fèi)用,總擁有成本仍遠(yuǎn)小于商業(yè)軟件。
2.3.2 存儲(chǔ)虛擬化技術(shù)
云存儲(chǔ)主要有兩大應(yīng)用需求。一是新建存儲(chǔ)資源池,二是整合利舊已有存儲(chǔ)設(shè)備。
新建存儲(chǔ)資源池時(shí),主要采購(gòu)商用存儲(chǔ)產(chǎn)品,總體上可以分為集中式存儲(chǔ)和分布式存儲(chǔ)。集中式存儲(chǔ)按照技術(shù)架構(gòu)可分為SAN和NAS,其中SAN又可細(xì)分為FC SAN、IP SAN、FCoE SAN。目前FC SAN和IP SAN技術(shù)都已比較成熟,F(xiàn)CoE SAN目前還處于發(fā)展初期,分布式存儲(chǔ)也已有不少商用產(chǎn)品和成熟案例,各種存儲(chǔ)產(chǎn)品有其各自的特點(diǎn)和優(yōu)劣勢(shì),適合不同的應(yīng)用場(chǎng)景,應(yīng)結(jié)合具體應(yīng)用需求,綜合考慮性能、價(jià)格等因素進(jìn)行選擇。對(duì)于虛擬機(jī)的鏡像文件,建議采用SAN存儲(chǔ)方式建設(shè)存儲(chǔ)池;對(duì)于虛擬機(jī)的數(shù)據(jù)存儲(chǔ),可綜合考慮性能、成本等因素,選擇SAN存儲(chǔ)或分布式存儲(chǔ)方式建設(shè)存儲(chǔ)資源池。
考慮整合利舊原有存儲(chǔ)資源時(shí),可采用的方式有三種。一是基于主機(jī)的存儲(chǔ)虛擬化,二是基于存儲(chǔ)設(shè)備的存儲(chǔ)虛擬化,三是基于網(wǎng)絡(luò)的存儲(chǔ)整合,即依賴于在存儲(chǔ)網(wǎng)絡(luò)中添加相應(yīng)的虛擬化設(shè)備而實(shí)現(xiàn)對(duì)存儲(chǔ)網(wǎng)絡(luò)中存儲(chǔ)設(shè)備的虛擬化。存儲(chǔ)整合時(shí),需綜合考慮不同方式對(duì)原有存儲(chǔ)數(shù)據(jù)的影響性、存儲(chǔ)池化的成本、以及現(xiàn)有存儲(chǔ)設(shè)備的特點(diǎn)等方面進(jìn)行綜合評(píng)估。
對(duì)為充分利舊原有存儲(chǔ)設(shè)備而整合存儲(chǔ)資源池,目前主要的方式有兩種:
方式一:采用純軟件的方式
方式二:采用在主機(jī)和存儲(chǔ)設(shè)備中增加中間層的方式
對(duì)于不同的方式,需考慮從整合存儲(chǔ)設(shè)備本身的特點(diǎn)、存儲(chǔ)池化的成本、實(shí)施的可操作性等方面進(jìn)行評(píng)估。
2.4.1 實(shí)施部署原則
(1)構(gòu)建池化實(shí)施:物理層面,與現(xiàn)網(wǎng)各類物理資源融合組池,資源池物理層面涵蓋所有支撐系統(tǒng);
(2)應(yīng)用系統(tǒng)分級(jí)部署:邏輯層面,根據(jù)業(yè)務(wù)特性對(duì)應(yīng)用系統(tǒng)進(jìn)行分類分級(jí),依據(jù)“先邊緣,再核心”原則,逐步提升資源池動(dòng)態(tài)、彈性邏輯部署能力;
(3)子池部署場(chǎng)景:小型機(jī)子池重點(diǎn)部署核心數(shù)據(jù)庫(kù)節(jié)點(diǎn)、高計(jì)算需求節(jié)點(diǎn),逐步降低規(guī)模;x86子池重點(diǎn)部署web應(yīng)用,分布式數(shù)據(jù)庫(kù)、接口、邊緣系統(tǒng)等,逐步擴(kuò)大應(yīng)用范圍。
2.4.2 容量管理原則
(1)容量變更:資源池設(shè)備新增、擴(kuò)容、替換需求,根據(jù)“控制總量、優(yōu)化增量、提高質(zhì)量、盤(pán)活存量”的基本原則進(jìn)行評(píng)估;
(2)容量管理模型:從業(yè)務(wù)處理能力(用戶數(shù)、話單數(shù)、業(yè)務(wù)種類、網(wǎng)絡(luò)中各類網(wǎng)元數(shù)量等)、系統(tǒng)處理能力(TPMC、存儲(chǔ)容量等)、服務(wù)水平(穩(wěn)定性、響應(yīng)速度等)三大維度構(gòu)建設(shè)備容量管理指標(biāo)模型,作為相關(guān)容量管理的計(jì)算依據(jù)。
(3)跨部門(mén)職責(zé)分工與協(xié)同:需求、規(guī)劃、生產(chǎn)維護(hù)、工程建設(shè)、采購(gòu)等共同參與協(xié)作。
某市網(wǎng)管機(jī)房由1#、2#、3#、4#機(jī)房等四個(gè)節(jié)點(diǎn)構(gòu)成,設(shè)備網(wǎng)絡(luò)拓?fù)淙缦聢D所示:
通過(guò)前期的網(wǎng)管系統(tǒng)集中備份建設(shè),網(wǎng)管系統(tǒng)目前完成網(wǎng)管集中備份能力建設(shè);建立了網(wǎng)管系統(tǒng)重要性備份恢復(fù)保護(hù)等級(jí)機(jī)制,提升關(guān)鍵系統(tǒng)備份能力;建立了網(wǎng)管集中備份恢復(fù)測(cè)試驗(yàn)證環(huán)境。
從以上網(wǎng)絡(luò)拓?fù)鋱D及運(yùn)營(yíng)商提供的其它資料可以看出網(wǎng)管系統(tǒng)存在的主要問(wèn)題包括機(jī)房分散建設(shè)、單機(jī)房容量過(guò)小、系統(tǒng)設(shè)備分散,基礎(chǔ)設(shè)施整體架構(gòu)設(shè)計(jì)與管理難度比較大;網(wǎng)管支撐系統(tǒng)備份能力不足,備份后未建立規(guī)范的備份恢復(fù)演練流程和工作制度,缺乏恢復(fù)測(cè)試驗(yàn)證環(huán)境,存在備份介質(zhì)無(wú)法恢復(fù)的風(fēng)險(xiǎn);各應(yīng)用軟件升級(jí)上線前測(cè)試不足。
工程應(yīng)用中該網(wǎng)管支撐系統(tǒng)基礎(chǔ)資源池的建設(shè)共納入綜合性網(wǎng)管、專業(yè)網(wǎng)管和廠商自帶設(shè)備網(wǎng)管OMC的基礎(chǔ)資源類需求,根據(jù)“控制總量、優(yōu)化增量、提高質(zhì)量、盤(pán)活存量”的基本原則進(jìn)行建設(shè)。
根據(jù)業(yè)務(wù)測(cè)算綜合性網(wǎng)管資源最終確定增加主機(jī)處理能力共2000萬(wàn)TPMC,增加存儲(chǔ)裸容量120TB;專業(yè)網(wǎng)管系統(tǒng)資源增加主機(jī)處理能力共500萬(wàn)TPMC,增加存儲(chǔ)裸容量40TB;網(wǎng)管OMC系統(tǒng)資源增加主機(jī)處理能力共300萬(wàn)TPMC;增加存儲(chǔ)裸容量10TB。合計(jì)增加主機(jī)處理能力共2800萬(wàn)TPMC,增加存儲(chǔ)裸容量170TB。
根據(jù)上述測(cè)算結(jié)果,該網(wǎng)管支撐系統(tǒng)基礎(chǔ)資源池新增10臺(tái)小型機(jī)設(shè)備,共新增處理能力2800萬(wàn)TPMC,新增96臺(tái)X86服務(wù)器以滿足X86資源池(包含路測(cè)服務(wù)器、網(wǎng)絡(luò)優(yōu)化、專業(yè)網(wǎng)管采集機(jī)、WLAN采集機(jī)、信令監(jiān)測(cè)、聯(lián)機(jī)指令網(wǎng)絡(luò)激活、測(cè)試服務(wù)器、家庭網(wǎng)關(guān)及集客IMS管理平臺(tái)、網(wǎng)絡(luò)投訴平臺(tái)、智能巡檢、業(yè)務(wù)開(kāi)通)需求。新增1套磁盤(pán)陣列,裸容量為140TB;同時(shí)對(duì)現(xiàn)網(wǎng)一套磁盤(pán)陣列進(jìn)行擴(kuò)容,新增30TB裸容量。
該期網(wǎng)管支撐系統(tǒng)基礎(chǔ)資源池的改造建設(shè)最少能滿足今后5-10年的發(fā)展,依據(jù)上述的基礎(chǔ)資源池部署和管理思路進(jìn)行集約化建設(shè)可使人力、硬件等相關(guān)成本節(jié)約30%以上,社會(huì)效益和經(jīng)濟(jì)效益明顯。
一方面,網(wǎng)管支撐系統(tǒng)基礎(chǔ)資源池的建設(shè)涉及到眾多廠家的服務(wù)器、磁盤(pán)陣列、帶庫(kù)等硬件設(shè)備,在項(xiàng)目建設(shè)過(guò)程中設(shè)備的選型、軟硬件兼容性、系統(tǒng)的升級(jí)維護(hù)等問(wèn)題都有可能對(duì)整個(gè)項(xiàng)目建設(shè)產(chǎn)生影響,因此,要做好基礎(chǔ)資源池項(xiàng)目建設(shè)的風(fēng)險(xiǎn)因素分析,盡量避免項(xiàng)目建設(shè)中各種潛在問(wèn)題的發(fā)生,將項(xiàng)目建設(shè)的風(fēng)險(xiǎn)最小化。另一方面,建立運(yùn)營(yíng)商的網(wǎng)管支撐系統(tǒng)基礎(chǔ)資源池系統(tǒng),通過(guò)大規(guī)模集中采購(gòu)、建設(shè)和維護(hù)IT基礎(chǔ)設(shè)施,并借助虛擬化和云計(jì)算等新技術(shù)帶來(lái)的優(yōu)勢(shì),可逐步實(shí)現(xiàn)進(jìn)一步降低整體IT系統(tǒng)的建設(shè)和運(yùn)營(yíng)成本,加快應(yīng)用部署快速目標(biāo)的實(shí)現(xiàn)。
在新的全業(yè)務(wù)競(jìng)爭(zhēng)形式和運(yùn)營(yíng)商轉(zhuǎn)型要求下,IT系統(tǒng)建設(shè)仍然面臨極大挑戰(zhàn),在IT支撐系統(tǒng)建設(shè)轉(zhuǎn)型過(guò)程中,最關(guān)鍵就是要推動(dòng)IT基礎(chǔ)資源建設(shè)層面的集中化、標(biāo)準(zhǔn)化和簡(jiǎn)單化工作。因此引入主機(jī)虛擬化技術(shù)、存儲(chǔ)虛擬化技術(shù)等關(guān)鍵技術(shù)及“集中池構(gòu)建、動(dòng)態(tài)靈活能力提升、標(biāo)準(zhǔn)服務(wù)能力輸出”的建設(shè)思路對(duì)今后網(wǎng)管支撐系統(tǒng)基礎(chǔ)資源池的集約化建設(shè)是非常必要的。