袁 林,蔡 超,黃庠奇(.中國聯(lián)通重慶分公司,重慶 40;.中國聯(lián)通網(wǎng)絡(luò)技術(shù)研究院,北京 00048)
隨著2019 年6 月6 日5G 商用牌照的正式發(fā)放,我國進(jìn)入5G 商用階段。5G 時(shí)代使用的無線頻率高,相比4G 時(shí)代單個(gè)基站的覆蓋減小,為了滿足覆蓋需求,基站將會(huì)非常密集,網(wǎng)元數(shù)幾倍乃至幾十倍的增量為運(yùn)營商的運(yùn)維工作帶來了巨大的挑戰(zhàn),相比4G時(shí)代網(wǎng)絡(luò)復(fù)雜性提升了一個(gè)數(shù)量級(jí)。另一方面,5G時(shí)代帶來的不僅僅是網(wǎng)絡(luò)架構(gòu)的變化,更是業(yè)務(wù)形態(tài)的變化。5G通過靈活的網(wǎng)絡(luò)切片滲透到網(wǎng)絡(luò)社會(huì)的各個(gè)角落,使能各種差異化的新業(yè)務(wù),包括高清視頻、車聯(lián)網(wǎng)、工業(yè)物聯(lián)網(wǎng)等,成為垂直行業(yè)數(shù)字化轉(zhuǎn)型的利器和未來萬物互聯(lián)數(shù)字社會(huì)的基石。
面對(duì)網(wǎng)絡(luò)全云化,控制面、用戶面分離的分布式網(wǎng)絡(luò)架構(gòu)演進(jìn),網(wǎng)絡(luò)運(yùn)維在5G 時(shí)代會(huì)面臨較大的挑戰(zhàn),電信運(yùn)營商需要通過運(yùn)維轉(zhuǎn)型來提升網(wǎng)絡(luò)運(yùn)維效率,降低網(wǎng)絡(luò)運(yùn)維成本。
5G 時(shí)代云網(wǎng)絡(luò)運(yùn)維的對(duì)象從傳統(tǒng)的專用設(shè)備轉(zhuǎn)變成基于NFV 的分層網(wǎng)元。圖1 簡單地描述了NFV的分層結(jié)構(gòu)。
NFV 網(wǎng)絡(luò)的3 層架構(gòu)包括上層的VNF 層,功能與傳統(tǒng)的CT 網(wǎng)元功能一樣;中間層的Cloud OS,實(shí)現(xiàn)向上提供基礎(chǔ)資源,向下管理通用硬件;下層的通用硬件層,包括物理的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源。
圖1 傳統(tǒng)CT設(shè)備與NFV分層結(jié)構(gòu)對(duì)比
NFV 的各層之間是解耦的,解耦方式如圖2所示。其中“完全解耦”是NFV 發(fā)展的方向和業(yè)界趨勢,運(yùn)營商可以擺脫對(duì)個(gè)別廠家的依賴,降低網(wǎng)絡(luò)建設(shè)成本。“完全解耦”部署和維護(hù)較復(fù)雜,但資源可以做到統(tǒng)一管理和調(diào)度,其最根本特征是各層間使用標(biāo)準(zhǔn)接口,但當(dāng)前協(xié)議和標(biāo)準(zhǔn)進(jìn)展緩慢。
面臨NFV 分層解耦的場景,傳統(tǒng)的核心網(wǎng)工程師難以獨(dú)立運(yùn)維如此復(fù)雜的系統(tǒng),所以運(yùn)維轉(zhuǎn)型就成為運(yùn)營商要探討的一個(gè)重要課題。
圍繞5G時(shí)代云化網(wǎng)絡(luò)運(yùn)維轉(zhuǎn)型,下面將從業(yè)務(wù)與基礎(chǔ)設(shè)施分層運(yùn)維、維護(hù)團(tuán)隊(duì)人員融合、集中監(jiān)控以及自動(dòng)化智能化運(yùn)維4個(gè)方面進(jìn)行分析和探討。
如圖3 所示,當(dāng)前的運(yùn)維模式有3 種:統(tǒng)一運(yùn)維、分層運(yùn)維和統(tǒng)一管理、分層運(yùn)維管理。
在運(yùn)營商云化轉(zhuǎn)型初始階段,對(duì)于少量NFV 新建或者替換場景,由于NFVI 運(yùn)維工作量較小而不必要設(shè)置專職的I 層工程師,如果沒有相應(yīng)的規(guī)劃,運(yùn)營商通常會(huì)選擇模式1,由傳統(tǒng)的核心網(wǎng)工程師掌握NFVI的技能,統(tǒng)一負(fù)責(zé)VNF和NFVI的運(yùn)維。
對(duì)于云化部署模式,因?yàn)镹FVI 運(yùn)維工作量增加,需要有專職的NFVI 運(yùn)維工程師來負(fù)責(zé)這部分的運(yùn)維工作,而VNF 運(yùn)維依舊由傳統(tǒng)的核心網(wǎng)工程師來負(fù)責(zé),即分層運(yùn)維。但是在管理層面,可以選擇由核心網(wǎng)統(tǒng)一負(fù)責(zé)問題和變更的管理,或者分別由各自的團(tuán)隊(duì)來負(fù)責(zé)管理(此種情況就要面臨如何協(xié)同管理VNF和NFVI的問題)。
從NFV 長期發(fā)展的角度來看,分層運(yùn)維是一個(gè)大的趨勢。將NFV 運(yùn)維團(tuán)隊(duì)分為業(yè)務(wù)管理、運(yùn)行維護(hù)團(tuán)隊(duì)、基礎(chǔ)設(shè)施管理和運(yùn)維團(tuán)隊(duì),人員分工和技能更為聚焦和專業(yè),能力繼承性好,維護(hù)效率更高(見圖4)。
隨著云化技術(shù)的發(fā)展,未來NFV 的私有云需要滿足電信5 個(gè)9 的可靠性要求。作為VNF 運(yùn)維工程師,需要關(guān)注上層業(yè)務(wù)的快速部署和故障處理,而不必關(guān)心下層使用的Cloud OS 是FS、Redhat Openstack 或者是Vmware。當(dāng)業(yè)務(wù)出現(xiàn)故障的時(shí)候,VNF工程師很容易通過上下層系統(tǒng)接口的狀態(tài)監(jiān)控來判斷是否是下層出現(xiàn)了問題,快速通知NFVI 團(tuán)隊(duì)進(jìn)行問題處理。而對(duì)于專業(yè)的NFVI 運(yùn)維工程師來說,只需專注于Cloud OS 和硬件資源的運(yùn)維,確??梢詾樯蠈訕I(yè)務(wù)提供充足可靠的資源,在這種情況下可做到電信云和IT云統(tǒng)一運(yùn)維,隨著云規(guī)??焖贁U(kuò)大,I 層的運(yùn)維效率也會(huì)得到很大提高,甚至可向互聯(lián)網(wǎng)廠商進(jìn)一步看齊。
圖3 當(dāng)前可見的3種運(yùn)維模式
圖4 NFV分層運(yùn)維模式轉(zhuǎn)變
在網(wǎng)絡(luò)云化場景下增加了NFVI 的運(yùn)維,會(huì)要求維護(hù)團(tuán)隊(duì)要有具備I 層運(yùn)維能力的工程師,即經(jīng)常提到的ICT 融合。按照當(dāng)前的情況,運(yùn)營商面臨要求每個(gè)工程師進(jìn)行相應(yīng)的ICT 技能融合,還是把CT 工程師和IT工程師進(jìn)行人員的融合的問題。
先討論技能融合。當(dāng)前NFV 主要應(yīng)用還是核心網(wǎng)場景,核心網(wǎng)按照業(yè)務(wù)可以分為CS和PS,CS業(yè)務(wù)包含固網(wǎng)NGN、移動(dòng)核心網(wǎng)CS、IMS 等,PS 業(yè)務(wù)包含USN、UGW、IGW、HSS 等。目前負(fù)責(zé)核心網(wǎng)運(yùn)維的工程師一般都是CS 和PS 分開設(shè)立的。CT 和IT 相比,二者之間的差別比較大,在當(dāng)前情況下要求一個(gè)核心網(wǎng)工程師去熟練掌握NFVI 的運(yùn)維是非常困難的。如果在NFV 運(yùn)維場景下,要求核心網(wǎng)工程師去掌握NFVI的運(yùn)維技能,基本上就是要求其具備5 級(jí)工程師的技能水平。從運(yùn)維成本和效率的角度來看,這種融合的方式并不是最優(yōu)的方案。
再看人員融合的方案,按照NFV 的分層解耦,上層的VNF 和之前傳統(tǒng)核心網(wǎng)網(wǎng)元的功能一樣,這部分的運(yùn)維仍然由傳統(tǒng)的核心網(wǎng)工程師來負(fù)責(zé);下層NFVI的運(yùn)維是新引入的,同IT 產(chǎn)品運(yùn)維相似,運(yùn)維就由專職的IT 工程師來負(fù)責(zé)。這種情況對(duì)當(dāng)前工程師來說轉(zhuǎn)型的難度較小,但是在遇到跨層問題的時(shí)候,如果VNF 層和NFVI 工程師互相不了解,就會(huì)帶來故障難以定界的問題,這時(shí)候就還是需要有融合VNF 和NFVI技能的專家工程師來協(xié)助解決故障。
所以,綜合起來看,VNF 和NFVI 人員的融合是比較適合的方案,可以保持較高的運(yùn)維效率;同時(shí)依然需要高級(jí)別工程師在技能上也做到VNF 和NFVI 的融合。
對(duì)于傳統(tǒng)核心網(wǎng)工程師,圖5 描述了建議的專業(yè)技能融合方向。
對(duì)于有志于向ICT 運(yùn)維專家發(fā)展的工程師來說,圖6 中包含的四大領(lǐng)域6 個(gè)能力模塊都是需要學(xué)習(xí)和發(fā)展的。
圖5 傳統(tǒng)核心網(wǎng)工程師專業(yè)技能融合方向
圖6 ICT運(yùn)維專家能力模型
在運(yùn)維活動(dòng)中,告警、性能和日志的監(jiān)控處理是非常重要的日?;顒?dòng)。在NFV 分層解耦的場景,每一層都有獨(dú)立的監(jiān)控工具。例如華為的產(chǎn)品,VNF 層使用EMS(U2000),NFVI 有FusionSphere OpenStack OM,v-center,硬件層有eSight。因?yàn)檫\(yùn)維入口數(shù)量較多,運(yùn)維工程師要頻繁切換運(yùn)維工具。在故障處理,特別是跨層故障定界定位時(shí),由于各個(gè)運(yùn)維平臺(tái)的不統(tǒng)一,會(huì)帶來極大的困難。
因此,在NFV 場景下,集中的監(jiān)控運(yùn)維平臺(tái)也會(huì)提升運(yùn)維效率。目前華為可以提供小閉環(huán)和大閉環(huán)的集中監(jiān)控運(yùn)維方案,分別針對(duì)華為VNF 的場景和多廠家分層運(yùn)維的場景(見圖7)。其他廠家也有類似的方案,實(shí)現(xiàn)NFV分層解耦情況下的集中監(jiān)控。
傳統(tǒng)的CT 運(yùn)維基本上依賴于工程師的經(jīng)驗(yàn)和技能,自動(dòng)化程度很低,更不要提智能化。目前運(yùn)營商和設(shè)備商都普遍認(rèn)同網(wǎng)絡(luò)全面云化后,面對(duì)海量的運(yùn)維數(shù)據(jù),傳統(tǒng)人工的運(yùn)維方式已無法滿足NFV 運(yùn)維的需求。電信運(yùn)營商需要參考IT 互聯(lián)網(wǎng)運(yùn)維,利用大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等技術(shù)實(shí)現(xiàn)運(yùn)維自動(dòng)化和智能化。
NFV 場景跨層告警關(guān)聯(lián)就是一個(gè)自動(dòng)化和智能化的實(shí)例,通過機(jī)器學(xué)習(xí)對(duì)海量告警數(shù)據(jù)的分析,可以自動(dòng)梳理出NFVI 告警和VNF 告警的關(guān)聯(lián)關(guān)系,再把這些關(guān)聯(lián)關(guān)系作為規(guī)則,EMS 或者IES 系統(tǒng)可以自動(dòng)對(duì)告警進(jìn)行關(guān)聯(lián)和壓縮。通過這種方式,運(yùn)維工程師可以比較快速地查找到根因告警(見圖8)。
目前NFV 自動(dòng)化和智能化運(yùn)維處在起步階段,與互聯(lián)網(wǎng)廠商的自動(dòng)化和智能化相比還有很長的路要走,這個(gè)也是未來NFV運(yùn)維解決方案開發(fā)的重點(diǎn)。
網(wǎng)絡(luò)云化是5G發(fā)展的基礎(chǔ),電信網(wǎng)絡(luò)將會(huì)面臨前所未有的發(fā)展契機(jī),而中國目前正處于5G發(fā)展的啟動(dòng)期。盡管運(yùn)營商在5G 網(wǎng)絡(luò)部署和運(yùn)營過程中會(huì)面臨各種挑戰(zhàn),但是5G網(wǎng)絡(luò)的靈活切片能力和對(duì)垂直行業(yè)數(shù)字化、智能化改造的強(qiáng)大潛力將給運(yùn)營商帶來更大的機(jī)遇。電信運(yùn)營商需要積極推進(jìn)運(yùn)維轉(zhuǎn)型,加大力度構(gòu)建云化網(wǎng)絡(luò)運(yùn)維能力,提升運(yùn)維效率,為即將到來的5G市場快速發(fā)展期打下良好基礎(chǔ)。
圖7 華為小閉環(huán)和大閉環(huán)的集中監(jiān)控運(yùn)維方案
圖8 NFV場景下自動(dòng)化跨層告警關(guān)聯(lián)示例