梁芳 佟恬 馬賀榮 曹暢
(1. 中國聯(lián)合網絡通信有限公司研究院,北京100048;2.山東港口煙臺港股份有限公司礦石碼頭分公司,煙臺 264004)
隨著數字經濟的快速發(fā)展,數據作為核心要素,對其承載和處理的需求高速增長。算力作為數據處理能力,迎來了大規(guī)模發(fā)展時期,成為數字經濟的重要生產力和重要載體。但我國存在東西部算力資源與供需不平衡的問題,影響了我國區(qū)域發(fā)展、產業(yè)發(fā)展、能源發(fā)展,掣肘了我國數字經濟的高速均衡發(fā)展,因此,“東數西算”工程成為我國數字經濟高質量發(fā)展的必然要求。本文對東數西算下算網建設的具體需求進行了分析,提出了 CUBE-Net 3.0 算力網絡架構,并對下一步算力網絡發(fā)展給出了建議。
隨著東數西算工程的實施,用戶側的需求是面向體驗結果的需求,即無論身處何處都能獲得及時、可靠、高性能的算力服務,而對算力提供地點、算力服務底層技術等要求并不太關心。這實際上是要求網絡基礎設施側能提供“高速路”“多服務”“一體化”的能力,主要是高速泛在、高可靠、低時延通信網絡、多樣化算力云資源接入要求和一體化算網協(xié)同調度要求,具體如下。
由于我國東西部將產生大量的交互和跨域流量,因此對東數西算工程的基礎設施即通信網絡建設提出以下要求。
(1)“寬”道路
在數據中心建設中,呈現了東部DC以服務本區(qū)域算力需求為主、西部DC以服務全國算力需求為主的特征,產生大量跨省流量,出省帶寬比例高,預計在完成東數西算規(guī)劃中的機架數時,我國骨干網傳輸帶寬需求將達到現有運營商骨干帶寬的3 倍左右,東西部的骨干網帶寬將達到2 000 T以上。因此,對我國通信網絡“高速路”建設的帶寬流量提出了較高的要求。
(2)“快”物流
時延是影響用戶算力服務體驗的關鍵因素之一,不同類型的算力服務對時延要求不同。根據各類算力業(yè)務的時延需求,可分為熱業(yè)務(低時延業(yè)務)、溫業(yè)務(時延相對敏感業(yè)務)和冷業(yè)務(時延不敏感、數據讀寫頻度較低)三類。由于不同業(yè)務對時延要求的不同,東數西算工程的部署應能按照不同的業(yè)務需求進行不同網絡SLA的配置,實現網絡“高速路”快慢車道的有效劃分,完成網絡資源的合理利用,推動東數西存(東部熱點區(qū)域完成數據計算、西部進行備份存儲)、東數西訓(東部部署算法倉庫、西部完成離線大數據分析)、實時性要求不高的業(yè)務部署于西部節(jié)點。
(3)“零”丟損
通常來說,數據中心內部網絡的可靠性遠高于長途網絡的可靠性,但東數西算的一些業(yè)務場景,如多云協(xié)同、存算分離、業(yè)務遠程集約化部署等,將本屬于數據中心內部的網絡連接,或者城域、區(qū)域內的連接,擴展為長途傳輸連接,并由于開銷的代價,對長距離傳輸的網絡可靠性提出更為嚴苛的要求,包括網絡無故障、無丟包、無突發(fā)擁塞、故障快速自愈、網絡性能確定(路由、時延、帶寬等)等方面。
(4)“低”成本
東數西算工程推動了東西部向長途傳輸需求的高速增長,但“舍近求遠”的網絡線路的搭建,提高了身處東數西算上下游企業(yè)的運營成本,暫不能滿足企業(yè)“降本增利”的思路和用戶側“高性價比”的需求。因此,建議采取多方面措施以降低網絡建設和運營成本。
搭建了“高速路”的基礎能力,面向多樣云資源能力等算力服務,需要能夠滿足多樣化算力云資源接入能力。對網絡的需求主要為以下兩個方面:一是客戶入云的需求,包括終端客戶訪問云端資源、獲取云端算力服務的需求,云租戶接入云資源池,對云上應用和業(yè)務進行運營和維護的需求,算力設施服務商接入云資源池,對算力設施進行運營和維護的需求等;二是數據中心間或云間互聯(lián)的需求,其中云間互聯(lián)需求包括公有云內部互通、混合云間互通、多公有云間互通、數據遷移與備份等。
實現了基礎能力和多樣服務,需要建立一體化機制充分發(fā)揮能力,因此東數西算工程的實施對網絡的智能管控和統(tǒng)一協(xié)同調度服務能力提出了更高要求。實現跨網、跨地區(qū)、跨企業(yè)的算力高效調度,需要智能、感知、靈活、確定的網絡支撐,網絡需要基于算力和網絡的全局資源視圖,根據網絡部署狀況進行全局的編排調度。
(1)實現對全局算力資源的自動感知,按需自動創(chuàng)建面向應用的全局多級算力資源自動分配調度、算網一體化服務編排、動態(tài)彈性算力和網絡資源的協(xié)同調整。
(2)可編程的調度和協(xié)同服務,主要包括多云之間、云和數據中心之間資源調度,跨行業(yè)、跨地區(qū)、跨層級的算力資源調度;跨域專線業(yè)務開通等一鍵式開通,其中云間協(xié)同服務要求網絡能夠智能、自動、實時感知應用,并基于需求提供靈活、實時、可靠的全局可編程的調度和協(xié)同服務。
根據上述“東數西算”工程對通信網絡和算力服務的需求分析,網絡需要整合不同類型算力資源,根據業(yè)務場景特點,通過調度平臺按需統(tǒng)一調度,滿足業(yè)務對多種算力協(xié)同、多云協(xié)同的應用需求。上述復雜的應用場景對算力調度的要求更高,涉及全局資源感知、資源采集、統(tǒng)一管控、統(tǒng)一注冊/建模/度量、最優(yōu)化靈活調度、計費與結算、生命周期管理等多方面。因此,算力網絡是實現東數西算戰(zhàn)略的重要承載方式。
2019年,我國提出了“算力網絡”的概念[1]。算力網絡是指在計算能力不斷泛在化發(fā)展的基礎上,通過網絡手段將計算、存儲等基礎資源在云—邊—端之間進行有效調配的方式,以此提升業(yè)務服務質量和用戶的服務體驗,超前的概念實現了與東數西算戰(zhàn)略的契合,加速東數西算戰(zhàn)略落地。同時,東數西算的戰(zhàn)略提出也為算力網絡的發(fā)展注入深場景和大意義,行業(yè)內加速了算力網絡技術的研究,并在國內外取得了顯著的進展[5-9]。
在國際,以運營商和華為技術有限公司為代表在IETF開展了Computing First Network Framework系列研究,在ETSI和BBF(寬帶論壇)上分別啟動了NFV-EVE 020和SD-466項目的研究;在ITU-T,中國電信聯(lián)合中國聯(lián)通在SG13組發(fā)布了Y.2501,同時中國聯(lián)通和中國移動分別牽頭啟動了Q.CPN、Y.A SA-CPN、Q.BNG-INC與Y.CAN等 SG1和SG13組的相關標準制定。
圖1 CUBE-Net 3.0頂層架構圖
在國內,CCSA方面,三大運營商聯(lián)合開展算力網絡系列標準研究,開展包括算力網絡需求與架構、算力路由協(xié)議技術、算力網絡標識解析技術、算力網絡控制器技術、算力網絡交易平臺技術、算力網絡管理與編排技術、算力度量與算力建模技術等全方位的標準技術研究工作,有力地推動了算力網絡的技術發(fā)展。
算力網絡是面向承載網算網融合演進的新型網絡架構,通過算力資源與網絡資源的協(xié)同調度,將不同應用的業(yè)務請求通過最優(yōu)路徑調度到最優(yōu)的計算節(jié)點,實現用戶體驗最優(yōu)的同時,保證網絡資源和計算資源利用率最優(yōu)化。面向東數西算的建設需求,本文提出了新的算力網絡架構設計思路,即基于第三代面向云的無處不在的寬帶彈性網絡(Cloud-oriented Ubiquitous Broadband Elastic Network 3.0,CUBE-Net 3.0),通過“聯(lián)接+計算”的算網一體理念,以云網為基、數智為核,實現算網聯(lián)動,融入云原生、邊緣計算、人工智能、區(qū)塊鏈、內生安全、確定性等新技術元素,打造了新一代數字基礎設施建設[1-3],實現不同技術和產業(yè)要素的深度融合,加速東數西算戰(zhàn)略的落地。圖1為CUBE-Net 3.0 頂層架構圖。
(1)打造全光底座的算力承載底座
構建“ROADM+OTN”光電雙平面立體架構,形成覆蓋國家樞紐的“5+4+31+X”的云—網—邊一體化算網布局,打造架構領先、體驗領先、運力充沛、智能開放的全光傳送底座。從帶寬驅動的管道網絡向體驗驅動的全光算力網絡演進,強化大帶寬、低時延、高可靠、高安全的算力輸送服務能力,提供高速泛在、靈活接入,實現一跳入算,為東數西算算力資源通信服務提供高質量運力保障,降低了傳輸時延,提升了傳輸效率,筑基了高速泛在低時延的算力底座。
(2)構建IPv6+的算網架構
以用戶為中心和以支持IPv6協(xié)議的網絡全面部署為基礎,開展“IPv6+”新技術研究加速網絡演進,打造低時延、廣聯(lián)接、智能化、便捷化的云—網—邊多級算力接入的IP承載網,擴展了SRv6段路由標識(SID)功能,構建了云—網—邊一體的可編程服務(SID as a Service)體系,使能了新型組播 (BIERv6)、VPN+切片、服務功能鏈(SFC)、隨流檢測(iFIT)、應用感知網絡(APN6)等IPV6+承載技術,具備了承載能力、調度能力、感知能力和運維能力,踐行了“轉發(fā)融合,管控分離,一體編排”算網一體架構,實現了多樣算力接入的能力。
(3)實踐面向云—網—邊一體的算力網絡智能調度體系
基于面向云—網—邊一體的算力網絡管理編排體系,構建算網一體化調度平臺,實現算網統(tǒng)一管控,協(xié)同編排和靈活調度,支持公有云、私有云以及端到端網絡的一體化編排調度能力。具備在云—網—邊之間按需分配和智能調度計算資源、存儲資源以及網絡資源的能力,滿足不同計算場景對帶寬、延遲、算力等的需求,提供了隨需可調、場景多樣、質量感知一體化算力服務協(xié)同調度能力。
目前,在行業(yè)內的共同努力下,我國算力網絡發(fā)展取得一定先發(fā)優(yōu)勢,為東數西算工程建設貢獻了力量,但仍存在算力供給不足、算力需求有待激發(fā)、創(chuàng)新研發(fā)不足、算網產業(yè)融合不深等發(fā)展難題。因此,建議繼續(xù)從優(yōu)化算網布局、提升算網資源效率、增強算網管控與編排、保障算網安全等方面進行提升,從而進一步面向東數西算深場景開發(fā),促進我國數字經濟發(fā)展。
隨著全國一體化大數據中心體系規(guī)劃布局的完成,樞紐節(jié)點將作為我國算力網絡的骨干連接點,發(fā)展數據中心集群,開展數據中心與網絡、云計算、大數據之間的協(xié)同建設,并作為國家“東數西算”工程的戰(zhàn)略支點,推動算力資源有序向西轉移,促進解決東西部算力供需失衡問題。但我國運營商骨干網的核心節(jié)點和骨干節(jié)點主要在省會城市及部分重點城市,需經省會等骨干節(jié)點轉接到部分國家算力節(jié)點,增加了傳輸時延。因此,需要運營商側進一步進行骨干網絡的結構調整和優(yōu)化,并對光纜網絡的路由和傳輸承載網絡的組網結構進行優(yōu)化,減少數據在網絡上的繞轉和轉發(fā)時延,縮短網絡傳輸時延,解決供給側的根本問題,從而催生多云協(xié)同、存算分離、云邊協(xié)同等創(chuàng)新服務模式,促進東數西算堅實落地。
算網深度融合階段為算力感知網絡,即通過無所不在的網絡連接分布式計算節(jié)點,實現服務的自動化部署、最優(yōu)路由和負載均衡,從而構建可以感知算力的全新網絡基礎設施,保證網絡能夠按需、實時調度不同位置的計算資源,提高網絡和計算資源利用率。為實現這一階段,需要全行業(yè)上下游產業(yè)的配合,如何從供給側推動產業(yè)協(xié)同,仍需在“降本增效”上進行探索,一方面運營商需要采取措施多方面降低網絡建設和運營成本,從而降低網絡帶寬租用成本;另一方面需要通過智能管控系統(tǒng)提供業(yè)務按需開通、帶寬按需動態(tài)調整等靈活的短租網絡連接服務,提高網絡利用效率。因此,算網產業(yè)協(xié)同發(fā)展將為東數西算大產業(yè)協(xié)同發(fā)展提供有力的能量。
算網管控與編排是“五數”體系中“數紐”層著力要解決的問題,也是實現東數西算工程總體目標的重要基礎能力。在東數西算業(yè)務場景的驅動下,云邊算趨向泛在化,網絡更加扁平化、靈活化、服務化,需要進一步加強技術創(chuàng)新內驅力,破解算力度量、算力編排與調度等難題,通過IPv6+、AI、邊緣計算、區(qū)塊鏈等技術對業(yè)務、算力資源和網絡資源的協(xié)同感知,將業(yè)務按需調度到合適的節(jié)點,為算網資源綜合最優(yōu)、高效調度打基礎,實現面向算網一體的算力網絡編排調度體系的研發(fā),并能聯(lián)合業(yè)界內各方力量共同研究、共同推動,探索出實現算網管控與編排的協(xié)調調度機制。
隨著當前國際局勢的變化,網絡安全已成為我國發(fā)展的重要課題。在東數西算下,海量數據在跨域流通時,面臨著更嚴峻的網絡安全風險,現有的外掛式安全體系難以滿足“東數西算”工程的安全需求,應積極研發(fā)新型安全技術體系或架構,基于網絡內生安全技術,在網絡層提供高水平的網絡安全體系,避免基于網絡對算力系統(tǒng)、應用和數據的攻擊,提高安全保障和服務能力。但構建自感知、自免疫、按需分配的網絡內生安全能力現仍為前沿技術能力,尚需產業(yè)界共同努力以盡快實現網絡內生安全技術的產業(yè)化,從而作為算網安全的根本內生能力,全力保障“東數西算”工程安全運行。
以5G為代表的新一代信息技術的快速迭代,帶領各行業(yè)數字化轉型的快速升級,全社會數據總量爆發(fā)式增長,數據資源存儲、計算和應用需求大幅提升,內在促生了東數西算戰(zhàn)略工程,算力網絡架構及體系天然適合作為東數西算工程的具體解決思路。同時,由于東數西算工程實施及其應用場景也對算力網絡提出了一些需求,作為設計思路,本文闡述了CUBE-Net 3.0算力網絡創(chuàng)新體系。未來,建議從優(yōu)化算網布局、提升算網資源效率、增強算網管控與編排、保障算網安全方面加強,助力東數西算的下一階段發(fā)展,全面推動數字經濟的持續(xù)健康發(fā)展。