陳新宇 王衛(wèi)斌 郭雪峰 朱 堃 何 偉
中興通訊股份有限公司 南京 210012
算網基礎設施與業(yè)務交織發(fā)展互相促進。算力和網絡技術創(chuàng)新是應用創(chuàng)新的基礎和使能條件,新型應用的快速發(fā)展又對算網基礎技術提出挑戰(zhàn)和需求。
當前,算力正在從通用計算向異構計算、泛在計算發(fā)展,高帶寬廣覆蓋的雙千兆網絡基本建成并向智能、開放發(fā)展。但同時存在資源割裂、利用率不高、與應用需求不匹配等問題。
因此,有必要研究算網一體關鍵技術,通過網絡將分散的算力、存儲以及網絡資源連接起來,基于應用需求實現一體化調度,最大化賦能應用創(chuàng)新,提升資源利用率。
視頻業(yè)務是當前最活躍也是最有發(fā)展前景的業(yè)務之一,據統計預測,視頻流量在整個IP流量的占比不斷上升,2025年將達到80%以上。視頻業(yè)務正在全面滲透到生活、生產的各個領域,并成為未來元宇宙、數字孿生超視頻時代的核心業(yè)務。
云游戲業(yè)務未來發(fā)展空間巨大,游戲+技術是元宇宙六大技術之一。而制約云游戲業(yè)務發(fā)展的問題之一是終端設備體驗差且存在笨、貴、耗電等問題,如果將算力消耗大的視頻編解碼、視頻渲染從終端遷移到邊緣或云端,同時網絡對端側到邊緣、云端的連接進行低時延、高帶寬保障,就可以在確保游戲效果的前提下采用輕量化終端降低成本提升體驗。同樣,家庭視頻類應用也一直受到終端算力的限制,為了推廣新業(yè)務,有時不得不大范圍進行機頂盒等終端替換,成本極高。如果基于網絡傳輸保障,將大部分計算遷移到云端,實現終端云化、存儲上云、應用在云,就可以突破終端算力瓶頸,實現業(yè)務快速靈活上線開通。
視頻應用正在快速進入生產現場,通過對現場視頻的實時采集、處理分析來操控PLC(Programmable Logic Controller)提升生產效率。工業(yè)生產對實時性、確定性要求很高,同時還要確保數據的隱私和安全,采用加密計算和傳輸,往往要求多種算力及確定性網絡協同運作。文獻[1]中提出為滿足視頻應用需求,需要在云邊、邊邊之間計算、網絡資源協同,部署不同種類算力,如計算增強型、GPU渲染增強型、存儲增強型等多種算力,根據應用需求以及算力分布實現算網一體協同。在視頻監(jiān)控場景,高清攝像頭要求上行帶寬在2Mb/s,超高清攝像頭要求不低于4Mb/s,而部分工業(yè)高清攝像頭要求高達50Mb/s。視頻分辨率和幀率的提升,會帶來壓縮算力及存儲算力的爆發(fā)式增長,利用算網一體技術將冷數據調度到云端或西部數據中心,本地只保留少量熱數據,既可滿足業(yè)務需求又可以降低成本,節(jié)能減排。
沉浸式多媒體業(yè)務是指能為用戶提供高逼真度體驗的多媒體業(yè)務。文獻[2]定義了6G沉浸式多媒體業(yè)務,是指支持Tb/s級超高帶寬、亞毫秒級超低時延的高可靠沉浸式多媒體業(yè)務,包括沉浸式XR、全息通信等業(yè)務類型,可廣泛用于辦公、醫(yī)療、社交、游戲、生產等場景。在算力需求上,包括視頻編解碼、視頻渲染、視頻分析、視頻存儲分發(fā)、視頻顯示、空間計算、多維感知等多種算力處理需求。在網絡傳輸需求上,更是要求端到端時延不超過20ms的高可靠低時延網絡。在上述報告中提出基于業(yè)務自動感知的算網一體化調度來智能實現業(yè)務與算網資源的匹配,自動識別業(yè)務對媒體編碼、分析、渲染的算力需求以及時延需求,結合泛在算力資源狀態(tài)和分布的實時感知,將媒體智能路由到合適的算力節(jié)點進行處理。
表1總結了關鍵視頻業(yè)務的發(fā)展趨勢及基礎設施需求,其中網絡指標數據參考3GPP TR26.928[3]、3GPP TS 22.104[4]、3GPP26.925[5]等標準規(guī)范給出??梢钥吹?,隨著視頻業(yè)務的發(fā)展,要求構建實時、泛在、異構的多樣性算力,并在新型網絡及算網一體技術的支撐下實現隨時、隨地接入使用最佳匹配的算力資源,達到業(yè)務體驗及資源利用率的雙贏。
表1 視頻業(yè)務發(fā)展及需求分析
中國聯通在《中國聯通Cube-Net 3.0網絡創(chuàng)新體系白皮書》Cube-Net 3.0架構中提出構建“聯結+計算+智能”融合服務的新一代數字基礎設施[6],在《中國聯通云網融合向算網一體技術演進白皮書》中,提出在未來算網一體架構中應包含運營融合、管控融合、數據融合、資源融合、網絡融合、協議融合的六大融合能力[7]。中國移動在《算網一體網絡架構及體系展望白皮書》中指出算網一體的主要特征應包括設備一體化、協議一體化、調度一體化及服務一體化[8]。中國電信在《云網融合2030技術白皮書》中指出云網融合的最終目標是使相對獨立的云計算資源和網絡設施融合形成一體化供給、一體化運營、一體化服務的體系,實現簡潔、敏捷、開放、融合、安全、智能的新型信息基礎設施的資源供給[9]。
我們通過誤差界限法,計算得出每個動作單元需要測量的組數,然后重新按照組數進行測時,計算求得每個動作單元用時平均值X,然后通過3σ法進行異常值的剔除,計算結果如表2所示。
為了實現算網一體的發(fā)展目標需要多技術融合發(fā)展,包括算網資源標識、度量、感知、路由以及一體化的編排、調度,能力抽象封裝及開放,涉及到大量設備的升級改造甚至是協議層面的演進升級,需要在做好頂層設計的前提下分階段發(fā)展。當前階段可聚焦在基本保持組網架構、網絡協議不變的情況下,通過構建一體化編排調度能力以及一體化運營服務能力實現面向視頻等新型應用的快速賦能,整體架構如圖1所示。其中一體化編排調度是關鍵,可拆解為算力、網絡、業(yè)務等領域內編排調度能力及跨層跨域的一體化編排調度能力。具體包括多要素原生的編排能力構建,多要素資源的統一建模,內生智能的業(yè)務感知及跨域編排。多要素資源原生的編排能力是指算力、網絡、數據、應用等資源遵循“原生編排”的理念,具備自身獨立編排能力及跨域協同編排能力,能夠對基礎能力不斷抽象,形成標準、靈活、可編排的原子API能力,對外提供標準化封裝、可自動執(zhí)行的原子能力和服務,供算網一體業(yè)務編排層使用。多要素資源的統一建模是指遵循“原子層—服務層—業(yè)務層”接口模型,首先對現有算網基礎設施的原子能力進行梳理,然后分層次抽取出面向資源的服務對象以及面向業(yè)務能力的業(yè)務層接口。內生智能的業(yè)務感知及跨域編排是指能夠智能識別業(yè)務意圖及算網資源解析,對不同應用如視頻類、AI類、行業(yè)類等進行細分建模,完成應用到資源的模型映射,自動生成資源可理解的交互指令,實現業(yè)務與資源最佳匹配的編排與調度。數據驅動及內生智能將貫穿一體化編排調度的演進歷程,并支撐一體化編排調度最終向意圖驅動、數字孿生演進。一體化運營服務是指實現云網業(yè)務的統一受理、統一支付、統一呈現。具體包括一體化服務和一體化運營管理:一體化服務是指可供應用層按需調用的增強型服務,如面向視頻領域的自適應編解碼、智能路由等能力,或者終端用戶可直接使用的一體化產品如云專網、云電腦、云會議等;一體化運營管理基于AI及大數據實現以用戶為中心的智能運營,包括需求、設計、部署、保障、評估的智能閉環(huán)運營管理。
圖1 算網一體化快速構建關鍵技術架構
視頻算力網絡是上述算網一體化架構及關鍵技術的實例化,為視頻應用提供增強賦能?;谏瞎?jié)所述,通過構建一體化編排調度能力及一體化運營能力,實現面向視頻領域應用的算網一體解決方案,如圖2所示。通過算網資源使能層以及編排調度中心構建視頻一體化編排調度能力,通過視頻服務能力層及視頻應用層構建視頻一體化運營能力,實現視頻領域算網一體化解決方案。
圖2 視頻算力網絡架構整體架構
算力使能層:算力資源的統一管理、全局調度。通過云原生技術在多環(huán)境、多數據中心的異構資源上構建分布式的容器集群,屏蔽底層異構技術棧的差異,實現算力服務與算力資源之間的解耦?;趹迷V求、內置就近、就閑、就碳等多策略進行全局資源合理調度,實現匹配視頻業(yè)務體驗保障下的跨層跨域算力資源利用率最優(yōu)。
網絡使能層:網絡資源的統一管理、全局調度。南向對接并拉通多段多類型網絡,無線側通過與NEF/SCEF對接,有線側通過與SDN控制器對接實現端到端網絡可編程可調度。面向視頻領域通過QUIC等技術構建端到端視頻鏈路加速并與CDN網絡融合互通,支撐互動直播等新型視頻應用對網絡的雙向流量需求;通過視頻節(jié)點的實時感知、編排實現面向視頻應用需求的智能路徑計算與選擇。
編排調度中心:算網資源的一體化編排與調度,視頻服務的編排調度。南向分別基于算力使能層及網絡使能層實現算力和網絡資源的感知與編排調度,北向面向應用實現跨層跨域的一體化編排能力封裝及開放。通過視頻服務模板,定義視頻服務及應用與算網資源需求的映射關系,實現應用與資源的解耦。對視頻類業(yè)務及服務進行統一納管、狀態(tài)感知、動態(tài)彈縮及實例化部署,達到視頻應用及服務最優(yōu)化運行,實現基于業(yè)務SLO多屬性需求智能感知的算網資源一體化編排調度。
同時,為了構建算網一體化架構,還需要對視頻領域現網資源進行部分改造升級,以實現算網資源原生的感知與編排調度。
算網資源設施層包括算力資源和網絡資源。算力資源層由不同類型(CPU/GPU/NPU/VPU/...)、不同級別(Mobile/Edge/Server/Data Center/Distributed Cloud)的算力體系形成位于端、邊、云、網泛在、異構的視頻算力,通過對算力資源虛擬化、池化改造實現資源可編排可調度。網絡資源,通過光網絡構建分級時延圈提升傳輸能力,通過5G增強技術提升上行帶寬及確定性能力,通過端到端的SRv6實現網絡快速部署及彈縮能力,通過RDMA、無損網絡等技術提升集群算力效能。通過RTN、CDN、IMS等業(yè)務網絡能力構造及升級,實現視頻應用網絡的能力增強及可編排。
視頻服務能力層:基于算網一體的基礎設施,面向視頻應用賦能,實現增強型的視頻服務能力,如自適應視頻編解碼、智能路由、分類存儲、深度實時渲染、視頻分析等服務化能力,賦能新型視頻業(yè)務創(chuàng)新。視頻服務能力層既可獨立設置構建如視頻中臺類網元,也可基于已有視頻網元改造合設如彩鈴業(yè)務媒體服務器。
視頻應用層:基于業(yè)務發(fā)展及實際需求以能力開放模式顯示調用增強型視頻能力,或通過網絡邊緣節(jié)點自動業(yè)務識別、算力路由提供增強性的視頻服務,使得業(yè)務體驗更好、成本更低、響應更快。
各模塊之間的接口如表2所示。
表2 視頻算力網絡接口描述
云電腦是典型的視頻類應用,隨著網絡和云計算技術的快速發(fā)展,進一步促進了云電腦業(yè)務的普及應用。云電腦用戶只需要使用輕量化的云終端設備通過網絡接入云端算力和應用,就可以輕松應對移動辦公、研發(fā)測試、家庭娛樂等場景。用戶操作通過遠程桌面協議發(fā)送到云端,云端算力運算得到結果,計算結果以視頻流推送到客戶端顯示。
應用場景不同、終端類型不同,所需要的云端算力有很大差異。傳統方式的云電腦業(yè)務為用戶靜態(tài)分配云端資源,資源與需求不能很好匹配導致云端算力利用率低。此外用戶的體驗往往受限于網絡傳輸質量及算力性能,在用戶業(yè)務使用中會出現卡頓等情況,影響業(yè)務推廣。視頻算力網絡基于算網業(yè)一體化編排調度可以有效提升云端算力使用率,改善用戶體驗。
基于視頻算力網絡拉通企業(yè)內多個DC算力,提供多種時延(低、中)、規(guī)格(4C8G、8C16G)、類型(CPU/GPU)的云電腦模型,結合云電腦業(yè)務開通及使用時的業(yè)務SLO需求、終端類型、潮汐效應,實現算網資源的最佳匹配編排,實現業(yè)務開通及使用。經過實際應用測試,可提升算力利用率30%以上,改善云電腦體驗避免卡頓,包括以下具體場景。
1)A企業(yè)通過一體化運營平臺申請采用筆記本云終端,進行家庭娛樂、多屏協同辦公等業(yè)務,需要低時延、GPU加速云電腦。一體化編排系統通過算力及網絡使能層實時感知算網資源,為企業(yè)分配雙屏編碼和CPU/GPU異構算力資源,匹配用戶需求的算網資源,開通云電腦業(yè)務。
2)B企業(yè)通過一體化運營平臺申請采用卡片式云終端,進行移動辦公。一體化編排系統根據用戶位置為用戶分配距離用戶位置最近的CPU算力資源,開通云電腦業(yè)務。
3)利用白天辦公、晚上娛樂錯峰使用的潮汐效應,不同類型云電腦共享資源,提升資源使用率。白天企業(yè)用戶登錄,使用云端算力進行辦公,下班后云端算力空閑,一體化編排調度系統檢測到算力空閑,將虛機休眠釋放算力,供家庭用戶晚間使用。
云電腦業(yè)務使用的最大痛點在于顯示卡頓,影響用戶體驗?;谒憔W一體化調度實現客戶端到服務端的智能路徑選擇,改善傳輸,為用戶提供最佳體驗,流程如圖3所示。
圖3 云電腦業(yè)務智能路徑選擇
1)用戶登錄云電腦業(yè)務,云電腦客戶端通過SDK調用視頻服務能力層提供的智能路徑選擇能力。
2)視頻服務能力層轉發(fā)請求到編排調度中心。編排調度中心根據媒體節(jié)點算力負載及網絡拓撲擁塞信息確定備選服務路徑,如路徑1為媒體節(jié)點AB,路徑2為媒體節(jié)點ACD,并基于路徑上的媒體節(jié)點資源、網絡擁塞確定采用路徑2更優(yōu),然后向視頻服務能力層反饋路徑2信息。
3)視頻服務能力層返回路徑2信息給云電腦客戶端,云電腦客戶端啟用路徑2,實現云電腦業(yè)務無卡頓傳輸和顯示 。
通過算網一體技術與視頻領域的深度結合,構建視頻算力網絡,經過實際部署及驗證,實現了基礎設施對視頻領域服務的能力增強,解決了業(yè)務發(fā)展及業(yè)務創(chuàng)新的核心痛點,同時也有利于促進算網一體技術成熟落地。