亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        硬件加速在核心網(wǎng)轉發(fā)面應用的思考和實踐

        2020-08-15 09:34:54
        中興通訊技術 2020年3期
        關鍵詞:功能

        (中國移動研究院,北京,100053)

        (China Mobile Research Institute, Beijing 100053)

        1 硬件加速起源于不匹配三角

        如同經濟學領域有蒙代爾的不可能三角、分布式計算有CAP(指一致性、可用性、分區(qū)容忍性)公理一樣,網(wǎng)絡功能虛擬化(NFV)也存在不匹配三角:計算、帶寬和存儲三者中總會有一方發(fā)展較慢。木桶理論中提到,最短木板決定了系統(tǒng)性能,因此,解決NFV不匹配三角問題,是硬件加速在NFV領域存在的基石。

        隨著虛擬化和微服務架構的興起,完成一個業(yè)務所需的東西向流量急劇增加。伴隨眾多網(wǎng)絡業(yè)務發(fā)展、4G不限量套餐普及及5G的興起,南北向業(yè)務流量也在急速增長。這是近兩三年來,數(shù)據(jù)中心機房迅速從10 G網(wǎng)卡提升到25 G光纖網(wǎng)卡并向100 G網(wǎng)卡演進的深層次原因。隨著網(wǎng)絡帶寬增長勢頭加劇,計算處理能力的短板逐漸凸顯;因此,人們急需一種技術方案來彌補這個短板。

        硬件加速即利用中央處理器(CPU)、片上系統(tǒng)(SoC)、圖形處理器(GPU)、數(shù)字信號處理器(ASIC)、現(xiàn)場可編程門陣列(FPGA)等使用不同類型指令集和不同體系架構的計算單元,組成一個混合的計算系統(tǒng),通過將處理工作分配給加速硬件以減輕CPU負荷的技術,從而實現(xiàn)性能提升、成本優(yōu)化的目標。當前,業(yè)界為了解決算力短板、滿足業(yè)務密集計算需求、提升業(yè)務處理性價比,廣泛使用各種加速硬件。例如,Azure、AWS等公有云推出的FPGA、GPU實例,Google推出全新架構的張量處理器(TPU)芯片,京東云、阿里云為提升網(wǎng)絡性能使用的開放虛擬交換(OvS)卸載智能網(wǎng)卡等。

        技術的發(fā)展如同歷史的發(fā)展一樣,總是螺旋式上升的。在CT領域,NFV通過使用X86等通用性商用貨架產品(COTS)硬件以及虛擬化技術來承載網(wǎng)絡功能的軟件處理,使網(wǎng)絡設備功能不再依賴于專用硬件、資源可以充分靈活共享,實現(xiàn)新業(yè)務的快速開發(fā)和上線,并基于實際業(yè)務例如,需求進行自動部署、彈性伸縮、故障隔離和自愈等;然而,面向5G、邊緣云移動邊緣計算(MEC)新興業(yè)務如增強現(xiàn)實(AR)/虛擬現(xiàn)實(VR)、云游戲、人工智能(AI)等計算、輸入/輸出(I/O)、網(wǎng)絡密集型應用時,單純使用COTS硬件并不能滿足這些應用對低時延、高可靠的網(wǎng)絡要求與并行計算的算力要求。如果采用服務器堆疊方式解決以上問題,總體上將增加資本支出(CAPEX)和運營成本(OPEX)壓力。在一些邊緣計算場景,機房有限的空間、承重、電力、散熱條件制約著可承載服務器的數(shù)量。本文中,我們的研究重點是針對負責網(wǎng)絡轉發(fā)的用戶面功能(UPF),提升其單位空間、能耗下的轉發(fā)性能,打破計算與帶寬的不匹配三角,實現(xiàn)通用X86服務器架構下的更高轉發(fā)性能。

        2 核心網(wǎng)網(wǎng)關轉發(fā)的瓶頸與引入100 G網(wǎng)卡的優(yōu)勢

        隨著后摩爾定律時代到來,CPU制程迭代變緩,主頻和單位面積芯片中可容納的核/緩存數(shù)量提升變得困難。目前,CPU三級緩存的存取效率已經從30 ns提升到10 ns左右,將共享三級緩存近核本地化和按需分配僅可以有限地提升緩存利用效率,性能進一步提升難度較大。

        在核心網(wǎng)網(wǎng)關UPF中,對一個報文的處理至少需要讀(查找轉發(fā)表)、寫(計費)緩存各一次。CPU緩存是最大的I/O瓶頸,過多緩存丟失引起的讀寫內存會引發(fā)轉發(fā)能力螺旋式下降[1]。I/O效率在100 G線速下幾乎是不可逾越的瓶頸,因此,如何減少業(yè)務處理邏輯對CPU緩存的訪問、將流表卸載至加速硬件中,是產業(yè)界嘗試打破轉發(fā)瓶頸的一個方向。

        在提速降費、不限量套餐普及以及5G業(yè)務發(fā)展的大背景下,核心網(wǎng)中數(shù)據(jù)流量劇增。在4G話務模型下,虛擬化核心網(wǎng)網(wǎng)關用戶面(GW-U)部署的普通雙路服務器,一般會配置兩塊25 G網(wǎng)卡——不跨非統(tǒng)一內存訪問架構(NUMA)節(jié)點。在實際商用部署中考慮到CPU毛刺等因素,理想狀態(tài)下一臺服務器的最大安全吞吐量約40 G。5G增強移動寬帶(eMBB)場景下,單局容量遠超4G。提高單服務器轉發(fā)能力,降低服務器總量從而降低能耗和管理成本是當務之急;因此,網(wǎng)卡向100 G發(fā)展是必然趨勢。若使用100 G智能網(wǎng)卡,由于轉發(fā)流量卸載到智能網(wǎng)卡,CPU沖高影響降低,在確定的話務模型下,理想最大安全吞吐量可達95 G,折扣大大降低,使總體轉發(fā)能力提升約4~5倍。同時,針對5G的超可靠低時延通信(URLLC)場景,智能網(wǎng)卡轉發(fā)處理的平均時延約為10 us,較之NFV軟件處理的平均時延100~200 us,可降低一個量級。100 G智能網(wǎng)卡在4G核心網(wǎng)(EPC)、5G eMBB和5G URLLC場景下,成本和時延優(yōu)勢明顯。

        3 UPF應用智能網(wǎng)卡的切入點

        如圖1所示,5G采用控制面與用戶面(C-U)分離架構,UPF作為U面對外接口是無線側N3和互聯(lián)網(wǎng)側N6,其中N3接口采用GPRS隧道協(xié)議(GTP)協(xié)議封裝。

        業(yè)界一度對核心網(wǎng)NFV的U面是否需要加速持懷疑態(tài)度[2],認為:

        1)通用硬件平臺虛擬化是大勢所趨,運營商剛從專用設備中轉型脫身,智能網(wǎng)卡似乎又回到了熟悉的專用硬件,這是倒退;

        2)硬件加速效能比達不到預期。

        專用設備被詬病的主要原因在于設備商壟斷造成了高昂成本。當前,核心網(wǎng)硬件加速的成熟應用主要聚焦在加解密、編解碼等領域。性能提升和成本下降有限,同時引入加速硬件可能帶來的硬件綁定問題,使運營商難以下定決心;因此,在加速硬件技術方案的選擇上,需要平衡當前通用與專用之間的矛盾。業(yè)界常見的加速硬件主要有5類,表1在成本、功耗、開發(fā)難度和重用性以及適合的數(shù)據(jù)處理類型等方面對這5類加速硬件進行了對比。

        在成本、功耗和開發(fā)難度上,數(shù)字信號處理器(ASIC)方案具有絕對優(yōu)勢;但是其支持的加速功能固化,芯片不可重用,靈活性低,更適合成熟穩(wěn)定的算法類應用。

        GPU是面向視頻處理等大規(guī)模并行計算類型領域的成熟方案,軟件生態(tài)強大。邊緣云業(yè)務中涉及到視頻數(shù)據(jù)處理(渲染、轉碼)以及AI的推理、訓練處理都采用GPU實現(xiàn)。

        NPU提供一定的轉發(fā)規(guī)則可配置能力,通過對數(shù)據(jù)報文轉發(fā)處理主要過程的固化,實現(xiàn)高性能數(shù)據(jù)轉發(fā),是高性能路由平臺的主要方案。

        SoC具有可編程、可升級、支持熱補丁特點,多為進階精簡指令集機器(ARM)架構,一般配合ASIC定制化使用以保證性能,適合較成熟穩(wěn)定的算法類應用。

        FPGA性價比介于通用處理器和ASIC之間,同時處理時延低,契合5G URLLC場景。EPGA靈活性高,可在線重加載配置軟件以實現(xiàn)不同的功能特性,并且片上資源可靈活劃分。隨著FPGA處理能力的提升,F(xiàn)PGA的部分重配置(PR)技術可以將一塊FPGA配置為多塊功能單元,比如各單元分別支持流量卸載、視頻編解碼和機器學習。同時每一個功能單元,還可以通過單引導I/O虛擬化(SR-IOV)方式提供給多個上層業(yè)務來使用,以充分發(fā)揮FPGA設備性能。實現(xiàn)網(wǎng)絡加速的智能網(wǎng)卡是FPGA芯片的一種典型應用,這也是數(shù)據(jù)轉發(fā)類加速硬件的一個重要形態(tài)。

        UPF加速要想做到硬件資源池化,須面臨軟軟解耦(即網(wǎng)元通過應用程序編程接口調用加速硬件的加速功能)或軟硬解耦(網(wǎng)元軟件在統(tǒng)一的加速硬件上進行功能迭代)的選擇。目前UPF硬件加速產業(yè)并不成熟,各廠家網(wǎng)元處理流程設計不同,加速卸載方案多樣。在這一階段我們選擇軟軟解耦方案,需要統(tǒng)一卸載功能模塊及處理流程,打開業(yè)務接口。這樣的話,一方面難以發(fā)揮各種加速硬件優(yōu)勢,另一方面當軟件功能升級時,拆分到硬件和上層軟件的功能協(xié)同升級也較為復雜,同時功能模塊的拆分也會為運維、故障定位帶來困難;因此,軟軟解耦是未來產業(yè)成熟后的遠期目標。針對軟硬解耦方案,需要選擇一類加速硬件由UPF廠家適配開發(fā)。5G業(yè)務對高吞吐、低時延的需求分析,與卸載功能和流程需要不斷優(yōu)化演進的需求,都要求加速芯片在保證并行處理能力和低時延性能的基礎上具備高度靈活性。綜上所述,F(xiàn)PGA芯片是一種更為靈活、成熟、可通用化部署的選擇。

        在圖2所示的UPF業(yè)務處理模型中,GTP封裝/解封裝、規(guī)則查找、DPI、服務質量(QoS)、計費是關鍵業(yè)務處理路徑。如果加速硬件僅處理轉發(fā)動作,所有報文仍需CPU處理GTP協(xié)議、QoS、計費等業(yè)務,這一加速應用模型對于UPF性能的提升有限;因此,UPF加速模型須考慮盡可能實現(xiàn)報文的全業(yè)務處理卸載。

        表1 常見加速硬件對比

        ETSI NFV001定義了硬件加速的3種主要模式[3],如圖3所示。

        1)Look-Aside:旁路模式,類似協(xié)處理器的應答模式,不改變現(xiàn)有軟件流程;

        2)In-Line:隨路模式,嵌入到軟件的包處理過程中,是一種緊耦合模型;

        3)Fast-Path:快路徑模式,報文不經過主機處理。

        對于UPF這類轉發(fā)面網(wǎng)元,Look-Aside模式中數(shù)據(jù)包要在加速卡和中央處理器之間多次傳遞,對總線帶寬和處理時延均有影響。In-Line模式和Fast-Path模式更適合業(yè)務功能的有效卸載。因此數(shù)據(jù)包由網(wǎng)卡接收后可以直接在本地處理的智能網(wǎng)卡比旁路外設部件互聯(lián)標準(PCIe)加速卡更適合用于UPF加速。

        使用FPGA智能網(wǎng)卡對現(xiàn)有NFV架構的主要影響包括網(wǎng)元適配開發(fā)和管理和編排(MANO)納管。FPGA開發(fā)基于硬件編程語言VHDL或Verilog,與硬件緊耦合。在NFV模式下,多UPF廠商多智能網(wǎng)卡配對,UPF廠家適配開發(fā)工作量需要收斂。在OpenStack社區(qū),Cyborg組件可以實現(xiàn)FPGA智能網(wǎng)卡的發(fā)現(xiàn)、管理以及加速功能加載。FPGA智能網(wǎng)卡需要支持通過Cyborg實現(xiàn)自動化在線重配置?;诮档瓦m配開發(fā)工作量、UPF加速業(yè)務快速上線、滿足在線自動重配的需求,F(xiàn)PGA智能網(wǎng)卡需要支持靜態(tài)-動態(tài)區(qū)域模式,并需要運營商對智能網(wǎng)卡進行統(tǒng)一定制化設計。

        在FPGA智能網(wǎng)卡的靜態(tài)-動態(tài)區(qū)域模式中,靜態(tài)區(qū)域需要封裝PCIe接口、雙倍數(shù)據(jù)傳輸速率(DDR)控制器等通用IP,面向動態(tài)區(qū)域提供調用接口,由硬件廠家預先完成開發(fā)調試,UPF廠家在動態(tài)區(qū)域進行功能開發(fā)時可以直接獲得硬件平臺能力。由硬件廠家提供靜態(tài)區(qū)域,用戶則無法修改,這為設備穩(wěn)定、可靠提供保障,也可形成FPGA用戶到服務器的隔離,提供安全保證。動態(tài)區(qū)域部分加載的UPF加速邏輯,由網(wǎng)元廠家開發(fā)設計,可動態(tài)更新,使網(wǎng)元加速功能開發(fā)更專注于業(yè)務邏輯,也便于后續(xù)網(wǎng)元的功能迭代。這一模式為FPGA的安全、可靠提供保證,同時使FPGA使用者專注于業(yè)務邏輯開發(fā),降低了FPGA開發(fā)難度。

        4 智能網(wǎng)卡業(yè)務卸載參考設計

        考慮到智能網(wǎng)卡更適合處理邏輯簡單的重復并行業(yè)務,在進行卸載功能選擇時,原則上選擇穩(wěn)定且邏輯簡單的功能卸載,卸載功能處理流程須符合In-Line或Fast-Path模式。使用In-Line模式時,我們需要考慮哪些功能必須由CPU處理,哪些適合下沉到智能網(wǎng)卡。對于Fast-Path模式,我們需要考慮滿足了哪些條件后,報文可以不經過CPU,完成正確的轉發(fā)和計費。

        圖2 用戶面功能業(yè)務處理模型

        圖3 硬件加速模式

        圖4 UPF硬件加速參考設計

        圖4給出了一種UPF業(yè)務卸載的參考設計,其中配置下發(fā)和計費等統(tǒng)計信息上送均通過流表完成。表2 給出了CPU下發(fā)的部分配置流表設計。

        1)通過首包(一個或幾個)上送CPU,CPU生成配置流表下發(fā)給智能網(wǎng)卡,流表中含路由、計費策略等內容;

        2)后續(xù)報文到達,智能網(wǎng)卡查找流表,命中則直接轉發(fā),不再經過CPU處理,未命中上送CPU;

        3)智能網(wǎng)卡實現(xiàn)GTP報文的封裝/解封裝等處理;

        4)根據(jù)計費等策略,智能網(wǎng)卡把計費等信息上報CPU。

        5 加速比是衡量硬件加速效能的關鍵指標

        阿姆達定律定義了多核計算的加速比,其核心思想是可并行計算的模塊占比與核的數(shù)量之間的關系。類似地,衡量硬件加速的效能,也可采用加速比這個概念;但不同之處在于使用了“可卸載報文比例”作為關鍵因子。加速比的定義如公式(1)所示:

        表2 流表參考設計

        圖5 加速比變化趨勢

        其中X為可卸載報文比例。

        例如,卸載80%的報文時,加速比為1/(1-80%),即5倍。這意味著一臺服務器可以處理原來5臺服務器處理的報文。

        圖5展示了加速比的變化趨勢:目前多數(shù)加速應用卸載比例約為35%,效能比低于1.5。當卸載50%的報文時,加速比為2倍,這個數(shù)值是加速比的拐點。當卸載比例超過50%,加速比將大幅提升。

        在實際轉發(fā)流量中,我們把超文本傳輸協(xié)議(HTTP)訪問稱為“短流”,把視頻類流稱為“長流”。“長流”持續(xù)時間長、報文數(shù)量多。顯而易見,“長流”可以獲得更高的加速比。隨著5G和視頻應用的普及,視頻流量的比例將大幅提升,并達到個人用戶上網(wǎng)流量的80%、行業(yè)流量的70%,同時智能網(wǎng)卡卸載加速的效果將會更加顯著。

        硬件加速的加速比存在極限。以EPC話務模型為例,以業(yè)界通常評估的平均一個流20個報文計算,除去必須首包學習上送CPU的報文,理論上剩下19個報文都可以被卸載,此時加速比的極限為20倍,這是這一話務模型下硬件加速的理想目標。

        6 結束語

        不匹配三角揭示的矛盾,在5G核心網(wǎng)U面UPF上體現(xiàn)為網(wǎng)卡帶寬需求遠超過當前主流雙路服務器的CPU計算能力。通過FPGA智能網(wǎng)卡實現(xiàn)報文卸載,可有效降低CPU負荷實現(xiàn)再平衡,由此降低了每吉比特流量的設備成本。同時,F(xiàn)PGA智能網(wǎng)卡的靈活性也可保證加速硬件資源池的通用性。

        猜你喜歡
        功能
        拆解復雜功能
        鐘表(2023年5期)2023-10-27 04:20:44
        也談詩的“功能”
        中華詩詞(2022年6期)2022-12-31 06:41:24
        基層弄虛作假的“新功能取向”
        當代陜西(2021年21期)2022-01-19 02:00:26
        深刻理解功能關系
        鉗把功能創(chuàng)新實踐應用
        關于非首都功能疏解的幾點思考
        基于PMC窗口功能實現(xiàn)設備同步刷刀功能
        懷孕了,凝血功能怎么變?
        媽媽寶寶(2017年2期)2017-02-21 01:21:24
        “簡直”和“幾乎”的表達功能
        中西醫(yī)結合治療甲狀腺功能亢進癥31例
        欧美另类在线视频| 久久久99精品免费视频| 欧美老肥妇做爰bbww| 婷婷五月综合丁香在线| 国产91 对白在线播放九色| 亚洲蜜桃视频在线观看| 国产女主播一区二区久久| 少妇人妻中文字幕hd| 99热久久这里只精品国产www| 99热国产在线| 自拍偷拍亚洲视频一区二区三区| 日本精品女优一区二区三区| 欧美精品videossex少妇| 免费一级肉体全黄毛片| 中文在线最新版天堂av| 国产高清在线视频一区二区三区| 欧美精品黑人粗大免费| 欧美喷潮系列在线观看| 东风日产系列全部车型| 在线国人免费视频播放| 最新日本一道免费一区二区| 无码人妻精品一区二区三区66| 亚洲色AV天天天天天天| 亚洲肥婆一区二区三区| 少妇无码av无码专线区大牛影院| 黑人巨大av在线播放无码| 在线视频一区二区日韩国产| 亚洲女人天堂成人av在线| 亚洲午夜精品一区二区| www国产精品内射熟女| 亚洲欧美国产精品久久久| 草逼视频免费观看网站| 色欲av蜜桃一区二区三| 亚洲区在线播放| 亚洲国产精品一区二区| 久久久久久久亚洲av无码| 成年女人毛片免费视频| 亚洲专区在线观看第三页| 三级国产精品久久久99| 久久久久久久岛国免费观看| 白白色发布在线播放国产|