劉韻潔,張 嬌,黃 韜,潘 恬
(北京郵電大學(xué) 網(wǎng)絡(luò)與交換國家重點實驗室,北京 100876)
近年來,網(wǎng)絡(luò)的飛速發(fā)展以及網(wǎng)絡(luò)中業(yè)務(wù)形式的多樣化使得現(xiàn)有的網(wǎng)絡(luò)架構(gòu)呈現(xiàn)出各種問題。4K/8K高清視頻、增強現(xiàn)實、自動駕駛等新型業(yè)務(wù)均對網(wǎng)絡(luò)提出了更高的性能需求。傳統(tǒng)網(wǎng)絡(luò)體系架構(gòu)不能很好地去支撐這些業(yè)務(wù),會阻礙這些技術(shù)的發(fā)展進程。因此,需要針對現(xiàn)有網(wǎng)絡(luò)中的問題,提出新型網(wǎng)絡(luò)體系架構(gòu)。
當(dāng)前網(wǎng)絡(luò)中存在如下3個關(guān)鍵問題。
1)缺乏對業(yè)務(wù)提供差異化服務(wù)的能力。近年來,視頻直播、高清視頻等OTT(over the top)業(yè)務(wù)蓬勃發(fā)展,用戶數(shù)量和數(shù)據(jù)流量快速增長。截至2017年,微信活躍用戶數(shù)量已經(jīng)達到了8.89億,F(xiàn)acebook月活躍用戶數(shù)量超過20億[1]。OTT業(yè)務(wù)的蓬勃發(fā)展雖然促進了網(wǎng)絡(luò)技術(shù)的變革,但是在目前盡力而為的網(wǎng)絡(luò)中,OTT業(yè)務(wù)占用大量帶寬,導(dǎo)致了一些對時延敏感的業(yè)務(wù)體驗質(zhì)量嚴重下降。而且,由于運營商在其中只是單純的扮演管道提供商的角色,因此,運營商缺乏足夠的動力對網(wǎng)絡(luò)進行擴容,網(wǎng)絡(luò)的擁塞情況日益嚴重,嚴重影響網(wǎng)絡(luò)的可持續(xù)發(fā)展。若允許運營商針對OTT業(yè)務(wù)按流量收費,這一方法雖然能減輕OTT業(yè)務(wù)對網(wǎng)絡(luò)的壓力,但是將會制約互聯(lián)網(wǎng)業(yè)務(wù)的蓬勃發(fā)展,阻礙技術(shù)和業(yè)務(wù)的創(chuàng)新之路。
解決OTT業(yè)務(wù)對網(wǎng)絡(luò)帶來的沖擊,一種可行的方式就是針對目前的網(wǎng)絡(luò)架構(gòu),對網(wǎng)絡(luò)進行改造。我們從交通系統(tǒng)中得到啟示:普通公路、高速公路、鐵路運輸、航空運輸?shù)葮I(yè)務(wù)具有不同的運輸能力和運輸速度,采取差異化的收費機制,選擇普通公路運輸?shù)挠脩舨皇召M,但是服務(wù)質(zhì)量得不到保障,選擇航空運輸?shù)挠脩羰杖「哌\輸費,在運輸速度上得到保障。這樣一來,一方面對網(wǎng)絡(luò)有服務(wù)質(zhì)量需求的內(nèi)容提供商可以得到服務(wù)保障,而普通用戶和小型創(chuàng)業(yè)公司等可以繼續(xù)免費使用互聯(lián)網(wǎng),促進互聯(lián)網(wǎng)的蓬勃發(fā)展。另一方面,基礎(chǔ)網(wǎng)絡(luò)提供者會有更高的動力去建設(shè)基礎(chǔ)網(wǎng)絡(luò)設(shè)施,以便更好地滿足不同用戶對基礎(chǔ)網(wǎng)絡(luò)的需求。根據(jù)調(diào)查顯示,當(dāng)前互聯(lián)網(wǎng)應(yīng)用提供商對于網(wǎng)絡(luò)差異性服務(wù)能力的需求非常強烈,例如,亞馬遜指出網(wǎng)絡(luò)延遲每增加0.1 s,每年銷售將減少1%[2],谷歌指出用戶搜索延遲每增加0.5 s,則搜索量將會減少20%[3]。據(jù)調(diào)查,85%內(nèi)容提供商為了提高用戶的業(yè)務(wù)體驗,愿意為更好的網(wǎng)絡(luò)服務(wù)質(zhì)量支付最高25%溢價。我們希望通過一種新的網(wǎng)絡(luò)架構(gòu),來為用戶提供差異化的服務(wù),一方面既能保障普通用戶的需求,另一方面對有特殊需求的用戶提供服務(wù)質(zhì)量保障。
2)網(wǎng)絡(luò)中存在大量的冗余傳輸。當(dāng)前互聯(lián)網(wǎng)中的大部分內(nèi)容分發(fā)型應(yīng)用存在大量重復(fù)傳輸問題,尤其是視頻流量,例如優(yōu)酷2011年播放量過億次的電視劇超過30部。而當(dāng)前互聯(lián)網(wǎng)中視頻流量占據(jù)了大部分,Cisco預(yù)計未來在線視頻流量將會占據(jù)互聯(lián)網(wǎng)流量的90%以上。這些冗余流量會浪費大量網(wǎng)絡(luò)帶寬,因此,消除信息冗余需求十分迫切。當(dāng)前網(wǎng)絡(luò)中主要是利用內(nèi)容分發(fā)網(wǎng)絡(luò)(content delivery network, CDN)技術(shù)來減少信息冗余。但是,傳統(tǒng)CDN的解決方案存在諸多不足,一方面,其采用覆蓋網(wǎng)(overlay network)的方式進行設(shè)計,增加了成本,造成了基礎(chǔ)設(shè)施資源的浪費。另外一方面,通常只有較成熟的公司才有能力去購買CDN服務(wù),因此CDN技術(shù)只是減小了購買其服務(wù)的內(nèi)容提供商的數(shù)據(jù)流量,并不是一個整體解決方案。對于基礎(chǔ)網(wǎng)絡(luò)來說,由于缺乏對內(nèi)容資源的智能調(diào)度能力,信息冗余仍然大量存在,因此,基礎(chǔ)網(wǎng)絡(luò)具備信息冗余消除能力十分必要。同時調(diào)查指出,存儲容量比帶寬增長速度更快,而且存儲成本價格比帶寬價格下降更快,按照目前數(shù)據(jù),存儲容量平均每1.7年翻倍,而帶寬平均每2.4年翻倍;存儲成本每年下降40%,而帶寬成本每年只下降26%[4]。因此,從發(fā)展趨勢來看,未來在基礎(chǔ)網(wǎng)絡(luò)中部署緩存來減小信息冗余也是一個大的方向。
3)缺乏對網(wǎng)絡(luò)數(shù)據(jù)的感知和應(yīng)用能力。知名咨詢公司麥肯錫在其報告中[5]指出,數(shù)據(jù)已經(jīng)滲透到當(dāng)今每個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)要素。網(wǎng)絡(luò)中同樣存在海量的數(shù)據(jù),然而目前網(wǎng)絡(luò)對于這些海量數(shù)據(jù)的應(yīng)用能力非常局限,主要由于2個原因:首先網(wǎng)絡(luò)缺乏對各類數(shù)據(jù)的測量能力。網(wǎng)絡(luò)測量是一項具有挑戰(zhàn)的工作,需要對網(wǎng)絡(luò)中的硬件設(shè)備和協(xié)議進行改造,同時需要應(yīng)對高速鏈路中線速數(shù)據(jù)包處理的挑戰(zhàn)。其次因為網(wǎng)絡(luò)缺乏對數(shù)據(jù)的收集和處理能力,單純的數(shù)據(jù)測量并不能產(chǎn)生很大的價值,在數(shù)據(jù)時代,數(shù)據(jù)的分析處理才是重點。進一步地,如何將分析得到的結(jié)果閉環(huán)地對網(wǎng)絡(luò)進行反饋控制也存在較大的技術(shù)挑戰(zhàn),目前的網(wǎng)絡(luò)架構(gòu)中缺乏一個層面來實現(xiàn)對于海量數(shù)據(jù)的收集、分析處理和網(wǎng)絡(luò)反饋控制。
針對以上3個問題,本文提出一種新網(wǎng)絡(luò)體系架構(gòu),服務(wù)定制網(wǎng)絡(luò)(service customized networking,SCN),試圖構(gòu)建一種開放可擴展、基于大數(shù)據(jù)分析實現(xiàn)高效靈活的網(wǎng)絡(luò)管理,并提供差異化服務(wù)能力的網(wǎng)絡(luò)體系架構(gòu)。網(wǎng)絡(luò)的底層通過融合計算、存儲、網(wǎng)絡(luò)資源形成資源池,網(wǎng)絡(luò)中增加的計算和存儲能大幅度提升網(wǎng)絡(luò)的能力,在降低業(yè)務(wù)時延和減少網(wǎng)絡(luò)中冗余傳輸?shù)耐瑫r,拓展了網(wǎng)絡(luò)的業(yè)務(wù)維度,增強了網(wǎng)絡(luò)的可創(chuàng)新性。基于云架構(gòu)實現(xiàn),并借助SDN/NFV(software defined network/ network function virtualizatio)技術(shù)在控制平面實現(xiàn)對資源的統(tǒng)一管理。同時,在網(wǎng)絡(luò)中增加基于大數(shù)據(jù)的網(wǎng)絡(luò)測量與感知平面,充分利用網(wǎng)絡(luò)中的數(shù)據(jù)來指導(dǎo)網(wǎng)絡(luò)管控策略的制定。
當(dāng)前的網(wǎng)絡(luò)架構(gòu)存在諸多問題,本節(jié)簡要介紹目前學(xué)術(shù)界和產(chǎn)業(yè)界針對網(wǎng)絡(luò)缺乏差異化服務(wù)能力、網(wǎng)絡(luò)中的冗余傳輸、網(wǎng)絡(luò)測量這3類問題所進行的一些相關(guān)工作。
網(wǎng)絡(luò)切片的目的在于根據(jù)用戶的不同需求,對網(wǎng)絡(luò)中的資源進行劃分。對網(wǎng)絡(luò)進行切分的思想廣泛存在于網(wǎng)絡(luò)中,例如VLAN(virtual local area network)技術(shù)通過標簽來劃分網(wǎng)絡(luò)的廣播域,VPN(virtual private network)技術(shù)通過端到端的隧道,實現(xiàn)網(wǎng)絡(luò)端到端的切分。近幾年,隨著SDN和NFV技術(shù)的提出,使得網(wǎng)絡(luò)變得更加的靈活可控,增強了網(wǎng)絡(luò)的可定制性。第五代移動通信(5G)也提出,該網(wǎng)絡(luò)需要支持不同類型的服務(wù),例如工業(yè)制造互聯(lián)網(wǎng),自動駕駛,遠程醫(yī)療,增強現(xiàn)實等[6]。目前的網(wǎng)絡(luò)架構(gòu)對于業(yè)務(wù)不同的時延、帶寬需求,明顯是不能滿足的。因此,基于SDN/NFV技術(shù),實現(xiàn)對網(wǎng)絡(luò)中資源的切片,實現(xiàn)業(yè)務(wù)端到端的可定制化。ONF(open networking foundation)組織在文獻[7]中,站在廣義SDN的角度,提出了網(wǎng)絡(luò)切片的架構(gòu),將計算、存儲和網(wǎng)絡(luò)資源都變成了SDN控制器可以管理的資源。
傳統(tǒng)的消除網(wǎng)絡(luò)中冗余傳輸?shù)姆椒ㄊ遣捎肅DN技術(shù)[8],但是只有一部分公司會選擇購買CDN服務(wù),因此,CDN服務(wù)只能消除網(wǎng)絡(luò)中部分的冗余傳輸,并不是全網(wǎng)的解決方案。針對這個問題,施樂帕洛阿爾托研究中心的Van Jacobson于2006年分析認為網(wǎng)絡(luò)的應(yīng)用呈現(xiàn)以信息為中心的特點,提出了信息中心網(wǎng)絡(luò)的架構(gòu)。其核心思想是采用類似URL(uniform resoure locator)的層次化命名方式對信息命名,從而方便用戶進行信息搜索和信息獲取。這種架構(gòu)將以IP地址為中心過渡到以信息為中心,網(wǎng)絡(luò)節(jié)點通過緩存數(shù)據(jù)可以有效降低信息冗余,加快對終端用戶的響應(yīng)速度。近幾年,出現(xiàn)了一種新興的減少冗余傳輸?shù)募夹g(shù):移動邊緣計算,最初于2013年在IBM和Nokia Siemens共同推出的一款計算平臺上出現(xiàn)。之后,各大電信標準組織開始推動移動邊緣計算的規(guī)范化工作。根據(jù)歐洲電信標準協(xié)會(European telecommunications standards institute,ETSI)的定義[9],移動邊緣計算側(cè)重在移動網(wǎng)邊緣提供IT服務(wù)環(huán)境和云計算能力,強調(diào)靠近移動用戶以減少網(wǎng)絡(luò)操作和服務(wù)交付的時延。
在SDN發(fā)展初期,網(wǎng)絡(luò)測量主要以控制平面主導(dǎo)的測量方法為主。著名的開源SDN網(wǎng)絡(luò)控制器ONOS(open network operating system)的網(wǎng)絡(luò)監(jiān)測模塊就是直接通過OpenFlow等南向協(xié)議讀取網(wǎng)絡(luò)設(shè)備的流表信息,然后進行路由環(huán)路、黑洞等網(wǎng)絡(luò)檢錯分析。但這種方案過多依賴于控制平面,面臨額外開銷過高、無法做出更加精細的網(wǎng)絡(luò)測量等問題。
在P4[10]編程語言提出后,極大擴展了數(shù)據(jù)平面的靈活性,測量方法也開始轉(zhuǎn)向數(shù)據(jù)平面主導(dǎo)。FlowRadar[11]就是一種基于P4語言的流粒度網(wǎng)絡(luò)監(jiān)控系統(tǒng),它通過在數(shù)據(jù)平面對流的編碼及各跳間編碼的對比得到丟包率等信息。在后續(xù)的工作中,F(xiàn)lowRader將系統(tǒng)的監(jiān)控粒度進一步細化到包級別,可以得到數(shù)據(jù)包時間戳、TTL(time to live)值等很難被傳統(tǒng)網(wǎng)絡(luò)設(shè)備收集的信息。P4聯(lián)盟也提出了帶內(nèi)網(wǎng)絡(luò)遙測(in-band network telemetry,INT)框架[12]用于收集和匯報網(wǎng)絡(luò)狀態(tài)信息??梢栽诓恍枰刂破矫娓深A(yù)的情況下,通過添加在真實數(shù)據(jù)包頭部中的遙測命令和遙測信息完成對網(wǎng)絡(luò)實時狀態(tài)的監(jiān)控。通過INT框架,控制器可以直接實時收集數(shù)據(jù)平面上在數(shù)據(jù)包轉(zhuǎn)發(fā)過程中真實經(jīng)歷的時延、抖動、誤碼率、信號強度、隊列長度、丟包率等網(wǎng)絡(luò)信息,而不需要發(fā)送其他特殊的探測包。
第1節(jié)中提到的新的未來網(wǎng)絡(luò)體系架構(gòu)都有各自的特點和優(yōu)勢,然而,它們不能或者只能部分解決當(dāng)前基礎(chǔ)網(wǎng)絡(luò)建設(shè)者面臨的OTT業(yè)務(wù)飛速發(fā)展以及信息存在大量冗余等挑戰(zhàn)。本節(jié)將會具體介紹為解決基礎(chǔ)網(wǎng)絡(luò)建設(shè)者當(dāng)前面臨的挑戰(zhàn)而提出的服務(wù)定制網(wǎng)絡(luò)。
1)提供差異化服務(wù)質(zhì)量。
從交通系統(tǒng)中得到啟示,不同的交通方式運載能力不同,速度不同,收費也不同。SCN網(wǎng)絡(luò)中希望可以為內(nèi)容提供商等用戶提供差異化服務(wù),構(gòu)建差異化的網(wǎng)絡(luò)切片,用戶可以根據(jù)特定的需求以及經(jīng)濟承受能力選擇適合的服務(wù)等級,從而構(gòu)建良好健康的互聯(lián)網(wǎng)經(jīng)濟模式。OTT業(yè)務(wù)在該模式下也得到限制,對網(wǎng)絡(luò)的沖擊也可以迎刃而解。
2)細粒度網(wǎng)絡(luò)測量與分析。
隨著網(wǎng)絡(luò)的規(guī)模越來越大,其中的資源種類越來越豐富,對于網(wǎng)絡(luò)中資源的管理變得越來越復(fù)雜,大數(shù)據(jù)技術(shù)和人工智能技術(shù)的產(chǎn)生為網(wǎng)絡(luò)的管理提供了一種新的思路,然而讓網(wǎng)絡(luò)管理的控制主體產(chǎn)生智能的前提是讓網(wǎng)絡(luò)底層能夠產(chǎn)生足夠的實時訓(xùn)練數(shù)據(jù),因此,如何獲取這些數(shù)據(jù)成了關(guān)鍵點。SCN網(wǎng)絡(luò)中需要對網(wǎng)絡(luò)中的參數(shù)實現(xiàn)實時的細粒度測量,并借助大數(shù)據(jù)和人工智能技術(shù)對網(wǎng)絡(luò)的狀態(tài)進行分析,實現(xiàn)網(wǎng)絡(luò)的可視化,為網(wǎng)絡(luò)的集中式管理提供數(shù)據(jù)支撐。
3)減少信息冗余。
對于信息冗余帶來的帶寬浪費問題,CDN也可以部分解決,但它是一種覆蓋網(wǎng)的方案。而SCN試圖讓網(wǎng)絡(luò)架構(gòu)本身具備避免信息冗余的能力,網(wǎng)絡(luò)具有感知內(nèi)容、網(wǎng)絡(luò)狀態(tài)的功能,然后基于大數(shù)據(jù)的智能數(shù)據(jù)挖掘與分析,實現(xiàn)全網(wǎng)內(nèi)容資源和網(wǎng)絡(luò)資源的智能調(diào)度,從而實現(xiàn)有效消減信息冗余,充分利用網(wǎng)絡(luò)基礎(chǔ)設(shè)施的能力。
4)支持現(xiàn)網(wǎng)平滑演進。
目前的網(wǎng)絡(luò)還是采用了以IP為細腰的準則,雖然存在各種問題,但也通過各種彌補手段承受住了各種考驗,SCN作為一種革命性質(zhì)的網(wǎng)絡(luò)架構(gòu),直接取代現(xiàn)網(wǎng)架構(gòu)是不現(xiàn)實的。對現(xiàn)網(wǎng)的改革一定是一個漫長的過程,也面臨著來自運營商和設(shè)備廠商的壓力。因此,為了漸進式部署,使SCN有可能被運營商等基礎(chǔ)網(wǎng)絡(luò)建設(shè)者采納,以較低的成本逐步部署到現(xiàn)網(wǎng)中,SCN當(dāng)前設(shè)計方案仍然遵循傳統(tǒng)互聯(lián)網(wǎng)中以IP為細腰的準則,數(shù)據(jù)包格式保持不變。然而,對于未來出現(xiàn)的更優(yōu)的網(wǎng)絡(luò)方案,SCN架構(gòu)也需要能夠支持。因此,SCN的設(shè)計思路之一是立足于解決現(xiàn)有的互聯(lián)網(wǎng)問題,同時符合未來的發(fā)展方向,具有可演進性。
SCN的體系架構(gòu)共包括5個平面,如圖1所示。
圖1 SCN體系架構(gòu)Fig.1 Architecture of SCN
1)最底層為基礎(chǔ)設(shè)施平面,主要由計算資源、存儲資源和網(wǎng)絡(luò)資源組成。部署的計算資源能夠支持網(wǎng)絡(luò)功能虛擬化,邊緣計算等。部署的存儲資源主要作為分布式緩存來存儲網(wǎng)絡(luò)中所傳輸?shù)男畔?,從而解決網(wǎng)絡(luò)中冗余傳輸?shù)膯栴}。
2)架構(gòu)的中間部分為控制平面,該平面的主要作用是為不同的用戶構(gòu)建不同服務(wù)質(zhì)量等級的網(wǎng)絡(luò)切片,從而為不同的用戶提供差異化的服務(wù),控制平面主要由3部分組成,分別為SDN控制器、NFV管理模塊和緩存資源管理器。
3)架構(gòu)的兩側(cè)分別為分發(fā)平面和感知平面。分發(fā)平面基于云架構(gòu)實現(xiàn),負責(zé)對網(wǎng)內(nèi)的信息資源進行智能地控制、調(diào)度和分發(fā),分發(fā)平面只負責(zé)制定策略,通過向控制平面下發(fā)指令來完成具體的操作,例如通過將應(yīng)用貼近用戶部署來降低業(yè)務(wù)的延時,通過在網(wǎng)內(nèi)優(yōu)化部署緩存來解決海量信息重復(fù)傳輸?shù)膯栴}。感知平面的主要功能是完成對網(wǎng)絡(luò)中各類參數(shù)的采集,并基于大數(shù)據(jù)技術(shù)對這些數(shù)據(jù)進行分析,分析的結(jié)果會反饋給分發(fā)和控制平面,使其能更好地管理網(wǎng)絡(luò)。
4)最后在架構(gòu)的最上層是應(yīng)用層,網(wǎng)絡(luò)管理者可以調(diào)用控制平面、分發(fā)平面和感知平面所開放的北向接口來自定義開發(fā)應(yīng)用。目前,在實現(xiàn)SCN體系架構(gòu)時,主要的挑戰(zhàn)集中在控制平面、感知平面和分發(fā)平面,針對這3個平面中的關(guān)鍵問題,下面將詳細闡述。
SCN網(wǎng)絡(luò)中除了具備傳統(tǒng)網(wǎng)絡(luò)中基本的數(shù)據(jù)轉(zhuǎn)發(fā)功能外,還能面向差異化的用戶需求提供不同等級的QoS保障,解決OTT業(yè)務(wù)對網(wǎng)絡(luò)的沖擊,保證關(guān)鍵業(yè)務(wù)的服務(wù)質(zhì)量。SCN網(wǎng)絡(luò)主要通過網(wǎng)絡(luò)切片技術(shù)來提供差異化的服務(wù),在網(wǎng)絡(luò)切片中,具體有2項關(guān)鍵技術(shù),分別是流量識別和流量端到端的QoS保障。
流量識別技術(shù)主要是在流量入口處根據(jù)數(shù)據(jù)流量的包頭信息對流量進行識別,然后打上分類的標簽。標簽分為2個,其一是流量的路徑標簽用來標識流量的轉(zhuǎn)發(fā)路徑,另一個是流量的QoS標簽用來標識流量的QoS等級。
流量QoS保障技術(shù)具體分為3個方面。第一方面是基于SDN的SR(segment routing)方案來實現(xiàn)動態(tài)路徑規(guī)劃,集中式的SDN控制器負責(zé)收集底層鏈路的拓撲信息和實時的帶寬占用信息,然后為不同的業(yè)務(wù)流量分配不同的路徑,路徑信息通過MPLS(multi-protocol label switching)路徑標簽實現(xiàn),并通過SDN的方式對路徑進行控制。
基于SDN的SR機制只是通過控制轉(zhuǎn)發(fā)路徑來實現(xiàn)負載均衡和流量調(diào)度,第二方面,我們還加入了基于隊列控制粒度的QoS保障機制實現(xiàn)對流量更進一步的精細控制,在交換設(shè)備的每個端口實現(xiàn)隊列優(yōu)先級調(diào)度算法,根據(jù)流量的QoS標簽進行調(diào)度,該QoS標簽可以是MPLS中的EXP字段,也可以是IP中的TOS字段,圖2詳細說明了端到端精細的QoS保障機制。具體地,使用交換機中內(nèi)置的隊列,來使不同優(yōu)先級的流量進入不同的隊列進行處理,交換機端口上的隊列創(chuàng)建是通過SDN控制器實現(xiàn),同時,控制器還需要通過南向協(xié)議來指定流量進入的隊列。此外,在每個端口還可以使用隊列來預(yù)留一部分帶寬,保障突發(fā)的關(guān)鍵性業(yè)務(wù)。
圖2 端到端精細化QoS保障Fig.2 End-to-end fine-grained QoS guarantee
最后一方面是切片內(nèi)預(yù)防突發(fā)流量的技術(shù),在網(wǎng)絡(luò)已為切片預(yù)留資源的情況下,切片內(nèi)仍可能發(fā)生流量突發(fā),進而影響切片內(nèi)的業(yè)務(wù)QoS。SDN網(wǎng)絡(luò)控制器集中決策限制了反應(yīng)時間。因此,在SCN架構(gòu)中,設(shè)計了提前由控制平面提前下發(fā)備用路由策略,并且設(shè)置相應(yīng)的突發(fā)門限。數(shù)據(jù)平面構(gòu)建處理邏輯,在網(wǎng)絡(luò)中流量突發(fā)時,擁塞節(jié)點能快速判斷反應(yīng),通知上游節(jié)點啟動備用路由,減少擁塞節(jié)點流量壓力。
SCN中的感知平面主要通過在高速網(wǎng)絡(luò)設(shè)備上采集底層網(wǎng)絡(luò)狀態(tài)(包括鏈路層、網(wǎng)絡(luò)層、傳輸層和應(yīng)用層),然后對收集的信息進行大數(shù)據(jù)處理分析,根據(jù)分析結(jié)果對網(wǎng)絡(luò)進行自動化的運維管理(包括故障檢測預(yù)警、內(nèi)容貼近用戶部署、流量自適應(yīng)調(diào)度等),從而提高網(wǎng)絡(luò)用戶的服務(wù)質(zhì)量。SCN的感知平面主要包含如下4個方面的能力。
1)多維信息采集能力。目前通常在應(yīng)用層基于DPI(deep packet inspection)等技術(shù)以流為單位對網(wǎng)絡(luò)流量中蘊含的信息進行采集挖掘,并向訪問控制或流量調(diào)度等模塊提供處理依據(jù)。相比傳統(tǒng)較少維度的信息采集手段,SCN中的感知平面強調(diào)多維網(wǎng)絡(luò)信息的采集能力。除了通過DPI等手段挖掘應(yīng)用層流量蘊含的信息,感知平面還將對鏈路層的信號強弱、誤碼率等信息,網(wǎng)絡(luò)層的丟包率、排隊時延、傳輸路徑等信息,傳輸層的滑動窗口大小、重傳率等信息進行識別和采集,從而完成整個協(xié)議棧自頂向下的全棧多維信息采集。相比單一的應(yīng)用層網(wǎng)絡(luò)信息采集,感知平面的多維信息采集能力將給集中式控制器提供大量的數(shù)據(jù)分析支撐,提供控制器從鏈路層到應(yīng)用層跨層的網(wǎng)絡(luò)優(yōu)化能力。
2)高速鏈路帶內(nèi)測量感知能力。在高速鏈路上進行多維的網(wǎng)絡(luò)信息采集將會遇到較大的性能挑戰(zhàn)。由于路由器或交換機進行數(shù)據(jù)包轉(zhuǎn)發(fā)的速率非常高,且數(shù)據(jù)包本身在網(wǎng)絡(luò)設(shè)備中需要經(jīng)歷多個流水段的快速處理,并沒有太多的時間空隙可以用來完成多維信息的提取和處理。如果采用傳統(tǒng)方法,從網(wǎng)絡(luò)設(shè)備的控制平面或管理平面通過協(xié)議詢問數(shù)據(jù)平面的狀態(tài),那么顯然會引入大量的時延,進而無法匹配高速鏈路線速轉(zhuǎn)發(fā)的需求。目前,文獻[12]提出使用INT技術(shù),由網(wǎng)絡(luò)設(shè)備自身在數(shù)據(jù)平面直接采集底層的鏈路狀態(tài),并裝填在數(shù)據(jù)包的包頭上,通過數(shù)據(jù)包自身攜帶出網(wǎng)絡(luò),最終轉(zhuǎn)發(fā)到集中式控制器上。對數(shù)據(jù)包頭的任意修改需要用到協(xié)議無關(guān)轉(zhuǎn)發(fā)技術(shù)?;贗NT的網(wǎng)絡(luò)狀態(tài)感知方法能夠盡可能地降低控制器對網(wǎng)絡(luò)設(shè)備底層鏈路狀態(tài)的主動詢問開銷。基于INT這樣的技術(shù),SCN的感知平面還將研究如何進一步壓縮底層鏈路狀態(tài)采集的開銷,從而減少路由器的處理負擔(dān)和上報給控制器的數(shù)據(jù)包數(shù)量及鏈路帶寬消耗。
3)控制器大數(shù)據(jù)分析處理能力。集中式控制器面臨著在線實時分析底層傳遞來的大量網(wǎng)絡(luò)鏈路狀態(tài)數(shù)據(jù)的挑戰(zhàn)。這里的挑戰(zhàn)有2個方面:①底層網(wǎng)絡(luò)上傳而來的數(shù)據(jù)具有多維的屬性,甚至某些數(shù)據(jù)是非結(jié)構(gòu)化的,需要使用更強的語義對其進行描述;②高速鏈路上傳而來的數(shù)據(jù)量非常大,且處理的實時性要求很高,如何設(shè)計感知平面面向高速網(wǎng)絡(luò)的硬件架構(gòu)及大數(shù)據(jù)分析處理算法具有較大的挑戰(zhàn)。在這里,SCN的感知平面通過使用分布式的服務(wù)器集群對底層鏈路狀態(tài)進行處理。同時也會使用一些采樣算法或者按需狀態(tài)上報的機制降低數(shù)據(jù)分析的復(fù)雜度,即不是每個包或每個流都進行采樣和控制器上報,而是在數(shù)據(jù)平面檢測到異常之后再按需進行異常狀態(tài)或異常網(wǎng)絡(luò)行為上報。
4)自動化的網(wǎng)絡(luò)管理能力。當(dāng)?shù)讓泳W(wǎng)絡(luò)狀態(tài)出現(xiàn)異常時,感知平面通過基于機器學(xué)習(xí)的大數(shù)據(jù)分析檢測算法可以自動識別出相應(yīng)的異常,從而觸發(fā)對應(yīng)的異常處理流程。例如,當(dāng)鏈路上的網(wǎng)絡(luò)設(shè)備的排隊時延明顯增高時,控制器能夠通過上面提到的帶內(nèi)遙測機制發(fā)現(xiàn)這種情況,并通過歷史經(jīng)驗猜測可能是由于上游交換機發(fā)生故障而導(dǎo)致鏈路擁塞,然后將這種猜測上報給上層的管理人員。也可以通過深度學(xué)習(xí)[13]等統(tǒng)計機器學(xué)習(xí)方法利用歷史的流量數(shù)據(jù)對集中式控制器進行長時間訓(xùn)練,使其具備一定的自動化事件處理能力。如果控制器的智能足夠高時,甚至可以由控制器自身主動發(fā)送故障修復(fù)指令,降低運維人員的工作量。除了網(wǎng)絡(luò)故障檢測及溯源分析,類似的基于大數(shù)據(jù)的網(wǎng)絡(luò)自動化管理能力還可以輔助運維人員進行網(wǎng)絡(luò)流量自適應(yīng)調(diào)度、內(nèi)容自動按需部署、網(wǎng)絡(luò)設(shè)備自適應(yīng)開關(guān)省電等工作。
SCN的分發(fā)平面通過將網(wǎng)絡(luò)和計算融合,網(wǎng)絡(luò)和存儲融合,基于云架構(gòu)實現(xiàn)信息資源的智能控制和調(diào)度。
目前新型的網(wǎng)絡(luò)應(yīng)用及服務(wù)對計算資源的需求日益增加,網(wǎng)絡(luò)功能虛擬化、邊緣計算等技術(shù)也得到了學(xué)術(shù)界和產(chǎn)業(yè)界的廣泛認可。在SCN的分發(fā)平面設(shè)計中,將網(wǎng)絡(luò)與計算融合,這樣做主要有如下2點好處:結(jié)合邊緣計算技術(shù),將網(wǎng)絡(luò)應(yīng)用部署到用戶側(cè),降低業(yè)務(wù)的時延,同時減輕了核心網(wǎng)的負載;結(jié)合網(wǎng)絡(luò)功能虛擬化技術(shù),將網(wǎng)絡(luò)功能部署在通用的服務(wù)器上,為網(wǎng)絡(luò)功能的部署和管理提供了更加靈活的方式。
如之前所述,目前網(wǎng)絡(luò)中存在著嚴重的冗余傳輸問題,因此,在SCN架構(gòu)中,我們將網(wǎng)絡(luò)和存儲融合,在網(wǎng)絡(luò)中的不同位置部署緩存,這方面的研究近幾年在信息中心網(wǎng)絡(luò)架構(gòu)中已經(jīng)受到了極大的關(guān)注,以命名數(shù)據(jù)網(wǎng)絡(luò)(named data networking, NDN)為例,它保留了IP協(xié)議棧的沙漏模型設(shè)計,但是用類似URL的分層內(nèi)容命名代替了原來的IP細腰層。同時,路由和轉(zhuǎn)發(fā)也是基于內(nèi)容名字,并使用最長前綴匹配的方法。另外,內(nèi)容可以在內(nèi)容源服務(wù)器獲取,也可以在路由器節(jié)點命中。可以看出,網(wǎng)內(nèi)緩存的能力不僅可以節(jié)省有限的帶寬資源,還能夠提高網(wǎng)絡(luò)的性能。
目前SCN架構(gòu)中將計算、存儲和網(wǎng)絡(luò)融合的思想得到了學(xué)術(shù)界和產(chǎn)業(yè)界的肯定,但是,SCN架構(gòu)在落地的過程中,主要面臨兩方面的問題:①如何選擇一種新型的架構(gòu),將網(wǎng)絡(luò)、計算、存儲資源進行整合,支持分發(fā)平面進行統(tǒng)一的管理和調(diào)度,同時,該架構(gòu)需要在現(xiàn)有的IP架構(gòu)上實現(xiàn)平滑演進;②如何針對業(yè)務(wù)的差異化需求在網(wǎng)內(nèi)部署存儲資源,實現(xiàn)業(yè)務(wù)的低延時傳輸。針對第一方面的問題,本團隊提出了SDNCC[14]方案,整體架構(gòu)如圖3所示。該架構(gòu)提出了網(wǎng)絡(luò)元素的概念,將各種資源都看做網(wǎng)絡(luò)中的元素,并在控制層面設(shè)計了針對不同資源的管理模塊。針對第二方面問題,本團隊提出了基于內(nèi)容差異化的信息中心網(wǎng)絡(luò)緩存資源自動分配和管理機制[15],實現(xiàn)對不同內(nèi)容請求者提供差異化的內(nèi)容服務(wù)。
圖3 SDNCC架構(gòu)Fig.3 Architecture of SDNCC
本文提出了一種面向服務(wù)定制的未來網(wǎng)絡(luò)架構(gòu),對網(wǎng)絡(luò)進行切片,利用優(yōu)化路由選路和端到端的QoS保障,為業(yè)務(wù)提供差異化的服務(wù)。通過將計算和存儲資源融合,可以有效解決網(wǎng)絡(luò)中冗余傳輸?shù)膯栴}。同時,在網(wǎng)絡(luò)中創(chuàng)新性地增加了一層感知平面,充分利用網(wǎng)絡(luò)中的數(shù)據(jù)來幫助控制平面對網(wǎng)絡(luò)進行優(yōu)化管理。在未來的工作中,依然存在著各類問題和挑戰(zhàn)需要解決,例如網(wǎng)絡(luò)功能模型的抽象、定義與建模;面向確定性時延的網(wǎng)絡(luò)QoS保障方案與機理;網(wǎng)絡(luò)、計算、存儲一體化融合技術(shù)的細化等。
[1] 中國互聯(lián)網(wǎng)絡(luò)信息中心.中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[EB/OL].[2017-09-12].http://www.cnnic.cn/hlwfzyj/hlwxzbg/hlwtjbg/201407/P020140721507223212132.pdf.
[2] Amazon found every 100ms of latency cost them 1% in sales[EB/OL].(2008-08-02)[2017-09-12]. http://blog.gigaspaces.com/amazon-found-every-100ms-of-latency-costthem-1-in-sales.
[3] Google VP Marissa Mayer Talk at web[EB/OL].[2017-11-01].http://glinden.blogspot.com/2006/11/marissa-mayer-at-web-20.html.
[4] MALIK Om. The Storage vs bandwidth debate[EB/OL].[2017-09-12].http://gigaom.com/2011/06/24/the-storage-vs-bandwidth-debate/.
[5] MANYIKA J, CHUI M, BROWN B, et al. Big data: The next frontier for innovation, competition, and productivity[R]. [S.l.]: McKinsey Global Institute, 2011.
[6] 5G-PPP, ERTICO, EFFRA, EUTC, NEM, CONTINUA and Networld2020 ETP, 5G empowering vertical industries: White Paper[S].[S.l.]:5G PPP, 2016.
[7] ONF TR-526. Applying SDN Architecture to 5G Slicing[S]. [S.l.]: 5G PPP, 2016.
[8] CHOI J, HAN J, CHO E, et al. A survey on content-oriented networking for efficient content delivery[J]. IEEE Communications Magazine,2011,49(3):121-127.
[9] HU Y C, PATEL M, SABELLA D, et al. Mobile edge computing—A key technology towards 5G[J]. ETSI White Paper, 2015, 11(11): 1-16.
[10] BOSSHART P, DALY D, GIBB G, et al. P4: Programming protocol-independent packet processors[J]. ACM SIGCOMM Computer Communication Review, 2014, 44(3): 87-95.
[11] LI Y, MIAO R, KIM C, et al. FlowRadar: A Better NetFlow for Data Centers[C]// Proceeding NSDI'16 Proceedings of the 13th Usenix Conference on Networked Systems Design and Implementation(NSDI). Berkeley, CA, USA:ACM, 2016: 311-324.
[12] KIM C, SIVARAMAN A, KATTA N, et al. In-band network telemetry via programmable dataplanes[EB/OL].[2017-09-10]. http://web.mit.edu/anirudh/www/int-demo.pdf.
[13] SILVER, D, HUANG A, MADDISION C J, et al. Mastering the game of Go with deep neural networks and tree search[J]. Nature, 2016,529 (1): 484-489.
[14] HUO R, YU F R, HUANG T, et al. Software defined networking, caching, and computing for green wireless networks[J]. IEEE Communications Magazine, 2016, 54(11): 185-193.
[15] HUO R, XIE R, ZHANG H, et al. What to cache: differentiated caching resource allocation and management in information-centric networking[J]. China Communications, 2016, 13(12): 261-276.
(編輯:魏琴芳)