蔡岳平 樊欣唯 王昌平
(重慶大學(xué)通信工程學(xué)院 重慶 400030)
?
光電混合數(shù)據(jù)中心網(wǎng)絡(luò)負(fù)載均衡流量調(diào)度機(jī)制
蔡岳平 樊欣唯 王昌平
(重慶大學(xué)通信工程學(xué)院 重慶 400030)
光電混合數(shù)據(jù)中心網(wǎng)絡(luò)采用傳統(tǒng)的RED(Random Early Detection)流量調(diào)度機(jī)制容易造成數(shù)據(jù)流丟失,同時(shí)在等價(jià)轉(zhuǎn)發(fā)路徑的選擇上存在隨機(jī)性。提出一種基于流量預(yù)測矩陣的負(fù)載均衡流量調(diào)度機(jī)制。該機(jī)制利用軟件定義網(wǎng)絡(luò),具有全局視角的優(yōu)點(diǎn),周期性統(tǒng)計(jì)網(wǎng)絡(luò)流量,建立流量預(yù)測矩陣。通過流量預(yù)測矩陣動態(tài)計(jì)算數(shù)據(jù)流在多條等價(jià)鏈路上的轉(zhuǎn)發(fā)概率,并按此概率完成下一個周期的轉(zhuǎn)發(fā)。同時(shí),利用電交換鏈路單獨(dú)處理突發(fā)流量,提高網(wǎng)絡(luò)吞吐量,實(shí)現(xiàn)網(wǎng)絡(luò)負(fù)載均衡。在光電混合數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)上建立合成流量模型進(jìn)行仿真實(shí)驗(yàn)和性能分析。結(jié)果表明,與傳統(tǒng)的RED流量調(diào)度機(jī)制相比,該機(jī)制能夠提高網(wǎng)絡(luò)吞吐量、降低數(shù)據(jù)流丟棄率。
光電混合數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu) 軟件定義 流量調(diào)度 負(fù)載均衡
隨著云計(jì)算技術(shù)的不斷發(fā)展,數(shù)據(jù)中心內(nèi)部的通信量呈爆炸式增長,對數(shù)據(jù)中心網(wǎng)絡(luò)帶來巨大的帶寬需求[1]。云計(jì)算[2]廣泛應(yīng)用于搜索引擎、在線地圖、社交網(wǎng)絡(luò)等數(shù)據(jù)密集型應(yīng)用中,而這些應(yīng)用的實(shí)現(xiàn)得益于高效的數(shù)據(jù)中心交換網(wǎng)絡(luò)[3-7]。一個擁塞的數(shù)據(jù)中心網(wǎng)絡(luò)通常面臨大量數(shù)據(jù)分組丟失和網(wǎng)絡(luò)吞吐量下降等問題,這會導(dǎo)致搜索的時(shí)延大、即時(shí)信息不能夠被迅速轉(zhuǎn)發(fā)等,降低服務(wù)的質(zhì)量。
文獻(xiàn)[8-9]提出了一種混合光路由和電分組交換的數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)HWRE(Hybrid optical Wavelength Routing and Electrical packet switching),其利用基于陣列波導(dǎo)光柵路由器AWGR(Arrayed Waveguide Grating Router)的光路由技術(shù)帶來的低時(shí)延、高帶寬的光互連網(wǎng)絡(luò)與電分組交換網(wǎng)絡(luò)協(xié)同通信,解決了高帶寬需求問題。此HWRE架構(gòu)的光路由核心部分采用AWGR,與傳統(tǒng)架構(gòu)Helios[10]和c-Throng[11]采用的MEMS光交換機(jī)相比,能降低配置的時(shí)延,提高網(wǎng)絡(luò)的吞吐量。然而在此架構(gòu)中需要使用高效的流量調(diào)度機(jī)制來獲得更好的網(wǎng)絡(luò)性能。
傳統(tǒng)的隊(duì)列調(diào)度采用隨機(jī)早期檢測算法RED[19]。該算法通過計(jì)算平均隊(duì)列長度對網(wǎng)絡(luò)的擁塞程度進(jìn)行估計(jì)。當(dāng)平均隊(duì)列長度超過一定閾值時(shí),根據(jù)擁塞的程度計(jì)算將數(shù)據(jù)分組丟棄的概率,從而有效地控制平均隊(duì)列長度。在該算法中,每個輸出端口緩存隊(duì)列中維持兩個參數(shù),即隊(duì)列最小門限和最大門限。當(dāng)有新的數(shù)據(jù)流到達(dá)某隊(duì)列時(shí),計(jì)算該隊(duì)列的平均長度,若平均隊(duì)列長度小于最小門限,則把新到達(dá)的數(shù)據(jù)流放入隊(duì)列進(jìn)行緩存。若平均隊(duì)列長度超過最大門限,則將新到達(dá)的流丟棄。若平均隊(duì)列長度在最小門限和最大門限之間,則按某一概率將數(shù)據(jù)流丟棄。這種算法在一定程度上造成了數(shù)據(jù)流的丟棄,降低網(wǎng)絡(luò)吞吐量。
本文提出了一種新的負(fù)載均衡流量調(diào)度機(jī)制以解決在光電混合數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)中的流量調(diào)度問題,同時(shí)該機(jī)制利用具有集中控制優(yōu)勢的SDN技術(shù),從全局的角度掌控全網(wǎng)的流量狀態(tài)信息,并能夠根據(jù)網(wǎng)絡(luò)狀況動態(tài)調(diào)整流量調(diào)度方案,實(shí)現(xiàn)負(fù)載均衡。在HWRE架構(gòu)中,架頂交換機(jī)ToR需要在多條等價(jià)鏈路間選擇一條進(jìn)行數(shù)據(jù)轉(zhuǎn)發(fā)。本方案為每條等價(jià)鏈路動態(tài)的計(jì)算轉(zhuǎn)發(fā)概率,以實(shí)現(xiàn)負(fù)載均衡,提高網(wǎng)絡(luò)吞吐量。首先,SDN控制器對數(shù)據(jù)流量進(jìn)行周期性統(tǒng)計(jì),并依此建立、更新流量預(yù)測矩陣。在方案中,電分組交換鏈路專門用來處理突發(fā)流量,不參與等價(jià)鏈路轉(zhuǎn)發(fā)概率的計(jì)算??刂破鞲鶕?jù)流量預(yù)測矩陣,計(jì)算出每條鏈路的利用率,并根據(jù)結(jié)果求出每條鏈路的可利用率,然后對所有等價(jià)鏈路的可利用率進(jìn)行歸一化處理,得到每條等價(jià)鏈路上數(shù)據(jù)流的轉(zhuǎn)發(fā)概率,在下一個周期內(nèi),數(shù)據(jù)流按此概率完成轉(zhuǎn)發(fā)。在轉(zhuǎn)發(fā)過程中,若交換機(jī)轉(zhuǎn)發(fā)端口的隊(duì)列長度超過了設(shè)定的閾值,則將其調(diào)度至隊(duì)列長度最小的可用端口,若該端口的隊(duì)列長度依然超過閾值,則將其調(diào)度至電分組交換端口處理。
本文研究的數(shù)據(jù)流調(diào)度機(jī)制針對基于陣列波導(dǎo)光柵路由器的混合光路由AWGR與電交換的數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)(HWRE)[13]。該架構(gòu)充分利用光傳輸網(wǎng)絡(luò)具有的高帶寬、高吞吐量、低能耗等優(yōu)點(diǎn),減少電分組交換機(jī)的部署,且光路由網(wǎng)絡(luò)選用光無源器件實(shí)現(xiàn),保證了網(wǎng)絡(luò)的可靠性。
1.1 陣列波導(dǎo)光柵路由器(AWGR)
陣列波導(dǎo)光柵路由器[11-12]AWGR(Arrayed Waveguide Grting Router)是該架構(gòu)光路由的核心器件,無需配置就能夠根據(jù)循環(huán)波長路由特性直接實(shí)現(xiàn)光波長路由。AWGR具有的循環(huán)波長路由特性可以將不同波長的光信號從同一輸入端口路由到不同的輸出端口。
圖1 陣列波導(dǎo)光柵路由器
1.2 光電混合數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)
以電分組交換機(jī)EPS(Electronic Packet Switch)為核心的電分組交換網(wǎng)絡(luò)和以陣列波導(dǎo)光柵路由器為核心的光路由網(wǎng)絡(luò)構(gòu)成了光電混合數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)[13]。如圖2所示,控制平面與數(shù)據(jù)平面分離,數(shù)據(jù)平面由AWGR、EPS、ToR等構(gòu)成,控制平面由SDN控制器構(gòu)成。
圖2 光電混合數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)(HWRE)
在HWRE架構(gòu)中數(shù)據(jù)流可以經(jīng)過光路由網(wǎng)絡(luò)傳輸,也可以選擇電交換網(wǎng)絡(luò)傳輸,具體的傳輸路徑由SDN控制平面進(jìn)行集中控制選擇。當(dāng)路徑選擇光路由路徑時(shí),網(wǎng)絡(luò)中的上行數(shù)據(jù)在架頂交換機(jī)的上行端口處被調(diào)制到合適波長的光載波上,然后通過AWGR將輸入的光信號路由到相應(yīng)的輸出端口,傳輸?shù)侥康腡oR,由目的交換機(jī)將信號進(jìn)行解復(fù)用后轉(zhuǎn)發(fā)到相應(yīng)的服務(wù)器。數(shù)據(jù)經(jīng)過電交換網(wǎng)絡(luò)傳輸時(shí),ToR將數(shù)據(jù)調(diào)制到光載波上轉(zhuǎn)發(fā)到核心電分組交換機(jī),核心電分組交換機(jī)將光信號轉(zhuǎn)換成為電信號后進(jìn)行處理,然后再將數(shù)據(jù)調(diào)制到光載波上通過光纖傳輸給目的ToR。目的ToR將接收到的光信號轉(zhuǎn)換成為電信號后轉(zhuǎn)發(fā)給相應(yīng)的服務(wù)器。
在HWRE架構(gòu)中,當(dāng)使用固定波長激光器作為光源時(shí),各ToR間的光路徑是固定的,且只能通過一條路徑分擔(dān)負(fù)載。而當(dāng)使用波長可調(diào)諧激光器作為光源時(shí),ToR在數(shù)據(jù)轉(zhuǎn)發(fā)的時(shí)候,可以在多條等價(jià)鏈路間進(jìn)行選擇。由于數(shù)據(jù)中心網(wǎng)絡(luò)的流量大部分持續(xù)時(shí)間較短,多為突發(fā)流量,流量在大小和時(shí)間上分布不均勻,因此我們采用電分組交換機(jī)專門處理突發(fā)流量。
圖3是HWRE架構(gòu)基于SDN的負(fù)載均衡流量調(diào)度機(jī)制總體設(shè)計(jì),共包含三個功能模塊:流量數(shù)據(jù)的收集,流量預(yù)測矩陣的建立和鏈路轉(zhuǎn)發(fā)概率的計(jì)算。首先,各架頂交換機(jī)ToR以間隔時(shí)間T為周期,統(tǒng)計(jì)本周期內(nèi)從每個ToR各端口鏈路轉(zhuǎn)發(fā)到其他ToR的數(shù)據(jù)流量,并上報(bào)至控制器??刂破鞲鶕?jù)收集的流量數(shù)據(jù)建立本周期的流量矩陣,并依此計(jì)算下一周期的預(yù)測矩陣。根據(jù)流量預(yù)測矩陣,計(jì)算得到每條等價(jià)鏈路上數(shù)據(jù)流的轉(zhuǎn)發(fā)概率。在新的周期內(nèi),數(shù)據(jù)流按此概率完成轉(zhuǎn)發(fā)。在數(shù)據(jù)流轉(zhuǎn)發(fā)時(shí),若交換機(jī)轉(zhuǎn)發(fā)端口的隊(duì)列長度超過了閾值,則將其調(diào)度至AWGR中隊(duì)列長度最小的可用端口,若該端口的隊(duì)列長度依然超過其閾值,則將其調(diào)度至電分組交換端口做轉(zhuǎn)發(fā)或丟棄處理。
圖3 HWRE數(shù)據(jù)流調(diào)度方案總體設(shè)計(jì)
研究人員發(fā)現(xiàn),數(shù)據(jù)中心網(wǎng)絡(luò)的流量具有突發(fā)性的特點(diǎn),當(dāng)時(shí)間跨度超過150 s時(shí),其流量矩陣難以預(yù)測[15,17]。然而文獻(xiàn)[10]研究發(fā)現(xiàn),在1 s的時(shí)間周期內(nèi)數(shù)據(jù)中心網(wǎng)絡(luò)流量并沒有明顯的變化(設(shè)定為大于20%的改變)。此結(jié)果表明,在細(xì)時(shí)間粒度內(nèi)流量矩陣具有可預(yù)測性。因此本文選擇統(tǒng)計(jì)周期時(shí)間為1 s進(jìn)行流量數(shù)據(jù)的收集與流量預(yù)測矩陣的建立。
本文在光電混合數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)上進(jìn)行研究架頂交換機(jī)完成對流量數(shù)據(jù)的收集、匯總、匯報(bào)和更新。
2.1 流量預(yù)測矩陣
流量預(yù)測矩陣的建立是整個調(diào)度機(jī)制的基礎(chǔ)和創(chuàng)新點(diǎn)。首先,各架頂交換機(jī)ToR以間隔時(shí)間T(1 s)為周期,統(tǒng)計(jì)本周期內(nèi)從一個ToR的各端口轉(zhuǎn)發(fā)到其他ToR的數(shù)據(jù)流量,并同時(shí)上報(bào)至SDN控制器??刂破魇盏礁鱐oR上報(bào)的信息后,對每個端口收到的數(shù)據(jù)流進(jìn)行統(tǒng)計(jì),建立每臺ToR上各等價(jià)鏈路本周期的流量矩陣MnT,流量矩陣對應(yīng)此ToR的端口號和轉(zhuǎn)發(fā)至其它各ToR的統(tǒng)計(jì)流量和。通過本周期流量矩陣MnT建立下一周期該ToR的預(yù)測矩陣,根據(jù)公式:PM(n+1)T=MnT+γ×MnT。其中(0<γ<1)為調(diào)整因子,用以下一周期容納突發(fā)流量。在本文中,我們按照文獻(xiàn)[10]的研究,選取γ=0.2。流量預(yù)測矩陣的建立為轉(zhuǎn)發(fā)概率的計(jì)算提供依據(jù),控制器根據(jù)預(yù)測矩陣PM(n+1)T計(jì)算下一個周期的數(shù)據(jù)流在各條鏈路上的轉(zhuǎn)發(fā)概率,以實(shí)現(xiàn)負(fù)載均衡的目的。
2.2 轉(zhuǎn)發(fā)概率的計(jì)算
2.3 算 法
下面我們對流量調(diào)度算法進(jìn)行分析,其計(jì)算復(fù)雜度為O(n2)。算法1是對流量調(diào)度算法的總體描述。T表示統(tǒng)計(jì)的周期時(shí)間,F(xiàn)nT表示第n個周期時(shí)流的統(tǒng)計(jì)信息集,PMnT表示本周期的流量預(yù)測矩陣。當(dāng)一個新流到達(dá)一臺架頂交換機(jī)ToR的時(shí)候,算法被觸發(fā),算法根據(jù)流量矩陣為新流提供一條轉(zhuǎn)發(fā)路徑。首先,當(dāng)新流f到達(dá)后,ToR會將其統(tǒng)計(jì)信息添加至第n個周期時(shí)流量的統(tǒng)計(jì)信息集FnT中并存儲在緩存當(dāng)中,在nT時(shí)刻打包發(fā)送給控制器??刂破魇盏紽nT的信息后,據(jù)此建立下一周期的流量預(yù)測矩陣(算法2至4行)。與此同時(shí),觸發(fā)子算法ProbabilityCalculation(·)進(jìn)行鏈路轉(zhuǎn)發(fā)概率的計(jì)算,得到各等價(jià)鏈路的轉(zhuǎn)發(fā)概率。在轉(zhuǎn)發(fā)時(shí),當(dāng)轉(zhuǎn)發(fā)的鏈路其鏈路隊(duì)列超過閾值Threshold·path時(shí),將數(shù)據(jù)流調(diào)度至電分組交換機(jī)端口完成轉(zhuǎn)發(fā)(算法7至11行)。若電分組交換機(jī)端口處的隊(duì)列同樣超過了其閾值Threshold·EPS,則將數(shù)據(jù)流做丟棄處理(算法15至17行)。
算法1流量調(diào)度算法
輸入:G:HWRE數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)?
FnT:第n個周期時(shí)流的統(tǒng)計(jì)信息集;
PMnT:本周期的流量預(yù)測矩陣;
Cap:鏈路的容量;
Threshold·path:鏈路的隊(duì)列閾值;
Threshold·EPS:電分組交換機(jī)鏈路隊(duì)列閾值。
輸出:{
1)IF a new flow f arrives THEN
2) FnT← { f };
3) MnT←FnT;
4) PM(n+1)T←MnT;
//建立下一周期的流量預(yù)測矩陣
5) < p(i,j)> ←ProbabilityCalculation(G,PM,Cap);
//觸發(fā)轉(zhuǎn)發(fā)概率計(jì)算算法,得到鏈路轉(zhuǎn)發(fā)概率
6) f.path ←p(i,j);
//通過鏈路轉(zhuǎn)發(fā)概率選擇轉(zhuǎn)發(fā)路徑
7) IF queue.path <= Threshold.path THEN
8) f.method ←FORWARD
9) RETURN < FORWARD,f.path >
10) ELSE
11) f.path ←EPS.path
//轉(zhuǎn)發(fā)至電分組交換機(jī)端口
12) IF queue.EPS<= Threshold.EPS THEN
13) f.method ←FORWARD
14) RETURN < FORWARD, EPS.path >
15) ELSE
16) f.method ←DISCARD
17) RETURN < DISCARD,-l >;
18) END
19) END
20)END
算法2是對等價(jià)鏈路轉(zhuǎn)發(fā)概率計(jì)算算法ProbabilityCalculation(·)的描述,算法需要為等價(jià)路徑計(jì)算下一周期內(nèi)數(shù)據(jù)流的轉(zhuǎn)發(fā)概率。若等價(jià)鏈路的數(shù)量為1,即沒有等價(jià)鏈路的時(shí)候,其轉(zhuǎn)發(fā)概率為1(算法6至8行)。否則,首先計(jì)算第i臺ToR第j條等價(jià)鏈路的利用率,而后用1減去鏈路的利用率得到鏈路可利用率并做歸一化處理,得到等價(jià)鏈路上的轉(zhuǎn)發(fā)概率p(i,j)(算法2至5行)。
算法2轉(zhuǎn)發(fā)概率計(jì)算算法
輸入:G:HWRE數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)?
PM(n+1)T:第n+1個周期的流量預(yù)測矩陣;
Capj.1≤j≤J:第j條鏈路的容量;
J:等價(jià)鏈路的數(shù)量。
輸出:
:第i臺ToR第j條等價(jià)鏈路的轉(zhuǎn)發(fā)概率。
1) IF J >1 THEN
2) u(i,j)←CalculateUtil (G,);
//計(jì)算第i臺ToR第j條等價(jià)鏈路的利用率
3) Ava(i,j)←1-u(i,j);
//計(jì)算鏈路可利用率
4)
←Normalize();
//歸一化得到轉(zhuǎn)發(fā)概率
5) RETURN < p(i,j)>;
6) ELSE;
7) < p(i,j)>←1;
8) RETURN < p(i,j)>;
9) END
本節(jié)我們在HWRE架構(gòu)上提出的調(diào)度機(jī)制進(jìn)行仿真實(shí)驗(yàn)分析。通過對比采用RED算法的傳統(tǒng)流量調(diào)度機(jī)制,本文展示了負(fù)載均衡流量調(diào)度機(jī)制在網(wǎng)絡(luò)吞吐量、流丟棄率方面的性能優(yōu)勢。此外,還分析對比不同光源部署方案對網(wǎng)絡(luò)性能的影響。
3.1 仿真設(shè)置
網(wǎng)絡(luò)拓?fù)洌罕疚倪x取含有8臺ToR的光電混合數(shù)據(jù)中心網(wǎng)絡(luò)HWRE架構(gòu)進(jìn)行性能評價(jià)。架構(gòu)中每臺ToR有48個端口,其緩存為512 MB,則平均每個端口的緩存隊(duì)列最大可以達(dá)到10.41 MB。每臺ToR交換機(jī)分別有7個向上的端口與光路由網(wǎng)絡(luò)互連和1個向上的端口與電分組交換網(wǎng)絡(luò)相連,端口速率為10 Gbps。
流量模型本文根據(jù)文獻(xiàn)[13-15]對數(shù)據(jù)中心內(nèi)部流量特征的研究分析結(jié)論模擬產(chǎn)生數(shù)據(jù)中心集群內(nèi)流量。其研究表明,企業(yè)級數(shù)據(jù)中心網(wǎng)絡(luò)的邊緣層交換機(jī)到達(dá)的活動流數(shù)量為1 000~5 000條/s。該文獻(xiàn)還對數(shù)據(jù)中心的數(shù)據(jù)流大小進(jìn)行分析,結(jié)果表明小于10 KB的數(shù)據(jù)流占總活動流數(shù)量的80%,而量大的數(shù)據(jù)被包含在少量的大數(shù)據(jù)流中。
根據(jù)上述研究,本文采用數(shù)據(jù)流層面的合成流量模型對兩種調(diào)度機(jī)制進(jìn)行對比分析,每種數(shù)據(jù)流所占比例如表1所示。仿真時(shí)參考文獻(xiàn)[14]的研究結(jié)論,設(shè)置ToR交換機(jī)處活動流的數(shù)量為1 000~5 000條/秒,流的到達(dá)速率服從泊松分布,到達(dá)的間隔時(shí)間服從負(fù)指數(shù)分布,共仿真10 000個流。
表1 數(shù)據(jù)流比例分布
3.2 性能評價(jià)
本文選取網(wǎng)絡(luò)吞吐量、流丟棄率作為性能評價(jià)指標(biāo)。網(wǎng)絡(luò)吞吐量是指在單位時(shí)間內(nèi)通過網(wǎng)絡(luò)傳輸并成功接收的數(shù)據(jù)總量。流丟棄率指單位時(shí)間內(nèi)數(shù)據(jù)流被丟棄的比率。首先我們將負(fù)載均衡流量調(diào)度機(jī)制應(yīng)用到在ToR上全部部署波長可調(diào)諧激光器的HWRE架構(gòu)中,仿真對比了方案在網(wǎng)絡(luò)吞吐量和流丟棄率上的性能優(yōu)勢。然后再將其分別應(yīng)用到ToR上全部部署波長可調(diào)諧激光器、混合部署固定波長激光器和波長可調(diào)諧激光器,以及全部部署固定波長激光器三種情況進(jìn)行性能對比,分析說明不同光源方案對網(wǎng)絡(luò)性能的影響?;旌喜渴鸬墓庠捶桨笧樵赥oR上部署1個波長可調(diào)諧激光器和6個固定波長激光器。
圖4是ToR上全部部署波長可調(diào)諧激光器作為光源的網(wǎng)絡(luò)架構(gòu)吞吐量仿真分析結(jié)果。結(jié)果表明,隨著數(shù)據(jù)流到達(dá)速率不斷增加,兩種調(diào)度算法的網(wǎng)絡(luò)吞吐量隨之增加,負(fù)載均衡調(diào)度算法的網(wǎng)絡(luò)吞吐量要高于傳統(tǒng)流量調(diào)度機(jī)制,隨著數(shù)據(jù)流到達(dá)速率的增大,差別越明顯。當(dāng)架頂交換機(jī)處的流到達(dá)速率為5 000條/秒時(shí),負(fù)載均衡流量調(diào)度機(jī)制的網(wǎng)絡(luò)吞吐量比傳統(tǒng)流量調(diào)度機(jī)制的網(wǎng)絡(luò)吞吐量高32.78%。這是由于當(dāng)平均隊(duì)列長度大于一定閾值時(shí),傳統(tǒng)流量調(diào)度機(jī)制采用隨機(jī)早期檢測算法按一定概率將數(shù)據(jù)流丟棄,影響了網(wǎng)絡(luò)吞吐量。而本文負(fù)載均衡的調(diào)度算法能夠根據(jù)網(wǎng)絡(luò)的狀況動態(tài)地調(diào)整各條鏈路上的流量分配,一定程度上避免擁塞,提高了吞吐量。
圖4 網(wǎng)絡(luò)吞吐量仿真對比
圖5展示了在ToR上全部部署波長可調(diào)諧激光器作為光源的網(wǎng)絡(luò)架構(gòu)中數(shù)據(jù)流丟棄率與數(shù)據(jù)流到達(dá)速率之間的關(guān)系。隨著數(shù)據(jù)流到達(dá)速率不斷增加,兩種算法的數(shù)據(jù)流丟棄率也不斷增加。當(dāng)架頂交換機(jī)處的流到達(dá)速率為5 000條/秒時(shí),負(fù)載均衡調(diào)度機(jī)制的流丟棄率比傳統(tǒng)流量調(diào)度機(jī)制的流丟棄率降低52.6%。其原因?yàn)樨?fù)載均衡調(diào)度機(jī)制能夠根據(jù)網(wǎng)絡(luò)狀態(tài)動態(tài)調(diào)整鏈路上負(fù)載的分配,同時(shí)利用電交換鏈路處理突發(fā)流量,盡可能完成數(shù)據(jù)流的轉(zhuǎn)發(fā)。因此負(fù)載均衡流量調(diào)度機(jī)制下的數(shù)據(jù)流丟棄率低于傳統(tǒng)流量調(diào)度機(jī)制下的數(shù)據(jù)流丟棄率。
圖5 流丟棄率仿真對比
負(fù)載均衡流量調(diào)度機(jī)制根據(jù)網(wǎng)絡(luò)的全局狀態(tài)對流量進(jìn)行調(diào)度。為了研究該機(jī)制在不同光源方案架構(gòu)中的性能,本文分別針對ToR上全部部署波長可調(diào)諧激光器、混合部署固定波長激光器和波長可調(diào)諧激光器以及全部部署固定波長激光器三種情況進(jìn)行仿真對比。
圖6所示為負(fù)載均衡流量調(diào)度機(jī)制應(yīng)用到三種不同的光源方案上的網(wǎng)絡(luò)吞吐量仿真結(jié)果。仿真結(jié)果顯示,隨著數(shù)據(jù)流到達(dá)速率增加,網(wǎng)絡(luò)吞吐量不斷增加。全部部署波長可調(diào)諧激光器的網(wǎng)絡(luò)吞吐量性能最優(yōu),混合部署波長固定和可調(diào)諧激光器的網(wǎng)絡(luò)吞吐量性能要優(yōu)于全部部署固定波長激光器。這是因?yàn)楣潭úㄩL激光器的架構(gòu)為各ToR之間固定地分配了鏈路,這導(dǎo)致數(shù)據(jù)流不能轉(zhuǎn)發(fā)至鏈路擁塞最輕的鏈路中,降低了鏈路利用率,影響網(wǎng)絡(luò)吞吐量。而全部部署波長可調(diào)諧激光器的架構(gòu)則可以從全局的角度靈活調(diào)度數(shù)據(jù)流,使鏈路負(fù)載更均衡,提高了網(wǎng)絡(luò)吞吐量。
圖6 不同光源網(wǎng)絡(luò)吞吐量仿真對比
圖7所示為負(fù)載均衡流量調(diào)度機(jī)制應(yīng)用到不同光源方案架構(gòu)中的數(shù)據(jù)流丟棄率對比仿真結(jié)果。結(jié)果表明,隨著流量到達(dá)速率不斷增加,數(shù)據(jù)流丟棄逐漸增大。全部部署波長可調(diào)諧激光器的數(shù)據(jù)流丟棄率最小,混合部署固定波長激光器和波長可調(diào)諧激光器的數(shù)據(jù)流丟棄率低于全部部署固定波長激光器的數(shù)據(jù)流丟棄率。表明負(fù)載均衡流量調(diào)度機(jī)制應(yīng)用在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)靈活的架構(gòu)中性能更優(yōu),其原因與不同光源網(wǎng)絡(luò)吞吐量相同。
圖7 不同光源流丟棄率仿真對比
本文提出了一種面向光電混合數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)HWRE的流量調(diào)度機(jī)制——負(fù)載均衡流量調(diào)度機(jī)制。該機(jī)制通過SDN控制器對數(shù)據(jù)流量進(jìn)行周期性統(tǒng)計(jì),建立流量預(yù)測矩陣。根據(jù)流量預(yù)測矩陣計(jì)算出每條等價(jià)鏈路的利用率并對其進(jìn)行相應(yīng)處理,得到每條等價(jià)鏈路上數(shù)據(jù)流的轉(zhuǎn)發(fā)概率,新的數(shù)據(jù)流按照此概率完成轉(zhuǎn)發(fā)。本文通過建立合成流量模型對軟件定義流量調(diào)度機(jī)制進(jìn)行性能評價(jià)。仿真結(jié)果表明,相比較傳統(tǒng)的RED流量調(diào)度機(jī)制算法,該調(diào)度機(jī)制能夠提高數(shù)據(jù)中心網(wǎng)絡(luò)的吞吐量,降低數(shù)據(jù)流丟棄率。同時(shí),當(dāng)該機(jī)制應(yīng)用于波長可調(diào)諧的光源架構(gòu)中時(shí),其性能表現(xiàn)更優(yōu)。
[1] Chen Y,Jain S,Adhikari V K,et al.A first look at inter-data center traffic characteristics via yahoo! datasets[C]//INFOCOM,2011 Proceedings IEEE.IEEE,2011:1620-1628.
[2] Armbrust,Michael,Fox,et al.Above the Clouds:A Berkeley View of Cloud Computing[J].Eecs Department University of California Berkeley,2009,53(4):50-58.
[3] Al-Fares M,Loukissas A,Vahdat A.A scalable,commodity data center network architecture[J].ACM SIGCOMM Computer Communication Review.ACM,2008,38(4):63-74.
[4] Farrington N,Porter G,Radhakrishnan S,et al.Helios:a hybrid electrical/optical switch architecture for modular data centers[J].ACM SIGCOMM Computer Communication Review,2010,40(4):339-350.
[5] Han QI,Muhammad SHIRAZ,Jie-Yao LIU,et al.Data Center Network Architecture in Cloud Computing:A Taxonomy and Review[J].Zhejiang University-SCIENCE C (Computers & Electronics),2014,15:776.
[6] Guo C,Lu G,Li D,et al.BCube:a high performance,server-centric network architecture for modular data centers[J].ACM SIGCOMM Computer Communication Review,2009,39(4):63-74.
[7] Guo C,Wu H,Tan K,et al.Dcell:a scalable and fault-tolerant network structure for data centers[J].ACM SIGCOMM Computer Communication Review.ACM,2008,38(4):75-86.
[8] Cai Yueping,Zhou Li,Yan Yao.Software Defined Data Center Network Architecture with Hybrid Optical Wavelength Routing and Electrical Packet Switching[C]//Proceedings of the Optoelectronics and Communications Conference (OECC’14),Melbourne,Australia,Jul 6-10,2014:682-684.
[9] Cai Yueping,Yan Yao,Zhou Li,et al.Architecture Design of AWGR-based Data Center Network with Hybrid Optical Wavelength Routing and Electrical Packet Switching [C]//Proceedings of the 3nd CCF Internet Conference of China (CCF ICoC’13),Shanghai,China,Jul 9-10,2013.
[10] Farrington N,Porter G,Radhakrishnan S,et al.Helios:a hybrid electrical/optical switch architecture for modular data centers[J].ACM SIGCOMM Computer Communication Review,2010,40(4):339-350.
[11] Wang G,Andersen D G,Kaminsky M,et al.c-Through:Part-time optics in data centers[C]//ACM SIGCOMM Computer Communication Review.ACM,2010,40(4):327-338.
[12] Maier M,Scheutzow M,Reisslein M.The arrayed-waveguide grating-based single-hop WDM network: an architecture for efficient multicasting[J].IEEE Journal on Selected Areas in Communications,2003,21(21):1414-1432.
[13] Benson T,Anand A,Akella A,et al.MicroTE:Fine grained traffic engineering for data centers[C]//Proceedings of the Seventh COnference on emerging Networking EXperiments and Technologies.ACM,2011:8.Centers.Proceedings of ACM SIGCOMM.
[14] Ye X,Yin Y,Yoo S J B,et al.DOS:A scalable optical switch for datacenters[C]//Proceedings of the 6th ACM/IEEE Symposium on Architectures for Networking and Communications Systems.ACM,2010:24.
[15] Yin Y,Proietti R,Ye X,et al.LIONS:An AWGR-based low-latency optical switch for high-performance computing and data centers[J].IEEE Journal of Selected Topics in Quantum Electronics,2013,19(2):3600409-3600409.
[16] 蔡岳平,晏堯,周麗,等.基于AWGR的光電混合數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)[J].計(jì)算機(jī)科學(xué)與探索,2014,8(10):1195-1205.
[17] Benson T,Akella A,Maltz D A.Network traffic characteristics of data centers in the wild[C]//Proceedings of the 10th ACM SIGCOMM conference on Internet measurement.ACM,2010:267-280.
[18] Kandula S,Sengupta S,Greenberg A,et al.The nature of data center traffic:measurements & analysis[C]//Proceedings of the 9th ACM SIGCOMM conference on Internet measurement conference.ACM,2009:202-208.
[19] Floyd S,Jacobson V.Random early detection gateways for congestion avoidance[J].IEEE/ACM Transactions on networking,1993,1(4):397-413.
[20] Benson T,Anand A,Akella A,et al.Understanding data center traffic characteristics[J].ACM SIGCOMM Computer Communication Review,2010,40(1):92-99.
LOADBALANCETRAFFICSCHEDULINGMECHANISMINANOPTICAL-ELECTRICALHYBRIDDATACENTERNETWORK
Cai Yueping Fan Xinwei Wang Changping
(CollegeofCommunicationEngineering,ChongqingUniversity,Chongqing400030,China)
Using traditional RED traffic scheduling mechanism, optical-electrical hybrid data center network is likely to cause data loss. And the choice of equal cost forwarding path is random. So we proposed a software-defined load balance traffic scheduling mechanism based on traffic prediction matrix. The mechanism uses software to define the network, which has the advantages of a global perspective, and periodic statistics of network traffic. Through this mechanism, traffic prediction matrix calculates the forwarding probability of the data stream with multiple equal links and completes the next cycle of forwarding according to this probability. Meanwhile, we use the electrical exchange link to deal with burst traffic alone to improve network throughput and achieve network load balancing. In this paper, a synthetic flow model is established on the topology of optoelectronic hybrid data center network for simulation experiment and performance analysis. The proposed mechanism can efficiently improve network throughput and reduce data loss rate.
Optical-electrical hybrid data centre network architecture Software-defined Routing algorithm Load balance
2016-10-08。國家自然科學(xué)基金項(xiàng)目(61301119);教育部留學(xué)歸國人員啟動基金項(xiàng)目(1020607820140002)。蔡岳平,副教授,主研領(lǐng)域:云計(jì)算數(shù)據(jù)中心網(wǎng)絡(luò),光通信網(wǎng)絡(luò),軟件定義網(wǎng)絡(luò)和未來互聯(lián)網(wǎng)。樊欣唯,碩士生。王昌平,碩士生。
TP3
A
10.3969/j.issn.1000-386x.2017.08.026