陳 曦
(河南科技大學(xué)網(wǎng)絡(luò)信息中心,河南 洛陽(yáng) 471023)
數(shù)據(jù)中心網(wǎng)絡(luò)是指數(shù)據(jù)中心內(nèi)部通過(guò)高速鏈路和交換機(jī)連接大量服務(wù)器的網(wǎng)絡(luò)[1]。其主要設(shè)計(jì)以優(yōu)化成本和性能為目標(biāo),要求網(wǎng)絡(luò)具有高帶寬、高可擴(kuò)展性、高容錯(cuò)性、低延遲、低開(kāi)銷的特性,這使得數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)錁?gòu)成為一個(gè)關(guān)鍵的設(shè)計(jì)元素。
本文主要分析對(duì)比了多層網(wǎng)絡(luò)和Fat tree網(wǎng)絡(luò)特點(diǎn),并根據(jù)數(shù)據(jù)中心網(wǎng)絡(luò)的多對(duì)一流量模式,利用Qualnet網(wǎng)絡(luò)仿真軟件對(duì)多層網(wǎng)絡(luò)和Fat tree網(wǎng)絡(luò)進(jìn)行了仿真,并設(shè)置了節(jié)點(diǎn)失效的情況,對(duì)比分析其容錯(cuò)性特點(diǎn)。
常見(jiàn)的數(shù)據(jù)中心網(wǎng)絡(luò)的拓?fù)淇煞譃槿N:基于交換機(jī)的拓?fù)?、基于服?wù)器的拓?fù)洹⒔粨Q機(jī)與服務(wù)器混合的拓?fù)?。在基于交換機(jī)的拓?fù)渲?,使用交換機(jī)進(jìn)行包的轉(zhuǎn)發(fā);在基于服務(wù)器的拓?fù)渲?,使用服?wù)器不僅執(zhí)行應(yīng)用服務(wù),而且還負(fù)責(zé)服務(wù)器間包的轉(zhuǎn)發(fā);而在交換機(jī)和服務(wù)器混合的拓?fù)渲?,交換機(jī)和服務(wù)器同時(shí)參與包的轉(zhuǎn)發(fā)。
常見(jiàn)的基于交換機(jī)的拓?fù)淙纾憾鄬泳W(wǎng)絡(luò),F(xiàn)at tree,VL2,Portland]等?;诜?wù)器的拓?fù)淙纾篊amcube?;诮粨Q機(jī)和服務(wù)器的混合拓?fù)溆校築Cube。本文主要介紹多兩種基于交換機(jī)的拓?fù)浣Y(jié)構(gòu)。
傳統(tǒng)的數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)渲饕遣捎脤哟渭軜?gòu)實(shí)現(xiàn)的,自上而下通常分為核心層、匯聚層和接入層。多層網(wǎng)絡(luò)作為傳統(tǒng)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)常用于企業(yè)的數(shù)據(jù)中心。典型的三層拓?fù)浣Y(jié)構(gòu)包括根級(jí)別的核心交換機(jī),中間層的匯聚交換機(jī),和連接到主機(jī)和服務(wù)器的接入交換機(jī),采用樹(shù)形結(jié)構(gòu)相連接,網(wǎng)絡(luò)中的鏈路使用以太網(wǎng)協(xié)議,服務(wù)器間為了減少?gòu)V播和提高網(wǎng)絡(luò)安全性,可以使用VLAN將其劃分不同的邏輯子網(wǎng)實(shí)現(xiàn)隔離。由于VLAN之間無(wú)法直接通信,需要通過(guò)三層交換機(jī)進(jìn)行轉(zhuǎn)發(fā)。通過(guò)二層交換技術(shù)生成樹(shù)協(xié)議(STP)來(lái)管理拓?fù)?,三層路由協(xié)議使用開(kāi)放式最短路徑優(yōu)先協(xié)議(OSPF),可以提供等價(jià)多路徑(ECMP)來(lái)實(shí)現(xiàn)負(fù)載均衡功能。層次樹(shù)形網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)簡(jiǎn)單,易于實(shí)現(xiàn)、管理和和擴(kuò)展,多層網(wǎng)絡(luò)對(duì)根節(jié)點(diǎn)的依賴過(guò)大,一旦根節(jié)點(diǎn)失效,將對(duì)網(wǎng)絡(luò)性能造成很大的影響。
Al-Fares等人提出了一種Fat tree的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),F(xiàn)at tree主要通過(guò)互連一些低端廉價(jià)的交換機(jī)來(lái)代替多層網(wǎng)絡(luò)拓?fù)渲械母叨私粨Q機(jī),因此多層網(wǎng)絡(luò)中的匯聚層和接入層的交換機(jī)將被替換為一組互聯(lián)的低端交換機(jī)替代。Fat tree位于匯聚層和接入層的交換機(jī)被分為K個(gè)域(Pod),每個(gè)域中的交換設(shè)備實(shí)現(xiàn)上行和下行鏈接數(shù)目相等,K個(gè)核心交換機(jī)共K2個(gè)端口分別連接K個(gè)域(Pod)。由于Fat tree中每個(gè)域(Pod)有相等的上行和下行連接數(shù)目,因此Fat tree有充分的對(duì)分帶寬,另外由于拓?fù)渲械挠虿捎玫投肆畠r(jià)的交換設(shè)備,因此該拓?fù)湟彩墙?jīng)濟(jì)和高度可擴(kuò)展的。
數(shù)據(jù)中心網(wǎng)絡(luò)中,數(shù)據(jù)流量主要是服務(wù)器間的流量,東西向流量要多于南北向流量,主要有一對(duì)一、一對(duì)多、多對(duì)一和多對(duì)多等集群通信方式[2]。由于數(shù)據(jù)中心網(wǎng)絡(luò)提供了諸如Web應(yīng)用,網(wǎng)絡(luò)硬盤、搜索引擎、集群計(jì)算等諸多應(yīng)用服務(wù),所以需要數(shù)據(jù)中心網(wǎng)絡(luò)在極短的時(shí)間內(nèi)處理大量的分布式計(jì)算和數(shù)據(jù)傳輸任務(wù),對(duì)網(wǎng)絡(luò)的性能提出了更高的要求。由于多用戶需要共享數(shù)據(jù)中心網(wǎng)絡(luò)中的計(jì)算、存儲(chǔ)和帶寬等資源這一特性,因此數(shù)據(jù)中心網(wǎng)絡(luò)如何選用合理的拓?fù)浣Y(jié)構(gòu)從而高效調(diào)度網(wǎng)絡(luò)資源也成為當(dāng)今的研究熱點(diǎn)。
QualNet 是由Scalable Network Technologies公司推出的一款商業(yè)性全球移動(dòng)信息系統(tǒng)模擬器。QualNet仿真平臺(tái)能模擬通信網(wǎng)絡(luò)行為的規(guī)劃、測(cè)試和訓(xùn)練。為了分析對(duì)比多層網(wǎng)絡(luò)和Fat tree拓?fù)涞男阅埽?yàn)證節(jié)點(diǎn)失效對(duì)網(wǎng)絡(luò)的影響。分別采用基于鏈路狀態(tài)路由選擇的OSPFv2算法來(lái)分別對(duì)多層網(wǎng)絡(luò)與Fat tree網(wǎng)絡(luò)進(jìn)行仿真,采用FTP應(yīng)用來(lái)模擬數(shù)據(jù)中心網(wǎng)絡(luò)中的東西向流量,采用多對(duì)一的流量模式,兩個(gè)FTP應(yīng)用服務(wù)向另一個(gè)接入交換機(jī)下的服務(wù)器發(fā)送數(shù)據(jù),每個(gè)FTP發(fā)送1000個(gè)數(shù)據(jù)項(xiàng)。實(shí)驗(yàn)的仿真時(shí)間設(shè)置為300秒。另外為了保證實(shí)驗(yàn)的公平性,多層網(wǎng)絡(luò)和Fat tree網(wǎng)絡(luò)設(shè)置相同的服務(wù)器數(shù)量,設(shè)置為16臺(tái)服務(wù)器,超額認(rèn)購(gòu)比為1:1。核心交換機(jī)以萬(wàn)兆接口與下行相連接,匯聚交換機(jī)和接入交換機(jī)間用千兆以太網(wǎng)相連,接入交換機(jī)與服務(wù)器和終端間用百兆以太網(wǎng)相連。
圖1 Fat tree網(wǎng)絡(luò)東西向流量仿真圖
相比于多層網(wǎng)絡(luò),圖1的Fat tree網(wǎng)絡(luò)采用基于OSPFv2路由協(xié)議可以充分的利用網(wǎng)絡(luò)冗余鏈路,使得網(wǎng)絡(luò)轉(zhuǎn)發(fā)節(jié)點(diǎn)的負(fù)載更加的均衡。通過(guò)采用OSPFv2路由協(xié)議能使用更多的節(jié)點(diǎn)進(jìn)行數(shù)據(jù)包的單播轉(zhuǎn)發(fā),從而降低了核心層和匯聚層節(jié)點(diǎn)的轉(zhuǎn)發(fā)數(shù)據(jù)包量。
另外為了驗(yàn)證多層網(wǎng)絡(luò)和Fat tree網(wǎng)絡(luò)拓?fù)渲懈?jié)點(diǎn)即核心交換機(jī)失效時(shí)對(duì)網(wǎng)絡(luò)性能的影響,本文設(shè)計(jì)將核心層的一個(gè)節(jié)點(diǎn)設(shè)置為靜態(tài)失效,失效時(shí)間從仿真開(kāi)始的10秒到30秒,即核心層節(jié)點(diǎn)持續(xù)20秒的失效期。
圖2 沒(méi)有節(jié)點(diǎn)失效時(shí)Fat tree節(jié)點(diǎn)的平均延時(shí)
圖3 節(jié)點(diǎn)11失效時(shí)Fat tree節(jié)點(diǎn)的平均延時(shí)
根據(jù)實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),對(duì)于多層網(wǎng)絡(luò),當(dāng)核心節(jié)點(diǎn)出現(xiàn)失效時(shí),會(huì)提高其他高節(jié)點(diǎn)的平均時(shí)延,而對(duì)比圖2和圖3,發(fā)現(xiàn)對(duì)于Fat tree網(wǎng)絡(luò),當(dāng)核心節(jié)點(diǎn)失效時(shí),基本上不會(huì)提高其他節(jié)點(diǎn)的平均時(shí)延。因此,相對(duì)于多層網(wǎng)絡(luò),F(xiàn)at tree對(duì)根節(jié)點(diǎn)失效具有較強(qiáng)的容錯(cuò)性。
本文介紹并分析了數(shù)據(jù)中心網(wǎng)絡(luò)中多層網(wǎng)絡(luò)和Fat tree拓?fù)涞奶攸c(diǎn),總結(jié)了數(shù)據(jù)中心網(wǎng)絡(luò)中的流量特征,并通過(guò)使用Qualnet網(wǎng)絡(luò)仿真對(duì)多層網(wǎng)絡(luò)和Fat tree進(jìn)行了仿真,通過(guò)實(shí)驗(yàn)證明了在使用OSPFv2協(xié)議下Fat tree相對(duì)于多層網(wǎng)絡(luò)具有更多的鏈路冗余,及匯聚和核心層的節(jié)點(diǎn)轉(zhuǎn)發(fā)量更小。并且證明在節(jié)點(diǎn)失效的情況下,F(xiàn)at tree對(duì)節(jié)點(diǎn)失效具有較強(qiáng)的容錯(cuò)性,更適合用于數(shù)據(jù)中心網(wǎng)絡(luò)。