周瑋
摘要:該文從某運營商現(xiàn)有的大二層網(wǎng)絡(luò)的架構(gòu)及改造需求談起, 詳細論述了針對該網(wǎng)絡(luò)提出的改造方案以及涉及的技術(shù)難點。該方案把VRRP協(xié)議(Virtual Router Redundancy Protocol)和BFD協(xié)議(Bidirectional Forwarding Detection)有機地結(jié)合在一起,使它們協(xié)調(diào)工作,實現(xiàn)了把一個比較脆弱的大二層網(wǎng)絡(luò)改造成一個相對健壯的網(wǎng)絡(luò)的目的;并且實現(xiàn)了多鏈路的冗余備份,主鏈路故障后業(yè)務(wù)可以快速倒換到備份鏈路。該方案在現(xiàn)網(wǎng)的成功實施說明了VRRP的BFD的結(jié)合可以實現(xiàn)二層網(wǎng)絡(luò)毫秒級的業(yè)務(wù)倒換.
關(guān)鍵詞:虛擬路由器冗余協(xié)議;雙向轉(zhuǎn)發(fā)檢測;業(yè)務(wù)倒換
中圖分類號:TP393 ? ? ? ?文獻標識碼:A
文章編號:1009-3044(2019)14-0072-02
某電信運營商在LTE技術(shù)成熟之際決定更新原有GSM倒換WCDMA基站并大量新建LTE基站以滿足用戶對移動業(yè)務(wù)流量及帶寬日益增長的需求。由于原有大二層承載網(wǎng)的限制,無法滿足LTE移動業(yè)務(wù)對承載網(wǎng)快速倒換的需求。為了最低成本地對現(xiàn)有承載網(wǎng)進行改造以滿足業(yè)務(wù)需求,經(jīng)過研究與測試,最終引入了VRRP( Virtual Router Redundancy Protocol) +BFD (Bidirectional Forwarding Detectio)的解決方案。本論文全面分析了引入此方案的原因及實現(xiàn)方案。
1 簡要網(wǎng)絡(luò)分析
該運營商共有3000多個站點,每個站點都有BTS(2G)基站、NodeB(3G)基站、eNodeB(4G-LTE)基站中的至少一種。
在每一個站點機房中,都有一臺和基站設(shè)備共站的三層接入交換機,該三層接入交換機通過本站點的波分(DWDM,Dense Wavelength Division Multiplexing)設(shè)備接入到了DWDM網(wǎng)絡(luò)。這臺三層交換機其實只起到了二層交換機的作用。
DWDM網(wǎng)絡(luò)是一個具有主備鏈路倒換功能的光波復(fù)用網(wǎng)絡(luò),會有從核心網(wǎng)到基站的業(yè)務(wù)數(shù)據(jù)流,在業(yè)務(wù)穿越DWDM網(wǎng)絡(luò)時,會有主備兩條隧道供使用:當主用隧道不可用時,業(yè)務(wù)可以通過備用隧道到達站點,保證手機業(yè)務(wù)不會中斷,增強網(wǎng)絡(luò)的健壯性。
2 運營商客戶的需求
雖然DWDM網(wǎng)絡(luò)具備自愈的功能, 可以在主用隧道不可用時快速將業(yè)務(wù)切換到備用隧道,但是核心路由器只有一臺,這就意味著核心網(wǎng)與核心路由器之間的鏈路只有一條,核心路由器至DWDM網(wǎng)絡(luò)的鏈路也只有一條。當這兩臺鏈路中的任何一條不可用時,全網(wǎng)業(yè)務(wù)便會癱瘓,所以這里隱藏著單鏈路故障巨大的風險。
此外,由于核心路由器只有一臺,當核心路由器不可用時,全網(wǎng)也將處于癱瘓狀態(tài);即這里也有單點故障的巨大風險。
雖然可以通過在核心網(wǎng)與核心路由器之間以及核心路由與DWDM網(wǎng)絡(luò)之間增加備用的鏈路解決單鏈路故障帶來的風險,但是仍然無法解決潛在的單點故障的風險。
客戶希望能夠有一個解決方案,通過購買最少的設(shè)備同時化解掉這兩個風險,并且要求在出現(xiàn)單鏈路故障(即某條鏈路不可用)或單點故障(即某臺核心路由器不可用)時,業(yè)務(wù)能夠快速切換到備用的設(shè)備或鏈路上,不會產(chǎn)生特別明顯的丟包或業(yè)務(wù)中斷。
3 方案分析
3.1 新的網(wǎng)絡(luò)拓撲
解決單點故障風險的唯一辦法就是增加核心路由器,使兩臺核心路由器互為備份。
新增核心路由器后必然需要在新增的核心路由與核心網(wǎng)和DWDM網(wǎng)絡(luò)間新增鏈路,這樣單鏈路故障的問題得以解決。為了進一步增強網(wǎng)絡(luò)的健壯性,我們也在兩臺核心路由器之間設(shè)計一條互聯(lián)鏈路。R2就是增加的一個路由器,改進后的網(wǎng)絡(luò)拓撲圖如下:
核心路由器R2是新增加的一臺核心路由器。
3.2 核心網(wǎng)與核心路由器之間路由協(xié)議的部署
在核心網(wǎng)與兩臺核心路由器互聯(lián)的設(shè)備和兩臺核心路由器上運行OSPF(Open Shortest Path First)路由器協(xié)議,相互交換路由信息。
核心網(wǎng)會通過OSPF路由協(xié)議分別從核心路由器R1和核心路由器R2上學習到兩條到基站的同一個業(yè)務(wù)網(wǎng)段的路由,通過設(shè)置核心網(wǎng)設(shè)備不同端口的OSPF優(yōu)先級,使核心網(wǎng)從核心路由器R1學習到的路由條目優(yōu)先于從核心路由器R2學習到相同基站的業(yè)務(wù)網(wǎng)段的路由條目。這樣,在正常情況下,核心網(wǎng)就會以核心路由器R1作為主用路由器,優(yōu)先把業(yè)務(wù)流量發(fā)送給核心路由器R1。
因為核心路由器到站點之間的網(wǎng)絡(luò)(包括DWDM部分)是純二層網(wǎng)絡(luò),所以基站設(shè)備的網(wǎng)關(guān)只能配置在兩臺核心路由器上。兩臺核心路由器與基站之間初步考慮部署VRRP(Virtual Router Redundancy Protocol,虛擬路由冗余協(xié)議)協(xié)議,核心路由器與基站之間有任何鏈路不可用時,通過VRRP實現(xiàn)基站與核心路由器之間的業(yè)務(wù)切換。
4 解決方案
約為3秒的主備倒換時間,對于承載網(wǎng)來說太過漫長,在這3秒的倒換時間內(nèi)會有很多的業(yè)務(wù)流量得不到及時的轉(zhuǎn)發(fā),客戶體驗會非常差。某廠商B的路由器設(shè)備具有某些特性,完全可以提出符合客戶要求的解決方案,下面提出解決方案。
4.1 VRRP的快速切換
如圖2,在基站的三層交換機上配置一個與基站的網(wǎng)關(guān)在同一網(wǎng)段的IP地址,比如10.0.1.14/28,分別在兩臺核心路由器和三層交換機上配置如下三對BFD會話:BFD1:基于核心路由器R1上的IP地址10.0.1.2/28和三層接入交換機上的IP地址10.0.1.14/28;BFD2: 基于核心路由器R2上的IP地址10.0.1.3/28和三層接入交換機上的IP地址10.0.1.14/28; ?BFD3: 基于核心路由器R1上的IP地址10.0.1.2/28和核心路由器R2上的IP地址10.0.1.3/28。由于直連路由的優(yōu)先級要高于任何路由,所以BFD3會話的BFD報文其實是通過DWDM網(wǎng)絡(luò)和三層交換機的二層通道傳輸?shù)?,并沒有經(jīng)過兩臺核心路由器的互聯(lián)鏈路。
配置這三個BFD會話的目的就是為了在兩臺核心路由器上的三層接口上配置VRRP組時跟蹤這三個BFD會話, VRRP的狀態(tài)將會與這三個BFD的會話進行聯(lián)動。
核心路由器R1上的VRRP跟蹤BFD1和BFD3 核心路由器R2上的VRRP跟蹤BFD2和BFD3。
同時也配置了兩臺核心路由器三層接口的VRRP狀態(tài)與BFD狀態(tài)進行聯(lián)動,同時核心路由器R2也在150ms內(nèi)檢測到BFD3會話中斷,但是BFD2會話依然正常,說明發(fā)生二層通道不可用的故障點在核心路由器R1與三層交換機之間,此時R2的三層接口便會迅速進入Master狀態(tài)接替核心路由器R1的三層接口的作用,而不會等到3秒以后才會開始轉(zhuǎn)變?yōu)镸aster狀態(tài)。如此,業(yè)務(wù)得以快速切換。
當原來的Master路由器因為故障鏈路恢復(fù)而VRRP狀態(tài)也恢復(fù)為Master狀態(tài)時, 基站的業(yè)務(wù)仍然可以及時快速地切換到核心路由器R1上。正常情況下,即沒有發(fā)生單點故障或任何鏈路故障時,核心網(wǎng)至基站的業(yè)務(wù)以核心路由器R1為主用路由器。
5 結(jié)語
大二層的承載網(wǎng)實現(xiàn)網(wǎng)絡(luò)節(jié)點和鏈路的冗余備份,很有必要部署VRRP。為了解決VRRP切換慢的弊端,有必要利用BFD協(xié)議來協(xié)助VRRP得以快速切換,這種VRRP與BFD的協(xié)同解決方案并不是所有廠家的路由器都支持的,但是很有必要。
參考文獻:
[1] 許圳彬.IP網(wǎng)絡(luò)技術(shù)[M].人民郵電出版社,2018:103-135.
[2] 李昌.數(shù)據(jù)通信與網(wǎng)絡(luò)技術(shù)[M].人民郵電出版社,2006:45-69.
[3] 張乃平.計算機網(wǎng)絡(luò)技術(shù)[M].華南理工大學出版社,2005:39-70.
[4] 周林.計算機網(wǎng)絡(luò)與應(yīng)用[M].中國電力出版社,2007:98-123.
[5] 伯塞卡斯.數(shù)據(jù)網(wǎng)絡(luò)[M].人民郵電出版社,2004:54-60.
[6] [美]米勒.數(shù)據(jù)通信與網(wǎng)絡(luò)[M].王涌,等,譯.清華大學出版社,2007:123-140.
[7] 威廉·斯托林斯.數(shù)據(jù)與計算機通信[M].周慧,等,譯.電子工業(yè)出版社,2015:230-250.
[8] 謝希仁.計算機網(wǎng)絡(luò)[M].電子工業(yè)出版社,2008:108-129.
[9] 伍振國.數(shù)據(jù)通信技術(shù)[M].中國鐵道出版社,2009:78-96.
[10] 楊彥彬.數(shù)據(jù)通信技術(shù)[M].北京郵電大學出版社,2009:105-121.
【通聯(lián)編輯:代影】