周偉
(上海市信息網(wǎng)絡有限公司, 上海 200081)
數(shù)據(jù)專線上網(wǎng)熱備冗余技術的應用研究
周偉
(上海市信息網(wǎng)絡有限公司, 上海 200081)
在部署上網(wǎng)數(shù)據(jù)專線時,針對如何有效實現(xiàn)鏈路失效時的自動檢測,并完成業(yè)務流量的自動快速切換問題,以電信級數(shù)據(jù)承載網(wǎng)為基礎平臺,根據(jù)IP SLA以及BFD這兩種技術的工作原理,結合數(shù)據(jù)專線上網(wǎng)業(yè)務的熱備冗余需求提出了解決方案。采用檢測機制與路由倒換進行聯(lián)動,在故障發(fā)生時實現(xiàn)冗余鏈路的自動倒換,達成互為備份功能。實驗比較顯示,基于BFD技術的路由聯(lián)動熱備方案可以提供中斷時間低于200毫秒級的冗余保護,是未來高端用戶的首選熱備方案。
IP SLA; DVSR; BFD; 熱備份; 毫秒級
隨著網(wǎng)絡技術和規(guī)模的蓬勃發(fā)展,無論是運營商還是企業(yè)級上網(wǎng)專線用戶,都對網(wǎng)絡的可靠性、穩(wěn)定性和不間斷傳輸提出了越來越高的需求。尤其是一些對業(yè)務的實時性和不間斷性要求特別高的重點企事業(yè)單位,例如金融機構、醫(yī)院、政府機關、大型高科技企業(yè),一旦網(wǎng)絡層面發(fā)生故障,如果僅僅依靠以往的冷備份的方式采取手工切換[1],在時間上的消耗勢必然會造成一定量的業(yè)務停頓,甚至有可能會導致巨大的損失。因此,為了解決冷備所造成的網(wǎng)絡傳輸間斷的問題,本文對熱備冗余技術[2]進行的研究和測試實驗,最終提出了一種較優(yōu)的網(wǎng)絡動態(tài)熱備方案,實現(xiàn)了在網(wǎng)絡層面出現(xiàn)物理鏈路故障或設備故障時,可以自動切換至備用鏈路的方法,從而提高了網(wǎng)絡的自愈性和可靠性。
一些常用的鏈路熱備技術可以實現(xiàn)基本的遇故障切換后鏈路功能快速恢復能力。IP SLA(Internet Protocol Service-Level Agreement互聯(lián)網(wǎng)協(xié)議服務等級),旨在監(jiān)控網(wǎng)絡中兩臺IP設備之間的網(wǎng)絡性能[3]。其工作原理是通過ICMP、UDP等協(xié)議報文的回包響應,對端到端的連通性進行監(jiān)測,量化評估網(wǎng)絡服務質量,結合浮動靜態(tài)路由[4]或HSRP[5]等技術,實現(xiàn)熱備份的倒換保護功能,因此在工程中有較多的應用。由于采用ICMP的檢測機制[6],所以IP SLA的切換速度為秒級。而BFD(Bidirectional Forwarding Detection,雙向轉發(fā)檢測),是一種快速檢測機制[7],用于監(jiān)測網(wǎng)路中鄰居間雙向轉發(fā)路徑的連通狀態(tài)。BFD協(xié)議是從基礎傳輸技術中發(fā)展而來,是一種通用且標準化的、與傳輸介質和網(wǎng)路底層協(xié)議無關,具有快速故障檢測,且輕負荷等特點的檢測機制[8]。從本質上講,BFD是一種高速且獨立的HELLO協(xié)議[9],其檢測間隔時間和開銷可根據(jù)不同的網(wǎng)路環(huán)境和路由協(xié)議進行調整。
BFD沒有自己的鄰居發(fā)現(xiàn)機制,是靠上層協(xié)議通告給它相關鄰居的信息,從而建立鄰居和會話[10]。BFD凈荷可以運行在任何媒介或網(wǎng)絡封裝協(xié)議的頂層,如圖1所示。
圖1 BFD會話的觸發(fā)過程
BFD的會話觸發(fā)過程為:啟用上層協(xié)議,例如OSPF協(xié)議[11],通過自己的HELLO機制建立鄰居。上層協(xié)議建立鄰居后,將鄰居參數(shù)及檢測參數(shù)都(包括目的地址和源地址等)通告給BFD。隨后BFD根據(jù)收到的參數(shù)建立BFD鄰居。
BFD建立鄰居后,便立刻在兩臺BFD設備上周期快速發(fā)送BFD報文。假設在檢測周期內沒有收到BFD報文,則認為數(shù)據(jù)流所在的鏈路上出現(xiàn)故障,BFD鄰居拆除,并通告上層協(xié)議終止鄰居關系,如果在網(wǎng)路中存在與之關聯(lián)的備用路徑,則可觸發(fā)路徑倒換。BFD的鄰居建立與拆除都是三次握手。將BFD技術與快速重路由[12](FRR,F(xiàn)ast Re-Route)相結合,可以進一步提高網(wǎng)絡的可靠性和自愈性[13]。
2.1 熱備需求分析及方案分析
對于高端企業(yè)用戶而言,數(shù)據(jù)專線業(yè)務的永續(xù)性需求變得越來越突出。雙機、雙路徑、雙出口,是熱備份鏈路的基本必要條件。一種專線上網(wǎng)熱備鏈路的網(wǎng)絡架構,如圖2所示。
圖2 專線上網(wǎng)熱備鏈路的網(wǎng)絡架構
運營商公網(wǎng)出口的兩臺路由器設備R1和R2之間運行OSPF路由協(xié)議并重分布直連路由,使用靜態(tài)路由指向客戶網(wǎng)絡,如圖3所示。
圖3 工作在主用鏈路
在運營商側,在主用鏈路有效時,數(shù)據(jù)流進入R1后,按照靜態(tài)路由通過主用鏈路到達客戶網(wǎng)絡;當數(shù)據(jù)流進入R2后,由于OSPF從R1學習得來的路由優(yōu)于更改AD值后的本地靜態(tài)路由,所以數(shù)據(jù)流經(jīng)由R1通過主用鏈路到達客戶網(wǎng)絡。
當主用鏈路失效后,相關機制觸發(fā)撤銷R1上的靜態(tài)路由,OSPF重新收斂路由。當數(shù)據(jù)流進入R1后,按照OSPF從R2學習得來的路由經(jīng)由R2通過備用鏈路到達客戶網(wǎng)絡;當數(shù)據(jù)流進入R2后,按照靜態(tài)路由通過備用鏈路到達客戶網(wǎng)絡,如圖4所示。
圖4 切換至備用鏈路
在主用鏈路恢復后,主用路由重新生效,OSPF進行收斂,數(shù)據(jù)流通過主用鏈路到達客戶網(wǎng)絡。
需要注意的是,在用戶端側,需要做相同的故障檢測機制以及保護路徑的關聯(lián)倒換功能。當主用路由失效時,用戶側和運營商側需同時感知鏈路故障,并將數(shù)據(jù)流都切換到備用鏈路上,才能實現(xiàn)熱備冗余的保護效果,如果只是單方面的路徑切換,鏈路將仍然處于中斷的狀態(tài)。
2.2 基于IP SLA的冗余熱備方案
DVSR(Dynamically Verified Static Routing,動態(tài)驗證靜態(tài)路由),是一種半動態(tài)半靜態(tài)路由協(xié)議[14],屬于IP SLA協(xié)議中的一種。當其檢測到關聯(lián)的路由失效時,就會撤銷該路由而不會放入路由表中。DVSR可應用于任意播路由、負載分擔、路由備份等。
基于IP SLA的冗余熱備方案,部署方法是在公網(wǎng)出口設備側的兩臺設備上配置DVSR功能,將指向用戶側的靜態(tài)路由與DVSR關聯(lián),當公網(wǎng)出口設備向用戶側發(fā)送數(shù)據(jù)時兩條上實現(xiàn)主備結構。在用戶側配置IP SLA,將靜態(tài)路由與IP SLA關聯(lián),從用戶側至公網(wǎng)出口設備的兩條獨立線路上實現(xiàn)主備結構。
DVSR方案包含3個要素:把指向客戶網(wǎng)絡的靜態(tài)路由應用DVSR;提高備用鏈路側靜態(tài)路由的AD值高于OSPF的協(xié)議管理距離;將靜態(tài)路由重分布進OSPF路由。
2.3 基于BFD的冗余熱備方案
基于BFD的冗余熱備方案,部署方法是在運營商公網(wǎng)出口設備公網(wǎng)出口設備與用戶端設備之間啟動BFD功能,雙方形成BFD鄰居。將指向用戶側的靜態(tài)路由與BFD關聯(lián),當公網(wǎng)出口設備向用戶側發(fā)送數(shù)據(jù)時兩條上實現(xiàn)主備結構。在用戶側,將靜態(tài)路由與BFD關聯(lián),從用戶側至公網(wǎng)出口設備的兩條獨立線路上實現(xiàn)主備結構。
BFD方案包含3點:把指向客戶網(wǎng)絡的靜態(tài)路由應用BFD;提高備用鏈路側靜態(tài)路由的AD值高于OSPF的協(xié)議管理距離;將靜態(tài)路由重分布進OSPF路由。
本次測試主要針對數(shù)字專線上網(wǎng)業(yè)務中,基于IP SLA和BFD兩種熱備冗余方案的的鏈路保護功能的效果測試,并對測試結果進行分析。
測試環(huán)境,如圖5所示。
圖5 熱備份測試環(huán)境
其中,運營商公網(wǎng)出口設備采用Redback SmartEdge系列產(chǎn)品。IP地址規(guī)劃舉例,如表1所示。
表1 IP地址規(guī)劃舉例
3.1 測試步驟
IP SLA方案測試步驟如下:
首先,當測試環(huán)境搭建完成后,檢測兩條互聯(lián)鏈路。在運營商的網(wǎng)絡出口設備上檢測DVSR的運行狀態(tài),調整DVSR間隔參數(shù)。同時,用戶側檢測IP SLA運行狀態(tài),調整IP SLA間隔參數(shù)。
模擬鏈路故障導致的主用鏈路中斷時,即斷開主鏈路,檢測公網(wǎng)出口設備端DVSR是否被觸發(fā)。然后檢測用戶端IP SLA是否觸發(fā)。確認公網(wǎng)出口設備至用戶端、用戶端至公網(wǎng)出口設備雙向流量都已切換至備份鏈路。記錄切換過程中各階段時間。
最后,恢復主鏈路。隨即確認公網(wǎng)出口設備至用戶端、用戶端至公網(wǎng)出口設備雙向流量全部從備份鏈路自動切換回主鏈路。同時確認運營商側的DVSR狀態(tài),以及用戶側的IP SLA狀態(tài)。
BFD方案測試步驟如下:
首先,當測試環(huán)境搭建完成后,檢測兩條互聯(lián)鏈路。在運營商的網(wǎng)絡出口設備上檢測與用戶側設備BFD鄰居運行和情況,是否匹配。
模擬鏈路故障導致的主用鏈路中斷時,即斷開主鏈路,檢測公網(wǎng)出口設備與用戶側BFD鄰居關系,確認BFD鄰居斷開后備份路由是否被觸發(fā),并確認公網(wǎng)出口設備至用戶端、用戶端至公網(wǎng)出口設備雙向流量都已切換至備份鏈路。然后記錄切換過程中各階段時間。
最后,恢復主鏈路。確認BFD鄰居關系是否恢復。隨即確認公網(wǎng)出口設備至用戶端、用戶端至公網(wǎng)出口設備雙向流量全部從備份鏈路自動切換回主鏈路。同時確認兩側BFD鄰居狀態(tài)。
3.2 測試結果
在SW1和R1后架設測試儀,并發(fā)送數(shù)據(jù)流模擬用戶使用流量,設置每秒發(fā)送10000個數(shù)據(jù)包,測算當主用鏈路發(fā)生故障時,觀測并記錄兩種熱備切換的中斷時間以及恢復時間。
IP SLA熱備切換的時間,如圖6所示。
圖6 IP SLA熱備切換時間
從圖6中5組數(shù)據(jù)對比可以看出,采用IP SLA的方案,切換時間大致在10秒至11秒之間,其中雙纖的中斷和恢復時間略長于單纖情況,BFD熱備切換的時間,如圖7所示。
圖7 BFD熱備切換時間
從圖7中5組數(shù)據(jù)對比可以看出,采用BFD的方案,切換時間大致在200毫秒以內,其中雙纖的中斷時間略長于單纖情況,而恢復時間則非常接近。
從實驗結果可以看出,IP SLA技術和BFD技術兩種熱備冗余方案,部署都很方便,IP SLA的主備鏈路的切換時間在10多秒,而BFD方案的主備鏈路的切換時間可以至毫秒級[15],保護效果更優(yōu)。
在運營商數(shù)據(jù)承載網(wǎng)的網(wǎng)絡內部,網(wǎng)絡架構及聚合冗余技術已充分保障了網(wǎng)絡的健壯性。但對單鏈路的高端客戶而言,“單點接入”將成為網(wǎng)絡健壯性的瓶頸。因此,雙鏈路接入,互為冗余保護,將成為高端用戶的主流鏈路保護方式。本文針對提高企業(yè)級數(shù)字上網(wǎng)專線的入網(wǎng)可靠性提出了解決方案,通過將IP SLA和BFD的故障檢測能力與路由切換做聯(lián)動,結合傳統(tǒng)以太承載網(wǎng)內部的自愈能力,使承載網(wǎng)具備滿足電信級業(yè)務保護的高可靠性需求。經(jīng)過理論研究以及在實際網(wǎng)絡環(huán)境中對設計方案的實現(xiàn)與驗證,較IP SLA相比,BFD大大縮短了主備鏈路的切換時間,可以達到毫秒級,鏈路自動切換,無需人工干預,并且BFD作為一種成熟的協(xié)議,設備兼容性高,運行穩(wěn)定,占用系統(tǒng)資源低。因此BFD是未來可普遍滿足客戶毫秒級熱備保護需求的保護方案。
[1] 樓智翔,張吉. 雙機冷備計算機信號切換的設計與實現(xiàn)[J]. 電子技術,2011,38(2):20-21.
[2] 滕紹華. 數(shù)據(jù)業(yè)務系統(tǒng)中冗余熱備技術的應用[J]. 通信管理與技術,2015(3):60-63.
[3] 柯敏,雷維禮. 基于IP網(wǎng)絡的SLA參數(shù)探[J]. 通信與信息技術,2010(1):61-63.
[4] 張學藝. 銀行網(wǎng)點路由備份技術應用分析[J]. 電信技術,2012(S1):236-239.
[5] Martijn M. H. P. van den Heuvel, Reinder J. Bril, Johan J. Lukkien. Transparent Synchronization Protocols for Compositional Real-Time Systems[J]. IEEE Transactions on Industrial Informatics, 2012,8(2):322-336.
[6] 史振華, 劉外喜, 楊家燁. SDN架構下基于ICMP流量的網(wǎng)絡異常檢測方法[J]. 計算機系統(tǒng)應用,2016,25(4):135-142.
[7] 徐俊,秦藝力,唐淼,等. 通信IP網(wǎng)BFD應用的研究[J]. 電子設計工程,2012, 20(3):39-43.
[8] 馬中一. MPLS網(wǎng)絡雙向轉發(fā)檢測技術[D]. 武漢:華中師范大學,2015.
[9] Wei Sun, Zheng Yang, Keyu Wang, et al. Hello: A Generic Flexible Protocol for Neighbor Discovery [C]. Toronto: IEEE Conference on Computer Communications,2014:540-548.
[10] 劉春余. 雙向轉發(fā)檢測(BFD)關鍵參數(shù)研究[J]. 數(shù)字技術與應用,2014(11):56-57.
[11] M. Goyal, M. Soperi, E. Baccelli, et al. Improving Convergence Speed and Scalability in OSPF: A Survey[J]. IEEE Communications Surveys & Tutorials, 2012,14(2):443-463.
[12] Eric Rosenberg, James Uttaro. A Fast Re-Route Method[J]. 2013,17(8):1656-1659.
[13] 伍思廉. 一種基于BFD檢測的IP快速重路由解決策略[J]. 信息通信,2016(7):56-67.
[14] Gambiroza V, Ping Yuan, L. Balzano, et al. Design, Analysis, and Implementation of DVSR: A Fair High-performance Protocol for Packet Rings[J]. IEEE/ACM Transactions on Networking, 2004,12(1):85-102.
[15] Ran Zheng, Shuhe Sun. BFD-triggered OAM mechanisms for IP RAN network[C]. 2013 IEEE 4th International Conference on Electronics Information and Emergency Communication, 2013:286-288.
Applied Research for Hot-redundancy Technique of Data Special Internet
Zhou Wei
(Shanghai Information Network Co.,Ltd., Shanghai 200081, China)
Considering how to realize the automatic detection of the link and complete the automatic and quick switchover of the traffic flow when a special line for the Internet data is deployed, this paper proposes the solution in order to solve the hot-redundancy for the special internet business base on the carrier-grade data bear the network and combined with working principle of IP SLA and BFD. The solution is that the detection mechanism and route switching is ganged, and the redundancy link realizes automatically change to reach the backup function in the breakdown. Though the test, the hot standby solution of the routine linkage basd on the BED technique can provide the redundancy protection under the 200 millisecond of break period, and will be the first choice for the high-end users in the future.
IP SLA; DVSR; BFD; Hot-redundancy; Milliseconds level
周偉(1972-),男,上海人,高級工程師,博士,研究方向:數(shù)據(jù)通信、無線通信。
1007-757X(2017)05-0072-04
TP393.1
A
2016.12.01)