何曉明,盧泉,邢亮
(1.中國(guó)電信股份有限公司廣州研究院,廣東 廣州 510630;2.中國(guó)電信集團(tuán)公司,北京 100032)
分段路由網(wǎng)絡(luò)研究及其在流量工程中的應(yīng)用
何曉明1,盧泉1,邢亮2
(1.中國(guó)電信股份有限公司廣州研究院,廣東 廣州 510630;2.中國(guó)電信集團(tuán)公司,北京 100032)
分段路由網(wǎng)絡(luò)是對(duì) IP 路由技術(shù)的繼承和創(chuàng)新,在實(shí)現(xiàn)網(wǎng)絡(luò)虛擬化、快速重路由、網(wǎng)絡(luò)可編程、負(fù)載均衡和流量工程等方面具有獨(dú)特優(yōu)勢(shì)。 深入研究了分段路由的實(shí)現(xiàn)機(jī)制,全面介紹和剖析了 IGP 和 BGP 支持分段路由網(wǎng)絡(luò)的協(xié)議擴(kuò)展,探討了分段路由在運(yùn)營(yíng)商網(wǎng)絡(luò)中典型應(yīng)用場(chǎng)景的流量工程實(shí)現(xiàn)。 隨著技術(shù)的成熟和標(biāo)準(zhǔn)的完善,分段路由網(wǎng)絡(luò)將具有廣闊的應(yīng)用前景。
分段路由;流量工程;路由協(xié)議;SDN 控制器
為 IP 報(bào)文指定轉(zhuǎn)發(fā)路徑、而不是按照傳統(tǒng) IP 網(wǎng)絡(luò)的最 短 路 徑 轉(zhuǎn) 發(fā) 的 網(wǎng) 絡(luò) 能 力 ,稱 為 基 于 源 路 由 網(wǎng) 絡(luò) (the source packet routing in networking,SPRING)[1]。 SPRING 的核心思想是由報(bào)文頭部維護(hù)策略狀態(tài),無(wú)需轉(zhuǎn)發(fā)路徑的中間節(jié)點(diǎn)維護(hù)策略狀態(tài),這樣可大大簡(jiǎn)化網(wǎng)絡(luò)為維護(hù)策略狀態(tài)信息所需復(fù)雜信令協(xié)議的支持。SPRING 有助于實(shí)現(xiàn)網(wǎng)絡(luò)虛擬化 、快速重路由(fast reroute,F(xiàn)RR)、網(wǎng) 絡(luò) 可 編 程 、OAM、負(fù) 載 均 衡 和 流 量 工 程 等 網(wǎng) 絡(luò) 功 能 。MPLS (multi-protocol label switching,多 協(xié) 議 標(biāo) 簽 交 換 )作 為 一 種 成 熟 可 商 用 的標(biāo)簽交換技術(shù),已經(jīng)在各大運(yùn)營(yíng)商網(wǎng)絡(luò)得到廣泛部署,主要用于提供二/三層 VPN 服務(wù)。然而,MPLS 支持流量工程 及 快 速 重 路 由 需 要 更 為 復(fù) 雜 的 信 令 協(xié) 議 ,如 CR-LDP[2]、RSVP-TE[3]等 ,網(wǎng) 絡(luò) 設(shè) 備 需 要 維 護(hù) 每 條 LSP 的 狀 態(tài) 信 息 ,設(shè)備開(kāi)銷大,存在嚴(yán)重的擴(kuò)展性問(wèn)題,因此,除了某些特殊應(yīng)用 (如為骨干網(wǎng)少數(shù)關(guān)鍵節(jié)點(diǎn)和鏈路提供局部保護(hù))外,一般極少使用。盡管采用獨(dú)立的路徑計(jì)算單元(path computation element,PCE)替 代 邊 緣 入 口 設(shè) 備 (label edge router,LER)選 擇 TE LSP 可 以 大 大 減 輕 設(shè) 備 控 制 面的負(fù)擔(dān)(維護(hù)流量工程數(shù)據(jù)庫(kù)需要足夠多的存儲(chǔ),路徑計(jì)算 需 要 消 耗 大 量 計(jì) 算 資 源 )[4],已 部 分 體 現(xiàn) 了 SDN 思 想 ,但網(wǎng)絡(luò)設(shè)備仍需運(yùn)行 RSVP-TE 等信令來(lái)維護(hù)每條 LSP 的狀態(tài)信息,對(duì)控制面的功能要求高。
SDN 近年來(lái)受到廣泛關(guān)注,并成為運(yùn)營(yíng)商、設(shè)備制造商、學(xué)術(shù)界研究和應(yīng)用的熱點(diǎn)領(lǐng)域。根據(jù)開(kāi)放網(wǎng)絡(luò)基金組織 (Open Networking Foundation,ONF)對(duì) SDN 的 定 義 ,在SDN 架構(gòu)中,控制平面和數(shù)據(jù)平面解耦,網(wǎng)絡(luò)智能和狀態(tài)邏輯集中,底層網(wǎng)絡(luò)基礎(chǔ)設(shè)施抽象于上層應(yīng)用。SDN 終極目標(biāo)是簡(jiǎn)化網(wǎng)絡(luò)設(shè)備的復(fù)雜性,實(shí)現(xiàn)網(wǎng)絡(luò)虛擬化和網(wǎng)絡(luò)應(yīng)用的開(kāi)放可編程,快速提供業(yè)務(wù)部署。當(dāng)前最具革命性的SDN 技 術(shù) 當(dāng) 屬 由 ONF 主 導(dǎo) 的 OpenFlow 協(xié) 議 , 基 于OpenFlow 的 SDN 通 過(guò) 集 中 的 SDN 控制器發(fā)現(xiàn)和維護(hù) 全網(wǎng)拓?fù)湫畔?,根?jù)自定義策略為每一跳轉(zhuǎn)發(fā)設(shè)備下發(fā)流轉(zhuǎn)發(fā)表,底層轉(zhuǎn)發(fā)設(shè)備依據(jù)流表實(shí)現(xiàn)業(yè)務(wù)流的轉(zhuǎn)發(fā)、過(guò)濾和丟棄等動(dòng)作。然而,OpenFlow 網(wǎng)絡(luò)當(dāng)前仍面臨流表的擴(kuò)展性、硬件芯片技術(shù)制約網(wǎng)絡(luò)轉(zhuǎn)發(fā)性能、新舊設(shè)備共存及網(wǎng)絡(luò) 演 進(jìn) 等 問(wèn) 題[5,6]。由 IETF 主 導(dǎo) 的 I2RS 工 作 組 希 望 在 繼 續(xù)保留分布式路由優(yōu)勢(shì)的同時(shí),仍可通過(guò)應(yīng)用來(lái)改變路由決策[7]。實(shí)踐已經(jīng)證明,傳統(tǒng)路由協(xié)議如 OSPF、ISIS、BGP 在大規(guī)模網(wǎng)絡(luò)(如 Internet)取得了巨大 成 功 。通過(guò)對(duì) 傳 統(tǒng)路由協(xié) 議進(jìn)行擴(kuò)展改良,能夠適應(yīng)網(wǎng)絡(luò)應(yīng)用和業(yè)務(wù)創(chuàng)新發(fā)展,從而實(shí)現(xiàn)現(xiàn)有網(wǎng)絡(luò)基礎(chǔ)設(shè)施向 SDN 的平滑演進(jìn)。
SPRING 的 目 標(biāo) 與 IETF 主 導(dǎo) 的 基 于 I2RS 的 SDN 是一致的,其目的在于通過(guò)對(duì)傳統(tǒng) IGP、BGP 進(jìn)行擴(kuò)展和改進(jìn),進(jìn)而簡(jiǎn)化網(wǎng)絡(luò)設(shè)備的復(fù)雜性,更好地實(shí)現(xiàn)網(wǎng)絡(luò)彈性和可編程、網(wǎng)絡(luò)負(fù)載均衡和流量工程、網(wǎng)絡(luò)虛擬化等功能,為業(yè)務(wù)提供最佳適配。
本 文全面介 紹 和 剖析 IGP 和 BGP 支 持 分 段路 由 網(wǎng)絡(luò)的協(xié)議擴(kuò)展,并分析了分段路由網(wǎng)絡(luò)的 OAM 機(jī)制,同時(shí)探討分段路由在運(yùn)營(yíng)商網(wǎng)絡(luò)中典型應(yīng)用場(chǎng)景的流量工程實(shí)現(xiàn)。
由 Cisco 發(fā) 起 的 分 段 路 由 (segment routing,SR)網(wǎng) 絡(luò) 是一種 基于源路 由 網(wǎng) 絡(luò),目前 正 由 IETF 的 SPRING 工 作組進(jìn) 行 標(biāo) 準(zhǔn) 化 。 根 據(jù) IETF“分 段 路 由 結(jié) 構(gòu) ”draft[8]的 定 義 ,分 段路由是指主機(jī)或網(wǎng)絡(luò)邊緣入口節(jié)點(diǎn)為 IP 報(bào)文添加一個(gè)包含一串按序排列的、被稱為“分段”的指令列表的報(bào)文頭部,中間節(jié)點(diǎn)根據(jù)報(bào)頭列表中的頂層段標(biāo)識(shí)進(jìn)行 IP 報(bào)文的逐跳轉(zhuǎn)發(fā)。分段路由的思想是把報(bào)文流經(jīng)過(guò)的一條端到端 的 路 徑 劃 分 成 多 個(gè) 分 段 ,每 一 分 段 以 段 標(biāo) 識(shí)(SID)來(lái) 標(biāo)識(shí)。對(duì)于 MPLS 網(wǎng)絡(luò),“分段路由結(jié)構(gòu) ”draft定義了 5 種段標(biāo) 識(shí) :IGP 段 標(biāo) 識(shí) 、BGP peer 段 標(biāo) 識(shí) 、LDP LSP 段 標(biāo) 識(shí) 、RSVP-TE LSP 段 標(biāo) 識(shí) 和 BGP LSP 段 標(biāo) 識(shí) 。 對(duì) IGP SID 而言 ,可 以 是 節(jié) 點(diǎn) 標(biāo) 識(shí) (node SID)、地 址 前 綴 標(biāo) 識(shí) (prefix SID),也可以是鄰接標(biāo)識(shí)(Adj-SID)。對(duì)于純 IPv6 網(wǎng)絡(luò),SID編碼成 IPv6 地址,為支持分段路由功能,IETF 專門定義了一 種 新 的 IPv6 路 由 擴(kuò) 展 頭 部[9]。
在 每 個(gè) 分 段 里 , 轉(zhuǎn) 發(fā) 設(shè) 備 根 據(jù) 轉(zhuǎn) 發(fā) 表 (forwarding information base,F(xiàn)IB)查 找 段 標(biāo) 識(shí) 對(duì) 應(yīng) 的 下 一 跳 ,最 終 轉(zhuǎn) 發(fā)到該段標(biāo)識(shí)的發(fā)起者。由于 SID 是通過(guò) IGP 向全網(wǎng)通告,這樣,IP 報(bào)文在每個(gè)分段里都按照 ECMP 感知的最短路徑優(yōu) 先 (shortest path first,SPF)算 法 進(jìn) 行 轉(zhuǎn) 發(fā) 。由 一 串 段 標(biāo) 識(shí)列表指定的端到端路徑通常由 SDN 控制器根據(jù)網(wǎng)絡(luò)資源的利用情況以及業(yè)務(wù)需求等因素來(lái)確定,當(dāng)然也可手工配置。網(wǎng)絡(luò)設(shè)備只需支持 OSPF、ISIS 等 基本路由 協(xié) 議,無(wú)需通過(guò)信令協(xié)議來(lái)維護(hù)報(bào)文流的狀態(tài)信息,極大地簡(jiǎn)化了網(wǎng)絡(luò)設(shè)備的復(fù)雜性。
2.1 分段路由的 IGP 擴(kuò)展
在一個(gè) IGP 拓?fù)溆蚶?,分段路由網(wǎng)絡(luò)通過(guò)一串按序排列的分段標(biāo)識(shí)靈活指定了一條端到端的轉(zhuǎn)發(fā)路徑,這些段標(biāo)識(shí)通過(guò)鏈路狀態(tài)路由協(xié)議 (如 OSPF 或 ISIS)向全網(wǎng)通告。一個(gè) prefix SID 通 常 代 表 多 跳 路 徑 ,具 有 全 局 唯 一 性 ;而一個(gè) Adj-SID 在 多 數(shù)情況下 是 一個(gè)單跳 路 徑 ,一 般 只具有本地意義。為了通告各種 SID,ISIS 和 OSPFv3 在鏈路狀態(tài) 協(xié) 議 數(shù) 據(jù) 單 元 (label switched path,LSP)分 別 為 它 們 定義 了 新 的 TLV[10,11]。由 于 OSPFv2 協(xié) 議 采 用 固 定 格 式 的 鏈 路狀 態(tài) 通 告 (link-state advertisement,LSA)報(bào) 文 ,為 了 支 持 新特 性 ,OSPFv2 在 RFC7684 專 門 定 義 了 2 個(gè) 新 的 opaque LSA:OSPFv2 擴(kuò) 展 prefix opaque LSA 和 OSPFv2 擴(kuò) 展 link opaque LSA,并 且分別為 它 們各自增 加 了 一個(gè)新的 TLV:OSPFv2 擴(kuò) 展 prefix TLV 和 OSPFv2 擴(kuò) 展 link TLV,用 于 通告 附 加 的 前 綴 和 鏈 路 屬 性 。以 下 介 紹 OSPFv2 協(xié) 議 擴(kuò) 展[12]與 SID 通告相關(guān)的幾個(gè)重要的 TLV。
(1)SID/標(biāo)簽 TLV
SID/標(biāo) 簽 TLV 用 于 通 告 前 綴 和 鏈 路 關(guān) 聯(lián) 的 SID 或 標(biāo)簽,SID/標(biāo)簽 TLV 格式如圖 1 所示。
圖1 SID/標(biāo)簽 TLV 格式
SID/label字段含義:若長(zhǎng)度字段設(shè)置為 3,那么 SID/label值 最 右 邊 的 20 bit代 表 一 個(gè) 標(biāo) 簽 ;若 長(zhǎng) 度 字 段 設(shè) 置 為4,則 SID/label值 代 表 32 bit的 SID。
(2)prefix SID TLV
prefix SID TLV 是 OSPFv2 擴(kuò) 展 prefix TLV 或 OSPFv2擴(kuò) 展 prefix range TLV 的 子 TLV,用 于 通 告 前 綴 綁 定 的 SID屬 性 。prefix SID TLV 格 式 如 圖 2 所 示 。
圖2 prefix SID TLV 格 式
flags 字 段 :8 bit,定義 如 圖 3 所 示 的 標(biāo) 志 位 。
圖3 prefix SID TLV flags 標(biāo) 志 位
NP 標(biāo)志位:no-PHP 標(biāo)志。若設(shè)置為 1,則次末跳向下一 跳 轉(zhuǎn) 發(fā) 報(bào) 文 時(shí) 不 應(yīng) 該 彈 出 prefix SID;若 設(shè) 置 為 0,則 次末 跳 必 須 彈 出 prefix SID,這等同于 MPLS 網(wǎng) 絡(luò) 中 的 次 末 跳彈出機(jī)制。
M 標(biāo)志位:映射服務(wù)器標(biāo)志。若設(shè)置為 1,該 SID 由映射服務(wù)器通告。
E 標(biāo) 志 位 :explicit-null標(biāo) 志 。若 設(shè) 置 為 1,prefix SID 發(fā)起 者 的 上 游 鄰 居 在 轉(zhuǎn) 發(fā) 報(bào) 文 前 必 須 用 一 個(gè) explicit-null值(對(duì) 于 IPv4 地 址 為 0)代替 prefix SID。
V 標(biāo) 志 位 :值/索 引 標(biāo) 志 。若 設(shè) 置 為 1,則 prefix SID攜 帶 一 個(gè) 絕 對(duì) 值 (SID );若 設(shè) 置 為 0,prefix SID 代 表 一 個(gè)索引。
L 標(biāo) 志 位 :本 地/全 局 標(biāo) 志 。若 設(shè) 置 為 1,則 prefix SID攜帶的值或索引具有本地意義;若設(shè)置為 0,則具有全局意義。
其他標(biāo)志位:保留,這些標(biāo)志位發(fā)送時(shí)必須置 0,接收時(shí)忽略。
MT-ID:由 RFC4915 定義的多拓?fù)?ID。
algorithm:一 個(gè) 字 節(jié) 字 段 ,標(biāo) 識(shí) prefix SID 關(guān) 聯(lián) 的 路 徑選擇算法。IGP 擴(kuò)展目前定義了兩種路徑選擇算法:當(dāng)該字段置“0”時(shí),表示缺省基于度量的最短路徑優(yōu)先(SPF)算法,允許任何節(jié)點(diǎn)根據(jù)本地路徑選擇策略來(lái)改變基于缺省SPF 選路;當(dāng)該字段置“1”時(shí),表示沿路徑的所有節(jié)點(diǎn)必須遵循嚴(yán)格 SPF 算法,不允許本地策略改變路徑選擇。
(3)Adj-SID TLV
Adj-SID 是 OSPFv2 擴(kuò) 展 link TLV 中 一 個(gè) 可 選 的 子TLV,用于標(biāo)識(shí)一條或一組單向鏈路。Adj-SID 格式如圖 4所示。
圖4 Adj-SID 格式
flags 字 段 :8 bit,定 義 標(biāo) 志 位 如 圖 5 所 示 。
圖5 Adj-SID TLV flags 標(biāo) 志 位
B 標(biāo)志位:備份標(biāo) 志 ,若 置“1”,該 Adj-SID 標(biāo)識(shí)的鏈 路符合鏈路保護(hù)條件。
V 標(biāo) 志 位 :值/索 引 標(biāo) 志 ,若 置 “1”,則 該 Adj-SID 攜 帶一個(gè)絕對(duì)值;若置“0”,則該 Adj-SID 代表一個(gè)索引。
L 標(biāo) 志 位 :本 地/全 局 標(biāo) 志 。若 設(shè) 置 為 1 ,則 prefix SID攜帶的值或索引具有本地意義;若設(shè)置為 0,則具有全局意義。
S 標(biāo) 志 位 :鏈 路 組 標(biāo) 識(shí) ,若 置 “1”,則 prefix SID 表 示 一個(gè)鏈路組,流量經(jīng)由一組鏈路負(fù)載分擔(dān)轉(zhuǎn)發(fā)到鄰居節(jié)點(diǎn)。
MT-ID:由 RFC4915 定義的多拓?fù)?ID。
weight字段:用于流量在一組并行鏈路間的負(fù)載均衡權(quán)重,這對(duì)于一組非等速鏈路是很有用的。
2.2 分段路由的 BGP 擴(kuò)展
由于 IGP 擴(kuò)展對(duì) SID 的通告只局限于單個(gè) IGP 域 ,只能 獲 取 IGP 域 內(nèi) 的 鏈 路 狀 態(tài) 數(shù) 據(jù) 庫(kù) (link state database,LSDB) 和 流 量 工 程 數(shù) 據(jù) 庫(kù) (traffic engineering database,TED),因此,單純使用 IGP 不足以 構(gòu) 建 跨多個(gè) IGP 域或 跨AS域的分段路由網(wǎng)絡(luò)。為了滿足某些需要跨域拓?fù)淇梢暤?應(yīng) 用 需 求 ,IETF 正 在 標(biāo) 準(zhǔn) 化 的 BGP-LS[13]允 許 BGP 攜 帶鏈路狀態(tài)信息。 BGP-LS 定義了一種新的 BGP 網(wǎng)絡(luò)層可達(dá)信 息 (network layer reachability information,NLRI)編 碼 格 式及一種新的 BGP-LS 屬性,節(jié)點(diǎn)、鏈路及前綴這 3 種關(guān)鍵的鏈路狀態(tài)對(duì)象分別被編碼在 NLRI中,與這些鏈路狀態(tài)對(duì)象關(guān)聯(lián)的屬性被編碼在 BGP-LS 屬性中。圖 6 展示了一種典型 的 跨 IGP 域 或 AS 域 的 部署場(chǎng)景 。在每個(gè) IGP 域 中,一個(gè)或多個(gè)節(jié)點(diǎn)配置使能 BGP-LS,這些 BGP 發(fā)言者通過(guò)連接路由反射器(route reflector,RR)形 成 IBGP 全互聯(lián)。這樣,所有的 BGP 發(fā)言者(特別是 RR)都獲取了全部 IGP 域的鏈路狀態(tài)信息,外部部件如 SDN 控制器可以從 RR 獲取全網(wǎng)鏈路狀態(tài)信息。
類似 SDN 控制器這種外部部件,通過(guò)收集跨 IGP 域的分段路由來(lái)構(gòu)建端到端的分段路徑,指示 IP 報(bào)文按照指定的分段路徑轉(zhuǎn)發(fā)。
為 支 持 分 段 路 由 網(wǎng) 絡(luò) ,BGP-LS 擴(kuò) 展 了 6 個(gè) 新 的BGP-LS 屬 性 TLV :prefix SID TLV、Adj-SID,SR 能 力 TLV、SR 算 法 TLV 、IGP binding TLV 和 映 射 服 務(wù) 器 通 告 前 綴 與SID 綁 定 TLV[14]。限 于 篇 幅 ,不 再 詳 細(xì) 介 紹 。
2.3 分段路由的域間多出口工程 BGP 擴(kuò)展
為 了 解 決 域 間 多 出 口 工 程 (egress peer engineering,EPE)問(wèn) 題 ,BGP-LS 擴(kuò) 展[15]定 義 了 3 種 BGP peering SID:peer-node-SID;peer-Adj-SID;peer-set-SID。peer-node-SID 用于標(biāo)識(shí) BGP 會(huì)話鄰居(peer),peer-Adj-SID 用于標(biāo)識(shí) BGP 會(huì)話的本地接口或互聯(lián)鏈路,peer-set-SID 用于標(biāo)識(shí)遠(yuǎn)端 AS 的所有 peer。由于域間多出口連接性描述基于鏈路和遠(yuǎn)端 peer/AS, 因 此 ,可 以 重 用 BGP-LS 中 的 link NLRI 通 告 BGP peering SID 的 可 達(dá) 性 ,并 定 義 了 一 種 新 的 protocol-ID,用 于區(qū)分 link NLRI攜帶的 EPE 描述信息與 IGP 鏈路狀態(tài)信息。
(1)BGP-LS link NLRI
BGP-LS 定 義 了 用 于 攜 帶 EPE 描 述 消 息 的 link NLRI格式,如圖 7所示。
圖6 跨域鏈路狀態(tài)信息收集
圖7 鏈路 NLRI格式
本 地 節(jié) 點(diǎn) 描 述 符 (local node descriptor)TLV 必 須 包 含3 個(gè) 消 息 :BGP router ID、AS、BGP-LS 標(biāo) 識(shí) 。
遠(yuǎn) 端 節(jié) 點(diǎn) 描 述 符 (remote node descriptor,RND)TLV 可以包含兩個(gè)消息:BGP router ID、AS。
鏈 路 描 述 符 (link descriptor)TLV 包含的消息跟通告的peering SID 相 關(guān) ,若 通 告 peer-node-SID 或 peer-set-SID,鏈路描述符 TLV 必須包含 BGP 會(huì)話的本地接口地址和 peer接口地址;若通告 peer-Adj-SID,鏈路描述符 TLV 必須包含4 byte 的 鏈 路 本 地 標(biāo) 識(shí) 符 和 4 byte 的 0 值 ,可 以 包 含 BGP會(huì)話的本地接口地址或 peer接口地址。
(2)BGP-LS 擴(kuò)展 link 屬性
BGP-LS 擴(kuò) 展 link 屬 性 定 義 的 peer-node-SID TLV、peer-Adj-SID TLV 和 peer-set-SID TLV,它 們 都 具 有 如 圖 8所示的格式。
圖8 BGP peering SID 格 式
flags 字段:8 bit,定義標(biāo)志位如圖 9 所示。
圖9 flags 標(biāo)志位
V 標(biāo) 志 位 :若 置 “1”,Adj-SID 攜 帶 一 個(gè) 絕 對(duì) 值 ,缺 省置位。
L 標(biāo) 志 位 :若 置“1”,Adj-SID 攜 帶值具有 本 地意義,缺省置位。
其余 bit,必須置“0”。
weight字段意義同圖 5,用于鏈路負(fù)載均衡。
為了便于理解,以圖 10 為例,對(duì)分段路由的 BGP 擴(kuò)展操作做進(jìn)一步說(shuō)明。
圖10 EPE 拓?fù)涫疽?/p>
圖10 中,假定為出口節(jié)點(diǎn) C 及 peer D、H、E 及其接口分配如下地址。
· 鏈 路 CD 中 連 接 節(jié) 點(diǎn) C 的 接 口 地 址 :1.0.1.1/24,連接節(jié)點(diǎn) D 的接口地址:1.0.1.2/24。
· 鏈 路 CH 中 連 接 節(jié) 點(diǎn) C 的 接 口 地 址 :1.0.2.1/24,連接節(jié)點(diǎn) H 的接口地址:1.0.2.2/24。
· 鏈路組 CE的兩條并行鏈路中上一條連接節(jié)點(diǎn) C的 接 口 地 址 :1.0.3.1/24,連 接 節(jié) 點(diǎn) E 的 接 口 地 址 :1.0.3.2/24。
· 鏈路組 CE的兩條并行鏈路中下一條連接節(jié)點(diǎn) C的 接 口 地 址 :1.0.4.1/24,連 接 節(jié) 點(diǎn) E 的 接 口 地 址 :1.0.4.2/24。
· 鏈路組 CE的兩條并行鏈路中上一條連接節(jié)點(diǎn) C的鏈路本地標(biāo)識(shí)符:0.0.0.1.0.0.0.0。
· 鏈路組 CE的兩條并行鏈路中下一條連接節(jié)點(diǎn) C的鏈路本地標(biāo)識(shí)符:0.0.0.2.0.0.0.0。
· 節(jié)點(diǎn) E 用于 eBGP 多跳連接的 loopback (環(huán) 回)地址:1.0.5.2/32。
· 節(jié) 點(diǎn) C 的 loopback 地 址 :3.3.3.3/32, 并 為 其 分 配SID:64。
· 節(jié) 點(diǎn) C、D、E、H 的 BGP router-ID 分 別 為 :3.3.3.3,4.4.4.4,5.5.5.5,6.6.6.6。
同時(shí),出口節(jié)點(diǎn) C 配置 3 種 BGP peering SID 如下所示。
· 為 peer D、H、E 分 配 的 peer-node-SID 分 別 為 :1012、1022、1052。
· 為連接到 peer E 的 上 、下 鏈 路 分 配 的 peer-Adj-SID為 1032 和 1042。
· 為 連 接 到 AS3 的 peer H 和 E 分 配 的 peer-set-SID為 1060。
· 為節(jié)點(diǎn) C 配置的本地 BGP-LS 標(biāo)識(shí)為 10000。
BGP-LS 更 新 消 息 由 節(jié) 點(diǎn) C 產(chǎn) 生 , 并 通 過(guò) iBGP 或eBGP 向鄰居通告。
下 面 描 述 出 口 節(jié) 點(diǎn) C 通 告 上 述 BGP peering SID 的BGP-LS 擴(kuò)展。
①為 peer D 通 告 的 peer-node-SID(1012)
BGP-LS link NLRI 包 含 :
· 本 地 節(jié) 點(diǎn) 描 述 符 (BGP router ID、AS、BGP-LS 標(biāo)識(shí)):3.3.3.3 ,AS1,10000;
· 遠(yuǎn) 端 節(jié) 點(diǎn) 描 述 符 (BGP router ID、AS):4.4.4.4,AS2;
· 鏈路描述 符 (本地接口 地 址 和 peer 接 口 地 址 ):1.0.1.1,1.0.1.2。
BGP-LS link 屬 性 包 含 peer-node-SID(1012)
②為 peer H 通告的 peer-node-SID(1022)和 peer-set-SID(1060)
· 本 地 節(jié) 點(diǎn) 描 述 符 (BGP router ID、AS、BGP-LS 標(biāo)識(shí)):3.3.3.3 ,AS1,10000;
· 遠(yuǎn) 端 節(jié) 點(diǎn) 描 述 符 (BGP router ID、AS):6.6.6.6,AS3;
· 鏈路描述 符 (本地接口 地 址 和 peer 接 口 地 址 ):1.0.2.1,1.0.2.2。
BGP-LS link 屬 性 包 含 peer-node-SID (1022)和peer-set-SID(1060)。
③為 peer E 通告的 peer-node-SID(1052)和 peer-set-SID(1060)
· 本 地 節(jié) 點(diǎn) 描 述 符 (BGP router ID、AS、BGP-LS 標(biāo)識(shí)):3.3.3.3 ,AS1,10000;
· 遠(yuǎn) 端 節(jié) 點(diǎn) 描 述 符 (BGP router ID、AS):5.5.5.5,AS3;
· 鏈路描述 符 (本地接口 地 址 和 peer 接 口 地 址 ):3.3.3.3,1.0.5.2。
BGP-LS link 屬 性 包 含 peer-node-SID (1052)和peer-set-SID(1060)。
④為連接到節(jié)點(diǎn) E 的上一條鏈路通告的 peer-Adj-SID(1032)
· 本 地 節(jié) 點(diǎn) 描 述 符 (BGP router ID、AS、BGP-LS 標(biāo)識(shí)):3.3.3.3 ,AS1,10000;
· 遠(yuǎn) 端 節(jié) 點(diǎn) 描 述 符 (BGP router ID、AS):5.5.5.5,AS3;
· 鏈路描述 符 (本地接口 標(biāo) 識(shí) 和 peer 接 口 地 址 ):0.0.0.1.0.0.0.0 ,1.0.3.2。
BGP-LS link 屬性包含 peer-Adj-SID(1032)。
⑤為連接 到節(jié)點(diǎn) E 的下一條鏈路通告的 peer-Adj-SID(1042)
· 本 地 節(jié) 點(diǎn) 描 述 符 (BGP router ID、AS、BGP-LS 標(biāo)識(shí) ):3.3.3.3 ,AS1,10000;
· 遠(yuǎn) 端 節(jié) 點(diǎn) 描 述 符 (BGP router ID、AS):5.5.5.5,AS3;
· 鏈 路 描述符 (本 地接 口 標(biāo) 識(shí) 和 peer 接 口 地 址 ):0.0.0.2.0.0.0.0 ,1.0.4.2。
BGP-LS link 屬性包含 peer-Adj-SID(1042)。
2.4 分段路由的 OAM 機(jī)制
根據(jù)“分段路由結(jié)構(gòu)”draft的定義,分段路由能夠直接應(yīng) 用 于 MPLS 數(shù) 據(jù) 平 面 :段 標(biāo) 識(shí) (SID)等 同 于 20 bit MPLS標(biāo)簽,分段路由頭部等同于 MPLS 標(biāo)簽棧。由于現(xiàn)有的MPLS 架構(gòu)需要 LDP 或 RSVP 等特定控制平面協(xié)議的支持,而分段路由結(jié)構(gòu)中標(biāo)簽的分發(fā)基于 IGP 的泛洪機(jī)制,分段路由這種技術(shù)特點(diǎn)引發(fā)了不同于傳統(tǒng) MPLS 網(wǎng)絡(luò) LSP故障檢測(cè)和隔離的考慮。
“分 段 路 由 網(wǎng) 絡(luò) 的 OAM 需 求 ”draft[16]對(duì) OAM 需 求 提出了全面的描述,包括:
· SR 的 OAM 必須支持按需(on-demand)和連續(xù)性故障診斷功能;
· SR 的 OAM 報(bào)文必須準(zhǔn)確跟隨數(shù)據(jù)平面的流量路徑;
· SR 的 OAM 報(bào)文必須有能力發(fā)現(xiàn)并執(zhí)行等價(jià)多徑路 徑 (equal cost multipath,ECMP) 和 非 等 價(jià) 多 徑 路徑 (unequal cost multipath,UCMP);
· SR 的 OAM 報(bào)文必須有能力發(fā)現(xiàn)并執(zhí)行可用路徑,而不僅僅只執(zhí)行最佳路徑;
· SR 的 OAM 報(bào) 文 必 須 有 能 力 檢 測(cè) 到 任 何 基 于node-SID 或 Adj-SID 路徑轉(zhuǎn)發(fā)失敗;
· SR 的 OAM 必須有能力由 SR 域中任意節(jié)點(diǎn)發(fā)起到其他節(jié)點(diǎn)的連通性檢測(cè)和連續(xù)性檢查;
· 當(dāng)出現(xiàn)連續(xù)性檢查失敗時(shí),SR 的 OAM 可以支持快速故障定位以隔離故障節(jié)點(diǎn);
· SR 的 OAM 應(yīng)具有由集中控制器發(fā)起故障診斷的能力;
· 當(dāng)集中控制器發(fā)起 OAM 檢測(cè)時(shí),必須有能力向 SR域中任何邊緣節(jié)點(diǎn)警示對(duì)應(yīng)的路徑或業(yè)務(wù)失敗,收到警示的節(jié)點(diǎn)可以采取本地保護(hù)行動(dòng)或彈出提示性消息;
· SR 的 OAM 必須有能力使用主動(dòng)或被動(dòng)方式測(cè)量報(bào)文丟失、報(bào)文時(shí)延或時(shí)延抖動(dòng)等性能指標(biāo)。
為了檢驗(yàn) SR 網(wǎng)絡(luò)的路徑(包括節(jié)點(diǎn)和鏈路)有效性,IETF 制 定 了 SR 網(wǎng) 絡(luò) 中 使 用 MPLS 數(shù) 據(jù) 平 面 的 LSP ping/trace 測(cè) 試 規(guī) 范[17],該 草 案 對(duì) SR 網(wǎng) 絡(luò) 存 在 問(wèn) 題 進(jìn) 行 闡 明 ,同時(shí) 在 target FEC stack TLV 定 義 了 3 個(gè) 新 的 SID 子 TLV:IPv4 IGP-prefix segment ID;IPv6 IGP-prefix segment ID;IGP-adjacency segment ID,用 于 解 決 SR 網(wǎng) 絡(luò) 路 徑 有 效 性 可能 存 在 的 問(wèn) 題 。 另 外 ,draft-ietf-spring-oam-usecase[18]還 提 出了一種可擴(kuò)展的 MPLS 數(shù)據(jù)平面監(jiān)視系統(tǒng),并給出了應(yīng)用場(chǎng)景,這進(jìn)一步豐富了 SR 網(wǎng)絡(luò)中的 OAM 機(jī)制。
由于分段路由是在網(wǎng)絡(luò)邊緣入口節(jié)點(diǎn)為 IP 報(bào)文添加一個(gè)包含一串按序排列 SID 列表的報(bào)文頭部,中間節(jié)點(diǎn)只需 根 據(jù) 報(bào) 頭 列 表 中 的頂 層 SID 進(jìn) 行 IP 報(bào) 文 的 逐 跳 轉(zhuǎn) 發(fā) 。所有路徑選擇的策略狀態(tài)信息都由入口節(jié)點(diǎn)維護(hù),中間節(jié)點(diǎn)無(wú)需運(yùn)行復(fù)雜信令協(xié)議來(lái)維護(hù)每流的狀態(tài)信息,大大簡(jiǎn)化了網(wǎng)絡(luò)設(shè)備的復(fù)雜度, 同傳統(tǒng)基于 MPLS 流量工程相比,具有良好的擴(kuò)展性和路徑選擇的靈活性。因此,SR 實(shí)現(xiàn)網(wǎng)絡(luò)的負(fù)載均衡和流量工程具有獨(dú)特優(yōu)勢(shì)。下面從 3個(gè)應(yīng)用場(chǎng)景分別描述 SR 在負(fù)載均衡和流量工程中的應(yīng)用。
3.1 IGP 域內(nèi)負(fù)載均衡
傳統(tǒng) IP 網(wǎng)絡(luò)基于最短路徑轉(zhuǎn)發(fā)報(bào)文,導(dǎo)致網(wǎng)絡(luò)流量分布極度不均衡,一部分鏈路嚴(yán)重?fù)砣?,而另一部分鏈路長(zhǎng)期處于輕載狀態(tài)。無(wú) 法 通 過(guò) IGP metric 調(diào)整來(lái)達(dá)到全網(wǎng)負(fù)載均衡的目的。圖 11 中,用戶終端連接 R1,訪問(wèn)的內(nèi)容源連接 R2,假定拓?fù)渲兴墟溌返?metric 值 都 相 等 。用戶訪 問(wèn) 站 點(diǎn) 1.1.0.0/16 的 全 部 流 量 最 終 經(jīng) 過(guò) 最 短 路 徑 R1-R2到達(dá)目的站點(diǎn),其他鏈路無(wú)法承載流量,處于空閑狀態(tài)。這種情形在現(xiàn)實(shí)網(wǎng)絡(luò)中普遍存在。這個(gè)問(wèn)題在 SR 網(wǎng)絡(luò)中可以得到輕松解決。
在 SR 網(wǎng)絡(luò)中,假設(shè)為 R2、R3、R4、R5 的環(huán)回地址分配的 node-SID 分別 為 102、103、104、105,并 通過(guò) IGP 擴(kuò)展向全網(wǎng)通告。這樣,網(wǎng)絡(luò)中所有節(jié)點(diǎn)的 FIB 都維護(hù)著這些SID 的標(biāo)簽轉(zhuǎn)發(fā)信息。網(wǎng)絡(luò)中的入口節(jié)點(diǎn) R1 通過(guò)規(guī)劃流量路徑(一般由 SDN 控制器負(fù)責(zé)),可以基于多種流分類策略(如接入端口、源地址、報(bào)文五元組等)為 IP 報(bào)文添加帶有 SID 列表的頭部。例如,為 VIP 流選擇 R1-R2 的最短路徑 ,VIP 報(bào) 文 采用缺省 方 式轉(zhuǎn)發(fā),不 攜 帶包含 SID 列表的頭部;為來(lái)自端口 1 的報(bào)文流選擇路徑 R1-R3-R2,添加帶 有 SID 列 表 為 {103}的 頭 部 ;為 源 自 端 口 2 的 報(bào) 文 流 選擇 路 徑 R1-R4-R5-R2, 添 加 帶 有 SID 列 表 為 {104,105}的 頭部。入口 節(jié)點(diǎn) R1 通 過(guò)合理規(guī) 劃 流量路徑 ,可 實(shí) 現(xiàn)流量在所有鏈路負(fù)載分擔(dān),達(dá)到全網(wǎng)流量均衡的效果。
圖11 SR 實(shí)現(xiàn) IGP 域內(nèi)負(fù)載均衡
3.2 骨干網(wǎng)雙平面流量工程
隨著互聯(lián)網(wǎng)應(yīng)用的飛速發(fā)展,過(guò)去幾年建成的骨干網(wǎng)難以支撐互聯(lián)網(wǎng)流量的爆炸式增長(zhǎng),各大運(yùn)營(yíng)商紛紛建設(shè)骨干網(wǎng)新平面,以承接洶涌而來(lái)的數(shù)字洪流。由于新老平面通常屬于獨(dú)立的自治域,無(wú)法實(shí)現(xiàn)兩個(gè)平面的網(wǎng)絡(luò)拓?fù)浼傲髁繑?shù)據(jù)的共享。采用 SDN 控制器可以收集跨域鏈路狀態(tài)數(shù)據(jù)及流量工程數(shù)據(jù),并根據(jù)新、老平面資源使用效率來(lái)動(dòng)態(tài)調(diào)度城域網(wǎng)流量的合理分配,實(shí)現(xiàn)骨干網(wǎng)雙平面流量工程。SDN 控制器與各個(gè) AS 域中的邊緣節(jié)點(diǎn)建立BGP 會(huì)話,通過(guò) BGP-LS 收集各個(gè) AS 域的鏈路狀態(tài)數(shù)據(jù)及流量工程數(shù)據(jù),并根據(jù)需要為邊緣入口節(jié)點(diǎn)的不同報(bào)文流選擇流路徑。入口節(jié)點(diǎn)還可以支持路徑計(jì)算單元協(xié)議(path computation element protocol,PCEP),為 特 定 業(yè) 務(wù) 流向 SDN 控制器請(qǐng)求路徑選擇。
圖12 中,城域 網(wǎng) A 與城域 網(wǎng) B 之間的互 訪 流量通過(guò)新、老平面進(jìn)行疏導(dǎo)。各個(gè)自治域都支持 SR,圖 12 中各自治 域 的邊緣節(jié)點(diǎn) RA、RB、R1、R2、R3、R4 以 BGP-LS 方 式 向SDN 控制器通告鏈路狀態(tài)及流量工程數(shù)據(jù),RA 為連接新平面的入口節(jié)點(diǎn) R1 的鏈路分配的 Adj-SID 為 9001; 為連接老平 面的 入 口 節(jié)點(diǎn) R2 的 鏈 路 分 配 的 Adj-SID 為 9002;新平 面 的 出 口 節(jié) 點(diǎn) R3 為 自 身 的 環(huán) 回 地 址 分 配 的 node-SID為 103;舊平面的出口節(jié)點(diǎn) R4 為自身的環(huán)回地址分配的node-SID 為 104。假設(shè)城域網(wǎng) A 的用戶和業(yè)務(wù)地址包 含 2個(gè) 地 址 段 :1.1.0.0/16 和 1.2.0.0/16,RA 為 這 2 個(gè) 地 址 段 的業(yè)務(wù)流向SDN 控制器請(qǐng)求路徑選擇。SDN 控制器根據(jù)這 2個(gè)地址段承載的流量大小,并結(jié)合新、舊平面的網(wǎng)絡(luò)資源利用情況,為 地 址 段 1.1.0.0/16 的 流 量 指 定 新 平 面 路 由 ,下 發(fā)的 路 徑 標(biāo) 簽 為{9001,103};為 地 址 段 1.2.0.0/16 的 流 量 指 定舊平面路由,下發(fā)的路徑標(biāo)簽為{9002,104}。RA 為源地址屬于 1.1.0.0/16 地 址 段 的 報(bào) 文 添 加 路 徑 標(biāo) 簽 為 {9001,103}的頭部,為源地址屬于 1.2.0.0/16 地 址 段 的 報(bào) 文 添 加 路 徑 標(biāo)簽為{9002,104}的頭部 ,報(bào) 文 流 在新、老 平 面遵 循ECMP 感知的最短路徑轉(zhuǎn)發(fā)到出口節(jié)點(diǎn)。這樣,城域網(wǎng) A去往城域網(wǎng) B的流量便實(shí)現(xiàn)了新、老平面的負(fù)載分擔(dān)。
圖12 SR 實(shí)現(xiàn)骨干網(wǎng)雙平面流量工程
3.3 域間多出口流量工程
在運(yùn)營(yíng)商骨干網(wǎng)與城域網(wǎng)及數(shù)據(jù)中心跨域互聯(lián)中,通常存在多出口流量 均衡問(wèn)題 。傳統(tǒng)采 用 BGP 路由策 略 來(lái)解決,存在配置復(fù)雜、流量調(diào)度不夠靈活等局限,并且難以實(shí)現(xiàn)基于源地址的流量?jī)?yōu)化調(diào)度。 第 2.3 節(jié) 詳 細(xì) 描 述 了 分段路由專門針對(duì) EPE 的 BGP 擴(kuò)展。下面以圖 10 所示的 EPE拓?fù)涫疽鈭D為例,分析 SR 在多出口流量工程中的應(yīng)用。
圖12 中,出口節(jié)點(diǎn) C 通過(guò) BGP-LS 方式向 SDN 控制器 通 告 BGP peering SID 關(guān) 聯(lián) 的 域 間 拓 撲 連 接 關(guān) 系 。同 時(shí) ,節(jié) 點(diǎn) C 的 FIB 維 護(hù) BGP peering SID 轉(zhuǎn) 發(fā) 信 息 見(jiàn) 表 1。
表1 節(jié) 點(diǎn) C 的 FIB 維 護(hù) BGP peering SID 轉(zhuǎn) 發(fā) 信 息
為了確定目的網(wǎng)絡(luò)的可達(dá)性,SDN 控制器需要收集域間 peer通告所有可用路徑,一種方式是利用 BGP 擴(kuò)展支持 的 ADD-path 能 力[19]。支 持 ADD-path 能 力 的 節(jié) 點(diǎn) C 將 向SDN 控制器通告相同網(wǎng)絡(luò)前綴的所有 BGP 路由,如圖 10中節(jié)點(diǎn) C 接收到的包含前綴 L/8 的 BGP 路由有:
· L/8 next-hop 1.0.1.2 AS path {AS 2,4};
· L/8 next-hop 1.0.2.2 AS path {AS 3,4};
· L/8 next-hop 1.0.5.2 AS path {AS 3,4}。
SDN 控制器還需收集 IGP 域內(nèi)鏈路狀態(tài)拓?fù)湫畔?,這可以通過(guò) BGP-LS 方式來(lái)實(shí)現(xiàn)。
當(dāng) SDN 控制器獲取了域內(nèi)和域間完整的網(wǎng)絡(luò)拓?fù)湫畔⒑?,就可以根?jù)策略規(guī)劃流量出口工程。
EPE 策 略 可 表述為攜 帶 2 個(gè) SID 的 列表 :第 一 個(gè) IGP prefix SID 用 于 標(biāo) 識(shí) 選 擇 的 出 口 節(jié) 點(diǎn) ;第 二 個(gè) BGP peering SID 用于標(biāo)識(shí)選擇的域間 peer。 SDN 控制器可以為目的前綴 L/8 選擇如下路徑:
· 出 口 節(jié) 點(diǎn) C 及 域 間 peer D:{64,1012};
· 出 口 節(jié) 點(diǎn) C 及 域 間 peer H:{64,1022};
· 出 口 節(jié) 點(diǎn) C 及 域 間 peer E:{64,1052};
· 出 口 節(jié) 點(diǎn) C 及 連 接 域 間 peer E 的 上 一 條 鏈 路 :{64,1032};
· 出 口 節(jié) 點(diǎn) C 及 連 接 域 間 peer E 的 下 一 條 鏈 路 :{64,1042};
· 出 口 節(jié) 點(diǎn) C 到 AS3 的任一條鏈路:{64,1060}。
SDN 控制器還可以指定 IGP 域內(nèi)的顯式路徑,如到達(dá)目的地的 IP 報(bào)文必須經(jīng)過(guò)節(jié)點(diǎn) B 轉(zhuǎn)發(fā)。假定節(jié)點(diǎn) B 為自身的環(huán)回地址分配 SID 為 62,即可為目的前綴 L/8 選擇一條 SID 列表為{62,64,1 012}路徑。
3.4 試驗(yàn)驗(yàn)證
目前,Cisco 應(yīng)用于運(yùn)營(yíng)商網(wǎng) 絡(luò) 從 邊緣、匯聚到 核 心的ASR、NCS 及 CRS 全系列路由器都已支持分段路由技術(shù)。為驗(yàn)證其設(shè)備支持分段路由的功能和性能,選用了ASR9000 (IOS-XR 5.2)、NCS6000 (IOS-XR 6.1.1)、CRS-3(IOS-XR 6.1.1)3 種 型 號(hào) 設(shè) 備 混 合 組 網(wǎng) ,在實(shí)驗(yàn)室搭建了如圖3所示拓?fù)錅y(cè)試環(huán)境。圖 3中所有互聯(lián)鏈路帶寬都為10 Gbit/s。并根據(jù)第 3.1 節(jié) 的 描 述 配 置 網(wǎng) 絡(luò) 參 數(shù) ,全網(wǎng)運(yùn)行OSPF 協(xié)議,在 R1 查看 LFIB 見(jiàn)表 2。
表2 在 R1 查看 LFIB
測(cè) 試 儀 表 的 3 個(gè) 10 Gbit/s 端 口 分 別 同 入 口 R1 的 端口 1、2、3 相連,用于發(fā)送測(cè)試流,其中,R1 的端口 3 模擬接收 VIP 流。測(cè) 試 儀 表 的 1 個(gè) 40 Gbit/s 端 口 同 出 口 R2 相連,配置為目標(biāo)網(wǎng)絡(luò),用于接收測(cè)試流。測(cè)試儀表同時(shí)向每個(gè) 端 口 發(fā) 送 9 Gbit/s 流 量 ,并 通 過(guò) 40 Gbit/s 端 口 進(jìn) 行 流 量回收,經(jīng)過(guò) 24 h 的長(zhǎng)期測(cè)試,測(cè)試結(jié)果無(wú)分組丟失現(xiàn)象。這完全驗(yàn)證了流量在所有鏈路負(fù)載分擔(dān),實(shí)現(xiàn)全網(wǎng)流量均衡。
同時(shí),試驗(yàn)也驗(yàn)證了分段路由技術(shù)實(shí)現(xiàn)流量工程僅需路由設(shè)備支持基本的 IGP 擴(kuò)展,設(shè)備配置較簡(jiǎn)單。而傳統(tǒng)基于 MPLS 流量工程需要網(wǎng)絡(luò)支持更多的信令協(xié)議,如LDP、RSVP-TE 等,因此大大簡(jiǎn)化了網(wǎng)絡(luò)運(yùn)維的復(fù)雜度。由于分段路由無(wú)需中間設(shè)備維護(hù)流狀態(tài),僅需邊緣入口設(shè)備對(duì)報(bào)文頭部攜帶標(biāo)簽列表指示的流量轉(zhuǎn)發(fā)路徑進(jìn)行編程,對(duì)流數(shù)目的支持具有良好的擴(kuò)展性,非常適合運(yùn)營(yíng)商大規(guī)模網(wǎng)絡(luò)的流量工程。
分段路由通過(guò)對(duì) IGP 和 BGP 進(jìn)行協(xié)議擴(kuò)展實(shí)現(xiàn)段標(biāo)識(shí)/標(biāo)簽的分發(fā),網(wǎng)絡(luò)節(jié)點(diǎn)維護(hù)段標(biāo)識(shí)/標(biāo)簽的轉(zhuǎn)發(fā)信息表。邊緣入口節(jié)點(diǎn)為報(bào)文流維護(hù)策略狀態(tài)信息,無(wú)需中間節(jié)點(diǎn)維護(hù)每報(bào)文流的策略狀態(tài)信息,即可實(shí)現(xiàn) IP 報(bào)文按指定路徑在一個(gè) IPG 域內(nèi)甚至跨域的端到端轉(zhuǎn)發(fā),極大地簡(jiǎn)化了網(wǎng)絡(luò)設(shè)備的復(fù)雜性。分段路由是對(duì)現(xiàn)有網(wǎng)絡(luò)技術(shù)的繼承和發(fā)展,并能實(shí)現(xiàn)同現(xiàn)有網(wǎng)絡(luò)基礎(chǔ)設(shè)施的互操作和平滑演進(jìn),在網(wǎng)絡(luò)虛擬化如二/三層 VPN 實(shí)現(xiàn)、網(wǎng)絡(luò)節(jié)點(diǎn)及鏈路保護(hù)、負(fù)載均衡和流量工程等方面顯示出了獨(dú)特的優(yōu)越性。分段路由思想一經(jīng)提出,便引起了網(wǎng)絡(luò)界的極大興趣,并得到設(shè)備制造商大力支持,目前正成為 IETF 的一項(xiàng)甚為活躍的標(biāo)準(zhǔn)化工作。由于分段路由技術(shù)的標(biāo)準(zhǔn)化工作起步較晚,目前還未達(dá)到成熟和完善階段,特別是在 OAM、網(wǎng)絡(luò)安全 、與 現(xiàn) 有 網(wǎng) 絡(luò) (包 括 MPLS、IPv6)互 操 作 等 諸 多 方 面[20]還 有許多工作要做??梢源竽戭A(yù)言,分段路由與 SDN 的結(jié)合,能夠很好地實(shí)現(xiàn)網(wǎng)絡(luò)的可編程性,進(jìn)一步增強(qiáng)網(wǎng)絡(luò)適配業(yè)務(wù)能力,為實(shí)現(xiàn)運(yùn)營(yíng)商大規(guī)模網(wǎng)絡(luò)流量工程奠定基礎(chǔ)。
[1] PREVIDI S,F(xiàn)ILSFILS C,DECRAENE B,et al.SPRING problem statement and requirements [J].Der Orthop de,2007,36(4):360-4.
[2] FAMOUSSI B,ANDERSON L,CALLON R,et al.Constraint-based LSP setup using LDP[J].Work in Progress Internet Draft,2002,38(2):295-305.
[3] AWDUCHE D,BERGER L,SWALLOW G,et al.RSVP-TE:extensions to RSVP for LSP tunnels[S].RFC 3209,2001.
[4] FARREL A,VASSEUR J P,ASH J.A path computation element (PCE)based architecture [C]//IETF RFC,April 3-9,2006,London,UK.New Jersey:IEEE Press,2006.
[5] 何曉明,冀 暉,毛 東峰,等. 電 信 IP 網(wǎng)向 SDN 演 進(jìn) 的探 討[J].電信科學(xué),2014,30(6):131-137. HE X M,JI H,MAO D F,et al.Telecom IP network to the exploration of the evolution of SDN [J].Telecommunication Science,2014,30(6):131-137.
[6] 王熙.撬動(dòng) 2500 億元市場(chǎng)的 SDN 技術(shù)為何依然難落地[EB/OL].(2016-04-13) [2016-04-20]. http://www.cww.net.cn/tech/html/2016/4/13/20164121826402633.htm. WANG X.Leveraged $250 billion market SDN why technology is still difficult to be born [EB/OL]. (2016-04-13)[2016-04-20]. http://www.cww.net.cn/tech/html/2016/4/13/20164121826402633. htm.
[7] HARES S,CHEN M.Summary of I2RS use case requirements[EB/OL]. (2016-02-16)[2016-04-05].http://www.ietf.org./.
[8] FILSFILS C,PREVIDI S,DECRAENE B,et al.Segment routing architecture [EB/OL]. (2016-03-06)[2016-04-05].http://www.segment-routing.net/home/ietf.
[9] PREVIDI S,F(xiàn)ILSFILS C,F(xiàn)IELD B,et al.IPv6 segment routing header (SRH)[EB/OL]. (2016-02-11)[2016-04-05].http://www. ietf.org./.
[10]PREVIDIS, FILSFILS C, BASHANDY A, etal.IS-IS extensions for segment routing [EB/OL]. (2016-01-20)[2016-04-05].http://www.ietf.org./.
[11]PSENAK P,PREVIDI S,F(xiàn)ILSFILS C,et al.OSPFv3 extensions for segment routing [EB/OL]. (2016-02-08)[2016-04-05].http://www.ietf.org./.
[12]PSENAK P,PREVIDI S,F(xiàn)ILSFILS C,et al.OSPF extensions for segment routing [EB/OL]. (2016-03-17)[2016-04-05].http://www.ietf.org./.
[13]GREDLER H,MEDVED J,PREVIDI S,et al.North-bound distribution of link-state and TE information using BGP[EB/OL].(2016-02-11)[2016-04-05].http://www.ietf.org./.
[14]PREVIDI S,PSENAK P,F(xiàn)ILSFILS C,et al.BGP link-state extensions for segment routing [EB/OL]. (2016-03-09)[2016-04-05].http://www.ietf.org./.
[15]PREVIDI S,F(xiàn)ILSFILS C,RAY S,et al.Segment routing egress peer engineering BGP-LS extensions [EB/OL]. (2016-02-15)[2016-04-05].http://www.ietf.org./.
[16]KUMAR N, PIGNATARO C, AKIYA N, etal.OAM requirements for segment routing network [EB/OL]. (2016-02-01)[2016-04-05].http://www.ietf.org./.
[17]KUMAR N,SWALLOW G,PIGNATARO C,et al.Label switched path (LSP)ping/trace for segment routing networks using MPLS dataplane[EB/OL]. (2016-02-07)[2016-04-05].http://www.ietf.org./.
[18]GEIB R,F(xiàn)ILSFILS C,PIGNATARO C,et al.A scalable and topology-awareMPLS dataplanemonitoringsystem [EB/OL].(2016-02-09)[2016-04-05].http://www.ietf.org./.
[19]WALTON D,RETANA A,CHEN E,et al.Advertisement of multiple paths in BGP[EB/OL]. (2016-03-11)[2016-04-05].http://www.ietf. org./.
[20]FILSFILS C,PREVIDI S,BASHANDY A,et al.Segment routing interoperability with LDP [EB/OL]. (2016-03-21)[2016-04-05]. http://www.ietf.org./.
Study on segment routing network and its application in traffic engineering
HE Xiaoming1,LU Quan1,XING Liang2
1.Guangzhou Research Institute of China Telecom Co.,Ltd.,Guangzhou 510630,China 2.China Telecommunications Corporation,Beijing 100032,China
Segment routing network is the inheritance and innovation of IP routing technology,which has many unique advantages in the realization of network virtualization,fast re-routing,network programming,load balancing and traffic engineering,and so on.Segment routing mechanism was studied in depth,and the protocol extensions of interior gateway protocols (IGP)and border gateway protocol (BGP)for segment routing were introduced and analyzed in detail.Furthermore,the realization of traffic engineering for segment routing in typical application scenarios of the operator networks was explored.With the maturity of technology and standardization,segment routing network will promise to have broad application prospects.
segment routing,traffic engineering,routing protocol,SDN controller
TN919.21
:A
10.11959/j.issn.1000-0801.2016179
何曉明(1968-),男,博士,中國(guó)電信股份有限公司廣州研究院高級(jí)工程師,主要從事數(shù)據(jù)網(wǎng)絡(luò)研究和支撐工作,研究興趣包括網(wǎng)絡(luò)架構(gòu)、 協(xié)議、 流量 工程、SDN/NFV等,已發(fā)表論文 30 余篇,申請(qǐng)專利 26 項(xiàng),獲授權(quán)專利 10余項(xiàng)。
盧泉(1969-),女,中國(guó)電信股份有限公司廣州研究院高級(jí)工程師,主要從事數(shù)據(jù)網(wǎng)絡(luò)研究和支撐工作。
邢亮(1978-),男,中國(guó)電信集團(tuán)公司網(wǎng)絡(luò)運(yùn)行維護(hù)事業(yè)部數(shù)據(jù)處工程師,主要從事數(shù)據(jù)網(wǎng)運(yùn)行維護(hù)管理工作。
2016-04-14;
:2016-06-14