□ 文 程東亮 曹小剛
(作者單位:中國人民銀行武漢分行;中國人民銀行黃石市中心支行)
近年來,隨著移動互聯(lián)網(wǎng)技術(shù)不斷向縱深發(fā)展,以大數(shù)據(jù)、人工智能為代表的現(xiàn)代信息科技正在逐步從根本上改變現(xiàn)代金融的運營模式。作為大數(shù)據(jù)、人工智能底層的云計算技術(shù)也得到蓬勃發(fā)展。傳統(tǒng)金融業(yè)IT架構(gòu)中,網(wǎng)絡(luò)僅具備高穩(wěn)定與高性能,但靈活性和敏捷性不夠,如根據(jù)業(yè)務(wù)需求部署上線周期較長,如果業(yè)務(wù)需求發(fā)生變動,重新修改相應網(wǎng)絡(luò)架構(gòu)及配置是一件非常繁瑣的事情。同時,多數(shù)據(jù)中心及多活數(shù)據(jù)中心成為關(guān)鍵業(yè)務(wù)在現(xiàn)實中的新常態(tài),數(shù)據(jù)中心間網(wǎng)絡(luò)流量調(diào)度問題影響資源效率。此時,迫切需要一種網(wǎng)絡(luò)技術(shù),與應用實現(xiàn)一定程度互動,既能實現(xiàn)網(wǎng)絡(luò)靈活彈性管理,也能實現(xiàn)網(wǎng)絡(luò)流量精細化控制。軟件定義網(wǎng)絡(luò)(Software-Defined Network,SDN)成為一個重要解決手段。
圖1 B4網(wǎng)絡(luò)整體架構(gòu)圖
SDN于2006年誕生于美國GENI項目資助的斯坦福大學Clean Slate課題。SDN是一種新型的網(wǎng)絡(luò)結(jié)構(gòu),它的設(shè)計理念是將網(wǎng)絡(luò)的控制平面與數(shù)據(jù)轉(zhuǎn)發(fā)平面進行分離,通過集中的控制器去實現(xiàn)可編程化控制底層硬件,實現(xiàn)對網(wǎng)絡(luò)資源靈活的按需調(diào)配。SDN的核心是網(wǎng)絡(luò)可編程。一個典型的SDN架構(gòu)分為三層:最上層是應用層,通過控制器層編程接口控制底層網(wǎng)絡(luò)設(shè)備,實現(xiàn)各種業(yè)務(wù)應用;中間為控制器層,集中管理整個網(wǎng)絡(luò)設(shè)備,并提供網(wǎng)絡(luò)資源;底層為設(shè)備層,負責與控制器層通信,實現(xiàn)相應功能。
本文重點分析和研究SDN行業(yè)應用較為成功的三個案例:谷歌、阿里巴巴和騰訊,提出金融行業(yè)應用策略,以此推動金融網(wǎng)絡(luò)下一步發(fā)展。
谷歌SDN應用主要用于其世界各地的數(shù)據(jù)中心之間流量傳輸。其傳輸?shù)臄?shù)據(jù)可以分為三大類:(1)用戶數(shù)據(jù)備份,包括視頻、圖片、語音和文字等;(2)遠程跨數(shù)據(jù)中心計算資源和存儲資源訪問;(3)因分布式訪問負載均衡而進行的大規(guī)模數(shù)據(jù)同步。這三類從前往后數(shù)據(jù)量依次變大,對延時的敏感度和優(yōu)先級依次降低。
B4網(wǎng)絡(luò)從低到高分為三個層次,分別是物理設(shè)備層(Switch Hardware)、局部網(wǎng)絡(luò)控制層(Site Controllers)和全局控制層(Global)。第一層的物理交換機和第二層的Controller在每個數(shù)據(jù)中心出口的地方部署,而第三層的SDN網(wǎng)關(guān)和TE服務(wù)器是在一個全局統(tǒng)一的控制池。第一層是谷歌自行設(shè)計并請其他廠商代工的物理交換機,運行OpenFlow協(xié)議,把BGP/IS-IS協(xié)議報文送到Controller層進行處理。第二層在每個數(shù)據(jù)中心出口有一個Controller服務(wù)器集群,下層交換機可連接到多個Controller,由Paxos來選出leader(即決定工作狀態(tài)的Controller)。第三層中全局的TE Server通過SDN Gateway從各個數(shù)據(jù)中心的控制器收集鏈路信息、路徑信息。這些路徑被以IP-In-IP 隧道的方式創(chuàng)建,通過Gateway到Onix Controller,最終下發(fā)到交換機中。當一個新的業(yè)務(wù)數(shù)據(jù)要開始傳輸時,應用程序會評估該應用所需要耗用的帶寬,為它選擇一條最優(yōu)路徑(如負載最輕的但非最短路徑,不丟包但延時大),然后把這個應用對應的流,通過Controller安裝到交換機中,并跟選擇的路徑綁定在一起。B4網(wǎng)絡(luò)整體架構(gòu)圖如圖1所示。
改造前,谷歌使用基于靜態(tài)Hash的負載均衡方式,需使用過量鏈路,提供比實際需要更多的帶寬,實際鏈路帶寬利用率只有30%-40%,網(wǎng)絡(luò)無法對上述三大類數(shù)據(jù)進行精細匹配分流,數(shù)據(jù)傳輸路徑無法做到最優(yōu)。改造后,通過使用程序來控制網(wǎng)絡(luò),實現(xiàn)流量大小及方向的控制。鏈路數(shù)量減少,成本明顯降低,但B4網(wǎng)絡(luò)鏈路帶寬利用率提高了3倍以上,達97%,并且簡化了網(wǎng)絡(luò)的流量管理和控制。
圖2 阿里云網(wǎng)絡(luò)架構(gòu)圖
圖3 SDN數(shù)據(jù)中心整體架構(gòu)視圖
阿里云主要利用SDN技術(shù)構(gòu)建一張Overlay虛擬網(wǎng)絡(luò),來實現(xiàn)海量的租戶相互之間的隔離以及高性能、安全、互聯(lián)、可靠性要求。網(wǎng)絡(luò)分為上下兩層,上層是虛擬網(wǎng)絡(luò),下層是物理網(wǎng)絡(luò)。在虛擬網(wǎng)絡(luò)的里面,租戶可以看到路由器、交換機、ECS主機以及在主機里運行的各種服務(wù)(如SLS負載均衡服務(wù)、RDS數(shù)據(jù)庫服務(wù)、OCS cache服務(wù)等)。在虛擬網(wǎng)絡(luò)上,它既可以從ECS去訪問對應的RDS,也可以從ECS通過交換機和路由器來訪問公網(wǎng)。實際承載的是它之下的物理網(wǎng)絡(luò)。通過Overlay技術(shù),物理網(wǎng)絡(luò)不再是一個復雜的節(jié)點,減少了網(wǎng)絡(luò)出問題的概率,網(wǎng)絡(luò)結(jié)構(gòu)穩(wěn)定。
阿里通過自研設(shè)備來實現(xiàn)互通需求。在網(wǎng)絡(luò)的架構(gòu)圖中部署了三類自研設(shè)備:虛擬交換機、數(shù)據(jù)層自研網(wǎng)絡(luò)設(shè)備和自研控制器。如圖2所示,左側(cè)是數(shù)據(jù)面,右側(cè)是控制面。虛擬交換機的主要作用是實現(xiàn)ECS之間的私網(wǎng)互聯(lián)(東西向流量)。自研網(wǎng)絡(luò)設(shè)備主要用于連接兩個不同的網(wǎng)絡(luò),完成南向流量的下發(fā),流量主要來自用戶的IDC和公網(wǎng)。所有的虛擬交換機和自研網(wǎng)絡(luò)設(shè)備中的轉(zhuǎn)發(fā)表都是由控制器下發(fā),在控制器之上的是控制臺,它的分流策略架構(gòu)保證了網(wǎng)絡(luò)能夠滿足互通的需求。
不同于傳統(tǒng)的SDN,阿里云將SDN開放給云上的每個用戶,讓用戶可以調(diào)用Open API。在基于云的網(wǎng)絡(luò)上可以自由地連接,配置路由、劃分子網(wǎng)、進行流量控制。同時在ECS上,用戶可以按照自己的需求創(chuàng)建、釋放虛擬機來承載其流量,以實現(xiàn)彈性伸縮。通過阿里云彈性伸縮的能力,微博能應對除夕當天或春晚直播期間的大規(guī)模流量。微博可以在10分鐘內(nèi)使它云上的上千臺ECS規(guī)模翻倍,擴充能力超過了流量增長的數(shù)量級,成本比使用SDN技術(shù)前下降了40%左右。
騰訊是目前流量最高的門戶網(wǎng)站、國內(nèi)用戶數(shù)量最大的即時通信在線社區(qū)。騰訊SDN應用于數(shù)據(jù)中心內(nèi)部和數(shù)據(jù)中心之間。在數(shù)據(jù)中心內(nèi),集中控制器進行控制,采用VXLAN+Service Chain,負責串接和虛擬網(wǎng)絡(luò)與物理網(wǎng)絡(luò)的解耦。流的轉(zhuǎn)發(fā)利用控制器openflow協(xié)議進行控制。采用兼容現(xiàn)網(wǎng)的漸進式南向協(xié)議,構(gòu)建基于騰訊運營場景的控制器和業(yè)務(wù)編排系統(tǒng),借助SDN彈性的網(wǎng)絡(luò)架構(gòu)模型來應對數(shù)據(jù)中心云化帶來的復雜多變的網(wǎng)絡(luò)需求,如圖3所示。
在數(shù)據(jù)中心之間,SDN控制器與路由器之間運行BGP-LS/SNMP協(xié)議,路由器將通過IGP搜集的網(wǎng)絡(luò)拓撲和帶寬情況通過BGP-LS傳遞給SDN控制器,使用集中式路徑計算與調(diào)整,來實現(xiàn)流量的差異化實時調(diào)度。通過SDN思路和技術(shù)解決廣域網(wǎng)絡(luò)利用率、差異化QoS網(wǎng)絡(luò)質(zhì)量保障、業(yè)務(wù)冗余調(diào)度等問題。
三個典型案例對比分析如表1所示。
金融行業(yè)網(wǎng)絡(luò)面對金融科技發(fā)展浪潮,必須結(jié)合自身實際,積極應對業(yè)務(wù)快速發(fā)展和變化的需要。SDN為未來金融業(yè)網(wǎng)絡(luò)發(fā)展插上了智能和開放的翅膀,成為重構(gòu)金融業(yè)數(shù)據(jù)中心網(wǎng)絡(luò)和數(shù)據(jù)中心互聯(lián)網(wǎng)絡(luò)的重要技術(shù)。
一是主動適應傳統(tǒng)數(shù)據(jù)中心向云數(shù)據(jù)中心、虛擬化數(shù)據(jù)中心發(fā)展趨勢,積極引入SDN技術(shù)和思想,采用VXLAN等大二層技術(shù),結(jié)合SDN控制器,實現(xiàn)多租戶的云化、自動化運維的數(shù)據(jù)中心虛擬網(wǎng)絡(luò),大幅提升網(wǎng)絡(luò)運維效率,支持更靈活和更便捷的業(yè)務(wù)發(fā)展需求。
二是基于金融業(yè)普遍“兩地三中心”甚至多中心的格局,積極在數(shù)據(jù)中心間互聯(lián)的廣域網(wǎng)部分引入SDN技術(shù),實現(xiàn)更加高效、便捷的廣域網(wǎng)流量調(diào)度和運維管理,進一步提升廣域網(wǎng)帶寬價值。
三是盡量采用公有、標準化的SDN技術(shù)和產(chǎn)品,實現(xiàn)最廣泛軟硬件兼容,提升投資價值。
四是利用SDN全局視角特點,進一步采集各種流量、告警、狀態(tài)等數(shù)據(jù),結(jié)合大數(shù)據(jù)分析、人工智能等技術(shù),分析應用流量和安全流量,逐步實現(xiàn)真正智能的SDN網(wǎng)絡(luò)?!?/p>