陳起
(中通服中??萍加邢薰?,廣東 廣州 510630)
網(wǎng)絡智能化技術可以通過分析大數(shù)據(jù)、深度學習等方式提高數(shù)據(jù)處理效率和質(zhì)量,從而幫助企業(yè)或機構更好地解決復雜問題。智能匹配和推薦系統(tǒng)等人工智能技術也催生了新型商業(yè)模式和行業(yè)生態(tài)。未來網(wǎng)絡智能化將面對更加廣泛和復雜的場景和需求,其需要不斷強化安全性、穩(wěn)定性、可拓展性,以滿足社會經(jīng)濟的快速發(fā)展及各種創(chuàng)新活動。
在網(wǎng)絡架構演進的過程中,從最初的以光口為主的城域骨干網(wǎng)到以IP 為核心的城域網(wǎng),再到以軟件定義網(wǎng)(software defined network, SDN)為核心的光傳送網(wǎng)(optical transport network, OTN)網(wǎng)絡(圖1),運營商已經(jīng)從單一網(wǎng)絡運營商轉變?yōu)榫邆渚C合電信服務能力的綜合通信運營商。在數(shù)據(jù)承載網(wǎng)絡建設過程中主要采用“網(wǎng)絡融合”和“云網(wǎng)融合”的技術路線,逐步向SDN、網(wǎng)絡功能虛擬化(network function virtualization, NFV)、云計算等方向發(fā)展。
圖1 OTN 網(wǎng)絡架構
在網(wǎng)絡架構演進方面,SDN(圖2)作為數(shù)據(jù)承載網(wǎng)絡架構的核心技術得到了廣泛應用。通過將業(yè)務和數(shù)據(jù)從傳統(tǒng)網(wǎng)絡中分離出來構建“端到端”“統(tǒng)一管理”和“集中控制”的新型承載網(wǎng)絡架構,實現(xiàn)了跨域跨廠商互通和跨域集中調(diào)度等能力,同時為運營商和企業(yè)客戶提供了靈活的業(yè)務接入方式。
圖2 SDN 網(wǎng)絡結構
當前運營商數(shù)據(jù)承載網(wǎng)絡主要有兩種技術標準:基于SDN 的光節(jié)點(optical network unit, ONU)(圖3)?;赟DN 的ONU 以OpenFlow 協(xié)議為基礎,提供了網(wǎng)絡切片和隔離等功能,通過虛擬私有云(virtual private cloud, VPC)實現(xiàn)了網(wǎng)絡資源的自動化調(diào)度。在不改變現(xiàn)有網(wǎng)絡架構、不影響網(wǎng)絡性能和效率的前提下實現(xiàn)了網(wǎng)絡資源的靈活分配?;赟DN 的ONU 以控制器為中心,通過將業(yè)務邏輯功能集中到控制器中實現(xiàn)了對業(yè)務的統(tǒng)一編排、故障定位、自動化部署和維護。ONU通過將業(yè)務邏輯下沉至邊緣設備,降低了網(wǎng)絡建設成本,并提供了多種保護模式。在當前網(wǎng)絡架構下,數(shù)據(jù)承載網(wǎng)絡一般采用SDN+ONU 的形式部署。但在業(yè)務部署過程中,由于SDN 控制器和ONU 控制器之間存在信息傳遞延遲,從而導致業(yè)務開通速度較慢和用戶體驗較差。因此如何平衡SDN 控制器和ONU 控制器之間信息傳遞延遲成為當前研究熱點。
圖3 ONU 網(wǎng)絡結構
從現(xiàn)階段的研究來看,數(shù)據(jù)承載網(wǎng)絡智能化主要包括網(wǎng)絡資源智能感知、網(wǎng)絡運行智能控制、網(wǎng)絡流量智能管理以及網(wǎng)絡運維智能化4 個方面。
(1)網(wǎng)絡資源智能感知。隨著承載網(wǎng)用戶對帶寬的需求不斷增加,帶寬資源成為傳送網(wǎng)的主要瓶頸。因此可以通過基于人工智能的方法感知和理解傳送網(wǎng)的資源需求,并將這些需求映射到網(wǎng)絡拓撲上實現(xiàn)對傳送網(wǎng)的合理分配和動態(tài)調(diào)整。
(2)網(wǎng)絡運行智能控制。數(shù)據(jù)承載網(wǎng)路由策略主要包括靜態(tài)策略、動態(tài)策略和混合策略三種。靜態(tài)策略是指只有一個路由,通過路由表實現(xiàn)路由的自動選擇;動態(tài)策略是指根據(jù)網(wǎng)絡拓撲、流量、業(yè)務等實時信息進行動態(tài)調(diào)整路由;混合策略是指基于路由表和端到端的路由策略,通過混合方式實現(xiàn)路由選擇[1]。
(3)網(wǎng)絡流量智能管理。隨著用戶對帶寬需求的不斷增加,傳送網(wǎng)承載的用戶流量也在不斷增加。為了保證傳送網(wǎng)的可靠性和效率可以通過基于人工智能的方法對傳送網(wǎng)的流量進行智能管理。首先,利用人工智能技術實現(xiàn)對網(wǎng)絡狀態(tài)數(shù)據(jù)的智能感知,并將這些感知數(shù)據(jù)映射到網(wǎng)絡拓撲上實現(xiàn)對承載網(wǎng)流量的自動檢測。其次,根據(jù)檢測到的數(shù)據(jù)進行路由計算、路由表調(diào)整和流量調(diào)度,以實現(xiàn)對承載網(wǎng)流量進行智能管理。
(4)網(wǎng)絡運維智能化。隨著承載網(wǎng)用戶數(shù)量和業(yè)務種類日益增多,傳送網(wǎng)將面臨更加復雜和多樣化的業(yè)務需求。因此可以利用人工智能技術實現(xiàn)傳送網(wǎng)運行狀態(tài)實時感知、故障快速定位和設備故障預測等功能,并對傳送網(wǎng)狀態(tài)進行自動監(jiān)測、預測和預警。
在數(shù)據(jù)承載網(wǎng)絡智能化研究中還可以利用深度學習、自然語言處理、計算機視覺等技術來實現(xiàn)對網(wǎng)絡業(yè)務和用戶體驗進行智能化分析。例如,通過對承載網(wǎng)業(yè)務狀態(tài)進行建模分析發(fā)現(xiàn)其中存在的問題,從而改進數(shù)據(jù)承載網(wǎng)絡中的算法設計和性能優(yōu)化。
數(shù)據(jù)承載網(wǎng)絡智能化涉及多個關鍵技術,主要包括以下方面。
(1)多域協(xié)同智能。以網(wǎng)絡設備為中心的傳統(tǒng)網(wǎng)絡是一個封閉的系統(tǒng),難以實現(xiàn)多域協(xié)同智能。數(shù)據(jù)承載網(wǎng)絡智能化將從技術層面打破現(xiàn)有的網(wǎng)絡邊界實現(xiàn)跨域協(xié)同智能。
(2)端到端智能。目前業(yè)界普遍認為端到端的智能化主要是指網(wǎng)絡設備端到端的智能化,包括端到端的感知、定位、通信以及路由等。未來數(shù)據(jù)承載網(wǎng)絡智能化將進一步延伸至業(yè)務層面,通過對用戶體驗的分析實現(xiàn)用戶體驗優(yōu)化和業(yè)務場景匹配。
(3)協(xié)同感知。目前業(yè)界普遍認為跨域智能是指將網(wǎng)絡設備與其他智能設備進行連接,從而實現(xiàn)不同域之間的協(xié)同。數(shù)據(jù)承載網(wǎng)智能化需要支持跨域智能實現(xiàn)跨域協(xié)同感知、定位和通信功能。
(4)多維立體感知。隨著5G 等新型移動通信技術的快速發(fā)展,數(shù)據(jù)承載網(wǎng)絡將面臨更加復雜的網(wǎng)絡環(huán)境,其需要實現(xiàn)多維立體感知來提高數(shù)據(jù)承載網(wǎng)智能化水平[2]。
(5)數(shù)據(jù)驅(qū)動決策。數(shù)據(jù)驅(qū)動決策是指基于數(shù)據(jù)和模型實現(xiàn)對未來業(yè)務需求和用戶體驗的預測和感知,從而優(yōu)化資源配置、提高資源利用率、提升網(wǎng)絡性能、降低成本等。
(6)智能控制。智能控制是指在數(shù)據(jù)承載網(wǎng)中實現(xiàn)對多域協(xié)同和多維立體感知的控制功能,進而提升數(shù)據(jù)承載網(wǎng)智能化水平。
(7)智能運維。隨著大數(shù)據(jù)和人工智能技術的發(fā)展,大數(shù)據(jù)驅(qū)動的智能運維逐漸成為業(yè)界關注的熱點和研究熱點。
(8)網(wǎng)絡重構。網(wǎng)絡重構是指從傳統(tǒng)以太網(wǎng)網(wǎng)光交叉連接(optical cross connect, OXC)演進過程中,實現(xiàn)以光為核心、多域協(xié)同、靈活高效、安全可控、開放創(chuàng)新等目標的網(wǎng)絡重構過程,從而支撐業(yè)務發(fā)展和網(wǎng)絡演進。
(9)綠色節(jié)能。綠色節(jié)能主要包括3 個方面:①提高能量效率,降低能耗。②采用高效節(jié)能設備。③提高能源利用率,減少浪費或廢物產(chǎn)生,從而達到環(huán)保效果。
在人工智能方面,我國的相關研究團隊基于深度學習、自然語言處理、計算機視覺、強化學習等技術已經(jīng)在數(shù)據(jù)承載網(wǎng)絡智能化方向取得了重要進展,主要表現(xiàn)為:在數(shù)據(jù)承載網(wǎng)絡智能化方向?qū)崿F(xiàn)了AI 模型的開源部署。我國在數(shù)據(jù)承載網(wǎng)絡智能化方向也開展了大量的應用研究,主要集中在以下方面:①基于深度學習的流量感知及預測。通過收集網(wǎng)絡運行數(shù)據(jù)并進行大量的訓練,實現(xiàn)對網(wǎng)絡狀態(tài)和流量的預測。②基于自然語言處理的故障檢測及定位。通過對數(shù)據(jù)進行語義分析識別網(wǎng)絡中可能發(fā)生故障的位置和原因。③基于強化學習的故障定位。通過將大數(shù)據(jù)與人工智能技術相結合研究數(shù)據(jù)承載網(wǎng)中故障定位及修復策略。④基于深度學習的業(yè)務感知。通過對網(wǎng)絡中用戶的行為進行學習實現(xiàn)業(yè)務感知與預測。這些技術已經(jīng)在部分地區(qū)開展了試點應用??傮w來看目前數(shù)據(jù)承載網(wǎng)絡智能化技術研究已取得一定進展,但距離實際應用還有較大差距[3]。
2.3.1 實現(xiàn)業(yè)務自動選擇和路由優(yōu)化
數(shù)據(jù)承載網(wǎng)絡是由多個網(wǎng)絡域組成的,每個域都有自己的業(yè)務質(zhì)量保證服務質(zhì)量機制,用于實現(xiàn)不同域之間的隔離和數(shù)據(jù)流轉通。在SDN/NFV 網(wǎng)絡中,數(shù)據(jù)承載網(wǎng)絡需要具備智能的業(yè)務自動選擇和路由優(yōu)化能力[4]。
在傳統(tǒng)的數(shù)據(jù)承載網(wǎng)絡中,用戶發(fā)起業(yè)務請求時,首先需要判斷業(yè)務對端到端路徑是否有指定優(yōu)先級(如1~3 級),如果有指定優(yōu)先級,則根據(jù)該優(yōu)先級確定路徑。而在SDN/NFV 網(wǎng)絡中,SDN 控制器需要主動識別業(yè)務流量對端到端路徑是否有指定優(yōu)先級,則根據(jù)該服務質(zhì)量機制進行相應的業(yè)務選擇和路由優(yōu)化。
在傳統(tǒng)的數(shù)據(jù)承載網(wǎng)絡中不同域之間的流量流動主要是單向的,不同域之間的數(shù)據(jù)流不會發(fā)生交換。而在SDN/NFV 網(wǎng)絡中可以基于多域之間數(shù)據(jù)流雙向流動的特點進行流量調(diào)度,實現(xiàn)跨域流量在不同域之間的流動。因此需要根據(jù)業(yè)務對端到端路徑是否有指定優(yōu)先級對流量進行調(diào)度。
2.3.2 自動化運維
自動發(fā)現(xiàn)和關聯(lián)網(wǎng)絡性能問題是智能運維的基礎。針對傳統(tǒng)網(wǎng)絡運維工具不能發(fā)現(xiàn)和關聯(lián)網(wǎng)絡性能問題,只能基于統(tǒng)計數(shù)據(jù)分析網(wǎng)絡故障,無法主動發(fā)現(xiàn)和關聯(lián)網(wǎng)絡故障的問題。人工智能技術的發(fā)展為解決上述問題提供了契機。人工智能技術具備數(shù)據(jù)分析能力,可以通過對大量歷史數(shù)據(jù)進行分析和挖掘,發(fā)現(xiàn)隱藏在海量數(shù)據(jù)中的網(wǎng)絡故障特征,可以自動發(fā)現(xiàn)并關聯(lián)網(wǎng)絡性能問題。
例如,在某大型數(shù)據(jù)中心內(nèi)部部署了基于人工智能的性能監(jiān)控系統(tǒng)可以實現(xiàn)對全局物理網(wǎng)絡和邏輯網(wǎng)絡的性能監(jiān)控。在不同的業(yè)務場景下通過收集并分析多個網(wǎng)絡指標(如OverlayLoss)來檢測物理層、鏈路層和協(xié)議層的性能問題。在網(wǎng)絡規(guī)模不斷擴大的情況下,通過構建“以用戶為中心”的運維體系實現(xiàn)對全局物理網(wǎng)絡和邏輯網(wǎng)絡的全面監(jiān)控和管理。同時通過不斷優(yōu)化算法模型使得性能監(jiān)控系統(tǒng)能夠不斷適應不同的業(yè)務需求。當業(yè)務需求發(fā)生變化時可以迅速對性能監(jiān)控系統(tǒng)進行更新,保證系統(tǒng)具有較強的適應能力[5]。
綜上所述,在數(shù)據(jù)承載網(wǎng)絡智能化方向的不斷發(fā)展和演進中技術突破和應用創(chuàng)新已經(jīng)成為數(shù)字時代最重要的趨勢之一。隨著人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)等領域不斷迭代升級,網(wǎng)絡智能化將有更加廣泛和深入的應用場景和需求。隨著技術的不斷發(fā)展,數(shù)據(jù)承載網(wǎng)絡呈現(xiàn)出了更多的技術特性和架構特性,同時也面臨著新的挑戰(zhàn)。以大帶寬、低時延、靈活接入為代表的新技術的快速發(fā)展對數(shù)據(jù)承載網(wǎng)絡提出了更高的要求,需要數(shù)據(jù)承載網(wǎng)絡具備更快的響應速度、更低的時延以及更靈活的接入方式。