諸葛群碧 鐘雪穎 蔡萌 劉曉敏 劉蕾 胡衛(wèi)生
(上海交通大學區(qū)域光纖通信網(wǎng)與新型光通信系統(tǒng)國家重點實驗室,上海 200240)
信息時代快速發(fā)展,通信流量呈現(xiàn)爆發(fā)式增長。光纖通信是通信基礎設施的主動脈,承擔了全球絕大多數(shù)的通信流量,因此光通信技術(shù)的發(fā)展成為推動信息時代持續(xù)發(fā)展的重要基石。目前,基于傳統(tǒng)光纖信道的光纖傳輸系統(tǒng)的設計已經(jīng)接近理論極限,然而光網(wǎng)絡的管控方法與機制發(fā)展相對滯后,這使得頻譜資源利用不充分且運行效率較低。因此,需要通過智慧光網(wǎng)絡的構(gòu)建,充分挖掘現(xiàn)有光纖系統(tǒng)的容量,最大化利用網(wǎng)絡資源。為了實現(xiàn)全光網(wǎng)的智能化,本文提出的光纖通信數(shù)字孿生系統(tǒng)將成為智慧光網(wǎng)絡的關(guān)鍵數(shù)字底座。該系統(tǒng)基于感知單元采集得到的實時數(shù)據(jù),對光纖通信系統(tǒng)中每一條鏈路進行同步數(shù)字化映射,為光網(wǎng)絡管控提供實時物理層關(guān)鍵信息,且具備全生命周期的學習推演能力。
對光纖鏈路的精確建模是構(gòu)建光纖通信數(shù)字孿生系統(tǒng)的首要環(huán)節(jié)。光纖鏈路的組成包括光收發(fā)機、光纖、光放大器、波長選擇開關(guān)等單元。目前,國內(nèi)外很多機構(gòu)對光纖建模進行了深入的研究。在理論模型方面,P.Poggiolini等[1]提出了高斯噪聲(Gaussian Noise,GN)模型,因其復雜度低,易于計算的特點,應用相當廣泛;在機器學習模型方面,使用深度學習算法中的雙向長短期記憶算法對于光纖信道進行建模[2],可以得到與傳統(tǒng)的基于模型驅(qū)動的分步傅里葉方法相似的結(jié)果,但在運算時間上大大減?。辉诟黝惼骷7矫?,很多研究基于機器學習算法對摻鉺光纖放大器(Erbium Doped Fiber Amplifier,EDFA)、可重構(gòu)光分插復用器(Reconfigurable Optical Add-Drop Multiplexer,ROADM)等光器件進行建模,例如利用神經(jīng)網(wǎng)絡對EDFA的增益譜及噪聲譜進行更加精準的建模[3-4],基于輸入濾波器的負載噪聲分布和帶寬分布等特征,使用神經(jīng)網(wǎng)絡對ROADM的濾波效應建模[5]。這些研究主要集中在光網(wǎng)絡單個器件的建模或整體端到端系統(tǒng)的靜態(tài)建模,由于沒有考慮到實時變化,未能在部署后通過在線學習的手段對模型進行更新迭代以構(gòu)建動態(tài)孿生模型。
為了構(gòu)建動態(tài)的光纖通信數(shù)字孿生模型,可以基于感知技術(shù)賦予數(shù)字孿生系統(tǒng)學習和演化能力。在光性能感知方面,目前的研究主要集中于單點感知。Fabian. N. Hauske等[6]在2009年提出使用相干接收機來聯(lián)合估計色散、偏振膜色散以及偏振相關(guān)損耗的方法。2017年,日本富士通公司在動態(tài)光網(wǎng)絡中使用光性能監(jiān)測來實現(xiàn)網(wǎng)絡資源的最優(yōu)分配[7]。為了進一步提高監(jiān)測準確度,結(jié)合機器學習算法實現(xiàn)光性能監(jiān)測成為研究熱點[8-10]。然而,單點感知技術(shù)在功能和精度方面存在欠缺,多點感知融合成為未來發(fā)展的一大趨勢。
圖1 光纖通信數(shù)字孿生系統(tǒng)架構(gòu)
為了實時消化感知提供的大量數(shù)據(jù),基于在線學習技術(shù),本文對系統(tǒng)中的物理層模型進行更新迭代,采用被動學習、主動學習等自學習方法,利用感知得到的網(wǎng)絡實時數(shù)據(jù)對系統(tǒng)中物理層模型進行訓練。該方法的優(yōu)點是,利用反映網(wǎng)絡當前狀態(tài)的小數(shù)據(jù)集對模型參數(shù)進行更新,相比于大量數(shù)據(jù)訓練得到的靜態(tài)模型,小數(shù)據(jù)集的仿真也能獲得相似的訓練精度[11-12]。
為了實現(xiàn)光纖通信數(shù)字孿生系統(tǒng)的構(gòu)建,光網(wǎng)絡物理層建模、感知技術(shù)及在線學習算法都需要進一步的研究。同時,三者之間的研究狀態(tài)相對獨立,需要站在全局高度對光纖通信數(shù)字孿生系統(tǒng)進行協(xié)同設計,在整體上依舊有很大的提升空間。
圖1為光纖通信數(shù)字孿生系統(tǒng)整體架構(gòu)圖。首先,對實際系統(tǒng)鏈路中每個單元進行數(shù)字化建模,建立基于數(shù)據(jù)驅(qū)動的灰盒孿生模型,該模型具有高精度、高泛化性特點。為了進一步降低復雜度,鏈路中各單元之間的耦合需要進一步結(jié)合波形仿真模型(計算信號波形)和性能計算模型(計算信噪比)來達到精度和復雜度的最優(yōu)折中。實際系統(tǒng)處于一個動態(tài)變化的狀態(tài),為了保持數(shù)字孿生系統(tǒng)與實際系統(tǒng)的一致性,通過物理層感知技術(shù)實時獲取網(wǎng)絡的當前狀態(tài),從而對初始模型進行更新迭代。物理層融合感知技術(shù)包括融合數(shù)據(jù)的提取、融合架構(gòu)的設計和融合算法。同時,為了賦予模型全生命周期推演能力,基于在線學習技術(shù)來定制每條鏈路的孿生模型。其中,在線學習技術(shù)包括主動學習、被動學習和概率學習。根據(jù)鏈路的具體情況綜合使用3種在線學習機制,可以最大程度地達到模型高效性、準確性的折中。綜上所述,為了實現(xiàn)基于物理層感知的全生命周期光纖通信數(shù)字孿生系統(tǒng),需要研究3個關(guān)鍵技術(shù):基于數(shù)據(jù)驅(qū)動的灰盒孿生建模;光纖物理層多維融合感知技術(shù);光纖系統(tǒng)在線學習算法和機制。本文將對這3個關(guān)鍵技術(shù)進行詳細的介紹。
基于數(shù)據(jù)驅(qū)動的灰盒孿生建模是全生命周期光纖通信數(shù)字孿生系統(tǒng)構(gòu)建的基礎?;液袑\生建模將傳統(tǒng)模型(白盒)和機器學習模型(黑盒)相結(jié)合,具有高精度和高泛化性的特點。對光纖鏈路采取模塊化建模的方式,對光收發(fā)機、光纖等各個單元分別建模,每個單元都是由灰盒模型組成。同時,為了滿足網(wǎng)絡管控速度的需要,將進一步降低各個單元的復雜度。因此,在各個單元的耦合上需要進一步結(jié)合波形仿真模型(計算信號波形)和性能計算模型(計算信噪比)的方案,達到精度與復雜度的最優(yōu)折中。最后,針對各個模塊之間的相關(guān)性,建立端到端的聯(lián)合校準機制,提升系統(tǒng)整體的建模精度。
以光纖的灰盒孿生建模為例,高斯噪聲模型是基于微擾假設提出來的計算光纖非線性信噪比的模型,包括相干高斯噪聲(Coherent Gaussian Noise,CGN)模型和非相干高斯噪聲(Incoherent Gaussian Noise,IGN)模型。IGN模型忽略了非線性噪聲的相干特性,是CGN模型的近似。但在多通道情況中,IGN模型的精確程度也很高,且由于其形式簡單、計算復雜度低的特點,IGN模型受到廣泛應用。文獻[12]給出了光纖灰盒模型(性能計算模型)的方案框圖,具體參見圖2。在仿真系統(tǒng)中,綜合對比了兩種模型及其與機器學習模型相融合的方案。圖3給出了傳統(tǒng)模型和融合方案的模型誤差??梢钥吹剑S著傳輸距離的增加,相干高斯噪聲模型的誤差從3.8 dB降低到0.5 dB;非相干高斯噪聲模型的誤差從3.8 dB降低到1.8 dB,而融合算法實現(xiàn)了不同傳輸距離下,模型誤差范圍在±1.1 dB以內(nèi)。仿真結(jié)果表明,傳統(tǒng)模型和數(shù)據(jù)驅(qū)動模型相結(jié)合可以實現(xiàn)性能的提升。
圖2 光纖灰盒模型框圖
圖3 仿真結(jié)果
感知技術(shù)是實現(xiàn)未來具備學習和演化能力的數(shù)字孿生的關(guān)鍵組成部分。在光纖通信數(shù)字孿生系統(tǒng)中,為了進行高效的網(wǎng)絡管控,同時為了提供基于數(shù)據(jù)驅(qū)動的灰盒孿生建模需要的實時感知數(shù)據(jù),需要對光網(wǎng)絡進行準確的監(jiān)測。光纖物理層多維融合感知技術(shù)包括數(shù)據(jù)的提取、融合架構(gòu)的設計和融合算法。
(1)數(shù)據(jù)的提取
數(shù)據(jù)的提取包括主動式和被動式的提取。主動式的提取方法是通過改變信號的狀態(tài)如在信號中插入到導頻等,來獲取監(jiān)測的信息。文獻[13]實現(xiàn)了利用導頻監(jiān)測鏈路的自相位調(diào)制效應(Self-phase Modulation,SPM),利用系統(tǒng)中已經(jīng)存在的用于載波相位恢復算法的導頻,在鏈路收端對該導頻信號進行平均來消除交叉相位調(diào)制效應(Cross-phase Modulation,XPM)的影響,只保留SPM噪聲,結(jié)合機器學習方法可對不同鏈路進行SPM估計,均方根誤差(Root Mean Square Error,RMSE)為0.36 dB。相比于主動式的感知方法,被動式的提取方法不需要改變信號的狀態(tài),直接在鏈路中獲取監(jiān)測信息。文獻[14]實現(xiàn)了利用收端數(shù)字信號處理(Digital Signal Processing,DSP)中的信號頻譜和均衡器收斂后的抽頭,結(jié)合神經(jīng)網(wǎng)絡,監(jiān)測鏈路中的濾波噪聲,該方法的監(jiān)測誤差RMSE為0.1 dB。
(2)融合架構(gòu)的設計
目前,單點監(jiān)測已經(jīng)受到了廣泛研究,但鏈路多監(jiān)測點協(xié)同設計的研究還十分欠缺,限制了物理層數(shù)據(jù)的有效利用。為了增強物理層的多點感知能力,可以借助鏈路中的一些監(jiān)測器件如光通道監(jiān)視器(Optical Channel Monitor,OCM)等,幫助提取光域的光譜等信息[15]。通過分析光譜的情況,為構(gòu)建灰盒孿生模型提供支撐。
圖4 第一階段神經(jīng)網(wǎng)絡性能曲線
(3)融合算法的實現(xiàn)
為了充分地利用來自網(wǎng)絡和鏈路的信息,文獻[16]提出從3個維度利用數(shù)據(jù)融合算法對物理層信息進行更加深入地分析與挖掘:從空間維度出發(fā),鏈路中的場景可分為同一區(qū)域和不同區(qū)域。對于同一區(qū)域的數(shù)據(jù),信號經(jīng)過同一組器件或同一段光纖,提供的數(shù)據(jù)具有強耦合性,可利用數(shù)據(jù)融合來挖掘數(shù)據(jù)間的相關(guān)性;對于不同區(qū)域的數(shù)據(jù),數(shù)據(jù)相關(guān)性較差,可通過聯(lián)邦學習等算法在各個區(qū)域進行分布式的模型訓練,從而提高算法的整體性能。從模型維度出發(fā),對于異構(gòu)模型,以傳統(tǒng)模型和機器學習模型為例,可以將兩者融合提供更好的預估結(jié)果;對于同構(gòu)模型,以機器學習模型為例,可以將多個弱學習器融合成為一個強學習器。從數(shù)據(jù)源維度出發(fā),需要融合來自物理層的光域和數(shù)字域的信息,主要包括級聯(lián)式融合、分階段融合、基于深度學習的數(shù)據(jù)融合3種方法。
以融合算法中的數(shù)據(jù)源融合為例,文獻[16]提出了一個兩階段的故障監(jiān)測和定位算法。在第一階段,使用均衡器抽頭的平均值、標準差、最小值、最大值,收端DSP中獲得的數(shù)字域頻譜的中心頻率和3 dB帶寬作為神經(jīng)網(wǎng)絡的輸入?yún)?shù),對故障進行監(jiān)測,并輸出粗略的定位結(jié)果。圖4所示為第一階段神經(jīng)網(wǎng)絡的估計精度曲線和損失函數(shù)曲線[16]。
在第二階段,只需要利用第一階段得到的近似位置附近的光域頻譜進行精準定位。頻率f處的理論光譜計算如下:
(1)
(2)
H(f)=Hsignal(f)Hrrc(f)s(f)n
(3)
其中,B和Botf分別代表波長選擇開關(guān)(Wavelength Selective Switch,WSS)濾波器的6 dB帶寬和陡降系數(shù),Hsignal(f)是傳輸信號的傅里葉變換,Hrrc(f)是根升余弦濾波器的傳輸函數(shù),n代表WSS級數(shù)。隨后將實際光譜與理論光譜差作為卷積神經(jīng)網(wǎng)絡的輸入,進行進一步的精準定位。經(jīng)過第二階段的定位,精度從第一階段的92.8%提升到100%。該結(jié)果表明,利用數(shù)據(jù)融合算法,可以實現(xiàn)故障定位精度的顯著提升。
光纖通信系統(tǒng)在線學習算法可以實時消化感知技術(shù)獲得的信息,對物理層模型進行更新迭代。在線修正的算法分為被動學習、主動學習和概率學習三大類。
(1)被動學習
使用現(xiàn)網(wǎng)中的已有信號光的真實數(shù)據(jù)來修正離線訓練得到的模型。由于現(xiàn)網(wǎng)中會逐漸部署大量業(yè)務光,接收機和光監(jiān)測模塊會實時上報與傳輸性能有關(guān)的真實數(shù)據(jù),這些數(shù)據(jù)可以用于更新離線訓練、設計的數(shù)字模型。在光網(wǎng)絡建立的初期,數(shù)據(jù)集較小,被動學習機制的效果受到限制。隨著業(yè)務光的增多,參考數(shù)據(jù)增多,數(shù)字模型精度逐漸提高。被動學習適用于數(shù)字模型不斷更新的場景,一定時間間隔內(nèi)再訓練或微調(diào)數(shù)字模型,實現(xiàn)相對容易。此外,將被動學習與一些新興算法如元學習相結(jié)合,可以對模型進行進一步的修正[17]。
(2)主動學習
通過主動更改信號配置、增加探針信號、發(fā)送導頻信號等方式,獲取真實數(shù)據(jù)來遷移或微調(diào)模型。對于難以直接通過監(jiān)測獲取的物理層信息,例如收發(fā)機代價、光信噪比等,可通過主動修改物理層配置,結(jié)合對應物理規(guī)律獲取。該算法對物理層已有信號的性能會造成一定的波動,具有一定的代價,僅在發(fā)出需求后才進行。如根據(jù)非線性噪聲的物理模型,使用GN模型對非線性噪聲進行較為準確地建模[1]。模型中,非線性噪聲的功率與信號的功率存在三次方的關(guān)系。通過改變信號的功率,可以對數(shù)據(jù)進行擬合,分離得到放大自發(fā)輻射(Amplified Spontaneous Emission,ASE)噪聲與非線性噪聲來獲取真實光纖鏈路的非線性效應的標簽數(shù)據(jù),實現(xiàn)光纖非線性建模精度的進一步提高。
(3)概率學習
結(jié)合了被動學習與主動學習,同時將物理層上報信息中的噪聲和不確定性考慮在內(nèi)。概率學習在學習真實數(shù)據(jù)的過程中,考慮訓練數(shù)據(jù)的可靠度以及最終模型輸出結(jié)果的可靠度。在實際系統(tǒng)中,光器件參數(shù)存在一定波動,被動或主動獲取的數(shù)據(jù)中包含了一定噪聲,需要在學習算法中考慮該因素。此外,數(shù)據(jù)驅(qū)動類模型的數(shù)據(jù)學習能力有限,難以實現(xiàn)無誤差的精度,在輸出估計結(jié)果時應當同時輸出置信度。基于貝葉斯理論的概率學習能夠滿足上述的需求,可以將物理層隨機波動考慮進來,學習輸出估計結(jié)果,給出置信區(qū)間。
為了實現(xiàn)網(wǎng)絡容量的提升,提高對復雜光網(wǎng)絡的管控能力,智慧全光網(wǎng)是光網(wǎng)絡未來發(fā)展的方向?;跀?shù)據(jù)驅(qū)動的光纖通信物理層數(shù)字孿生系統(tǒng)是實現(xiàn)智慧全光網(wǎng)的重要研究目標。本文介紹了數(shù)字孿生系統(tǒng)的相關(guān)研究進展及架構(gòu),分析了數(shù)字孿生系統(tǒng)中使用到的關(guān)鍵技術(shù),包括基于數(shù)據(jù)驅(qū)動的灰盒孿生建模、光纖物理層多維融合感知技術(shù)、光纖系統(tǒng)在線學習算法和機制?;诰_感知,具有精準物理模型,同時具備演進學習能力的數(shù)字孿生系統(tǒng)將成為光纖通信系統(tǒng)重要的數(shù)字底座,助力智慧全光網(wǎng)的構(gòu)建,支撐信息時代的發(fā)展。