沈綱祥
(蘇州大學(xué)蘇州市先進(jìn)光通信網(wǎng)絡(luò)技術(shù)重點實驗室,江蘇 蘇州 215006)
人工智能(AI,artificial intelligence)技術(shù)很早就被應(yīng)用于諸多領(lǐng)域,然而很多年來這一技術(shù)并未獲得高度關(guān)注,直至AlphaGo 戰(zhàn)勝中韓兩國圍棋高手后,它才開始成為研究熱點,研究者們嘗試將AI 技術(shù)應(yīng)用于不同的領(lǐng)域,其中也包括光通信網(wǎng)絡(luò)。近兩年,美國光通信會議(OFC,optical fiber communication)和歐洲光通信會議(ECOC,European conference of optical communication)上,至少有16 個會議專題聚焦于AI 或機(jī)器學(xué)習(xí)(ML,machine learning)技術(shù)。本文將AI 技術(shù)和ML 技術(shù)看作同一類技術(shù),同時,盡管AI 技術(shù)涵蓋很廣,本文中所指的AI 技術(shù)主要是神經(jīng)網(wǎng)絡(luò)類技術(shù)。
AI 技術(shù)受到廣泛關(guān)注主要有以下兩方面的原因。首先,AI 技術(shù)比較容易入門和使用。它采用黑盒子的方式對系統(tǒng)進(jìn)行建模,通過大量的樣本學(xué)習(xí),讓黑盒子自己去連接神經(jīng)元,分配神經(jīng)元間的連接權(quán)重,而不要求使用者了解神經(jīng)元間為何這樣連接和被分配當(dāng)前的權(quán)重。使用者只需提供足夠多的學(xué)習(xí)樣本,增加神經(jīng)元的個數(shù)和隱藏層的層數(shù),就可以提高AI 技術(shù)的預(yù)測精度。其次,AI 技術(shù)在AlphaGo 事件后幾乎已被神化,幾乎人人都知道“人工智能”這一詞匯,而在學(xué)術(shù)圈,貼上AI 標(biāo)簽的論文似乎也更容易發(fā)表,所以這也導(dǎo)致了目前的一個現(xiàn)象,即對于所有問題,不管是否適合,幾乎都采用AI 技術(shù)進(jìn)行建模求解。
AI 技術(shù)對一些問題的求解是十分成功的,如前面所提的圍棋和一些圖像語音識別場景,但是不能因某一領(lǐng)域或某些問題的成功求解,而將AI 當(dāng)成一種“萬能方法”。本文針對當(dāng)前AI 技術(shù)在光通信網(wǎng)絡(luò)中的應(yīng)用進(jìn)行探討,包括AI 技術(shù)在光通信網(wǎng)絡(luò)中的適用性,并對使用AI 技術(shù)的潛在風(fēng)險提出一些應(yīng)對策略。
AI 技術(shù)已廣泛應(yīng)用于光通信網(wǎng)絡(luò),文獻(xiàn)[1-2]中可以找到大量這方面的研究。本文介紹AI 技術(shù)在光通信網(wǎng)絡(luò)中的幾種代表性的應(yīng)用。1)在接收端,采用結(jié)合AI 技術(shù)的數(shù)字信號處理方法,可以有效地提高光信號檢測靈敏度,改善光纖傳輸系統(tǒng)的性能,提高網(wǎng)絡(luò)的頻譜使用效率[3-5]。2)在光網(wǎng)絡(luò)中,存在大量端到端光通道,分別以這些光通道的相關(guān)參數(shù)(包括傳輸速率、調(diào)制格式、所經(jīng)過的光纖鏈路數(shù)、光放大器個數(shù)及增益等)和它們在接收端檢測到的信號傳輸質(zhì)量(QoT,quality of transmission)作為輸入和輸出,通過大量學(xué)習(xí),可以實現(xiàn)對光網(wǎng)絡(luò)中不同端對端光通道QoT 的預(yù)測;其中,QoT經(jīng)常表示為光通道的信噪比(OSNR,optical signal to noise ratio),其精準(zhǔn)預(yù)測可以降低光通道OSNR 余量的配置,從而提高網(wǎng)絡(luò)的頻譜使用效率[6-8]。3)通過不斷學(xué)習(xí)光網(wǎng)絡(luò)中的故障事件,分別以故障和故障原因作為輸入和輸出,實現(xiàn)對故障原因的精準(zhǔn)分析和對未來故障的預(yù)警[9-11]。4)結(jié)合網(wǎng)絡(luò)安全的需求,AI技術(shù)也可用于預(yù)警和識別光層的網(wǎng)絡(luò)攻擊[12-13]。
針對以上幾種代表性的應(yīng)用,本文將其分類為決策性AI 應(yīng)用和輔助性AI 應(yīng)用。決策性應(yīng)用是指整個系統(tǒng)的運行直接依賴于AI 技術(shù),AI 預(yù)測的失效可能導(dǎo)致系統(tǒng)的癱瘓,造成嚴(yán)重后果。在上述代表性應(yīng)用中,1)和2)均可被歸為決策性AI 應(yīng)用。例如,對于光通道QoT 的預(yù)測,盡管在大多數(shù)情形下,AI 技術(shù)可以較精準(zhǔn)地預(yù)測光通道的QoT,但如果在某一時刻其預(yù)測失效,將導(dǎo)致相應(yīng)的光通道不能被實際建立,或者建立的光通道達(dá)不到用戶的傳輸要求,就違背了通信服務(wù)水平協(xié)議(SLA,service level agreement)。對于骨干網(wǎng)絡(luò)中的高速光通道,SLA 違背的后果往往比較嚴(yán)重,可能會引起巨額的商業(yè)賠償。所以,對于決策性AI 的應(yīng)用,網(wǎng)絡(luò)運營商和設(shè)備生產(chǎn)商一般都比較謹(jǐn)慎。到目前為止,尚未發(fā)現(xiàn)有網(wǎng)絡(luò)運營商在其現(xiàn)網(wǎng)中采用基于AI 技術(shù)的光通道QoT 預(yù)測。
輔助性AI 應(yīng)用是指采用AI 技術(shù)進(jìn)行日常網(wǎng)絡(luò)維護(hù)和潛在故障的預(yù)測,這類預(yù)測的失敗不會造成系統(tǒng)的癱瘓或嚴(yán)重的經(jīng)濟(jì)損失,其類似于購物網(wǎng)站的商品推介,推介錯誤只是減少了有效推介的機(jī)會,而不會造成任何損失。前面所提的代表性應(yīng)用3)和4)均可被歸為輔助性AI 應(yīng)用。例如,可采用AI 技術(shù)對網(wǎng)絡(luò)未來故障開展預(yù)測,如果預(yù)測準(zhǔn)確,可以提高網(wǎng)絡(luò)的穩(wěn)健性;如果預(yù)測失敗,也不會造成損失。因為其只是一種提醒或預(yù)警,網(wǎng)管人員會對此類預(yù)警信息進(jìn)行核實,如果預(yù)測正確,會采取相應(yīng)的措施;如果預(yù)警錯誤,則將其忽略,不會影響網(wǎng)絡(luò)的正常運行。
以“黑盒子”為代表的AI 技術(shù)易學(xué)易用,目前屬于研究熱點。AI 技術(shù)可以很好地解決一些問題(如圍棋、圖像語音識別等),但它并非萬能,對于其他的一些問題,過度使用AI 技術(shù)反而會引入弊端和風(fēng)險。本節(jié)將結(jié)合光通信網(wǎng)絡(luò),介紹幾種AI技術(shù)可能帶來的弊端和風(fēng)險。
AI 技術(shù)將同一種“黑盒子”方法不斷地套用到不同的應(yīng)用場景,導(dǎo)致對方法創(chuàng)新和背后機(jī)理分析的懈怠。一個很典型的例子如下。由于AI 技術(shù)(如深度學(xué)習(xí))可以有效地識別一些圖像模式,有研究者把這一技術(shù)應(yīng)用到對人體不同部位病變的識別?;谙嗤姆椒ê土鞒蹋粩嗟厥褂貌煌娜梭w部位圖片,這樣可以形成大量的所謂“研究成果”和學(xué)位論文。顯然,從培養(yǎng)學(xué)生和科研的角度,學(xué)生在項目中實際獲得的研究技能和專業(yè)素養(yǎng)的提升是很少的,而實際工作只是收集相關(guān)的圖片數(shù)據(jù)和編寫少量Python 代碼,最后將訓(xùn)練任務(wù)交由圖形處理器(GPU,graphics processing unit)來完成,沒有針對具體的研究問題在方法機(jī)理上進(jìn)行深入的思考和有效的創(chuàng)新,也不能掌握(事實上目前也無法掌握)黑盒子里究竟發(fā)生了什么,這顯然不利于創(chuàng)新能力的培養(yǎng)。
圍棋棋盤中的19 條橫線加上19 條豎線形成了一個閉合的信息(狀態(tài))空間,圍棋的規(guī)則是固定的,外界因素不會改變這一信息空間的大小,是一種完全信息的博弈。光通信網(wǎng)絡(luò)系統(tǒng)是一個開放系統(tǒng)(或不完全信息系統(tǒng)),它的開放性決定了AI 技術(shù)學(xué)習(xí)(狀態(tài))空間的無限性。很多論文中報道的AI 技術(shù)很可能只是學(xué)習(xí)了光通信網(wǎng)絡(luò)整個開放空間中的某一小部分[6-8],這一部分可能只對應(yīng)于某一常規(guī)場景,而當(dāng)實際應(yīng)用場景偏離常規(guī)場景時,前面學(xué)習(xí)獲得的AI 參數(shù)就會失效,導(dǎo)致AI 預(yù)測模型出錯。下面給出幾個典型的例子。
1)5G 核心網(wǎng)
以下是一個典型的實例。AI 技術(shù)被某設(shè)備生產(chǎn)商應(yīng)用于5G 核心網(wǎng),在對國內(nèi)5G 核心網(wǎng)全面多參數(shù)AI 學(xué)習(xí)后,獲得一套較為精準(zhǔn)的網(wǎng)絡(luò)性能預(yù)測模型,然而將這一系統(tǒng)直接應(yīng)用于歐洲某城市5G核心網(wǎng)時,模型不能正常工作,不能有效地預(yù)測并提升5G 核心網(wǎng)的性能。這是一個典型的由于系統(tǒng)學(xué)習(xí)空間不封閉(或不完全信息系統(tǒng))而導(dǎo)致的預(yù)測模型失敗的例子,中國城市和歐洲城市的5G 核心網(wǎng)環(huán)境是不同的,2 個城市分別對應(yīng)于開放空間中2 個不同的子空間,所以在中國城市學(xué)習(xí)的5G核心網(wǎng)參數(shù)不能保證在歐洲城市也有效。
2)光通道QoT 的預(yù)測
在光通信網(wǎng)絡(luò)中,對于光通道信號傳輸質(zhì)量的預(yù)測,也存在光通信網(wǎng)絡(luò)學(xué)習(xí)空間巨大和開放性的問題。對于QoT 的預(yù)測,通常是以網(wǎng)絡(luò)中光通道的相關(guān)參數(shù)(包括傳輸速率、調(diào)制格式、所經(jīng)過的光纖鏈路數(shù)、光放大器個數(shù)及增益等)和它們在接收端檢測到的QoT 分別作為輸入和輸出,通過大量學(xué)習(xí),實現(xiàn)對光網(wǎng)絡(luò)中不同端對端光通道QoT 的預(yù)測。盡管可以在實驗室中收集幾千個光通道測試樣本(事實上,現(xiàn)在很多發(fā)表的論文使用的數(shù)據(jù)量要遠(yuǎn)小于這一量級),然后采用這些樣本進(jìn)行訓(xùn)練學(xué)習(xí),獲得相應(yīng)的預(yù)測參數(shù),從論文發(fā)表的角度,這一過程是完整的,實驗室獲得的樣本形成了一個子空間,采用這一空間中的樣本獲得的預(yù)測模型能有效地預(yù)測相同空間中的其他樣本。然而,對于一個巨大開放的光通信網(wǎng)絡(luò)狀態(tài)空間,上述方法獲得的實驗室樣本量仍過小,很難代表光網(wǎng)絡(luò)開放環(huán)境下的全天候狀態(tài)數(shù)據(jù)。因此,一個重要問題是,能否使用這些實驗室中獲得的模型參數(shù)去預(yù)測實際開放光網(wǎng)絡(luò)中光通道的QoT?顯然,這是很具挑戰(zhàn)性的,失敗的概率會很高。原因可以通過以下例子來分析。
以一條建立在廣州和沈陽之間的光通道為例(如圖1 所示)。它經(jīng)過多個不同的光纖鏈路段,這些鏈路段有的通過地下管道鋪設(shè),有的露天布設(shè),同時考慮不同地區(qū)和不同季節(jié)的溫差,以及露天光纖段的擺動(例如由于大風(fēng)造成露天光纜的擺動會嚴(yán)重影響光纖通信系統(tǒng)的正常工作)。這一實際網(wǎng)絡(luò)場景顯然比實驗室中的場景要復(fù)雜得多,其信息狀態(tài)空間比實驗室場景大得多。如果采用實驗室子空間中學(xué)習(xí)獲得的模型去預(yù)測這一光通道的QoT,其精準(zhǔn)度顯然是不能保證的。此外,還需要進(jìn)一步考慮一些突發(fā)事件,如某段光纜被拖拽,或者某段光纜管道出現(xiàn)雨水倒灌、某一地段發(fā)生地震等,這些都可能導(dǎo)致網(wǎng)絡(luò)信息狀態(tài)空間發(fā)生變化。所以,擁有多個節(jié)點、多條鏈路的光通信網(wǎng)絡(luò)的信息狀態(tài)空間是不封閉且時變的,幾乎是無限大的,是一個不完全信息系統(tǒng)。針對此類系統(tǒng),要通過幾千個靜態(tài)信道的狀態(tài)樣本來學(xué)習(xí)獲取一個統(tǒng)一精準(zhǔn)的AI預(yù)測模型顯然是相當(dāng)困難的,幾乎不可能實現(xiàn)。
圖1 建立在廣州和沈陽之間的光通道
3)網(wǎng)絡(luò)故障和動態(tài)性
AI 技術(shù)的模型訓(xùn)練通?;谡>W(wǎng)絡(luò)場景,所采集的樣本也是在網(wǎng)絡(luò)正常運行下的樣本。當(dāng)網(wǎng)絡(luò)發(fā)生故障時,其對應(yīng)的場景會發(fā)生偏離,導(dǎo)致其對應(yīng)的狀態(tài)信息空間發(fā)生變化,這從另一側(cè)面說明了光通信網(wǎng)絡(luò)是一個不完全信息系統(tǒng),此時如果繼續(xù)采用正常場景下獲得的模型對新場景進(jìn)行預(yù)測,就會面臨預(yù)測失敗的風(fēng)險。對于第2 節(jié)中提到的應(yīng)用場景2),目前大多數(shù)的光通道QoT 預(yù)測模型在學(xué)習(xí)時均未考慮網(wǎng)絡(luò)發(fā)生老化和部分故障時的情形。然而,在實際光網(wǎng)絡(luò)中,存在光放大器的泵浦光源逐漸老化、泵浦功率逐漸衰竭等問題。所以,一個完整可靠的QoT 預(yù)測模型需要覆蓋此類老化情形,然而這一過程是十分復(fù)雜的,因為其對應(yīng)的學(xué)習(xí)樣本很難產(chǎn)生和收集,所需的學(xué)習(xí)時間也相當(dāng)冗長。
此外,現(xiàn)有的很多光通道QoT 預(yù)測模型也未考慮光網(wǎng)絡(luò)的動態(tài)特性,如新的光通道業(yè)務(wù)的建立和老業(yè)務(wù)的釋放等。在光纖通信系統(tǒng)中,任何光通道的建立或釋放都會影響與其同纖的其他光通道??紤]到光網(wǎng)絡(luò)中存在大量的光通道,不同光通道同纖的組合幾乎是無窮的,這使光通道QoT 模型訓(xùn)練過程很難對這些組合進(jìn)行全覆蓋,所以也很難保證所得預(yù)測模型的精準(zhǔn)性。事實上,目前大多數(shù)研究只采用了最多幾百條靜態(tài)光通道的訓(xùn)練樣本[6],而面對一個包含幾十個甚至上百個節(jié)點的光網(wǎng)絡(luò),這一規(guī)模的訓(xùn)練樣本顯然是不夠的。
盡管AI 具有不斷學(xué)習(xí)進(jìn)化的能力,理論上可以應(yīng)對由于網(wǎng)絡(luò)故障和動態(tài)性造成的樣本不完整性和結(jié)果適應(yīng)性差等問題,但這要求在網(wǎng)絡(luò)環(huán)境發(fā)生變化后,系統(tǒng)能立即擁有足夠多的新環(huán)境學(xué)習(xí)樣本,且系統(tǒng)的學(xué)習(xí)必須足夠快,能在新環(huán)境下立即完成學(xué)習(xí)。然而,在未進(jìn)入未知新環(huán)境前或剛進(jìn)入新環(huán)境時,短時間內(nèi)獲取大量新環(huán)境下的學(xué)習(xí)樣本顯然是比較困難的。為解決這一少樣本或無樣本的問題,可以通過專家決策的方法為學(xué)習(xí)提供先驗知識,但這些先驗知識或虛擬樣本不是系統(tǒng)實際產(chǎn)生的,有時并不能精確反映系統(tǒng)的實際行為,所以基于此訓(xùn)練的模型也不能保證其預(yù)測結(jié)果的精準(zhǔn)性。
AI 技術(shù)的基礎(chǔ)是概率統(tǒng)計,主要依賴大量的樣本學(xué)習(xí)來形成一套用于預(yù)測的系統(tǒng)參數(shù)。這一特性可能在某些場合下給網(wǎng)絡(luò)攻擊提供可乘之機(jī),對網(wǎng)絡(luò)安全形成威脅。例如,一個用戶可以通過為訓(xùn)練系統(tǒng)提供大量假的或者不是最優(yōu)的網(wǎng)絡(luò)樣本,使學(xué)習(xí)后獲得的系統(tǒng)參數(shù)偏離實際的最優(yōu)參數(shù)。盡管對于這一用戶來說,這樣做的代價是其不能獲得最優(yōu)的網(wǎng)絡(luò)性能,但其可以惡意控制或影響整個網(wǎng)絡(luò)中的資源分配決策和其他用戶的網(wǎng)絡(luò)性能。事實上,在某些網(wǎng)絡(luò)排名系統(tǒng)中,很早就有用戶利用這一統(tǒng)計學(xué)方面的漏洞,來提高某些商品或網(wǎng)站排名和推薦機(jī)會。目前,專門針對AI 技術(shù)的網(wǎng)絡(luò)攻擊尚很少被提及和關(guān)注,但這并不表示此類攻擊在不久的將來不會出現(xiàn)。
AI 技術(shù)對光通信網(wǎng)絡(luò)的規(guī)劃和運營是有幫助的,但不是萬能的。針對其在應(yīng)用中可能存在的一些風(fēng)險,本節(jié)建設(shè)性地提出了以下幾點建議。
首先,AI 技術(shù)在光通信網(wǎng)絡(luò)應(yīng)用中比較適合于輔助性的預(yù)測場景,如網(wǎng)絡(luò)中某些信號的出現(xiàn)預(yù)示著可能會在某些位置出現(xiàn)網(wǎng)絡(luò)故障,因此可以進(jìn)行預(yù)警,對網(wǎng)絡(luò)和傳輸系統(tǒng)進(jìn)行提前干預(yù),防止故障的發(fā)生。只要保證大部分預(yù)警是正確的,即使存在少量的預(yù)警錯誤,也不會給網(wǎng)管人員造成很大的負(fù)擔(dān),這一智能性將極大地提高網(wǎng)絡(luò)的可靠性,改善網(wǎng)絡(luò)資源的使用效率,并提高用戶的使用體驗。
其次,由于光通信網(wǎng)絡(luò)的巨大規(guī)模和高度的開放性,對于涉及SLA 的決策性應(yīng)用場景,AI 技術(shù)應(yīng)避免將整個光通信網(wǎng)絡(luò)看成一個巨大的“黑盒子”來學(xué)習(xí),盡管該類方法對于進(jìn)行方法性探究是可行的,但在實際工程性應(yīng)用中,存在著巨大的風(fēng)險。這是因為,光通信網(wǎng)絡(luò)狀態(tài)空間的開放性和突發(fā)事件的不確定性決定了AI 技術(shù)的預(yù)測能力不可能保證全覆蓋,一定會出現(xiàn)某些失效場景,造成SLA 的違背,進(jìn)而導(dǎo)致巨額的經(jīng)濟(jì)賠償,相對于這一賠償和后續(xù)造成的損失,AI 技術(shù)給光通信網(wǎng)絡(luò)帶來的效率提升和成本節(jié)省可能可以忽略。
第三,面對開放的光通信網(wǎng)絡(luò)狀態(tài)空間,一個比較有效的策略是采用基于單元器件或設(shè)備的單元化小空間AI 建模,并基于獲得的AI 單元參數(shù),進(jìn)一步結(jié)合傳統(tǒng)的經(jīng)典方法進(jìn)行網(wǎng)絡(luò)建模和規(guī)劃。這一結(jié)合能有效地解決基于全網(wǎng)AI 技術(shù)建模下狀態(tài)空間開放性的難題??s小的子系統(tǒng)狀態(tài)空間能有效降低AI 技術(shù)失效的風(fēng)險,同時,由于采用了傳統(tǒng)的網(wǎng)絡(luò)建模和規(guī)劃方法,能有效規(guī)避在AI 技術(shù)下全網(wǎng)黑盒子的弊端,當(dāng)出現(xiàn)失效時,仍可以很快地通過傳統(tǒng)的建模和規(guī)劃方法,宏觀地確定實際失效的位置和對應(yīng)的“小盒子”。
本文結(jié)合3.2 節(jié)提到的光通道QoT 預(yù)測問題,給出了一個基于小盒子縮小狀態(tài)空間的光通道QoT 估算例子,如圖2 所示。圖2 給出了一個完整的光通信網(wǎng)絡(luò)模型。左邊方框中光發(fā)射機(jī)作為信號源,是光通道的起點。光通道經(jīng)過多條光纖鏈路,每條鏈路上放置多個光信號放大器,對光信號進(jìn)行周期性的放大。光通道也會經(jīng)過全光交換節(jié)點(ROADM,reconfigurable optical add/drop multiplexer)進(jìn)行光纖鏈路的切換。最后,經(jīng)過多條鏈路、多個光信號放大器、多個全光交換節(jié)點后,光通道到達(dá)目的節(jié)點,其信號被光接收機(jī)接收。整個系統(tǒng)中的器件或子系統(tǒng)包含光發(fā)射機(jī)、光接收機(jī)、光信號放大器、全光交換節(jié)點等。在單元化AI 建模方法下,首先對光網(wǎng)絡(luò)系統(tǒng)中的每個子系統(tǒng)盒子(如光發(fā)射機(jī)[14]、光接收機(jī)[15]、光信號放大器[16-17]、ROADM[18]等)進(jìn)行基于AI 技術(shù)的訓(xùn)練和預(yù)測,然后,在獲得相關(guān)AI 預(yù)測模型后,對跨越整個網(wǎng)絡(luò)的光通道進(jìn)行基于傳統(tǒng)高斯噪聲信道模型[19]建模估算。由于每個器件或子系統(tǒng)都處于一個相對封閉的環(huán)境,如光收發(fā)機(jī)、光交換機(jī)和光信號放大器均可能被置于機(jī)房內(nèi),環(huán)境溫度恒定,外界干擾較少,使AI 技術(shù)的應(yīng)用場景更接近于實驗室環(huán)境,從而保證了其相對封閉性。同時,由于每個器件或子系統(tǒng)相對獨立,涉及的特征量較少,其狀態(tài)空間相對較小,在封閉且較小的狀態(tài)空間下,可以使用較少的訓(xùn)練樣本獲得較高精度的預(yù)測模型,極大地改善AI 技術(shù)的適用性和實用性。另一方面,由于采用了經(jīng)典的高斯噪聲信道QoT 估算模型,存在堅實的物理理論指引,因此整個系統(tǒng)不再是一個“大而黑”的盒子,當(dāng)網(wǎng)絡(luò)出現(xiàn)問題時,可以通過分析估算模型快速確定問題的根源。
圖2 小系統(tǒng)AI 模型和經(jīng)典高斯噪聲信道模型相結(jié)合的光通道QoT 估算
第四,盡管采用AI 技術(shù)進(jìn)行更高精度的網(wǎng)絡(luò)性能預(yù)測可以提高網(wǎng)絡(luò)資源使用效率、降低網(wǎng)絡(luò)成本,但這是以損害網(wǎng)絡(luò)可用性或生存性為代價的。傳統(tǒng)的光網(wǎng)絡(luò)建模和規(guī)劃通常為了保證足夠高的網(wǎng)絡(luò)可用性(如99.999%),留足各方面的余量。例如,在評估光通道所需的QoT 時,通常為了支持某種調(diào)制格式和頻譜效率,會全面地考慮各種OSNR損傷并留足余量,以保證光網(wǎng)絡(luò)在20~30 年之后還能正常工作。而AI 技術(shù)想通過大量的樣本學(xué)習(xí)來獲得一個更加精確的信道QoT 評估模型,以此降低傳統(tǒng)方法下需要的余量。但是由于光通信網(wǎng)絡(luò)狀態(tài)空間的開放性,這種降低OSNR 余量的方法可能會使網(wǎng)絡(luò)可用性[20]受損,而對于AI 技術(shù)的使用到底會多大程度影響網(wǎng)絡(luò)可用性,是否會造成SLA 的違背,目前尚沒有明確答案,也沒有精確的評估方法。其原因在于,AI 技術(shù)是一個黑盒子技術(shù),里面設(shè)置的參數(shù)和實際網(wǎng)絡(luò)參數(shù)沒有一一對應(yīng)關(guān)系,可解釋性較差。所以,在使用AI 技術(shù)的同時,評估光通信網(wǎng)絡(luò)的可用性是十分必要的,只有在未違背網(wǎng)絡(luò)可用性要求下,使用AI 技術(shù)才有實際意義,然而這方面的研究目前尚為空白。
第五,針對AI 預(yù)測模型失效的情形,需要建立一種專門的網(wǎng)絡(luò)保護(hù)機(jī)制,即當(dāng)由于AI 預(yù)測模型失效而出現(xiàn)網(wǎng)絡(luò)癱瘓時,存在一種機(jī)制能及時地恢復(fù)網(wǎng)絡(luò)業(yè)務(wù)。這種業(yè)務(wù)的恢復(fù)機(jī)制和傳統(tǒng)的網(wǎng)絡(luò)發(fā)生故障時的業(yè)務(wù)恢復(fù)[21]十分類似。例如,對于點對點的光通道業(yè)務(wù),可以使用AI 技術(shù)建立一條工作光通道,同時采用基于傳統(tǒng)的非AI 技術(shù)預(yù)留一條保護(hù)光通道。這里保護(hù)光通道需留足OSNR 余量,所以其頻譜資源使用效率可能會低于工作光通道,但當(dāng)工作光通道由于基于AI 預(yù)測模型的配置失效時,可以通過保護(hù)切換將業(yè)務(wù)從工作光通道快速地切換到保護(hù)光通道上,這時由于保護(hù)光通道留足了OSNR 余量,能正常工作,從而保證了用戶的網(wǎng)絡(luò)業(yè)務(wù)不受影響。目前,針對AI 預(yù)測模型失效的保護(hù)研究仍為空白,需要進(jìn)一步針對不同的AI 應(yīng)用場景提出不同的網(wǎng)絡(luò)保護(hù)和恢復(fù)機(jī)制。
第六,由于AI 預(yù)測模型是通過對大量的樣本或統(tǒng)計概率的方式學(xué)習(xí)而獲得的,因此此類系統(tǒng)可能會遭受惡意假樣本的攻擊,攻擊會影響系統(tǒng)的預(yù)測精度。此外,也可能面臨更為精準(zhǔn)或細(xì)化的攻擊,如專門針對AI 系統(tǒng)中某一特征值、神經(jīng)元函數(shù)或權(quán)重值的攻擊。盡管目前尚未看到此類攻擊的報道,但未雨綢繆,需要盡早考慮相應(yīng)的應(yīng)對策略和防范措施。
本文針對基于AI 技術(shù)的光通信網(wǎng)絡(luò)這一當(dāng)前研究熱點進(jìn)行了系統(tǒng)性的探討,認(rèn)為AI 技術(shù)更適合于一些輔助性的預(yù)測場景,將其應(yīng)用于涉及SLA的場景時,需要進(jìn)行深入的論證并開展風(fēng)險評估。對AI 技術(shù)在光通信網(wǎng)絡(luò)中的應(yīng)用提出了一些建議,主要包括通過盡量減小系統(tǒng)狀態(tài)空間的大小,以規(guī)避整個光網(wǎng)絡(luò)巨型空間的開放性,同時為避開“黑盒子”弊端,基于小系統(tǒng)的AI 建模仍需與傳統(tǒng)的經(jīng)典網(wǎng)絡(luò)建模和規(guī)劃方法相結(jié)合。針對AI 技術(shù)的可能失效和受攻擊等問題,提出了專門的網(wǎng)絡(luò)保護(hù)思想。本文涉及的觀點是開放的,從不同的角度提供一些新的思路和啟示。同時,盡管本文主要針對光通信網(wǎng)絡(luò),其中的一些思想和方法也可應(yīng)用于其他領(lǐng)域,期待與讀者進(jìn)一步交流探討。