王孝艷,王志遠,陳子陽,蒲繼雄
(華僑大學信息科學與工程學院,福建省光傳輸與變換重點實驗室,福建 廈門 361021)
具有螺線型相位分布的光束被稱為渦旋光束,1992年,Allen等[1]的研究表明渦旋光束的光子攜帶軌道角動量。渦旋光束的軌道角動量可以傳遞給微粒,從而驅動微粒轉動[2,3]。2004年,Gibson等[4]將渦旋光束軌道角動量應用于自由空間的信息編碼與傳輸。由于渦旋光束的軌道角動量理論上有無限的取值,因此這種新型的光信息編碼方式具有更高的信息容量[5];此外,該研究還表明這種編碼方式具有更好的保密性[5]。渦旋光束的獨特性質(zhì)引起了研究人員的廣泛關注,相關研究陸續(xù)開展[6?8]。
準確測量渦旋光束的軌道角動量對于渦旋光束的應用具有重要意義[9,10]。研究人員提出了一系列基于干涉和衍射的渦旋光束軌道角動量測量方法,例如與球面波進行干涉[11]、Mach-Zehnder干涉[12]、雙縫干涉[13]、多點干涉[14]、三角形衍射[15]、角透鏡衍射[16]等,但是這些方法大多只適用于渦旋光束在自由空間中的傳輸。在光信息傳輸和醫(yī)學診斷等諸多應用中,常涉及到光經(jīng)過各種隨機介質(zhì)的傳輸,例如毛玻璃、多模光纖、生物組織等[17?19]。這些介質(zhì)的隨機散射和折射率不均勻分布導致了光束相位的畸變,并形成光強無序分布的散斑。因此當渦旋光束經(jīng)過這類隨機介質(zhì)傳輸后不再保持螺線型相位分布,上述傳統(tǒng)測量方法無法準確測量渦旋光束軌道角動量。
盡管渦旋光束經(jīng)過隨機介質(zhì)后形成了散斑狀光強分布,但是散射過程實際上可以被認為是一個光場信息的重新分布過程,即散斑場中仍然包含了入射光的信息,只是其信息被打亂。直接從散斑場中提取入射光的信息是具有重要意義同時又極具挑戰(zhàn)性的研究。光束經(jīng)過隨機介質(zhì)的傳輸是一個非常復雜的過程,可以將該傳輸過程用傳輸矩陣表述,通過測量隨機介質(zhì)的傳輸矩陣并進行反演,可以從散斑場中還原出入射光場的信息,但是傳輸矩陣的測量需要較為復雜的光學系統(tǒng)、耗時的測量過程以及繁瑣的算法[20,21]。深度學習技術是另外一種從散斑場中恢復入射光場信息的有效方法,該技術通過采集一定量的入射光場及其對應的散斑場,利用這些數(shù)據(jù)訓練網(wǎng)絡,將未參與訓練過程的散斑光強圖樣輸入網(wǎng)絡就可以預測入射光場的信息。目前已有一些相關研究從散斑場中還原了入射渦旋光束的拓撲荷數(shù),然而這些研究中入射光場通常只是單一渦旋結構[22?24]。提高渦旋光束軌道角動量信息傳輸能力的一個可行方法是采用空間復用技術,即利用一束光同時傳輸多個渦旋結構。
本文針對這種空間復用信息編碼技術,基于深度學習方法從單幀散斑場中實現(xiàn)了多個渦旋光束軌道角動量的測量。相較于傳統(tǒng)方法,深度學習方法具有以下優(yōu)勢:深度學習模型的泛化能力及魯棒性強,同時具有光路設計簡單、實驗裝置精度要求低的優(yōu)點;對于訓練好的網(wǎng)絡,僅需采集一張散斑圖就可以同時自動識別多個光渦旋的信息;不要求渦旋結構具有確定的螺線型相位分布,也能準確識別非理想相位分布的渦旋結構信息。
為了獲得足夠的網(wǎng)絡訓練數(shù)據(jù),本研究組設計了如圖1所示的實驗裝置,激光器(Onefive Origami-10XP,400 fs,1 MHz)發(fā)射波長為1028 nm的紅外激光,其經(jīng)過偏振片P后照射在反射式空間光調(diào)制器(SLM,HAMAMATSU,X13138-03)上,SLM加載多束渦旋光的相位圖,將入射光調(diào)制為空間復用的多渦旋結構光束。渦旋相位圖的大小為400 pixel×400 pixel。三渦旋相位圖中,第一個渦旋相位奇點位置位于相位圖中心左邊100 pixel,該位置圍繞相位圖中心順時針旋轉120°兩次依次獲得第二、三個渦旋相位奇點位置,每個圓形渦旋相位直徑為160 pixel;類似地,五渦旋相位圖中,第一個渦旋相位奇點位置位于相位圖中心左邊100 pixel,該位置圍繞相位圖中心順時針旋轉72°依次獲得第二、三、四、五個渦旋相位奇點位置,每個圓形渦旋相位直徑為104 pixel。此處所加載的渦旋光相位圖周邊分布有隨機相位,從而避免多個渦旋結構之間出現(xiàn)干涉條紋。調(diào)制后的多束渦旋光沿入射方向返回,由BS分束后其中一束入射至物鏡(O,10X,NA=0.25)中。多渦旋結構光經(jīng)過O聚焦照射在毛玻璃(GGD,Thorlabs,DG10-220,220 grit)上,其產(chǎn)生的散射光斑被工業(yè)相機(CCD,AVT,Pike F421B)拍攝采集,工業(yè)相機采集的散斑大小為256 pixel×256 pixel,并由計算機保存。實驗采集了兩組多渦旋光束散斑數(shù)據(jù)集,分別為3束渦旋光散斑以及5束渦旋光散斑,詳細參數(shù)見表1。
圖1 實驗裝置圖Fig.1 Schematic of experimental setup
表1 多束渦旋光散斑數(shù)據(jù)集信息Table 1 Detail of the speckle datasets of multi-vortex beams
實驗分別采集了3束渦旋光與5束渦旋光的散斑數(shù)據(jù)集,兩組數(shù)據(jù)軌道角動量數(shù)的變化范圍分別為1~20與1~6,間隔為1;在兩個數(shù)據(jù)集中分別隨機選取了25%、25.7%的數(shù)據(jù)作為測試集,不參與訓練過程,剩余的數(shù)據(jù)分別作為訓練集用于網(wǎng)絡訓練。
網(wǎng)絡結構如圖2所示,256 pixel×256 pixel的散斑圖輸入到網(wǎng)絡后,經(jīng)過16個步長為1、4×4大小的卷積核卷積后輸出256×256×16的張量,之后經(jīng)過7次大小為4×4、步長為2、不同數(shù)目的卷積核卷積后輸出2×2×128的張量,經(jīng)過全局池化層后輸出1×1×128的張量。散斑圖中包含的所有軌道角動量以獨熱編碼(One-hot encoding)表示,即用M位狀態(tài)寄存器來表示M個軌道角動量的狀態(tài)。輸出層使用N(渦旋光束數(shù)目)個激活函數(shù)為Softmax的全連接層連接,每個全連接層的節(jié)點數(shù)等于每束渦旋光軌道角動量的種類M。最后,基于Softmax函數(shù)輸出的張量最大概率所在位置,網(wǎng)絡通過反獨熱編碼即可輸出該位置所代表的軌道角動量。Softmax函數(shù)表達式為
圖2 網(wǎng)絡簡圖Fig.2 Diagram of network structure
式中:zi為第i個節(jié)點的輸出,n為輸出節(jié)點的數(shù)目,即所有的軌道角動量種類。本研究中網(wǎng)絡對渦旋光的識別準確率定義為
網(wǎng)絡使用步長為2的卷積核替代池化層,在對輸入張量進行卷積操作的同時起到了下采樣的作用;卷積核全部采用ReLU為激活函數(shù),每次卷積操作后通過批量歸一化(Batch-Normalization,momentum=0.95)避免梯度消失或爆炸。全連接層的Dropout概率為0.3,以避免過擬合。
網(wǎng)絡運行環(huán)境基于TensorFlow2.6,使用GPU(NVIDIA,RTX2080SUPER)運算數(shù)據(jù),選用Adam[25]作為網(wǎng)絡優(yōu)化器。優(yōu)化器的初始學習率設置為1×10?3,網(wǎng)絡在第10代及第15代時優(yōu)化器學習率在原基礎上減小10倍,網(wǎng)絡訓練迭代次數(shù)為20。
三個渦旋結構光束的軌道角動量依次由1變化至20,間隔為1,共計獲得8000張包含不同組合軌道角動量的散斑。隨機選取2000張作為測試集,剩余6000張作為訓練集輸入至網(wǎng)絡訓練,網(wǎng)絡由3個節(jié)點數(shù)目為20的全連接層輸出。訓練過程中損失及準確率變化曲線如圖3(a)所示,由圖可見:10代之前,由于學習率較大,網(wǎng)絡模型處于訓練初期,且在全連接層的隨機失活作用下,網(wǎng)絡的損失曲線下降迅速且伴隨浮動;當網(wǎng)絡訓練至第10代及第15代時,由于及時調(diào)整優(yōu)化器學習率,網(wǎng)絡模型趨于穩(wěn)定,使得損失曲線的浮動消失,并具有較為明顯的下降;同時可以看出在及時調(diào)整優(yōu)化器學習率后,網(wǎng)絡在第11代后訓練集準確率收斂于100%且穩(wěn)定不變。網(wǎng)絡在測試集上對三束渦旋光的識別準確率分別為:99.5%,98.7%,99.7%。
圖3 (a)3束及(b)5束渦旋光訓練過程中損失與準確率變化曲線Fig.3 Evolution of the loss and accuracy of(a)3 vortex beams and(b)5 vortex beams in the training process
類似地,5束渦旋光軌道角動量依次由1變化至6,間隔為1,最終獲得7776張散斑圖。隨機選取2000張作為測試集,訓練集為5778張散斑圖。網(wǎng)絡使用5個節(jié)點數(shù)目為6的全連接層輸出,其訓練過程中訓練集損失與準確率的變化曲線如圖3(b)所示。與3束渦旋光訓練時的曲線變化相似:網(wǎng)絡在第10代及時調(diào)整優(yōu)化器學習率后,在第12代時網(wǎng)絡訓練的損失曲線與準確率曲線均趨于平穩(wěn),訓練集準確率在第12代后穩(wěn)定趨近于100%。最終網(wǎng)絡在測試集上對五束渦旋光的識別準確率分別為:99.95%,99.7%,99.2%,99.3%,99.1%。
網(wǎng)絡使用了步長為2的卷積核,其對來自上一層的張量均會起到類似于下采樣的作用。為了驗證該方案在本實驗中的優(yōu)勢,使用傳統(tǒng)的卷積層加最大池化層的方法構建了一個結構類似的卷積神經(jīng)網(wǎng)絡,該網(wǎng)絡除了所有的卷積核步長為1以及每次卷積后經(jīng)過一個池化核為(2,2)的最大池化層外,其余所有參數(shù)均與原網(wǎng)絡相同,3束渦旋光與5束渦旋光在訓練過程中的損失變化曲線以及驗證集的損失變化曲線如圖4所示,其中Maxpool為帶有最大池化層的卷積神經(jīng)網(wǎng)絡。
圖4 (a)3束及(b)5束渦旋光散斑訓練集及驗證集損失變化曲線Fig.4 Evolution of the loss of training set and test set of(a)3 vortex beams and(b)5 vortex beams
由圖4可見,帶有最大池化層的卷積神經(jīng)網(wǎng)絡在訓練集及驗證集的表現(xiàn)均不如本研究所提出的網(wǎng)絡。盡管隨著訓練次數(shù)的增加,訓練集的損失有所下降,但其驗證集的損失曲線在第11代后幾乎保持不變,不再下降,說明網(wǎng)絡出現(xiàn)了過擬合現(xiàn)象。這兩個網(wǎng)絡在測試集的識別準確率表現(xiàn)對比如表2所示。
表2 本研究所提出網(wǎng)絡與帶有最大池化層網(wǎng)絡的測試集準確率對比Table 2 Comparison of the accuracy on test set between the proposed network and the network with max-pooling layers
由表2可以看出,本研究所提出的網(wǎng)絡識別效果較帶有最大池化層的卷積神經(jīng)網(wǎng)絡更佳,軌道角動量識別準確率最高達99.95%。
針對多渦旋結構光束經(jīng)過散射介質(zhì)后其攜帶的軌道角動量無法被有效識別的問題,提出了一種基于深度學習方法的軌道角動量識別方案,利用神經(jīng)網(wǎng)絡識別輸入的散斑圖片中所包含的軌道角動量信息,同時識別光束中多個渦旋光束的軌道角動量。所采用的神經(jīng)網(wǎng)絡模型使用步長為2的卷積核替代池化層,同時起到特征提取與下采樣的作用,與帶有池化層的卷積神經(jīng)網(wǎng)絡相比具有明顯優(yōu)勢。所設計的網(wǎng)絡在識別三束渦旋光束散斑圖的情況下同時輸出其包含的三個軌道角動量,最低準確率為98.7%;在識別五束渦旋光束散斑圖時,其最低準確率為99.1%。所提出方法在基于渦旋光束的信息編碼與傳輸、圖像識別等領域具有一定的應用價值。