馮佳濠,胡啟立,姜 律,楊燕燕,華晟驍,吳晶晶,胡立發(fā)*
(1.江南大學(xué) 理學(xué)院,江蘇 無錫 214122;2.江蘇省輕工光電工程技術(shù)研究中心,江蘇 無錫 214122;3.光電對抗測試評估技術(shù)重點(diǎn)實(shí)驗(yàn)室,河南 洛陽 471003)
在大口徑光學(xué)望遠(yuǎn)鏡的天文觀測中,大氣湍流等觀測條件變化嚴(yán)重限制了望遠(yuǎn)鏡的成像分辨率,因此人們引入自適應(yīng)光學(xué)(AO)技術(shù)來克服這一問題,以盡可能接近其衍射極限的成像性能[1]。
自適應(yīng)光學(xué)系統(tǒng)[2]主要由3 部分組成:波前傳感器、波前控制器和波前校正器。波前傳感器檢測波前像差,直接決定了系統(tǒng)的波前校正精度。在幾種典型的波前探測器中,夏克-哈特曼波前傳感器(SHWFS)[3]以其高光能量利用率高、結(jié)構(gòu)簡單、探測動(dòng)態(tài)范圍大而成為應(yīng)用最多的波前探測器。SHWFS 由子透鏡陣列和CCD 組成。每個(gè)子透鏡的波前像差使光斑的質(zhì)心發(fā)生位移。根據(jù)這些質(zhì)心偏移量,可以計(jì)算出相應(yīng)子區(qū)域的平均斜率,從而以斜率與相位關(guān)系重構(gòu)波前。
為應(yīng)對強(qiáng)大氣湍流的影響,大口徑光學(xué)望遠(yuǎn)鏡(如VLT 巡天望遠(yuǎn)鏡[4])上的SHWFS 需要大量的子透鏡來分割湍流引起的畸變波前,提高其探測精度,但由于每個(gè)子透鏡光通量降低,導(dǎo)致其探測能力降低。此外,大量的重心(COG)[5]和斜率計(jì)算[6]會(huì)降低探測波前的重構(gòu)速度且基于斜率的傳統(tǒng)波前重構(gòu)算法重構(gòu)精度始終有限,因此,研究一種能夠保證SHWFS 波前探測精度和波前探測能力并且能實(shí)現(xiàn)高精度且穩(wěn)定波前重構(gòu)的算法是很有必要的。
近兩年,Gao 等人[7]利用基于維納濾波器的迭代計(jì)算策略重構(gòu)出在強(qiáng)湍流影響下的被觀測物體的清晰圖像。Kee 等人[8]使用機(jī)器學(xué)習(xí)的方式輔助以實(shí)現(xiàn)在強(qiáng)湍流的情況下進(jìn)行數(shù)字識別。但是這兩種方法并不適用于大口徑天文望遠(yuǎn)鏡上的SHWFS。Dubose 等人[9]擴(kuò)展了Swanson 等人[10]的工作,構(gòu)建了強(qiáng)度/斜率網(wǎng)絡(luò)(ISNet),它可以由斜率和子透鏡采集的光點(diǎn)的總強(qiáng)度在強(qiáng)湍流情況下直接重構(gòu)波前,該方法適用于SHWFS,然而其計(jì)算斜率的過程會(huì)降低重構(gòu)速度并且其波前畸變波動(dòng)的劇烈程度有限。胡樂佳等人[11]減少了斜率的計(jì)算過程,構(gòu)建的SH-Net 結(jié)構(gòu)是已知的重構(gòu)精度最高的方法,卻只是在生物顯微的像差測量應(yīng)用中實(shí)現(xiàn)了從傳感器的光點(diǎn)陣圖像到相位分布的高精度映射。
上述針對強(qiáng)湍流影響的研究確實(shí)提高了波前重構(gòu)精度或者直接提高了光學(xué)系統(tǒng)的成像能力,然而均沒有考慮到觀測目標(biāo)亮度減弱的影響。李自強(qiáng)[12]等人構(gòu)造了名為SHNN 的全連接神經(jīng)網(wǎng)絡(luò),解決了光強(qiáng)干擾的極端情況下導(dǎo)致的質(zhì)心探測精度不高或無法探測的問題,并通過有限數(shù)目的Zernike 模式重構(gòu)波前,然而卻存在截?cái)嗾`差和模式混淆誤差等問題,波前重構(gòu)精度不高。在天文觀測中,湍流強(qiáng)度的變化會(huì)導(dǎo)致波前的波動(dòng)范圍很大,隨機(jī)的變化也會(huì)導(dǎo)致波前有較多高階像差,Zernike 模式重構(gòu)波前的方法平滑了邊緣高階像差并且存在截?cái)嗾`差和模式混淆誤差,波前重構(gòu)精度有限。
為了在湍流強(qiáng)度強(qiáng)弱變化與觀測目標(biāo)亮度變化的復(fù)雜觀測條件下,基于固定的子透鏡陣列的SHWFS 實(shí)現(xiàn)高精度波前重構(gòu),本文提出了一個(gè)基于Transformer的U 形神經(jīng)網(wǎng)絡(luò)模型。在數(shù)值驗(yàn)證部分,通過模擬由大氣湍流相干長度r0[13]從5~25 cm 的大范圍湍流空間強(qiáng)度變化引起的復(fù)雜畸變波前(涵蓋了世界主要天文臺的典型地觀測條件),對所提出的模型進(jìn)行了測試和分析。通過模擬不同星等的觀測條件,進(jìn)一步測試了模型對于不同亮度的目標(biāo)的波前重構(gòu)能力。
模擬的大氣湍流[14]為3 個(gè)離散層疊加形成的湍流相位屏,湍流相位屏遵循von Kármán 譜[15],其具體參數(shù)如表1 所示。von Kármán 譜的表達(dá)式如式(1)所示:
表1 湍流相位屏的關(guān)鍵參數(shù)Tab.1 Key parameters for turbulence phase screens
其中:f為空間頻率;L0為湍流外尺度;r0為大氣相干長度[16],即湍流空間強(qiáng)度。通過Bufton 模型[17]來設(shè)置風(fēng)速參數(shù),其定義如式(2)所示:
其中h為高度,其單位為m。
為了使訓(xùn)練后的模型在變化的觀測條件下能夠獲得較高精度的畸變波前重構(gòu),在湍流模擬過程中,將湍流空間強(qiáng)度最強(qiáng)的情況,即大氣相干長度r0的最小值設(shè)置在V 波段(505~595 nm)的5 cm 處,以適應(yīng)一般天文臺需要面對的最強(qiáng)的大氣湍流擾動(dòng)。導(dǎo)星所處波段也為V 波段(激光或瑞利導(dǎo)星所處波段)并將SHWFS 設(shè)置為V 波段。觀測目標(biāo)的的星等為6 mag。
模擬的望遠(yuǎn)鏡口徑為2 m,在模擬的SHWFS[18]上建立了一個(gè)大規(guī)模的子透鏡陣列。子透鏡陣列由40×40(約1 208 個(gè)有效子透鏡)子透鏡組成,光點(diǎn)陣圖像總像素?cái)?shù)為280×280 個(gè),單個(gè)像素直徑為10 μm。在模擬CCD 采集光點(diǎn)陣圖像的過程中,考慮了3 種主要噪聲類型;暗電流噪聲、讀出噪聲和光子噪聲。
在復(fù)雜多變的大氣湍流環(huán)境下利用光點(diǎn)陣圖像實(shí)現(xiàn)復(fù)雜畸變波陣面的直接高精度重構(gòu),一般使用U 型網(wǎng)絡(luò)結(jié)構(gòu)且需要網(wǎng)絡(luò)具有極強(qiáng)表達(dá)能力。然而已報(bào)道的應(yīng)用于波前重構(gòu)的CNN,包括SH-Net在內(nèi),由于局部卷積性質(zhì),使得其每層僅能關(guān)注到卷積核內(nèi)的部分,光點(diǎn)之間的聯(lián)系往往無法被網(wǎng)絡(luò)學(xué)習(xí),除非網(wǎng)絡(luò)深度極深,這會(huì)導(dǎo)致訓(xùn)練過程出現(xiàn)信息丟失,過于龐大的網(wǎng)絡(luò)結(jié)構(gòu)需要更高的計(jì)算和時(shí)間成本,并不適用于波前重構(gòu)。
本文為了網(wǎng)絡(luò)能在復(fù)雜觀測條件下建立足夠穩(wěn)定的非線性映射關(guān)系,需要其對輸入的光點(diǎn)陣圖像在關(guān)注局部光點(diǎn)有效信息的同時(shí),進(jìn)行全局所有光點(diǎn)信息和噪聲的交互式學(xué)習(xí)以實(shí)現(xiàn)從單一光點(diǎn)陣中獲得足夠豐富的特征信息。而網(wǎng)路輸出的畸變波前整體是復(fù)雜且具有較多的高頻信號,并且隨著觀測條件的變化而變化,這就需要網(wǎng)絡(luò)對輸入的特征圖具有強(qiáng)大的非線性解碼能力,才能夠?qū)崿F(xiàn)對畸變波前的高準(zhǔn)確度重構(gòu)。
Transformer 結(jié)構(gòu)[19]以自注意力機(jī)制[20]為中心,能夠?qū)植考?xì)節(jié)進(jìn)行有效關(guān)注并使全局信息實(shí)現(xiàn)交互。由于這種全局建模的能力,本文首次將Transformer 結(jié)構(gòu)引入到波前重構(gòu)中。選擇的Transformer模塊為Swin-Transformer模塊[21],相比于普通的Transformer 模塊,Swin-Transformer 模塊基于移動(dòng)窗口的自注意力機(jī)制使其不僅能夠進(jìn)行全局建模,而且計(jì)算復(fù)雜度更低,有助于網(wǎng)絡(luò)在重構(gòu)波前時(shí)擁有更快的響應(yīng)速度。
本文構(gòu)建了編碼器和解碼器均以Transformer 模塊為主學(xué)習(xí)模塊的U 型網(wǎng)絡(luò)結(jié)構(gòu),并將其命名為SH-U-Transformer,其結(jié)構(gòu)如圖1(a)所示。SH-U-Transformer 網(wǎng)絡(luò)模型的輸入為SHWFS 中280×280 大小的光點(diǎn)陣圖像,輸出為280×280 大小的重構(gòu)波前。
圖1 SH-U-Transformer 的架構(gòu)和細(xì)節(jié)。(a)SH-U-Transformer 的架構(gòu)(H 和W 表示特征圖的大小,C 是通道數(shù));(b)Embedding Layer 的結(jié)構(gòu)(k 是卷積核的大小,s 是卷積的步長,p 是填充大?。唬╟)Transformer Block 的結(jié)構(gòu)(多頭自注意力機(jī)制中的注意力頭數(shù)隨著通道數(shù)的增加而增加1 倍,初始注意頭數(shù)為9)。Fig.1 Architecture and details of SH-U-Transformer.(a)Architecture of SH-U-Transformer(H and W indicate the size of the feature map.C is the channel’s number);(b)Architecture of the Embedding Layer(k is the size of the convolution kernel,s is the stride of the convolution,and p is the padding added to all four sides of the input);(c)Architecture of the Transformer Block(the number of attentional heads in the two multi-headed self-attention mechanisms doubles as the number of channels increases,and the initial number of attention heads is 9).
為了確保沒有信息丟失,該網(wǎng)絡(luò)模型的特征圖尺寸調(diào)整部分并沒有選擇類似于CNN 粗暴的信息篩選或填充的方式。在編碼器部分,模型通過分割相鄰像素塊然后將它們通過前后通道拼接重排成新的特征塊來進(jìn)行下采樣,如圖2 所示;在解碼器部分相反,模型將相鄰?fù)ǖ赖奶卣鲏K重新左右拼接使通道數(shù)量減半,特征圖的分辨率變?yōu)樵瓉淼? 倍。這一做法確保了所有信息都能被運(yùn)用并通過學(xué)習(xí)的方式?jīng)Q定去留。
圖2 SH-U-Transformer 下采樣的方式Fig.2 SH-U-Transformer downsampling mode
接下來是對模型進(jìn)行進(jìn)一步優(yōu)化調(diào)整。首先是編碼器部分的預(yù)處理層——Embedding Layer,這一層的作用是對光點(diǎn)陣圖像進(jìn)行初步特征提取和通道增加的預(yù)處理后輸出的特征圖進(jìn)行特征學(xué)習(xí)提取。值得一提的是,在該層用于初步特征提取的部分,本文自行設(shè)計(jì)了一個(gè)Inception Block[22],如圖1(b)所示,用于對輸入進(jìn)行預(yù)處理。在這個(gè)Block 中,設(shè)計(jì)有4 種不同的卷積內(nèi)核,它們的尺寸分別是5×5、7×7、9×9 和11×11。通過多感受野融合,該模塊實(shí)現(xiàn)了從提取單個(gè)子透鏡區(qū)域的光點(diǎn)信息擴(kuò)展到與相鄰子透鏡區(qū)域的光點(diǎn)信息交互或者單個(gè)子透鏡內(nèi)的有效光點(diǎn)和噪聲信息交互。通過將這些提取出來的信息通過通道拼接的方式輸入到網(wǎng)絡(luò)中可以保證輸入網(wǎng)絡(luò)的特征圖攜帶更多的信息供給編碼器的學(xué)習(xí)模塊進(jìn)行學(xué)習(xí)。
其次,對圖1(c)中每個(gè)Transformer Block 的學(xué)習(xí)核心——多頭自注意力機(jī)制中的注意力頭的數(shù)量進(jìn)行修改。多頭自注意力機(jī)制中的頭能夠在聚焦到像素點(diǎn)自身的同時(shí)關(guān)注周圍區(qū)域的像素點(diǎn),這也是Transformer Block 在建立每個(gè)子透鏡中光點(diǎn)與子透鏡區(qū)域內(nèi)波前的像素級映射的同時(shí)學(xué)習(xí)與其他區(qū)域波前之間的關(guān)聯(lián)的核心。在一個(gè)自注意力機(jī)制中,其頭數(shù)需要大于等于9 才能使每個(gè)機(jī)制學(xué)習(xí)能力均超過卷積模塊[23],而一個(gè)Transformer Block 擁有兩個(gè)類似的自注意力機(jī)制,這確保了每個(gè)Transformer Block 的學(xué)習(xí)能力均遠(yuǎn)超卷積模塊。本文在第一個(gè)包含Transformer Block 的學(xué)習(xí)層將注意力頭數(shù)設(shè)置為9,并且隨著網(wǎng)絡(luò)的深入,注意力頭數(shù)倍增,每一層的學(xué)習(xí)能力增強(qiáng),從而進(jìn)一步提高了整個(gè)網(wǎng)絡(luò)的表達(dá)能力。
最后是整個(gè)網(wǎng)絡(luò)的Transformer Block 的布局。所有的Transformer Block 具有相同的結(jié)構(gòu),并且是模型實(shí)現(xiàn)高精度直接重構(gòu)的關(guān)鍵。編碼器和解碼器各設(shè)置了一個(gè)疊加6 個(gè)Transformer Block 的學(xué)習(xí)層。編碼器部分被設(shè)置為第二個(gè)主要的學(xué)習(xí)層,用于從下采樣過一次的特征圖中學(xué)習(xí)特征,這是因?yàn)榻?jīng)過初步特征提取和首次學(xué)習(xí)的特征圖包含了足夠多的光點(diǎn)陣特征與聯(lián)系,足夠多的學(xué)習(xí)模塊有助于對這些信息進(jìn)行辨析提取和進(jìn)一步學(xué)習(xí),防止網(wǎng)絡(luò)加深導(dǎo)致信息丟失。解碼器部分被設(shè)置為倒數(shù)第二個(gè)主要學(xué)習(xí)層,是從特征圖逐步解碼為波前分布的關(guān)鍵部分。輸入這一層的特征圖包含了大量與波前分布相關(guān)的信息,需要網(wǎng)絡(luò)的進(jìn)一步解析后由最后一個(gè)學(xué)習(xí)層進(jìn)行調(diào)整進(jìn)而輸出波前。Transformer Block 數(shù)量的增加可以增強(qiáng)每個(gè)學(xué)習(xí)層的學(xué)習(xí)能力,然而也會(huì)增加參數(shù)量。為了在減少時(shí)間成本的同時(shí)保證精度,其他的學(xué)習(xí)層的Transformer Block 的數(shù)量經(jīng)過測試訓(xùn)練后都被設(shè)置為2 個(gè)。
訓(xùn)練數(shù)據(jù)集包括90 000 組對應(yīng)的SHWFS 的光點(diǎn)陣圖像及畸變波前。其中的90%作為訓(xùn)練數(shù)據(jù)集,用于執(zhí)行算法訓(xùn)練,優(yōu)化SH-U-Transformer模型的參數(shù);10%的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù)集,用于充分驗(yàn)證以選擇最佳模型。SH-U-Transformer 網(wǎng)絡(luò)模型使用Pytorch 框架(Python 3.8)構(gòu)建,在桌面PC(3.20 GHz Intel(R)Core i7-8700 CPU,16 GB RAM 和NVIDIA GeForce RTX 1070)上進(jìn)行訓(xùn)練。
在訓(xùn)練過程中,由于Transformer Block 的計(jì)算復(fù)雜度較高,SH-U-Transformer 模型需要更多的訓(xùn)練批次和更詳細(xì)且有針對性的損失函數(shù)設(shè)置,因此需要將整個(gè)訓(xùn)練過程分為訓(xùn)練和調(diào)整兩個(gè)階段,兩個(gè)階段的批次大小均為6 個(gè)。為了使訓(xùn)練后的模型在重構(gòu)高度復(fù)雜的波前時(shí)更加精確、穩(wěn)定,損失函數(shù)被設(shè)置為復(fù)合函數(shù):
其中:t為真實(shí)波前;p為網(wǎng)絡(luò)重構(gòu)的波前;RMSE為均方根誤差函數(shù);SSIM[24]是結(jié)構(gòu)相似性函數(shù),其作為權(quán)重被添加到損失函數(shù)中;α是一個(gè)超參數(shù),它決定了結(jié)構(gòu)相似性函數(shù)占損失函數(shù)的比例。在第一階段設(shè)置有200 個(gè)epoch,初始學(xué)習(xí)率設(shè)置為1×10-4,α設(shè)置為實(shí)驗(yàn)測量的0.013。采用Adam 優(yōu)化器進(jìn)行快速梯度下降,快速優(yōu)化模型參數(shù)。在第二階段設(shè)置有50 個(gè)epoch,初始學(xué)習(xí)率設(shè)置為6×10-7,α設(shè)置為0.003 5。優(yōu)化器為SGD 優(yōu)化器,對模型參數(shù)進(jìn)一步調(diào)整優(yōu)化。在這兩個(gè)階段中,模型驗(yàn)證階段的評估指標(biāo)均為真實(shí)波前和預(yù)測波前之間的RMSE 值作為最終的驗(yàn)證準(zhǔn)確度,RMSE=0.010 77 μm。
訓(xùn)練好的SH-U-Transformer 模型參數(shù)被保存后用于波前重構(gòu),仿真光路如圖3 所示。在模擬設(shè)置中,來自導(dǎo)星或探測目標(biāo)的光波通過地球大氣湍流后由望遠(yuǎn)鏡的鏡面收集。望遠(yuǎn)鏡收集的光波經(jīng)過縮束處理被反射鏡反射后被SHWFS采集。在此過程中,大氣湍流擾動(dòng)的變化引起波前像差的變化以及導(dǎo)星或探測目標(biāo)星等的升高對SHWFS 探測能力的影響,這兩點(diǎn)都降低了望遠(yuǎn)鏡的觀測能力。
圖3 用于數(shù)據(jù)生成和波前重建的模擬光路圖Fig.3 Simulated optical path diagram for data generation and wavefront reconstruction
在SH-U-Transformer 模型性能測試階段,通過隨機(jī)生成若干大氣相干長度r0處于5~20 cm 范圍內(nèi)的SHWFS 接收光點(diǎn)陣圖像作為測試數(shù)據(jù),輸入訓(xùn)練好的網(wǎng)絡(luò)模型,測試在動(dòng)態(tài)變化湍流空間強(qiáng)度下的模型重構(gòu)性能。首先選擇使用兩種常規(guī)的波前重建方法:區(qū)域法[25]和前250 項(xiàng)Zernike 模式的模態(tài)法[26]進(jìn)行比較。前250項(xiàng)Zernike 模式的系數(shù)分布如表2所示。另外,本文復(fù)刻了SH-Net并將其以訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,訓(xùn)練好后將其與SHU-Transformer 模型進(jìn)行實(shí)驗(yàn)對比。
表2 前250 項(xiàng)Zernike 多項(xiàng)式系數(shù)分布Tab.2 The first 250 terms Zernike polynomial coefficient distribution
在圖4 中,從上到下,每一行對應(yīng)一個(gè)有代表性的r0條件,分別為5,10,15,20 cm。對應(yīng)條件下的光點(diǎn)陣圖像即是網(wǎng)絡(luò)的輸入,輸出是相應(yīng)的畸變波前。第一列為光點(diǎn)陣圖像,第二列為對應(yīng)的真實(shí)波前,第三列為SH-U-Transformer 模型重構(gòu)的波前,第四列為該方法對應(yīng)的殘余波前。后面3 組從前至后依次為SH-Net 方法、模態(tài)法和區(qū)域法的結(jié)果和殘差??梢钥闯?,在不同的r0條件下,SH-U-Transformer 模型波前重構(gòu)精度的峰谷值(Peak-to-Valley,PV)與均方根誤差(RMSE)都是最優(yōu)的。例如,當(dāng)湍流空間強(qiáng)度在r0=5 cm 時(shí),SH-U-Transformer 模型計(jì)算的殘余波前的PV 值為0.265 1 μm,約為真實(shí)波前PV 值(19.788 4 μm)的1.34%;RMSE 值為0.023 9 μm,約為真實(shí)波前RMSE 值(4.123 3 μm)的0.58%。與SH-Net 相比,殘余波前的PV 值約比其低57.25%(0.620 1 μm),RMSE 值約比其低51.32%(0.049 1 μm);與模態(tài)法相比,殘余波前的PV 值約比其低98.46%(17.173 8 μm),RMSE 值約比其低94.42%(0.428 6 μm);與區(qū)域法相比,殘余波前的PV 值約比其低97.80%(12.075 9 μm),RMSE值約比其低97.21%(0.856 6 μm)。該方法即使是在空間強(qiáng)度極強(qiáng)的湍流下,波前重構(gòu)精度也能遠(yuǎn)優(yōu)于已有的方法。雖然隨著湍流空間強(qiáng)度減弱而優(yōu)勢減弱,但其重構(gòu)精度卻一直十分穩(wěn)定。
圖4 4 種方法在4 種不同湍流強(qiáng)度下波前重構(gòu)結(jié)果的比較。計(jì)算的波前及其殘差使用了與原始波前不同的顏色分布標(biāo)準(zhǔn),給出了每個(gè)殘差的均方根誤差(RMSE)和PV 誤差。Fig.4 Comparison of the wavefront reconstruction results of the four methods at four different r0.The calculated wavefront and its residuals use a different color bar than the original wavefront.The RMS error(RMSE)and the PV error for each residual are given.
在4 個(gè)不同區(qū)間的湍流空間強(qiáng)度下的400 個(gè)4種波前重構(gòu)方法的殘余波前RMSE 值分布如圖5所示,湍流空間強(qiáng)度分布的規(guī)律為r0每隔5 cm 為一個(gè)區(qū)間。結(jié)果表明,在r0處于5~25 cm 區(qū)間內(nèi)的SH-U-Transformer 的性能均大幅優(yōu)于其他方法,殘余波前的RMSE 值分布范圍為0.010~0.024 μm,幾乎不受湍流空間強(qiáng)度變化的影響。這進(jìn)一步補(bǔ)充說明了SH-U-Transformer在湍流空間強(qiáng)度變化下的重構(gòu)波前結(jié)果穩(wěn)定性,在典型r0條件下均具有顯著優(yōu)勢。此外,SH-U-Transformer可以直接由SHWFS 采集的光點(diǎn)陣圖像重構(gòu)出高精度的波前分布,省去了許多計(jì)算步驟,簡化了波前重構(gòu)的流程。
圖5 4 種波前重建方法在不同湍流空間強(qiáng)度下殘余波前RMS 誤差分布。(a)r0范圍為5~10 cm;(b)r0范圍為10 cm~15 cm;(c)r0范圍為15~20 cm;(d)r0范圍為20~25 cm。每個(gè)階段屏幕包含100 個(gè)數(shù)據(jù)。Fig.5 Comparison of RMS errors of residual wavefront under different r0 for four wavefront reconstruction methods.(a)r0 ranges from 5 cm to 10 cm;(b)r0 ranges from 10 cm to 15 cm;(c)r0 ranges from 15 cm to 20 cm;(d)r0 ranges from 20 cm to 25 cm.Each stage screen contains 100 datasets.
對評價(jià)波前重構(gòu)算法優(yōu)劣的關(guān)鍵指標(biāo)——重構(gòu)速度[27]也進(jìn)行了測試。將SH-U-Transformer模型部署到不同的GPU 上進(jìn)行重構(gòu)波前計(jì)算并記錄時(shí)間成本。在部署了RTX A6000 顯卡的服務(wù)器上,計(jì)算時(shí)間約為15 ms,這是目前最快的計(jì)算速度,表明SH-U-Transformer 模型可以無需調(diào)整直接部署到更高型號的GPU 上以盡可能地實(shí)現(xiàn)實(shí)時(shí)的計(jì)算。值得注意的是,當(dāng)模型部署在配備了RTX 2080ti GPU 的工作站上時(shí),波前重構(gòu)所需的時(shí)間(24.87 ms)比已報(bào)道的SH-Net(40.2 ms)少了約38.13%,表明SH-U-Transformer具有更快的波前重構(gòu)速度,這也為其實(shí)際應(yīng)用提供了可能。
本文還測試了SH-U-Transformer 模型在應(yīng)對不同星等[28]的導(dǎo)星或觀測目標(biāo)時(shí)重構(gòu)波前的精度。SHWFS 子透鏡陣列接收的光子數(shù)量隨著導(dǎo)星或觀測目標(biāo)的星等的變化而變化,這也導(dǎo)致了有效子透鏡數(shù)量的變化。表3給出了當(dāng)r0=5 cm時(shí),觀測目標(biāo)的星等在3~8 mag 時(shí),有效子透鏡數(shù)目及子透鏡接收的平均光強(qiáng)。
表3 不同星等下SHWFS 子透鏡的參數(shù)Tab.3 Parameters of sub-apertures of SHWFS at different magnitudes
如表3 所示,星等的增大導(dǎo)致來自觀測目標(biāo)的光強(qiáng)減小,噪聲增大,導(dǎo)致SHWFS[29]有效子孔徑數(shù)量迅速減少。SHWFS 的微透鏡陣列無法快速改變,然而有效子透鏡的減少會(huì)導(dǎo)致光斑陣圖像中包含的有效信息減少,從而降低波前重建精度,甚至由于過少的有效子透鏡出現(xiàn)無法重構(gòu)波前的情況。自適應(yīng)光學(xué)系統(tǒng)通常只能分得望遠(yuǎn)鏡接收的部分光用于波前探測,即子透鏡接收到的光能量有限,這也導(dǎo)致了傳統(tǒng)依靠有效子透鏡重構(gòu)波前的方法無法適用于高星等觀測目標(biāo),限制了固定規(guī)模子透鏡陣列SHWFS 的探測能力,進(jìn)一步導(dǎo)致傳統(tǒng)自適應(yīng)光學(xué)系統(tǒng)只能應(yīng)用于低星等的觀測目標(biāo)。
首先,隨機(jī)生成了一個(gè)畸變波前及其對應(yīng)的在不同星等的觀測目標(biāo)下SHWFS 采集的光點(diǎn)陣圖像,通過SH-U-Transformer模型進(jìn)行波前重建,結(jié)果如圖6 所示。圖6(a)是SH-U-Transformer模型對不同星等目標(biāo)的波前重構(gòu)的結(jié)果,其中從上到下依次為3、5、6、7、8 等5 個(gè)星等下的導(dǎo)星。結(jié)果表明,訓(xùn)練好的模型無需調(diào)整就可以在應(yīng)對不同星等的目標(biāo)時(shí)都能實(shí)現(xiàn)高精度波前重構(gòu)。即使是星等為8 等的觀測目標(biāo),從圖6(a)中可以看出,殘余波前的RMSE 值依然可以達(dá)到0.047 5 μm,PV 值為0.450 8 μm,與真實(shí)波前相比,重構(gòu)精度令人滿意。圖6(b)展示了5 個(gè)不同星等的觀測目標(biāo)的殘余波前RMSE 值分布,每組包含100 個(gè)在大氣相干長度r0為5~20 cm 范圍內(nèi)的真實(shí)波前數(shù)據(jù)。它們的分布范圍直觀地表明了SH-UTransformer 在不同觀測目標(biāo)亮度高低變化的情況下依然能穩(wěn)定地實(shí)現(xiàn)高精度波前重構(gòu)且對暗弱目標(biāo)也很有效。
圖6 不同星等的觀測目標(biāo)的波前重構(gòu)結(jié)果。(a)同一波前從上到下不同星等的重構(gòu)結(jié)果,輸出波前及其殘差使用與真實(shí)波前不同的顏色分布標(biāo)準(zhǔn)并給出了每個(gè)殘差的均方根誤差(RMSE)和PV 誤差;(b)r0處于5~20 cm 范圍內(nèi)的不同星等觀測目標(biāo)的重構(gòu)波前的RMS 誤差分布。每個(gè)星等包含100 個(gè)數(shù)據(jù)。Fig.6 Results of wavefront reconstruction at different magnitudes.(a)Reconstruction results from the same wavefront at different magnitudes from top to down,the output wavefronts and their residuals use a different color bar than the original wavefront,and RMS error(RMSE)and the PV error for each residual are given;(b)RMS error distributions of reconstructed wavefronts of different magnitudes are obtained when r0 is in the range of 5~20 cm.Each stage screen contains 100 datasets.
對于這一結(jié)果,主要原因是在SH-U-Transformer 模型的訓(xùn)練過程中,損失函數(shù)中加入了SSIM 函數(shù)這一權(quán)值,使模型能夠通過觀測目標(biāo)亮度固定的數(shù)據(jù)集學(xué)習(xí)光點(diǎn)陣圖像與波前分布之間在結(jié)構(gòu)上的關(guān)系,即使亮度降低導(dǎo)致有效信號減弱,兩者結(jié)構(gòu)上的非線性關(guān)系依然能起到穩(wěn)定地指導(dǎo)建立像素級映射的作用。因此,采用SH-U-Transformer 模型的SHWFS 能夠適應(yīng)導(dǎo)星或觀測目標(biāo)亮度變化的觀測條件。
本文實(shí)現(xiàn)了一種深度學(xué)習(xí)波前重建方法——SH-U-Transformer。該方法適用于大口徑天文光學(xué)望遠(yuǎn)鏡,能夠應(yīng)對復(fù)雜的觀測條件。SH-UTransformer 首次在波前重構(gòu)中引入了Transformer 結(jié)構(gòu),實(shí)現(xiàn)了在復(fù)雜變化的觀測條件下直接從SHWFS 光點(diǎn)陣圖像高精度地重構(gòu)湍流引起的畸變波前。通過仿真驗(yàn)證,定量評價(jià)了SHU-Transformer 對不同空間強(qiáng)度的湍流引起的像差的波前重構(gòu)性能。與傳統(tǒng)的模態(tài)法和區(qū)域法相比,SH-U-Transformer 模型不僅精度提高了近2 個(gè)數(shù)量級,而且消除了斜率測量等的繁瑣步驟。與應(yīng)用于SHWFS 的直接高精度重構(gòu)波前的深度學(xué)習(xí)方法SH-Net 相比,SH-U-Transformer 模型具有更高的重構(gòu)精度和更快的重構(gòu)速度,并且隨著GPU 的進(jìn)一步升級,它的時(shí)間成本也會(huì)隨之降低。此外,SH-U-Transformer 也可以穩(wěn)定地高精度重構(gòu)在導(dǎo)星或者觀測目標(biāo)改變時(shí)的畸變波前,性能表現(xiàn)極佳。