應(yīng)大衛(wèi) 張思慧 鄧書(shū)金 武海斌
(華東師范大學(xué),精密光譜科學(xué)與技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海 200062)
在冷原子研究中,通常采用吸收成像的方式來(lái)進(jìn)行冷原子狀態(tài)的探測(cè),然而該成像方式受探測(cè)過(guò)程中光學(xué)平面干涉、激光功率、頻率、空間位置抖動(dòng)等方面的擾動(dòng),最終形成的冷原子圖像總是會(huì)出現(xiàn)殘余部分空間結(jié)構(gòu)噪聲,導(dǎo)致成像質(zhì)量的下降.尤其是對(duì)于冷原子密度稀薄的區(qū)域或者飛行時(shí)間較久的情況,往往需要大量的重復(fù)和平均才能得到理想的信噪比,然而這樣不僅導(dǎo)致時(shí)間周期大幅度增加,還會(huì)引入大量隨機(jī)噪聲.本文基于機(jī)器學(xué)習(xí)提出了一種單拍冷原子成像方案,在該方案中僅需對(duì)冷原子進(jìn)行單次吸收成像,對(duì)應(yīng)背景圖片可以通過(guò)自動(dòng)編碼器的神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行生成,有效地降低了成像的空間條紋噪聲,大幅度提高成像質(zhì)量,可以用于冷原子單循環(huán)多次成像.
超冷原子分子氣體是高度空間隔離的純凈量子多體系統(tǒng),具有很好的量子相干性,被廣泛應(yīng)用于量子信息[1,2]、量子計(jì)算和模擬[3-5]以及精密測(cè)量[6-8]的研究.準(zhǔn)確測(cè)量和分析超冷原子分子的量子特性對(duì)后續(xù)研究十分重要,冷原子吸收成像是當(dāng)前實(shí)驗(yàn)中最常采用的原子狀態(tài)探測(cè)方式,該方案利用一束準(zhǔn)直的共振激光去照射冷原子氣體,將原子散射的光信號(hào)連同未被散射的光信號(hào)收集到相機(jī)中[9],通過(guò)從位置相關(guān)的散射信號(hào)中提取原子空間分布,進(jìn)而分析原子熱力學(xué)狀態(tài)等特性.
標(biāo)準(zhǔn)的吸收成像方案需要采集兩張圖像: 第一次曝光采集的信號(hào)是原子存在時(shí)的吸收?qǐng)D像,將共振激光通過(guò)原子云后的吸收和散射信號(hào)進(jìn)行收集;第二次曝光采集的是背景信號(hào),不包含任何原子信息,用于進(jìn)行原子背景參考校正,通常是在第一次曝光后等待原子移出拍攝區(qū)域或利用光學(xué)方式將原子泵浦到暗態(tài)之后再進(jìn)行.通過(guò)對(duì)比吸收信號(hào)和參考背景信號(hào)得到原子的光學(xué)密度,進(jìn)而得到原子的空間分布.在實(shí)驗(yàn)中,探測(cè)激光的相干長(zhǎng)度通常比光學(xué)元器件之間的距離長(zhǎng)得多,各光學(xué)元件間的殘余反射會(huì)干擾圖像并在記錄的圖像中產(chǎn)生條紋和牛頓環(huán)等特征圖案.然而,由于噪聲漂移和其他動(dòng)態(tài)過(guò)程,兩幅圖像中的噪聲模式通常并不完全相同,這導(dǎo)致最終圖像中出現(xiàn)殘差結(jié)構(gòu)噪聲模式,并最終導(dǎo)致成像質(zhì)量的大幅度下降.
機(jī)器學(xué)習(xí)通過(guò)多層神經(jīng)網(wǎng)絡(luò)來(lái)傳播信息,將給定的輸入數(shù)據(jù)轉(zhuǎn)換為特定的預(yù)測(cè).近年來(lái),機(jī)器學(xué)習(xí)在圖像處理等領(lǐng)域取得了巨大成功[10-14].圖像補(bǔ)全是機(jī)器學(xué)習(xí)應(yīng)用的一個(gè)很好的例子.對(duì)于那些存在反復(fù)出現(xiàn)且不斷變化的圖像條紋場(chǎng)景,機(jī)器學(xué)習(xí)技術(shù)的優(yōu)勢(shì)更為明顯.圖像補(bǔ)全技術(shù)可以從部分未損壞的圖像中推斷出圖像損壞的部分,使圖像看起來(lái)更完整.機(jī)器學(xué)習(xí)技術(shù)已被應(yīng)用于優(yōu)化超冷原子的冷卻過(guò)程和執(zhí)行相關(guān)的數(shù)值計(jì)算[15-17].在這些應(yīng)用中,機(jī)器學(xué)習(xí)模型可以學(xué)習(xí)如何最大限度地減少原子的熱運(yùn)動(dòng),從而使其達(dá)到極低的溫度.
本文基于機(jī)器學(xué)習(xí)的技術(shù)方法提出了一種冷原子成像方案,該方案中背景圖片采用自動(dòng)編碼器的神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行生成,用于消除成像中引入的空間條紋噪聲,提高成像質(zhì)量.本文使用一種深度神經(jīng)網(wǎng)絡(luò)(DNN)的冷原子成像替代方法,從包含原子散射信號(hào)的單個(gè)圖像中生成一個(gè)理想的背景圖像.在編碼過(guò)程中還引入了注意力機(jī)制,使得神經(jīng)網(wǎng)絡(luò)可以自動(dòng)在更加重要的圖樣紋路上賦予更多的權(quán)重,并最終大幅度地提高了成像質(zhì)量.該單拍成像方法簡(jiǎn)化了實(shí)驗(yàn)操作步驟,降低了對(duì)相機(jī)的硬件要求,縮短了觀測(cè)原子動(dòng)力學(xué)演化的時(shí)間并有效地抑制了條紋干涉,可應(yīng)用于冷原子單循環(huán)多次成像.
本實(shí)驗(yàn)數(shù)據(jù)庫(kù)來(lái)自超冷量子氣體的吸收成像,實(shí)驗(yàn)中首先將6Li 原子氣體裝載到光偶極阱中,并制備在最低的兩個(gè)自旋態(tài)(|1〉=|F=1/2,MF=1/2〉和| 2〉=|F=1/2,MF=-1/2〉).接下來(lái)利用原子間的Feshbach 共振進(jìn)行蒸發(fā)冷卻,此時(shí)偏置磁場(chǎng)強(qiáng)度為300 G (1 G=10—4T),對(duì)應(yīng)散射長(zhǎng)度約為—290a0(玻爾半徑),蒸發(fā)冷卻約8 s 時(shí)間后將磁場(chǎng)偏轉(zhuǎn)至528 G 并對(duì)|1〉態(tài)進(jìn)行吸收成像,原子溫度T/TF約為0.3,詳細(xì)實(shí)驗(yàn)系統(tǒng)和冷卻過(guò)程參考文獻(xiàn)[18-21].成像激光的光斑直徑大約1 cm,光功率密度大約0.2Is(飽和光強(qiáng)),成像脈沖時(shí)間10 μs.實(shí)驗(yàn)中使用的相機(jī)是Andor iKon-M934,具有1024×1024 個(gè)像素.考慮到電子噪聲和相應(yīng)速度,拍照時(shí)選擇的相機(jī)參數(shù)是: 讀取率為1 MHz,16 bit,轉(zhuǎn)移速度為3.3 μs.由于相機(jī)本身幀轉(zhuǎn)移速率限制,信號(hào)光脈沖和背景光脈沖間隔時(shí)間300 ms,該數(shù)據(jù)庫(kù)包含1150 組圖片,每組圖片包含1 個(gè)信號(hào)光和1 個(gè)背景光.
基于該數(shù)據(jù)庫(kù),深度神經(jīng)網(wǎng)絡(luò)(DNN)建立了一個(gè)通道,輸入的吸收?qǐng)D像首先要將原子氣體所在區(qū)域進(jìn)行掩碼屏蔽,僅抽取背景部分的條紋信息,再經(jīng)歷多次卷積轉(zhuǎn)換和維度變換.這些轉(zhuǎn)換提取了底層空間模式的特征,對(duì)DNN 的預(yù)測(cè)起到了至關(guān)重要的作用.訓(xùn)練階段主要使用背景圖片庫(kù)進(jìn)行,用于空間噪聲模式的對(duì)比和優(yōu)化重構(gòu).在每個(gè)優(yōu)化步驟中,將網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果與掩蔽區(qū)域的真實(shí)值進(jìn)行比較,并改變模型的權(quán)重以最小化損失函數(shù),即真實(shí)值與預(yù)測(cè)結(jié)果之間的均方誤差(L2 范數(shù)).在訓(xùn)練結(jié)束時(shí),將獲得一個(gè)優(yōu)化的模型,用于預(yù)測(cè)包含原子信息在內(nèi)的新圖像.然而因?yàn)樵铀趨^(qū)域被掩蓋了,所以無(wú)論原子是否出現(xiàn)在原始圖像中,該網(wǎng)絡(luò)都會(huì)產(chǎn)生一個(gè)理想的背景圖像.
卷積網(wǎng)絡(luò)(圖1)是由U-net 架構(gòu)[22]的自動(dòng)編碼器和解碼器組成的,網(wǎng)絡(luò)中的跳層連接結(jié)構(gòu)可以保證網(wǎng)絡(luò)在很深的情況下也能夠使得網(wǎng)絡(luò)前端卷積核權(quán)重進(jìn)行有效的更新.通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),加入注意力機(jī)制[7]會(huì)使得在此任務(wù)上的表現(xiàn)更加好.網(wǎng)絡(luò)的輸入是原子吸收成像的圖像,從中掩蔽了寬度為120 個(gè)像素的條形區(qū)域,用于掩蔽原子本身的散射光信號(hào).訓(xùn)練中使用一個(gè)生成器來(lái)打亂圖像,在輸入上應(yīng)用掩碼,并以8 張圖片為一批輸入DNN進(jìn)行訓(xùn)練.
圖1 U-net 神經(jīng)網(wǎng)絡(luò)架構(gòu)Fig.1.U-net neural network architecture.
神經(jīng)網(wǎng)絡(luò)將整體數(shù)據(jù)集分為三類(lèi)數(shù)據(jù)集,訓(xùn)練集、驗(yàn)證集和測(cè)試集,其中訓(xùn)練集占據(jù)60%,驗(yàn)證集占據(jù)20%,測(cè)試集占據(jù)20%,訓(xùn)練集用于訓(xùn)練和生成神經(jīng)網(wǎng)絡(luò),驗(yàn)證集用于驗(yàn)證神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確性,測(cè)試集用于最終的實(shí)際測(cè)試.該網(wǎng)絡(luò)由74457081 個(gè)參數(shù)組成,共34 層,其中可訓(xùn)練參數(shù)74433017 個(gè),不可訓(xùn)練參數(shù)24064 個(gè)(主要是批歸一化層中的平均值與方差).將網(wǎng)絡(luò)輸出與每張圖像的原始中心部分進(jìn)行比較,并最小化均方誤差損失函數(shù).使用ADAM 優(yōu)化器[23]和He 初始化[24]進(jìn)行參數(shù)優(yōu)化,學(xué)習(xí)率為5×10—3[25],應(yīng)用0.99 批歸一化[26]和通道注意力機(jī)制[10,11]可以進(jìn)一步使得模型的表現(xiàn)能力更加好.
本文中僅有訓(xùn)練集參與神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,在多次訓(xùn)練后形成相應(yīng)的神經(jīng)網(wǎng)絡(luò).基于相應(yīng)次數(shù)的神經(jīng)網(wǎng)絡(luò),將利用驗(yàn)證集中的圖庫(kù)數(shù)據(jù)來(lái)驗(yàn)證其準(zhǔn)確性.圖像的損失函數(shù)通常用于衡量模型的輸出圖像與真實(shí)圖像之間的差異.圖像損失函數(shù)表示為
其中,I表示真實(shí)圖像,表示生成的圖像,W,H和C分別表示圖像的寬度、高度和通道數(shù).該損失函數(shù)計(jì)算了兩個(gè)圖像之間每個(gè)像素通道的均方誤差(MSE),然后對(duì)所有像素的誤差求平均,最終的損失值越小,表示生成的圖像與真實(shí)圖像之間的差異越小.因此,原則上訓(xùn)練集和驗(yàn)證集的損失函數(shù)都應(yīng)該同步降低并最終收斂.
模型的收斂性如圖2 所示,其中訓(xùn)練(藍(lán)色)和驗(yàn)證(黃色)數(shù)據(jù)集的損失函數(shù)隨著訓(xùn)練次數(shù)的增加而減少,兩個(gè)數(shù)據(jù)集(訓(xùn)練集和驗(yàn)證集)的衰減具有相似的趨勢(shì).而當(dāng)訓(xùn)練次數(shù)超過(guò)200 次之后,盡管訓(xùn)練集的損失函數(shù)仍在不停降低,驗(yàn)證集的損失函數(shù)不再振蕩并保持收斂趨勢(shì),甚至存在非常微弱的上升趨勢(shì),這就意味著模型的進(jìn)一步訓(xùn)練和優(yōu)化將不再對(duì)真實(shí)的背景校正有本質(zhì)影響,為了防止過(guò)擬合,最后取驗(yàn)證集表現(xiàn)最好時(shí)候的模型作為預(yù)測(cè)模型.
圖2 損失函數(shù)隨著DNN 訓(xùn)練次數(shù)的變化過(guò)程,即模型預(yù)測(cè)和真實(shí)值之間的均方誤差作為訓(xùn)練迭代次數(shù)的函數(shù),較低的值意味著更好的預(yù)測(cè)性能.黃色的曲線表示驗(yàn)證集的損失函數(shù),藍(lán)色曲線是訓(xùn)練集上的損失函數(shù)Fig.2.The loss function varies with the training iterations of the DNN,which is the mean square error between model predictions and true values as a function of training iterations(epochs),and a lower value indicates better prediction performance.The yellow line represents the loss function on the validation set,and the blue line represents the loss function on the training set.
而原則上,只要驗(yàn)證集損失函數(shù)不再發(fā)生變化,對(duì)于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練就可以停止,推測(cè)超過(guò)200 次訓(xùn)練后訓(xùn)練集的損失函數(shù)仍在降低的現(xiàn)象來(lái)自于較小的數(shù)據(jù)庫(kù)引起的局域化分布.當(dāng)訓(xùn)練次數(shù)達(dá)到1000 次之后,我們停止了訓(xùn)練,基于此構(gòu)建了整體的神經(jīng)網(wǎng)絡(luò).
訓(xùn)練生成的神經(jīng)網(wǎng)絡(luò)可以應(yīng)用于原子信息重構(gòu),首先進(jìn)行的是背景圖片重構(gòu).選取測(cè)試集中無(wú)原子信息存在的區(qū)域進(jìn)行對(duì)比研究,由于這部分特定選取的區(qū)域不存在原子分布,可以用于對(duì)比研究生成的背景圖片與實(shí)際拍照獲取的背景圖片的噪聲分布.為了比較兩者之間的差異,同時(shí)采用冷原子光學(xué)密度(optical density,OD)的表征方法來(lái)進(jìn)行描述,O D=log[Iref/Isig] ,其中Isig為實(shí)際拍攝的信號(hào)圖片,Iref為相應(yīng)的背景圖片,可以為預(yù)測(cè)生成或者實(shí)際拍攝.
圖3 展示了一組無(wú)原子信息存在時(shí)的實(shí)驗(yàn)結(jié)果,其中圖3(a)和圖3(b) 分別展示的是預(yù)測(cè)生成和實(shí)際拍攝的光學(xué)密度分布,可以發(fā)現(xiàn)背景圖片扣除后圖3(a)中的噪聲明顯小于圖3(b)中的噪聲,且?guī)缀蹩床坏酱嬖诳臻g關(guān)聯(lián)的條紋噪聲.這說(shuō)明利用已訓(xùn)練的神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)生成的背景圖片更加貼近于真實(shí)噪聲分布,而雙次拍照獲得的圖像信息由于殘差干涉噪聲的存在信噪相對(duì)較差.
圖3 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的成像信息和實(shí)際拍攝的結(jié)果對(duì)比圖(無(wú)原子信息部分) (a),(c) 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的光學(xué)密度圖及其傅里葉空間分布;(b),(d) 實(shí)際雙拍成像的光學(xué)密度圖及其傅里葉空間分布;(e) 頻譜空間的噪聲對(duì)比圖Fig.3.Comparison of images predicted by neural networks and actual captured results (excluding atomic information): (a),(c) The optical density and Fourier space distribution of images generated by neural networks;(b),(d) the optical density and Fourier space distribution of actual double-shot imaging;(e) comparison of noise in frequency space.
將殘余噪聲轉(zhuǎn)換為傅里葉空間的分布上區(qū)分則更加清楚,如圖3(c)和圖3(d)所示,在相同的幅度顯示下,雙拍成像帶來(lái)了更多的空間條紋噪聲,對(duì)其進(jìn)行角平均后可以發(fā)現(xiàn)其空間頻率主要分布于0.05 μm—1附近(圖3(e)),而采用神經(jīng)網(wǎng)絡(luò)生成的背景圖片進(jìn)行背景扣除后OD 的測(cè)量結(jié)果則可以大幅度抑制空間條紋噪聲,對(duì)于某些特定的空間頻率,其噪聲強(qiáng)度甚至可以抑制到雙拍成像的1/20 左右.
該神經(jīng)網(wǎng)絡(luò)構(gòu)建的吸收成像優(yōu)化模型不僅可以優(yōu)化背景圖片中存在的空間條紋噪聲,同樣也可以用于優(yōu)化原子信息處的噪聲分布.本次測(cè)試中原子數(shù)目總計(jì)大約 20 萬(wàn)個(gè),但是在一般雙拍吸收成像方式中由于殘差噪聲的存在導(dǎo)致原子處能看到清晰的條紋結(jié)構(gòu),如圖4(b)所示,表現(xiàn)出原子分布被空間噪聲所調(diào)制,一般只能通過(guò)多次平均來(lái)克服這種噪聲干擾,但是往往需要耗費(fèi)大量的時(shí)間成本的同時(shí)還會(huì)引入隨機(jī)噪聲.圖4(a)展示了基于神經(jīng)網(wǎng)絡(luò)構(gòu)建背景圖片優(yōu)化后的原子密度分布,可以看到原子的密度分布變得更加的平滑,空間條紋噪聲被大幅度的抑制,成像得到了很好的優(yōu)化.
圖4 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的成像信息和實(shí)際拍攝的結(jié)果對(duì)比圖(原子信息部分) (a) 經(jīng)網(wǎng)絡(luò)預(yù)測(cè)生成的無(wú)條紋的原子密度分布圖;(b) 使用傳統(tǒng)雙拍成像得到的原子密度分布;(c) 白框中原子沿x 方向積分后的一維密度分布圖Fig.4.Comparison of images predicted by neural networks and actual captured results (atomic information included): (a) Stripefree atomic density distribution map generated by neural networks;(b) atomic density distribution obtained using traditional double-shot imaging;(c) one-dimensional density distribution in the white square (integrated along x direction).
由于原子處空間噪聲有多種頻率成分,條紋幅度和方向也有很大不同,隨機(jī)選取了圖4(a)和圖4(b)白框中的部分原子來(lái)展示算法對(duì)原子噪聲的抑制作用,對(duì)白框中的原子沿著x方向進(jìn)行積分得到結(jié)果,如圖4(c)所示,經(jīng)算法優(yōu)化后的原子密度分布更加平滑,信噪比大幅度提高.同時(shí)值得注意的是,傳統(tǒng)雙拍成像得到的密度分布比算法校正后的原子密度分布更高,意味著部分條紋噪聲被誤計(jì)入原子數(shù)目中,影響實(shí)驗(yàn)中對(duì)原子實(shí)際參數(shù)的評(píng)估.經(jīng)計(jì)算實(shí)際大約13%左右的原子應(yīng)該被移出總原子基數(shù),這將最終導(dǎo)致實(shí)際費(fèi)米面縮小2%左右.
本文展示了一個(gè)基于深度卷積神經(jīng)網(wǎng)絡(luò)背景還原的單拍冷原子成像技術(shù),證實(shí)了這種方案可以大幅度抑制由于空間干涉帶來(lái)的空間條紋噪聲干擾,準(zhǔn)確地重建比傳統(tǒng)的雙拍成像技術(shù)質(zhì)量更好的冷原子成像.同時(shí)利用該單拍成像方案可以降低相機(jī)高幀轉(zhuǎn)移速率的要求,結(jié)合偏振成像技術(shù)、相襯成像技術(shù)等無(wú)損探測(cè)技術(shù)可應(yīng)用于冷原子單循環(huán)多次成像,便于更快地還原原子的動(dòng)力學(xué)行為.該機(jī)器學(xué)習(xí)方案具有很好的魯棒性,將來(lái)可以通過(guò)在線學(xué)習(xí)方案進(jìn)行進(jìn)一步的優(yōu)化,通過(guò)把圖像定期添加到數(shù)據(jù)集,使得模型可以一邊預(yù)測(cè)一邊不斷更新,從而獲得更高的預(yù)測(cè)精度[27].