(西安工程大學(xué)電子信息學(xué)院 陜西 西安 710048)
自2002年德國(guó)Munich研究小組通過(guò)控制光晶格[1]的阱深,實(shí)現(xiàn)了將超冷原子從超流態(tài)向Mott絕緣態(tài)的相變[2]。在傳統(tǒng)的超冷原子研究計(jì)算中,對(duì)于一維光晶格中的玻色愛因斯坦凝聚體的波函數(shù)的計(jì)算,通常采用托馬斯-費(fèi)米近似和高斯近似模型求得[3,4]。通過(guò)波函數(shù)的疊加[5]再做傅里葉變換,最后得到在實(shí)驗(yàn)上觀測(cè)到的動(dòng)量分布。本文建立改進(jìn)的條件生成對(duì)抗網(wǎng)絡(luò)研究一維光晶格中稀薄氣體玻色-愛因斯坦凝聚體的相位與出其動(dòng)量分布。
生成式對(duì)抗網(wǎng)絡(luò)是Goodfellow在2014年提出的[6],其原理基于博弈論的思想,通過(guò)將生成網(wǎng)絡(luò)與判別網(wǎng)絡(luò)作為兩位博弈方,即一方獲得,另一方就會(huì)有損失。通過(guò)雙方不斷地博弈最終達(dá)到一種平衡。其模型如圖1所示:
圖1 生成式對(duì)抗網(wǎng)絡(luò)模型
其數(shù)學(xué)表達(dá)式如公式1所示:
(1)
D表示判別網(wǎng)絡(luò),G表示生成網(wǎng)絡(luò),z表示隨機(jī)噪聲。其含義就是判別網(wǎng)絡(luò)最大化分辨真實(shí)數(shù)據(jù)與生成數(shù)據(jù),而生成網(wǎng)絡(luò)則是要不斷減小生成數(shù)據(jù)與真實(shí)數(shù)據(jù)的差距。相較于其他神經(jīng)網(wǎng)絡(luò)模型,生成判別網(wǎng)絡(luò)可以生成更好的結(jié)果,但是由于生成網(wǎng)絡(luò)的輸入來(lái)自隨機(jī)噪聲,這樣會(huì)導(dǎo)致生成網(wǎng)絡(luò)的訓(xùn)練過(guò)于緩慢,所以在Mirza提出在通過(guò)加入一個(gè)條件變量來(lái)約束輸入噪聲,于是就有了條件生成對(duì)抗網(wǎng)絡(luò)[7],其數(shù)學(xué)表達(dá)式如下
(2)
y表示為條件變量用來(lái)約束隨機(jī)噪聲z,我們對(duì)條件生成對(duì)抗網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)進(jìn)行了設(shè)計(jì),生成網(wǎng)絡(luò)我們采用3層卷積層[8]和2層循環(huán)層[9]組成,判別網(wǎng)絡(luò)用3層卷積層以及兩層的全連接層組成,其結(jié)構(gòu)如圖2所示:
圖2 條件生成式對(duì)抗網(wǎng)絡(luò)
(一)實(shí)驗(yàn)數(shù)據(jù)集及網(wǎng)絡(luò)模型參數(shù)
實(shí)驗(yàn)中,我們通過(guò)托馬斯費(fèi)米理論進(jìn)行計(jì)算得到波函數(shù)的兩個(gè)特征,即相位信息與原子密度信息,生成106組值作為一維光晶格中106個(gè)格點(diǎn)的波函數(shù)特征,其每組數(shù)據(jù)維度為106*2,我們生成了5000組數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),其中將4500組作為訓(xùn)練數(shù)據(jù)集,250組作為驗(yàn)證數(shù)據(jù)集,250組作為測(cè)試數(shù)據(jù)集。條件生成對(duì)抗網(wǎng)絡(luò)的超參數(shù)如表1所示:
表1 生成網(wǎng)絡(luò)的超參數(shù)
表2 判別網(wǎng)絡(luò)的超參數(shù)
循環(huán)網(wǎng)絡(luò)層選用Relu[10]作為激活函數(shù),卷積層選用的激活函數(shù)選用LeakyRelu[11],LeakyRelu可以保留卷積層輸出的負(fù)值相位特征,其表達(dá)式為:
y=max(0.2x,x)
(3)
(二)實(shí)驗(yàn)結(jié)果
我們用平均誤差來(lái)評(píng)估模型的效果,網(wǎng)絡(luò)模型不能根據(jù)測(cè)試數(shù)據(jù)集的結(jié)果進(jìn)行調(diào)整且測(cè)試數(shù)據(jù)集絕對(duì)未知,所以測(cè)試集的結(jié)果可以作為最終的評(píng)估結(jié)果,其結(jié)果如表2所示。圖3是在訓(xùn)練過(guò)程中,卷積循環(huán)網(wǎng)絡(luò)模型在驗(yàn)證數(shù)據(jù)集上的平均誤差,圖4是訓(xùn)練完成后,卷積循環(huán)神經(jīng)網(wǎng)絡(luò)在測(cè)試數(shù)據(jù)集上的結(jié)果。
表3驗(yàn)證集和預(yù)測(cè)集下的神經(jīng)網(wǎng)絡(luò)的平均誤差
Table3.AverageErrorofNeuralNetworksbasedonVerificationSetandPredictionSet
神經(jīng)網(wǎng)絡(luò)模型驗(yàn)證數(shù)據(jù)集平均誤差測(cè)試數(shù)據(jù)集平均誤差7層卷積神經(jīng)網(wǎng)絡(luò)2.242.27條件生成對(duì)抗網(wǎng)絡(luò)0.590.59
圖3 生成網(wǎng)絡(luò)在驗(yàn)證數(shù)據(jù)集上的平均誤差
圖4 網(wǎng)絡(luò)模型在測(cè)試數(shù)據(jù)集上的結(jié)果
(三)實(shí)驗(yàn)結(jié)果分析
通過(guò)表3可以看出,條件生成對(duì)抗網(wǎng)絡(luò)模型的效果不管是在測(cè)試集上,還是驗(yàn)證測(cè)試集上平均誤差都有明顯的下降,其誤差結(jié)果為0.59,相較于7層卷積神經(jīng)網(wǎng)絡(luò),誤差降低了74%。通過(guò)圖4可以看出訓(xùn)練完成的模型能比較明顯的預(yù)測(cè)出一維光晶格中的超冷凝聚體在動(dòng)量空間中的幾個(gè)峰值以及位置。
本文從數(shù)據(jù)科學(xué)的研究角度出發(fā),將機(jī)器學(xué)習(xí)的方法,運(yùn)用到冷原子物理中,建立卷積循環(huán)網(wǎng)絡(luò)模型,通過(guò)一維光晶格中的玻色-愛因斯坦凝聚體的波函數(shù)預(yù)測(cè)其動(dòng)量空間的分布,不僅對(duì)基礎(chǔ)研究有開拓性的意義,甚至是對(duì)高精密測(cè)量,量子信息處理方面都有積極的意義。