林文瑞 叢 爽
在量子力學(xué)中,量子狀態(tài)密度矩陣包含了量子系統(tǒng)的全部信息,是量子信息處理和量子控制研究的基礎(chǔ).根據(jù)海森堡不確定性原理[1],對量子系統(tǒng)的每一次測量都會破壞其原有的狀態(tài),這使得人們無法通過直接對一個量子系統(tǒng)進(jìn)行測量來獲得量子系統(tǒng)的狀態(tài),只能測量到量子系統(tǒng)的狀態(tài)在某個投影方向上的投影(坍縮)結(jié)果,再通過多次測量的統(tǒng)計結(jié)果,計算出各投影分量的概率對真實量子狀態(tài)進(jìn)行估計[2].為了解決量子態(tài)的估計問題,1957 年Fano[3]提出了量子層析的方法,它是通過對一個量子狀態(tài)進(jìn)行多次投影測量,根據(jù)測量值與量子態(tài)直接的關(guān)系式,聯(lián)立方程求解出量子狀態(tài).該方法需要制備量子狀態(tài)的大量全同副本,并進(jìn)行重復(fù)地測量來進(jìn)行量子態(tài)估計.隨著量子理論的逐步完善,1969 年Cahill和Glauber[2]提出利用重復(fù)測量獲取的量子概率統(tǒng)計數(shù)據(jù)重構(gòu)出量子態(tài)的密度矩陣來恢復(fù)量子狀態(tài)信息,奠定了量子態(tài)層析的基礎(chǔ).一個n比特量子系統(tǒng)狀態(tài)的密度矩陣ρ∈Cd×d的維數(shù)為d×d,并同時具有半正定,單位跡和共軛對稱的性質(zhì),其中d=2n.由于待估計的ρ的未知元素數(shù)目為d×d=4n個,所以該系統(tǒng)的完備測量次數(shù)為 4n,是隨著量子維數(shù)呈指數(shù)增加[4].為了解決測量次數(shù)隨量子位指數(shù)增長的問題,人們根據(jù)壓縮感知(Compressive sensing,CS)理論[5]將量子態(tài)密度矩陣通過高維測量矩陣投影到維數(shù)很低的壓縮矩陣上,只要測量矩陣滿足限制等距特性(Restricted isometry property,RIP)[6],就可以利用壓縮后的低維壓縮矩陣通過求解一個優(yōu)化問題精確重構(gòu)出待估計的密度矩陣[7-9].
在實際量子測量過程中,測量噪聲的存在是不可避免的,并且可以被假定為高斯噪聲.在量子狀態(tài)估計算法研究中,Smith 等[10]基于最小二乘法從含有噪聲的數(shù)據(jù)中實現(xiàn)了4 比特量子狀態(tài)估計.Li等[11]基于壓縮感知將交替方向乘子法(Alternating direction multiplier method,ADMM)運(yùn)用到量子態(tài)估計中[12],給出了算法迭代優(yōu)化形式,并在5 比特的量子狀態(tài)密度矩陣估計中獲得了較高的估計精度.ADMM 算法是一種求解分布式凸優(yōu)化問題的計算框架,在圖像處理及恢復(fù)、統(tǒng)計學(xué)習(xí)和量子態(tài)估計等領(lǐng)域有著廣泛應(yīng)用.Smolin 等[13]提出了一種從加性高斯噪聲測量中計算最大似然量子態(tài)的有效方法,其最壞時間復(fù)雜度為O(d4).但是這些優(yōu)化算法在量子態(tài)重建過程中都會需要較多的計算內(nèi)存和計算時間.對于高維量子系統(tǒng),重建過程中需要測量和處理的數(shù)據(jù)會很多,這樣會導(dǎo)致所需的計算資源和計算時間增長很快.Metzler 等[14]提出DAMP 算法,它是一種基于壓縮感知的迭代稀疏信號恢復(fù)算法,通過在算法中添加Onsager 校正項[14-15],修正每次迭代時有效噪聲的偏差,改進(jìn)了基于去噪的迭代閾值(Denoising-based iterative threshold,DIT)算法收斂速度慢的問題.Liu 等[16]采用卷積神經(jīng)網(wǎng)絡(luò)的降噪自動編碼器,從帶有噪聲的密度矩陣中重建出高精度的密度矩陣.
本文基于壓縮感知理論,結(jié)合深度學(xué)習(xí)網(wǎng)絡(luò),提出一種采用深度學(xué)習(xí)網(wǎng)絡(luò)來估計量子狀態(tài)密度矩陣的方法.將密度矩陣視為二維自然圖像信號,采用基于學(xué)習(xí)降噪的近似消息傳遞(Learned denoising-based approximate message passing,LDAMP)神經(jīng)網(wǎng)絡(luò)[17],將去噪卷積神經(jīng)網(wǎng)絡(luò)(Denoising convolutional neural network,DnCNN)的圖像降噪器[18]融合到基于去噪的近似消息傳遞(Denoisingbased approximate message passing,DAMP)算法[19]中.此外,還提供一個關(guān)于LDAMP 在量子狀態(tài)估計中的漸近收斂性能的分析框架—狀態(tài)演化(State evolution,SE)方程[17]來預(yù)測LDAMP 網(wǎng)絡(luò)每一層的均方誤差(Mean square error,MSE)性能[20].在數(shù)值仿真實驗中,在固定DnCNN 神經(jīng)網(wǎng)絡(luò)和LDAMP 網(wǎng)絡(luò)的層數(shù),選擇高斯測量矩陣,在無和有外部測量噪聲兩種情況下,分別對4 個量子位的量子本征態(tài)、疊加態(tài)、對角混合態(tài)和一般混合態(tài)的密度矩陣參數(shù)估計進(jìn)行結(jié)果和性能分析,并與其他典型的重建算法對密度矩陣參數(shù)估計的性能進(jìn)行了對比研究.
本文結(jié)構(gòu)安排如下:第1 節(jié)概述了基于壓縮感知的量子狀態(tài)估計作為一個信號恢復(fù)問題,第2 節(jié)介紹了應(yīng)用于量子狀態(tài)估計的DAMP 信號恢復(fù)算法,第3 節(jié)具體描述了LDAMP 網(wǎng)絡(luò)的實現(xiàn)和DnCNN 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)及其訓(xùn)練過程,第4 節(jié)給出了對DnCNN 訓(xùn)練后模型的測試結(jié)果和量子態(tài)估計數(shù)值模擬實驗結(jié)果及分析,第5 節(jié)是結(jié)論.
壓縮感知是近10 多年來在信號處理領(lǐng)域誕生的一種新的信號恢復(fù)理論.它主要是利用信號s∈CN的M(遠(yuǎn)遠(yuǎn)小于完備測量需要的N)個隨機(jī)線性測量值y,建立欠定線性方程組y=As(y∈CM),并通過優(yōu)化算法來高精度重構(gòu)求解出原始信號s,其中A∈CM×N,M<N為測量矩陣.在量子態(tài)估計中,原始信號為密度矩陣ρ∈Cd×d,它與量子系統(tǒng)波函數(shù)之間的關(guān)系為:
式中,|ψi〉為系統(tǒng)的波函數(shù),pi表示波函數(shù)的概率,d為密度矩陣的維數(shù).將密度矩陣寫成向量表達(dá)的形式是ρ=ψ·ψ*,其中ψ=當(dāng)量子系統(tǒng)的量子位數(shù)為n時,密度矩陣的維數(shù)d=2n.由于神經(jīng)網(wǎng)絡(luò)無法直接處理復(fù)數(shù)信號的去噪,在本文中僅對實數(shù)密度矩陣進(jìn)行估計.在基于壓縮感知的量子態(tài)估計中,測量矩陣A需要滿足限制等距特性才可以唯一確定d2個待估計的密度矩陣元素,人們通常采用的是泡利測量矩陣[21].由于隨機(jī)高斯矩陣參數(shù)均為實數(shù)并且具有較好的重構(gòu)效果[22],本文中在RIP 條件下采用隨機(jī)高斯矩陣來構(gòu)造測量矩陣,其設(shè)計方法為:構(gòu)造一個M ×N大小的矩陣A,使A中的每一個元素獨(dú)立的服從均值為0,方差為 1 /M的高斯分布,即:
式中,A的行數(shù)與列數(shù)的比值定義為采樣率η=M/N,并且有N=d2.
考慮從有外部測量干擾的線性度量中恢復(fù)密度矩陣ρ∈Rd×d的問題:
式中,vec(·) 表示將一個矩陣按列的方向組合成一個列向量,w∈Rm為測量噪聲并且通常被假設(shè)為獨(dú)立且同分布的高斯噪聲.定義測量噪聲w~N(0)為加性高斯白噪聲(Additive white Gaussian noise,AWGN),其中γw為噪聲標(biāo)準(zhǔn)差.在本文的模擬實驗中,采用含測量噪聲信號y和理想測量信號y0=A·vec(ρ) 之間的信噪比(Signal noise ratio,SNR)作為噪聲強(qiáng)度,計算公式為:
式中,y(i,j)和y0(i,j) 分別為含測量噪聲信號和理想測量信號在向量中 (i,j) 點(diǎn)處的值.
利用正則化二次損失最小化方法解決該線性逆問題,可以通過求解一個凸優(yōu)化問題計算得到vec(ρ)的估計值[23-24]:
式中,λ>0 為正則化參數(shù).然而這個極小化問題是一個凸優(yōu)化問題,在大規(guī)模問題中,由于數(shù)據(jù)維度較大,常規(guī)求解算法中,如內(nèi)點(diǎn)法等的算法復(fù)雜度較大,求解起來非常耗時.這使得眾多研究人員通過簡單的基于梯度的方法來求解式(5).
在眾多基于梯度的算法中,最受關(guān)注的一類方法是迭代閾值(Iterative threshold,IT)算法.為了方便表示,定義s=vec(ρ).當(dāng)待估計的密度矩陣為ρ0時,稱s0=vec(ρ0) 為待估計的信號.從s0=0和z0=0開始,迭代公式為:
式中,sl是l次迭代密度矩陣的估計值.zl是l次迭代的殘差,如果密度矩陣恢復(fù)過程是無噪聲的,并且算法性能執(zhí)行得很好,它將收斂于0.η(·) 稱為閾值函數(shù),它是一個被應(yīng)用到矢量的分量元素上的標(biāo)量非線性函數(shù).λl是l次迭代閾值函數(shù)使用的參數(shù).
在信號恢復(fù)中,閾值函數(shù)的選擇非常重要,常見的有軟閾值函數(shù)(7)等.其中符號 (w)+表示w ≥0時結(jié)果為w,否則結(jié)果為0.另外一種實現(xiàn)閾值函數(shù)的方法是使用降噪器Dσ?l,此時閾值參數(shù)λl的含義為輸入降噪器的信號的所含高斯噪聲的標(biāo)準(zhǔn)差估計,并且計算公式為它隨著迭代次數(shù)的變化而變化.利用降噪器實現(xiàn)閾值函數(shù)的迭代閾值算法稱為基于去噪的迭代閾值(Denoisingbased iterative threshold,DIT)算法[17],迭代公式為:
基于不同的降噪器,DAMP 包含許多算法[27],包括高斯-AMP (Gauss-AMP)、雙邊-AMP (Bilateral-AMP)、非局部平均-AMP (Non-local means AMP,NLM-AMP)和三維塊匹配-AMP (Block matching 3D AMP,BM3D-AMP)[28]等.本文采用的降噪器和散度計算都是通過設(shè)計并訓(xùn)練一個深度卷積神經(jīng)網(wǎng)絡(luò)DnCNN 來實現(xiàn).同時通過設(shè)計一個學(xué)習(xí)的基于去噪的近似消息傳遞LDAMP 網(wǎng)絡(luò),來實現(xiàn)算法1 的DAMP 算法,并通過多個相同結(jié)構(gòu)的的級聯(lián),來獲得高精度的信號s0即vec(ρ0) 的估計,得到密度矩陣ρ0的估計.
本文通過LDAMP 網(wǎng)絡(luò),使用量子系統(tǒng)輸出的測量值,來實現(xiàn)對量子態(tài)密度矩陣估計,具體流程如下:
步驟1.根據(jù)生成DnCNN 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集,驗證集和測試集,具體過程在第3.3 節(jié);
步驟2.在9 個不同噪聲標(biāo)準(zhǔn)差范圍下,訓(xùn)練出相應(yīng)的DnCNN 神經(jīng)網(wǎng)絡(luò),訓(xùn)練完成后利用測試集對網(wǎng)絡(luò)進(jìn)行測試;
步驟3.對于待估計的密度矩陣ρ0,在不同采樣率下利用高斯測量算符獲取的輸出測量值y0.對于含噪聲情況下測量值,通過y=awgn(y0,SNR) 添加固定SNR數(shù)值的高斯噪聲獲得好噪聲測量值y;
步驟4.設(shè)計一個包含訓(xùn)練好的DnCNN 網(wǎng)絡(luò)和實現(xiàn)DAMP 算法的10 層LDAMP 網(wǎng)絡(luò),網(wǎng)絡(luò)各層中的DnCNN 是根據(jù)當(dāng)前層的噪聲標(biāo)準(zhǔn)差估計σ?落入的9 個范圍來選定.LDAMP 網(wǎng)絡(luò)的輸入為測量值y0或y;
步驟5.LDAMP 網(wǎng)絡(luò)最后的輸出為根據(jù)輸入測量值y0或y得到的估計的密度矩陣.
第3.1 節(jié)對LDAMP 網(wǎng)絡(luò)的結(jié)構(gòu)進(jìn)行設(shè)計;第3.2 節(jié)進(jìn)行DnCNN 降噪器及其中的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計;第3.3 節(jié)進(jìn)行DnCNN 降噪器中神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程.
LDAMP 網(wǎng)絡(luò)由L層相同的AMP 網(wǎng)絡(luò)結(jié)構(gòu)級聯(lián)而成,其中,LDAMP 網(wǎng)絡(luò)單層的結(jié)構(gòu)圖如圖1所示.每層網(wǎng)絡(luò)包含兩個在固定噪聲標(biāo)準(zhǔn)差區(qū)間下訓(xùn)練好的DnCNN 降噪器,一個用于計算每層AMP網(wǎng)絡(luò)的輸出sl+1,另一個用于實現(xiàn)散度圖1中的xl=sl+AHzl為LDA MP網(wǎng)絡(luò)的第(l+1) 層中DnCNN 降噪器的輸入信號,v?l為降噪器中DnCNN 卷積神經(jīng)網(wǎng)絡(luò)的輸出,它表示對有效噪聲vl的估計.
圖1 LDAMP 中第 l 級網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 Structure of the l-level network in the LDAMP
需要指出的是,LDAMP 網(wǎng)絡(luò)中只有DnCNN降噪器是由神經(jīng)網(wǎng)絡(luò)設(shè)計而成,而網(wǎng)絡(luò)的其他部分只是對DAMP 算法的實現(xiàn).
對于L層的LDAMP 網(wǎng)絡(luò),可以使用不同的方法來訓(xùn)練,包括端到端訓(xùn)練,逐層訓(xùn)練和逐降噪器訓(xùn)練,其中,端到端訓(xùn)練是指將L層的LDAMP網(wǎng)絡(luò)視作一個整體,同時訓(xùn)練網(wǎng)絡(luò)的所有權(quán)值.這是訓(xùn)練神經(jīng)網(wǎng)絡(luò)的標(biāo)準(zhǔn)方法.逐層訓(xùn)練是指每次訓(xùn)練LDAMP 網(wǎng)絡(luò)中的一層AMP 網(wǎng)絡(luò)來恢復(fù)信號,固定這些權(quán)值,然后添加一層AMP 網(wǎng)絡(luò),訓(xùn)練產(chǎn)生的2 層網(wǎng)絡(luò)的第2 層來恢復(fù)信號,再固定這些權(quán)值,重復(fù)操作直到已經(jīng)訓(xùn)練一個L層LDAMP 網(wǎng)絡(luò).逐降噪器訓(xùn)練是指將DnCNN 降噪器從網(wǎng)絡(luò)中單獨(dú)出來,并在不同噪聲標(biāo)準(zhǔn)差范圍區(qū)間下訓(xùn)練每個降噪器的AWGN 去噪問題,從而得到多個不同去噪水平的降噪器,以供LDAMP 網(wǎng)絡(luò)中的各層選擇,即每層AMP 網(wǎng)絡(luò),根據(jù)當(dāng)前層的噪聲標(biāo)準(zhǔn)差的估計,來選擇使用哪一個降噪器.
本文采用的逐降噪器訓(xùn)練方法是最小均方誤差(Minimum mean squared error,MMSE)[17]最優(yōu)的.具體訓(xùn)練過程為:首先,對噪聲水平的預(yù)期范圍進(jìn)行離散化,將噪聲標(biāo)準(zhǔn)差[0,2]范圍內(nèi)的噪聲分成多個小范圍;然后,在這些小范圍噪聲水平下訓(xùn)練DnCNN 降噪器,得到多個訓(xùn)練好的降噪器模型;最后,LDAMP 網(wǎng)絡(luò)實現(xiàn)時,每層網(wǎng)絡(luò)根據(jù)本層的噪聲標(biāo)準(zhǔn)差估計落在某個區(qū)間內(nèi),來選擇在該噪聲標(biāo)準(zhǔn)差區(qū)間下訓(xùn)練好的降噪器模型.LDAMP網(wǎng)絡(luò)易于訓(xùn)練,可以應(yīng)用于各種不同的測量矩陣,并帶有一個可以準(zhǔn)確預(yù)測其性能的狀態(tài)演化框架.
狀態(tài)演化(State evolution,SE)是一個可以預(yù)測LDAMP 網(wǎng)絡(luò)各級的輸出與真實信號之間MSE性能的分析框架.它由一系列SE 方程組成:
在DnCNN 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計上,DnCNN 網(wǎng)絡(luò)源于對VGG 網(wǎng)絡(luò)的改進(jìn),去除了池化層和全連接層,在卷積層(Convolution,Conv)和修正線性單元(Rectified linear unit,ReLU)[29]之間加入了批歸一化(Batch normalization,BN)[30].這種改變可以減輕內(nèi)部協(xié)變量移位[18]帶來的影響,從而提高網(wǎng)絡(luò)的學(xué)習(xí)收斂速度.在模型學(xué)習(xí)中,DnCNN 借鑒了ResNet 的殘差學(xué)習(xí)方法[31-33],來提高訓(xùn)練速度和去噪性能.
圖2 為DnCNN 降噪器的網(wǎng)絡(luò)結(jié)構(gòu)圖,圖3 是DnCNN 降噪器輸入變量的尺寸變換過程圖.輸入矢量的維數(shù)為d×d,其中d=2n,n為量子態(tài)的位數(shù).深度為D的DnCNN 神經(jīng)網(wǎng)絡(luò),在本文應(yīng)用中,D取值為20.本文設(shè)計的DnCNN 有三種不同的網(wǎng)絡(luò)層,具體排列順序為:第1 層為卷積層+修正線性單元(Conv+ReLU):使用64 個大小為3×3×1的卷積核(或稱為濾波器),生成64 個特征圖.然后,使用修正線性單元進(jìn)行非線性處理.第2~(D-1)層為卷積層+批歸一化+修正線性單元(Conv+BN+ReLU),使用64 個大小為 3×3×64 的卷積核,在卷積層和ReLU 層之間加入BN 層.最后一層為卷積層(Conv),使用1 個大小為 3×3×64 的卷積核重構(gòu)輸出.
圖2 DnCNN 降噪器的網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 Network structure of the DnCNN denoiser
DnCNN 神經(jīng)網(wǎng)絡(luò)的輸入是有噪聲的信號矩陣x∈Rd×d,所以LDAMP 網(wǎng)絡(luò)各層把數(shù)據(jù)輸入到DnCNN 神經(jīng)網(wǎng)絡(luò)之前,需要將列向量變成原始信號大小的矩陣形式,變換過程如圖3 所示.含噪聲輸入的矩陣x和向量xl分別為:
圖3 DnCNN 降噪器輸入變量的尺寸變換過程Fig.3 Size transformation process of input variable of the DnCNN denoiser
它是估計噪聲信號R(x;Θ) 與真實噪聲信號v=x-s0之間的均方誤差.其中,Q是批大小(Batch Size),Θ 是DnCNN 神經(jīng)網(wǎng)絡(luò)中可以調(diào)整的參數(shù),包括網(wǎng)絡(luò)的權(quán)值和偏置,訓(xùn)練次數(shù)和目標(biāo)誤差等.
在許多信號恢復(fù)算法中,通常要求輸出信號的尺寸與輸入信號的尺寸一致,這可能會導(dǎo)致恢復(fù)的矩陣信號中邊界元素值受到較大影響,也就是產(chǎn)生邊界偽影.為了保證隱含層的每個特征信號與輸入信號的尺寸大小相同,在DnCNN 神經(jīng)網(wǎng)絡(luò)的每個卷積層中進(jìn)行卷積運(yùn)算之前,對輸入卷積層的信號采用簡單的零填充策略,不過這種零填充策略不會產(chǎn)生任何邊界偽影[18].
在對DnCNN 神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練時,采用的樣本數(shù)據(jù)的尺寸大小為 24×24=16×16,也就是4個量子位的密度矩陣.對樣本數(shù)據(jù)加入不同標(biāo)準(zhǔn)差范圍下的高斯噪聲作為訓(xùn)練輸入,原始樣本數(shù)據(jù)作為訓(xùn)練輸出目標(biāo),在未知高斯噪聲水平下訓(xùn)練DnCNN 神經(jīng)網(wǎng)絡(luò).為了訓(xùn)練更小噪聲范圍下的DnCNN 網(wǎng)絡(luò),將噪聲標(biāo)準(zhǔn)差范圍[0,2]劃分成9個小范圍,具體分段結(jié)點(diǎn)為0、0.005、0.01、0.03、0.05、0.1、0.3、0.5、1和2,并在這9 個小范圍噪聲水平下分別訓(xùn)練了DnCNN 網(wǎng)絡(luò).然后LDAMP 網(wǎng)絡(luò)根據(jù)各級的噪聲標(biāo)準(zhǔn)差估計σ? 的大小選擇對應(yīng)的DnCNN 模型.訓(xùn)練和測試過程中,樣本數(shù)據(jù)包含滿足和近似滿足量子態(tài)密度矩陣性質(zhì)的矩陣,其中滿足性質(zhì)的兩種量子態(tài)的密度矩陣生成公式為:
式中,φr為d×r的Wishart 矩陣,并且矩陣內(nèi)各元素滿足高斯分布[35].r=1 時,為疊加態(tài)密度矩陣,r >1時為一般混合態(tài)密度矩陣.
本文研究的另外兩種量子態(tài)還包括本征態(tài)和對角混合態(tài),其中本征態(tài)密度矩陣為僅有對角線某一位置有元素為1,其他位置元素均為0 的矩陣,對角混合態(tài)密度矩陣為僅在對角線上所有位置有非0 元素,且對角線所有元素之和為1,其他位置元素均為0 的矩陣.樣本數(shù)據(jù)中近似滿足性質(zhì)的矩陣是指在構(gòu)造樣本數(shù)據(jù)時,改變部分滿足性質(zhì)的密度矩陣中的元素,加入一些噪聲干擾,使矩陣的跡在[0,1]之間且近似共軛對稱的半正定矩陣.在構(gòu)造過程中,采用[0,1]之間的隨機(jī)數(shù)乘以原始密度矩陣或在原始矩陣生成過程中給矩陣φr的共軛轉(zhuǎn)置矩陣添加噪聲干擾.值得注意的是,訓(xùn)練集和測試集中近似滿足性質(zhì)的密度矩陣所占的比例在30%~50%可以取得較好的估計效果,另外[0,0.5]之間的隨機(jī)數(shù)應(yīng)多于(0.5,1]之間的隨機(jī)數(shù).這種構(gòu)造方法的原因是因為LDAMP 網(wǎng)絡(luò)具有數(shù)層相同的結(jié)構(gòu),網(wǎng)絡(luò)的初始輸入s0=vec(ρ0) 為零向量,網(wǎng)絡(luò)的最終輸出為估計的密度矩陣,所以網(wǎng)絡(luò)進(jìn)行密度矩陣估計是各層網(wǎng)絡(luò)漸近逼近真實密度矩陣的過程,因此需要大量的中間估計結(jié)果和少量的零矩陣包含在訓(xùn)練樣本集中.
在訓(xùn)練DnCNN 時,本文使用了9 900×128=1 267 200 個樣本用于訓(xùn)練,1 100×128=140 800 個樣本用于驗證和11 × 128=1 408 個樣本矩陣用于測試.訓(xùn)練集、驗證集及測試集中4 種量子態(tài)密度矩陣的比例為本征態(tài):對角混合態(tài):疊加態(tài):一般混合態(tài)=1:2:4:4.所有的樣本矩陣在生成時都是無噪聲樣本,而在訓(xùn)練、驗證和測試時,會在對應(yīng)的噪聲水平范圍內(nèi)加入噪聲.為了獲取足夠的空間信息進(jìn)行去噪,將DnCNN 神經(jīng)網(wǎng)絡(luò)的深度設(shè)置為20 層.采用了一種魯棒的初始化方法MSRA[36]來初始化DnCNN 神經(jīng)網(wǎng)絡(luò)權(quán)值,并采用權(quán)值衰減為0.0001、動量為0.9、小批量尺寸為128 的帶動量的隨機(jī)梯度下降法(Stochastic gradient descent with momentum,SGDM)訓(xùn)練網(wǎng)絡(luò).為每個小范圍噪聲水平下的神經(jīng)網(wǎng)絡(luò)設(shè)置的最大訓(xùn)練次數(shù)為50,最大允許無用訓(xùn)練次數(shù)(Max bad epochs,MBE)為2,初始無用訓(xùn)練次數(shù)(Bad epochs,BE)為0.在訓(xùn)練過程中,初始最小驗證誤差采用驗證集驗證未訓(xùn)練的網(wǎng)絡(luò)得到,后續(xù)過程中,網(wǎng)絡(luò)訓(xùn)練一次就驗證一次得到新的驗證誤差,并將新的驗證誤差與上一次的驗證誤差相比,如果小于上一次的驗證誤差就將此次驗證誤差設(shè)置為最小驗證誤差并將BE 清零,否則最小驗證誤差不變并將BE 加1.當(dāng)BE 大于等于MBE 時,網(wǎng)絡(luò)就減小學(xué)習(xí)速率,并將BE 清零.學(xué)習(xí)速率變化過程為初始值0.001 衰減為0.0001,最后衰減至0.00001.當(dāng)學(xué)習(xí)速率衰減為0.00001且BE 大于等于MBE 時,DnCNN 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練結(jié)束.在實驗中,使用Matlab 中的MatCov-Net 工具箱[37]來實現(xiàn)DnCNN 神經(jīng)網(wǎng)絡(luò).所有實驗均在Intel(R) Core(TM) i7-8700K CPU 3.70 GHz、NVIDIA GeForce GTX 1 080 GPU 的PC 上運(yùn)行的Matlab (R2018b)環(huán)境下進(jìn)行.所有9 個小范圍噪聲水平下的20 層DnCNN 網(wǎng)絡(luò)的GPU 訓(xùn)練時間需要59 小時左右.
本節(jié)對本文提出的LDAMP 網(wǎng)絡(luò)的量子態(tài)估計性能,在不同參數(shù)下,進(jìn)行了數(shù)值性能對比實驗,進(jìn)行3 個實驗:
1)不同噪聲標(biāo)準(zhǔn)差區(qū)間下,對所設(shè)計訓(xùn)練出的20 層DnCNN 神經(jīng)網(wǎng)絡(luò)降噪器去噪性能的測試實驗;
2)本文的LDAMP 網(wǎng)絡(luò)與其他5 種不同方法對量子態(tài)密度矩陣估計的性能對比實驗;
3)不同測量噪聲以及不同采樣率分別對LDAMP網(wǎng)絡(luò)估計量子態(tài)密度矩陣性能的影響實驗.
實驗中,量子狀態(tài)測量值y是根據(jù)式(3)計算:y=A·vec(ρ0)+w,其中A為隨機(jī)高斯測量矩陣,w~N(0)表示測量過程中產(chǎn)生的高斯噪聲,ρ0為真實密度矩陣,可以從本征態(tài)、疊加態(tài)、對角混合態(tài)和一般混合態(tài)密度矩陣中選取.定義了三個性能指標(biāo)來衡量實驗結(jié)果:
當(dāng)MSE 以dB 作為單位時,定義為:
3)估計的密度矩陣與真實密度矩陣之間的保真度(Fidelity)[38]:
式中,保真度的范圍是[0,1],并且當(dāng)2 個矩陣完全相同時,保真度為1[39].
圖4 為使用11 × 128=1408 個隨機(jī)樣本矩陣,分別測試噪聲水平分別從[0,0.005],(0.005,0.03],···,(1,2]共9 個范圍情況下,對訓(xùn)練后得到的20 層DnCNN 進(jìn)行去噪性能的測試實驗的誤差曲線圖,其中方形實線表示網(wǎng)絡(luò)輸入樣本與對應(yīng)的無噪聲樣本之間的平均均方誤差MSE (dB);圓圈虛線為網(wǎng)絡(luò)輸出樣本與對應(yīng)的無噪聲樣本之間的平均均方誤差MSE (dB);三角形實線是輸出誤差與輸入誤差之間的MSE 比值變化曲線.由圖4 可以看出,網(wǎng)絡(luò)輸出誤差始終小于輸入誤差,并且隨著噪聲標(biāo)準(zhǔn)差的增加,輸出誤差與輸入誤差之間的比值逐漸減小:從[0,0.005]區(qū)間的0.5956 減小至(1,2]區(qū)間的0.0311.這說明,當(dāng)輸入噪聲很小時,輸出誤差仍然能夠濾掉接近一半噪聲,隨著噪聲的增加,去噪效果越明顯.表明經(jīng)過訓(xùn)練后的DnCNN 降噪器擁有良好的去噪效果.
圖4 DnCNN 降噪器的MSE 性能Fig.4 MSE performance of the DnCNN denoiser
本節(jié)中將本文的LDAMP 網(wǎng)絡(luò)與ADMM 算法,以及其他4 種DAMP 算法(BM3D-AMP、NLMAMP、Gauss-AMP和Bilateral-AMP)對量子態(tài)估計的性能,進(jìn)行對比實驗.實驗中采用的樣本為對角混合態(tài)密度矩陣.分別在采樣率從0.05 每隔0.05增加到0.5,測量噪聲強(qiáng)度固定為SNR=40 dB 情況下,不同量子態(tài)估計方法的歸一化距離隨采樣率變化情況,實驗結(jié)果如圖5 所示.固定采樣率η=0.1,不同量子態(tài)估計方法的MSE (dB)性能隨SNR 變化情況如表1 所示.由圖5 可以看出,在每一個采樣率下,LDAMP 網(wǎng)絡(luò)的性能是所有算法中最好的,并且在采樣率為0.15 時,就能夠達(dá)到10-3的性能.由表1 可以看出,在所有不同噪聲等級干擾和無噪聲情況下,LDAMP 網(wǎng)絡(luò)的估計性能均優(yōu)于其他方法,并且在無噪聲干擾下的MSE (dB)為-41.0905 dB,估計誤差達(dá)到 1 0-4量級.
表1 當(dāng) η=0.1 時,LDAMP 網(wǎng)絡(luò)和其他方法的MSE (dB)性能比較Table 1 Comparison of MSE (dB) performance between LDAMP network and other methods with η=0.1
圖5 當(dāng)SNR=40 dB 時,LDAMP 網(wǎng)絡(luò)和其他方法的歸一化距離性能對比Fig.5 Comparison of normalized distance performance between LDAMP network and other methods with SNR=40 dB
本節(jié)采用本文設(shè)計出的具有20 層DnCNN 以及10 層算法迭代的LDAMP 網(wǎng)絡(luò),在無和有噪聲的2 種情況下,分別對本征態(tài)、疊加態(tài)、對角混合態(tài)和一般混合態(tài)的估計進(jìn)行了性能對比實驗.影響狀態(tài)估計性能的因素有采樣率的多少和噪聲的大小,共進(jìn)行了4 個實驗.
1)不同采樣率下無和含固定測量噪聲的量子狀態(tài)估計實驗
在采樣率從0.05 每隔0.05 增加到0.5,分別在無和含固定測量噪聲SNR=40 dB 兩種情況下,對4 種不同算法的量子狀態(tài)進(jìn)行了網(wǎng)絡(luò)訓(xùn)練設(shè)計,網(wǎng)絡(luò)的估計結(jié)果與真實狀態(tài)之間的歸一化距離變化過程如圖6 所示.從圖6 可以看出,隨著采樣率的增加,所有狀態(tài)估計的歸一化距離呈下降趨勢,估計效果逐漸變好.由于測量噪聲的存在,所有狀態(tài)的估計結(jié)果均略差于無噪聲情況下的狀態(tài)估計.其中,本征態(tài)的估計最為準(zhǔn)確,歸一化距離均可以在最低采樣率0.05 時達(dá)到 1 0-4量級,其在無噪聲情況下的保真度為0.999993,有噪聲情況下的保真度為0.989028.對角混合態(tài)的估計次之,其在0.15 采樣率時無噪聲情況下的歸一化距離(保真度)才達(dá)到0.0017 (0.999898).這2 種量子狀態(tài)具有較為簡單的密度矩陣結(jié)構(gòu),因此在估計時也達(dá)到了較好的估計效果.在無噪聲情況下,疊加態(tài)在采樣率0.3 時的歸一化距離(保真度)達(dá)到0.0037 (0.980570);一般混合態(tài)在采樣率0.5 時的歸一化距離(保真度),達(dá)到0.0198 (0.992958).在采樣率小于0.3 時,對角混合態(tài)的估計效果不如一般混合態(tài);當(dāng)采樣率大于0.3 時,對角混合態(tài)效果優(yōu)于一般混合態(tài).對于這種現(xiàn)象,經(jīng)過采用多個不同密度矩陣的驗證,可以得出以下原因:在采樣率較小時,兩種狀態(tài)的估計效果均不理想,但是由于疊加態(tài)密度矩陣中元素數(shù)值相對一般混合態(tài)中的元素數(shù)值較大一些,所以計算出的歸一化距離的值會更大,而采樣率變大后,兩種狀態(tài)的估計效果均逐漸變好,由于疊加態(tài)相對于一般混合態(tài)的密度矩陣結(jié)構(gòu)更為簡單,此時疊加態(tài)的估計效果明顯優(yōu)于一般混合態(tài),其歸一化距離更低.
圖6 LDAMP 網(wǎng)絡(luò)對不同量子態(tài)密度矩陣估計的歸一化距離性能對比Fig.6 Comparison of normalized distance performance of LDAMP network for estimation of density matrices of different quantum states
2)三種采樣率及噪聲固定下不同層數(shù)的LDAMP 網(wǎng)絡(luò)的性能實驗
圖7 為固定噪聲SNR=40 dB,采樣率分別取0.05、0.1和0.2 三種情況下,不同層數(shù)的LDAMP 網(wǎng)絡(luò)估計效果與式(10)和式(11)所示的SE方程的MSE (dB)性能對比的實驗結(jié)果,其中虛線為SE 方程在三個不同采樣率下的性能,實線為本文設(shè)計的LDAMP 網(wǎng)絡(luò)所對應(yīng)的性能Sim.由圖7可以看出,在采樣率低于0.2 時,LDAMP 網(wǎng)絡(luò)在10 層內(nèi)收斂;而采樣率大于0.2 時,對于混合態(tài)和疊加態(tài),LDAMP網(wǎng)絡(luò)則需要更多的層數(shù)達(dá)到收斂,這也與密度矩陣的復(fù)雜度相關(guān),同時表明本文設(shè)計的LDAMP 網(wǎng)絡(luò)的高效性.
圖7 當(dāng)SNR=40 dB 時,不同采樣率下LDAMP 網(wǎng)絡(luò)的仿真(Sim)狀態(tài)演化方程的MSE (dB)性能對比Fig.7 Comparison of MSE (dB) performance between simulation (Sim) and SE analysis of LDAMP network for different sampling ratios with SNR=40 dB
3)固定采樣率在無和有噪聲下對角混合態(tài)的估計性能對比實驗
圖8 為固定采樣率0.1,在無和分別含SNR=30 dB和SNR=40 dB 測量噪聲的情況下,對角混合態(tài)真實密度矩陣ρ3測量值的柱狀圖.圖8 中3 個測量值之間的對比表現(xiàn)出不同大小測量噪聲對真實測量值的影響效果.由圖8 可以看出,30 dB 明顯比40 dB 等級的噪聲影響更大,這種影響持續(xù)體現(xiàn)在對真實量子態(tài)的估計上.
圖8 當(dāng) η=0.1 時,對角混合態(tài)密度矩陣 ρ3 的真實測量值與含噪聲測量值對比Fig.8 Comparison between the real measured values of diagonal mixed state density matrix ρ3 and the measured values with noise inη=0.1
圖9 為相同情況下,對角混合態(tài)真實密度矩陣ρ3與密度矩陣估計、(w=30 dB)和(w=40 dB)的模值元素分布圖.估計出來的3 個密度矩陣與ρ3之間的歸一化距離分別為0.1492、0.3197和0.1614.
圖9 當(dāng) η=0.1 時,對角混合態(tài)密度矩陣 ρ3 及其在無和含測量噪聲下估計矩陣的模值分布Fig.9 Diagonal mixed state density matrix ρ3 and its modulus distribution of estimation matrix without and including measurement noise with η=0.1
4) 3 種采樣率下4 種不同量子態(tài)在不同噪聲的估計性能實驗
為了研究測量噪聲和采樣率對量子態(tài)估計的具體影響,還進(jìn)行了采樣率分別為0.05、0.1和0.2 時,4 種不同量子態(tài)估計后的MSE (dB)隨測量噪聲大小的變化的實驗,實驗結(jié)果如圖10 所示.由圖10可以看出,在采樣率和噪聲水平分別固定時,所有量子態(tài)估計的MSE 均隨另一個未固定量的增加而減小,其中SNR 增加時表示噪聲水平降低.LDAMP 網(wǎng)絡(luò)的性能可以隨著采樣率的增加而提高.不同量子態(tài)的表現(xiàn)也有差異,對于本征態(tài),LDAMP網(wǎng)絡(luò)在采樣率η=0.1 的情況下,就能夠獲得優(yōu)良的性能.而對于其他3 種量子態(tài),則需要增加采樣率來達(dá)到期望的估計效果.
圖10 不同采樣率下LDAMP 網(wǎng)絡(luò)對4 種量子態(tài)密度矩陣估計時的MSE 性能Fig.10 MSE performance of the LDAMP network for the estimation of four quantum state density matrices with different sampling ratios
本文訓(xùn)練出一個具有20 層的降噪卷積神經(jīng)網(wǎng)絡(luò)(DnCNN),與基于去噪的近似消息傳遞(DAMP)算法相結(jié)合,設(shè)計出一個10 層的基于學(xué)習(xí)去噪的近似消息傳遞(LDAMP)網(wǎng)絡(luò),并將其應(yīng)用于量子狀態(tài)估計中.本文提出的LDAMP 網(wǎng)絡(luò)在量子態(tài)估計中的性能,優(yōu)于基于壓縮感知理論最先進(jìn)的三維塊匹配近似消息傳遞BM3D-AMP 信號恢復(fù)算法和ADMM 算法,為采用深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行量子態(tài)估計開辟了一條新的路徑.更加深入的研究是帶有虛部的深度學(xué)習(xí)網(wǎng)絡(luò)的量子態(tài)估計,以及實現(xiàn)在線量子態(tài)估計[40]的深度學(xué)習(xí)網(wǎng)絡(luò)的實現(xiàn).