馬 鐘,魏 璐,姚璐陽,王云江
(1.西安微電子技術(shù)研究所,陜西 西安710065;2.西安電子科技大學(xué)ISN國家重點(diǎn)實(shí)驗(yàn)室,陜西 西安710071)
量子糾錯(cuò)編碼是保障量子通信傳輸與量子信息處理可靠性的關(guān)鍵手段。目前,關(guān)于量子糾錯(cuò)編碼的研究主要集中在量子穩(wěn)定子碼領(lǐng)域,特別是拓?fù)淞孔蛹m錯(cuò)碼更是近年來量子糾錯(cuò)編碼領(lǐng)域的熱點(diǎn)問題。拓?fù)淞孔哟a不僅具有容錯(cuò)閾值高、糾錯(cuò)能力強(qiáng)的特點(diǎn),更因?yàn)槠鋬H僅需要相鄰量子比特間的關(guān)聯(lián)操控,使其成為未來最有望硬件實(shí)現(xiàn)的量子糾錯(cuò)編碼方案。然而,除了具有理論較優(yōu)的性能,是否具有高效的譯碼算法也是量子糾錯(cuò)碼能否真正落地實(shí)現(xiàn)的關(guān)鍵。這是因?yàn)?,相比?jīng)典糾錯(cuò)碼,量子糾錯(cuò)碼更容易受到外界的干擾,造成信息的塌縮。而高效快速的譯碼策略可以有效縮短譯碼時(shí)間,從而極大地降低譯碼過程中的錯(cuò)誤引入,這對于量子信息的快速處理與可靠存儲(chǔ)至關(guān)重要。
目前,對于拓?fù)淞孔哟a而言,其應(yīng)用最廣泛的譯碼算法是基于圖論的最小權(quán)重最佳匹配譯碼算法(Minimum Weight Perfect Matching,MWPM)[1]。其基本思想是將拓?fù)淞孔蛹m錯(cuò)碼上的最有可能錯(cuò)誤映射作為該碼所對應(yīng)拓?fù)鋱D中與錯(cuò)誤圖樣相對應(yīng)的最短距離。然而,由于量子糾錯(cuò)碼獨(dú)特的簡并錯(cuò)誤以及MWPM在錯(cuò)誤相關(guān)性上探測的局限性,其譯碼效果性能仍未能達(dá)到人們的期望。
近年來,機(jī)器學(xué)習(xí)正逐步被引入到量子信息與量子計(jì)算中來。已有的研究成果表明,借助機(jī)器學(xué)習(xí)可以有效地解決量子信息處理中的若干難題??紤]到量子譯碼算法的重要性,基于神經(jīng)網(wǎng)絡(luò)的譯碼技術(shù)正逐步引起人們的關(guān)注[2-3]。例如,對于拓?fù)淞孔哟a而言,文獻(xiàn)[4]提出了一種基于全連接神經(jīng)網(wǎng)絡(luò)的拓?fù)淞孔哟a的譯碼策略。在該策略中,通過給定訓(xùn)練樣本與標(biāo)簽,可以探測錯(cuò)誤之間的相關(guān)性,明顯緩解MWPM算法所固有的譯碼缺陷。
然而,全連接網(wǎng)絡(luò)在應(yīng)用于拓?fù)淞孔哟a的譯碼時(shí),存在譯碼復(fù)雜度高、耗時(shí)相對較長的問題,這對拓?fù)淞孔哟a在實(shí)際中的應(yīng)用十分不利。一方面,卷積神經(jīng)網(wǎng)絡(luò)由于所需的參數(shù)相對較少,在圖像分析和處理領(lǐng)域有廣泛應(yīng)用;另一方面,拓?fù)淞孔哟a是一種基于拓?fù)浣Y(jié)構(gòu)的量子糾錯(cuò)碼,其在平面上的展開就是一個(gè)個(gè)的二維結(jié)構(gòu),有著圖的結(jié)構(gòu)特點(diǎn),這給了我們將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用在拓?fù)浯a譯碼器上的新思路。
為此,在本文中,考慮基于卷積神經(jīng)網(wǎng)絡(luò)開展拓?fù)淞孔幼g碼算法的設(shè)計(jì),并通過實(shí)驗(yàn)仿真對構(gòu)造的卷積神經(jīng)網(wǎng)絡(luò)譯碼器進(jìn)行測試與驗(yàn)證。實(shí)驗(yàn)表明,本文所提的譯碼器同樣可以克服MWPM所存在的不能有效識(shí)別量子錯(cuò)誤的相關(guān)性這一問題,譯碼性能獲得明顯提升。并且由于相對全連接神經(jīng)網(wǎng)絡(luò)所需的參數(shù)更少,因而譯碼時(shí)效性也更強(qiáng)。
量子穩(wěn)定子碼(Quantum Stabilizer Code)也稱加性量子碼,是目前量子糾錯(cuò)碼的研究主流[5-9],其結(jié)構(gòu)類似于經(jīng)典線性碼,其碼字空間是由所有穩(wěn)定子生成子的本征值為1的共同本征態(tài)所構(gòu)成[5-8]。這里所謂的穩(wěn)定子是由Pauli算子的乘積構(gòu)成,對于量子穩(wěn)定子碼而言,要求所有的生成子彼此間相互對易,其角色相當(dāng)于經(jīng)典線性碼的校驗(yàn)矩陣[8]。
量子糾錯(cuò)碼中的錯(cuò)誤種類很多,但Shor和Steane將復(fù)雜的量子態(tài)錯(cuò)誤簡化為單個(gè)量子位上的比特翻轉(zhuǎn)錯(cuò)誤、相位翻轉(zhuǎn)錯(cuò)誤和比特翻轉(zhuǎn)加相位翻轉(zhuǎn)錯(cuò)誤,分別對應(yīng)X、Y、Z三個(gè)Pauli矩陣[5]。隨后,Preskill指出單量子比特上發(fā)生的任意錯(cuò)誤,都可能被視為以上三種錯(cuò)誤的線性組合。這樣對量子比特上錯(cuò)誤的糾正,演變成對其上發(fā)生的X、Y、Z這三種錯(cuò)誤的識(shí)別。
拓?fù)淞孔哟a(Topological Quantum Code)是具有良好抵抗噪聲能力的一類穩(wěn)定子碼[9-10],區(qū)別于其他穩(wěn)定子碼的顯著特點(diǎn)是其穩(wěn)定子生成子的幾何局部性。換句話說,該碼的物理比特以規(guī)則的拓?fù)浣Y(jié)構(gòu)相互關(guān)聯(lián)構(gòu)成,且在某個(gè)幾何區(qū)域內(nèi),每個(gè)穩(wěn)定子的生成子都由恒定數(shù)量的量子比特支撐,例如Toric碼。一般而言,該穩(wěn)定子的非零元素個(gè)數(shù)相對物理量子比特的個(gè)數(shù)要小很多,因此也屬于量子低密度奇偶校驗(yàn)(Low Density Parity Check)碼的一種,常見的拓?fù)浞€(wěn)定子碼包括Toric碼、Surface碼、Color碼以及它們的高維形式。
拓?fù)浯a最佳匹配算法的基本思想是在圖中求最短路徑和[11]。以Toric碼為例,該算法的匹配過程如圖1所示。
(a) 上下、左右兩個(gè)syndrome 之間的最短路徑
圖1(a)和圖1(d)是5×5的Toric碼,其中藍(lán)色標(biāo)識(shí)是穩(wěn)定子測量后得到的錯(cuò)誤圖樣(Syndrome)為-1的位置。依據(jù)編碼理論可知,一個(gè)碼字中發(fā)生少量錯(cuò)誤的概率大于發(fā)生多個(gè)錯(cuò)誤的概率,同樣的結(jié)論也適用于量子糾錯(cuò)碼。Toric碼里,經(jīng)過一個(gè)量子比特(圖1(a)中的空心圓圈)計(jì)為一個(gè)單位長度,圖1(a)中任意兩個(gè)錯(cuò)誤之間的最短距離可以表示成圖的形式,如圖1(b)所示。MWPM算法就是找到圖1(b)中包含所有錯(cuò)誤的最短路徑,如圖1(c)所示,最后再映射回Toric碼上如圖1(d)所示,其中綠色標(biāo)識(shí)就是找到的最短錯(cuò)誤鏈。從這個(gè)匹配過程中可以看出,MWPM算法就是找到能將所有的錯(cuò)誤圖樣串聯(lián)起來的最短路徑。
對于量子穩(wěn)定子碼,之前提到的MWPM譯碼算法并非是最佳的譯碼算法,原因在于其無法最佳地檢測Y錯(cuò)誤,即同一量子比特上的比特翻轉(zhuǎn)錯(cuò)誤和相位翻轉(zhuǎn)錯(cuò)誤的結(jié)合,MWPM譯碼算法將其視為兩個(gè)獨(dú)立的錯(cuò)誤[4,9],忽略了兩者之間的相關(guān)性。雖然可以對該算法進(jìn)行改進(jìn),用來解釋錯(cuò)誤之間的相關(guān)性。但因?yàn)樵跁r(shí)間開銷上較大,它們并不利于實(shí)際應(yīng)用。
幸運(yùn)的是,這些錯(cuò)誤相關(guān)性可以用神經(jīng)網(wǎng)絡(luò)的模式匹配能力來識(shí)別。在文獻(xiàn)[4]中,蔣良教授課題組提出一種基于神經(jīng)網(wǎng)絡(luò)的量子穩(wěn)定子碼譯碼器,其中神經(jīng)網(wǎng)絡(luò)用的是全連接前饋神經(jīng)網(wǎng)絡(luò),隱藏層中的每個(gè)神經(jīng)元都與前后面層中的神經(jīng)元相連,且有多個(gè)隱藏層。該譯碼器在糾錯(cuò)能力上要優(yōu)于經(jīng)典的最小權(quán)重最佳匹配譯碼器。但相應(yīng)的,因?yàn)槿B接的前饋神經(jīng)網(wǎng)絡(luò)層與層之間是完全關(guān)聯(lián)的,一旦網(wǎng)絡(luò)深度增加,參數(shù)量會(huì)非常多,整個(gè)網(wǎng)絡(luò)的計(jì)算量將會(huì)變得非常大,從而給梯度下降法訓(xùn)練全連接網(wǎng)絡(luò)帶來極大困難。
考慮到卷積神經(jīng)網(wǎng)絡(luò)所需的參數(shù)相對較少,在圖像分析和處理領(lǐng)域廣泛應(yīng)用,而拓?fù)淞孔哟a在平面上的展開恰是一個(gè)個(gè)二維結(jié)構(gòu),具有圖的顯著特征。為此,本文基于卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)實(shí)現(xiàn)拓?fù)淞孔哟a的譯碼器,用于識(shí)別量子比特上的錯(cuò)誤關(guān)聯(lián),在提高譯碼性能表現(xiàn)的同時(shí),降低譯碼時(shí)延。基本思路是:以Toric碼的X和Z穩(wěn)定子的測量結(jié)果及其對應(yīng)的錯(cuò)誤作為訓(xùn)練數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò),使其具備預(yù)測Toric碼中的每個(gè)量子比特上發(fā)生X和Z錯(cuò)誤的概率分布的能力,再通過采樣和硬判決取出一個(gè)預(yù)測的錯(cuò)誤,驗(yàn)證該錯(cuò)誤是否能產(chǎn)生同樣的錯(cuò)誤圖樣。如果不能,就重復(fù)采樣,同時(shí)設(shè)置最大迭代次數(shù)。如果超過最大迭代次數(shù)還找不到真正的錯(cuò)誤,就放棄迭代,認(rèn)為此次譯碼失敗。如果成功找到了對應(yīng)的錯(cuò)誤,則認(rèn)為此次譯碼是成功的。具體的譯碼流程如圖2所示。
圖2 基于神經(jīng)網(wǎng)絡(luò)的譯碼流程圖Fig.2 Flowchart of a neural network based decoding
這里的卷積神經(jīng)網(wǎng)絡(luò),需要有有多個(gè)卷積層,這是因?yàn)閱蝹€(gè)卷積層學(xué)到的特征一般比較局限。其中的下采樣層(池化層)用來完成對特征的篩選,以進(jìn)一步減少參數(shù)量。而Softmax層的作用是對全連接層的輸出做歸一化處理,轉(zhuǎn)換為概率輸出。卷積網(wǎng)絡(luò)的輸入是測量所得的錯(cuò)誤圖樣,輸出節(jié)點(diǎn)數(shù)量(輸出層的神經(jīng)元數(shù)量)取為Toric碼量子比特?cái)?shù)的兩倍。
此次仿真實(shí)驗(yàn),考慮不同碼距的Toric碼在所設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)譯碼器下的表現(xiàn)。對于每個(gè)碼距的Toric碼,通過在譯碼器中輸入數(shù)量相同的測量錯(cuò)誤圖樣,判斷并計(jì)算能夠成功找到對應(yīng)錯(cuò)誤的比例。訓(xùn)練數(shù)據(jù)的生成是采用去極化信道,得到相應(yīng)的錯(cuò)誤圖樣和訓(xùn)練數(shù)據(jù)。每個(gè)噪聲下最好的譯碼性能可能出現(xiàn)在不同的參數(shù)設(shè)置下,通過網(wǎng)絡(luò)搜索法進(jìn)行迭代,并把相應(yīng)的譯碼結(jié)果和MWPM譯碼器進(jìn)行對比,如圖3所示。
圖3中橫坐標(biāo)表示信道錯(cuò)誤概率,縱坐標(biāo)表示給定大小相同的驗(yàn)證集,譯碼器成功譯碼的比例,d表示對應(yīng)Toric碼的碼距。由圖3可知,CNN譯碼器的閾值門限約為0.162,較MWPM譯碼器有所上升。譯碼器閾值的提高,也表明CNN譯碼器對噪聲的抵抗能力得到相對提升,能夠容納更高的噪聲。
圖3 不同碼長下,CNN和MWPM譯碼器性能對比Fig.3 Decoding comparison between CNN and MWPM under different coding length
當(dāng)信道錯(cuò)誤概率低于閾值門限時(shí),噪聲小、影響弱,如果擴(kuò)大碼距,雖然譯碼器的譯碼能力是增加的,但是增加的程度會(huì)越來越小。因?yàn)殡S著碼距的擴(kuò)大,會(huì)使碼字的錯(cuò)誤空間迅速增長。而當(dāng)信道錯(cuò)誤概率高于閾值門限時(shí),噪聲的影響過大,嚴(yán)重干擾譯碼器的工作,如果再增加碼距,反而降低譯碼器的譯碼能力。
在相同的噪聲環(huán)境下,CNN譯碼器能夠獲得更高的譯碼性能,原因主要是CNN譯碼器在錯(cuò)誤相關(guān)性上帶來的改善。為了說明這一點(diǎn),圖4中給出在碼距為7時(shí),只用Z穩(wěn)定子和同時(shí)用X和Z穩(wěn)定子的測量結(jié)果分別訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)所得到的譯碼性能圖。
圖4 d=7時(shí)CNN譯碼器探測錯(cuò)誤相關(guān)性對比Fig.4 Comparison of CNN decoders on correlated errors under coding length being 7
在去極化信道下,發(fā)生X錯(cuò)誤和Z錯(cuò)誤是等概的,Y錯(cuò)誤等價(jià)于同時(shí)發(fā)生X錯(cuò)誤和Z錯(cuò)誤;如果X和Z錯(cuò)誤之間沒有相關(guān)性,則兩種錯(cuò)誤就可以看作是獨(dú)立的,圖中的2條曲線應(yīng)該重合。圖4表明,通過卷積神經(jīng)網(wǎng)絡(luò)借助其特有的學(xué)習(xí)能力,能探測出來以上2種錯(cuò)誤的相關(guān)性,改善了譯碼器性能,提高了糾錯(cuò)能力。
卷積神經(jīng)網(wǎng)絡(luò)比起全連接神經(jīng)網(wǎng)絡(luò),一個(gè)顯著特點(diǎn)就是參數(shù)量少,并由于卷積層中的參數(shù)可以共享,同時(shí)池化也降低了計(jì)算量。因此,訓(xùn)練速度相對較快,消耗時(shí)間少。表1為bitch_size=512、d=5時(shí),全連接神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)在相同大小的訓(xùn)練集下訓(xùn)練一輪(epoch)平均所需的時(shí)間,從表中清楚地看出,卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度明顯快于全連接神經(jīng)網(wǎng)絡(luò)。
表1 兩種神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間對比
本文工作進(jìn)一步表明,神經(jīng)網(wǎng)絡(luò)譯碼器相比于傳統(tǒng)MWPM譯碼器在探測錯(cuò)誤相關(guān)性上具備更強(qiáng)的能力,有助于提升譯碼器的糾錯(cuò)能力。卷積神經(jīng)網(wǎng)絡(luò)譯碼器相對于全連接神經(jīng)網(wǎng)絡(luò),參數(shù)量更少,在保證譯碼性能的同時(shí),時(shí)間復(fù)雜度更低。未來的研究可以注重多元化的神經(jīng)網(wǎng)絡(luò)與量子糾錯(cuò)碼的編譯策略相結(jié)合。另外,目前的研究大多假設(shè)穩(wěn)定子的測量過程是準(zhǔn)確的,而實(shí)際中測量結(jié)果本身錯(cuò)誤也難以避免,以上問題都將作為我們未來的研究工作。