張淑儀 席政軍
(陜西師范大學(xué)計算機(jī)科學(xué)學(xué)院 西安 710062)
在經(jīng)典信息論中,Shannon互信息是刻畫兩個隨機(jī)變量相互之間獨(dú)立程度的度量,在信道編碼中有很重要的應(yīng)用且給出了信道容量[1].在量子信息論中,通過von Neumann熵形式給出了互信息的基本定義(與Shannon互信息對應(yīng),本文稱作von Neumann互信息,通常也稱作量子互信息[2]).在量子信息處理中,von Neumann互信息可以描述兩體量子態(tài)上的全部關(guān)聯(lián)[3],也用于量子信道容量的刻畫[4-5],并在量子資源理論中有非常好的應(yīng)用[6].von Neumann互信息可以由量子相對熵給出4種等價的定義.在量子信道容量的研究中,結(jié)合信道的n次重復(fù)使用(獨(dú)立同分布)基于量子互信息來描述信道容量.而實(shí)際中較大量子系統(tǒng)上的操作難以實(shí)現(xiàn)且獨(dú)立同分布的量子態(tài)難以制備等限制,一般考慮帶有誤差的有限情形或者one-shot情形(也就是n=1的情形).在one-shot量子信息論中,涉及到帶參數(shù)的熵,量子假設(shè)檢驗(yàn)相對熵就是非常重要的一類帶參數(shù)的熵.量子假設(shè)檢驗(yàn)相對熵來自于量子假設(shè)檢驗(yàn),量子假設(shè)檢驗(yàn)類似于2個量子態(tài)的區(qū)分問題.量子假設(shè)檢驗(yàn)是量子信息處理中的基本問題[7-8],已得到很好的發(fā)展和應(yīng)用[9-18].
文獻(xiàn)[19]在前人工作的基礎(chǔ)上集中討論了量子假設(shè)檢驗(yàn)相對熵,較為系統(tǒng)地研究了其性質(zhì),給出了在one-shot經(jīng)典-量子信道容量中的應(yīng)用.文獻(xiàn)[20]給出了與文獻(xiàn)[19]等價的另一個量子假設(shè)檢驗(yàn)相對熵,得到了與其他廣義熵之間的關(guān)系.文獻(xiàn)[21]基于量子假設(shè)檢驗(yàn)相對熵[19]定義了量子假設(shè)檢驗(yàn)條件熵,刻畫了具有量子邊信息的數(shù)據(jù)壓縮,得到了最小壓縮長度的上下界.該文獻(xiàn)也給出了量子假設(shè)檢驗(yàn)相對熵和其他相對熵之間的一些關(guān)系.在量子假設(shè)檢驗(yàn)相對熵的研究相對成熟的情形下,一個自然的問題是:用量子假設(shè)檢驗(yàn)相對熵給出量子版本互信息的定義是否等價?如果不等價,是否存在序關(guān)系?本文將采用文獻(xiàn)[19]中關(guān)于量子假設(shè)檢驗(yàn)相對熵的定義,較為系統(tǒng)地研究其性質(zhì),并討論與其他相對熵之間的關(guān)系.在Shannon互信息中,由于貝葉斯概率,容易得到條件熵和互信息的鏈?zhǔn)椒▌t,但是目前還不清楚量子假設(shè)檢驗(yàn)相對熵版本的互信息是否存在鏈?zhǔn)椒▌t。本文將重點(diǎn)研究基于量子假設(shè)檢驗(yàn)相對熵的互信息定義及其相應(yīng)的性質(zhì).
本文均使用以2為底的對數(shù).若2個隨機(jī)變量(X,Y)服從聯(lián)合分布pxy,則Shannon聯(lián)合熵定義為
可以定義一個隨機(jī)變量在給定另一隨機(jī)變量下的條件熵,即
結(jié)合貝葉斯概率公式pxy=pxpy|x,得到聯(lián)合熵和條件熵的鏈?zhǔn)椒▌t,即
H(X,Y)=H(X)+H(Y|X).
(1)
對于同一字符集上的2個概率密度函數(shù)為px和qx,它們的相對熵定義為
(2)
I(X;Y)=D(pxy‖pxpy).
(3)
Shannon互信息刻畫一個隨機(jī)變量包含另一個隨機(jī)變量的信息量,也描述已知另一隨機(jī)變量所含有的信息量下原隨機(jī)變量不確定度的減少量.結(jié)合Shannon熵的定義,Shannon互信息表示為
I(X;Y)=D(pxy‖pxpy)=
H(X)+H(Y)-H(X,Y)=
H(X)-H(X|Y)=
H(Y)-H(Y|X).
(4)
這里,I(X;Y)=H(X)-H(X|Y)和I(X;Y)=H(Y)-H(Y|X)這2個等式是雙隨機(jī)變量互信息的鏈?zhǔn)椒▌t.
因?yàn)榱孔恿W(xué)中并沒有與在不同時間變量的2個變量的聯(lián)合概率分布類似的概念[2-3],從而對于兩體量子態(tài)ρAB,并沒有類似于pxy=pxpy|x的量子態(tài)表示形式,即ρAB≠ρA?ρB|A,其中ρA=trB(ρA)是約化密度算子,類似于邊際概率分布.算子ρB|A并不是條件量子態(tài),甚至不是量子態(tài).因此,沒有類似于Shannon條件熵的量子條件熵的直接定義.結(jié)合鏈?zhǔn)椒▌t(1),對于任意的兩體量子態(tài)ρAB,基于子系統(tǒng)B的von Neumann條件熵定義為
S(A|B)=S(ρAB)-S(ρB).
(5)
顯然,量子信息論中的von Neumann條件熵只是在形式上類似于經(jīng)典信息論中的Shannon條件熵,在本質(zhì)上它們之間有很大的區(qū)別,比如:當(dāng)兩體量子態(tài)為糾纏態(tài)時,S(A|B)<0.這說明von Neumann條件熵可以為負(fù).von Neumann互信息定義為
I(A:B)=S(ρA)+S(ρB)-S(ρAB).
(6)
von Neumann條件熵和互信息在形式上都與Shannon條件熵和互信息保持一致.特別地,von Neumann互信息也有等式組(4)表示,具體討論在第3節(jié).
量子假設(shè)檢驗(yàn)問題涉及2個假設(shè):
1)零假設(shè)(null hypothesis)H0:ρ?n,
2)備則假設(shè)(alternative hypothesis)H1:σ?n,
其中ρ?n=ρ?…?ρ和σ?n=σ?…?σ表示量子態(tài)的n次獨(dú)立同分布(independent and identically distributed,i.i.d.)的拷貝態(tài).需要解決的問題是基于量子測量結(jié)果確定哪一個假設(shè)是真的.量子測量由一個POVM(positive operator valued measure,POVM)來描述.本文僅考慮二值的POVM,相應(yīng)的測量算子元為Mn和In-Mn,分別對應(yīng)假設(shè)H0和H1的接受,從而產(chǎn)生2類誤差概率:
αn(Mn)=tr((In-Mn)ρ?n),
βn(Mn)=tr(Mnσ?n),
其中,α(M)是當(dāng)假設(shè)H0為真時接受假設(shè)H1的概率,β(M)是當(dāng)假設(shè)H1為真時接受H0的概率.類似于經(jīng)典假設(shè)檢驗(yàn)問題,通常希望同時最小化這2類概率,但是它們之間存在均衡關(guān)系.一般情況下,約束其中一個誤差概率而對另一個進(jìn)行最小化.若第1類誤差概率被限制在很小的參數(shù)ε∈(0,1)內(nèi),討論第2類誤差概率的最小化,量子Stein’s引理給出了漸近情形下關(guān)于誤差概率的最佳可達(dá)誤差指數(shù)[8-9],即
在非漸近情形下,對第1類誤差概率限制下第2類誤差概率的變化趨勢是由量子假設(shè)檢驗(yàn)相對熵來描述的.本文后面的討論僅考慮單次拷貝的情形,且采用文獻(xiàn)[19]中量子假設(shè)檢驗(yàn)相對熵的定義.
(7)
(8)
類似于von Neumann熵,該量化可以看做是量子假設(shè)檢驗(yàn)熵.
量子假設(shè)檢驗(yàn)相對熵滿足數(shù)據(jù)處理不等式,也就是量子操作不會引起量子假設(shè)檢驗(yàn)相對熵增加[19,22],即對于任意的量子操作Λ都有
進(jìn)一步地,如果考慮n次獨(dú)立同分布的情形,當(dāng)n充分大時,量子假設(shè)檢驗(yàn)相對熵等于量子相對熵[18],也就是漸近均分性(asymptotic equipartition property,AEP),即
(9)
結(jié)合文獻(xiàn)[20]的方法,基于定義1,使用von Neumann相對熵容易給出量子假設(shè)檢驗(yàn)相對熵的一個上界,即
(10)
其中Hb(ε)=-εlb(ε)-(1-ε)lb(1-ε)為二元Shannon熵.
量子假設(shè)檢驗(yàn)相對熵依賴于參數(shù)ε,量子態(tài)的ε-鄰域發(fā)生變化,有可能導(dǎo)致量子假設(shè)檢驗(yàn)相對熵發(fā)生變化.通過簡單的計算可得性質(zhì)1~4.
性質(zhì)1.
(11)
b.設(shè)ε1,ε2∈[0,1],且ε1<ε2,有
(12)
該結(jié)果的詳細(xì)證明見文獻(xiàn)[22]不等式(11)表明:隨著備擇假設(shè)的增強(qiáng),第2類誤差概率變大.而不等式(12)表明:誤差參數(shù)的越小限制,第2類誤差概率反而變大.性質(zhì)1給出了備擇假設(shè)的變化引起的第2類誤差概率的變化,結(jié)合文獻(xiàn)[20]的結(jié)果,容易給出零假設(shè)的微小變化和參數(shù)變化共同引起第2類誤差概率的變化情形.
(13)
及
(14)
其中,δ∈(0,1-ε).
從定義1可知,量子假設(shè)檢驗(yàn)相對熵本質(zhì)上就是一個期望值,通過零假設(shè)的一些特定限制,可以直接估算量子假設(shè)檢驗(yàn)相對熵的界.文獻(xiàn)[23]首先給出了這方面的討論.
性質(zhì)3.設(shè)ρ為任意滿秩態(tài),σ為任意量子態(tài),且0≤ε<λmin(ρ),有
(15)
其中,λmin(ρ)是量子態(tài)ρ的最小特征值.
性質(zhì)3僅是針對零假設(shè)為滿秩態(tài)的情形,性質(zhì)4給出一般量子態(tài)的情形.
(16)
其中,λi(ρ)為ρ的特征值.
結(jié)合不等式tr(Mρ)≥1-ε,有
從而可得
則可以得到
從而命題得證.
證畢.
在經(jīng)典信息論中,對于聯(lián)合概率分布,依賴于貝葉斯概率,得到條件熵等于聯(lián)合熵與其中一個邊際分布熵的差,也就是條件熵鏈?zhǔn)椒▌t(1).在量子信息論中,并不存在條件量子態(tài),從而不能直接推廣經(jīng)典條件熵的定義.如果考慮條件量子態(tài),只能基于某一個子系統(tǒng)上的測量獲得另一個子系統(tǒng)上的量子態(tài).但是兩體量子態(tài)的局部進(jìn)行測量后整體量子態(tài)會發(fā)生改變,測量前后的狀態(tài)可能并不相同.依賴于測量得到的條件量子熵一般并不等于von Neumann條件熵(5).研究發(fā)現(xiàn)它們的差正好能刻畫復(fù)合量子系統(tǒng)上子系統(tǒng)之間的非經(jīng)典關(guān)聯(lián)[3].本節(jié)重點(diǎn)討論von Neumann條件熵的形式,不涉及測量.
量子條件熵可以通過量子相對熵來表示[5,21].對于兩體量子態(tài)ρAB和次歸一化態(tài)IA?σB,它們的von Neumann相對熵為
S(ρAB‖IA?σB)=
-S(ρAB)-tr[ρABlb(IA?σB)]=
-S(ρAB)+S(ρB)+S(ρB‖σB).
(17)
由于本文采用次歸一化態(tài),從而von Neumann條件熵的相對熵表示與文獻(xiàn)[1]的表述略有不一致.以該表示為標(biāo)準(zhǔn)形式,可以方便討論量子假設(shè)檢驗(yàn)相對熵性質(zhì)的條件熵[19-22].
(18)
從定義2易得最優(yōu)化的過程并沒有一個精確解,即
根據(jù)Schatten ∞-范數(shù)的半正定程序[20,22],量子假設(shè)檢驗(yàn)條件熵也可以表示為
(19)
其中,MB=trAMAB.顯然,并不能從等式(19)直接得到量子假設(shè)檢驗(yàn)條件熵的精確解,這與von Neumann條件熵并不一致.但是對于等式(19)繼續(xù)使用半正定程序易得到量子假設(shè)檢驗(yàn)條件熵的許多性質(zhì)以及和其他量化的關(guān)系,比如:數(shù)據(jù)處理不等式.該不等式的成立直接導(dǎo)致增加條件減小熵的結(jié)果.特別地,量子假設(shè)檢驗(yàn)條件熵并沒有類似于Shannon條件熵的鏈?zhǔn)椒▌t(1).
在量子信息論中,對量子系統(tǒng)上的狀態(tài)進(jìn)行測量后會發(fā)生變化,測量前后的狀態(tài)無法保持一致.因此無測量的von Neumann互信息是Shannon互信息形式上的直接推廣.von Neumann互信息只是在形式上保持了Shannon互信息等價形式的一種,但在本質(zhì)還是有所不同的.結(jié)合量子相對熵可以給出von Neumann互信息的4種等價形式,有
(20)
進(jìn)而有
(21)
原問題
s.t.0≤MAB≤IAB
tr(MABρAB)≥1-ε
對偶問題
max(1-ε)η-tr(NAB)
s.t.ηρAB≤NAB+ρA?σB
NAB≥0,η≥0
σB≥0,tr(σB)≤1
.
(22)
從而命題得證.
證畢.
由于量子假設(shè)檢驗(yàn)互信息與誤差參數(shù)有關(guān),結(jié)合量子假設(shè)檢驗(yàn)相對熵性質(zhì)1直接可得量子假設(shè)檢驗(yàn)互信息關(guān)于參數(shù)的序關(guān)系.對于0≤ε<ε′≤1,有
在三體量子系統(tǒng)中,對于von Neumann互信息中,丟棄一個子系統(tǒng),互信息會減少.下面的結(jié)果證明量子假設(shè)檢驗(yàn)相對熵的互信息也具有類似的性質(zhì).
(23)
性質(zhì)6的證明與性質(zhì)5類似.特別地,當(dāng)εA和εB均為恒等映射時,可得
(24)
該關(guān)系說明丟棄子系統(tǒng)減少量子假設(shè)檢驗(yàn)互信息.
經(jīng)典-量子態(tài)在具有量子邊信息的信源編碼中有非常重要的應(yīng)用,也對應(yīng)于經(jīng)典-信道編碼.同時,在考慮基于測量的量子條件熵時,經(jīng)典-量子態(tài)僅擁有經(jīng)典關(guān)聯(lián).結(jié)合量子假設(shè)檢驗(yàn)條件熵,下面討論三體經(jīng)典-量子態(tài)的情形.
其中,dX是經(jīng)典系統(tǒng)X的維數(shù).
進(jìn)而可得
類似地可以給出經(jīng)典-量子態(tài)的量子假設(shè)檢驗(yàn)條件熵的上下界,即
其中,c=|supp{px}|表示概率分布px的支集維數(shù).
下面的結(jié)果給出量子假設(shè)檢驗(yàn)互信息與量子最大互信息之間的關(guān)系.
結(jié)合文獻(xiàn)[20-21]中結(jié)果,使用本文量子假設(shè)檢驗(yàn)相對熵的定義,通過基本的代數(shù)運(yùn)算可以完成證明.與之類似的結(jié)果,結(jié)合不等式(10),下面的結(jié)果給出量子假設(shè)檢驗(yàn)互信息和von Neumann互信息的關(guān)系,即
(25)
根據(jù)量子條件熵和量子互信息可以由量子相對熵表示,可知量子條件熵與量子互信息有量子互信息的鏈?zhǔn)疥P(guān)系,即
I(A:B)=S(ρA)+S(ρB)-S(ρAB)=
S(ρB)-S(B|A)=S(ρA)-S(A|B).
(26)
一般情況下,基于其他熵度量定義的互信息并不一定有等式(26)成立[20-21,24-25].下面討論量子假設(shè)檢驗(yàn)互信息的鏈?zhǔn)疥P(guān)系.首先基于量子假設(shè)檢驗(yàn)相對熵定義單系統(tǒng)上量子假設(shè)檢驗(yàn)最大熵.
(27)
(28)
最后通過簡單的代數(shù)運(yùn)算,進(jìn)而完成命題的證明.
證畢.
在該命題的證明過程中,得到了帶限制的量子假設(shè)檢驗(yàn)熵,該熵的測量算子依賴于條件熵的最佳測量,顯然易得
另外,該命題僅給出了一個下界,但上界的證明目前還是一個開放的問題.雖然能給出互信息和條件熵的上下界,但是難以給出一個緊湊的鏈?zhǔn)疥P(guān)系.
在量子信息論中,基于von Neumann熵,可以得到類似于經(jīng)典信息論中Shannon熵的好多有用量化和關(guān)系,在量子信息處理中有非常重要的應(yīng)用.存在一些其他的熵在量子信息中的推廣,但并不像von Neumann熵具有良好的性質(zhì)或者關(guān)系,可關(guān)鍵是這些熵在one-shot量子信息論中有非常好的應(yīng)用,比如假設(shè)檢驗(yàn)相對熵.我們詳細(xì)介紹了量子假設(shè)檢驗(yàn)相對熵及其相關(guān)性質(zhì),并得到了新的上界.然后基于量子假設(shè)檢驗(yàn)相對熵討論了條件熵,得到量子假設(shè)檢驗(yàn)相對熵形式的條件熵并沒有類似Shannon熵或von Neumann熵的鏈?zhǔn)疥P(guān)系,這是由于假設(shè)檢驗(yàn)相對熵或者新定義的最大熵都依賴于最優(yōu)化.由于糾纏的存在同時并不存在量子版本的貝葉斯公式.對于量子假設(shè)檢驗(yàn)相對熵,我們給出了4種不完全等價的互信息定義.結(jié)合在信息處理中常用的條件熵,主要討論了其中一類互信息,得到了一些有意思的性質(zhì),并給出了和其他互信息之間的關(guān)系.給出了經(jīng)典-量子態(tài)的量子假設(shè)檢驗(yàn)互信息的上下界,得到了量子假設(shè)檢驗(yàn)互信息類似于Shannon熵或von Neumann熵的互信息鏈?zhǔn)疥P(guān)系.