李 瓊,武 東
二維正態(tài)分布在數(shù)學(xué)、物理與工程等領(lǐng)域具有十分重要的概率分布,由于該分布函數(shù)具有很多很好的性質(zhì),在諸多涉及統(tǒng)計(jì)科學(xué)、離散科學(xué)等領(lǐng)域都有重要的影響力.例如圖像處理中的Gaussian濾波器;醫(yī)學(xué)中的同質(zhì)群體的紅細(xì)胞數(shù)與血紅蛋白量,成年男子的身高與體重,經(jīng)濟(jì)學(xué)中的總消費(fèi)與總支出.相關(guān)系數(shù)是反映變量之間相關(guān)程度的一種度量,在一定程度上反映了變量之間的相互關(guān)系.獲得樣本相關(guān)系數(shù)的性質(zhì)在實(shí)際中十分重要.趙志文等[1]利用多元函數(shù)的中心極限定理推斷了二維正態(tài)總體的樣本相關(guān)系數(shù)具有漸近正態(tài)性并獲得了其漸近分布.宋立新[2]和葉萌等[3]在樣本相關(guān)系數(shù)具有漸近正態(tài)性的前提下給出了二維正態(tài)總體相關(guān)系數(shù)的假設(shè)檢驗(yàn)方法.文獻(xiàn)[4]研究了二維正態(tài)分布樣本Gini相關(guān)系數(shù)的均值和方差的漸近性.文獻(xiàn)[5]研究了正態(tài)總體情況下次序統(tǒng)計(jì)量相關(guān)系數(shù)的漸近性質(zhì).文獻(xiàn)[6]研究了一些非正態(tài)總體情況下相關(guān)系數(shù)的統(tǒng)計(jì)推斷.但上述情況都未討論二維正態(tài)總體部分參數(shù)已知情況下樣本相關(guān)系數(shù)的漸近性.鑒于此,本文討論了正態(tài)總體參數(shù)已知和未知情況下,二維正態(tài)總體樣本相關(guān)系數(shù)的漸近正態(tài)性,當(dāng)樣本容量很大時(shí)為使用二維正態(tài)總體樣本相關(guān)系數(shù)進(jìn)行假設(shè)檢驗(yàn)與區(qū)間估計(jì)提供了理論依據(jù)和方法.
引理1[7]若隨機(jī)向量(X1,X2,…,Xp)T服從p維正態(tài)分布Np(μ,Σ),這里μ=(μ1,…,μp)T,Σ=(σij),則關(guān)于均值的四階矩為
引理2[7-8]令U是具有m階矩的隨機(jī)向量序列,b為常數(shù)向量,并滿足N(0,Σ),n→∞.令f(u)是向量u的向量值函數(shù)且fj(u) 在u=b有非零微分,并令是Φb的第(i,j)個(gè)元素,則有極限分布
定理1[9]設(shè)總體(X,Y)T服從二維正態(tài)分布N(0,0,1,1,ρ),其概率密度為
其中(x,y)T∈R2,(X1,Y1)T,(X2,Y2)T,…,(Xn,Yn)T是來(lái)自二維正態(tài)總體(X,Y)T的n個(gè)樣本.
假設(shè)(X,Y)T的所有矩有限,定義
則當(dāng)n→∞時(shí),
同理cov(X,Y3)=2ρ.
f(b)=ρ,則的極限分布的方差為
說(shuō)明:定理1僅討論了特殊情形下二維正態(tài)分布樣本相關(guān)系數(shù)的漸近分布,下面討論一般情況下二維正態(tài)分布樣本相關(guān)系數(shù)有關(guān)漸近分布的相關(guān)結(jié)果.
定理2 設(shè)總體(X,Y)T服從二維正態(tài)分布其概率密度為
若(X1,Y1)T,(X2,Y2)T,…,(Xn,Yn)T是 來(lái) 自二維正態(tài)總體(X,Y)T的n個(gè)樣本.假設(shè)(X1,Y1)T所有必要的矩均有限,則
因此得到
定理3 條件同定理2,并定義
則當(dāng)n→∞時(shí),
證明 我們有
在定理2中,已經(jīng)證明了上式的第一項(xiàng)按分布收斂到N(0,1+ρ2) asn→∞.而對(duì)于第二項(xiàng),根據(jù)中心極限定理和大數(shù)定律,可得
運(yùn)用Slutsky定理,可得
綜合上述情況,并運(yùn)用Slutsky定理,可得
定理4 條件同定理2,假設(shè)(X,Y)T的所有 矩 有 限,定 義記則 隨 機(jī) 向 量的極限分布為三元正態(tài)分布其中Σ=
證明 運(yùn)用中心極限定理可得到
綜合上述內(nèi)容并運(yùn)用Slutsky定理,可得
由大數(shù)定律,可得
再由定理3和中心極限定理即可得證.
定理5 條件同定理2,并定義
則當(dāng)n→∞時(shí),
眾所周知,在統(tǒng)計(jì)學(xué)領(lǐng)域正態(tài)分布的地位舉足輕重,主要是因?yàn)榇罅楷F(xiàn)象或隨機(jī)變量都可用正態(tài)分布描述;當(dāng)樣本量很大時(shí),統(tǒng)計(jì)量的極限分布通常用正態(tài)分布刻畫.二維正態(tài)分布總體樣本相關(guān)系數(shù)通常是進(jìn)行回歸分析、主成分分析和因子分析的前提,鑒于此,文章較為詳細(xì)地研究了部分參數(shù)已知和所有參數(shù)未知情況下二維正態(tài)總體的樣本相關(guān)系數(shù)及其漸近正態(tài)性等大樣本理論.為進(jìn)一步研究和應(yīng)用二維正態(tài)分布的樣本相關(guān)系數(shù)的假設(shè)檢驗(yàn)和區(qū)間估計(jì)奠定研究基礎(chǔ).例如,利用定理3可以構(gòu)造部分參數(shù)已知時(shí)二維正態(tài)總體的相關(guān)系數(shù)的檢驗(yàn)統(tǒng)計(jì)量或構(gòu)造漸近置信區(qū)間,而定理5可以構(gòu)造所有參數(shù)未知時(shí)二維正態(tài)總體的相關(guān)系數(shù)的檢驗(yàn)統(tǒng)計(jì)量或漸近置信區(qū)間.