胡宏昌,王佳琪
(湖北師范大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖北 黃石 435002)
由于在測(cè)量數(shù)據(jù)的采集、錄入及處理過程中,不可避免地受到外界條件、人為因素等的影響,導(dǎo)致觀測(cè)誤差不是正態(tài)分布,而采用P-范分布描述更為合理。盡管P-范分布描述觀測(cè)誤差時(shí)具有明顯的優(yōu)越性,但其概率密度函數(shù)的表達(dá)式較為復(fù)雜,在對(duì)其進(jìn)行理論分析和實(shí)際應(yīng)用研究時(shí),具有一定的困難。因此找到一個(gè)形式比較簡(jiǎn)單的函數(shù)來近似地代替P-范分布的密度函數(shù)是很有必要的。為了使P-范分布的相關(guān)問題得到簡(jiǎn)化,文獻(xiàn)[1]利用密度函數(shù)較為簡(jiǎn)單的正態(tài)分布、拉普拉斯分布以及均勻分布的線性組合來近似地表示P-范分布,這種表示方法能夠近似到四階矩,那么可以認(rèn)為f1(x)與f2(x)近似相等。雖然這種近似對(duì)其理論分析和實(shí)際應(yīng)用的研究都是十分有利的,然而在理論上這種觀點(diǎn)存在明顯的缺陷(由兩種分布的前四階矩相同不能推出這兩種分布相同)。
盡管對(duì)于P-范分布的深入研究成果有很多(如文獻(xiàn)[1~6]等),然而涉及其檢驗(yàn)問題的研究不多(只有文獻(xiàn)[5]涉及P-范分布的參數(shù)假設(shè)檢驗(yàn)問題)。為了彌補(bǔ)文獻(xiàn)[1]的不足和拓寬P-范分布的研究范圍,本文采用柯爾莫哥洛夫檢驗(yàn)方法對(duì)近似P-范分布進(jìn)行非參數(shù)假設(shè)檢驗(yàn),以此來驗(yàn)證近似P-范分布的擬合效果。
定義1[4]若隨機(jī)向量X的密度函數(shù)為
(1)
注1 易得一元P-范分布的密度函數(shù)的數(shù)學(xué)期望為μ,方差為σ2,偏態(tài)系數(shù)為0,峰態(tài)系數(shù)為
注2 拉普拉斯分布(p=1)、正態(tài)分布(p=2)、均勻分布(p→∞)和退化分布(p→0)均為P-范分布的特例。
設(shè)有兩個(gè)隨機(jī)變量X1和X2,其密度函數(shù)分別為f1(x)和f2(x).如果它們的數(shù)學(xué)期望、方差、偏態(tài)系數(shù)及峰態(tài)系數(shù)均相等,那么可以近似地認(rèn)為X1和X2具有相同的統(tǒng)計(jì)性質(zhì),而且f1(x)與f2(x)近似相等(參見文獻(xiàn)[1].雖然這種觀點(diǎn)存在明顯的缺陷,但本文還是采用這種近似)。
當(dāng)1≤p≤2時(shí),有0≤γ2≤3,因此可以用
f(x)=(1-ε)fN(x)+εfL(x)
(2)
來近似地表示fp(x),其中fN(x)與fL(x)分別為正態(tài)分布與拉普拉斯分布的密度函數(shù),表達(dá)式分別為
顯然,f(x)、fN(x)、fL(x)具有相同的數(shù)學(xué)期望μ和方差σ2,且偏態(tài)系數(shù)均為0.而f(x)的峰態(tài)系數(shù)為
因此只要令
則fp(x)與f(x)具有相同的數(shù)學(xué)期望、方差、偏態(tài)系數(shù)、峰態(tài)系數(shù)。即用f(x)代替fp(x)可以準(zhǔn)確到四階矩。
當(dāng)2≤p<∞時(shí),fp(x)的峰態(tài)系數(shù)介于正態(tài)分布與均勻分布的峰態(tài)系數(shù)之間,因此可以用正態(tài)分布與均勻分布的組合來近似地表示,即
f(x)=(1-ε)fN(x)+εfR(x)
(3)
其中
由于分布f(x)的峰態(tài)系數(shù)為
所以令
則fp(x)與f(x)具有相同的數(shù)學(xué)期望、方差、偏態(tài)系數(shù)和峰態(tài)系數(shù),即用f(x)代替fp(x)也可以準(zhǔn)確到四階矩。
下面利用特征函數(shù)來討論上文兩種近似P-范分布的隨機(jī)變量序列和的極限分布。
定理1 若ξ服從近似P-范分布(1≤p≤2), 其簡(jiǎn)單隨機(jī)子樣序列ξ1,ξ2,…,ξn,且nε→0,則
證明 當(dāng)1≤p≤2時(shí),P-范分布可由正態(tài)分布與拉普拉斯分布的密度函數(shù)近似表示。易知正態(tài)分布與拉普拉斯分布的特征函數(shù)分別為
因此近似P-范分布的特征函數(shù)為
下證當(dāng)nε→0時(shí),上述二項(xiàng)式的展開式中第二項(xiàng)到第n項(xiàng)均為第一項(xiàng)的無窮小量。事實(shí)上,由于
所以
即為N(nμ,nσ2)的特征函數(shù)。
定理2 若ξ服從近似P-范分布(2≤p≤∞),其簡(jiǎn)單隨機(jī)子樣序列ξ1,ξ2,…,ξn,且nε→0,則
證明 當(dāng)2≤p≤∞時(shí),P-范分布可由正態(tài)分布與均勻分布的密度函數(shù)近似表示。類似于定理1,在此略。
情形一 當(dāng)p=1.5時(shí),隨機(jī)生成120個(gè)服從P-范分布的隨機(jī)數(shù),這里檢驗(yàn)假設(shè)為
H0∶F(x)=F0(x)=(1-ε)Fn(x)+εFL(x)?H1∶F(x)≠F0(x)
為了根據(jù)子樣觀測(cè)值得到統(tǒng)計(jì)量Dn的值,把必要的計(jì)算結(jié)果列入表1中。
表1 當(dāng)p=1.5時(shí),統(tǒng)計(jì)量Dn及其相關(guān)值
續(xù)表1
從表1中|F(xi)-Fn(xi)|和|F(xi)-Fn(xi+1)|兩列可以得到統(tǒng)計(jì)量D120=0.110176,查柯爾莫哥洛夫檢驗(yàn)臨界值表(嚴(yán)格地來說是極限分布函數(shù)數(shù)值表)得到
由此可推斷不能拒絕原假設(shè),因此認(rèn)為原假設(shè)H0成立。
情形二 當(dāng)p=3時(shí),生成120個(gè)服從P-范分布的隨機(jī)數(shù),這里檢驗(yàn)假設(shè)為
H0∶F(x)=F0(x)=(1-ε)Fn(x)+εFR(x)?H1∶F(x)≠F0(x)
類似于情形一的計(jì)算可得
D120,0.10=0.11137>D120=0.102373
因此認(rèn)為原假設(shè)H0成立。
綜上,通過運(yùn)用柯爾莫哥洛夫擬合檢驗(yàn)的方法,分別對(duì)兩個(gè)近似P-范分布進(jìn)行非參數(shù)假設(shè)檢驗(yàn)。結(jié)果顯示,兩個(gè)近似P-范分布均通過檢驗(yàn),從而從分布的角度說明了近似P-范分布能夠替代P-范分布。