魏艷華,王丙參,邢永忠
(天水師范學(xué)院a.數(shù)學(xué)與統(tǒng)計(jì)學(xué)院;b.電子信息與電氣工程學(xué)院,甘肅 天水 741001)
在統(tǒng)計(jì)推斷中,由于目標(biāo)統(tǒng)計(jì)量的真實(shí)分布往往很難獲得,這就對(duì)目標(biāo)量的估計(jì)與檢驗(yàn)造成了很大困難。假設(shè)檢驗(yàn)的推斷基礎(chǔ)是樣本,是一種不完全歸納推斷,盡管在大多數(shù)情況下得到的結(jié)論是正確的,但也有可能犯錯(cuò):一類(lèi)是棄真錯(cuò)誤(第I型錯(cuò)誤),一類(lèi)是存?zhèn)五e(cuò)誤(第II型錯(cuò)誤)。通常,很難獲得統(tǒng)計(jì)量在已知條件(比如原假設(shè)成立或備擇假設(shè)成立條件)下的精確分布或極限分布,因此,也無(wú)法確定接受原假設(shè)的臨界值與犯錯(cuò)的概率。這時(shí),利用蒙特卡洛方法逼近統(tǒng)計(jì)量的分布不失為一種可行辦法,其主要思想是通過(guò)產(chǎn)生參考數(shù)據(jù),構(gòu)造新分布去逼近基于觀測(cè)數(shù)據(jù)的統(tǒng)計(jì)量分布[1-4]。本文將對(duì)此方法進(jìn)行探討。
設(shè) (Ω,?X)為可測(cè)空間,樣本X取值于 (Ω,?X),其分布族為{Pθ,θ∈Θ},又因總體與樣本同分布,故總體分布族也為{Pθ,θ∈Θ}。一個(gè)統(tǒng)計(jì)假設(shè)是關(guān)于樣本X的函數(shù),或者說(shuō),關(guān)于參數(shù)θ的一個(gè)命題:H0:θ∈Θ0,其中Θ0已知,是Θ的一個(gè)真子集。設(shè)非空集Θ1?Θ-Θ0,則命題H1:θ∈Θ1稱為H0的備擇假設(shè)或?qū)α⒓僭O(shè)。注意,在一般情況下Θ1=Θ-Θ0,采用Θ1是Θ-Θ0的子集具有更大的靈活性。如果Θ1是Θ-Θ0的真子集,則H0成立未必H1不成立,這時(shí),H1是本文最關(guān)心的非H0情況?;跇颖緓而做出是否拒絕原假設(shè)H0,稱為對(duì)H0進(jìn)行統(tǒng)計(jì)檢驗(yàn)。這樣,一個(gè)統(tǒng)計(jì)檢驗(yàn)就是把樣本空間Ω分解為兩個(gè)不交子集 ΩA與 ΩB,當(dāng)x∈ΩA時(shí)接受H0,當(dāng)x∈ΩB時(shí)拒絕H0,故ΩA與ΩB分別稱為檢驗(yàn)的接受域與拒絕域。按照隨機(jī)化決策的思想,可引入更一般的檢驗(yàn)方法:在樣本空間Ω上定義一個(gè)取值為[0,1]的?x可測(cè)的函數(shù)φ(x),對(duì)于樣本x計(jì)算φ(x),然后以概率φ(x)否定原假設(shè)H0,以1-φ(x)的概率接受原假設(shè),這樣的φ(x)稱為檢驗(yàn)函數(shù),即檢驗(yàn)?zāi)P?。如果?x)∈(0,1),檢驗(yàn)稱為隨機(jī)化的。如果φ(x)取值只是0或1,則檢驗(yàn)退化為一般的檢驗(yàn),即非隨機(jī)化檢驗(yàn),這時(shí),檢驗(yàn)的接受域?yàn)閧x:φ(x)=0},拒絕域?yàn)閧x:φ(x)=1}。
對(duì)于正態(tài)總體,由于構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量往往已知,所以可通過(guò)解析方法獲得兩類(lèi)錯(cuò)誤的表達(dá)式,但是,如果假設(shè)檢驗(yàn)總體的正態(tài)性假設(shè)不滿足或者不能通過(guò)解析方法獲得兩類(lèi)錯(cuò)誤的表達(dá)式,此時(shí),利用蒙特卡洛方法模擬兩類(lèi)錯(cuò)誤便是一個(gè)很好的選擇,這就是蒙特卡洛檢驗(yàn)(MCT)[4]。MCT的關(guān)鍵在于利用蒙特卡洛方法逼近統(tǒng)計(jì)量的分布,其基本思想是利用產(chǎn)生的參考數(shù)據(jù)構(gòu)造新的分布去逼近基于觀測(cè)數(shù)據(jù)的統(tǒng)計(jì)量分布,因此如何產(chǎn)生參考數(shù)據(jù)是至關(guān)重要的。當(dāng)然,如果在原假設(shè)成立或備擇假設(shè)成立條件下總體的分布已知,則產(chǎn)生觀測(cè)數(shù)據(jù)是比較容易的,只需要生成已知總體的樣本觀測(cè)值即可。在參數(shù)的情況下,如果沒(méi)有討厭參數(shù),MCT可能達(dá)到精確的顯著性水平,即使與一致最優(yōu)檢驗(yàn)相比,它的功效也是非常高的;在討厭參數(shù)存在情況下,MCT仍然可能達(dá)到精確的顯著性水平。在參數(shù)族情況下,不論是否有討厭參數(shù),不論統(tǒng)計(jì)量的漸近分布是否樞軸,利用MCT逼近的誤差比統(tǒng)計(jì)量的漸近引起的誤差小,且可區(qū)分n-0.5的速度逼近備擇假設(shè)。這些結(jié)論進(jìn)一步奠定了MCT法的理論依據(jù)。
利用蒙特卡洛方法模擬棄真錯(cuò)誤α的步驟:
(1)確定原假設(shè)H0成立條件下總體的分布函數(shù)。
(2)抽取樣本容量為n的樣本的樣本觀測(cè)值,即生成n個(gè)總體分布隨機(jī)數(shù)。用臨界值方法進(jìn)行假設(shè)檢驗(yàn),確定棄真錯(cuò)誤是否發(fā)生,即觀測(cè)是否拒絕原假設(shè)H0,并記錄實(shí)驗(yàn)結(jié)果:
(3)重復(fù)第(2)步N次。
同理,利用蒙特卡洛方法模擬存?zhèn)五e(cuò)誤β的步驟:
(1)確定原假設(shè)H0不成立條件下總體的分布函數(shù)。
(2)抽取樣本容量為n的樣本的樣本觀測(cè)值,即生成n個(gè)總體分布隨機(jī)數(shù)。用顯著性水平α與相應(yīng)臨界值進(jìn)行假設(shè)檢驗(yàn),確定存?zhèn)五e(cuò)誤是否發(fā)生,即觀測(cè)是否未拒絕原假設(shè)H0,并記錄實(shí)驗(yàn)結(jié)果:
(3)重復(fù)第(2)步N次。
注意,由于原假設(shè)H0不成立具有多種可能,因此在分析存?zhèn)五e(cuò)誤時(shí)應(yīng)指明選取的備擇假設(shè)。
設(shè)φ(x)是檢驗(yàn)H0的檢驗(yàn)函數(shù),則函數(shù):
gφ(θ)=Pθ(否定H0)
稱為檢驗(yàn)方法φ(x)的功效函數(shù)。通俗地說(shuō),樣本觀測(cè)值落入拒絕域內(nèi)的概率稱為該檢驗(yàn)的功效函數(shù),即:
gφ(θ)=Pθ(否定H0)=Pθ(X∈W),θ∈Θ
其中X為樣本觀測(cè)值,W為拒絕域。顯然,當(dāng)θ∈Θ0時(shí),gφ(θ)=α=α(θ),當(dāng)θ∈Θ1時(shí),gφ(θ)=1-β=1-β(θ)??梢?jiàn),求功效函數(shù)就是求檢驗(yàn)犯兩類(lèi)錯(cuò)誤的概率。如果利用蒙特卡洛方法估計(jì)出兩類(lèi)錯(cuò)誤的概率,也就估計(jì)出了功效函數(shù)。
例 1:假定X~P(λ) ,利用樣本觀測(cè)值檢驗(yàn)假設(shè):H0:λ=5VSH1:λ>5 。令,機(jī)械地利用中心極限定理會(huì)得出:當(dāng)Z≥1.645時(shí)拒絕原假設(shè)H0。顯然,對(duì)于確定的n(尤其當(dāng)n較小時(shí)),統(tǒng)計(jì)量的精確分布是未知的,但利用MCT方法進(jìn)行統(tǒng)計(jì)推斷。下面利用MCT方法模擬棄真錯(cuò)誤的概率α。每次模擬α?xí)r生成N=1000個(gè)參考值z(mì),總共模擬1000個(gè)α值,直方圖見(jiàn)圖1。
圖1 利用MCT方法模擬棄真錯(cuò)誤的概率(左圖n=10,右圖n=100)
當(dāng)n=10,棄真錯(cuò)誤α的均值為0.0551,標(biāo)準(zhǔn)差為0.0071,利用分位數(shù)方法估計(jì)的95%的置信區(qū)間為(0.0420,0.0690);當(dāng)n=100,棄真錯(cuò)誤α的均值為0.0523,標(biāo)準(zhǔn)差為0.0070,利用分位數(shù)方法[5]估計(jì)的95%的置信區(qū)間為(0.0390,0.0660)。如果統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布,棄真錯(cuò)誤的概率應(yīng)為0.05。隨著n的增大,Z越來(lái)越近似于標(biāo)準(zhǔn)正態(tài)分布,棄真錯(cuò)誤的概率也越來(lái)越可能接近0.05,方差也會(huì)相應(yīng)的減少,模擬結(jié)果也驗(yàn)證了此結(jié)論。注意,這些結(jié)論是在概率意義下成立的,在實(shí)際模擬中也會(huì)出現(xiàn)例外,尤其當(dāng)n相差不大時(shí)。
圖2 λ∈[5.1,6.5]時(shí)的功效函數(shù)
對(duì)于λ∈[5.1,6.5],利用蒙特卡洛方法估計(jì)存?zhèn)五e(cuò)誤的概率,進(jìn)而得出相應(yīng)區(qū)間的功效函數(shù)曲線,如圖2所示,其中n=100,每次模擬存?zhèn)胃怕师聲r(shí)生成N=1000個(gè)參考值z(mì)。λ從5.1~6.2(間隔為0.1)的功效函數(shù)取值分別為:
(0.1070 0.2350 0.3820 0.5580 0.7210 0.8300 0.9260 0.9660 0.9870 0.9990 0.9990 1.0000)
可見(jiàn),隨著λ的增大,功效函數(shù)遞增,從λ=6.2開(kāi)始,功效函數(shù)取值幾乎為1,即當(dāng)λ較大時(shí)利用中心極限定理進(jìn)行近似檢驗(yàn)的效率非常高,但是,λ較小時(shí),效率則是非常低的,比如λ=5.1時(shí),功效函數(shù)才為0.1070。
例2:(非平穩(wěn)序列虛假回歸的隨機(jī)模擬)為正確理解虛假回歸,本文考慮一元?jiǎng)討B(tài)線性回歸模型:yt=β0+β1xt+εt。為了檢驗(yàn)?zāi)P偷娘@著性,需要檢驗(yàn):H0:β1=0 VSH1:β1≠0 。如果序列相互獨(dú)立,理論上應(yīng)該接受原假設(shè)H0。如果檢驗(yàn)結(jié)果恰好與理論相反,就會(huì)犯拒真錯(cuò)誤。由于樣本的隨機(jī)性,拒真錯(cuò)誤會(huì)一直存在。通常采用統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn),如果都平穩(wěn),則該統(tǒng)計(jì)量服從t(n),其中n為樣本容量。如果不平穩(wěn),則檢驗(yàn)統(tǒng)計(jì)量不再服從t(n)分布,且樣本方差遠(yuǎn)遠(yuǎn)大于t(n)分布的方差。如果仍用t(n)分布臨界值進(jìn)行檢驗(yàn),拒真概率就會(huì)大大增加。這就會(huì)導(dǎo)致無(wú)法控制拒真概率,容易接受回歸模型顯著的錯(cuò)誤結(jié)論,即產(chǎn)生虛假回歸現(xiàn)象。假如擬合兩個(gè)隨機(jī)游走模型序列:
圖3 檢驗(yàn)統(tǒng)計(jì)量的頻數(shù)直方圖(左)與頻率直方圖(右)
圖4 檢驗(yàn)統(tǒng)計(jì)量的頻數(shù)直方圖(左)與頻率直方圖(右)
拒真錯(cuò)誤概率才0.0650,這說(shuō)明在此非平穩(wěn)序列場(chǎng)合,虛假回歸現(xiàn)象幾乎不存在,原因主要在隨機(jī)游動(dòng)系數(shù)的選擇上。如果保持其他參數(shù)不變,令a=0.5,b=0.5,拒真錯(cuò)誤概率為0.11700;令a=0.1,b=0.1,拒真錯(cuò)誤概率為0.0500??梢?jiàn),隨機(jī)游動(dòng)系數(shù)越小,拒真錯(cuò)誤概率越低,甚至?xí)咏V担怀霈F(xiàn)虛假回歸現(xiàn)象。
由于假設(shè)檢驗(yàn)的結(jié)論很簡(jiǎn)單,在給定顯著性水平α下,要么接受原假設(shè),要么拒絕原假設(shè)。然而,會(huì)出現(xiàn)這樣情況:在一個(gè)較大的顯著性水平得到拒絕原假設(shè)的結(jié)論,但是一個(gè)較小的顯著性水平下得到拒絕原假設(shè)的結(jié)論,因?yàn)轱@著性水平變小,會(huì)使得檢驗(yàn)的拒絕域變小。為此,本文引入檢驗(yàn)p值,即利用樣本所能夠拒絕原假設(shè)的最小顯著性水平[6,7]。
考慮總體為F(.)的簡(jiǎn)單隨機(jī)樣本假定原假設(shè)為H0:F(.)=G(.,θ),其中θ是未知參數(shù),G(.)為已知函數(shù)。對(duì)于這個(gè)假設(shè)檢驗(yàn)的任何統(tǒng)計(jì)量蒙特卡洛檢驗(yàn)方法就是從中獨(dú)立產(chǎn)生參考數(shù)據(jù)并計(jì)算作為統(tǒng)計(jì)量的參考值,其中?是θ的估計(jì)值。不妨令=T0,T1,…,TN表示由蒙特卡洛方法得到的N個(gè)參考值,如果T值較大,拒絕原假設(shè),則檢驗(yàn)p值的估計(jì)為,其中k為T(mén)0,T1,…,TN大于等于T0的個(gè)數(shù)。如果?小于等于給定的顯著性水平α,則拒絕原假設(shè);反之則否。同理,對(duì)于其他檢驗(yàn)情況(比如雙邊檢驗(yàn))不難進(jìn)行相應(yīng)調(diào)整。值得注意的是,參數(shù)蒙特卡羅檢驗(yàn)的具體步驟非常類(lèi)似20世紀(jì)80年代發(fā)展的參數(shù)自助近似[8]。
對(duì)于非參數(shù)或半?yún)?shù)的情形,在原假設(shè)成立情況下很難模擬參考數(shù)據(jù),進(jìn)而也無(wú)法計(jì)算統(tǒng)計(jì)量對(duì)應(yīng)的MCT的條件統(tǒng)計(jì)量。這是因?yàn)榧词乖谠僭O(shè)成立下,模型不能用含有幾個(gè)未知數(shù)的具體模型刻畫(huà)。自助法是解決此問(wèn)題方法之一,它是完全的非參數(shù)統(tǒng)計(jì)方法,對(duì)模型結(jié)構(gòu)和數(shù)據(jù)結(jié)構(gòu)的限制很少。但是,如果模型不是非參數(shù)的,而是半?yún)?shù),自助法就效率不高,這時(shí)可改進(jìn)蒙特卡洛逼近,充分利用數(shù)據(jù)提供的信息,這也是目前研究的熱點(diǎn)之一。如果隨機(jī)向量X獨(dú)立可分解,即X=Y·Z依分布獨(dú)立,Y,Z獨(dú)立且已知,Y·Z表示Y,Z點(diǎn)乘,這時(shí)可采用非參數(shù)蒙特卡洛檢驗(yàn)(NMCT)。記表示總體X的簡(jiǎn)單隨機(jī)樣本,如果xi在原假設(shè)下可獨(dú)立分解為xi=yi·zi,則檢驗(yàn)統(tǒng)計(jì)量NMCT的具體做法為:給定z1,…,zn,從分布Y中獨(dú)立生成一組參考數(shù)據(jù)于是相應(yīng)統(tǒng)計(jì)量的值為假設(shè)T值較大,拒絕原假設(shè);雙邊檢驗(yàn)不難做相應(yīng)調(diào)整。如果原始數(shù)據(jù)對(duì)應(yīng)的T值為T(mén)0,通過(guò)蒙特卡洛方法生成N組參考數(shù)據(jù),則檢驗(yàn)p值的估計(jì)為其中k為T(mén)0,T1,…,TN大于等于T0的個(gè)數(shù)。給定顯著性水平α,只要就拒絕原假設(shè)。因?yàn)橥植加?,而且在給定下,它們有相同的條件分布,因此檢驗(yàn)可能精確有效。原因如下:
如果Ti之間有結(jié),且k≤[α(N+1)],那么T0至少比Ti中第個(gè)大的元素大,因此也有
對(duì)zi求積分,可得這說(shuō)明在變量可獨(dú)立分解時(shí),NMCT是可以精確有效的,而自助法就沒(méi)有這個(gè)優(yōu)點(diǎn)。
例3:(分布族的卡方擬合優(yōu)度檢驗(yàn))考慮檢驗(yàn)H0:F(.)=G(.,θ),其中θ是r維未知參數(shù),在H0下X的所有可能取值Ω可分為k個(gè)互不相交的子集其中k>r+1,記fi為n個(gè)樣本觀測(cè)值落入集合Ai的次數(shù),則樣本觀測(cè)值落入集合Ai頻率為另一方面,利用假設(shè)分布函數(shù)G(.,θ)可計(jì)算:
某地區(qū)在夏季一個(gè)月中由100個(gè)氣象站報(bào)告的暴雨次數(shù)如表1所示,要求檢驗(yàn)假設(shè)H0:F(x)=P(θ)。
表1 某地區(qū)100次觀測(cè)的暴雨次數(shù)
下面利用MCT方法,每次生成100個(gè)參考數(shù)據(jù),共模擬10000次,結(jié)果如圖5所示,p值為0.8336。如果每次生成10000個(gè)參考數(shù)據(jù),共模擬1000次,結(jié)果如圖6所示。注意,此時(shí)分組應(yīng)變?yōu)锳i=P(X=i-1),i=1,…,8,并把 ≥8作為一類(lèi),記為A9。由于最初樣本值只有100個(gè),所以此時(shí)不能得到原檢驗(yàn)的p值,只能模擬檢驗(yàn)統(tǒng)計(jì)量的分布。
圖5 檢驗(yàn)統(tǒng)計(jì)量的頻率分布圖(n=100)與χ2(3)密度曲線
顯然,當(dāng)n=100時(shí),檢驗(yàn)統(tǒng)計(jì)量與漸近分布χ2(3)相比,右偏,厚尾,這會(huì)導(dǎo)致低估p值,故利用MCT可提高檢驗(yàn)效率。由于p值0.8336顯著大于0.05,故可認(rèn)為接受原假設(shè),即某地區(qū)暴雨次數(shù)分布服從泊松分布。
圖6 檢驗(yàn)統(tǒng)計(jì)量的頻率分布圖(n=10000)與χ2(7)密度曲線
顯然,當(dāng)n=10000時(shí),檢驗(yàn)統(tǒng)計(jì)量與漸近分布χ2(7)吻合的非常好,這也驗(yàn)證了檢驗(yàn)統(tǒng)計(jì)量的漸近分布為χ2(k-r-1)。故在進(jìn)行分布族的卡方擬合優(yōu)度檢驗(yàn)時(shí),樣本觀測(cè)值要盡量多(建議大于2000),否則,建議使用MCT方法。
本文利用蒙特卡洛方法產(chǎn)生參考數(shù)據(jù)去逼近統(tǒng)計(jì)量的分布,模擬假設(shè)檢驗(yàn)的兩類(lèi)錯(cuò)誤發(fā)生概率與p值。在非平穩(wěn)序列場(chǎng)合構(gòu)造一元?jiǎng)討B(tài)回歸模型,探討虛假回歸現(xiàn)象出現(xiàn)的原因與影響因素。對(duì)于分布族的卡方擬合優(yōu)度檢驗(yàn),得出:當(dāng)樣本量較少時(shí),使用漸進(jìn)分布誤差較大,建議使用蒙特卡洛檢驗(yàn)方法。