朱春浩 王文平
(武漢船舶職業(yè)技術(shù)學(xué)院,湖北武漢 430050)
眾所周知,統(tǒng)計(jì)學(xué)中存在三大學(xué)派,即奈曼經(jīng)典學(xué)派(或頻率學(xué)派)、貝葉斯學(xué)派、費(fèi)歇爾信念學(xué)派。這三大學(xué)派由于其在統(tǒng)計(jì)哲學(xué)方面的分歧,使得它們對(duì)幾乎所有的統(tǒng)計(jì)問題都有自己的一套解決方法。奈曼置信理論與非置信理論爭(zhēng)論最多也最引人注意的就是兩均值之差區(qū)間估計(jì)和檢驗(yàn)問題。
1929年,貝倫斯(Behrens)基于工程實(shí)踐的需要,提出了以下問題:對(duì)均值為 μ1,方差為的正態(tài)總體X取得了大小為n1的完全樣本X1,X2,…,對(duì)另一均值為 μ2,方差為的正態(tài)總體Y取得了大小為n2的完全樣本Y1,Y2,…,Yn2,并且此兩個(gè)樣本相互獨(dú)立 。在 μ1、μ2、、均未知時(shí),要求根據(jù)樣本給出δ=μ1-μ2的精確區(qū)間估計(jì)或假設(shè)檢驗(yàn) H0:μ1=μ2,H1:μ1≠μ2。它有三種問題:①μ1=μ2,=。 ②μ1=μ2,假定=(公共值未知)。 ③μ1=μ2。
問題①奈曼、愛根?皮爾遜在1930年文章《關(guān)于兩樣本檢驗(yàn)》中討論過,他們求得了似然比檢驗(yàn),但對(duì)其性質(zhì)未作深入討論。
問題②已由費(fèi)歇爾在1925年文章《Student t分布的應(yīng)用》中討論過,他引進(jìn)了沿用至今的兩樣本檢驗(yàn),但也沒能仔細(xì)探究其表現(xiàn),特別是在作為出發(fā)點(diǎn)的假定=不對(duì)時(shí),會(huì)有如何的后果。
問題③首先由著名的統(tǒng)計(jì)學(xué)界泰斗費(fèi)歇爾(R.A.Fisher,1890-1962)進(jìn)行了研究,所以稱為貝倫斯-費(fèi)歇爾問題。貝倫斯-費(fèi)歇爾問題應(yīng)用意義非常重要,例如可應(yīng)用于空間飛行器性能參數(shù)的地面試驗(yàn)與飛行試驗(yàn)的天地差分析、航天產(chǎn)品在不同試驗(yàn)條件的試驗(yàn)參數(shù)對(duì)比分析等。
許寶騄于1938年在奈曼和愛根?皮爾遜《統(tǒng)計(jì)研究報(bào)告》的第2卷發(fā)表了關(guān)于數(shù)理統(tǒng)計(jì)學(xué)的第一篇論文《Student t分布理論應(yīng)用于兩樣本問題》[1],研究了貝倫斯-費(fèi)歇爾問題。許寶騄用一個(gè)一般的形式對(duì)這些問題進(jìn)行了一攬子討論,他創(chuàng)造性地引進(jìn)統(tǒng)計(jì)量[2]
其中 A1>0,A2>=為常數(shù),來討論以|u|>c為否定域的檢驗(yàn)。
當(dāng)A1=A2=N/[n1 n2(N-2)],N=n1+n2時(shí),則可導(dǎo)出u1,即Student t的統(tǒng)計(jì)量。
當(dāng)A1=1/[n1(n1-1)],A2=1/[n2(n2-1)]時(shí),則可導(dǎo)出貝倫斯-費(fèi)歇爾問題的統(tǒng)計(jì)量u2。
許寶騄通過把u的密度函數(shù)展開成冪級(jí)數(shù),研究了否定域|u|>c的勢(shì)函數(shù)對(duì)參數(shù)的依賴關(guān)系。其主要內(nèi)容是計(jì)算上述U檢驗(yàn)的功效函數(shù),并研究該檢驗(yàn)在多種情況下的表現(xiàn)。
這是一個(gè)精確的(不是漸進(jìn)的)分析,當(dāng)代統(tǒng)計(jì)學(xué)家謝非稱之為“數(shù)學(xué)嚴(yán)密性的范本”。據(jù)許寶騄的研究成果給出的檢驗(yàn)方法后被稱為“許方法(Method)”。
由于貝倫斯-費(fèi)歇爾問題在實(shí)用上的重要性及其在估計(jì)理論中的歷史作用,許多學(xué)者也研究了這個(gè)問題,但迄今為止只在以下三種情況給出了Frequentist(頻率)精確區(qū)間估計(jì):①σ1=σ2=σ未知的情況;②σ1/σ2=a已知的情況;③n1=n2的情況。對(duì)于一般情況尚未找到Frequentist精確區(qū)間估計(jì)。
(1)韋爾奇(Welch)的解法
韋爾奇在1938年給出了貝倫斯-費(fèi)歇爾問題的一個(gè)近似解法。
Welch&Aspin給出了δ的置信水平為γ的近似置信區(qū)間[3]為
(2)謝非(Scheffe)的解法
1944年,謝非給出了服從t分布且含有參數(shù)μ1-μ2的一個(gè)樞軸量,從而得到了的置信水平為1-α的區(qū)間估計(jì),給出了貝倫斯-費(fèi)歇爾問題的一個(gè)解法[4]。
則有
又有Cov(Zi,Zj)=δij(i,j=1,2,…,n1),于是Z1,Z2,…,Zn1為來自總體 Z ~ N(μ1-μ2,+n1/n2)的簡(jiǎn)單樣本,這樣把原來的問題轉(zhuǎn)化為檢驗(yàn)總體Z均值的問題了。
若考慮以區(qū)間的平均長(zhǎng)度為標(biāo)準(zhǔn),這個(gè)解法有足夠高的精確性。但美中不足的是,所構(gòu)造的樞軸量并不是樣本X1,X2,…,Xn1和Y1,Y2,…,Yn2的對(duì)稱函數(shù)。這樣一來,改變樣本X1,X2,…,Xn1與Y1,Y2,…,Yn2的前后次序,就得到了不同的區(qū)間估計(jì),而由樣本的獨(dú)立同分布性,人們自然地希望:樣本的次序應(yīng)與問題的解無關(guān)。
費(fèi)歇爾對(duì)貝倫斯問題給出了信念推斷的區(qū)間,在這個(gè)問題中,充分地顯示出置信推斷與信念推斷的區(qū)別。
設(shè)函數(shù)模型[5]
其中t1~t(n1-1),t2~t(n2-1),t1和t2相互獨(dú)立,從而有
記W=t2 cosθ-t1 sinθ,顯然W 的分布僅與 θ和t分布的自由度n1-1和n2-1有關(guān)??梢宰C明:W的分布關(guān)于原點(diǎn)對(duì)稱。費(fèi)歇爾等給出了δ的Fiducial信念水平為γ的Fiducial精確區(qū)間估計(jì)為(稱為信念區(qū)間估計(jì))
d值可在費(fèi)歇爾和耶茨編的統(tǒng)計(jì)表中查出[6]。
此問題的解在信念分布的歷史中有相當(dāng)?shù)囊饬x。它對(duì)一個(gè)用頻率學(xué)派方法難以處理的重要問題,給了一種明確的解法而不必涉及大樣本,這說明它并非原有方法的改頭換面的形式,而是能提供一些新東西。可以說,要不是貝倫斯-費(fèi)歇爾問題,費(fèi)歇爾的信念分布法可能早就被人遺忘了[2]。
費(fèi)歇爾提出了信念推斷方法,在他將此方法用于著名的貝倫斯-費(fèi)歇爾問題之后,信念推斷方法受到人們很大的關(guān)注,這說明信念推斷方法是解決區(qū)間估計(jì)的一個(gè)有效的方法。另外,信念推斷方法直觀,它容易被實(shí)際工作者所接受。
但是,隨著研究的深入,人們發(fā)現(xiàn)了信念推斷方法的一些內(nèi)在的問題。例如,在尋求信念分布的時(shí)候,利用不同的方法,推導(dǎo)出的信念分布有可能不一樣。信念分布的這種不確定性是費(fèi)歇爾的信念推斷方法至今還沒有被人們完全接受的原因之一。對(duì)于該信念推斷,很多統(tǒng)計(jì)學(xué)家進(jìn)行了批評(píng)。奈曼通過計(jì)算說明,費(fèi)歇爾給出的信念水平為1-α的區(qū)間估計(jì)并不是置信水平為1-α的區(qū)間估計(jì)。所以有的時(shí)候信念水平為1-α的區(qū)間估計(jì)并不是置信水平為1-α的區(qū)間估計(jì)。
兩均值之差δ=μ1-μ2的精確區(qū)間估計(jì)或假設(shè)檢驗(yàn),H0:μ1=μ2,H1:μ1≠μ2,這里區(qū)分三種不同的情況,分別處理[7]。
現(xiàn)在考慮②、③兩種情況。
于是記 x=(x1,…,xn1)′,y=(y1,…,yn2)′后 ,后驗(yàn)密度
要求出 μ1-μ2的區(qū)間估計(jì),只消求得 h(μ1,μ2|x,y),因此對(duì) σ2從 0到 ∞積分,由 h(μ1,μ2,σ2|x,y)就得到
利用Γ函數(shù)的性質(zhì),就知道
為了求得μ1-μ2的后驗(yàn)分布,考慮變換
此時(shí)相應(yīng)的雅可比行列式是1,得到
對(duì)η積分,就得
為了求出上式右端的積分,將被積函數(shù)的形式作一改寫。令 z=η-,則
其中 v=v1+v2。取 t=后,從θ的后驗(yàn)密度,就得
這與經(jīng)典方法的結(jié)果是完全一樣的。
從貝葉斯方法看來,②與③的差別只是多了一個(gè)參數(shù),在原則上是沒有困難的。如果選先驗(yàn)分布時(shí),考慮到兩個(gè)總體是彼此無關(guān)的,應(yīng)該相互獨(dú)立,后驗(yàn)分布因此也相互獨(dú)立,這樣就可以兩個(gè)總體各自處理,分別消除未知參數(shù),的影響,于是就有后驗(yàn)密度
上式中的 h(μ1,)和 h(μ2,)可以用與 ②完全類似的方法求得。因此,用廣義先驗(yàn)分布 π(μ1,)∝()-1,π(μ2,)∝()-1時(shí),就有 h(μ1,)∝[1+,n1是來自 N(μ1,)樣本的樣本量,它正是自由度為n1-1的t分布。容易看出,對(duì)μ2也有類似的結(jié)果,即
n2是來自 N(μ2,)樣本的樣本量。令 t=
則有
于是可以算得密度為
值得注意的是用費(fèi)歇爾信念方法處理也得這一結(jié)果。
關(guān)于費(fèi)歇爾信念推斷解法,置信推斷理論的創(chuàng)立者奈曼在一項(xiàng)工作中進(jìn)行了批評(píng),奈曼主要提到兩點(diǎn):一是信念分布是含糊不清的,缺乏依據(jù)的,既然未對(duì)信念分布作出完全明確的定義而又借用通常概率論中的結(jié)果,提出這種批評(píng)是自然的;另一點(diǎn)是奈曼通過計(jì)算證明,這樣定義的區(qū)間估計(jì)并不具備在他的意義下的置信系數(shù)1-α。奈曼就n1=12,n2=6和α=0.05的情況作了計(jì)算,說明由費(fèi)歇爾方法作出的信念區(qū)間包含被估計(jì)的 μ1-μ2的概率,依賴于比值 ρ=σ1/σ2。當(dāng) ρ=0.1,1.0和10時(shí),這概率分別為0.966,0.960和0.934。對(duì)后面這個(gè)批評(píng),信念推斷論者并不在意,因?yàn)樗麄儾⒉徽J(rèn)為,給區(qū)間估計(jì)以奈曼那種頻率解釋是不可或缺的,在他們看來,奈曼的計(jì)算結(jié)果的意義只在于證實(shí)了“信念系數(shù)”與“置信系數(shù)”確非一樣的東西。事實(shí)上,更使人感興趣的是:即使在這樣較為復(fù)雜的場(chǎng)合,基于根本不同的出發(fā)點(diǎn)所建立的區(qū)間估計(jì)的“可靠度”有著很接近的值。
費(fèi)歇爾信念推斷理論是他的歸納推理體系一個(gè)主要組成部分,他是似然率、極大似然估計(jì)、充分性等歸納推理思想的繼續(xù)[8]。信念概率及信念水平也是繼似然率之后費(fèi)歇爾信念的又一測(cè)度方法。但由于信念推斷對(duì)于充分統(tǒng)計(jì)量、對(duì)于未知參數(shù)的統(tǒng)計(jì)量的精確抽樣分布及其連續(xù)性等都有較嚴(yán)格的要求,因而在實(shí)際推斷中不如置信推斷來得方便。特別是對(duì)于兩個(gè)參數(shù)或兩個(gè)以上參數(shù)的較復(fù)雜推斷問題,信念理論的局限性就更大了。不但所得結(jié)果與置信推斷不同,而且對(duì)其解釋也很困難。因而信念推斷就被置信推斷所取代,現(xiàn)代的教科書中也很少介紹信念推斷方法了。盡管如此,費(fèi)歇爾信念推斷仍然閃爍著他歸納推理思想的杰出的火花?,F(xiàn)在,也仍然有一些統(tǒng)計(jì)學(xué)家在努力完善費(fèi)歇爾信念推斷思想理論,并取得了一些進(jìn)展?;蛟S在將來某一天,費(fèi)歇爾信念推斷思想會(huì)重放光彩,重新引起人們的興趣和重視。
1 Pao-Lu H su.Contributions to the Tw o-sample P roblem and the Theory of the “ Student's” t-test[J].Statist.Res.Mem.,1938(2):1-24.
2 陳希孺.數(shù)理統(tǒng)計(jì)學(xué)簡(jiǎn)史[M].湖南:湖南教育出版社,2002.
3 峁詩松,王靜龍.數(shù)理統(tǒng)計(jì)[M].上海:華東師范大學(xué)出版社,1990.
4 陳希孺.數(shù)理統(tǒng)計(jì)學(xué)引論[M].北京:科學(xué)出版社,1981.
5 茆詩松,王靜龍.高等數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,德國(guó):施普林格出版社,1998.
6 R.A.Fisher,F.Yates.Statistical Tables fo r Biological[M].Agricultural and Medical Research(5thed.),O liver&Boyd,Edinburgh,1957.
7 張堯庭,陳漢峰.貝葉斯統(tǒng)計(jì)推斷[M].北京:科學(xué)出版社,1991.
8 袁衛(wèi).統(tǒng)計(jì)推斷思想[M].北京:中國(guó)統(tǒng)計(jì)出版社,1990.