楊 剛
(陜西理工學(xué)院 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,陜西 漢中 723000)
常規(guī)的假設(shè)檢驗(yàn)(又稱為臨界值法)是根據(jù)檢驗(yàn)統(tǒng)計(jì)量落入的區(qū)域作出是否拒絕原假設(shè)的決策.在確定α后,拒絕域的位置也就相應(yīng)確定.α是一個(gè)通用的風(fēng)險(xiǎn)概率,這是用域表示的缺點(diǎn).但根據(jù)不同的樣本結(jié)果進(jìn)行決策,所面臨的風(fēng)險(xiǎn)事實(shí)上是有差別的,為了精確反映決策的風(fēng)險(xiǎn)度,可利用P值進(jìn)行決策.但許多統(tǒng)計(jì)學(xué)教材中關(guān)于P值的描述常常比較抽象、簡要、零碎,所以對其進(jìn)行比較詳細(xì)、全面和深入的探討是十分必要的.
假設(shè)檢驗(yàn)理論的創(chuàng)立者Fisher在假設(shè)檢驗(yàn)中首先提出了P值的概念.他認(rèn)為假設(shè)檢驗(yàn)是一種程序,人們依照這一程序可以對某一總體參數(shù)形成一種判斷.換句話說,他認(rèn)為假設(shè)檢驗(yàn)是數(shù)據(jù)分析的一種形式,是人們在研究中加入的主觀信息.
P值就是當(dāng)原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率[1].這種描述比較抽象和含混,下面這種描述就顯得比較清楚:如果原假設(shè)為真,P值是抽樣分布中大于或小于樣本統(tǒng)計(jì)量的概率.當(dāng)左側(cè)檢驗(yàn)時(shí),P值為曲線上方小于檢驗(yàn)統(tǒng)計(jì)量部分的面積;當(dāng)右側(cè)檢驗(yàn)時(shí),P值為曲線上方大于檢驗(yàn)統(tǒng)計(jì)量部分的面積.P值被稱為觀察到的(或?qū)崪y的)顯著性水平.
一般用X表示檢驗(yàn)的統(tǒng)計(jì)量,當(dāng)H0為真時(shí),可由樣本數(shù)據(jù)計(jì)算出該統(tǒng)計(jì)量的值C,根據(jù)檢驗(yàn)統(tǒng)計(jì)量X的具體分布,可求出P值[2].具體地說,左側(cè)檢驗(yàn)的P值為檢驗(yàn)統(tǒng)計(jì)量X小于樣本統(tǒng)計(jì)值C的概率,即P=P(X
P值其實(shí)就是按照抽樣分布計(jì)算的一個(gè)概率值,這個(gè)值是根據(jù)檢驗(yàn)統(tǒng)計(jì)量計(jì)算出來的[3].通過P值,可以知道在P<α的情況下犯第一類錯(cuò)誤的實(shí)際概率是多少.如果P>α,那么原假設(shè)不被拒絕,在這種情況下,第一類錯(cuò)誤并不會發(fā)生.P值也可以說是拒絕原假設(shè)的最小顯著性水平,或觀察到的(實(shí)例的)顯著性水平,或顯著性概率.P值表示對原假設(shè)的支持程度,是用于確定是否應(yīng)該拒絕原假設(shè)的另一種方法.
通過對P值的進(jìn)一步研究發(fā)現(xiàn),P值實(shí)際上是一個(gè)隨機(jī)變量,在無效假設(shè)(即原假設(shè))H0成立的條件下,P值的分布服從區(qū)間[0,1]的均勻分布[4];在無效假設(shè)H0不成立的條件下,P值的分布不僅受樣本含量n和檢驗(yàn)功效1-β的影響,還受總體參數(shù)之差以及總體中個(gè)體變異的影響,因而理論上其分布較為復(fù)雜,不一定服從均勻分布.
P值是在H0成立的情況下,檢驗(yàn)統(tǒng)計(jì)量X大于或小于樣本統(tǒng)計(jì)量C的概率,而不是X大于或小于C條件下H0成立的概率[5].從條件概率的角度,前者可以表示為P=P(X>C或X P值法與臨界值法處理問題的角度不同.P值法的核心是計(jì)算出現(xiàn)樣本值或更極端值的概率,而臨界值法則著重于比較檢驗(yàn)統(tǒng)計(jì)量的值與臨界值的大小[6].P值法比臨界值法具有以下優(yōu)點(diǎn): (1)P值法使用方便 在統(tǒng)計(jì)推斷中,只要涉及假設(shè)檢驗(yàn)問題,無論是參數(shù)的假設(shè)檢驗(yàn)(如方差分析和回歸分析),還是非參數(shù)的假設(shè)檢驗(yàn)(如中位數(shù)檢驗(yàn)、尺度檢驗(yàn)和總體分布的檢驗(yàn)),統(tǒng)計(jì)分析軟件均會給出P值,從而可以很方便地得出是否拒絕H0的結(jié)論.在統(tǒng)計(jì)軟件中輸出的P值,有的用“P-value”表示,有的用“Sig.”表示.而在臨界值法中常常需要查表求出臨界值,這樣比較麻煩. (2)P值法的結(jié)論更加準(zhǔn)確 在P值法中,P值本質(zhì)上是在拒絕H0時(shí)犯棄真錯(cuò)誤的概率.事實(shí)上,在利用P值法檢驗(yàn)時(shí),對于任何大于P的顯著性水平α,均可以拒絕H0.在臨界值法中,若拒絕了H0,則只知道犯棄真錯(cuò)誤的概率不超過α,但確切的犯棄真錯(cuò)誤概率并不知道,故P值法的結(jié)論更加準(zhǔn)確. (1)P值是假定原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率,并不是原假設(shè)為真的概率的估計(jì)值. (2)由著名的Jeffreys—Lindley悖論可知,當(dāng)樣本容量很大時(shí),由P值檢驗(yàn)幾乎總是得出拒絕原假設(shè)的結(jié)論.因此,當(dāng)樣本容量很大時(shí)P值并不太適用,幾乎失效. (3)對于多重假設(shè)檢驗(yàn)問題,利用P值檢驗(yàn)法也不好做出判斷.對于P值檢驗(yàn)法的不足之處,在實(shí)際工作中,可以借助貝葉斯學(xué)派的方法來彌補(bǔ). (4)P值在解決醫(yī)學(xué)領(lǐng)域的某些問題時(shí)存在缺陷.在醫(yī)學(xué)領(lǐng)域中,假設(shè)檢驗(yàn)的P值雖然能提供精確的概率值,但提供的信息有限,常常僅能回答兩組總體參數(shù)是否有差別,這種差別無統(tǒng)計(jì)學(xué)意義,不能回答臨床醫(yī)生更關(guān)心的差別程度和有無臨床意義[7].而效應(yīng)量的可信區(qū)間則能提供更多信息,同時(shí)能顯示差別的大小及有無臨床意義等.因此,應(yīng)該把P值同可信區(qū)間的結(jié)果相結(jié)合,即同時(shí)報(bào)告P值和可信區(qū)間信息,這樣的結(jié)果是才是完整和有效的,它將有助于臨床醫(yī)生結(jié)合專業(yè)知識得到相應(yīng)的臨床結(jié)論. 計(jì)算出P值后,將給定的顯著性水平α與P值比較,就可做出檢驗(yàn)的結(jié)論:如果α P值,則在顯著性水平α下拒絕原假設(shè).并且,P值越小,拒絕原假設(shè)H0的證據(jù)越充分;P值越大,不能拒絕原假設(shè)H0的證據(jù)越充分.其實(shí),沒有足夠的證據(jù)拒絕原假設(shè)只表明原假設(shè)中的參數(shù)具有存在的合理性,不排除其他參數(shù)存在的可能性,一次檢驗(yàn)僅僅表明某個(gè)參數(shù)值是否合理[8].在實(shí)踐中,當(dāng)α=P值時(shí),也即統(tǒng)計(jì)量的值剛好等于臨界值時(shí),為慎重起見,可增加樣本容量,重新進(jìn)行抽樣檢驗(yàn). 例:由統(tǒng)計(jì)資料得知,2008年某地新生兒的平均體重為3 190克,新生兒體重的標(biāo)準(zhǔn)差為80克,現(xiàn)在從2009年的新生兒中隨機(jī)抽取100個(gè),測得其平均體重為3 210克,問2009年的新生兒與2008年相比,體重有無顯著差異?(α取0.05) 解:H0∶μ=3 190,認(rèn)為2009年新生兒體重同2008年相比沒有差異; H1∶μ≠3 190,認(rèn)為2009年新生兒體重同2008年相比有明顯差異. 這是一個(gè)雙側(cè)檢驗(yàn)問題,拒絕域位于分布曲線的兩側(cè). 又由已知:α=0.05,n=100,σ=80,故這是一個(gè)大樣本且σ已知的問題,故可以采用z統(tǒng)計(jì)量,它服從標(biāo)準(zhǔn)正態(tài)分布: 查表可得z分布在α/2處的分位數(shù)為zα/2=1.96,所以有z>zα/2,統(tǒng)計(jì)量落在了拒絕域,可以進(jìn)行決策:在α=0.05的顯著性水平下,有證據(jù)拒絕H0,從而接受H1,即認(rèn)為2009年新生兒的平均體重同2008年相比有明顯差異. 此題也可以由P值進(jìn)行檢驗(yàn): 因?yàn)閦=2.5,故由概率的幾何意義有:0.5P=1-Φ(2.5)=1-0.993 8=0.006 2,故P=0.012 4,P<α,所以在α=0.05的水平上拒絕H0,有證據(jù)表明2009年新生兒的平均體重同2008年相比有明顯差異. 采用臨界值法進(jìn)行假設(shè)檢驗(yàn)的優(yōu)點(diǎn)是進(jìn)行決策的界限清晰,但弱點(diǎn)是進(jìn)行決策面臨的風(fēng)險(xiǎn)比較籠統(tǒng).采用P值進(jìn)行決策可以精確地反映決策的風(fēng)險(xiǎn)度.在P<α的情況下,P值越小,拒絕原假設(shè)的理由越充分,故用P值進(jìn)行假設(shè)檢驗(yàn)的優(yōu)點(diǎn)是很明顯的.但在具體應(yīng)用中,還應(yīng)注意P值的缺點(diǎn)和該方法所使用的專業(yè)領(lǐng)域的特點(diǎn),防止P值被濫用或誤用. 參考文獻(xiàn): [1] 賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)[M].4版.北京:中國人民大學(xué)出版社,2009:214-215. [2] 樊冬梅.假設(shè)檢驗(yàn)中的P值[J].鄭州經(jīng)濟(jì)管理干部學(xué)院學(xué)報(bào),2002,17(4):70-71. [3] 韓志霞,張玲.P值檢驗(yàn)和假設(shè)檢驗(yàn)[J].邊疆經(jīng)濟(jì)與文化,2006(4):62-63. [4] James H,Robert T,Bauer P,et a1.The behavior of theP-value when the alternative hypothesis is true[J].Biometrics,1997(53):11-22. [5] 呂佳,喬克林.淺談假設(shè)檢驗(yàn)中的P-值[J].科學(xué)技術(shù)與工程,2010,10(34):8494-8496. [6] 侯志強(qiáng),柴文義,宗明剛,等.P-值法及其應(yīng)用[J].北方工業(yè)大學(xué)學(xué)報(bào),2007,19(1):63-65. [7] 康德英,王家良,洪旗,等.循證醫(yī)學(xué)中統(tǒng)計(jì)結(jié)果的準(zhǔn)確表達(dá):P值與可信區(qū)間[J].華西醫(yī)學(xué),2000,15(4):402-403. [8] 鮑貴,席雁.統(tǒng)計(jì)顯著性檢驗(yàn):問題與思考[J].南京工程學(xué)院學(xué)報(bào):社會科學(xué)版,2010,10(4):27-32.2 P值法的優(yōu)點(diǎn)和缺點(diǎn)
2.1 P值法的優(yōu)點(diǎn)
2.2 P值法的缺點(diǎn)
3 P值法的應(yīng)用
3.1 利用P值進(jìn)行決策
3.2 P值法應(yīng)用實(shí)例
4 結(jié)語