楊 剛
(陜西理工學院 數(shù)學與計算機科學學院,陜西 漢中 723000)
常規(guī)的假設(shè)檢驗(又稱為臨界值法)是根據(jù)檢驗統(tǒng)計量落入的區(qū)域作出是否拒絕原假設(shè)的決策.在確定α后,拒絕域的位置也就相應確定.α是一個通用的風險概率,這是用域表示的缺點.但根據(jù)不同的樣本結(jié)果進行決策,所面臨的風險事實上是有差別的,為了精確反映決策的風險度,可利用P值進行決策.但許多統(tǒng)計學教材中關(guān)于P值的描述常常比較抽象、簡要、零碎,所以對其進行比較詳細、全面和深入的探討是十分必要的.
假設(shè)檢驗理論的創(chuàng)立者Fisher在假設(shè)檢驗中首先提出了P值的概念.他認為假設(shè)檢驗是一種程序,人們依照這一程序可以對某一總體參數(shù)形成一種判斷.換句話說,他認為假設(shè)檢驗是數(shù)據(jù)分析的一種形式,是人們在研究中加入的主觀信息.
P值就是當原假設(shè)為真時所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率[1].這種描述比較抽象和含混,下面這種描述就顯得比較清楚:如果原假設(shè)為真,P值是抽樣分布中大于或小于樣本統(tǒng)計量的概率.當左側(cè)檢驗時,P值為曲線上方小于檢驗統(tǒng)計量部分的面積;當右側(cè)檢驗時,P值為曲線上方大于檢驗統(tǒng)計量部分的面積.P值被稱為觀察到的(或?qū)崪y的)顯著性水平.
一般用X表示檢驗的統(tǒng)計量,當H0為真時,可由樣本數(shù)據(jù)計算出該統(tǒng)計量的值C,根據(jù)檢驗統(tǒng)計量X的具體分布,可求出P值[2].具體地說,左側(cè)檢驗的P值為檢驗統(tǒng)計量X小于樣本統(tǒng)計值C的概率,即P=P(X
P值其實就是按照抽樣分布計算的一個概率值,這個值是根據(jù)檢驗統(tǒng)計量計算出來的[3].通過P值,可以知道在P<α的情況下犯第一類錯誤的實際概率是多少.如果P>α,那么原假設(shè)不被拒絕,在這種情況下,第一類錯誤并不會發(fā)生.P值也可以說是拒絕原假設(shè)的最小顯著性水平,或觀察到的(實例的)顯著性水平,或顯著性概率.P值表示對原假設(shè)的支持程度,是用于確定是否應該拒絕原假設(shè)的另一種方法.
通過對P值的進一步研究發(fā)現(xiàn),P值實際上是一個隨機變量,在無效假設(shè)(即原假設(shè))H0成立的條件下,P值的分布服從區(qū)間[0,1]的均勻分布[4];在無效假設(shè)H0不成立的條件下,P值的分布不僅受樣本含量n和檢驗功效1-β的影響,還受總體參數(shù)之差以及總體中個體變異的影響,因而理論上其分布較為復雜,不一定服從均勻分布.
P值是在H0成立的情況下,檢驗統(tǒng)計量X大于或小于樣本統(tǒng)計量C的概率,而不是X大于或小于C條件下H0成立的概率[5].從條件概率的角度,前者可以表示為P=P(X>C或X P值法與臨界值法處理問題的角度不同.P值法的核心是計算出現(xiàn)樣本值或更極端值的概率,而臨界值法則著重于比較檢驗統(tǒng)計量的值與臨界值的大小[6].P值法比臨界值法具有以下優(yōu)點: (1)P值法使用方便 在統(tǒng)計推斷中,只要涉及假設(shè)檢驗問題,無論是參數(shù)的假設(shè)檢驗(如方差分析和回歸分析),還是非參數(shù)的假設(shè)檢驗(如中位數(shù)檢驗、尺度檢驗和總體分布的檢驗),統(tǒng)計分析軟件均會給出P值,從而可以很方便地得出是否拒絕H0的結(jié)論.在統(tǒng)計軟件中輸出的P值,有的用“P-value”表示,有的用“Sig.”表示.而在臨界值法中常常需要查表求出臨界值,這樣比較麻煩. (2)P值法的結(jié)論更加準確 在P值法中,P值本質(zhì)上是在拒絕H0時犯棄真錯誤的概率.事實上,在利用P值法檢驗時,對于任何大于P的顯著性水平α,均可以拒絕H0.在臨界值法中,若拒絕了H0,則只知道犯棄真錯誤的概率不超過α,但確切的犯棄真錯誤概率并不知道,故P值法的結(jié)論更加準確. (1)P值是假定原假設(shè)為真時所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率,并不是原假設(shè)為真的概率的估計值. (2)由著名的Jeffreys—Lindley悖論可知,當樣本容量很大時,由P值檢驗幾乎總是得出拒絕原假設(shè)的結(jié)論.因此,當樣本容量很大時P值并不太適用,幾乎失效. (3)對于多重假設(shè)檢驗問題,利用P值檢驗法也不好做出判斷.對于P值檢驗法的不足之處,在實際工作中,可以借助貝葉斯學派的方法來彌補. (4)P值在解決醫(yī)學領(lǐng)域的某些問題時存在缺陷.在醫(yī)學領(lǐng)域中,假設(shè)檢驗的P值雖然能提供精確的概率值,但提供的信息有限,常常僅能回答兩組總體參數(shù)是否有差別,這種差別無統(tǒng)計學意義,不能回答臨床醫(yī)生更關(guān)心的差別程度和有無臨床意義[7].而效應量的可信區(qū)間則能提供更多信息,同時能顯示差別的大小及有無臨床意義等.因此,應該把P值同可信區(qū)間的結(jié)果相結(jié)合,即同時報告P值和可信區(qū)間信息,這樣的結(jié)果是才是完整和有效的,它將有助于臨床醫(yī)生結(jié)合專業(yè)知識得到相應的臨床結(jié)論. 計算出P值后,將給定的顯著性水平α與P值比較,就可做出檢驗的結(jié)論:如果α P值,則在顯著性水平α下拒絕原假設(shè).并且,P值越小,拒絕原假設(shè)H0的證據(jù)越充分;P值越大,不能拒絕原假設(shè)H0的證據(jù)越充分.其實,沒有足夠的證據(jù)拒絕原假設(shè)只表明原假設(shè)中的參數(shù)具有存在的合理性,不排除其他參數(shù)存在的可能性,一次檢驗僅僅表明某個參數(shù)值是否合理[8].在實踐中,當α=P值時,也即統(tǒng)計量的值剛好等于臨界值時,為慎重起見,可增加樣本容量,重新進行抽樣檢驗. 例:由統(tǒng)計資料得知,2008年某地新生兒的平均體重為3 190克,新生兒體重的標準差為80克,現(xiàn)在從2009年的新生兒中隨機抽取100個,測得其平均體重為3 210克,問2009年的新生兒與2008年相比,體重有無顯著差異?(α取0.05) 解:H0∶μ=3 190,認為2009年新生兒體重同2008年相比沒有差異; H1∶μ≠3 190,認為2009年新生兒體重同2008年相比有明顯差異. 這是一個雙側(cè)檢驗問題,拒絕域位于分布曲線的兩側(cè). 又由已知:α=0.05,n=100,σ=80,故這是一個大樣本且σ已知的問題,故可以采用z統(tǒng)計量,它服從標準正態(tài)分布: 查表可得z分布在α/2處的分位數(shù)為zα/2=1.96,所以有z>zα/2,統(tǒng)計量落在了拒絕域,可以進行決策:在α=0.05的顯著性水平下,有證據(jù)拒絕H0,從而接受H1,即認為2009年新生兒的平均體重同2008年相比有明顯差異. 此題也可以由P值進行檢驗: 因為z=2.5,故由概率的幾何意義有:0.5P=1-Φ(2.5)=1-0.993 8=0.006 2,故P=0.012 4,P<α,所以在α=0.05的水平上拒絕H0,有證據(jù)表明2009年新生兒的平均體重同2008年相比有明顯差異. 采用臨界值法進行假設(shè)檢驗的優(yōu)點是進行決策的界限清晰,但弱點是進行決策面臨的風險比較籠統(tǒng).采用P值進行決策可以精確地反映決策的風險度.在P<α的情況下,P值越小,拒絕原假設(shè)的理由越充分,故用P值進行假設(shè)檢驗的優(yōu)點是很明顯的.但在具體應用中,還應注意P值的缺點和該方法所使用的專業(yè)領(lǐng)域的特點,防止P值被濫用或誤用. 參考文獻: [1] 賈俊平,何曉群,金勇進.統(tǒng)計學[M].4版.北京:中國人民大學出版社,2009:214-215. [2] 樊冬梅.假設(shè)檢驗中的P值[J].鄭州經(jīng)濟管理干部學院學報,2002,17(4):70-71. [3] 韓志霞,張玲.P值檢驗和假設(shè)檢驗[J].邊疆經(jīng)濟與文化,2006(4):62-63. [4] James H,Robert T,Bauer P,et a1.The behavior of theP-value when the alternative hypothesis is true[J].Biometrics,1997(53):11-22. [5] 呂佳,喬克林.淺談假設(shè)檢驗中的P-值[J].科學技術(shù)與工程,2010,10(34):8494-8496. [6] 侯志強,柴文義,宗明剛,等.P-值法及其應用[J].北方工業(yè)大學學報,2007,19(1):63-65. [7] 康德英,王家良,洪旗,等.循證醫(yī)學中統(tǒng)計結(jié)果的準確表達:P值與可信區(qū)間[J].華西醫(yī)學,2000,15(4):402-403. [8] 鮑貴,席雁.統(tǒng)計顯著性檢驗:問題與思考[J].南京工程學院學報:社會科學版,2010,10(4):27-32.2 P值法的優(yōu)點和缺點
2.1 P值法的優(yōu)點
2.2 P值法的缺點
3 P值法的應用
3.1 利用P值進行決策
3.2 P值法應用實例
4 結(jié)語