亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

假設(shè)檢驗(yàn)中的P值研究

2012-04-12 15:56:38楊剛

河南工程學(xué)院學(xué)報(bào)(自然科學(xué)版) 2012年2期

楊剛

(陜西理工學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院，陜西漢中 723000)

常規(guī)的假設(shè)檢驗(yàn)(又稱(chēng)為臨界值法)是根據(jù)檢驗(yàn)統(tǒng)計(jì)量落入的區(qū)域作出是否拒絕原假設(shè)的決策.在確定α后，拒絕域的位置也就相應(yīng)確定.α是一個(gè)通用的風(fēng)險(xiǎn)概率，這是用域表示的缺點(diǎn).但根據(jù)不同的樣本結(jié)果進(jìn)行決策，所面臨的風(fēng)險(xiǎn)事實(shí)上是有差別的，為了精確反映決策的風(fēng)險(xiǎn)度，可利用P值進(jìn)行決策.但許多統(tǒng)計(jì)學(xué)教材中關(guān)于P值的描述常常比較抽象、簡(jiǎn)要、零碎，所以對(duì)其進(jìn)行比較詳細(xì)、全面和深入的探討是十分必要的.

1 P值的概述

1.1 P值的提出

假設(shè)檢驗(yàn)理論的創(chuàng)立者Fisher在假設(shè)檢驗(yàn)中首先提出了P值的概念.他認(rèn)為假設(shè)檢驗(yàn)是一種程序，人們依照這一程序可以對(duì)某一總體參數(shù)形成一種判斷.換句話(huà)說(shuō)，他認(rèn)為假設(shè)檢驗(yàn)是數(shù)據(jù)分析的一種形式，是人們?cè)谘芯恐屑尤氲闹饔^信息.

1.2 P值的計(jì)算

P值就是當(dāng)原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率[1].這種描述比較抽象和含混，下面這種描述就顯得比較清楚：如果原假設(shè)為真，P值是抽樣分布中大于或小于樣本統(tǒng)計(jì)量的概率.當(dāng)左側(cè)檢驗(yàn)時(shí)，P值為曲線上方小于檢驗(yàn)統(tǒng)計(jì)量部分的面積；當(dāng)右側(cè)檢驗(yàn)時(shí)，P值為曲線上方大于檢驗(yàn)統(tǒng)計(jì)量部分的面積.P值被稱(chēng)為觀察到的(或?qū)崪y(cè)的)顯著性水平.

一般用X表示檢驗(yàn)的統(tǒng)計(jì)量，當(dāng)H0為真時(shí)，可由樣本數(shù)據(jù)計(jì)算出該統(tǒng)計(jì)量的值C，根據(jù)檢驗(yàn)統(tǒng)計(jì)量X的具體分布，可求出P值[2].具體地說(shuō),左側(cè)檢驗(yàn)的P值為檢驗(yàn)統(tǒng)計(jì)量X小于樣本統(tǒng)計(jì)值C的概率，即P=P(XC)；雙側(cè)檢驗(yàn)的P值為檢驗(yàn)統(tǒng)計(jì)量X落在樣本統(tǒng)計(jì)值C為端點(diǎn)的尾部區(qū)域內(nèi)的概率的2倍,即P=2P(X>C)(當(dāng)C位于分布曲線的右端時(shí))或P=2P(XC).

P值其實(shí)就是按照抽樣分布計(jì)算的一個(gè)概率值，這個(gè)值是根據(jù)檢驗(yàn)統(tǒng)計(jì)量計(jì)算出來(lái)的[3].通過(guò)P值，可以知道在P<α的情況下犯第一類(lèi)錯(cuò)誤的實(shí)際概率是多少.如果P>α，那么原假設(shè)不被拒絕，在這種情況下，第一類(lèi)錯(cuò)誤并不會(huì)發(fā)生.P值也可以說(shuō)是拒絕原假設(shè)的最小顯著性水平，或觀察到的(實(shí)例的)顯著性水平，或顯著性概率.P值表示對(duì)原假設(shè)的支持程度，是用于確定是否應(yīng)該拒絕原假設(shè)的另一種方法.

1.3 P值的分布

通過(guò)對(duì)P值的進(jìn)一步研究發(fā)現(xiàn),P值實(shí)際上是一個(gè)隨機(jī)變量，在無(wú)效假設(shè)(即原假設(shè))H0成立的條件下，P值的分布服從區(qū)間[0,1]的均勻分布[4]；在無(wú)效假設(shè)H0不成立的條件下，P值的分布不僅受樣本含量n和檢驗(yàn)功效1-β的影響，還受總體參數(shù)之差以及總體中個(gè)體變異的影響，因而理論上其分布較為復(fù)雜，不一定服從均勻分布.

1.4 2個(gè)概念的區(qū)分

P值是在H0成立的情況下，檢驗(yàn)統(tǒng)計(jì)量X大于或小于樣本統(tǒng)計(jì)量C的概率，而不是X大于或小于C條件下H0成立的概率[5].從條件概率的角度，前者可以表示為P=P(X>C或XC或XC或XC或X

2 P值法的優(yōu)點(diǎn)和缺點(diǎn)

2.1 P值法的優(yōu)點(diǎn)

P值法與臨界值法處理問(wèn)題的角度不同.P值法的核心是計(jì)算出現(xiàn)樣本值或更極端值的概率，而臨界值法則著重于比較檢驗(yàn)統(tǒng)計(jì)量的值與臨界值的大小[6].P值法比臨界值法具有以下優(yōu)點(diǎn)：

(1)P值法使用方便

在統(tǒng)計(jì)推斷中，只要涉及假設(shè)檢驗(yàn)問(wèn)題，無(wú)論是參數(shù)的假設(shè)檢驗(yàn)(如方差分析和回歸分析)，還是非參數(shù)的假設(shè)檢驗(yàn)(如中位數(shù)檢驗(yàn)、尺度檢驗(yàn)和總體分布的檢驗(yàn))，統(tǒng)計(jì)分析軟件均會(huì)給出P值，從而可以很方便地得出是否拒絕H0的結(jié)論.在統(tǒng)計(jì)軟件中輸出的P值，有的用“P-value”表示，有的用“Sig.”表示.而在臨界值法中常常需要查表求出臨界值，這樣比較麻煩.

(2)P值法的結(jié)論更加準(zhǔn)確

在P值法中，P值本質(zhì)上是在拒絕H0時(shí)犯棄真錯(cuò)誤的概率.事實(shí)上，在利用P值法檢驗(yàn)時(shí)，對(duì)于任何大于P的顯著性水平α，均可以拒絕H0.在臨界值法中，若拒絕了H0，則只知道犯棄真錯(cuò)誤的概率不超過(guò)α，但確切的犯棄真錯(cuò)誤概率并不知道，故P值法的結(jié)論更加準(zhǔn)確.

2.2 P值法的缺點(diǎn)

(1)P值是假定原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率，并不是原假設(shè)為真的概率的估計(jì)值.

(2)由著名的Jeffreys—Lindley悖論可知，當(dāng)樣本容量很大時(shí)，由P值檢驗(yàn)幾乎總是得出拒絕原假設(shè)的結(jié)論.因此，當(dāng)樣本容量很大時(shí)P值并不太適用，幾乎失效.

(3)對(duì)于多重假設(shè)檢驗(yàn)問(wèn)題，利用P值檢驗(yàn)法也不好做出判斷.對(duì)于P值檢驗(yàn)法的不足之處，在實(shí)際工作中，可以借助貝葉斯學(xué)派的方法來(lái)彌補(bǔ).

(4)P值在解決醫(yī)學(xué)領(lǐng)域的某些問(wèn)題時(shí)存在缺陷.在醫(yī)學(xué)領(lǐng)域中，假設(shè)檢驗(yàn)的P值雖然能提供精確的概率值，但提供的信息有限，常常僅能回答兩組總體參數(shù)是否有差別，這種差別無(wú)統(tǒng)計(jì)學(xué)意義，不能回答臨床醫(yī)生更關(guān)心的差別程度和有無(wú)臨床意義[7].而效應(yīng)量的可信區(qū)間則能提供更多信息，同時(shí)能顯示差別的大小及有無(wú)臨床意義等.因此，應(yīng)該把P值同可信區(qū)間的結(jié)果相結(jié)合，即同時(shí)報(bào)告P值和可信區(qū)間信息，這樣的結(jié)果是才是完整和有效的，它將有助于臨床醫(yī)生結(jié)合專(zhuān)業(yè)知識(shí)得到相應(yīng)的臨床結(jié)論.

3 P值法的應(yīng)用

3.1 利用P值進(jìn)行決策

計(jì)算出P值后，將給定的顯著性水平α與P值比較，就可做出檢驗(yàn)的結(jié)論：如果αP值，則在顯著性水平α下拒絕原假設(shè).并且,P值越小，拒絕原假設(shè)H0的證據(jù)越充分；P值越大，不能拒絕原假設(shè)H0的證據(jù)越充分.其實(shí)，沒(méi)有足夠的證據(jù)拒絕原假設(shè)只表明原假設(shè)中的參數(shù)具有存在的合理性，不排除其他參數(shù)存在的可能性，一次檢驗(yàn)僅僅表明某個(gè)參數(shù)值是否合理[8].在實(shí)踐中，當(dāng)α=P值時(shí)，也即統(tǒng)計(jì)量的值剛好等于臨界值時(shí)，為慎重起見(jiàn)，可增加樣本容量，重新進(jìn)行抽樣檢驗(yàn).

3.2 P值法應(yīng)用實(shí)例

例：由統(tǒng)計(jì)資料得知，2008年某地新生兒的平均體重為3 190克，新生兒體重的標(biāo)準(zhǔn)差為80克，現(xiàn)在從2009年的新生兒中隨機(jī)抽取100個(gè)，測(cè)得其平均體重為3 210克，問(wèn)2009年的新生兒與2008年相比，體重有無(wú)顯著差異？(α取0.05)

解：H0∶μ=3 190，認(rèn)為2009年新生兒體重同2008年相比沒(méi)有差異；

H1∶μ≠3 190，認(rèn)為2009年新生兒體重同2008年相比有明顯差異.

這是一個(gè)雙側(cè)檢驗(yàn)問(wèn)題，拒絕域位于分布曲線的兩側(cè).

又由已知：α=0.05,n=100,σ=80,故這是一個(gè)大樣本且σ已知的問(wèn)題，故可以采用z統(tǒng)計(jì)量，它服從標(biāo)準(zhǔn)正態(tài)分布:

查表可得z分布在α/2處的分位數(shù)為zα/2=1.96，所以有z>zα/2，統(tǒng)計(jì)量落在了拒絕域，可以進(jìn)行決策：在α=0.05的顯著性水平下，有證據(jù)拒絕H0，從而接受H1，即認(rèn)為2009年新生兒的平均體重同2008年相比有明顯差異.

此題也可以由P值進(jìn)行檢驗(yàn)：

因?yàn)閦=2.5，故由概率的幾何意義有：0.5P=1-Φ(2.5)=1-0.993 8=0.006 2，故P=0.012 4，P<α,所以在α=0.05的水平上拒絕H0，有證據(jù)表明2009年新生兒的平均體重同2008年相比有明顯差異.

4 結(jié)語(yǔ)

采用臨界值法進(jìn)行假設(shè)檢驗(yàn)的優(yōu)點(diǎn)是進(jìn)行決策的界限清晰，但弱點(diǎn)是進(jìn)行決策面臨的風(fēng)險(xiǎn)比較籠統(tǒng).采用P值進(jìn)行決策可以精確地反映決策的風(fēng)險(xiǎn)度.在P<α的情況下,P值越小，拒絕原假設(shè)的理由越充分，故用P值進(jìn)行假設(shè)檢驗(yàn)的優(yōu)點(diǎn)是很明顯的.但在具體應(yīng)用中，還應(yīng)注意P值的缺點(diǎn)和該方法所使用的專(zhuān)業(yè)領(lǐng)域的特點(diǎn)，防止P值被濫用或誤用.

參考文獻(xiàn)：

[1] 賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)[M].4版.北京：中國(guó)人民大學(xué)出版社，2009:214-215.

[2] 樊冬梅.假設(shè)檢驗(yàn)中的P值[J].鄭州經(jīng)濟(jì)管理干部學(xué)院學(xué)報(bào),2002,17(4):70-71.

[3] 韓志霞,張玲.P值檢驗(yàn)和假設(shè)檢驗(yàn)[J].邊疆經(jīng)濟(jì)與文化,2006(4):62-63.

[4] James H，Robert T，Bauer P,et a1．The behavior of theP-value when the alternative hypothesis is true[J]．Biometrics,1997(53):11-22.

[5] 呂佳,喬克林.淺談假設(shè)檢驗(yàn)中的P-值[J].科學(xué)技術(shù)與工程,2010,10(34):8494-8496.

[6] 侯志強(qiáng),柴文義,宗明剛，等.P-值法及其應(yīng)用[J].北方工業(yè)大學(xué)學(xué)報(bào),2007,19(1):63-65.

[7] 康德英,王家良,洪旗,等.循證醫(yī)學(xué)中統(tǒng)計(jì)結(jié)果的準(zhǔn)確表達(dá)：P值與可信區(qū)間[J].華西醫(yī)學(xué),2000,15(4):402-403.

[8] 鮑貴,席雁.統(tǒng)計(jì)顯著性檢驗(yàn)：?jiǎn)栴}與思考[J].南京工程學(xué)院學(xué)報(bào):社會(huì)科學(xué)版,2010,10(4):27-32.