亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        假設(shè)檢驗(yàn)中的P值研究

        2012-04-12 15:56:38
        關(guān)鍵詞:假設(shè)檢驗(yàn)概率顯著性

        楊 剛

        (陜西理工學(xué)院 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,陜西 漢中 723000)

        常規(guī)的假設(shè)檢驗(yàn)(又稱為臨界值法)是根據(jù)檢驗(yàn)統(tǒng)計(jì)量落入的區(qū)域作出是否拒絕原假設(shè)的決策.在確定α后,拒絕域的位置也就相應(yīng)確定.α是一個(gè)通用的風(fēng)險(xiǎn)概率,這是用域表示的缺點(diǎn).但根據(jù)不同的樣本結(jié)果進(jìn)行決策,所面臨的風(fēng)險(xiǎn)事實(shí)上是有差別的,為了精確反映決策的風(fēng)險(xiǎn)度,可利用P值進(jìn)行決策.但許多統(tǒng)計(jì)學(xué)教材中關(guān)于P值的描述常常比較抽象、簡要、零碎,所以對其進(jìn)行比較詳細(xì)、全面和深入的探討是十分必要的.

        1 P值的概述

        1.1 P值的提出

        假設(shè)檢驗(yàn)理論的創(chuàng)立者Fisher在假設(shè)檢驗(yàn)中首先提出了P值的概念.他認(rèn)為假設(shè)檢驗(yàn)是一種程序,人們依照這一程序可以對某一總體參數(shù)形成一種判斷.換句話說,他認(rèn)為假設(shè)檢驗(yàn)是數(shù)據(jù)分析的一種形式,是人們在研究中加入的主觀信息.

        1.2 P值的計(jì)算

        P值就是當(dāng)原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率[1].這種描述比較抽象和含混,下面這種描述就顯得比較清楚:如果原假設(shè)為真,P值是抽樣分布中大于或小于樣本統(tǒng)計(jì)量的概率.當(dāng)左側(cè)檢驗(yàn)時(shí),P值為曲線上方小于檢驗(yàn)統(tǒng)計(jì)量部分的面積;當(dāng)右側(cè)檢驗(yàn)時(shí),P值為曲線上方大于檢驗(yàn)統(tǒng)計(jì)量部分的面積.P值被稱為觀察到的(或?qū)崪y的)顯著性水平.

        一般用X表示檢驗(yàn)的統(tǒng)計(jì)量,當(dāng)H0為真時(shí),可由樣本數(shù)據(jù)計(jì)算出該統(tǒng)計(jì)量的值C,根據(jù)檢驗(yàn)統(tǒng)計(jì)量X的具體分布,可求出P值[2].具體地說,左側(cè)檢驗(yàn)的P值為檢驗(yàn)統(tǒng)計(jì)量X小于樣本統(tǒng)計(jì)值C的概率,即P=P(XC);雙側(cè)檢驗(yàn)的P值為檢驗(yàn)統(tǒng)計(jì)量X落在樣本統(tǒng)計(jì)值C為端點(diǎn)的尾部區(qū)域內(nèi)的概率的2倍,即P=2P(X>C)(當(dāng)C位于分布曲線的右端時(shí))或P=2P(XC).

        P值其實(shí)就是按照抽樣分布計(jì)算的一個(gè)概率值,這個(gè)值是根據(jù)檢驗(yàn)統(tǒng)計(jì)量計(jì)算出來的[3].通過P值,可以知道在P<α的情況下犯第一類錯(cuò)誤的實(shí)際概率是多少.如果P>α,那么原假設(shè)不被拒絕,在這種情況下,第一類錯(cuò)誤并不會發(fā)生.P值也可以說是拒絕原假設(shè)的最小顯著性水平,或觀察到的(實(shí)例的)顯著性水平,或顯著性概率.P值表示對原假設(shè)的支持程度,是用于確定是否應(yīng)該拒絕原假設(shè)的另一種方法.

        1.3 P值的分布

        通過對P值的進(jìn)一步研究發(fā)現(xiàn),P值實(shí)際上是一個(gè)隨機(jī)變量,在無效假設(shè)(即原假設(shè))H0成立的條件下,P值的分布服從區(qū)間[0,1]的均勻分布[4];在無效假設(shè)H0不成立的條件下,P值的分布不僅受樣本含量n和檢驗(yàn)功效1-β的影響,還受總體參數(shù)之差以及總體中個(gè)體變異的影響,因而理論上其分布較為復(fù)雜,不一定服從均勻分布.

        1.4 2個(gè)概念的區(qū)分

        P值是在H0成立的情況下,檢驗(yàn)統(tǒng)計(jì)量X大于或小于樣本統(tǒng)計(jì)量C的概率,而不是X大于或小于C條件下H0成立的概率[5].從條件概率的角度,前者可以表示為P=P(X>C或XC或XC或XC或X

        2 P值法的優(yōu)點(diǎn)和缺點(diǎn)

        2.1 P值法的優(yōu)點(diǎn)

        P值法與臨界值法處理問題的角度不同.P值法的核心是計(jì)算出現(xiàn)樣本值或更極端值的概率,而臨界值法則著重于比較檢驗(yàn)統(tǒng)計(jì)量的值與臨界值的大小[6].P值法比臨界值法具有以下優(yōu)點(diǎn):

        (1)P值法使用方便

        在統(tǒng)計(jì)推斷中,只要涉及假設(shè)檢驗(yàn)問題,無論是參數(shù)的假設(shè)檢驗(yàn)(如方差分析和回歸分析),還是非參數(shù)的假設(shè)檢驗(yàn)(如中位數(shù)檢驗(yàn)、尺度檢驗(yàn)和總體分布的檢驗(yàn)),統(tǒng)計(jì)分析軟件均會給出P值,從而可以很方便地得出是否拒絕H0的結(jié)論.在統(tǒng)計(jì)軟件中輸出的P值,有的用“P-value”表示,有的用“Sig.”表示.而在臨界值法中常常需要查表求出臨界值,這樣比較麻煩.

        (2)P值法的結(jié)論更加準(zhǔn)確

        在P值法中,P值本質(zhì)上是在拒絕H0時(shí)犯棄真錯(cuò)誤的概率.事實(shí)上,在利用P值法檢驗(yàn)時(shí),對于任何大于P的顯著性水平α,均可以拒絕H0.在臨界值法中,若拒絕了H0,則只知道犯棄真錯(cuò)誤的概率不超過α,但確切的犯棄真錯(cuò)誤概率并不知道,故P值法的結(jié)論更加準(zhǔn)確.

        2.2 P值法的缺點(diǎn)

        (1)P值是假定原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率,并不是原假設(shè)為真的概率的估計(jì)值.

        (2)由著名的Jeffreys—Lindley悖論可知,當(dāng)樣本容量很大時(shí),由P值檢驗(yàn)幾乎總是得出拒絕原假設(shè)的結(jié)論.因此,當(dāng)樣本容量很大時(shí)P值并不太適用,幾乎失效.

        (3)對于多重假設(shè)檢驗(yàn)問題,利用P值檢驗(yàn)法也不好做出判斷.對于P值檢驗(yàn)法的不足之處,在實(shí)際工作中,可以借助貝葉斯學(xué)派的方法來彌補(bǔ).

        (4)P值在解決醫(yī)學(xué)領(lǐng)域的某些問題時(shí)存在缺陷.在醫(yī)學(xué)領(lǐng)域中,假設(shè)檢驗(yàn)的P值雖然能提供精確的概率值,但提供的信息有限,常常僅能回答兩組總體參數(shù)是否有差別,這種差別無統(tǒng)計(jì)學(xué)意義,不能回答臨床醫(yī)生更關(guān)心的差別程度和有無臨床意義[7].而效應(yīng)量的可信區(qū)間則能提供更多信息,同時(shí)能顯示差別的大小及有無臨床意義等.因此,應(yīng)該把P值同可信區(qū)間的結(jié)果相結(jié)合,即同時(shí)報(bào)告P值和可信區(qū)間信息,這樣的結(jié)果是才是完整和有效的,它將有助于臨床醫(yī)生結(jié)合專業(yè)知識得到相應(yīng)的臨床結(jié)論.

        3 P值法的應(yīng)用

        3.1 利用P值進(jìn)行決策

        計(jì)算出P值后,將給定的顯著性水平α與P值比較,就可做出檢驗(yàn)的結(jié)論:如果αP值,則在顯著性水平α下拒絕原假設(shè).并且,P值越小,拒絕原假設(shè)H0的證據(jù)越充分;P值越大,不能拒絕原假設(shè)H0的證據(jù)越充分.其實(shí),沒有足夠的證據(jù)拒絕原假設(shè)只表明原假設(shè)中的參數(shù)具有存在的合理性,不排除其他參數(shù)存在的可能性,一次檢驗(yàn)僅僅表明某個(gè)參數(shù)值是否合理[8].在實(shí)踐中,當(dāng)α=P值時(shí),也即統(tǒng)計(jì)量的值剛好等于臨界值時(shí),為慎重起見,可增加樣本容量,重新進(jìn)行抽樣檢驗(yàn).

        3.2 P值法應(yīng)用實(shí)例

        例:由統(tǒng)計(jì)資料得知,2008年某地新生兒的平均體重為3 190克,新生兒體重的標(biāo)準(zhǔn)差為80克,現(xiàn)在從2009年的新生兒中隨機(jī)抽取100個(gè),測得其平均體重為3 210克,問2009年的新生兒與2008年相比,體重有無顯著差異?(α取0.05)

        解:H0∶μ=3 190,認(rèn)為2009年新生兒體重同2008年相比沒有差異;

        H1∶μ≠3 190,認(rèn)為2009年新生兒體重同2008年相比有明顯差異.

        這是一個(gè)雙側(cè)檢驗(yàn)問題,拒絕域位于分布曲線的兩側(cè).

        又由已知:α=0.05,n=100,σ=80,故這是一個(gè)大樣本且σ已知的問題,故可以采用z統(tǒng)計(jì)量,它服從標(biāo)準(zhǔn)正態(tài)分布:

        查表可得z分布在α/2處的分位數(shù)為zα/2=1.96,所以有z>zα/2,統(tǒng)計(jì)量落在了拒絕域,可以進(jìn)行決策:在α=0.05的顯著性水平下,有證據(jù)拒絕H0,從而接受H1,即認(rèn)為2009年新生兒的平均體重同2008年相比有明顯差異.

        此題也可以由P值進(jìn)行檢驗(yàn):

        因?yàn)閦=2.5,故由概率的幾何意義有:0.5P=1-Φ(2.5)=1-0.993 8=0.006 2,故P=0.012 4,P<α,所以在α=0.05的水平上拒絕H0,有證據(jù)表明2009年新生兒的平均體重同2008年相比有明顯差異.

        4 結(jié)語

        采用臨界值法進(jìn)行假設(shè)檢驗(yàn)的優(yōu)點(diǎn)是進(jìn)行決策的界限清晰,但弱點(diǎn)是進(jìn)行決策面臨的風(fēng)險(xiǎn)比較籠統(tǒng).采用P值進(jìn)行決策可以精確地反映決策的風(fēng)險(xiǎn)度.在P<α的情況下,P值越小,拒絕原假設(shè)的理由越充分,故用P值進(jìn)行假設(shè)檢驗(yàn)的優(yōu)點(diǎn)是很明顯的.但在具體應(yīng)用中,還應(yīng)注意P值的缺點(diǎn)和該方法所使用的專業(yè)領(lǐng)域的特點(diǎn),防止P值被濫用或誤用.

        參考文獻(xiàn):

        [1] 賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)[M].4版.北京:中國人民大學(xué)出版社,2009:214-215.

        [2] 樊冬梅.假設(shè)檢驗(yàn)中的P值[J].鄭州經(jīng)濟(jì)管理干部學(xué)院學(xué)報(bào),2002,17(4):70-71.

        [3] 韓志霞,張玲.P值檢驗(yàn)和假設(shè)檢驗(yàn)[J].邊疆經(jīng)濟(jì)與文化,2006(4):62-63.

        [4] James H,Robert T,Bauer P,et a1.The behavior of theP-value when the alternative hypothesis is true[J].Biometrics,1997(53):11-22.

        [5] 呂佳,喬克林.淺談假設(shè)檢驗(yàn)中的P-值[J].科學(xué)技術(shù)與工程,2010,10(34):8494-8496.

        [6] 侯志強(qiáng),柴文義,宗明剛,等.P-值法及其應(yīng)用[J].北方工業(yè)大學(xué)學(xué)報(bào),2007,19(1):63-65.

        [7] 康德英,王家良,洪旗,等.循證醫(yī)學(xué)中統(tǒng)計(jì)結(jié)果的準(zhǔn)確表達(dá):P值與可信區(qū)間[J].華西醫(yī)學(xué),2000,15(4):402-403.

        [8] 鮑貴,席雁.統(tǒng)計(jì)顯著性檢驗(yàn):問題與思考[J].南京工程學(xué)院學(xué)報(bào):社會科學(xué)版,2010,10(4):27-32.

        猜你喜歡
        假設(shè)檢驗(yàn)概率顯著性
        第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
        第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
        概率與統(tǒng)計(jì)(一)
        概率與統(tǒng)計(jì)(二)
        基于顯著性權(quán)重融合的圖像拼接算法
        電子制作(2019年24期)2019-02-23 13:22:26
        基于視覺顯著性的視頻差錯(cuò)掩蓋算法
        統(tǒng)計(jì)推斷的研究
        雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗(yàn)
        一種基于顯著性邊緣的運(yùn)動模糊圖像復(fù)原方法
        Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
        久久久国产精品首页免费| 亚洲 欧美 国产 日韩 精品| 91短视频在线观看免费| 久久天堂精品一区专区av| 三级国产精品久久久99| 亚洲熟妇av日韩熟妇在线| 成人免费xxxxx在线视频| 中文字幕成人乱码亚洲| 一区二区三区视频在线观看| 中文无码熟妇人妻av在线| 国产在线观看入口| 日本a一区二区三区在线| 亚洲麻豆视频免费观看| www插插插无码视频网站| 亚洲AV无码资源在线观看| 国产熟妇一区二区三区网站| 欧美午夜理伦三级在线观看| av潮喷大喷水系列无码| 日韩精品一区二区三区毛片| 中文字幕东京热一区二区人妻少妇| 真实的国产乱xxxx在线| 广东少妇大战黑人34厘米视频| 成年女人片免费视频播放A| 久久免费亚洲免费视频| 久久久久久曰本av免费免费| 欧洲中文字幕| 最新中文字幕乱码在线| 亚洲av无码偷拍在线观看| 蜜桃成人无码区免费视频网站| 男女高潮免费观看无遮挡| 国产黑丝美女办公室激情啪啪| 国产午夜福利不卡在线观看| 天堂中文资源在线地址| 日本熟妇裸体视频在线| 国产在线无码不卡影视影院| 人妻精品无码一区二区三区 | 欧美性狂猛xxxxx深喉| 91情侣在线精品国产免费| 日本精品一区二区三区在线观看| 日韩丰满少妇无码内射| 日韩欧美亚洲中字幕在线播放|