職桂珍, 徐雅靜, 曲雙紅, 盧金梅, 汪遠征
(鄭州輕工業(yè)學(xué)院數(shù)學(xué)與信息科學(xué)系,河南鄭州 450002)
假設(shè)檢驗中p值的靈活運用
職桂珍, 徐雅靜, 曲雙紅, 盧金梅, 汪遠征
(鄭州輕工業(yè)學(xué)院數(shù)學(xué)與信息科學(xué)系,河南鄭州 450002)
給出假設(shè)檢驗中p值的定義以及雙邊檢驗p值與單邊檢驗p值的關(guān)系,介紹了利用p值將三種檢驗同時進行的方法及意義,最后給出應(yīng)用實例.
假設(shè)檢驗;p值;拒絕域
假設(shè)檢驗是統(tǒng)計推斷的重要內(nèi)容,在很多經(jīng)典的統(tǒng)計學(xué)教科書中,甚至是現(xiàn)在流行的概率統(tǒng)計教材中,大多采用計算檢驗統(tǒng)計量的觀測值,并根據(jù)檢驗統(tǒng)計量的觀測值是否落入拒絕域的方法做出能否拒絕原假設(shè)的推斷.而現(xiàn)代統(tǒng)計軟件中,假設(shè)檢驗多是采用計算p值的方法進行推斷的.檢驗時需要由樣本觀測值計算出檢驗統(tǒng)計量的觀測值和衡量觀測結(jié)果極端性的p值,然后通過比較p值和顯著水平的大小作判斷:當(dāng)p<,拒絕原假設(shè)H0;當(dāng)p>,不能拒絕原假設(shè)H0.借助于統(tǒng)計軟件,采用p值法進行假設(shè)檢驗方便、明了且便于了解檢驗結(jié)果顯著性的程度.
然而,由于傳統(tǒng)統(tǒng)計教學(xué)方法和現(xiàn)代軟件使用的脫節(jié),使很多人對p值的概念不清楚,不能靈活使用,或根本看不懂軟件結(jié)果而無法解決應(yīng)用問題.另一方面,有些統(tǒng)計軟件可以方便地利用p值進行雙邊檢驗,卻沒有直接給出單邊檢驗的過程和結(jié)果.如果對p值的計算沒有深入探究,遇到單邊檢驗問題,就會覺得軟件不好使用.事實上,可以通過雙邊檢驗的p值計算出單邊檢驗的p值,單雙邊檢驗可以同時進行,事半而功倍.本文深入介紹p值的計算公式并推出單雙邊檢驗中p值的關(guān)系,最后給出應(yīng)用實例.
p值就是當(dāng)原假設(shè)成立時得到樣本觀測值和更極端結(jié)果的概率.若W為檢驗統(tǒng)計量,W0為W的觀察值,通常p值由下面公式計算而得到.
1.雙邊檢驗的p值.
假設(shè)H0:θ=θ0;H1:θ≠θ0.
(i)檢驗統(tǒng)計量為對稱分布的雙邊檢驗
(ii)檢驗統(tǒng)計量為非對稱分布的雙邊檢驗
2.單邊檢驗的p值
(i)拒絕域為右邊區(qū)域的右邊檢驗
假設(shè)H0:θ≤θ0;H1:θ>θ0.
(ii)拒絕域為左邊區(qū)域的左邊檢驗
假設(shè)H0:θ≥θ0;H1:θ<θ0.
根據(jù)上面p值的計算公式不難推出如下命題:
命題 設(shè)W為檢驗統(tǒng)計量,W0為W的觀察值,W中為W的中位數(shù),p雙,p右和p左分別為雙邊檢驗H0:θ=θ0;H1:θ≠θ0,右邊檢驗H0:θ≤θ0;H1:θ>θ0和左邊檢驗H0:θ≥θ0;H1:θ<θ0的p值,則它們有下面關(guān)系:
1.檢驗統(tǒng)計量為對稱連續(xù)分布時,
2.檢驗統(tǒng)計量為非對稱分布時,
證1.檢驗統(tǒng)計量為對稱連續(xù)分布時,由于
所以
(i)拒絕域為右邊區(qū)域的右邊檢驗,
若W0≥0,則p右=P{W≥W0}=p雙/2;
若W0<0,則p右=P{W≥W0}=1-P{W<W0}=1-p雙/2.
(ii)拒絕域為左邊區(qū)域的左邊檢驗,
若W0≥0,則p左=P{W≤W0}=1-P{W>W(wǎng)0}=1-p雙/2;
若W0<0,則p左=P{W≤W0}=p雙/2.
2.檢驗統(tǒng)計量為非對稱分布時,由于
所以
(i)拒絕域為右邊區(qū)域的右邊檢驗,
若W0≥W中,則p右=P{W≥W0}=p雙/2;
若W0<W中,則p右=P{W≥W0}=1-p雙/2.
(ii)拒絕域為左邊區(qū)域的左邊檢驗
若W0≥W中,則p左=P{W≤W0}=1-p雙/2;
若W0<W中,則p左=P{W≤W0}=p雙/2.
知道雙邊檢驗的p值和單邊檢驗的p值關(guān)系后,三種檢驗就可以一次完成.事實上,實際應(yīng)用中只作一次雙邊檢驗或單邊檢驗有時是不夠的.比如在均值檢驗時,得到拒絕原假設(shè)μ=μ0的結(jié)論下,有時我們還需要進一步檢驗是否可以認為μ>μ0或μ<μ0才能得到較為準(zhǔn)確的結(jié)論.即使是在得到不能拒絕原假設(shè)μ=μ0的結(jié)論下,如果雙邊檢驗的p值不夠大(0.05<p<0.1),即拒絕備擇假設(shè)μ≠μ0的證據(jù)較弱,往往也應(yīng)該進一步作單邊檢驗,以得到較為合理的μ≥μ0或μ≤μ0的結(jié)論.針對這兩種情況,利用上述雙邊檢驗的p值和單邊檢驗的p值關(guān)系,將三種檢驗同時進行就很有必要.
在考慮雙邊檢驗的p值和單邊檢驗的p值關(guān)系時,當(dāng)檢驗統(tǒng)計量為非對稱分布時要用到檢驗統(tǒng)計量分布的中位數(shù),可查閱有關(guān)分位數(shù)表,或用統(tǒng)計軟件調(diào)用相應(yīng)分位數(shù)函數(shù)進行計算.
1.檢驗統(tǒng)計量為對稱分布時.
例1 一家食品廠以生產(chǎn)袋裝食品為主,每天的產(chǎn)量大約為8000袋,每袋重量規(guī)定為100克.為了分析每袋重量是否符合要求,質(zhì)檢部門經(jīng)常進行抽檢.現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如表1所示.試從抽檢的樣本數(shù)據(jù)出發(fā),檢驗袋裝食品的平均重量與100克是否有顯著差異.
表1 25袋食品的重量(單位:克)
分析與解答 設(shè)重量變量名為weight,本題是要求做原假設(shè)為μ=100的雙邊檢驗.但是根據(jù)檢驗p值與單邊檢驗p值的關(guān)系,我們可以將三種檢驗同時進行.
(i)雙邊檢驗(H0:μ=μ0=100; H1:μ≠μ0,α=0.05).
在SAS中作t檢驗結(jié)果如圖1.
圖1 t檢驗結(jié)果
從圖中看到原假設(shè)μ=100的p雙值為0.0355,在0.05的顯著水平下,應(yīng)該拒絕原假設(shè).
(ii)右邊檢驗(H0:μ≤100; H1:μ>100,α=0.05).
由于
拒絕右邊檢驗的原假設(shè)μ≤100.
(3)左邊檢驗(H0:μ≥100; H1:μ<100,α=0.05).
由于
不能拒絕左邊檢驗的原假設(shè)μ≥100.
綜上,我們可以認為袋裝食品的平均重量與100有顯著差異,袋裝食品的平均重量大于100克.
2.檢驗統(tǒng)計量為非對稱分布時.
例2 某藥材生產(chǎn)商要檢查包裝機械的狀態(tài).根據(jù)規(guī)定,包裝機正常工作時,每袋重量為50克,方差為4.隨機抽取當(dāng)天生產(chǎn)的16袋樣本稱重后結(jié)果如表2所示,試考查藥材包裝機的狀態(tài)是否正常.
表2 16袋藥材重量(單位:克)
分析與解答 設(shè)重量變量名為weight,本題首先做原假設(shè)為σ2=4的雙邊檢驗,再根據(jù)雙邊檢驗p值與單邊檢驗p值的關(guān)系,將三種檢驗同時進行,并綜合分析三種情況作出判斷.
(i)雙邊檢驗(H0:σ2=σ20=4; H1:σ2≠σ20,α=0.05).
在SAS中做方差的卡方檢驗結(jié)果如圖2.
圖2 χ2檢驗結(jié)果
從圖中看到原假設(shè)σ2=4的p雙值為0.0662,在0.05的顯著水平下,不能拒絕原假設(shè).
(ii)右邊檢驗(H0:σ2≤4; H1:σ2>4,α=0.05).
由于自由度為15的χ2分布中位數(shù)為14.339,χ2=26.500>χ,p右=p雙/2=0.0331<0.05,應(yīng)拒絕右邊檢驗的原假設(shè)σ2≤4.
(iii)左邊檢驗(H0:σ2≥4; H1:σ2<4,α=0.05).
由于χ2=26.500>χ,p左=P{W≤W0}=1-p雙/2=0.9669,不能拒絕左邊檢驗的原假設(shè)σ2≥4.
綜上,我們可以認為包裝重量的方差不小于4,即認為現(xiàn)在包裝機情況不夠穩(wěn)定,需維修.
例3 從機械廠的兩臺機器所加工的同一種零件中,分別抽出8個和9個樣品,測量其尺寸如表3,試檢驗兩臺機器所加工零件的穩(wěn)定性哪個較好?(α=0.05)
表3 兩臺機器所加工同一種零件的尺寸(單位:厘米)
分析與解答 設(shè)尺寸變量名為y,A機床加工該零件尺寸的方差為σ12,B機床加工該零件尺寸的方差為σ22.本題首先做原假設(shè)為σ12=σ22的雙邊檢驗,再根據(jù)檢驗p值與單邊檢驗p值的關(guān)系,將三種檢驗同時進行,并進行綜合分析作出判斷.
(i)雙邊檢驗(H0:σ=σ; H1:σ≠σ,α=0.05).
在SAS中做兩總體方差比的F檢驗結(jié)果如圖3.
(ii)右邊檢驗(H0:σ≤σ; H1:σ>σ,α=0.05).
由于自由度為(7,8)的F分布中位數(shù)為0.988,F=3.53>F中,p右=p雙/2=0.0491<0.05,拒絕右邊檢驗的原假設(shè)σ≤σ.
(iii)左邊檢驗(H0:σ≥σ; H1:σ<σ,α=0.05).
由于F=3.53>F中,p左=P{W≤W0}=1-p雙/2=0.9509,不能拒絕左邊檢驗的原假設(shè)σ≥σ.
綜上,我們可以認為A機床加工的零件尺寸的方差不比B機床加工的零件尺寸的方差小,即B機床加工的零件比A機床加工的零件尺寸更加穩(wěn)定.
圖3 F檢驗結(jié)果
在統(tǒng)計推斷中掌握雙邊檢驗p值與單邊檢驗p值的關(guān)系,不僅可以更加靈活地使用統(tǒng)計軟件解決實際問題,而且可以三種檢驗同時進行使推斷結(jié)果更加客觀、符合實際.
[1] 峁詩松,程依明,濮曉龍,等.概率論與數(shù)理統(tǒng)計教程[M].北京:高等教育出版社,2004.
[2] 汪遠征,徐雅靜.SAS軟件與統(tǒng)計應(yīng)用教程[M].北京:機械工業(yè)出版社,2007.
[3] 薛薇,SPSS統(tǒng)計分析方法及應(yīng)用[M].北京:電子工業(yè)出版社,2004.
[4] Gerald Keller,Brian Warrack.Statistics for managenment and economics[M].王琪延,郝志敏,廉曉紅,等譯.北京:中國人民大學(xué)出版社,2006.
[5] 謝明文.關(guān)于單側(cè)檢驗拒絕的證明及假設(shè)檢驗的概率實質(zhì)[J].北京:數(shù)學(xué)實踐與認識,2004(10):99-103.
The Flexible Application of Valuepin Hypothesis Tests
Z HI Gui-zhen, XU Ya-jing, QU S huang-hong, L U J in-mei, WA N G Yuan-zheng
(Dept.ofMath.and Infor.Sci.,Zhengzhou Inst.of Light Ind.,Zhengzhou 450002,China)
Supplying with the definition of Valuepin the hypothesis tests and the relationship of Valuepin unilateral test and bilateral test,this paper introduced the method and significance of using Valuepto carry on the three kinds of tests synchronously,some applied exaples will be given in the end.
hypothesis tests;valuep;rejection region
O212.1
C
1672-1454(2011)05-0152-05
2009-01-11
鄭州輕工業(yè)學(xué)院第八批教學(xué)改革與研究資助項目;鄭州輕工業(yè)學(xué)院研究生教育教學(xué)第一批教改項目;鄭州輕工業(yè)學(xué)院青年教師教學(xué)改革與研究項目