劉素兵 曹大志 張華
摘要:從參數(shù)的區(qū)間估計(jì)角度審視假設(shè)檢驗(yàn)問(wèn)題,剖析知識(shí)點(diǎn)的內(nèi)在聯(lián)系,梳理置信區(qū)間與假設(shè)檢驗(yàn)中的拒絕域之間的關(guān)系,認(rèn)為可以用置信區(qū)間進(jìn)行假設(shè)檢驗(yàn)。
關(guān)鍵詞:區(qū)間估計(jì);置信區(qū)間;抽樣分布;假設(shè)檢驗(yàn)
中圖分類號(hào):G642.0文獻(xiàn)標(biāo)識(shí)碼:A
Assumption of Confidence Interval Method
LiuSubing1CaoDazhi1ZhangHua2
1.Rocket Force University of EngineeringShanxiXian710025;
2.The Hitech College ofXian University of TechnologyShanxiXian710109
Abstract:The hypothesis test is analyzed from the perspective of the interval estimation of the parameters,the internal relations of the knowledge points are analyzed,the relationship between the domains in the confidence interval and the hypothesis test is combed.Finally,the hypothesis test is carried out in the confidence interval.
Key words:interval estimation;confidence interval;sampling distribution;hypothesis test
數(shù)理統(tǒng)計(jì)中的重點(diǎn)內(nèi)容就是利用樣本信息對(duì)總體參數(shù)進(jìn)行某種推斷和預(yù)測(cè),其中有兩個(gè)重要的組成部分是參數(shù)估計(jì)和假設(shè)檢驗(yàn)。從推斷角度上看,參數(shù)估計(jì)時(shí),估計(jì)前總體參數(shù)是未知的,主要討論用樣本統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行估計(jì);假設(shè)檢驗(yàn)時(shí),則是先對(duì)未知參數(shù)提出一定的假設(shè),然后再利用樣本信息去檢驗(yàn)所提假設(shè)是否成立。雖然考慮問(wèn)題的出發(fā)點(diǎn)不同,但在參數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)這兩部分學(xué)習(xí)中,仔細(xì)觀察發(fā)現(xiàn)有諸多相似之處:均用到了正態(tài)總體的抽樣分布、假設(shè)檢驗(yàn)中的檢驗(yàn)統(tǒng)計(jì)量同置信區(qū)間的樞軸量相似、都有一個(gè)給定的α。那么它們之間有沒(méi)有聯(lián)系呢?很多同學(xué)在學(xué)習(xí)中都存在這樣的困惑。進(jìn)一步講,除了假設(shè)檢驗(yàn)本身方法外,能不能用區(qū)間估計(jì)中的置信區(qū)間來(lái)進(jìn)行假設(shè)檢驗(yàn)?zāi)兀?/p>
在參數(shù)的置信區(qū)間估計(jì)中,記1-α為置信度,反映區(qū)間估計(jì)的可信度,α為置信水平,在置信水平下,利用樣本信息對(duì)未知參數(shù)進(jìn)行估計(jì),并以1-α的概率保證總體參數(shù)落在該區(qū)間內(nèi),α越小,置信區(qū)間也就越寬。在假設(shè)檢驗(yàn)中,一旦顯著性水平α和檢驗(yàn)統(tǒng)計(jì)量確定,臨界值的位置也就確定了。比如,在對(duì)總體均值α進(jìn)行假設(shè)檢驗(yàn)時(shí),由對(duì)應(yīng)臨界值所圍成的區(qū)域組成以μ0為中心的置信區(qū)間,因此,是否可以接受原假設(shè)μ=μ0,取決于μ的統(tǒng)計(jì)量是否落在這個(gè)區(qū)間內(nèi)。若原假設(shè)H0∶μ=μ0為真,則在假設(shè)下,自然認(rèn)為μ的統(tǒng)計(jì)量幾乎不可能落在置信區(qū)間外,而若落在外面,就認(rèn)為小概率事件發(fā)生了,利用“小概率原理”,則推斷H0為假,從而拒絕H0。α越小,置信區(qū)間就越寬,從而使得犯“棄真錯(cuò)誤”可能性變小。因此,可以用置信區(qū)間進(jìn)行假設(shè)檢驗(yàn)。
1 用置信區(qū)間進(jìn)行假設(shè)檢驗(yàn)
設(shè)X1,X2,…,Xn來(lái)自正態(tài)總體N(μ,σ2)的樣本,討論σ2已知關(guān)于均值μ的檢驗(yàn)問(wèn)題。分三種情況:
①H0∶μ=μ0H1∶μ≠μ0(雙側(cè)檢驗(yàn))
②H0∶μ≤μ0H1∶μ>μ0(右側(cè)檢驗(yàn))
③H0∶μ≥μ0H1∶μ<μ0(左側(cè)檢驗(yàn))
其中,μ0已知,總體方差σ2分已知和未知討論。討論在σ已知情況下假設(shè)問(wèn)題。
①H0∶μ=μ0H1∶μ≠μ0(雙側(cè)檢驗(yàn))
在α下的檢驗(yàn)的接受域?yàn)椋?/p>
W-1=|U|≤uα/2=X--μ0σ/n≤uα/2,
此接受域可改寫成
W-1=X--μ0≤uα/2σn=X--uα/2σn≤μ0≤X-+uα/2σn,其中μ0并無(wú)限制,若讓?duì)?在(-∞,+∞)內(nèi)取值,就得到μ的置信度1-α置信區(qū)間:X-+uα/2σn。
反之,若有一個(gè)如上的置信度1-α的置信區(qū)間:,也可以獲得關(guān)于H0∶μ=μ0H1∶μ≠μ0的顯著性水平為α的顯著性檢驗(yàn)。因此,正態(tài)均值μ的1-α的置信區(qū)間與關(guān)于H0∶μ=μ0H1∶μ≠μ0的雙側(cè)檢驗(yàn)問(wèn)題的顯著性水平為α的顯著性檢驗(yàn)一一對(duì)應(yīng)。
正態(tài)總體均值μ的置信區(qū)間由點(diǎn)估計(jì)值和描述估計(jì)量精度的邊際誤差兩部分組成,記允許誤差為Δ=uα/2σ[]n,可得,利用置信區(qū)間進(jìn)行雙側(cè)假設(shè)檢驗(yàn)的決策為:
若|X-μ0|≤Δ,不能拒絕H0;若|X-μ0|>Δ,拒絕H0。
②H0∶μ≤μ0H1∶μ>μ0(右側(cè)檢驗(yàn));
在顯著性水平μ下的檢驗(yàn)的接受域?yàn)椋?/p>
,這就給出了參數(shù)μ的1-α的置信上限。反之,對(duì)上述給定的μ的1-α的置信上限,我們也可以得到關(guān)于H0∶μ≤μ0H1∶μ>μ0的單側(cè)檢驗(yàn)問(wèn)題的顯著性水平α的檢驗(yàn),它們之間具有一一對(duì)應(yīng)關(guān)系。
對(duì)于單側(cè)置信區(qū)間,記Δ=μασ[]n,于是利用置信區(qū)間進(jìn)行右側(cè)假設(shè)檢驗(yàn)的決策為:
若X-μ0≤Δ,不能拒絕H0;若X-μ0>Δ,拒絕H0。
③類似于②,對(duì)于單側(cè)置信區(qū)間,記Δ=uασ[]n,于是利用置信區(qū)間進(jìn)行左側(cè)假設(shè)檢驗(yàn)的決策為:
若X-μ0>-Δ,不能拒絕H0;若X-μ0<-Δ,拒絕H0。
綜上所述,若記允許誤差為Δ=uα/2σ[]n(單側(cè)檢驗(yàn)中為μασm),則利用置信區(qū)間進(jìn)行假設(shè)檢驗(yàn)的決策準(zhǔn)側(cè)統(tǒng)一概括為:
若|X-μ0|≤Δ,不能拒絕H0;
若|X-μ0|>Δ,拒絕H0.
類似可考慮方差未知時(shí)的假設(shè)檢驗(yàn)問(wèn)題:若σ未知,用s進(jìn)行估計(jì),用t代替正態(tài)分布即可,見(jiàn)下表。
由上,對(duì)同一實(shí)例,當(dāng)進(jìn)行參數(shù)估計(jì)和假設(shè)檢驗(yàn),用的是同一樣本,統(tǒng)計(jì)量和分布也相同時(shí),可以利用置信區(qū)間進(jìn)行假設(shè)檢驗(yàn)。以幾個(gè)例子作為進(jìn)一步的說(shuō)明。
2 若干應(yīng)用
例1[1]有一種元件,對(duì)其平均使用壽命要求是應(yīng)達(dá)1000小時(shí),已知該種元件壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為100小時(shí),現(xiàn)從一批這樣的元件中,隨機(jī)抽取了49件,測(cè)得其平均壽命是950小時(shí)。試確定這批元件是否合格(α=0.05)。
解若使用壽命高于所要求的標(biāo)準(zhǔn)1000小時(shí),自然認(rèn)為元件為合格品,所以更關(guān)心置信下限值,因此,認(rèn)為這是左單側(cè)下限的檢驗(yàn)問(wèn)題。
H0∶μ≥1000H1∶μ<1000(左側(cè)檢驗(yàn))
當(dāng)α=0.05時(shí),uα=1.645,置信區(qū)間的下限值:
μ0-uασn=1000-1.645×10049=976.5
進(jìn)行決策示意圖如下所示
由上圖看出,若樣本均值x->976.5,不能拒絕原假設(shè),可以認(rèn)為這批元件合格;若x-≤976.5,則拒絕原假設(shè),認(rèn)為這批元件不合格。經(jīng)計(jì)算,本題中x-=950>976.5,故拒絕原假設(shè),認(rèn)為這批元件不合格。
置信區(qū)間中的允許誤差Δ=uασn=1.645×10049=23.5,利用置信區(qū)間進(jìn)行假設(shè)檢驗(yàn),|x--μ0|=|950-1000|=50,因?yàn)閨x--μ0|>Δ,所以拒絕H0。
用置信區(qū)間進(jìn)行檢驗(yàn)時(shí),好處是可以同時(shí)對(duì)幾個(gè)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。例如,從三批這樣的元件中分別抽取隨機(jī)樣本,測(cè)得使用壽命的均值分別為980,976,970,問(wèn)這三批元件是否合格?
解由以上討論,此問(wèn)題十分簡(jiǎn)單,若x-i(i=1,2,3)>9765,則認(rèn)為元件達(dá)到合格標(biāo)準(zhǔn),否則便認(rèn)為不合格。
例2[1]某種元件壽命記為X(小時(shí)),設(shè)X~N(μ,σ2),其中,μ,σ2未知,隨機(jī)抽取了16只元件,壽命測(cè)得如下:
280,264,149,170,101,159,224,168,379,212,179,222,485,362,250,260
問(wèn)是否可以認(rèn)為該元件的平均壽命大于225小時(shí)?(α=0.05)
解本題σ2未知,是關(guān)于μ右單側(cè)上限檢驗(yàn)問(wèn)題。
H0∶μ≤225H1∶μ>225(右側(cè)檢驗(yàn))
置信區(qū)間的上限值:μ0+ta(n-1)sn=225+1.7531×98.72616=268.2691
(α=0.05,t0.05(15)=1.7531)
由上圖看出,若樣本均值x-<268.2691,不能拒絕原假設(shè),可以認(rèn)為這批元件的平均壽命大于225小時(shí),否則,拒絕原假設(shè)。本例中x-=241.5<268.2691,故不能拒絕原假設(shè)。
置信區(qū)間中的允許誤差Δ=tα(n-1)sn=1.7531×98.72616=43.2691,利用置信區(qū)間進(jìn)行假設(shè)檢驗(yàn),|x--μ0|=|241.5-225|=16.5,因|x--μ0|<Δ,無(wú)充足理由拒絕H0。
參考文獻(xiàn):
[1]賈俊平,何曉群,金勇進(jìn),等.統(tǒng)計(jì)學(xué)(第三版)[M].北京:中國(guó)人民大學(xué)出版社,2007.
[2]楊萍,敬斌.工程數(shù)學(xué)(下冊(cè))[M].西安:西安電子科技大學(xué)出版社,2016.
[3]茆詩(shī)松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計(jì)教程(第二版)[M].北京:高等教育出版社,2011.
[4]蘭沖鋒.統(tǒng)計(jì)學(xué)教學(xué)中關(guān)于假設(shè)檢驗(yàn)問(wèn)題探討[J].湖南城市學(xué)院學(xué)報(bào)(自然科學(xué)版),2016,25(2)303304.
基金項(xiàng)目:陜西省教育廳專項(xiàng)科研計(jì)劃資助項(xiàng)目(17JK1023)
作者簡(jiǎn)介:劉素兵(1980),女,河北邢臺(tái)人,碩士,講師,主要從事統(tǒng)計(jì)研究。