白梅花 唐駿 羅寧 翟麗麗 劉興薇
基金項(xiàng)目:內(nèi)蒙古教育廳項(xiàng)目--《數(shù)學(xué)教育工學(xué)結(jié)合人才培養(yǎng)模式的建構(gòu)與實(shí)踐》(2013nmjg029)
摘 要 :本文以一個(gè)簡(jiǎn)單例子探討了統(tǒng)計(jì)中統(tǒng)計(jì)推斷的一項(xiàng)重要內(nèi)容--假設(shè)檢驗(yàn)及其相關(guān)的基本問(wèn)題。假設(shè)檢驗(yàn)是利用樣本對(duì)總體進(jìn)行某種推斷的方法。文中給出了對(duì)總體參數(shù)如何提出假設(shè);再如何利用樣本數(shù)據(jù)判斷這個(gè)假設(shè)成立與否;以及假設(shè)檢驗(yàn)方法可能犯的錯(cuò)誤等。
關(guān)鍵詞 :假設(shè)檢驗(yàn);統(tǒng)計(jì)量;拒絕域;錯(cuò)誤
中圖分類(lèi)號(hào):O21 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-3791(2015)01(c)0000-00
1.前言
假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的重要組成部分,是利用樣本對(duì)總體進(jìn)行某種推斷的方法。它先對(duì)總體參數(shù)的值提出一個(gè)假設(shè),然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。那么如何利用樣本信息,對(duì)假設(shè)成立與否作出判斷的一套程序是本文探討的內(nèi)容。
在現(xiàn)實(shí)生活中有大量的事例可以歸結(jié)為假設(shè)檢驗(yàn)的問(wèn)題。本文從下面例子談起。
2.假設(shè)檢驗(yàn)的一個(gè)例子
例:由統(tǒng)計(jì)資料得知,2008年某地新生兒的平均體重為3190克,現(xiàn)在從2010年的新生兒中隨機(jī)抽取100個(gè),測(cè)得其平均體重為3210克,問(wèn):2010年的新生兒與2008年相比,體重有無(wú)顯著差異?
解:從結(jié)果看,2010年新生兒平均體重比2008年新生兒平均體重增加了20克,但這20克的差異可能產(chǎn)生于抽樣的隨機(jī)性或可以理解為抽樣隨機(jī)性不可能造成20克這樣大的差異,新生兒體重確實(shí)有增加。那么,這20克的差異說(shuō)明了什么?下面我們可以采取假設(shè)的方法。
(1)提出假設(shè): 表示2010年新生兒平均體重; 表示2008年新生兒平均體重。假設(shè)2008年和2010年新生兒的體重沒(méi)有顯著差異,則原假設(shè)和備擇假設(shè)分別為
,
原假設(shè)與備擇假設(shè)互斥,肯定原假設(shè),意味著放棄備擇假設(shè);否定原假設(shè),意味著接受備擇假設(shè)。
(2)確定檢驗(yàn)統(tǒng)計(jì)量及檢驗(yàn)法:原假設(shè)是否成立呢?我們要借助樣本統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)推斷,這個(gè)統(tǒng)計(jì)量被稱(chēng)為檢驗(yàn)統(tǒng)計(jì)量。選擇哪個(gè)統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量需要考慮一些因素,例如,樣本是大樣本還是小樣本,總體標(biāo)準(zhǔn)差 已知還是未知,等等。
假定已知總體的標(biāo)準(zhǔn)差 ,樣本量 , , ,所以采用 統(tǒng)計(jì)量:
,
由抽樣分布原理知統(tǒng)計(jì)量 服從標(biāo)準(zhǔn)正態(tài)分布,故檢驗(yàn)用 檢驗(yàn)法。
(3)確定拒絕域:
如果顯著水平 ,則95%的 應(yīng)當(dāng)落在區(qū)間 內(nèi),即 內(nèi)。那么,我們把相應(yīng)的區(qū)間
即
稱(chēng)為拒絕原假設(shè)的拒絕域。如果原假設(shè)成立,那么在一次實(shí)驗(yàn)中 落入拒絕域: 內(nèi)的概率只有0.05,這個(gè)概率是很小的。如果這個(gè)情況真的出現(xiàn),我們有理由認(rèn)為總體的真值不是3190克,也即拒絕原假設(shè),接受備擇假設(shè)。
這利用的是小概率原理,小概率原理是指發(fā)生概率很小的隨機(jī)事件在一次實(shí)驗(yàn)中是幾乎不可能發(fā)生的。根據(jù)這一原理可以作出是否拒絕原假設(shè)的決定。但是什么樣的概率才算小呢?概率0.05夠小嗎?著名的英國(guó)統(tǒng)計(jì)學(xué)家費(fèi)希爾把小概率的標(biāo)準(zhǔn)定為0.05,雖然費(fèi)希爾并沒(méi)有對(duì)為什么選擇0.05給出充分的解釋?zhuān)藗冞€是沿用了這個(gè)標(biāo)準(zhǔn),把0.05或比0.05更小的概率看成小概率。
(4)檢驗(yàn)假設(shè)做出決策:把已知數(shù)據(jù) , , , 代入 算得
,落入拒絕域,所以拒絕原假設(shè),認(rèn)為與2008年相比,2010年新生兒的體重有顯著差異。
3.假設(shè)檢驗(yàn)兩類(lèi)錯(cuò)誤
對(duì)原假設(shè)提出的命題,我們依據(jù)樣本提供的信息需要做出真與偽的判斷,也就是由部分來(lái)推斷總體。因而判斷有可能正確,有可能不正確,也就是說(shuō),我們面臨著犯錯(cuò)誤的可能。所犯的錯(cuò)誤有兩種類(lèi)型,一類(lèi)錯(cuò)誤是原假設(shè) 為真卻被我們拒絕了,這種錯(cuò)誤稱(chēng)為棄真錯(cuò)誤;另一類(lèi)錯(cuò)誤是原假設(shè) 為偽我們卻沒(méi)有拒絕,這種錯(cuò)誤稱(chēng)為納偽錯(cuò)誤。
自然,人們希望犯這兩類(lèi)錯(cuò)誤的概率越小越好。那么只能增大樣本量 ,才能做到犯這兩類(lèi)錯(cuò)誤的概率都很小。但樣本量不可能沒(méi)有限制,否則就會(huì)使抽樣調(diào)查失去意義。但對(duì)于一定的樣本量 ,我們做不到犯這兩類(lèi)錯(cuò)誤的概率同時(shí)都很小。一般只能把帶來(lái)嚴(yán)重后果的一類(lèi)錯(cuò)誤作為首要的控制目標(biāo)即可。
4.拒絕域檢驗(yàn)的優(yōu)缺點(diǎn)
上面進(jìn)行檢驗(yàn)的方法是根據(jù)檢驗(yàn)統(tǒng)計(jì)量落入的區(qū)域作出是否拒絕原假設(shè)的決策。在確定顯著水平 以后,拒絕域的位置也就相應(yīng)確定了,其好處是進(jìn)行決策的界限清晰,但缺點(diǎn)是進(jìn)行決策面臨的風(fēng)險(xiǎn)是籠統(tǒng)的。在上例子中,計(jì)算的 ,落入拒絕域,我們拒絕原假設(shè),接受備擇假設(shè)。這時(shí)犯棄真錯(cuò)誤的概率為0.05。如果計(jì)算的 ,同樣落入拒絕域,我們拒絕原假設(shè)面臨的風(fēng)險(xiǎn)也是0.05。那么0.05是通用的風(fēng)險(xiǎn)概率,這是用拒絕域表示的弱點(diǎn)。
5.結(jié)束語(yǔ)
在實(shí)際問(wèn)題的檢驗(yàn)中,我們不可能對(duì)問(wèn)題的背景都有所了解,如何提出假設(shè),并沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),假設(shè)的確定通常與所要檢驗(yàn)的問(wèn)題的性質(zhì),檢驗(yàn)者所要達(dá)到的目的有關(guān)系,也與檢驗(yàn)者的經(jīng)驗(yàn)和知識(shí)水平有關(guān)。
另外,通常在假設(shè)檢驗(yàn)中把希望證明的命題放在備擇假設(shè)上,而把原有的、傳統(tǒng)的觀點(diǎn)放在原假設(shè)上,這樣我們的目的就是希望能夠用事實(shí)推翻原假設(shè),而接受備擇假設(shè)。由于推翻原假設(shè)需要檢驗(yàn)統(tǒng)計(jì)量落入拒絕域,所以在一次實(shí)驗(yàn)中原假設(shè)是具有優(yōu)勢(shì)的,由小概率原理,備擇假設(shè)在一次實(shí)驗(yàn)中不容易出現(xiàn),但一旦發(fā)生,我們就有充分的理由推翻原假設(shè),這意味著新結(jié)論的誕生。但是沒(méi)有拒絕原假設(shè),并不意味著備擇假設(shè)是錯(cuò)誤的,只是說(shuō)還沒(méi)有足夠的證據(jù)證明原假設(shè)不成立。所以說(shuō)我們接受備擇假設(shè)一定意味著原假設(shè)錯(cuò)誤;沒(méi)有拒絕原假設(shè)并不能表明備擇假設(shè)一定是錯(cuò)的。
【參考文獻(xiàn)】
[1] 茆詩(shī)松,澲小龍,程依明.概率論與數(shù)理統(tǒng)計(jì)簡(jiǎn)明教程[M].第1版.北京:高等教育出版社,2012.
[2] 趙彥暉,楊金林.概率統(tǒng)計(jì)[M].第1版.北京:科學(xué)出版社,2009.
[3] 賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)[M].第4版.北京:中國(guó)人民大學(xué)出版社,2009.
[4] 石林,張景.概率論與數(shù)理統(tǒng)計(jì)---理論與演練[M].第1版.成都:西南交通大學(xué)出版社,2013.