俞雪梨
摘要:假設(shè)檢驗(yàn)有雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)之分,實(shí)際應(yīng)用的過程中,通常把假設(shè)檢驗(yàn)的實(shí)施流程化,而沒有去深究實(shí)施流程邏輯上的嚴(yán)密性。文章研究了單側(cè)檢驗(yàn)中的這個(gè)邏輯問題,使得單側(cè)檢驗(yàn)的實(shí)施流程更加嚴(yán)密。
關(guān)鍵詞:假設(shè)檢驗(yàn);單側(cè)檢驗(yàn);邏輯嚴(yán)密
中圖分類號(hào):G642.0 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2019)31-0195-02
一、假設(shè)檢驗(yàn)的基本流程
高等金融類院校和工科院校均開設(shè)了“統(tǒng)計(jì)學(xué)”這門核心課程,其中假設(shè)檢驗(yàn)由于廣泛應(yīng)用于金融、生物技術(shù)、教育學(xué)、心理學(xué)等多個(gè)領(lǐng)域,因而備受重視,與此同時(shí),該部分內(nèi)容涉及比較深的統(tǒng)計(jì)思想,因而也是教學(xué)中的難點(diǎn)。為了降低學(xué)生學(xué)習(xí)的難度,在教學(xué)過程中,通常把假設(shè)檢驗(yàn)的流程程序化和步驟化,一般總結(jié)為以下幾個(gè)步驟。
第一步:提出原假設(shè)H和備擇假設(shè)H;第二步:確定檢驗(yàn)統(tǒng)計(jì)量;第三步:根據(jù)顯著性水平,確定拒絕域;第四步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的實(shí)現(xiàn)值;第五步:驗(yàn)證第四步檢驗(yàn)統(tǒng)計(jì)量的實(shí)現(xiàn)值是否掉入拒絕域,得出結(jié)論。
下面用一個(gè)例子來說明這五個(gè)步驟的實(shí)施。
例1:某大學(xué)所有學(xué)生都擁有手機(jī),一年前,所有學(xué)生每月的手機(jī)話費(fèi)支出的均值為100元。一年之后的現(xiàn)在,從該校所有學(xué)生中隨機(jī)抽取100名同學(xué)進(jìn)行調(diào)查,發(fā)現(xiàn)他們每月的手機(jī)話費(fèi)支出的均值為110元,標(biāo)準(zhǔn)差為30元。據(jù)此,在顯著性水平為α=0.05下能否認(rèn)為所有學(xué)生每月的手機(jī)話費(fèi)均值已不同于一年以前?
解:第一步:依題意,如果用μ代表現(xiàn)在所有學(xué)生每月話費(fèi)的均值,一年前話費(fèi)均值μ=100元,原假設(shè)為H:μ=μ=100,備擇假設(shè)是原假設(shè)的對立面,即為H:μ≠100元。第二步:考慮到總體標(biāo)準(zhǔn)差σ未知,并且樣本容量很大,使用z=N(0,1)作為檢驗(yàn)統(tǒng)計(jì)量。第三步:當(dāng)X的值太大或者太小,與檢驗(yàn)值100差距很大時(shí),是小概率事件,此時(shí)檢驗(yàn)統(tǒng)計(jì)量
Z=~N(0,1)將會(huì)是一個(gè)很小的負(fù)數(shù)或是一個(gè)很大的正數(shù),結(jié)合顯著性水平α=0.05,說明這兩塊區(qū)域的面積加起來要等于0.05,查正態(tài)分布的分位數(shù)表可得,右邊的分位點(diǎn)為1.96,由于對稱性,左邊的分位點(diǎn)為-1.96,即拒絕域?yàn)閦>1.96或z<-1.96(如圖1)。第四步:將樣本數(shù)據(jù)及原假設(shè)成立時(shí)μ=μ=100代入計(jì)算檢驗(yàn)統(tǒng)計(jì)量的實(shí)現(xiàn)值,得z===
3.33。第五步:由于3.33>1.96,掉入右側(cè)拒絕域,因此拒絕原假設(shè)H,認(rèn)為現(xiàn)在該校所有學(xué)生每月話費(fèi)的均值已不同于一年以前的100元。
二、單側(cè)檢驗(yàn)中存在的問題
例2:在例1中,抽取到的這100名學(xué)生每月的手機(jī)話費(fèi)支出的均值為110元,比一年前所有學(xué)生每月手機(jī)話費(fèi)均值100元是有所提高的,一個(gè)很自然的問題是,在顯著性水平為α=0.05下,能否認(rèn)為所有學(xué)生每月的手機(jī)話費(fèi)均值比一年以前有顯著的提高?
解:第一步:顯然這是屬于單側(cè)假設(shè)檢驗(yàn)問題,原假設(shè)為H:μ≤100元,備擇假設(shè)為H:μ>100元。第二步,檢驗(yàn)統(tǒng)計(jì)量仍然為z=N(0,1)。第三步:原假設(shè)是H:μ≤100,樣本均值反映了總體均值的真實(shí)情況,當(dāng)?shù)闹堤?,比檢驗(yàn)值100大很多時(shí),是在原假設(shè)成立時(shí)不太可能發(fā)生的小概率事件,此時(shí)依據(jù)小概率原理,我們將得出拒絕原假設(shè)的結(jié)論。因此拒絕域只在右邊,考慮到顯著性水平為0.05,查表得臨界值為1.6449,拒絕域?yàn)閦>1.6449。第四步:代入計(jì)算得檢驗(yàn)統(tǒng)計(jì)量的實(shí)現(xiàn)值z===3.33。第五步:由于3.33>1.6449,掉入拒絕域,拒絕原假設(shè)H,即可以認(rèn)為現(xiàn)在該校所有同學(xué)每月話費(fèi)的均值比一年以前的100元有顯著的提高。
大家在使用上述步驟時(shí),幾乎是“天經(jīng)地義”,沒有誰去質(zhì)疑它的邏輯嚴(yán)密性。問題出在哪里呢?在第四步中,在原假設(shè)成立的時(shí)候,計(jì)算檢驗(yàn)統(tǒng)計(jì)量的實(shí)現(xiàn)值,為什么代入μ=μ=100進(jìn)行計(jì)算呢?事實(shí)上,原假設(shè)μ≤100中μ不僅可以等于100,還可能是≤100的任何一個(gè)值。為什么只需要代入端點(diǎn)值μ=100進(jìn)行判斷就可以了呢?
三、單側(cè)檢驗(yàn)中邏輯問題的解決
事實(shí)上,在做假設(shè)檢驗(yàn)時(shí),把需要收集證據(jù)驗(yàn)證的假設(shè)放在備擇假設(shè)的位置上,要求在得出備擇假設(shè)是對的結(jié)論(即拒絕原假設(shè))時(shí),要有足夠的證據(jù)(小概率事件發(fā)生了)。由于檢驗(yàn)統(tǒng)計(jì)量z=是一個(gè)關(guān)于μ的遞減函數(shù),因此當(dāng)μ=μ=100算出的檢驗(yàn)統(tǒng)計(jì)量大于拒絕域,從而得出拒絕原假設(shè)的結(jié)論時(shí),把μ<100代入計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量將更大,就一定會(huì)掉入拒絕域中,同樣能夠保證拒絕原假設(shè)時(shí)證據(jù)的充分性。因此,在進(jìn)行單側(cè)檢驗(yàn)的時(shí)候,計(jì)算檢驗(yàn)統(tǒng)計(jì)量的實(shí)現(xiàn)值時(shí)只需把端點(diǎn)的值代入計(jì)算。
因?yàn)閜π<<π,pπ
0,因而Z′(π)<0,因此Z(π)是一個(gè)單調(diào)遞減函數(shù),這就保證了在總體比例的單側(cè)檢驗(yàn)中,假設(shè)檢驗(yàn)流程的第四步,可以使用原假設(shè)的臨界點(diǎn)代入計(jì)算檢驗(yàn)統(tǒng)計(jì)量的實(shí)現(xiàn)值。
參考文獻(xiàn):
[1]叢凌博.假設(shè)檢驗(yàn)的啟發(fā)式教學(xué)方法研究[J].價(jià)值工程,2012,(6):273.