【摘要】假設(shè)檢驗(yàn)是統(tǒng)計(jì)學(xué)課程中十分重要的內(nèi)容。假設(shè)檢驗(yàn)教學(xué)中的難點(diǎn)是單尾檢驗(yàn)。本文闡述了如何通過分析專門設(shè)計(jì)的實(shí)例以及運(yùn)用統(tǒng)計(jì)分析軟件等方法講解單尾檢驗(yàn)的原理,以使學(xué)生能更深入地理解這部分內(nèi)容。
【關(guān)鍵詞】假設(shè)檢驗(yàn)單尾檢驗(yàn)統(tǒng)計(jì)分析軟件
【中圖分類號(hào)】G642.4【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2014)05-0209-01
統(tǒng)計(jì)假設(shè)檢驗(yàn)是統(tǒng)計(jì)學(xué)中重要而又獨(dú)特的一種思維方式,也是在實(shí)際中應(yīng)用十分廣泛的統(tǒng)計(jì)分析方法。筆者在多年的統(tǒng)計(jì)類課程的教學(xué)中發(fā)現(xiàn),假設(shè)檢驗(yàn)中的單尾假設(shè)檢驗(yàn)(one?鄄tailed hypothesis test)是教學(xué)中的一個(gè)難點(diǎn)。單尾假設(shè)檢驗(yàn)指要檢驗(yàn)總體參數(shù)值不大于或不小于某個(gè)特定值時(shí)所使用的一種假設(shè)檢驗(yàn)方法;因其拒絕域只是在抽樣分布的一側(cè)(左尾或右尾),故稱單尾檢驗(yàn)。對(duì)于單尾檢驗(yàn),學(xué)生通常覺得最難理解的是如何設(shè)定零假設(shè)(H0)和備擇假設(shè)(H1),比如,對(duì)一個(gè)給定的關(guān)于均值假設(shè)檢驗(yàn)的實(shí)際問題,是應(yīng)設(shè)定H0:μ≥μ0,H1:μ<μ0;還是設(shè)定H0:μ≤μ0, H1:μ>μ0。另外,對(duì)于使用兩種不同的設(shè)定而得出的不一致的結(jié)果應(yīng)如何解釋,學(xué)生一般也覺得較難理解。
筆者運(yùn)用了結(jié)合對(duì)特別設(shè)計(jì)的實(shí)例進(jìn)行深入分析和應(yīng)用統(tǒng)計(jì)分析軟件SPSS輔助教學(xué)的方法來解決這一難題,取得了良好的效果。
一、運(yùn)用實(shí)際例子深入剖析原理
在講了單尾檢驗(yàn)的概念之后,給出如下例子。
例1. 一個(gè)汽車輪胎制造廠商聲稱,該廠一等品輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于25000公里。而某批發(fā)商提出,如果使用隨機(jī)樣本的檢驗(yàn)結(jié)果能充分支持該廠商的說法,他將購(gòu)買大批這種輪胎。對(duì)一個(gè)由15個(gè)輪胎組成的隨機(jī)樣本作了試驗(yàn),得到的輪胎壽命(公里)分別為:24500、27230、21900、28900、32500、23200、25950、26620、21060、30500、31900、29200、27890、22530、24100。假定輪胎壽命近似服從正態(tài)分布,試問能否從這些數(shù)據(jù)做出結(jié)論:該廠商的產(chǎn)品同他所說的標(biāo)準(zhǔn)相符?(顯著性水平α=0.05)
首先讓學(xué)生試做這一例子。為了便于計(jì)算,給出樣本均值=26532和樣本標(biāo)準(zhǔn)差=3627。
試做的結(jié)果,大家的做法大致可歸納為兩種。
第一種,做出如下假設(shè):
H0:μ≤25000 , H1:μ>25000。
應(yīng)用t-檢驗(yàn),在這種假設(shè)下,拒絕域?yàn)門≥t0.05(14)=1.761,而實(shí)際計(jì)算的T值為:T=1.636;因而,結(jié)論是不拒絕H0。
第二種,做出如下假設(shè):
H0:μ≥25000 ,H1:μ<25000 。
在這種假設(shè)下,拒絕域?yàn)門≤-t0.05(14)=-1.761,實(shí)際的T值同樣為1.636;因而,結(jié)論是不拒絕H0。
接下來,讓學(xué)生思考:如何解釋這兩種看起來“矛盾”的結(jié)論?在討論中引導(dǎo)學(xué)生認(rèn)識(shí)這樣一點(diǎn):由于這兩種做法的結(jié)果都是不拒絕H0,因而兩者都有可能犯第二類錯(cuò)誤(即“取偽錯(cuò)誤”),而且第二類錯(cuò)誤的概率通常比第一類錯(cuò)誤(棄真錯(cuò)誤)的概率大,并且難以事先控制;從這個(gè)角度看,我們并沒有得出完全矛盾的結(jié)論。
至此,大家很自然就會(huì)提出:到底能否判斷哪種作法才是“對(duì)”的?實(shí)際中我們應(yīng)如何在兩種不同的假設(shè)中做出選擇?
在對(duì)這些問題的討論中,應(yīng)引導(dǎo)學(xué)生認(rèn)識(shí)選擇假設(shè)的一般原則是“將‘有很高可靠度才愿意接受’的結(jié)論放到H1”。原因在于,當(dāng)拒絕H0(接受H1)時(shí),犯錯(cuò)誤的概率被控制在α(即顯著性水平,通常是很小的數(shù),如,0.05)之內(nèi),即很有把握據(jù)此做出正確決策。但當(dāng)不拒絕H0(實(shí)際決策則為接受H0)時(shí),犯錯(cuò)誤的概率通常較大且難以確定,即并非很有把握據(jù)此做出正確決策。
因此,最后應(yīng)指出的是,選擇哪種假設(shè)歸結(jié)為一個(gè)“立場(chǎng)”問題(在本例中,即:是站在“買家”還是“賣家”的立場(chǎng))。對(duì)于“買家”而言,他們會(huì)選擇第一種假設(shè)方式;因?yàn)樗麄兊南敕ㄊ牵阂苡邪盐瘴也旁敢赓?gòu)買這種輪胎。而對(duì)于“賣家”而言,他們?cè)敢膺x擇第二種假設(shè)方式;因?yàn)樗麄冋J(rèn)為:你要很有把握才說我的輪胎質(zhì)量不行。
二、運(yùn)用SPSS加深對(duì)問題的理解
由上所述,可以看出,“買家”與“賣家”存在一個(gè)“矛盾域”,即如果T值落在區(qū)間(-1.761,1.761)之中,則雙方會(huì)有矛盾的結(jié)論。(如果T值不小于1.761,“買家”也會(huì)認(rèn)為輪胎質(zhì)量不錯(cuò),而如果T值不大于-1.761,“賣家”也不得不承認(rèn)質(zhì)量不行。)
通過增大樣本容量n,可緩解雙方的矛盾。從“矛盾域”的范圍來看,若n不是15而是20,則存在矛盾的區(qū)間變?yōu)椋ǎ?.729,1.729);若n為30,則區(qū)間變?yōu)椋ǎ?.699,1.699)。而n的增大對(duì)緩解雙方矛盾的更主要作用體現(xiàn)在它使實(shí)際T值的絕對(duì)值增大(T值與n的平方根成正比)。兩個(gè)不同容量的樣本,即使其均值和標(biāo)準(zhǔn)差都相同,其實(shí)際T值也不同,從而可能導(dǎo)致不同的檢驗(yàn)結(jié)論。
筆者運(yùn)用統(tǒng)計(jì)分析軟件SPSS設(shè)計(jì)出第二個(gè)例子,其樣本容量n=20,而樣本均值、標(biāo)準(zhǔn)差都與例1相同。通過使用SPSS對(duì)這兩個(gè)例子進(jìn)行對(duì)比分析,使學(xué)生充分認(rèn)識(shí)樣本容量在單尾檢驗(yàn)中扮演的角色,從而更深入理解單尾檢驗(yàn)的原理。
由于兩個(gè)例子中的樣本均值都大于檢驗(yàn)值(25000),故第二種假設(shè)的檢驗(yàn)結(jié)果必然都是不拒絕H0。下面我們對(duì)第一種假設(shè)進(jìn)行分析。
運(yùn)用SPSS進(jìn)行t-檢驗(yàn)的步驟為:
菜單操作:Analyze→Compare Means→One-Sample T Test→把要檢驗(yàn)的變量選入變量框→在檢驗(yàn)值框中輸入25000。
結(jié)果分析:例1的運(yùn)行結(jié)果為:T值=1.636,Sig.(2-tailed)=0.124。
SPSS的Sig.值即通常說的p-值,應(yīng)注意的是,由于系統(tǒng)中的Sig.值為雙尾的,故在做單尾檢驗(yàn)時(shí),應(yīng)取該值的一半作為單尾的p-值。因而,在這一例子中,p-值為0.062;按照當(dāng)p-值小于α值(在本例中為0.05)時(shí)拒絕H0的原則,檢驗(yàn)結(jié)論為不拒絕H0。
例2. 在例1的基礎(chǔ)上,再隨機(jī)抽取5個(gè)輪胎,其壽命(公里)分別為:29720、24430、25445、21532、31533。以20個(gè)輪胎為樣本進(jìn)行檢驗(yàn)。(α=0.05)
用SPSS對(duì)例2進(jìn)行分析,運(yùn)行結(jié)果為:
T值=1.889;Sig.(2-tailed)=0.074。即,在例2中,單尾的p-值為0.037,故檢驗(yàn)結(jié)論為拒絕H0。也就是說,接受輪胎平均壽命大于25000公里的結(jié)論。
注意到例2中的樣本均值=26532,樣本標(biāo)準(zhǔn)差=3627,與例1完全相同。但由于n的不同,導(dǎo)致T值和p-值都不相同,結(jié)論也完全不同。由此,可以看到n的增大對(duì)“買家”與“賣家”的矛盾有緩解作用,我們還可以將此與日常生活中的相應(yīng)情形聯(lián)系起來理解——“你如果還不相信,就再多試幾次嘛”。
這樣的統(tǒng)計(jì)分析軟件演示不但使學(xué)生更深入地理解了假設(shè)檢驗(yàn)的原理,而且也理解了樣本量在統(tǒng)計(jì)分析中的作用和重要性。
參考文獻(xiàn):
[1]陳秀虎,楊敏,白厚義.單尾假設(shè)檢驗(yàn)假設(shè)設(shè)置的探討[J].統(tǒng)計(jì)教育.2007(2):8-9.
[2]鐘路.對(duì)參數(shù)單尾假設(shè)檢驗(yàn)中存在的問題的探討[J].統(tǒng)計(jì)與決策.2004(11):27-28.
[3](美)戴維 R.安德森 等 著.張建華 等 譯.商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)(第11版)[M].北京:機(jī)械工業(yè)出版社.2012.