劉忠廣
(河南工程學(xué)院 工商管理學(xué)院,河南 鄭州 451191)
單個(gè)正態(tài)總體均值的假設(shè)檢驗(yàn)可以用SPSS等專業(yè)統(tǒng)計(jì)軟件來(lái)實(shí)現(xiàn),但這些專業(yè)統(tǒng)計(jì)軟件的普及性不夠.Excel軟件具有極強(qiáng)的普及性并且易于操作,其所帶的數(shù)據(jù)分析工具能滿足大多數(shù)數(shù)據(jù)處理的要求,但在進(jìn)行假設(shè)檢驗(yàn)時(shí),Excel的數(shù)據(jù)分析工具只提供了兩個(gè)總體參數(shù)檢驗(yàn)的方法,而沒(méi)有專門的對(duì)單個(gè)總體均值進(jìn)行檢驗(yàn)的現(xiàn)成工具,所以很有必要探討用Excel進(jìn)行單個(gè)正態(tài)總體均值檢驗(yàn)的便捷方法.
對(duì)于總體均值的檢驗(yàn)按照以下步驟來(lái)進(jìn)行:(1)提出假設(shè);(2)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量并計(jì)算統(tǒng)計(jì)量的值;(3)根據(jù)給定的顯著水平確定臨界值和拒絕域;(4)將統(tǒng)計(jì)量的值與臨界值進(jìn)行比較,做出決策.下面以實(shí)例來(lái)說(shuō)明.
例某醫(yī)生調(diào)查了20個(gè)難產(chǎn)嬰兒的出生體重,數(shù)據(jù)如下(單位為kg):3.88,3.31,3.34,3.82,3.30,3.16,3.84,3.10,3.90,3.18,3.05,3.22,3.28,3.34,3.62,3.28,3.30,3.22,3.54,3.30.已知一般嬰兒的平均出生體重為3.25 kg,能否認(rèn)為難產(chǎn)嬰兒的出生體重顯著大于一般嬰兒(給定顯著水平α=0.05).
解(1)提出假設(shè):H0∶μ=3.25,H1∶μ>3.25.
(2)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量并計(jì)算統(tǒng)計(jì)量的值.
(3)根據(jù)α=0.05,查自由度為19的t分布表得臨界值為1.729.
(4)將統(tǒng)計(jì)量的值與臨界值進(jìn)行比較,統(tǒng)計(jì)量t=2.476>1.729,故拒絕原假設(shè),認(rèn)為難產(chǎn)嬰兒的出生體重顯著大于一般嬰兒.檢驗(yàn)結(jié)果見(jiàn)圖1.
圖1 檢驗(yàn)結(jié)果Fig.1 Result of the test
(1)構(gòu)造工作表[1]. 在單元格A1輸入“難產(chǎn)嬰兒出生體重”,在A2~A21輸入上例中的數(shù)據(jù),在B2和C2分別輸入“總體均值的假設(shè)值”和“3.25”;在B3和C3分別輸入“置信水平”和“0.95”;在B6,B7和B8分別輸入“檢驗(yàn)統(tǒng)計(jì)量t”,“t臨界值(右側(cè)檢驗(yàn))”和“p值”,如圖1所示. C6,C7和C8的數(shù)值由下面的函數(shù)工具計(jì)算.(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量.在C6單元格輸入公式:“=(average(A2∶A21)-C2)/stdev(A2∶A21)/sqrt(count(A2∶A21))”.(3)計(jì)算臨界值tα,在C7單元格輸入公式“=tinv((1-C4),count(A2∶A21)-1)”.(4)計(jì)算p值,在C8單元格輸入公式“=tdist(C6,count(A2∶A21)-1,1)”.(5)根據(jù)以上的計(jì)算結(jié)果,p值(0.011 426)< 0.05(或統(tǒng)計(jì)量t=2.476>1.729 1),故拒絕原假設(shè),認(rèn)為難產(chǎn)嬰兒的出生體重顯著大于一般嬰兒.
在對(duì)兩個(gè)總體均值之差檢驗(yàn)時(shí),原假設(shè)和備擇假設(shè)分別有如下幾種情況:(1)H0∶μ1-μ2=0,H1∶μ1-μ2≠0;(2)H0∶μ1-μ2≥0,H1∶μ1-μ2<0;(3)H0∶μ1-μ2≤0,H1∶μ1-μ2>0.
使用的檢驗(yàn)統(tǒng)計(jì)量為
(1)
自由度為
(2)
現(xiàn)在考慮一種特殊的情形,假設(shè)總體2的各個(gè)值均為μ0,那么從總體2中抽取的若干個(gè)體組成的樣本2的各個(gè)值也均為μ0,則樣本2的均值和方差分別為
(3)
(4)
將式(3)和式(4)代入式(1)和式(2),則檢驗(yàn)統(tǒng)計(jì)量為
(5)
自由度為
(6)
在僅對(duì)總體1的均值進(jìn)行檢驗(yàn)時(shí),原假設(shè)和備擇假設(shè)分別為
(1)H0∶μ1=μ0,H1∶μ1≠μ0;(2)H0∶μ1≥μ0,H1∶μ1<μ0;(3)H0∶μ1≤μ0,H1∶μ1>μ0.
圖2 Excel數(shù)據(jù)Fig.2 Excel data
故上述內(nèi)容證明了單個(gè)正態(tài)總體均值的檢驗(yàn)和對(duì)兩個(gè)總體均值之差檢驗(yàn)的特殊情形(其中一個(gè)總體的各個(gè)體的值均相等)是一致的,所以對(duì)單個(gè)總體均值的檢驗(yàn)可以利用Excel中的數(shù)據(jù)分析來(lái)實(shí)現(xiàn).
打開(kāi)Excel,在單元格A1輸入“難產(chǎn)嬰兒出生體重”,將上例中的20個(gè)數(shù)據(jù)輸入到工作表的A2~A21;在單元格B1輸入“一般嬰兒出生體重”,B2單元格輸入3.25,再將3.25復(fù)制粘貼幾次即可(最少要有2個(gè)數(shù)據(jù),因?yàn)橹挥幸粋€(gè)數(shù)據(jù)時(shí)無(wú)法計(jì)算方差,本例為2個(gè)數(shù)據(jù)),如圖2所示,然后按如下步驟操作:
(1)選擇【工具】下拉菜單;(2)選擇【數(shù)據(jù)分析】選項(xiàng);(3)在分析工具中選擇【t檢驗(yàn),雙樣本異方差檢驗(yàn)】;(4)當(dāng)出現(xiàn)對(duì)話模型時(shí),在【變量1的區(qū)域】方框內(nèi)輸入數(shù)據(jù)區(qū)域A1∶A15,在【變量2的區(qū)域】方框內(nèi)輸入數(shù)據(jù)區(qū)域B1∶B3,在【假設(shè)的平均差】方框內(nèi)輸入0,在【標(biāo)志】前的方框內(nèi)打上“√”,在【ɑ】方框內(nèi)輸入0.05,在【輸出選項(xiàng)】中選擇輸出區(qū)域(本例中選擇“新工作表”),如圖3所示.然后選擇【確定】,輸出結(jié)果如圖4所示.
根據(jù)圖4中的結(jié)果可知,p值單尾(0.011 426)<0.05(或檢驗(yàn)統(tǒng)計(jì)量t=2.476>單尾臨界值1.729 1),故拒絕原假設(shè),認(rèn)為難產(chǎn)嬰兒的出生體重顯著大于一般嬰兒.
圖3 Excel工作表Fig.3 Excel work chart
圖4 Excel輸出Fig.4 Excel output
參考文獻(xiàn):
[1] 袁加軍,朱建平.統(tǒng)計(jì)基礎(chǔ)實(shí)驗(yàn)[M].廈門:廈門大學(xué)出版社,2010:103.
[2] 賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)[M].5版.北京:中國(guó)人民大學(xué)出版社,2012:171.
[3] 莊楚強(qiáng),何春雄.應(yīng)用數(shù)理統(tǒng)計(jì)基礎(chǔ)[M].3版.廣州:華南理工大學(xué)出版社,2006:107.