王麗麗
(合肥學(xué)院數(shù)學(xué)與物理系,安徽 合肥 230601)
假設(shè)檢驗是推斷統(tǒng)計的重要組成部分。推斷統(tǒng)計是一種根據(jù)樣本數(shù)據(jù)來推斷總體特征的方法,它是在對樣本數(shù)據(jù)描述的基礎(chǔ)上,以概率的形式對總體的未知特征(如均值、方差、分布等)進(jìn)行表述。利用樣本數(shù)據(jù)對總體特征的推斷通常分為兩種情況:參數(shù)假設(shè)檢驗與非參數(shù)假設(shè)檢驗檢驗。假設(shè)檢驗所依據(jù)的原理是小概率原理。其基本思路是首先對總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息以一定的概率來判斷原假設(shè)是否成立。根據(jù)假設(shè)檢驗的基本思想,假設(shè)檢驗可歸納為四個基本步驟:
(1)根據(jù)具體的問題,建立原假設(shè)和備擇假設(shè)。 原假設(shè)一般是研究者想收集證據(jù)予以反對的假設(shè);備擇假設(shè)一般是研究者想收集證據(jù)予以支持的假設(shè)。由于假設(shè)檢驗中只有在小概率事件發(fā)生的情況下才拒絕原假設(shè),因此在假設(shè)檢驗過程中原假設(shè)是受到保護(hù)的。它們有三種形式:雙側(cè)檢驗、左側(cè)檢驗、右側(cè)檢驗。采用哪種形式要根據(jù)實際問題。
(2)構(gòu)造一個合適的統(tǒng)計量,計算其抽樣分布。
(3)給定顯著性水平α,確定臨界值,拒絕域和接受域。
(4)根據(jù)樣本的值計算統(tǒng)計量的數(shù)值并作出決策。從概率的角度來講,如果統(tǒng)計量取值的概率小于或等于顯著性水平,表明小概率事件發(fā)生了,因此拒絕原假設(shè),反之,不能拒絕原假設(shè)。(P值)如果統(tǒng)計量的值正好落在拒絕域內(nèi),那么拒絕原假設(shè),如果落在接收域內(nèi),則不能拒絕原假設(shè),如果正好等于臨界值,也要拒絕原假設(shè)。
我們這里重點討論參數(shù)假設(shè)檢驗中的T檢驗。T檢驗作為參數(shù)假設(shè)檢驗的重要方法,在生產(chǎn)與實踐中有著廣泛的應(yīng)用。T檢驗也需要經(jīng)過上述四個基本步驟,我們應(yīng)重點研究不同T檢驗的目的、前提條件和相應(yīng)的統(tǒng)計量。
單樣本T檢驗的目的是根據(jù)總體的樣本數(shù)據(jù),推斷總體的均值與待檢驗值之間是否有顯著差異。它是對單個總體均值的假設(shè)檢驗。
單樣本T檢驗指的是研究問題中僅有一個總體,其前提是樣本數(shù)據(jù)來自服從正態(tài)分布或近似正態(tài)分布的總體,且總體方差未知。
假設(shè)總體分布為正態(tài)分布 N(μ,σ2),T檢驗統(tǒng)計量的數(shù)學(xué)定義為:
式中,S為樣本均方差,T統(tǒng)計量服從自由度為n-1的T分布。
SPSS 軟件自動將樣本均值、μ0、樣本方差、樣本量代入式(1),計算出T統(tǒng)計量的觀測值和對應(yīng)的概率P值。
例1:成蝦的平均體重一般為21g。在配合飼料中添加0.5%的酵母培養(yǎng)物飼養(yǎng)成蝦時,隨機抽取16只對蝦,體重為(單位:克)
試檢驗添加0.5%的酵母培養(yǎng)物飼養(yǎng)成蝦時是否提高了成蝦體重?
解:SPSS輸出結(jié)果如下:
p=0.041<0.05,所以拒絕原假設(shè) Test Value=21,又因為樣本均值21.519>21,認(rèn)為在飼料中添加酵母培養(yǎng)物顯著提高了成蝦體重。
兩獨立樣本T檢驗的目的是根據(jù)兩個總體的獨立樣本,推斷兩個總體的均值是否有顯著差異。
該檢驗的前提條件是:兩個總體服從正態(tài)分布或近似正態(tài)分布;且兩樣本相互獨立,即來自一個總體的樣本與來自另一總體的樣本互相不影響,兩組樣本的樣本量相等也可以不相等。
于是,兩個總體均值差檢驗的檢驗統(tǒng)計量為T統(tǒng)計量,表達(dá)式為:
式中,由 于 μ1-μ2=0(原 假 設(shè) ),故 略 去 。 在第一種情況下,式(5)服從自由度為 n1+n2-2的T分布;在第二種情況下,服從修正自由度的T分布,修正自由度為:
所以兩總體方差相等與否是計算抽樣分布方差的關(guān)鍵。因此,有必要對兩總體方差是否相等進(jìn)行統(tǒng)計檢驗。該原假設(shè)是:兩個總體方差無顯著差異,表述為:
SPSS中通過Levene F方法進(jìn)行檢驗。Levene F方法是通過判斷兩樣本的方差是否相等來間接推斷兩個總體的方差是否存在差異的。SPSS軟件將自動計算F統(tǒng)計量和概率P值,并將兩樣本的均值、樣本量、抽樣分布方差等代入式(5),計算T 統(tǒng)計量的觀測值和相應(yīng)的概率P值。
例2:為了估計兩種方法組裝產(chǎn)品所需要時間的是否存在顯著差異,分別對兩種不同的組裝方法隨機安排12個工人,每個工人組裝一件產(chǎn)品所需的時間(分鐘)。
表2 兩種方法組裝產(chǎn)品所需的時間
試以5%的顯著性水平判斷兩種方法組裝產(chǎn)品所需的時間是否存在顯著差異。
解:SPSS輸出結(jié)果如下:
在 Levene’s Test for Equality of Variances (方 差齊性檢驗)中,F(xiàn)=.011,p=0.917>0.05,接受原假設(shè),即認(rèn)為方差是齊的。從而,看方差齊那一行的計算結(jié)果。此時t-test for Equality of Means(兩均值比較的t檢驗)中,p=0.042<0.05,所以拒絕原假設(shè),認(rèn)為兩種方法下的平均時間存在顯著差異。
表3 Independent Samples Test
兩配對樣本T檢驗的目的是根據(jù)兩個總體的配對樣本,推斷兩個總體的均值是否存在顯著差異。
兩配對樣本T檢驗與兩獨立樣本T檢驗的顯著差別是要求兩組樣本是配對的。配對樣本是對某事物兩個側(cè)面的描述,也可是在“前”、“后”兩種狀態(tài)下某種屬性的兩種不同的特征。其中的差別在于抽樣是相互關(guān)聯(lián)的,而不是相互獨立。
配對樣本一般有兩個特征:第一,兩組樣本的樣本量相同;第二,兩組樣本觀測值的先后順序是一一對應(yīng)的,不能隨意更改。
表4 10名學(xué)生兩套試卷的得分
兩配對樣本T檢驗是通過轉(zhuǎn)化為單樣本T檢驗來實現(xiàn)的,即轉(zhuǎn)化成推斷差值序列總體的均值是否與0存在顯著差異,其檢驗統(tǒng)計量與單樣本T檢驗類似。所以,它要求樣本配對,觀測值數(shù)量相同且順序不能隨意更改。SPSS軟件將計算兩組樣本的差值,并將數(shù)據(jù)代入式(1),計算出T統(tǒng)計量的觀測值和對應(yīng)的概率P值。
表5 Paired Samples Test
例3:由10名學(xué)生組成一個隨機樣本,讓他們分別采用A和B兩套試卷進(jìn)行測試。
試以5%的顯著性水平確定兩套試卷的平均分有無顯著差異。
解:SPSS輸出結(jié)果如下:
p=0.001<0.05,所以拒絕原假設(shè),認(rèn)為兩份試卷的平均成績有顯著差異。
通過上面的討論,可以發(fā)現(xiàn)三種T檢驗的分析方法有一些共同之處,即在構(gòu)造T統(tǒng)計量時,它們的分母都是抽樣分布的標(biāo)準(zhǔn)差,分子都是均值之差。但是兩獨立樣本T檢驗與兩配對樣本T檢驗的抽樣分布的標(biāo)準(zhǔn)差不同。兩配對樣本T檢驗比兩獨立樣本T檢驗更進(jìn)了一步,因為它能對觀測值自身的其他影響因素加以控制。