胡純嚴,胡良平,2*
(1.軍事科學院研究生院,北京 100850;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029
方差齊性檢驗就是檢驗某試驗因素兩個水平或多個水平下觀測的定量數(shù)據(jù)所代表的總體方差是否相等,它是定量資料均值比較的重要前提條件之一。通常,方差齊性檢驗分為單因素兩水平設計與單因素多水平設計下一元定量資料方差齊性檢驗兩種情形。在第一種情形下,只有一種F檢驗法;而在第二種情形下,有三種F檢驗法和一種χ2檢驗法。本文將介紹前述提及的五種方差齊性檢驗法,并通過三個實例和SAS軟件實現(xiàn)各種方差齊性檢驗。
在進行兩個或多個均值比較時,若希望采用經(jīng)典統(tǒng)計學中的參數(shù)檢驗法[(包括Z檢驗、t檢驗和方差分析(或稱F檢驗)],定量資料應滿足三個前提條件:獨立性、正態(tài)性和方差齊性。當只有一個兩水平的試驗因素時,方差齊性檢驗的方法比較簡單,只需要用較大的樣本方差除以較小的樣本方差,依據(jù)F分布,就可推斷兩總體方差是否相等;然而,當只有一個試驗因素且水平數(shù)大于2時,就不適合采取前述的方法進行方差齊性檢驗。SAS/STAT的GLM過程[1]中介紹了四種方差齊性檢驗方法,將在下文進行闡述。
當試驗研究涉及多個試驗因素時,傳統(tǒng)的做法仍然是對每一個試驗因素分別進行方差齊性檢驗。若采用混合效應模型進行方差分析,在SAS/STAT的MIXED過程中,改變了思路,不直接檢驗各前提條件是否滿足,而是假設給定的定量資料具有某種“方差和協(xié)方差結構”。基于特定的假設去構造混合效應模型,并計算一系列衡量模型對給定定量資料擬合效果的評價指標或統(tǒng)計量。分別采用多種可能的“方差和協(xié)方差結構”對同一個資料進行建模,最后,依據(jù)前述提及的評價指標的數(shù)值來確定哪個混合效應模型能最好地擬合給定的資料[1-2]。
式(1)中,F(xiàn)服從分子自由度為df1、分母自由度為df2的F分布。拒絕域:F≥F(1-α/2)(df1,df2),則p≤α(注:此時宜采用雙側(cè)檢驗)。
兩總體方差齊性檢驗屬于雙側(cè)檢驗,而通常的基于均值比較的方差分析(F檢驗)屬于單側(cè)檢驗。理由如下:在方差齊性檢驗中,無效假設為兩總體方差相等。若拒絕此無效假設,就意味著兩總體方差不等,此時,第1個總體方差可能大于第2個總體方差,也可能小于第2個總體方差;而在基于均值比較的方差分析(F檢驗)中,無效假設為各組均值相等,在此假設成立的條件下,所構造的檢驗統(tǒng)計量F的分子為“組間方差”,分母為“組內(nèi)方差(或誤差方差)”。通常檢驗統(tǒng)計量F的分子大于等于分母,故此時宜采用單側(cè)檢驗。
1.3.1 Bartlett’s χ2檢驗
Bartlett提出了一種等方差檢驗,這是對正態(tài)理論似然比檢驗的修正。用于方差齊性檢驗的Bartlett’sχ2檢驗的原理如下[3-4]。設有k個總體,每個總體的方差為,則建立檢驗假設如下,H1:k個總體方差不等或不全相等。構造檢驗統(tǒng)計量見式(2):
式(2)中,若k個樣本均來自獨立的正態(tài)分布總體,則χ2服從自由度為df=k-1的χ2分布;拒絕域為q和h分別見式(3)、式(4):
式(3)中,“l(fā)g”代表取以10為底的常用對數(shù),ni代表從第i個總體中抽取樣本的樣本含量,N代表總樣本含量,為第i個總體的樣本方差,為合并的樣本方差,其計算見式(5):
Bartlett’sχ2檢驗可以通過 SAS 軟件實現(xiàn):調(diào)用SAS/STAT中的GLM過程時,在其內(nèi)的MEANS語句的選項中加上“HOVTEST=BARTLETT”[1]。
1.3.2 Levene’s F檢驗
導致對基礎分布更穩(wěn)健的檢驗方法是轉(zhuǎn)換因變量的原始值以導出離散變量,然后對該變量進行方差分析。方差同質(zhì)性檢驗的顯著性水平是離散變量方差分析F檢驗的P值。除Bartlett方差齊性檢驗外,PROC GLM中可用的所有方差齊性檢驗均使用此方法[1,4]。
Levene’s檢驗被廣泛認為是方差的標準同質(zhì)性檢驗(HOVTEST=Levene選項)。Levene’s檢驗采用前面討論的離散變量方差分析形式,其中離散變量為以下任一項:
采用式(6)或式(7)對原始數(shù)據(jù)yij做變量變換后,得到新數(shù)據(jù)zij。然后直接對新數(shù)據(jù)采用單因素k水平設計一元定量資料方差分析,對應的檢驗統(tǒng)計量見式(8):
在式(8)中,F(xiàn)服從分子自由度為k-1、分母自由度為N-k的F分布。
1.3.3 O′Brien’s F檢驗
O′Brien提出了一個檢驗(HOVTEST=OBRIEN),它基本是對Levene方法的一種修改,使用式(9)等號左邊的離散變量[1,4]:
式(9)中,ni是第i組的樣本大小,是其樣本方差。可以使用括號中的W=選項[例如:HOVTEST=OBRIEN(W=0.5)]來調(diào)整O′Brien的離散變量,以匹配設定分布的可疑峰度。默認情況下,W=0.5[1]。將式(9)代入式(8),就可實現(xiàn)對新變量進行方差分析,但其結果是O′Brien’s方差齊性檢驗的結果。
1.3.4 Brown-Forsythe’sF檢驗
Brown和Forsythe建議使用式(10),即組中位數(shù)的絕對偏差[1,4]:
在式(10)中,mi是第i組的中位數(shù)。可以使用HOVTEST=BF選項指定此檢驗。將式(10)代入式(8),就可以實現(xiàn)對新變量進行方差分析,其結果是Brown-Forsythe’s方差齊性檢驗的結果。
如果其中一項檢驗拒絕方差同質(zhì)性假設,則應使用Welch’s方差分析而不是通常的方差分析來檢驗組間均值的差異。然而,只有當使用一個穩(wěn)健的方差齊性檢驗(即不適用于HOVTEST=BARTLETT)時,這個結論才成立;即使如此,任何方差齊性檢驗的能力都太小,無法始終檢驗Welch’s方差分析是否合適[1]。
【例1】研究呼出氣冷凝液中氮氧化物與哮喘發(fā)病的關系。探討哮喘急性發(fā)作期患者和健康體檢者呼出氣冷凝液中氮氧化物的水平,了解其與哮喘發(fā)病、病情變化及肺功能的關系。選取13例哮喘急性發(fā)作期患者和13名健康體檢者,兩組重要的基礎資料比較差異均無統(tǒng)計學意義,哮喘急性發(fā)作期患者與健康體檢者的氧氮化物含量(單位:μmol/L)數(shù)據(jù)如下[5]。哮喘急性發(fā)作組:0.62、1.28、1.44、0.26、1.19、1.03、2.11、1.38、1.40、1.42、0.96、2.27、1.55;健康對照組:0.93、0.68、0.54、0.18、0.82、0.88、0.54、1.00、0.94、0.31、0.72、0.25、0.88。試問兩組定量資料所取自的兩個總體的方差是否相等?
【例2】抽樣測定了32名蓄電池廠工人的尿ALA(尿氨基-γ-酮戊酸)含量(單位:μmol/L),平均值為53.8662,方差為2460.4768;測定了6名化工廠工人的尿ALA含量,平均值為26.5640,方差為52.6150。試問兩廠工人尿ALA含量的方差是否相等[3]?
【例3】賓夕法尼亞大學一項嗅覺鑒定測試[1],旨在探索年齡和性別與嗅覺的關系。共有180名20~89歲的受試者暴露于40種不同的氣味中,對于每種氣味,受試者被要求從四個詞中選擇一個最能描述該氣味的詞。Freeman-Tukey修正的反正弦變換用于正確識別氣味的比例,得出嗅覺指數(shù)。將受試者分為五個年齡組:年齡≤25歲、25歲<年齡≤40歲、40歲<年齡≤55歲、55歲<年齡≤70歲、年齡>70歲。設年齡分組變量為agegroup,嗅覺指數(shù)變量為smell。試驗數(shù)據(jù)較多,此處從略,參見文獻[1]。試檢驗五個年齡組受試對象嗅覺指數(shù)的方差是否相等?
【分析與解答】這是一個單因素兩水平設計(常簡稱為成組設計)一元定量資料,若希望采用單因素兩水平設計一元定量資料t檢驗,需要先檢查前提條件是否滿足,方差齊性檢驗是其中的一個。設所需要的SAS程序如下:
【SAS程序說明】在以上程序中,只調(diào)用了PROC TTEST過程,因為該過程中包含了兩總體方差齊性檢驗,但未對定量資料進行正態(tài)性檢驗。因此,還需要使用PROC UNIVARIATE過程實現(xiàn)正態(tài)性檢驗;若資料不滿足正態(tài)性和方差齊性,還需要調(diào)用PROC NPAR1WAY過程對定量資料進行秩和檢驗。
【SAS輸出結果及解釋】
因F=3.67,df1=df2=12,P=0.0328<0.05,說明兩總體方差不等。
【分析與解答】這是一個單因素兩水平設計一元定量資料(缺乏詳細的原始數(shù)據(jù)),若希望采用單因素兩水平設計一元定量資料t檢驗,需要先檢查前提條件是否滿足,方差齊性檢驗是其中的一個。設所需要的SAS程序如下:
【SAS程序說明】由于缺乏詳細的原始數(shù)據(jù),無法利用SAS中的PROC TTEST過程實現(xiàn)方差齊性檢驗,只能用兩樣本方差比的計算公式,并利用F分布的分位數(shù)函數(shù)FINV(1-α/2,df1,df2)計算F分布曲線下橫坐標上的上側(cè)臨界值(按雙側(cè)檢驗來確定)[6]。
【SAS輸出結果及解釋】
在輸出結果中,var1和var2分別代表兩個樣本方差,F(xiàn)=46.7638為檢驗統(tǒng)計量的值,F(xiàn)005和F001代表與顯著性水平α分別等于0.05和0.01對應的雙側(cè)檢驗的臨界值。由F=46.7638>F001=12.6395,故得到P<0.01,說明兩總體方差不等。由于var1=2460.48>var2=52.615,說明蓄電池廠工人尿ALA含量的變異度大于化工廠工人尿ALA含量。
【分析與解答】這是一個單因素五水平設計一元定量資料,若希望采用單因素五水平設計一元定量資料方差分析,需要先檢查前提條件是否滿足,方差齊性檢驗是其中的一個。設所需要的SAS程序如下:
【SAS程序說明】在SAS過程步中有4個“MEANS語句”,分別代表4種具體的方差齊性檢驗方法。其中,后3個被放置在注釋語句“/**/”中,被當作注釋(不被SAS系統(tǒng)執(zhí)行);每次只能讓一個“MEANS語句”處于可被執(zhí)行的狀態(tài)。
【SAS輸出結果及解釋】
第一,采用Bartlett’s方法進行方差齊性檢驗的計算結果。
以上呈現(xiàn)的是各年齡組smell的平均值和標準差的計算結果(注:第2列為樣本含量)。
以上呈現(xiàn)的是采用Bartlett’s方法對五組定量資料(smell)進行方差齊性檢驗的結果,其中,說明該定量資料不滿足方差齊性要求。
第二,采用Brown-Forsythe’s方法進行方差齊性檢驗的計算結果。
以上呈現(xiàn)的是采用Brown-Forsythe’s方法對五組定量資料(smell)進行方差齊性檢驗的結果,其中F=5.47,df=4,P<0.0004,說明該定量資料不滿足方差齊性要求。
第三,采用Levene’s方法進行方差齊性檢驗的計算結果。
以上呈現(xiàn)的是采用Levene’s方法對五組定量資料(smell)進行方差齊性檢驗的結果,其中F=6.35,df=4,P<0.0001,說明該定量資料不滿足方差齊性要求。
第四,采用O′Brien’s方法進行方差齊性檢驗的計算結果。
以上呈現(xiàn)的是采用O′Brien’s方法對五組定量資料(smell)進行方差齊性檢驗的結果,其中F=6.16,df=4,P=0.0001,說明該定量資料不滿足方差齊性要求。
當數(shù)據(jù)的基本分布為正態(tài)時,Bartlett’sχ2檢驗具有準確的I型錯誤率和最佳功效,但如果該分布稍不正態(tài),則可能不準確。因此,一般情況下,SAS不建議使用 Bartlett’sχ2檢驗[1]?;趯υ级抠Y料進行變量變換后的三種F檢驗(即Levene’sF檢驗、O′Brien’sF檢驗和Brown-Forsythe’sF檢驗),對于變換后的新數(shù)據(jù)而言,在本質(zhì)上就是“基于均值比較的方差分析”,實現(xiàn)了對原始數(shù)據(jù)的方差齊性檢驗。采用以上4種方法對本文例1的定量資料進行方差齊性檢驗,得到結果匯總?cè)缦拢?/p>
Bartlett’sχ2檢驗法:χ2=4.5524,df=1,P=0.0329(單側(cè)概率)。Levene’sF檢驗法:F=3.21,df1=1,df2=24,P=0.090(單側(cè)概率)。Brown-Forsythe’sF檢驗法:F=1.64,df1=1,df2=24,P=0.2131(單側(cè)概率)。O′Brien’sF檢驗法:F=2.86,df1=1,df2=24,P=0.104(單側(cè)概率)。
以上4種檢驗結果僅Bartlett’sχ2檢驗的結果與例1的基于方差比的檢驗結果完全一致,其他3種檢驗得出了相反的結論。由于例1的兩組定量資料均服從正態(tài)分布,故Bartlett’sχ2檢驗的結果精確度高。
本文對五種方差齊性檢驗的理論和方法進行了詳細介紹,呈現(xiàn)了兩種具有不同數(shù)據(jù)結構的單因素兩水平設計一元定量資料,并采用兩種途徑實現(xiàn)了方差齊性檢驗;對于單因素多水平設計一元定量資料,基于SAS中的PROC GLM過程實現(xiàn)了三種F檢驗和一種χ2檢驗。