摘 要:本文研究了在違背總體正態(tài)性假定時,通過研究檢驗功效的均值來方差分析與Kruskal-Wallis檢驗的優(yōu)劣。文中引入了置換方法,并基于蒙特卡羅模擬的研究兩種檢驗的功效。結果表明,在總體分布不對稱的情況下,非參數(shù)的Kruskal-Wallis檢驗優(yōu)于參數(shù)的方差分析方法。
關鍵詞:單因素方差分析;秩和檢驗;置換檢驗;檢驗功效
一、引言
統(tǒng)計學中總體,樣本,分布,估計和假設檢驗等都是最基本的概念。這里總體的分布都是事先給定的,我們的大部分工作是對未知參數(shù)作估計以及對參數(shù)各種檢驗。而在實踐案例中,總體的分布類型并不能隨便地假設。實驗數(shù)據(jù)可能不來自正態(tài)分布總體,而且可能是異方差的,也可能存在異常值,這種情況下使用傳統(tǒng)的參數(shù)統(tǒng)計方法可能會導致錯誤。所以我們就希望在不假定總體分布的前提下,從樣本數(shù)據(jù)本身入手獲取我們的信息。這就是非參數(shù)統(tǒng)計的思想。
Wilcox(1995)和Glass et al.(1972)曾經(jīng)做過關于違背正態(tài)假定情況下的方差分析研究。Wilcox發(fā)現(xiàn)總體的非正態(tài)性對第一類犯錯率有影響,但當方差相等時,其影響很小,而對于第二類犯錯率非正態(tài)性的影響相對顯著。Glass et al.則更多地從總體的偏度出發(fā),在方差相等時得出了和Wilcox相同的結論。Blair et al.(1980)做了一個關于T檢驗和Wilcoxon秩和檢驗的檢驗功效分析,研究發(fā)現(xiàn)當參數(shù)過程的假定滿足時,參數(shù)檢驗法比非參數(shù)檢驗法更好。那么當這些假定都不滿足時,如Likert尺度數(shù)據(jù),當我們用傳統(tǒng)的參數(shù)分析法時這些數(shù)據(jù)往往違背了正態(tài)性和方差齊性的假定。Nanna和Sawilowsky證明對這種數(shù)據(jù),Wilcoxon秩和檢驗比參數(shù)的T檢驗更具優(yōu)勢。Wilcoxon秩和檢驗法大、小樣本都有優(yōu)勢,且這種優(yōu)勢隨著樣本量的增大而增加。我們的研究目的是能否就傳統(tǒng)的參數(shù)方差分析法和Kruskal-Wallis檢驗法得到類似于Nanna和Sawilowsky的結論。
二、方差分析和Kruskal-Wallis檢驗
1.假定條件
方差分析的F檢驗被用來檢驗k個總體的均值是否相等,可設原假設為:
然而,在實際應用中F檢驗的正態(tài)性和方差齊性假定常常被忽略和違背,當數(shù)據(jù)不滿足正態(tài)分布的假定時,單因子方差分析估計出的p值也許也是不準確的。Kruskal-Wallis檢驗是一種類似于單因子方差分析的非參數(shù)檢驗方法,它不需要正態(tài)性的假定。像大多數(shù)非參數(shù)的檢驗方法一樣,它是基于觀測值的秩研究的,另外還假定每組觀測值都來自相同的分布。因為當分布的形狀不同時Kruskal-Wallis方法的檢驗結果可能是不準確的(參閱2009年Fagerland和Sandvik的研究)。替代原假設(1),Kruskal-Wallis檢驗的原假設是樣本來自相同的總體。
2.Kruskal-Wallis檢驗的原理
Kruskal-Wallis方法是用樣本的秩替代原始觀測值研究的,用1代表最小值,用2代表第二小值,依次類推,對相同的觀測值取秩的平均。相應的檢驗統(tǒng)計量H為:
三、置換檢驗均值的功效
1.置換檢驗
置換檢驗又稱為隨機化檢驗,是由經(jīng)典統(tǒng)計學創(chuàng)始人R.A.Fisher首次提出的,由于當時計算機技術的限制Fisher晚年時放緩了對置換檢驗的研究。隨機化檢驗是將數(shù)據(jù)重新隨機的分配以便基于排列后的數(shù)據(jù)計算出確切的p值。假設我們有三組數(shù)據(jù),每組有20個觀測值,那么就有種排列方法重新分配這三個小組。在實踐中這一龐大的工程是不可能實現(xiàn)的,于是我們采用蒙特卡羅抽樣的方法,即通過置換后的隨機樣本來估計所有可能的樣本結果。
多重置換檢驗的步驟如下:
2.方差檢驗和Kruskal-Wallis檢驗的功效比較
這里的檢驗效度是通過R程序指定分布的參數(shù)以產(chǎn)生需要的隨機數(shù),并通過蒙特卡羅模擬的方法來估計。如果參數(shù)在不同的均值情況下設定,那么可以得到經(jīng)驗的檢驗效度。通過這些結果,就可以分析方差檢驗和Kruskal-Wallis檢驗的檢驗功效,進而觀察在違背假定的情況下哪種方法更好。
四、檢驗實例
選取三種不同大小的樣本,在正態(tài)分布、對數(shù)正態(tài)發(fā)布、卡方分布下做模擬。設原假設為:
通過表1,可以看到在對稱分布中(正態(tài)分布б=1)Kruskal-Wallis檢驗的檢驗功效和相同情況下的參數(shù)檢驗的結果相差不大。
通過表2、表3,可以看到在非對稱分布中(對數(shù)正態(tài)分布б=1,或者自由度為3的卡方分布)非參數(shù)的Kruskal-Wallis檢驗的檢驗功效有著更好的檢驗性能,且n越大檢驗效度越高。所有圖形都基于函數(shù)d來呈現(xiàn)。
五、結論
經(jīng)模擬檢驗可以看到,在數(shù)據(jù)類型分布非對稱時,非參數(shù)的Kruskal-Wallis檢驗比傳統(tǒng)的單因子方差分析有更高的檢驗功效?,F(xiàn)實例子中我們大多遇見的數(shù)據(jù)都是非齊性的,且分布的類型也沒法確定,數(shù)據(jù)中也可能會出現(xiàn)比該組中大部分數(shù)據(jù)都要小很多或大的極端值,在這些情況下采用非參數(shù)的Kruskal-Wallis法效果會更優(yōu)。模擬結果同時顯示:在做檢驗之前,數(shù)據(jù)的集中趨勢分析是必要的。盡管文獻和教科書說,在違背假定的情況下,F(xiàn)檢驗是穩(wěn)健的,但檢驗結果告訴我們其檢驗性能顯著降低了。
參考文獻:
[1]吳喜之,趙博娟.非參數(shù)統(tǒng)計[M].北京:中國統(tǒng)計出版社,2009.
[2]王靜龍,梁小筠.非參數(shù)統(tǒng)計[M].北京:中國統(tǒng)計出版社,2009.
[3]于長春.秩和檢驗-Kruskal-Wallis法和Nemenyi法在科室醫(yī)療質量動態(tài)監(jiān)測中的應用[J].中國醫(yī)院統(tǒng)計,2009.
[4]王俊.實際應用中方差分析與秩和檢驗結果比較[J].中國衛(wèi)生統(tǒng)計,2008.