劉蓮花 (海南醫(yī)學(xué)院公共衛(wèi)生學(xué)院,海南 ???571199)
羅文強(qiáng) (中國(guó)地質(zhì)大學(xué)(武漢)數(shù)理學(xué)院,湖北 武漢 430074)
擬合優(yōu)度檢驗(yàn)功效比較
劉蓮花 (海南醫(yī)學(xué)院公共衛(wèi)生學(xué)院,海南 ???571199)
羅文強(qiáng) (中國(guó)地質(zhì)大學(xué)(武漢)數(shù)理學(xué)院,湖北 武漢 430074)
采用統(tǒng)計(jì)模擬的方法對(duì)6種正態(tài)性擬合優(yōu)度檢驗(yàn)方法的功效進(jìn)行了模擬比較,模擬中分別采用Beta分布、Gamma分布、T分布和Lognormal分布4種不同的偏正態(tài)分布函數(shù)進(jìn)行抽樣,最終得出6種檢驗(yàn)方法功效上的總體排序。
擬合優(yōu)度檢驗(yàn);檢驗(yàn)功效;統(tǒng)計(jì)模擬
擬合優(yōu)度檢驗(yàn)是統(tǒng)計(jì)理論的重要內(nèi)容,其與實(shí)際應(yīng)用有密切的聯(lián)系。現(xiàn)實(shí)生活中常常需要根據(jù)給定的樣本數(shù)據(jù)來(lái)檢驗(yàn)樣本是否來(lái)自某個(gè)特定的分布,以便進(jìn)一步的獲取樣本的某些信息,如疲勞壽命、可靠度等。但是實(shí)際應(yīng)用中常常出現(xiàn)這種問(wèn)題:同一樣本數(shù)據(jù)在相同的原假設(shè)分布下,有的擬合優(yōu)度檢驗(yàn)方法得出的結(jié)論是拒絕原假設(shè),而有的擬合優(yōu)度檢驗(yàn)方法得到的結(jié)論是接受原假設(shè)。出現(xiàn)這種問(wèn)題的原因是進(jìn)行擬合優(yōu)度檢驗(yàn)時(shí)很容易犯“拒真”和“納偽”2類(lèi)錯(cuò)誤。任何一種檢驗(yàn)方法,犯2類(lèi)錯(cuò)誤都是不可避免的,然而對(duì)于同一樣本,不同的擬合優(yōu)度檢驗(yàn)方法犯錯(cuò)誤的概率卻是不同的。一個(gè)好的檢驗(yàn),要求在控制第1類(lèi)錯(cuò)誤的前提下,第2類(lèi)錯(cuò)誤盡可能的小,也就是檢驗(yàn)的功效盡可能的高,因此出現(xiàn)上述問(wèn)題時(shí),應(yīng)以功效較高的檢驗(yàn)方法得出的結(jié)論為主,且在進(jìn)行擬合優(yōu)度檢驗(yàn)時(shí),應(yīng)盡量選擇功效高的擬合優(yōu)度檢驗(yàn)方法。為此,筆者對(duì)不同的擬合優(yōu)度檢驗(yàn)方法的功效進(jìn)行了模擬比較。
目前擬合優(yōu)度檢驗(yàn)的方法很多,因?yàn)檎龖B(tài)分布是最重要的分布,也是實(shí)際應(yīng)用最為廣泛的分布,所以筆者主要針對(duì)正態(tài)性檢驗(yàn)方法進(jìn)行討論。討論的統(tǒng)計(jì)量有D、W2、A2、Zc、Za和Zk,其數(shù)值計(jì)算公式[1-3]如下:
按照Neyman-Pearson原則[4],在所有水平為α的擬合優(yōu)度檢驗(yàn)中,功效函數(shù)[4]在備擇假設(shè)H1為真時(shí)越大,表明該檢驗(yàn)越好,也即檢驗(yàn)的功效越高,然而想求擬合優(yōu)度檢驗(yàn)的功效,其檢驗(yàn)問(wèn)題的備擇假設(shè),必須是具體的分布,所以筆者針對(duì)如下的具體問(wèn)題進(jìn)行討論:
H0:F(x)=F1(x)H1:F(x)=F2(x)
擬合優(yōu)度檢驗(yàn)的功效一般不易直接求出,為此筆者采用統(tǒng)計(jì)模擬[5]的方法,模擬的具體步驟如下:
步2 計(jì)算用某種檢驗(yàn)方法進(jìn)行擬合優(yōu)度檢驗(yàn)時(shí)統(tǒng)計(jì)量的值,并記m次重復(fù)模擬中統(tǒng)計(jì)量的值落于拒絕域的次數(shù)為t;
因?yàn)閷?duì)于不同的偏正態(tài)分布以及不同的樣本容量擬合優(yōu)度檢驗(yàn)的功效會(huì)有很大的差別,所以筆者主要選擇Beta分布、Gamma分布、T分布、Lognormal分布作為備擇分布進(jìn)行抽樣模擬[6-7],所抽取的樣本容量分別為10、30、50、60、70、80、100、150、200、250,模擬中的檢驗(yàn)水平α=0.05,并在模擬中不斷改變各分布的參數(shù),以便得到在不同的偏度和峰度時(shí)的功效模擬值,表1~4分別列出了4種備擇分布的參數(shù)取不同值時(shí)所對(duì)應(yīng)的偏度及峰度值,圖1~圖4是分別從4種不同的備擇分布中進(jìn)行抽樣模擬時(shí)的功效比較圖形,最后通過(guò)分析圖形對(duì)6種正態(tài)性檢驗(yàn)方法的功效進(jìn)行了總體的評(píng)價(jià)和排序。
3.1備擇假設(shè)為Beta分布
從功效模擬圖形1可得如下結(jié)論:①當(dāng)備擇分布Beta的偏度為零時(shí),D統(tǒng)計(jì)量的功效是最高的,但是若偏度非零則D統(tǒng)計(jì)量的功效最低,這說(shuō)明D統(tǒng)計(jì)量在檢驗(yàn)時(shí)對(duì)峰度比較靈敏而對(duì)偏度不靈敏。②當(dāng)備擇分布偏度非零時(shí),D統(tǒng)計(jì)量的功效隨樣本變化很小。③除D以外的其他5種統(tǒng)計(jì)量的功效隨著備擇分布偏度偏離于零的程度的增大而增加。④當(dāng)偏度非零時(shí),W2統(tǒng)計(jì)量的功效僅高于D統(tǒng)計(jì)量。⑤當(dāng)偏度非零時(shí),幾種統(tǒng)計(jì)量的功效排序大致為:Za>Zc>Zk>A2>W2>D。
表1 Beta分布中參數(shù)取不同值時(shí)的偏度及峰度
圖1 Normal VS Beta(原假設(shè)是Normal分布,備擇假設(shè)為Beta分布) 功效模擬比較圖
圖2 Normal VS T功效模擬比較圖
圖3 Gamma 功效模擬比較圖
3.2備擇假設(shè)為T(mén)分布
從功效模擬圖形2可得如下結(jié)論:①因?yàn)門(mén)分布是對(duì)稱(chēng)分布,即偏度為0,從圖中可發(fā)現(xiàn)D統(tǒng)計(jì)量的檢驗(yàn)功效是最高的,進(jìn)一步說(shuō)明了D統(tǒng)計(jì)量對(duì)峰度靈敏。②T分布中參數(shù)為3時(shí)偏離正態(tài)的程度大于參數(shù)為9時(shí)偏離正態(tài)的程度,相應(yīng)的各統(tǒng)計(jì)量的功效也較高,這說(shuō)明當(dāng)備擇分布偏離正態(tài)越嚴(yán)重,各檢驗(yàn)統(tǒng)計(jì)量的功效越高。
3.3備擇假設(shè)為Gamma分布
從功效模擬圖形3可得如下結(jié)論:①2個(gè)圖形中的備擇分布的偏度都是非零的,所對(duì)應(yīng)的D統(tǒng)計(jì)量的功效最低,進(jìn)一步說(shuō)明D統(tǒng)計(jì)量對(duì)偏度不靈敏。②當(dāng)備擇分布偏度非零時(shí),W2統(tǒng)計(jì)量?jī)H優(yōu)于D統(tǒng)計(jì)量,而Za,Zc功效是最高的。
表2 T分布中參數(shù)取不同值時(shí)的偏度及峰度
表3 Gamma分布中參數(shù)取不同值時(shí)的偏度及峰度
3.4備擇假設(shè)為L(zhǎng)ognormal分布
表4 Lognormal分布中參數(shù)取不同值時(shí)的偏度及峰度
圖4(b)的備擇分布偏離正態(tài)分布的程度較圖4(a)備擇分布嚴(yán)重,所對(duì)應(yīng)的各統(tǒng)計(jì)量的功效也較高,進(jìn)一步說(shuō)明備擇分布偏離正態(tài)分布越嚴(yán)重,各統(tǒng)計(jì)量的檢驗(yàn)功效就越高。
圖4 Lognormal 功效模擬比較圖
整體上觀察上述4種備擇假設(shè)下的功效模擬圖形,可得到如下的總體結(jié)論:①D不是很好的檢驗(yàn)正態(tài)性的方法,因?yàn)樗粚?duì)峰度的偏差靈敏,而對(duì)偏度的偏差不靈敏。②當(dāng)備擇分布偏離正態(tài)的程度越嚴(yán)重,各檢驗(yàn)統(tǒng)計(jì)量的功效就越高。③統(tǒng)計(jì)量Za、Zc、Zk對(duì)各種偏正態(tài)的分布都很有效且是穩(wěn)健的。④在備擇分布偏度非零的情況下,W2的功效僅高于D的功效。⑤從功效的角度看,6種統(tǒng)計(jì)量的總體排序?yàn)椋篫a>Zc>Zk>A2>W2>D。
采用統(tǒng)計(jì)模擬的方法比較了D、W2、A2、Zc、Za、Zk這6種統(tǒng)計(jì)量在檢驗(yàn)正態(tài)性時(shí)的功效差異,通過(guò)對(duì)Beta分布、Gamma分布、T分布、Lognormal分布這4種分布進(jìn)行抽樣模擬,得出了6種統(tǒng)計(jì)量各自的優(yōu)缺點(diǎn),并對(duì)6種統(tǒng)計(jì)量在功效上進(jìn)行了總體的排序。在進(jìn)行擬合優(yōu)度檢驗(yàn)時(shí),應(yīng)該結(jié)合具體的原假設(shè)和備擇假設(shè),盡量選擇合適的功效較高的檢驗(yàn)方法,從而提高檢驗(yàn)的可靠度。
[1]楊振海.擬合優(yōu)度檢驗(yàn)[M].合肥:安徽教育出版社,1994.
[2]Zhang J. Powerful goodness-of-fit tests based on the likelihood ratio[J]. J Roy Statist Soc,2002,64:281-294.
[3]Zhang J, Wu Y h. Likelihood-ration tests for normality[J]. Computational Statistics & Data Analysis, 2005,49: 709-721.
[4]茆詩(shī)松,王靜龍,濮曉龍.高等數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,1998.
[5]楊振海,程維虎.統(tǒng)計(jì)模擬[J].數(shù)理統(tǒng)計(jì)與管理,2006,25(1):117-126.
[6]Surucu B.A power comparison and simulation study of goodness-of-fit tests[J].Computers and Mathematics with Applications, 2008, 56:1617-1625.
[7]Zhang Z Z. Some comments on the EDF Statistics of Goodness-of-Fit Tests[J]. Chinese Journal of Applied Probability and Statistics, 1996, 12(4):361-368.
2012-11-24
海南省自然科學(xué)基金項(xiàng)目(112006)。
劉蓮花(1983-),女,碩士,講師,現(xiàn)主要從事擬合優(yōu)度檢驗(yàn)方面的教學(xué)與研究工作。
O212
A
1673-1409(2013)04-0014-03
[編輯] 洪云飛