葉仁道,徐立軍
(杭州電子科技大學(xué) 經(jīng)濟(jì)學(xué)院,浙江 杭州 310018)
基于蒙特卡洛模擬的四格表獨(dú)立性檢驗(yàn)研究
葉仁道,徐立軍
(杭州電子科技大學(xué) 經(jīng)濟(jì)學(xué)院,浙江 杭州 310018)
文章通過給出四格表三種獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量的蒙特卡洛模擬算法,研究不同樣本量和參數(shù)條件下各檢驗(yàn)統(tǒng)計(jì)量犯第一類錯(cuò)誤的概率和功效,并進(jìn)行統(tǒng)計(jì)量優(yōu)良性對比。結(jié)果表明,在樣本量較小時(shí),似然比檢驗(yàn)優(yōu)于卡方檢驗(yàn)和優(yōu)比檢驗(yàn);而隨著樣本量的增加,三種檢驗(yàn)統(tǒng)計(jì)量都能較為有效地控制犯第一類錯(cuò)誤的概率,并具有較高的檢驗(yàn)功效。在此基礎(chǔ)上,將上述三種檢驗(yàn)統(tǒng)計(jì)量應(yīng)用于實(shí)際案例的數(shù)據(jù)分析中。
四格表;蒙特卡洛模擬;獨(dú)立性檢驗(yàn);統(tǒng)計(jì)功效
四格表是一種應(yīng)用非常廣泛的數(shù)據(jù)分析方法,常被用作分析處理社會科學(xué)、人口和醫(yī)學(xué)等領(lǐng)域的分類數(shù)據(jù)。近年來,關(guān)于用何種獨(dú)立性檢驗(yàn)方法對四格表進(jìn)行統(tǒng)計(jì)推斷,已受到眾多學(xué)者的廣泛關(guān)注[1-3]。例如,包和平等[4]、何平平等[5]基于現(xiàn)有統(tǒng)計(jì)推斷方法基礎(chǔ)上,提出了在不滿足正態(tài)近似時(shí)所需要采用的精確檢驗(yàn)方法。此外,趙博娟和吳喜之[6]提出列聯(lián)表形成過程的不同會影響所做假設(shè)檢驗(yàn)的結(jié)果。然而,現(xiàn)有關(guān)于四格表的統(tǒng)計(jì)推斷研究,較少涉及在不同樣本量下比較檢驗(yàn)統(tǒng)計(jì)量的優(yōu)良性。
鑒于此,本文針對四格表的卡方檢驗(yàn)、似然比檢驗(yàn)和優(yōu)比檢驗(yàn)等三種獨(dú)立性檢驗(yàn)方法[7],給出其蒙特卡洛模擬算法。并利用此算法分別獲得上述三種檢驗(yàn)統(tǒng)計(jì)量犯第一類錯(cuò)誤的模擬概率和功效,用以檢驗(yàn)統(tǒng)計(jì)量的優(yōu)良性。最后,將上述三種統(tǒng)計(jì)推斷方法應(yīng)用于環(huán)衛(wèi)工人生活現(xiàn)狀問題研究中,以檢驗(yàn)環(huán)衛(wèi)工人性別與收入、月剩余是否存在相互獨(dú)立等問題。
考慮如下四格表:
表1 四格表和它的邊際部分
其中,A、B分別表示兩種屬性,n1+=n11+n12,n2+=n21+n22,n+1=n11+n21,n+2=n12+n22,n=n11+n12+n21+n22。當(dāng)單側(cè)n1+和n2+給定時(shí),本文假定n11和n21是服從二項(xiàng)分布的隨機(jī)變量。
(一)四格表獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量
H0:p1=p2vsH1:p1≠p2
(1)
若H0成立,則屬性A和B相互獨(dú)立;反之,若H1成立,則屬性A和B不相互獨(dú)立[7]。為探討假設(shè)檢驗(yàn)問題(1),本文首先給出四格表三種獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量。
在(1)中原假設(shè)條件下,定義以下檢驗(yàn)統(tǒng)計(jì)量:
1)χ2檢驗(yàn)
(2)
2)似然比檢驗(yàn)
(3)
3)優(yōu)比檢驗(yàn)
(4)
(二)蒙特卡洛模擬算法
針對假設(shè)檢驗(yàn)問題(1),本小節(jié)給出檢驗(yàn)統(tǒng)計(jì)量Ti(i=1,2,3)的蒙特卡羅模擬算法,以獲得該統(tǒng)計(jì)量犯第一類錯(cuò)誤的概率及功效。為方便起見,本小節(jié)僅以T1為例給出其算法,具體算法步驟如下。
(a)給定樣本量n1+、n2+及參數(shù)p,其中p=p1=p2;
(b)在(1)中原假設(shè)下,分別模擬生成N個(gè)服從二項(xiàng)分布b(n1+,p1)和b(n2+,p2)的隨機(jī)變量n11和n21;
(c)將(b)中得到的隨機(jī)變量代入卡方檢驗(yàn)公式(2)中可得T1值;
此外,由于檢驗(yàn)統(tǒng)計(jì)量功效的模擬步驟與上述模擬步驟類似,故本文將其略去。
基于上述所給的蒙特卡洛模擬算法,本文利用R軟件模擬(2)-(4)檢驗(yàn)統(tǒng)計(jì)量犯第一類錯(cuò)誤的概率及功效。
對于假設(shè)檢驗(yàn)問題(1),在不同顯著性水平下,對(2)-(4)檢驗(yàn)統(tǒng)計(jì)量進(jìn)行蒙特卡洛模擬。為此,設(shè)定不同樣本量和參數(shù),取樣本量n1+=15、45、60以及n2+=15、30、60。在模擬各檢驗(yàn)統(tǒng)計(jì)量犯第一類錯(cuò)誤的概率時(shí),取條件概率p=0.2、0.5和0.7。在模擬各檢驗(yàn)統(tǒng)計(jì)量的功效時(shí),分別取p1=0.2,p2=0.3、0.5和0.6。具體模擬結(jié)果見表2和3,其中檢驗(yàn)方法1、2、3分別表示卡方檢驗(yàn)、似然比檢驗(yàn)和優(yōu)比檢驗(yàn)。
表2 各檢驗(yàn)統(tǒng)計(jì)量犯第一類錯(cuò)誤的概率
表3 各檢驗(yàn)統(tǒng)計(jì)量的功效模擬結(jié)果(p1=0.2)
由表2可見,在樣本量較小時(shí),優(yōu)比檢驗(yàn)犯第一類錯(cuò)誤的概率遠(yuǎn)小于名義顯著性水平,說明其較為保守;而在個(gè)別情況下,卡方檢驗(yàn)犯第一類錯(cuò)誤的概率大于名義顯著性水平,故而較為自由。隨著樣本量逐漸增加,以上兩種檢驗(yàn)方法犯第一類錯(cuò)誤的概率接近于名義顯著性水平。而在大多數(shù)情況下,似然比檢驗(yàn)犯第一類錯(cuò)誤的概率接近于名義顯著性水平。此外,由表3可知,樣本量較小時(shí),在個(gè)別情況下優(yōu)比檢驗(yàn)的功效小于名義顯著性水平,表明功效較低。隨著樣本量的增大,該方法功效顯著增大。而當(dāng)逐漸偏離時(shí),卡方檢驗(yàn)和似然比檢驗(yàn)的功效顯著增大,且增量接近。綜上所述,在小樣本情況下,似然比檢驗(yàn)優(yōu)于卡方檢驗(yàn)和優(yōu)比檢驗(yàn);在大樣本情況下,三種檢驗(yàn)統(tǒng)計(jì)量都能較為有效控制犯第一類錯(cuò)誤的概率,且具有較高的檢驗(yàn)功效。
本小節(jié)將四格表獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量應(yīng)用于實(shí)際案例的數(shù)據(jù)分析中。其中,相關(guān)數(shù)據(jù)來源于對杭州市環(huán)衛(wèi)工人的實(shí)地調(diào)查。
例1 為檢驗(yàn)不同性別的環(huán)衛(wèi)工人在個(gè)人收入方面有無差異,調(diào)查了122名男性環(huán)衛(wèi)工人和314名女性環(huán)衛(wèi)工人。具體調(diào)查數(shù)據(jù)如表4所示。
表4 收入與性別四格表
考慮假設(shè)檢驗(yàn)問題(1),由式(2)-(4)可得各檢驗(yàn)方法的χ2統(tǒng)計(jì)量值。進(jìn)一步,基于蒙特卡洛模擬算法,得到獨(dú)立性檢驗(yàn)結(jié)果及功效。具體結(jié)果見表5。
表5 獨(dú)立性檢驗(yàn)及功效(1)
由表5可見,三種檢驗(yàn)方法在0.05的顯著性水平下均拒絕原假設(shè),表明不同性別的環(huán)衛(wèi)工人在月工資方面有顯著差異。此外,各檢驗(yàn)方法的功效均較高。
例2 在例1研究的基礎(chǔ)上,為檢驗(yàn)不同性別的環(huán)衛(wèi)工人在個(gè)人收入剩余方面有無差異,繼續(xù)對這436名環(huán)衛(wèi)工人進(jìn)行了調(diào)查。具體調(diào)查數(shù)據(jù)如表6所示。
表6 月剩余與性別四格表
與例1相似,可得表7所示的獨(dú)立性檢驗(yàn)結(jié)果及功效。
表7 獨(dú)立性檢驗(yàn)及功效(2)
由表7可見,三種檢驗(yàn)方法在0.05的顯著性水平下均接受原假設(shè),表明不同性別的環(huán)衛(wèi)工人在月剩余方面無顯著差異。相應(yīng)地,各檢驗(yàn)方法的功效均較低。
例3 為繼續(xù)研究不同工齡的環(huán)衛(wèi)工人在個(gè)人收入方面有無差異,對這436名環(huán)衛(wèi)工人在工齡方面的數(shù)據(jù)進(jìn)行了調(diào)查。具體調(diào)查數(shù)據(jù)如表8所示。
表8 收入與工齡四格表
與上述例子類似,可得表9所示的獨(dú)立性檢驗(yàn)結(jié)果及功效。
表9 獨(dú)立性檢驗(yàn)及功效(3)
由表9可見,三種檢驗(yàn)方法在0.05的顯著性水平下均拒絕原假設(shè),表明不同工齡的環(huán)衛(wèi)工人在月工資方面有顯著差異。此外,各檢驗(yàn)方法的功效均較高。
由于不同檢驗(yàn)統(tǒng)計(jì)量在各種樣本量條件下的檢驗(yàn)效果不同,因此本文首先給出四格表三種獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量的蒙特卡洛模擬算法。進(jìn)而,在不同樣本量和參數(shù)條件下,利用此算法獲得其犯第一類錯(cuò)誤的概率和功效,以驗(yàn)證統(tǒng)計(jì)量的優(yōu)良性。研究結(jié)果表明,在樣本量較小時(shí),似然比檢驗(yàn)優(yōu)于卡方檢驗(yàn)和優(yōu)比檢驗(yàn)。同時(shí),隨著樣本量的增加,三種檢驗(yàn)統(tǒng)計(jì)量都能較為有效控制犯第一類錯(cuò)誤的概率,并具有較高的檢驗(yàn)功效。最后,將以上三種檢驗(yàn)方法應(yīng)用于實(shí)際數(shù)據(jù)的分析中,說明環(huán)衛(wèi)工人性別與月剩余相互獨(dú)立,而與個(gè)人收入不相互獨(dú)立。同時(shí)表明,不同工齡的環(huán)衛(wèi)工人在個(gè)人收入方面也存在明顯差異。
[1]陸運(yùn)清.相關(guān)四格表數(shù)據(jù)資料檢驗(yàn)方法的進(jìn)展與應(yīng)用[J].統(tǒng)計(jì)與決策,2011(17):30-32.
[2]魯慶云,劉紅霞.關(guān)于列聯(lián)表卡方檢驗(yàn)在數(shù)學(xué)教育研究中的使用方法分析[J].統(tǒng)計(jì)與決策,2008(2):156-158.
[3]陸賢杰.用平均誤差校正2×2聯(lián)列表x2檢驗(yàn)的可行性研究[J].中國衛(wèi)生統(tǒng)計(jì),1994(2):24-26.
[4]包和平,白玉峰,包德喜.四格列聯(lián)表的獨(dú)立性Fisher精確檢驗(yàn)的近似檢驗(yàn)法[J].數(shù)理醫(yī)藥學(xué)雜志,2007(3):301-302.
[5]何平平,王洪源,郭利霞,等.配對設(shè)計(jì)2×2列聯(lián)表的精確檢驗(yàn)方法及應(yīng)用[J].中國衛(wèi)生統(tǒng)計(jì),2006(5):450-451.
[6]趙博娟,吳喜之.形成過程不同的列聯(lián)表的檢驗(yàn)[J].數(shù)理統(tǒng)計(jì)與應(yīng)用概率,1997(2):78-85,86.
[7]王靜龍,梁小筠.定性數(shù)據(jù)統(tǒng)計(jì)分析[M].北京:中國統(tǒng)計(jì)出版社,2008:39-65.
A Research on Independence Test of Fourfold Table Based on Monte Carlo Simulation
YE Ren-dao,XU Li-jun
(SchoolofEconomics,HangzhouDianziUniversity,HangzhouZhejiang310018,China)
In this paper, a Monte Carlo simulation algorithm is presented for three kinds of independence test statistics of fourfold table. And then, in order to test the optimality of the statistics, it uses the algorithm to obtain the Type I error probability and power of each statistics in different sample sizes and parameters. The result shows that the likelihood ratio test is better than the other methods when the sample size is small. Moreover, with the increase of the sample size, the three test statistics can more effectively control the probability of Type I error, and have a high power of the test. On this basis, the above-mentioned three test statistics are applied to the data analysis of the real cases.
fourfold table;Monte Carlo simulation;independence test;statistical power
10.13954/j.cnki.hduss.2017.02.004
2015-12-16
浙江省哲學(xué)社科規(guī)劃“之江青年”課題(16ZJQN017YB);杭州電子科技大學(xué)優(yōu)秀碩士學(xué)位論文培育基金(yxlw2016014)
葉仁道(1981-),男,浙江溫州人,博士,教授,數(shù)理統(tǒng)計(jì)、經(jīng)濟(jì)統(tǒng)計(jì).
C812
B
1001-9146(2017)02-0020-05