江紹萍
(1.云南民族大學 數(shù)學與計算機科學學院,昆明 650500;2.云南大學 數(shù)學與統(tǒng)計學院,昆明 650500)
在實際生活中,研究者經(jīng)常遇見這樣的一類問題,即在2×2列聯(lián)表的對角線上有一個元素為零;且在理論上,這個為零的格子在試驗中是觀察不到次數(shù)的,故含結(jié)構零的2×2列聯(lián)表就產(chǎn)生了。如1997年日本進行結(jié)核病的臨床試驗[1]稱為TB試驗,總共進行兩次TB試驗。在第一次TB試驗后,都希望被試驗者呈強陽性(Positive也就是有肺結(jié)核抗體)。過一到三周后在進行第二次TB試驗,若第一次試驗后呈陽性反應的患者將不進行第二次TB試驗。經(jīng)過第二次TB試驗后,患者還是出現(xiàn)陽性或者陰性的反應,從而得到含結(jié)構零的2×2列聯(lián)表。這個試驗中,試驗的總樣本數(shù)是固定的,若樣本數(shù)小,那么可能使得其它三個格子中的樣本數(shù)為零。為了避免這種情況的發(fā)生,在試驗中加入了逆抽樣過程。
逆抽樣(又稱為負二項分布)即為連續(xù)抽樣直到獲得先前固定的r個感興趣的樣本時才停止抽樣。在現(xiàn)實生活中,逆抽樣條件下相對差的估計問題具有很高的實用價值。所以一些學者已作過類似的研究,如KungJongLui[3,4,5]把逆抽樣的思想加入到2×2列聯(lián)表的研究過程中,他只是建立了Wald統(tǒng)計量和對數(shù)Wald統(tǒng)計量進行假設檢驗,且在求解得方法采用極大似然估計的方法求解感興趣參數(shù)的估計及方差。M.L.Tang[4]作了逆抽樣條件下兩組獨立的樣本的風險比的檢驗問題。
本文在含結(jié)構零的列聯(lián)表中加入逆抽樣,以檢測結(jié)核病抗體的試驗為例,即在TB試驗中連續(xù)抽樣,直到抽到先前固定x1(x1>0)的個第一次TB反應為陰性的樣本時才停止抽樣。我們得到如下的列聯(lián)表的形式:
其中 0<πij<1(j=0,1)是列聯(lián)表的相應格子中的概率,X11,X10,X00為落入相應格子的樣本數(shù)。 并且滿足:π1=π11+π10;π1+π00=1;X11=0,1,…x1;X10=0,1,…,x1;X00=0,1,…。 從而得到變量X=(X11,X10,X00)的概率密度函數(shù)為:
在含結(jié)構零的2×2列聯(lián)表中,相對差的定義為:
根據(jù)相對差的定義,可以用參數(shù)δ和π1表示出其它的參數(shù),即 π11=π1(π1-δ),π10=π1(1+δ-π1),π00=(1-π1)。 從而得到了由參數(shù)δ和π1表示的似然函數(shù):
其中,C為不依賴于δ和π1常數(shù),δ為感興趣參數(shù),π1為討厭參數(shù)。
本文感興趣的是檢驗相對差δ是否等于先前固定的某一個值δ0,從而建立如下的假設檢驗問題:
同理,可以求得在H0:δ=δ0條件下參數(shù)的極大似然估計,記為即求解如下方程:
得關于π1的一元三次方程:
計算過程中采用一元三次方程的求根公式來求解上述方程組的根。
以往求解感興趣參數(shù)的期望和方差,通常的做法是采用delta方法,但delta方法是一種近似求解的方法,得到的結(jié)果帶有一定的偏差。為了避免出現(xiàn)偏差,本文采用Fisher-score的方法來求解參數(shù)的方差。由此建立Fisher信息陣如下:
在求解Fisher信息陣的過程中應該注意到,變量X11服從參數(shù)為x11和π11/π1的二項分布;同理X10服從參數(shù)為x1和π10/π1的二項分布;而變量X00服從參數(shù)為x1和的負二項分布。故可以得到各隨機變量的期望如下:
通過求解Fisher信息陣的逆矩陣得到感興趣參數(shù)的方差為:
建立統(tǒng)計量如下:
在實際中,可以通過求解各統(tǒng)計量條件下犯第一類錯誤的概率和功效來檢驗建立的統(tǒng)計量的優(yōu)劣性。并采用蒙特卡洛的方法對有限樣本進行模擬。當給定了δ0和π1的值之后,通過相對差的定義得到 π11,π10,π00的值。 所以模擬的過程中, 相對差 δ0取值為-0.2,-0.1,0.0,0.1;π1取值為 0.3,0.5,0.7,顯著水平為α=5%,得到相應的結(jié)果見表1、表2。
表1 統(tǒng)計量T1,T2,T3,T4條件下犯第一類錯誤的概率
表2 統(tǒng)計量T1,T2,T3,T4條件下的功效
通過計算犯第一類錯誤的概率和功效,得到如下的結(jié)論:
觀察表1、表2發(fā)現(xiàn),Score統(tǒng)計量是最優(yōu)的。因為在參數(shù)取值相同的條件下,它能保證犯第一類錯誤的概率最小且功效還能達到最大。
T3統(tǒng)計量即Wald-score統(tǒng)計量適用于處理大樣本的情況。在T3統(tǒng)計量條件下,所求得的犯第一類錯誤的概率隨著樣本值的增大而減小,并趨近于置信水平。所求解得的功效隨著r的增大而增大。
在模擬過程中,無論樣本值r的取值如何,T2統(tǒng)計量即Score統(tǒng)計量都能使得犯第一類錯誤的概率達到最小,同時也使得功效達到最大。特別在樣本值r小于30的情況下,犯第一類錯誤的概率接近于置信水平。隨著樣本值r的增大,功效變化不大。故可以T2統(tǒng)計量來處理小樣本問題。
通過觀察犯第一類錯誤的概率發(fā)現(xiàn),T1統(tǒng)計量即Wald統(tǒng)計量比T3統(tǒng)計量性質(zhì)更穩(wěn)定一些,但是在相同的參數(shù)條件下,T1統(tǒng)計量求解得的功效比T3統(tǒng)計量差一些。
通過觀察犯第一類錯誤的概率發(fā)現(xiàn),T4統(tǒng)計量即似然比統(tǒng)計量的性質(zhì)比較穩(wěn)定,但是觀察功效發(fā)現(xiàn)波動性比較大,不太穩(wěn)定,所以T4統(tǒng)計量比其他的統(tǒng)計量性質(zhì)要差一點。
現(xiàn)實生活中逆抽樣的問題經(jīng)常涉及到。本文除了應用逆抽樣的方法外,還采用Fisher-Score的方法求解感興趣參數(shù)的方差。這種方法可以比較準確地求解參數(shù)方差,避免了采用delta方法求解感興趣參數(shù)方差時存在的誤差。另外,文中建立了四個統(tǒng)計量,并討論了這四個統(tǒng)計量所使用的條件,還得到了一個最優(yōu)的統(tǒng)計量,為以后的研究提供了一個有用的方法。在以后的問題的討論過程中,可以采用類似的方法討論π11/π12的假設檢驗問題。
[1]Toyota,M.,Kudo,K.,Sumiya,M.,Kobori,O.High Frequency ofIndividuals with Strong Reaction to Tuberculosis among Clinical Trainess[J].Japanese Journal of Infectious Disease,1999,52.
[2]Nian-Sheng Tang,Man-lai Tang,Ivan Siu-Fung Chan.On Test of Equivalence Via Non-unity Relative Risk for Matched-pair Design[J].Statistics in Medicine,2003,22.
[3]Kung-Jong Lui.Estimation of Rate Ratio and Relative Difference in Matched-pairs underInverse Sampling[J].Environmetrics,2001,12.
[4]M.L.Tang,Y.J.Liao,H.K.T.Ng,P.S.Chan.Testing of Rate Ratio under Inverse Sampling[J].Biometrical Journal,2008,89.
[5]Kung-Jong Lui.Point Estimation on Relative Risk under Inverse Sampling[J].Biometrical Journal,1996,38.
[6]Kikuchi,D.A.Inverse Sampling in Case Control Studies Involing a Rare Exposure[J].Biometerical Journal,1987,29.
[7]Kung-Jong Lui.Confidence Intervalsforthe Risk Ratio in Cohort Studies under Inverse Sampling[J].Biometrical Journal,1995,37.
[8]Kung-Jong Lui.Sample Size for the Exact Conditional Test under Inverse Sampling[J].Statistics in Medicine,1995,15.