王黎明,劉青松,張曉良,邱世芳
(重慶理工大學(xué) 理學(xué)院,重慶 400054)
研究某種疾病在人群中的流行率對生物醫(yī)學(xué)相關(guān)研究具有重要意義,一般情況下通過判斷受試者是否患有某種疾病對其進(jìn)行分類從而獲得該疾病的患病率。然而,在現(xiàn)實(shí)生活中,金標(biāo)準(zhǔn)檢驗(yàn)無誤判但價(jià)格昂貴,篩檢方法價(jià)格低但常有誤判。為了克服二者的不足,Tenenbein[1]提出了二重抽樣的方法,即從總體中隨機(jī)抽取N個(gè)個(gè)體利用篩檢方法進(jìn)行檢驗(yàn),再從N個(gè)個(gè)體中隨機(jī)抽取n個(gè)個(gè)體接受金標(biāo)準(zhǔn)檢驗(yàn)。這樣,這n個(gè)個(gè)體同時(shí)接受了2種檢驗(yàn),而N-n個(gè)個(gè)體只接受了篩檢檢驗(yàn),因此,Tang等[2]將采用二重抽樣方法獲得的數(shù)據(jù)稱為部分核實(shí)數(shù)據(jù)。
在部分核實(shí)數(shù)據(jù)的研究方面,已有大量成果,例如文獻(xiàn)[3-10],但是上述研究都是基于有金標(biāo)準(zhǔn)分類器存在的情況下進(jìn)行的。實(shí)際生活中,金標(biāo)準(zhǔn)分類器并不一定存在或可用,而無金標(biāo)準(zhǔn)存在的部分核實(shí)數(shù)據(jù)在實(shí)際生活中廣泛存在。一個(gè)典型例子是Nedelman[11]利用二重抽樣數(shù)據(jù)研究了瘧疾的流行率,使用2種分類器(即初級顯微鏡者和高級顯微鏡者)對病人是否患有瘧疾進(jìn)行分類。由于無論是初級還是高級顯微鏡都存在誤判,因而不存在金標(biāo)準(zhǔn)。表1列出了1個(gè)干旱季節(jié)和潮濕季節(jié)下2個(gè)年齡組(9~18歲,19~29歲)的瘧疾數(shù)據(jù)。感興趣的問題是:在不同的季節(jié)和不同的年齡組,瘧疾的流行率是否有顯著不同。為此,Qiu等[12]從齊性檢驗(yàn)的角度進(jìn)行了研究。然而,在醫(yī)學(xué)研究中,需要多少個(gè)體參與試驗(yàn)也是一個(gè)重要的研究課題。Qiu等[13]從疾病流行率顯著性檢驗(yàn)的角度對樣本量的確定進(jìn)行了探究。Tang等[14]基于比例比,分別從假設(shè)檢驗(yàn)與置信區(qū)間寬度的角度確定了近似樣本量公式。然而,在給定置信水平下,關(guān)于疾病流行率之差(比例差)的置信區(qū)間的寬度控制在指定范圍內(nèi)的樣本量確定還沒有相關(guān)研究文獻(xiàn)。因此,本文中將從置信區(qū)間寬度的角度出發(fā)對此問題進(jìn)行研究,提出幾種有效的樣本量的確定公式或有效算法。如Nedelman[11]所論述,對此類問題假定不存在假陽性誤判是合理的。因而,研究不存在假陽性誤判下基于流行率之差的區(qū)間寬度控制下的樣本量的確定問題。
表1 瘧疾數(shù)據(jù)
假設(shè)有來自第j組的Nj個(gè)個(gè)體,對每個(gè)個(gè)體先用初級分類器進(jìn)行檢驗(yàn),Jj=1表示陽性,Jj=0表示陰性。接著從Nj個(gè)樣本中隨機(jī)選取nj個(gè)個(gè)體再用高級分類器進(jìn)行檢驗(yàn),Sj=1表示陽性,Sj=0表示陰性(j=1,2),數(shù)據(jù)如表2所示。
表2 二重抽樣的數(shù)據(jù)類型
令Dj表示第j組中個(gè)體真實(shí)患病的情況,Dj=1表示個(gè)體患病,反之則沒有(j=1,2)。設(shè)πj=Pr(Dj=1)為患病率,ηj=Pr(Jj=1|Dj=1)和θj=Pr(Sj=1|Dj=1)分別表示初級和高級分類器的敏感度,即在患病條件下檢驗(yàn)為陽性的條件概率。假設(shè)初級分類器和高級分類器滿足條件獨(dú)立性,即Pr(Jj,Sj|Dj)=Pr(Jj|Dj)Pr(Sj|Dj)。假設(shè)不存在假陽性誤判下,其概率結(jié)構(gòu)(稱之為模型1)如表3所示。
表3 模型1的概率結(jié)構(gòu)
設(shè)mj=(n11j,n10j,n01j,n00j,xj,yj),m={mj∶j=1,2},且π=(π1,π2),η=(η1,η2),θ=(θ1,θ2),則模型1下的似然函數(shù)為
其中C1=log(A1)。根據(jù)文獻(xiàn)[15],當(dāng)n11jn00j≥n10jn01j時(shí),參數(shù)πj,ηj,θj的極大似然估計(jì)為
在不假定條件獨(dú)立性下,Lie等[16]在假定Pr(Jj=1,Sj=0|Dj=1)=Pr(Sj=0|Dj=1)、Pr(Jj=0,Sj=1|Dj=1)=Pr(Jj=0|Dj=1)下,提出了模型2,如表4所示。
表4 模型2的概率結(jié)構(gòu)
模型2的似然函數(shù)為:
其中C2是與參數(shù)無關(guān)的常數(shù)。根據(jù)文獻(xiàn)[15],可得參數(shù)πj,ηj,θj的極大似然估計(jì)分別為
假設(shè)核實(shí)驗(yàn)證比例為pj,即nj=Njpj,(j=1,2),并在N2=N1r下考慮樣本量的確定問題。
基于以上得到的δ的估計(jì)和其估計(jì)的方差,易得到參數(shù)δ的基于Wald檢驗(yàn)的置信水平為1-α的置信區(qū)間為:
其中,zα/2是標(biāo)準(zhǔn)正態(tài)分布的α/2分位數(shù)。為了將置信區(qū)間寬度控制在2ω以內(nèi),當(dāng)ω≤δ時(shí)設(shè)否則由此可得置信區(qū)間寬度控制在指定寬度2ω所需的樣本量為:
對于模型1:
對于模型2:
則δ的置信水平為1-α的置信區(qū)間為:
通過計(jì)算得到,基于對數(shù)變換的置信區(qū)間寬度控制在2ω所需的樣本量為:
其中,模型1與模型2下,V分別由式(9)與(10)得到。
則δ的置信水平為1-α的置信區(qū)間為
通過計(jì)算可得基于Logit變換的置信區(qū)間寬度控制在2ω所需的樣本量為
其中,模型1與模型2下,V分別由式(9)與(10)得到。
由于基于Score和似然比檢驗(yàn)統(tǒng)計(jì)量的δ的置信區(qū)間計(jì)算中需要參數(shù)π1,ηj,θj在δ=δ0下的限制性極大似然估計(jì)而這些估計(jì)沒有顯表達(dá)式,需要通過迭代算法得到,故考慮Zou等[17]提出的MOVER方法求得δ的置信區(qū)間。設(shè)δ的置信水平為1-α的置信區(qū)間上限δU和下限δL,根據(jù)中心極限定理易得:
同樣,通過中心極限定理可直接求出πj(j=1,2)的置信水平為1-α的雙邊置信區(qū)間的上限uj和下限lj分別為:
由此可得:
根據(jù)MOVER方法,下限δL的替換得到:
類似地,將上限δU的替換得到:
分別基于以下的Score檢驗(yàn)統(tǒng)計(jì)量與似然比檢驗(yàn)統(tǒng)計(jì)量求得πj(j=1,2)的置信水平為1-α的雙邊置信區(qū)間的上限uj和下限lj,代入上述δL和δU的式中,從而得到δ的置信水平為1-α的置信區(qū)間。
2.4.1 基于Score檢驗(yàn)統(tǒng)計(jì)量的置信區(qū)間
上述方程組無顯式解,可通過迭代算法求得。
在模型2下:
基于Rao[18]的理論,在模型1下,檢驗(yàn)假設(shè)H0j∶πj=π0j的Score檢驗(yàn)統(tǒng)計(jì)量為
在模型2下:
根據(jù)文獻(xiàn)[19],當(dāng)nj→∞時(shí),在H0j下Tsc(π0j)漸近服從標(biāo)準(zhǔn)正態(tài)分布,利用迭代方法解如下方程可得到基于Score檢驗(yàn)統(tǒng)計(jì)量的置信水平為1-α的πj置信區(qū)間上限與下限為
2.4.2 基于似然比檢驗(yàn)統(tǒng)計(jì)量的置信區(qū)間
在模型1下,檢驗(yàn)假設(shè)H0j∶πj=π0j的似然比檢驗(yàn)統(tǒng)計(jì)量為
在模型2下,檢驗(yàn)假設(shè)H0j∶πj=π0j的似然比檢驗(yàn)統(tǒng)計(jì)量為
根據(jù)文獻(xiàn)[20],似然比檢驗(yàn)統(tǒng)計(jì)量Tl(π0j)漸近服從自由度為1的卡方分布,通過解方程Tl(π0j)=可得到基于似然比檢驗(yàn)統(tǒng)計(jì)量的置信水平為1-α的πj置信區(qū)間上下限。
2.4.3 樣本量的數(shù)值解法
由于基于以上檢驗(yàn)統(tǒng)計(jì)量Tsc(π0j)和Tl(π0j)計(jì)算的πj置信區(qū)間均沒有顯表達(dá)式,采取如下的搜索算法來獲得近似樣本量的估計(jì):
步驟1給定π1,ηj,θj,δ,r,pj,N1的值,產(chǎn)生K組隨機(jī)樣本mj=(n11j,n10j,n01j,n00j,xj,yj)。
令M(·)表示多項(xiàng)分布,在模型1下,(n11j,n10j,n01j,n00j)~M(nj;πjηjθj,πj(1-ηj)θj,πjηj(1-θj),πj(1-ηj)(1-θj)+(1-πj))。
在模型2下,(n11j,n10j,n01j,n00j)~M(pjNj;πj(ηj+θj-1),πj(1-ηj),πj(1-θj),(1-πj))。
兩種模型下(xj,yj)都服從二項(xiàng)分布B((1-pj)Nj,πjηj)。
步驟2基于步驟1產(chǎn)生的樣本,結(jié)合MOVER方法計(jì)算δ的置信區(qū)間。并通過K個(gè)置信區(qū)間寬度的平均值計(jì)算近似的區(qū)間寬度,記為2ω*(N1)。
步驟3若2ω*(N1)大于(小于)2ω,則增加(減少)N1的值,重復(fù)步驟1、2。
步驟4重復(fù)步驟3直到近似的半?yún)^(qū)間寬度ω*(N1)非常接近于給定的區(qū)間寬度ω,則N1=min{N1∶|ω*(N1)-ω|≤0.001}即為滿足條件的近似樣本量。
通過以上搜索方法可獲得基于Tsc(π0j)和Tl(π0j)的置信區(qū)間的樣本量Nsc和Nl。
對于模型1和模型2下所提出的樣本量的估計(jì)方法,通過計(jì)算在估計(jì)的樣本量下δ的置信區(qū)間的經(jīng)驗(yàn)覆蓋概率(ECP)和經(jīng)驗(yàn)覆蓋寬度(ECW)來評估本文中所提出方法的有效性。1)經(jīng)驗(yàn)覆蓋概率(ECP)
[δL(m(k)),δU(m(k))]為δ的第k個(gè)置信區(qū)間,:j=1,2},此時(shí)I{δ∈[δL(m(k)),δU(m(k))]}為示性函數(shù)。
2)經(jīng)驗(yàn)覆蓋寬度(ECW)
在置信水平1-α=0.95下分別通過以下參數(shù)設(shè)置考察了各種樣本量估計(jì)方法的有效性:
1)δ的影響。為研究δ的變化對樣本量的影響,在2種模型下,考慮如下參數(shù)設(shè)置:δ=0.1(0.01)0.3,π1=0.3,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1以及(a):r=1.0,p1=p2=1/3,(b):r=2.0,p1=p2=1/3,(c):r=1.0,p1=1/3,p2=1/5,(d):r=2.0,p1=1/3,p2=1/5。圖1、3給出了估計(jì)的樣本量N1、置信區(qū)間的經(jīng)驗(yàn)覆蓋概率ECP(%)和經(jīng)驗(yàn)覆蓋寬度ECW。對于模型1和模型2,隨著δ的逐漸增大,基于所有方法計(jì)算的所需樣本量均逐漸增加,基于對數(shù)變換置信區(qū)間的樣本量Nlog和基于Logit變換置信區(qū)間的樣本量Nlogit相對其他3種方法較小,所有方法的ECP均接近于事先給定的置信水平1-α=0.95,ECW接近于2ω=0.2。
2)p1和p2的影響。為研究p1的變化對樣本量的影響,考慮如下參數(shù)設(shè)置:p1=0.1(0.1)0.9,π1=0.3,δ=0.2,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1,p2=0.3,(a):r=1.0,(b):r=2.0。為研究p2的變化對樣本量的影響,考慮如下參數(shù)設(shè)置:p2=0.1(0.1)0.9,π1=0.3,δ=0.2,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1,p1=0.3,(c):r=1.0,(d):r=2.0。圖2、4給出了估計(jì)的樣本量N1、置信區(qū)間的經(jīng)驗(yàn)覆蓋概率ECP(%)和經(jīng)驗(yàn)覆蓋寬度ECW。模擬研究結(jié)果表明,隨著p1和p2的增大,基于所有方法計(jì)算得到的樣本量均減少,所有方法的ECP均接近于事先給定的置信水平1-α=0.95,ECW接近于2ω=0.2。
圖1中,δ=0.1(0.01)0.3,π1=0.3,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1。
圖1 模型1:置信水平1-α=0.95下,估計(jì)的樣本量N1、置信區(qū)間的經(jīng)驗(yàn)覆蓋概率ECP(%)和經(jīng)驗(yàn)覆蓋寬度ECW隨δ變化的情況
圖2中,π1=0.3,δ=0.2,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1。
圖2 模型1:置信水平1-α=0.95下,估計(jì)的樣本量N1、置信區(qū)間的經(jīng)驗(yàn)覆蓋概率ECP(%)和經(jīng)驗(yàn)覆蓋寬度ECW隨p1、p2變化的情況
圖3中,δ=0.1(0.01)0.3,π1=0.3,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1。
圖3 模型2:置信水平1-α=0.95下,估計(jì)的樣本量N1、置信區(qū)間的經(jīng)驗(yàn)覆蓋概率ECP(%)和經(jīng)驗(yàn)覆蓋寬度ECW隨δ變化的情況
圖4中,π1=0.3,δ=0.2,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1。
圖4 模型2:置信水平1-α=0.95下,估計(jì)的樣本量N1、置信區(qū)間的經(jīng)驗(yàn)覆蓋概率ECP(%)和經(jīng)驗(yàn)覆蓋寬度ECW隨p1、p2變化的情況
采用所提出的方法對表1數(shù)據(jù)進(jìn)行分析。表5列出了2個(gè)調(diào)查組下不同年齡組患病率之差δ、2組年齡下不同調(diào)查組患病率之差δ的參數(shù)估計(jì),置信水平1-α=0.95下區(qū)間寬度控制在區(qū)間寬度ω=0.1下的樣本量估計(jì),在估計(jì)樣本量下δ的置信區(qū)間的經(jīng)驗(yàn)覆蓋概率和經(jīng)驗(yàn)覆蓋寬度。結(jié)果表明:對于模型1,基于對數(shù)變換方法的ECW相對于其他4種方法較小,在模型2下則相反。值得注意的是,在模型1與模型2下,基于Wald方法置信區(qū)間得到的樣本量明顯大于其他4種方法的樣本量,但所有方法的ECP均接近于事先給定的置信水平1-α=0.95,ECW接近于2ω=0.2,現(xiàn)有樣本量滿足實(shí)驗(yàn)需求。
基于無金標(biāo)準(zhǔn)的部分核實(shí)數(shù)據(jù),從比例差的區(qū)間寬度的角度給出了比較2組患病率是否有顯著性差異所需要的樣本量。在2種不同二重抽樣模型下,給出了在給定置信水平下置信區(qū)間寬度控制在指定范圍內(nèi)的樣本量估計(jì)公式。模擬結(jié)果表明:相同參數(shù)設(shè)置下模型1下各種方法所需樣本量大于模型2下相應(yīng)方法所需的樣本量;在2種模型下,基于所提出的各種方法估計(jì)的樣本量下計(jì)算的δ的置信區(qū)間的經(jīng)驗(yàn)覆蓋概率接近給定的置信水平且經(jīng)驗(yàn)覆蓋寬度接近設(shè)定的寬度。由此可知,所提出的樣本量估計(jì)公式和數(shù)值算法有效,推薦在實(shí)際應(yīng)用中使用。
附錄:Fisher信息陣
令I(lǐng)j=(Ilkj)3×3表示第j組下2個(gè)模型的費(fèi)希爾信息矩陣,其中,在模型1下,
在模型2下