伏啟翔,覃 愿,王黎明,邱世芳
(重慶理工大學 理學院,重慶 400054)
估計疾病流行率是生物醫(yī)學研究中的一個重要問題。為收集數(shù)據(jù),價格便宜的篩檢方法常被用來做初步診斷,但由于其分類誤差而導致有誤的分類結(jié)果,進而導致基于這些有誤分類數(shù)據(jù)的統(tǒng)計推斷不太合理。無誤判的金標準通常存在昂貴、耗時等不足,因而常不能用于每個個體的檢驗。為此,Tenenbein[1]提出了二重抽樣方法,即從感興趣的總體中抽取的樣本(如N)都接受篩檢檢驗,然后再隨機抽取部分個體(如n)再次接受金標準檢驗。由于這n個個體同時接受了篩檢檢驗和金標準檢驗,反映了個體的真實特征。因而通過二重抽樣方法得到的數(shù)據(jù)又稱為部分核實數(shù)據(jù)[2]。對于有金標準部分核實數(shù)據(jù)的研究得到了很多學者的關(guān)注,如Tenenbein等[3-4]將二重抽樣方法推廣到多項分布數(shù)據(jù)的研究,Hochberg[5]推廣到多維數(shù)據(jù)的研究,Geng等[6]發(fā)展了部分核實數(shù)據(jù)的Bayesian分析方法。對于有序部分核實數(shù)據(jù),Poon等[7]發(fā)展了一類參數(shù)模型,Qiu等[8]從有序效應度角度研究了疾病流行率的等價性評價問題。以上研究都是基于有金標準下的研究,事實上,臨床診斷中并不一定存在完全無誤判的金標準。當2種檢驗都有誤判時基于部分核實數(shù)據(jù)的統(tǒng)計分析具有重要的現(xiàn)實意義。為此,Nedelman[9]基于條件獨立性假定提出了3種模型并研究了疾病流行率、敏感度和特異度的估計問題,Lie等[10]基于2種二重抽樣模型進行了研究。在Nedelman等[9-10]提出的模型基礎上,Qiu等[11-13]基于無金標準部分核實數(shù)據(jù)研究了假設檢驗、區(qū)間估計及樣本量確定問題。疾病流行率的研究可能受到年齡、性別等混雜因素的影響,因而將這些混雜因素看成分層變量,研究分層設計下的部分核實數(shù)據(jù)的統(tǒng)計推斷問題是一種重要的研究問題。在小樣本下基于大樣本漸近分布的檢驗過程常常會得到不太令人滿意的結(jié)果,因而在小樣本下研究基于分層設計下的部分核實數(shù)據(jù)對疾病流行率的齊性檢驗是一個有意義的研究問題。
假設存在有誤判的2種分類器(初級分類器J和高級分類器S)。從第j層(j=1,2,…,J)總體中隨機抽取Nj個個體接受初級分類器進行檢驗,Jj=1表示第j層的個體被診斷為陽性,反之,Jj=0;然后再從中隨機抽取nj(nj<Nj)個個體接受高級分類器的檢驗,Sj=1表示被診斷為陽性,反之,Sj=0。從而得到如表1所示的部分核實數(shù)據(jù)。
設Dj=1表示第j層中個體患病,反之,Dj=0;令πj=Pr(Dj=1)表示第j層中個體患病的概率,ηj=。為了使模型可識別,不妨假定不存在假陽性。
表1 第j層部分核實數(shù)據(jù)
表2 模型1下第j層概率結(jié)構(gòu)
以下為齊性檢驗:H0:π1=π2=…=πJ=π?H1:至少有一對πi≠πj(i≠j)。
設mj=(n11j,n10j,n01j,n00j,xj,yj),π=(π1,…,πJ)′,η=(η1,…,ηJ)′,θ=(θ1,…,θJ)′,則基于m={mj:j=1,2,…,J}的對數(shù)似然函數(shù)為:l1(m;π,η,θ)=,其中
顯然,πj,ηj,θj的非限制性極大似然估計是方程組的解。根據(jù)文獻[12]可得,當n11jn00j≥n10jn01j時,
在H0:π1=π2=… =πJ=π下,π,ηj,θj的限制性極大似然估計是如下方程組的解:,由于無顯表達式,因而可用牛頓迭代法等求得方程組的解。
表3 模型2下第j層概率結(jié)構(gòu)
基于m={mj∶j=1,2,…,J}對數(shù)似然函數(shù)為,其中:
則πj,ηj,θj的非限制性極大似然估計為
在H0:π1=π2=… =πJ=π下,π,ηj,θj的限制性極大似然估計通過求解以下兩式:,得到:
根據(jù)Rao[14]所提出的Score檢驗的一般理論,在2種模型下,經(jīng)過簡單計算可得在H0:π1=π2=…=πJ=π成立下的Score檢驗統(tǒng)計量為
其中Sj是2種模型下的Score函數(shù),
I11j為第j層Fisher信息陣的逆矩陣的第一主對角元素(見附錄)。當Nj→∞(j=1,2,…,J)時,檢驗統(tǒng)計量Tsc漸近服從自由度為J-1的卡方分布[15]。
根據(jù)研究,可得如下的加權(quán)最小二乘估計檢驗統(tǒng)計量[16]:
式中:漸近服從于自由度為J-1的卡方分布。
為評價提出方法的有效性,考慮如下的樣本量:①平衡設計nj=20,Nj=30(j=1,2,3);②非平衡設計:(n1,n2,n3,N1,N2,N3)=(10,10,15,20,15,30)和參數(shù)設置:π=0.10(0.20)0.50;η1=0.50(0.05)0.60,η2=η1+0.05,η3=η1+0.10;θ1=0.70(0.05)0.80,θ2=θ1+0.05,θ3=θ1+0.10研究各種檢驗的犯第1類錯誤的概率,模擬結(jié)果列于表4、5。同時,考慮以上2種樣本量下δ=0.10(0.10)0.30和以上參數(shù)設置各檢驗的功效,由于篇幅的限制,本研究只列出了nj=20,Nj=30(j=1,2,3)下的模擬結(jié)果,如表6所示。
模擬結(jié)果表明,2種模型下基于Bootstrap的小樣本檢驗過程優(yōu)于漸近的檢驗方法,前者犯第1類錯誤的概率更接近名義水平且具有更高的功效,而后者在小樣本下犯第1類錯誤的概率太保守。特別地,基于Score檢驗的Bootstrap檢驗過程在2種模型下的犯第1類錯誤的概率最接近名義水平。
表4 平衡小樣本量nj=20,Nj=30(j=1,2,3)下各檢驗統(tǒng)計量在顯著性水平為α=0.05下犯第1類錯誤的概率(%)
表5 非平衡小樣本量設置下(n1=10,n2=10,n3=10;N1=20,N2=15,N3=30)各檢驗統(tǒng)計量在置信水平α=0.05下犯第1類錯誤的模型結(jié)果概率(%)
表6 平衡小樣本量設置下(Nj=20,Nj=30,j=1,2,…,3)各檢驗統(tǒng)計量在置信水平α=0.05下的檢驗功效(%)
考慮Nedelman[9]在研究瘧疾流行率時按年齡分層的瘧疾數(shù)據(jù),本研究考慮如表7所示的3個成年組數(shù)據(jù),其中“+”表示被診斷為陽性,“-”表示被診斷為陰性。
表7 成人組瘧疾數(shù)據(jù)
基于以上數(shù)據(jù),可得到2個模型下參數(shù)πj、ηj、θj的非限制性和限制性極大似然估計,如表8所示。
表8 成人組瘧疾數(shù)據(jù)的非限制性極大似然估計(MLE)與限制性極大似然估計(CMLE)
對于假設檢驗:H0∶π1=π2=π3?H1∶π1,π2,π3不全相等,各種檢驗的漸近p值和Bootstrap檢驗p值如表9所示。
表9 成人組瘧疾數(shù)據(jù)的檢驗p值
由表9可知,2種模型下各種檢驗的漸近和Bootstrap檢驗p值都大于0.05,因而在顯著性水平0.05下都沒有足夠的理由拒絕原假設。
本研究考慮了分層設計下的無金標準部分核實數(shù)據(jù)對疾病流行率的齊性檢驗H0∶π1=π2=… =πJ?H1∶πi,πj不全相等(i≠j),提出了小樣本下基于檢驗統(tǒng)計量Tsc,Twls,Tlog,Tlogit,Tdlog的Bootstrap檢驗過程。模擬研究結(jié)果表明,在小樣本下基于Bootstrap的檢驗過程犯第1類錯誤的概率更接近顯著性水平,且具有更高的功效。因而,在小樣本下推薦使用Bootstrap的檢驗過程。
附錄
第j層Fisher信息陣的逆矩陣的第一主對角元素為
其中,
在模型1下:
在模型2下: