亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        部分核實(shí)數(shù)據(jù)下基于比例差的置信區(qū)間寬度的樣本量確定

        2021-06-10 07:30:06王黎明劉青松張曉良邱世芳
        關(guān)鍵詞:置信水平置信區(qū)間樣本量

        王黎明,劉青松,張曉良,邱世芳

        (重慶理工大學(xué) 理學(xué)院,重慶 400054)

        研究某種疾病在人群中的流行率對生物醫(yī)學(xué)相關(guān)研究具有重要意義,一般情況下通過判斷受試者是否患有某種疾病對其進(jìn)行分類從而獲得該疾病的患病率。然而,在現(xiàn)實(shí)生活中,金標(biāo)準(zhǔn)檢驗(yàn)無誤判但價(jià)格昂貴,篩檢方法價(jià)格低但常有誤判。為了克服二者的不足,Tenenbein[1]提出了二重抽樣的方法,即從總體中隨機(jī)抽取N個(gè)個(gè)體利用篩檢方法進(jìn)行檢驗(yàn),再從N個(gè)個(gè)體中隨機(jī)抽取n個(gè)個(gè)體接受金標(biāo)準(zhǔn)檢驗(yàn)。這樣,這n個(gè)個(gè)體同時(shí)接受了2種檢驗(yàn),而N-n個(gè)個(gè)體只接受了篩檢檢驗(yàn),因此,Tang等[2]將采用二重抽樣方法獲得的數(shù)據(jù)稱為部分核實(shí)數(shù)據(jù)。

        在部分核實(shí)數(shù)據(jù)的研究方面,已有大量成果,例如文獻(xiàn)[3-10],但是上述研究都是基于有金標(biāo)準(zhǔn)分類器存在的情況下進(jìn)行的。實(shí)際生活中,金標(biāo)準(zhǔn)分類器并不一定存在或可用,而無金標(biāo)準(zhǔn)存在的部分核實(shí)數(shù)據(jù)在實(shí)際生活中廣泛存在。一個(gè)典型例子是Nedelman[11]利用二重抽樣數(shù)據(jù)研究了瘧疾的流行率,使用2種分類器(即初級顯微鏡者和高級顯微鏡者)對病人是否患有瘧疾進(jìn)行分類。由于無論是初級還是高級顯微鏡都存在誤判,因而不存在金標(biāo)準(zhǔn)。表1列出了1個(gè)干旱季節(jié)和潮濕季節(jié)下2個(gè)年齡組(9~18歲,19~29歲)的瘧疾數(shù)據(jù)。感興趣的問題是:在不同的季節(jié)和不同的年齡組,瘧疾的流行率是否有顯著不同。為此,Qiu等[12]從齊性檢驗(yàn)的角度進(jìn)行了研究。然而,在醫(yī)學(xué)研究中,需要多少個(gè)體參與試驗(yàn)也是一個(gè)重要的研究課題。Qiu等[13]從疾病流行率顯著性檢驗(yàn)的角度對樣本量的確定進(jìn)行了探究。Tang等[14]基于比例比,分別從假設(shè)檢驗(yàn)與置信區(qū)間寬度的角度確定了近似樣本量公式。然而,在給定置信水平下,關(guān)于疾病流行率之差(比例差)的置信區(qū)間的寬度控制在指定范圍內(nèi)的樣本量確定還沒有相關(guān)研究文獻(xiàn)。因此,本文中將從置信區(qū)間寬度的角度出發(fā)對此問題進(jìn)行研究,提出幾種有效的樣本量的確定公式或有效算法。如Nedelman[11]所論述,對此類問題假定不存在假陽性誤判是合理的。因而,研究不存在假陽性誤判下基于流行率之差的區(qū)間寬度控制下的樣本量的確定問題。

        表1 瘧疾數(shù)據(jù)

        1 數(shù)據(jù)結(jié)構(gòu)和統(tǒng)計(jì)模型

        1.1 數(shù)據(jù)結(jié)構(gòu)

        假設(shè)有來自第j組的Nj個(gè)個(gè)體,對每個(gè)個(gè)體先用初級分類器進(jìn)行檢驗(yàn),Jj=1表示陽性,Jj=0表示陰性。接著從Nj個(gè)樣本中隨機(jī)選取nj個(gè)個(gè)體再用高級分類器進(jìn)行檢驗(yàn),Sj=1表示陽性,Sj=0表示陰性(j=1,2),數(shù)據(jù)如表2所示。

        表2 二重抽樣的數(shù)據(jù)類型

        1.2 模型1的概率結(jié)構(gòu)

        令Dj表示第j組中個(gè)體真實(shí)患病的情況,Dj=1表示個(gè)體患病,反之則沒有(j=1,2)。設(shè)πj=Pr(Dj=1)為患病率,ηj=Pr(Jj=1|Dj=1)和θj=Pr(Sj=1|Dj=1)分別表示初級和高級分類器的敏感度,即在患病條件下檢驗(yàn)為陽性的條件概率。假設(shè)初級分類器和高級分類器滿足條件獨(dú)立性,即Pr(Jj,Sj|Dj)=Pr(Jj|Dj)Pr(Sj|Dj)。假設(shè)不存在假陽性誤判下,其概率結(jié)構(gòu)(稱之為模型1)如表3所示。

        表3 模型1的概率結(jié)構(gòu)

        設(shè)mj=(n11j,n10j,n01j,n00j,xj,yj),m={mj∶j=1,2},且π=(π1,π2),η=(η1,η2),θ=(θ1,θ2),則模型1下的似然函數(shù)為

        其中C1=log(A1)。根據(jù)文獻(xiàn)[15],當(dāng)n11jn00j≥n10jn01j時(shí),參數(shù)πj,ηj,θj的極大似然估計(jì)為

        1.3 模型2的概率結(jié)構(gòu)

        在不假定條件獨(dú)立性下,Lie等[16]在假定Pr(Jj=1,Sj=0|Dj=1)=Pr(Sj=0|Dj=1)、Pr(Jj=0,Sj=1|Dj=1)=Pr(Jj=0|Dj=1)下,提出了模型2,如表4所示。

        表4 模型2的概率結(jié)構(gòu)

        模型2的似然函數(shù)為:

        其中C2是與參數(shù)無關(guān)的常數(shù)。根據(jù)文獻(xiàn)[15],可得參數(shù)πj,ηj,θj的極大似然估計(jì)分別為

        2 樣本量的確定

        假設(shè)核實(shí)驗(yàn)證比例為pj,即nj=Njpj,(j=1,2),并在N2=N1r下考慮樣本量的確定問題。

        2.1 基于Wald置信區(qū)間的樣本量

        基于以上得到的δ的估計(jì)和其估計(jì)的方差,易得到參數(shù)δ的基于Wald檢驗(yàn)的置信水平為1-α的置信區(qū)間為:

        其中,zα/2是標(biāo)準(zhǔn)正態(tài)分布的α/2分位數(shù)。為了將置信區(qū)間寬度控制在2ω以內(nèi),當(dāng)ω≤δ時(shí)設(shè)否則由此可得置信區(qū)間寬度控制在指定寬度2ω所需的樣本量為:

        對于模型1:

        對于模型2:

        2.2 基于對數(shù)變換置信區(qū)間的樣本量

        則δ的置信水平為1-α的置信區(qū)間為:

        通過計(jì)算得到,基于對數(shù)變換的置信區(qū)間寬度控制在2ω所需的樣本量為:

        其中,模型1與模型2下,V分別由式(9)與(10)得到。

        2.3 基于Logit變換置信區(qū)間的樣本量

        則δ的置信水平為1-α的置信區(qū)間為

        通過計(jì)算可得基于Logit變換的置信區(qū)間寬度控制在2ω所需的樣本量為

        其中,模型1與模型2下,V分別由式(9)與(10)得到。

        2.4 基于Score置信區(qū)間和似然比置信區(qū)間的樣本量

        由于基于Score和似然比檢驗(yàn)統(tǒng)計(jì)量的δ的置信區(qū)間計(jì)算中需要參數(shù)π1,ηj,θj在δ=δ0下的限制性極大似然估計(jì)而這些估計(jì)沒有顯表達(dá)式,需要通過迭代算法得到,故考慮Zou等[17]提出的MOVER方法求得δ的置信區(qū)間。設(shè)δ的置信水平為1-α的置信區(qū)間上限δU和下限δL,根據(jù)中心極限定理易得:

        同樣,通過中心極限定理可直接求出πj(j=1,2)的置信水平為1-α的雙邊置信區(qū)間的上限uj和下限lj分別為:

        由此可得:

        根據(jù)MOVER方法,下限δL的替換得到:

        類似地,將上限δU的替換得到:

        分別基于以下的Score檢驗(yàn)統(tǒng)計(jì)量與似然比檢驗(yàn)統(tǒng)計(jì)量求得πj(j=1,2)的置信水平為1-α的雙邊置信區(qū)間的上限uj和下限lj,代入上述δL和δU的式中,從而得到δ的置信水平為1-α的置信區(qū)間。

        2.4.1 基于Score檢驗(yàn)統(tǒng)計(jì)量的置信區(qū)間

        上述方程組無顯式解,可通過迭代算法求得。

        在模型2下:

        基于Rao[18]的理論,在模型1下,檢驗(yàn)假設(shè)H0j∶πj=π0j的Score檢驗(yàn)統(tǒng)計(jì)量為

        在模型2下:

        根據(jù)文獻(xiàn)[19],當(dāng)nj→∞時(shí),在H0j下Tsc(π0j)漸近服從標(biāo)準(zhǔn)正態(tài)分布,利用迭代方法解如下方程可得到基于Score檢驗(yàn)統(tǒng)計(jì)量的置信水平為1-α的πj置信區(qū)間上限與下限為

        2.4.2 基于似然比檢驗(yàn)統(tǒng)計(jì)量的置信區(qū)間

        在模型1下,檢驗(yàn)假設(shè)H0j∶πj=π0j的似然比檢驗(yàn)統(tǒng)計(jì)量為

        在模型2下,檢驗(yàn)假設(shè)H0j∶πj=π0j的似然比檢驗(yàn)統(tǒng)計(jì)量為

        根據(jù)文獻(xiàn)[20],似然比檢驗(yàn)統(tǒng)計(jì)量Tl(π0j)漸近服從自由度為1的卡方分布,通過解方程Tl(π0j)=可得到基于似然比檢驗(yàn)統(tǒng)計(jì)量的置信水平為1-α的πj置信區(qū)間上下限。

        2.4.3 樣本量的數(shù)值解法

        由于基于以上檢驗(yàn)統(tǒng)計(jì)量Tsc(π0j)和Tl(π0j)計(jì)算的πj置信區(qū)間均沒有顯表達(dá)式,采取如下的搜索算法來獲得近似樣本量的估計(jì):

        步驟1給定π1,ηj,θj,δ,r,pj,N1的值,產(chǎn)生K組隨機(jī)樣本mj=(n11j,n10j,n01j,n00j,xj,yj)。

        令M(·)表示多項(xiàng)分布,在模型1下,(n11j,n10j,n01j,n00j)~M(nj;πjηjθj,πj(1-ηj)θj,πjηj(1-θj),πj(1-ηj)(1-θj)+(1-πj))。

        在模型2下,(n11j,n10j,n01j,n00j)~M(pjNj;πj(ηj+θj-1),πj(1-ηj),πj(1-θj),(1-πj))。

        兩種模型下(xj,yj)都服從二項(xiàng)分布B((1-pj)Nj,πjηj)。

        步驟2基于步驟1產(chǎn)生的樣本,結(jié)合MOVER方法計(jì)算δ的置信區(qū)間。并通過K個(gè)置信區(qū)間寬度的平均值計(jì)算近似的區(qū)間寬度,記為2ω*(N1)。

        步驟3若2ω*(N1)大于(小于)2ω,則增加(減少)N1的值,重復(fù)步驟1、2。

        步驟4重復(fù)步驟3直到近似的半?yún)^(qū)間寬度ω*(N1)非常接近于給定的區(qū)間寬度ω,則N1=min{N1∶|ω*(N1)-ω|≤0.001}即為滿足條件的近似樣本量。

        通過以上搜索方法可獲得基于Tsc(π0j)和Tl(π0j)的置信區(qū)間的樣本量Nsc和Nl。

        3 模擬研究

        對于模型1和模型2下所提出的樣本量的估計(jì)方法,通過計(jì)算在估計(jì)的樣本量下δ的置信區(qū)間的經(jīng)驗(yàn)覆蓋概率(ECP)和經(jīng)驗(yàn)覆蓋寬度(ECW)來評估本文中所提出方法的有效性。1)經(jīng)驗(yàn)覆蓋概率(ECP)

        [δL(m(k)),δU(m(k))]為δ的第k個(gè)置信區(qū)間,:j=1,2},此時(shí)I{δ∈[δL(m(k)),δU(m(k))]}為示性函數(shù)。

        2)經(jīng)驗(yàn)覆蓋寬度(ECW)

        在置信水平1-α=0.95下分別通過以下參數(shù)設(shè)置考察了各種樣本量估計(jì)方法的有效性:

        1)δ的影響。為研究δ的變化對樣本量的影響,在2種模型下,考慮如下參數(shù)設(shè)置:δ=0.1(0.01)0.3,π1=0.3,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1以及(a):r=1.0,p1=p2=1/3,(b):r=2.0,p1=p2=1/3,(c):r=1.0,p1=1/3,p2=1/5,(d):r=2.0,p1=1/3,p2=1/5。圖1、3給出了估計(jì)的樣本量N1、置信區(qū)間的經(jīng)驗(yàn)覆蓋概率ECP(%)和經(jīng)驗(yàn)覆蓋寬度ECW。對于模型1和模型2,隨著δ的逐漸增大,基于所有方法計(jì)算的所需樣本量均逐漸增加,基于對數(shù)變換置信區(qū)間的樣本量Nlog和基于Logit變換置信區(qū)間的樣本量Nlogit相對其他3種方法較小,所有方法的ECP均接近于事先給定的置信水平1-α=0.95,ECW接近于2ω=0.2。

        2)p1和p2的影響。為研究p1的變化對樣本量的影響,考慮如下參數(shù)設(shè)置:p1=0.1(0.1)0.9,π1=0.3,δ=0.2,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1,p2=0.3,(a):r=1.0,(b):r=2.0。為研究p2的變化對樣本量的影響,考慮如下參數(shù)設(shè)置:p2=0.1(0.1)0.9,π1=0.3,δ=0.2,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1,p1=0.3,(c):r=1.0,(d):r=2.0。圖2、4給出了估計(jì)的樣本量N1、置信區(qū)間的經(jīng)驗(yàn)覆蓋概率ECP(%)和經(jīng)驗(yàn)覆蓋寬度ECW。模擬研究結(jié)果表明,隨著p1和p2的增大,基于所有方法計(jì)算得到的樣本量均減少,所有方法的ECP均接近于事先給定的置信水平1-α=0.95,ECW接近于2ω=0.2。

        圖1中,δ=0.1(0.01)0.3,π1=0.3,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1。

        圖1 模型1:置信水平1-α=0.95下,估計(jì)的樣本量N1、置信區(qū)間的經(jīng)驗(yàn)覆蓋概率ECP(%)和經(jīng)驗(yàn)覆蓋寬度ECW隨δ變化的情況

        圖2中,π1=0.3,δ=0.2,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1。

        圖2 模型1:置信水平1-α=0.95下,估計(jì)的樣本量N1、置信區(qū)間的經(jīng)驗(yàn)覆蓋概率ECP(%)和經(jīng)驗(yàn)覆蓋寬度ECW隨p1、p2變化的情況

        圖3中,δ=0.1(0.01)0.3,π1=0.3,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1。

        圖3 模型2:置信水平1-α=0.95下,估計(jì)的樣本量N1、置信區(qū)間的經(jīng)驗(yàn)覆蓋概率ECP(%)和經(jīng)驗(yàn)覆蓋寬度ECW隨δ變化的情況

        圖4中,π1=0.3,δ=0.2,η1=θ1=0.8,η2=0.85,θ2=0.75,ω=0.1。

        圖4 模型2:置信水平1-α=0.95下,估計(jì)的樣本量N1、置信區(qū)間的經(jīng)驗(yàn)覆蓋概率ECP(%)和經(jīng)驗(yàn)覆蓋寬度ECW隨p1、p2變化的情況

        4 實(shí)例分析

        采用所提出的方法對表1數(shù)據(jù)進(jìn)行分析。表5列出了2個(gè)調(diào)查組下不同年齡組患病率之差δ、2組年齡下不同調(diào)查組患病率之差δ的參數(shù)估計(jì),置信水平1-α=0.95下區(qū)間寬度控制在區(qū)間寬度ω=0.1下的樣本量估計(jì),在估計(jì)樣本量下δ的置信區(qū)間的經(jīng)驗(yàn)覆蓋概率和經(jīng)驗(yàn)覆蓋寬度。結(jié)果表明:對于模型1,基于對數(shù)變換方法的ECW相對于其他4種方法較小,在模型2下則相反。值得注意的是,在模型1與模型2下,基于Wald方法置信區(qū)間得到的樣本量明顯大于其他4種方法的樣本量,但所有方法的ECP均接近于事先給定的置信水平1-α=0.95,ECW接近于2ω=0.2,現(xiàn)有樣本量滿足實(shí)驗(yàn)需求。

        5 結(jié)論

        基于無金標(biāo)準(zhǔn)的部分核實(shí)數(shù)據(jù),從比例差的區(qū)間寬度的角度給出了比較2組患病率是否有顯著性差異所需要的樣本量。在2種不同二重抽樣模型下,給出了在給定置信水平下置信區(qū)間寬度控制在指定范圍內(nèi)的樣本量估計(jì)公式。模擬結(jié)果表明:相同參數(shù)設(shè)置下模型1下各種方法所需樣本量大于模型2下相應(yīng)方法所需的樣本量;在2種模型下,基于所提出的各種方法估計(jì)的樣本量下計(jì)算的δ的置信區(qū)間的經(jīng)驗(yàn)覆蓋概率接近給定的置信水平且經(jīng)驗(yàn)覆蓋寬度接近設(shè)定的寬度。由此可知,所提出的樣本量估計(jì)公式和數(shù)值算法有效,推薦在實(shí)際應(yīng)用中使用。

        附錄:Fisher信息陣

        令I(lǐng)j=(Ilkj)3×3表示第j組下2個(gè)模型的費(fèi)希爾信息矩陣,其中,在模型1下,

        在模型2下

        猜你喜歡
        置信水平置信區(qū)間樣本量
        定數(shù)截尾場合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
        醫(yī)學(xué)研究中樣本量的選擇
        p-范分布中參數(shù)的置信區(qū)間
        多個(gè)偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
        產(chǎn)品控制與市場風(fēng)險(xiǎn)之間的相互作用研究
        航空裝備測試性試驗(yàn)樣本量確定方法
        列車定位中置信區(qū)間的確定方法
        單因子方差分析法在卷煙均勻性檢驗(yàn)中的研究與應(yīng)用
        Sample Size Calculations for Comparing Groups with Binary Outcomes
        用VaR方法分析中國A股市場的風(fēng)險(xiǎn)
        久久综合五月天啪网亚洲精品 | 亚洲精品国产一二三区| 在线成人一区二区| 免费国产交换配乱淫| 操B小视频国产| 亚洲av成人一区二区| 国产精品99无码一区二区| 午夜无码片在线观看影院| 国产成人精品无码一区二区老年人| 美女被强吻并脱下胸罩内裤视频 | 丝袜美腿在线播放一区二区| 国产成人无码a在线观看不卡| 午夜男女爽爽爽在线视频| 东京热加勒比在线观看| 亚洲精品国产成人久久av盗摄| 精品露脸国产偷人在视频| 国产精品美女一区二区三区 | 午夜无码片在线观看影院| 亚洲欧洲日产国码无码av野外| 国产在线av一区二区| 亚洲精品久久久久成人2007| 岛国av无码免费无禁网站下载| 国产亚洲三级在线视频| 日本人妻免费一区二区三区| 精品无码人妻一区二区三区不卡| 久久99国产伦精品免费| 亚洲天堂av中文字幕| 欧美日本精品一区二区三区| 国产亚洲情侣一区二区无| 亚洲第一区二区快射影院| 国产一区二区精品人妖系列在线| 超碰cao已满18进入离开官网| 97视频在线播放| 久久老熟女乱色一区二区 | а√中文在线资源库| 精品国精品国产自在久国产应用| 网红极品女神精品视频在线| 国产不卡精品一区二区三区| 性一交一乱一伧国产女士spa| 国产aⅴ天堂亚洲国产av| 国产中文色婷婷久久久精品|