亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        二分類(lèi)數(shù)據(jù)缺失多重填補(bǔ)分析及應(yīng)用*

        2014-03-10 05:25:11山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)教研室030001陳培翠張翠仙羅天娥劉桂芬
        關(guān)鍵詞:分類(lèi)分析

        山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)教研室(030001) 張 耀 陳培翠 張翠仙 羅天娥 劉桂芬

        二分類(lèi)數(shù)據(jù)缺失多重填補(bǔ)分析及應(yīng)用*

        山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)教研室(030001) 張 耀 陳培翠 張翠仙 羅天娥 劉桂芬△

        目的闡明四種填補(bǔ)方法(multiple imputation,M I)的基本原理,實(shí)例介紹縱向研究二分類(lèi)缺失數(shù)據(jù)多種填補(bǔ)方法的應(yīng)用。方法對(duì)比分析簡(jiǎn)單填補(bǔ)、分層填補(bǔ)、考慮個(gè)體差異的填補(bǔ)及考慮個(gè)體、抽樣的多重填補(bǔ)等四種填補(bǔ)方法;模擬證實(shí)幾種OR取值的敏感性分析。結(jié)果進(jìn)行大樣本(N=10000)模擬研究表明:簡(jiǎn)單多重填補(bǔ)分析會(huì)降低檢驗(yàn)效能,不能客觀(guān)反應(yīng)兩樣本的差異;考慮先前信息的分層多重填補(bǔ)會(huì)擴(kuò)大I型錯(cuò)誤;若只考慮個(gè)體變異,僅模擬一個(gè)數(shù)據(jù)集,所得結(jié)論不穩(wěn)定;在考慮個(gè)體、抽樣和填補(bǔ)差異后模擬的多重填補(bǔ)數(shù)據(jù)集,當(dāng)OR≈2時(shí),所得統(tǒng)計(jì)量基本接近真值;實(shí)例驗(yàn)證,經(jīng)高血壓知曉干預(yù)后,尚不能認(rèn)為兩區(qū)的吸煙率有差別。結(jié)論不考慮前次觀(guān)察數(shù)據(jù)以及OR值的影響,一味地把缺失值當(dāng)作該事件發(fā)生處理,會(huì)加大I型錯(cuò)誤;只有綜合考慮個(gè)體、抽樣和填補(bǔ)差異,多重填補(bǔ)數(shù)據(jù)集的估計(jì)結(jié)果才更具穩(wěn)健性。

        多重填補(bǔ) 縱向研究 二分類(lèi)數(shù)據(jù)缺失 效果評(píng)價(jià)

        數(shù)據(jù)缺失是縱向研究中普遍存在的問(wèn)題,盲目地對(duì)缺失數(shù)據(jù)進(jìn)行處理,會(huì)喪失原資料蘊(yùn)藏的信息,甚至得出錯(cuò)誤的結(jié)論。公共衛(wèi)生研究中,有關(guān)藥物依賴(lài)、酗酒、吸煙等針對(duì)個(gè)體縱向監(jiān)測(cè)的干預(yù)效果的評(píng)價(jià),二分類(lèi)數(shù)據(jù)缺失是多見(jiàn)的一種形式。有關(guān)二分類(lèi)缺失數(shù)據(jù)處理的統(tǒng)計(jì)方法,已有非技術(shù)性文獻(xiàn)發(fā)表[1],但由于這些方法未能在標(biāo)準(zhǔn)分析軟件中方便實(shí)施,其研究尚有較大空間。本文擬針對(duì)二分類(lèi)數(shù)據(jù)缺失多重填補(bǔ)問(wèn)題介紹四種方法。

        原理與方法

        對(duì)于本文,形如nabcd,下角標(biāo)中第一個(gè)值a表示前一觀(guān)測(cè)時(shí)間點(diǎn)t0的觀(guān)測(cè)結(jié)果是否存在某種行為,賦值:是=1,否=2;下角標(biāo)b表示最后觀(guān)測(cè)時(shí)點(diǎn)是否缺失,賦值:是=1,否=2;下角標(biāo)c表示最后一次觀(guān)測(cè)結(jié)果是否存在某種行為,賦值:是=1,否=2;d表示分組情況;下角標(biāo)“.”表示兩水平行或列的合計(jì);t0表示首次觀(guān)測(cè)某種行為時(shí)刻,t1表示干預(yù)后終點(diǎn)觀(guān)測(cè)時(shí)刻。

        1.二分類(lèi)數(shù)據(jù)缺失多重填補(bǔ)原理

        (1)簡(jiǎn)單多重填補(bǔ)法(simple M I)

        對(duì)單一時(shí)間點(diǎn),不考慮前一時(shí)刻t0觀(guān)測(cè)結(jié)果,根據(jù)最終觀(guān)測(cè)結(jié)果二分類(lèi)效應(yīng)變量如吸煙與否,是否有數(shù)據(jù)缺失,可列成四格表,其優(yōu)勢(shì)比OR=(n11/n12)/(n21/n22),式中n22表示非吸煙組觀(guān)察單位數(shù);n21表示吸煙組非缺失個(gè)體數(shù),缺失值n12和n11是未知的,其推算式記作:

        若將缺失均看作是吸煙,n12=0,n11=n1(“.”表示行或列合計(jì)所有缺失個(gè)體),則OR值趨于+∞。顯然,關(guān)于OR值更合理的假設(shè)是有限的。當(dāng)n21/n22值已知,若設(shè)定OR值,由式(1)可估算出缺失數(shù)據(jù)中吸煙與非吸煙的觀(guān)察單位數(shù)。同理將式(1)轉(zhuǎn)換為:

        式(2)中,odds1:實(shí)際觀(guān)察到吸煙個(gè)體的優(yōu)勢(shì)(n21/n22);π:優(yōu)勢(shì)比為OR值時(shí),數(shù)據(jù)缺失者中吸煙者所占比例,即n11=n1.π。

        (2)考慮先前信息的分層多重填補(bǔ)

        考慮先前信息的多重填補(bǔ)(consider previous information MI)中,LOCF(last observation carried forward)是目前眾多研究中常用的填補(bǔ)技術(shù),因其原理不合邏輯被廣泛批評(píng)[2],它是將最后一次得到的干預(yù)效應(yīng)作為其觀(guān)察終點(diǎn)。按終點(diǎn)觀(guān)測(cè)前一時(shí)刻t0觀(guān)察結(jié)果分層,設(shè)某層數(shù)據(jù)缺失值中吸煙者所占比例為πi,即

        式中,oddi:第i層(i=1,2,…,k)終點(diǎn)非缺失個(gè)體吸煙者的優(yōu)勢(shì)。

        (3)考慮個(gè)體差異的多重填補(bǔ)

        盡管分層多重填補(bǔ)考慮了前一時(shí)間點(diǎn)觀(guān)測(cè)結(jié)果對(duì)本次結(jié)果的影響,但仍沒(méi)有考慮由于個(gè)體變異對(duì)觀(guān)察結(jié)果的影響。若在分層條件下再考慮個(gè)體變異的多重填補(bǔ)(consider individual variation M I)可用潛變量logistic回歸模型[3]表示:

        式中,εi:個(gè)體差異;Miss:數(shù)據(jù)缺失=1,反之賦值為0;Smok0i:當(dāng)前次觀(guān)察結(jié)果為吸煙者,賦值為1,反之為0;β0表示t0時(shí)刻不吸煙,t1時(shí)刻非缺失其吸煙的優(yōu)勢(shì)對(duì)數(shù)值;β2:表示t0時(shí)刻吸煙,t1時(shí)刻非缺失其吸煙的優(yōu)勢(shì)對(duì)數(shù)值;β1表示t0時(shí)刻不吸煙,t1時(shí)刻缺失其吸煙的優(yōu)勢(shì)比對(duì)數(shù)值,β3:表示t0時(shí)刻吸煙,t1時(shí)刻缺失其吸煙的優(yōu)勢(shì)比對(duì)數(shù)值(可通過(guò)設(shè)定的OR值來(lái)表示)設(shè)為個(gè)體i的潛變量,記臨界值為γ,如果Y*>γ,Y=1,否則Y=0。通過(guò)設(shè)置logistic回歸模型臨界值γ=0,假定誤差εi服從標(biāo)準(zhǔn)logistic分布(均數(shù)=0,方差為π2/3)[4],對(duì)原缺失數(shù)據(jù)按式(4)進(jìn)行合理填補(bǔ),即可將個(gè)體變異考慮入填補(bǔ)過(guò)程,使具有相同協(xié)變量的受試者賦有不同的吸煙概率,該填補(bǔ)也稱(chēng)為隨機(jī)回歸填補(bǔ)[5]。

        (4)考慮樣本變異的多重填補(bǔ)

        基于填補(bǔ)過(guò)程中考慮樣本的變異(consider sampling variation M I),可用常規(guī)logistic回歸來(lái)預(yù)測(cè)二分類(lèi)結(jié)果。t0時(shí)刻非吸煙個(gè)體分層回歸參數(shù)的方差協(xié)方差估計(jì)如下:

        同理,t0時(shí)刻吸煙個(gè)體分層回歸參數(shù)的方差協(xié)方差估計(jì)類(lèi)似;我們用表示t0時(shí)刻非吸煙者估計(jì)的參數(shù)向量的估計(jì)方差-協(xié)方差;假定從均數(shù)為和方差-協(xié)方差為的總體中進(jìn)行隨機(jī)抽樣得到的參數(shù)。按上述過(guò)程,同樣可獲得t0組吸煙者的回歸系數(shù)同理,從均數(shù)為(即t0組吸煙者回歸系數(shù)向量為和方差-協(xié)方差矩陣總體中進(jìn)行隨機(jī)抽樣得到的參數(shù)(即用n1ij代替n2ij估計(jì)得到參數(shù))模型表述如下:

        將連續(xù)潛變量Y*轉(zhuǎn)化為二分類(lèi)變量yi,與前規(guī)則相同,進(jìn)行多次重復(fù)隨機(jī)填補(bǔ),建立多個(gè)模擬數(shù)據(jù)集,即可對(duì)感興趣的效應(yīng)變量進(jìn)行統(tǒng)計(jì)分析與評(píng)價(jià)。

        有關(guān)上述四種方法的模擬證實(shí),無(wú)論采用不同的OR值,還是隨機(jī)獲得填補(bǔ)100次的模擬數(shù)據(jù)集,均可采用SAS9.2編程來(lái)實(shí)現(xiàn)。

        2.大樣本模擬研究

        進(jìn)行大樣本(N=10000)模擬研究表明:簡(jiǎn)單多重填補(bǔ)分析會(huì)降低檢驗(yàn)效能,不能客觀(guān)反應(yīng)兩樣本的差異;考慮先前信息的分層多重填補(bǔ)會(huì)擴(kuò)大I型錯(cuò)誤;考慮個(gè)體差異的多重填補(bǔ)所得結(jié)果極不穩(wěn)定;考慮個(gè)體變異樣本變化的多重填補(bǔ)分析結(jié)果最接近真實(shí)值,且OR≈2時(shí),所得統(tǒng)計(jì)量基本接近真值。

        實(shí)例研究

        1.六社區(qū)吸煙干預(yù)數(shù)據(jù)缺失情況分析

        以全國(guó)社區(qū)高血壓規(guī)范化管理項(xiàng)目太原分中心研究數(shù)據(jù)為例,收集2007-2008年間太原市迎澤區(qū)(師范中心社區(qū)、廟前社區(qū)和棉花巷社區(qū))與杏花嶺區(qū)(東華苑社區(qū)、敦化坊社區(qū)和杏花嶺社區(qū))管理的518例高血壓患者為研究對(duì)象;根據(jù)項(xiàng)目組對(duì)高?;颊邔?shí)行社區(qū)高血壓三級(jí)管理要求,一年內(nèi)應(yīng)進(jìn)行六次隨訪(fǎng);以基線(xiàn)調(diào)查中非藥物治療是否吸煙為t0時(shí)刻觀(guān)測(cè)結(jié)果,以第五次隨訪(fǎng)吸煙狀況為干預(yù)后終觀(guān)測(cè)結(jié)果。經(jīng)兩地區(qū)基線(xiàn)資料吸煙率比較,χ2=0.914,P=0.339,尚不能認(rèn)為兩區(qū)患者的吸煙率有差別。按項(xiàng)目規(guī)范管理要求,經(jīng)對(duì)患者每月集中實(shí)施高血壓知識(shí)、態(tài)度和行為等規(guī)范管理干預(yù)后,進(jìn)行干預(yù)效果評(píng)價(jià)。

        通過(guò)對(duì)兩區(qū)六個(gè)社區(qū)第五次終隨訪(fǎng)結(jié)果吸煙情況分析可知,迎澤區(qū)實(shí)施三級(jí)規(guī)范化管理的高血壓患者261例,第五次檢測(cè)中數(shù)據(jù)缺失95例,缺失比例36.40%;杏花嶺區(qū)管理257例,第五次檢測(cè)中數(shù)據(jù)缺失132例,缺失比例51.36%,兩組缺失數(shù)據(jù)平均占高血壓規(guī)范管理患者的43.8%。

        2.二分類(lèi)數(shù)據(jù)缺失四種多重填補(bǔ)方法對(duì)比研究

        (1)簡(jiǎn)單多重填補(bǔ)法分析

        表1 兩區(qū)終隨訪(fǎng)數(shù)據(jù)缺失關(guān)系分析

        由基線(xiàn)資料分析,迎澤區(qū)吸煙率75/166=45.1%,杏花嶺區(qū)吸煙率71/125=58.8%,經(jīng)Pearson卡方檢驗(yàn)χ2=3.851,P=0.0498,可認(rèn)為兩地區(qū)吸煙率有差別。若采用簡(jiǎn)單多重填補(bǔ),將缺失個(gè)體均假設(shè)為吸煙,迎澤區(qū)和杏花嶺區(qū)的吸煙率分別為(75+95)/261=65.13%和(71+132)/257=78.99%,經(jīng)兩區(qū)終隨訪(fǎng)吸煙率比較χ2=12.331,P<0.01,盡管統(tǒng)計(jì)分析結(jié)論一致,但卡方值有很大的差別??梢?jiàn)把缺失值均看做吸煙(或不吸煙)的假設(shè),給兩區(qū)高血壓知曉干預(yù)效果的評(píng)價(jià)解釋帶來(lái)較大的困惑。因兩區(qū)數(shù)據(jù)缺失比重不同,這樣將數(shù)據(jù)缺失值都看作吸煙,顯然不合理。若考慮數(shù)據(jù)缺失與吸煙率的關(guān)系,分別將OR取值設(shè)為1、3、5、7(即缺失數(shù)據(jù)的吸煙優(yōu)勢(shì)是已觀(guān)測(cè)個(gè)體的1倍、3倍……),若OR=1,則π=1×[(71+75)/(54+91)]/(1+1×[(71+75)/(54+91)])=0.502,即當(dāng)缺失與吸煙關(guān)系獨(dú)立;表明缺失數(shù)據(jù)中吸煙率50.2%,則迎澤區(qū)缺失數(shù)據(jù)中吸煙數(shù)為n11=95×0.502=47.69;同理,不同OR取值條件下,可填補(bǔ)杏花嶺區(qū)缺失數(shù)據(jù)中吸煙與非吸煙觀(guān)察單位數(shù),見(jiàn)表2。

        表2 4種邊際OR取值對(duì)兩組吸煙率的影響分析

        表2簡(jiǎn)單填補(bǔ)法分析結(jié)果可見(jiàn),邊際OR取值不同,對(duì)分析結(jié)果有影響,隨邊際OR值的增大,更趨于得出兩組吸煙率差別有統(tǒng)計(jì)學(xué)意義的結(jié)論。

        (2)分層多重填補(bǔ)分析

        若考慮第一時(shí)點(diǎn)(基線(xiàn))與終觀(guān)測(cè)結(jié)果間的關(guān)聯(lián)性,即基于t0時(shí)刻吸煙(Smok0)信息進(jìn)行分層分析,結(jié)果整理如表3。

        表3 按Smok0分層多重填補(bǔ)分析

        表中,基線(xiàn)調(diào)查不吸煙者中,終隨訪(fǎng)結(jié)果迎澤區(qū)缺失n21.y=n212y+n211y=62,杏花嶺區(qū)缺失n21.x=n212x+n211x=64;同理,基線(xiàn)調(diào)查為吸煙者中,迎澤區(qū)缺失n11.y=n111y+n112y=33,杏花嶺區(qū)缺失n11.x=n111x+n112x=68。仍假定OR=1,π1=(141/137)/[1+(141/137)]=0.2303;π2=0.9292。進(jìn)行不同OR取值假定下的分層填補(bǔ),結(jié)果對(duì)比見(jiàn)表4。

        表4 兩區(qū)不同OR取值分層多重填補(bǔ)結(jié)果分析

        表4OR取值分別為1,3,5,7的分層多重填補(bǔ)結(jié)果表明,OR=1時(shí),表明數(shù)據(jù)缺失與效應(yīng)變量間關(guān)系相互獨(dú)立,而OR=7表明兩者間關(guān)聯(lián)性較強(qiáng)。結(jié)果可見(jiàn),簡(jiǎn)單填補(bǔ)法更易把分析結(jié)果推斷為有統(tǒng)計(jì)學(xué)意義,而分層填補(bǔ)在數(shù)據(jù)缺失與效應(yīng)變量有關(guān)聯(lián)時(shí),它可更客觀(guān)地反映出分層OR值遠(yuǎn)比邊際OR值的影響小,也即干預(yù)后效應(yīng)變量是否有統(tǒng)計(jì)學(xué)意義,其結(jié)果也取決它與缺失數(shù)據(jù)間的關(guān)聯(lián)性,即將缺失值均看做吸煙的假設(shè)掩蓋了OR取值的影響。

        (3)考慮個(gè)體變異的多重填補(bǔ)分析

        假定誤差分布服從均數(shù)=0,方差為π2/3的logistic分布[4],按式(4)來(lái)擬合logistic回歸模型,對(duì)所產(chǎn)生的數(shù)據(jù)集進(jìn)行分析,模擬分析結(jié)果見(jiàn)表5。

        表5 考慮個(gè)體變異四種OR取值兩組結(jié)果比較

        考慮個(gè)體變異,OR分別取值1、3、5、7時(shí)分析結(jié)果對(duì)比表明,由于存在個(gè)體變異,不能單純考慮OR取值對(duì)數(shù)據(jù)缺失與效應(yīng)變量間關(guān)系的影響,尚應(yīng)計(jì)算考慮個(gè)體變異情況下含有數(shù)據(jù)缺失信息吸煙的概率,它是目前填補(bǔ)方法中既考慮邏輯關(guān)系,又考慮分析效果解釋的首選方法。

        (4)考慮個(gè)體變異樣本變化的多重填補(bǔ)分析

        在考慮個(gè)體變異的情況下,重復(fù)隨機(jī)填補(bǔ)過(guò)程100次生成多重填補(bǔ)數(shù)據(jù)集,并進(jìn)行兩區(qū)干預(yù)后吸煙率的比較。

        表6 考慮個(gè)體變異和四種OR取值樣本變化情況的兩組比較

        填補(bǔ)進(jìn)行100次,OR取值為1、3、5、7時(shí),計(jì)算檢驗(yàn)統(tǒng)計(jì)量與對(duì)應(yīng)的P值。需要注意的是,相同OR取值時(shí),其卡方值均小于沒(méi)有考慮個(gè)體、抽樣和填補(bǔ)差異的卡方值,P值均大于表4、表5的概率P值。由此可知,同時(shí)考慮抽樣、隨機(jī)填補(bǔ)和個(gè)體變異,且OR取值低于5時(shí),兩區(qū)高血壓規(guī)范管理對(duì)吸煙知行干預(yù)效果尚不能認(rèn)為有差別;而OR取值不同對(duì)應(yīng)的敏感性分析結(jié)果有差別。

        小 結(jié)

        二分類(lèi)數(shù)據(jù)缺失的處理方法有多種,常規(guī)分析多將未觀(guān)測(cè)到的結(jié)果看作是二分類(lèi)結(jié)果中的任一種結(jié)局(如視為吸煙),這樣不僅“保守”,且顯然不符合邏輯?!扒懊嬗^(guān)測(cè)結(jié)果決定終觀(guān)察結(jié)果”的LOCF分析,在OR值大于3時(shí),更易得出差別有統(tǒng)計(jì)學(xué)意義的結(jié)論;考慮前觀(guān)測(cè)結(jié)果對(duì)后干預(yù)效果的關(guān)聯(lián)性時(shí),隨OR取值增大,更有可能得出差別有統(tǒng)計(jì)學(xué)意義的結(jié)果。若僅考慮個(gè)體變異,只模擬單個(gè)數(shù)據(jù)集進(jìn)行缺失數(shù)據(jù)分析,在OR取值不同的情況下,均可見(jiàn)統(tǒng)計(jì)結(jié)果不穩(wěn)定。當(dāng)考慮個(gè)體、抽樣和多重填補(bǔ)變異,采用多重填補(bǔ)其分析結(jié)果解釋更符合實(shí)際。因此推知,考慮個(gè)體變異、樣本變化的多重填補(bǔ)方法是以上四種方法中值得推崇的缺失數(shù)據(jù)分析方法。

        高血壓知行干預(yù)后吸煙缺失多是因受試者主觀(guān)因素造成的,其數(shù)據(jù)缺失個(gè)體大多是干預(yù)后仍處于吸煙狀態(tài),因此認(rèn)為吸煙與數(shù)據(jù)缺失間的假設(shè)是合理的。通過(guò)OR取值為1、3、5、7的多重填補(bǔ)100次模擬證實(shí),隨OR取值增大,更易得出差別有統(tǒng)計(jì)學(xué)意義的結(jié)論,即可認(rèn)為該數(shù)據(jù)缺失與OR取值有關(guān)聯(lián)。而考慮個(gè)體、抽樣和多重填補(bǔ)變異時(shí),當(dāng)吸煙優(yōu)勢(shì)比較大(OR取值大于5),才有可能得出兩區(qū)干預(yù)效果差別有統(tǒng)計(jì)學(xué)意義的結(jié)論,分析結(jié)果更具說(shuō)服力,結(jié)論更穩(wěn)健。

        總之,單一終點(diǎn)二分類(lèi)數(shù)據(jù)缺失,考慮個(gè)體、抽樣和填補(bǔ)差異的影響進(jìn)行多重填補(bǔ)是二分類(lèi)缺失數(shù)據(jù)分析值得推崇的一種方法。本方法類(lèi)似于加權(quán)估計(jì)方程處理缺失數(shù)據(jù)[6-7]的原理,利用已觀(guān)測(cè)到的信息對(duì)缺失數(shù)據(jù)賦予合理權(quán)重,進(jìn)而進(jìn)行填補(bǔ);考慮前次觀(guān)測(cè)情況以及優(yōu)勢(shì)比OR取值的影響,對(duì)干預(yù)后單時(shí)點(diǎn)干預(yù)效果進(jìn)行評(píng)價(jià)的影響是值得關(guān)注的。有關(guān)考慮個(gè)體、抽樣和多重填補(bǔ)差異的多時(shí)點(diǎn)干預(yù)效果評(píng)價(jià)中結(jié)構(gòu)數(shù)據(jù)缺失的分析方法研究有待進(jìn)一步探討。

        1.Abraham W.T.,Russell D.W.M issing data:a review of currentmethods and applications in epidemiological research.Curr Opin Psychiatry,2004,17:315-321.

        2.Siddiqui O,Hung HM.MMRM vs.LOCF:a comprehensive comparison based on simulation study and 25 NDA datasets.JBiopharm Stat,2009,19:227.

        3.Donald H,Robin J,Hakan D.Analysis of binary outcomes w ith m issing data:m issing=smoking,last observation carried forward,and a little multiple imputation.Methods and techniques,2007,10:1565-1569.

        4.Long JS.Regression Models for Categorical and Lim ited Dependent Variables.Thousand Oaks,CA:Sage Publications,1997:42.

        5.Little RJA,Rubin DB.Statistical Analysis w ith M issing Data,2nd edn.New York:Wiley,2002.

        6.張偉,馮萍,趙永紅.加權(quán)估計(jì)方程用于缺失數(shù)據(jù)的處理.中國(guó)衛(wèi)生統(tǒng)計(jì),2013,30(3):435-437.

        7.帥平,李曉松,周曉華.缺失數(shù)據(jù)統(tǒng)計(jì)處理方法的研究進(jìn)展.中國(guó)衛(wèi)生統(tǒng)計(jì),2013,30(1):137.

        (責(zé)任編輯:郭海強(qiáng))

        The M ultiple Im putation and App lication in Binary LongitudinalM issing Data

        Zhang Yao,Chen Peicui,Zhang Cuixian,et al(DepartmentofHealthStatistics,SchoolofPublicHealth,ShanxiMedicalUniversity(030001),Taiyuan)

        ObjectiveTo clarify the basic principles of themultiple imputation(M I),wew ill introduce severalmethods w ith examples.MethodsCompare the analysis of four M Imodel,i.e.(1)simple M I.(2)Stratified M I.(3)The M Iwhich consider individual differences.(4)Perform the comprehensive analysis considering the individual,sampling and imputation.Carry outsensitivity analysis under different imputation sample,using SAS 9.2 to complete M I.ResultsLarge sample(N=10000)simulation show that:simple multiple imputation analysis w ill reduce the ability of performance test,it can not response the difference between two samples.themultiple imputation analysis which considering the previous information w ill expand type I error.If only considerate the individual variability and simulate a data set,the conclude w ill be not stable;considerate the individual variability,sampling,and filling difference,whenOR≈2,the statistics result are close to the true value.We finally still can not believe that the rate of smoking are unequal between the two areas though the example of hypertension awareness intervention.ConclusionWhen we regard them issing as the event,therew ill increase the probability of type Ierror.When we consider the difference of individual,sampling and multiple imputation,we w ill draw amore robust parameter estimation.

        M I;Longitudinal study;Binary m issing data;Evaluation

        *:國(guó)家自然科學(xué)基金項(xiàng)目(編號(hào)81172774);國(guó)家青年科學(xué)基金項(xiàng)目資助(81001294);太原市大學(xué)生創(chuàng)新創(chuàng)業(yè)專(zhuān)題(120164023)

        △通信作者:劉桂芬,E-mail:liugf66@126.com

        猜你喜歡
        分類(lèi)分析
        分類(lèi)算一算
        垃圾分類(lèi)的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        隱蔽失效適航要求符合性驗(yàn)證分析
        分類(lèi)討論求坐標(biāo)
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        數(shù)據(jù)分析中的分類(lèi)討論
        教你一招:數(shù)的分類(lèi)
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
        給塑料分分類(lèi)吧
        中西醫(yī)結(jié)合治療抑郁癥100例分析
        a午夜国产一级黄片| 国精产品一区一区三区有限公司杨| 亚洲av日韩av综合| 久久se精品一区精品二区国产| 日本成人三级视频网站| 亚洲国产中文字幕在线视频综合| 少妇人妻精品一区二区三区| 久久99精品久久久久久野外| 国产aⅴ丝袜旗袍无码麻豆| 国内免费自拍9偷1拍| 亚洲乱码一区av春药高潮| 亚洲免费观看在线视频| av大片在线无码永久免费网址| 久久伊人精品色婷婷国产| 无码国内精品久久人妻| 欧美色aⅴ欧美综合色| 亚洲精品中文字幕乱码二区| 二区免费在线视频观看| 久久久无码人妻精品无码| 精品欧美乱子伦一区二区三区| 亚洲中文字幕国产综合| 极品一区二区在线视频观看| 久久亚洲私人国产精品va| 国产午夜无码视频免费网站| 精品少妇一区二区三区四区| 亚洲午夜无码毛片av久久| 最新国产乱人伦偷精品免费网站| 亚欧乱色束缚一区二区三区| 成在线人免费视频| 99re在线视频播放| 久久国产亚洲av高清色| 女人无遮挡裸交性做爰| 国产精品美女一区二区三区| 无码高潮久久一级一级喷水 | 在线亚洲妇色中文色综合| 特级做a爰片毛片免费看| 抽搐一进一出试看60秒体验区| 亚洲精品一区二区三区播放 | 十八禁视频网站在线观看| 熟妇人妻中文字幕无码老熟妇| 国产一区二区三区白浆在线观看 |