亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多重填補技術(shù)在醫(yī)學(xué)研究缺失值處理中的應(yīng)用及發(fā)展*

        2022-05-28 04:21:00海軍軍醫(yī)大學(xué)衛(wèi)生勤務(wù)學(xué)系軍隊衛(wèi)生統(tǒng)計學(xué)教研室200433
        中國衛(wèi)生統(tǒng)計 2022年2期
        關(guān)鍵詞:機制分析方法

        海軍軍醫(yī)大學(xué)衛(wèi)生勤務(wù)學(xué)系軍隊衛(wèi)生統(tǒng)計學(xué)教研室(200433)

        朱榮慧 許金芳 王 睿 吳 騁△

        在醫(yī)學(xué)研究數(shù)據(jù)采集與獲取過程中,經(jīng)常會碰到缺失值。例如,創(chuàng)新藥開發(fā)臨床試驗中,導(dǎo)致缺失值的原因可能有受試者失訪、或受試者由于不良事件、對干預(yù)措施的不耐受或缺乏療效等原因中途退出試驗[1]。缺失值不僅會給統(tǒng)計分析和結(jié)果解釋帶來挑戰(zhàn),而且可能會對臨床試驗結(jié)果造成偏倚,使其代表性和真實性受到影響[2]。對于缺失值處理的問題,歐洲藥品管理局于2010年發(fā)布了《確證性臨床試驗中缺失數(shù)據(jù)處理指南》[3]。同年,美國食品藥品監(jiān)督管理局(Food and Drug Administration,F(xiàn)DA)發(fā)布了《臨床試驗中缺失數(shù)據(jù)的預(yù)防和處理》報告[4],該報告推薦了合適的研究設(shè)計和隨訪方法來減少臨床試驗中的數(shù)據(jù)缺失,以及有效處理結(jié)果分析中缺失數(shù)據(jù)的統(tǒng)計方法。2016年,國家藥品監(jiān)督管理局藥品評審中心頒布了《藥物臨床試驗的生物統(tǒng)計學(xué)指導(dǎo)原則》[5]。該原則指出“在試驗的計劃、執(zhí)行過程中應(yīng)有必要的措施盡量避免缺失值的發(fā)生,在分析和報告中要正確處理缺失數(shù)據(jù),否則會造成潛在的偏倚”。由此可見,在醫(yī)學(xué)研究中適當處理缺失值已越來越引起關(guān)注。

        缺失值通??筛鶕?jù)Rubin和Little提出的缺失機制分為三類,分別是完全隨機缺失(missing completely at random,MCAR)、隨機缺失(missing at random,MAR)和非隨機缺失(missing not at random,MNAR)[6]。根據(jù)缺失模式分為兩類:特殊缺失模式(special missingness pattern)和任意缺失模式(arbitrary missingness pattern)[4],特殊缺失模式包括單變量缺失模式(univariate missingness pattern)和單調(diào)缺失模式(monotone missingness pattern)。也可以使用因果圖(causal diagrams)來描述數(shù)據(jù)缺失的機制[7-8]。不同的缺失類型,其填補方法往往不同。本文將在簡要介紹常用缺失值處理方法的基礎(chǔ)上重點綜述應(yīng)用較廣的多重填補的步驟、方法及其進展,以期為研究者提供參考。

        常用缺失值處理方法

        臨床試驗中常用的缺失值處理方法有完全記錄分析(complete-case analysis)、單一填補(single value imputation)和多重填補(multiple imputation)。

        1.完全記錄分析

        完全記錄分析也稱為成組刪除法,是指從分析中刪除有缺失數(shù)據(jù)的觀測對象,即僅對沒有缺失數(shù)據(jù)的觀測對象進行分析。此方法簡單易行,但由于刪除有缺失數(shù)據(jù)的觀測對象使樣本量減少,可能會影響試驗結(jié)果的代表性和準確性,并導(dǎo)致統(tǒng)計功效下降[9]。但完全記錄分析在缺失機制為MCAR且缺失比例較低時的估計結(jié)果較好[10]。

        2.單一填補

        單一填補是指用單個數(shù)值填補缺失值,形成完整的數(shù)據(jù)集后再進行統(tǒng)計分析。常用的方法有均數(shù)填補法(mean imputation)和末次觀測結(jié)轉(zhuǎn)法(last observation carried forward,LOCF)。均數(shù)填補法未考慮缺失值的不確定性、減小了數(shù)據(jù)變異性和估計的標準誤[11]、夸大了估計精度,可能會導(dǎo)致I類錯誤,但在MCAR缺失機制下對均數(shù)的估計結(jié)果較準確[9]。LOCF是指用末次觀測數(shù)據(jù)填補缺失值,通常用于縱向數(shù)據(jù)(又稱多次重復(fù)測量數(shù)據(jù))或生存數(shù)據(jù)中缺失值的填補。LOCF填補過程較簡單,但在多數(shù)情況下,該方法的I類錯誤難以控制,即使在MCAR缺失機制下,其檢驗效能和估計誤差仍不穩(wěn)定[12]。

        3.多重填補

        多重填補旨在基于一個或多個模型填補缺失數(shù)據(jù),并正確反映與“填補”過程相關(guān)的不確定性[13]。該方法不是為每個缺失觀測填補單個值,而是根據(jù)缺失觀測的預(yù)測分布生成一組填補值,從而生成不同的填補數(shù)據(jù)集。然后再對每個填補數(shù)據(jù)集進行分析,并通過Rubin法則合并分析結(jié)果[13]。多重填補主要包括以下三個步驟[1]:第一步,選擇可能有助于填補缺失數(shù)據(jù)的自變量,對缺失變量進行多次填補,創(chuàng)建多個不同的填補數(shù)據(jù)集,其中自變量應(yīng)包括后續(xù)分析模型中的所有變量,以及能使MAR假設(shè)合理的輔助變量;第二步,采用既定的統(tǒng)計分析方法分別對每個填補數(shù)據(jù)集進行結(jié)果的關(guān)聯(lián)估計,因此可計算估計系數(shù)和相應(yīng)的標準誤,作為每個填補數(shù)據(jù)集的關(guān)聯(lián)度量;第三步,通過Rubin法則和相應(yīng)的標準誤合并每個填補數(shù)據(jù)集的關(guān)聯(lián)估計,得到最終的分析結(jié)果。相比于單一填補方法,多重填補具有一定優(yōu)勢:第一,考慮了缺失值的不確定性;第二,由于最終的關(guān)聯(lián)估計是根據(jù)每個填補數(shù)據(jù)集估計系數(shù)的平均值得到的,減小了抽樣誤差,從而得到了更精確的點估計值[4];第三,最終分析模型中不包括的輔助變量也可以用于填補模型[13],從而可使MAR的假設(shè)更合理;最后,雖然多重填補假定的缺失機制為MAR,但也能處理缺失機制為MCAR或MNAR的缺失數(shù)據(jù)[14]?;谝陨蟽?yōu)點,多重填補方法已廣泛應(yīng)用于醫(yī)學(xué)研究的缺失值處理中。

        多重填補方法類型及其比較

        根據(jù)需填補變量的數(shù)量、資料類型不同,進行多重填補的方法不同[15],對于單變量填補,若缺失變量為連續(xù)型,可采用線性回歸模型(linear regression model)和預(yù)測均數(shù)匹配(predictive mean matching,PMM);若缺失變量為分類變量,可采用logistic回歸模型(logistic regression model)。對于多變量填補,即有多個變量含有缺失值,可采用基于鏈式方程的多重填補(MI by chained equations,MICE),又稱為完全條件規(guī)范(fully conditional specification,F(xiàn)CS);或采用多變量正態(tài)填補(multivariate normal imputation,MVNI)。上述幾種多重填補方法的簡要說明及優(yōu)缺點總結(jié)如表1。有研究認為不同的多重填補方法,主要取決于缺失變量的類型(連續(xù)型或分類型)、包括在預(yù)測模型中的協(xié)變量的類型以及缺失模式的類型(單調(diào)性或非單調(diào)性)[16]。也有研究根據(jù)填補方法的復(fù)雜程度將多重填補分類為單值填補、單調(diào)填補、基于鏈式方程的多重填補和馬爾科夫鏈蒙特卡羅法[14]。

        表1 不同多重填補方法的比較

        多重填補法的進展

        隨著計算機和多重填補技術(shù)的發(fā)展,越來越多的新技術(shù)逐漸應(yīng)用到醫(yī)學(xué)研究缺失值的填補中。如Bartlett等[21]提出了修正的FCS—分析模型兼容的完全條件規(guī)范(substantive-model compatible fully conditional specification,SMC-FCS)。他們認為當分析模型包含非線性特征或交互時,由于填補模型和分析模型的不兼容,使用基于FSC算法的填補模型可能會得到有偏估計,所以提出根據(jù)與分析模型兼容的填補模型對每個協(xié)變量進行填補。雖然分析模型和填補模型的兼容性并不能保證填補模型一定是正確或規(guī)范說明的,但保證了模型間的假設(shè)不相互沖突,從而減少了參數(shù)估計中的偏倚。Anneke等[22]將SMC-FCS應(yīng)用到由連續(xù)型變量衍生的不完整二分類變量的多重填補中,他們比較了5種不同的多重填補方法—使用logistic回歸模型填補二分類變量、使用線性回歸模型填補連續(xù)型變量后再歸類生成二分類變量、使用FCS同時填補連續(xù)型和二分類變量、使用MVNI同時填補連續(xù)型和二分類變量以及使用SMC-FCS進行填補。結(jié)果發(fā)現(xiàn),除了計算時間較長外,SMC-FCS優(yōu)于所有其他方法。Md[23]等介紹和比較了12種基于FCS和MVNI的多重填補方法,為處理縱向研究中的缺失值提供了多種可供選擇的方法。

        多重填補技術(shù)本身的應(yīng)用范圍也越來越廣,如Rushani[24]等比較研究了多種多重填補方法填補三水平(three-level)數(shù)據(jù)缺失的效果,為如何填補三水平缺失數(shù)據(jù)推薦了可行的多重填補方法。Matthew[25]等針對分散式數(shù)據(jù)藥品安全網(wǎng)絡(luò)內(nèi)的系統(tǒng)性缺失混雜因素的處理,基于多重填補方法提出了利用“驗證數(shù)據(jù)庫”來填補“缺失數(shù)據(jù)庫”的方法,減小了傳統(tǒng)上每個數(shù)據(jù)庫先單獨分析再使用meta分析匯總估計效果的方法可能會帶來的估計偏倚。

        對于多重填補過程中可能會遇到的程序崩潰問題,White等[26]對于完美預(yù)測問題,提出了增強數(shù)據(jù)方法,即通過增加一些額外的“偽觀測”(pseudo-observations)來解決完美預(yù)測的問題。Nguyen等[27]則針對完美預(yù)測和共線性兩個問題,概述了包括填補復(fù)合變量而非單個變量,引入先驗信息,以及改變填補模型形式等解決策略。

        隨著多重填補和其他缺失值處理技術(shù)的不斷發(fā)展,對如何規(guī)范化處理和報告缺失數(shù)據(jù)越來越引起研究者的關(guān)注。Lee等[28]提出并說明了觀察性研究缺失數(shù)據(jù)的處理和報告框架(treatment and reporting of missing data in observational studies framework,TARMOS)。該框架由三個步驟組成:制定分析計劃,指定分析模型以及如何處理缺失數(shù)據(jù)。其中,需重點考慮完全記錄分析是否有效,多重填補或其替代方法是否會帶來益處,以及對缺失機制進行敏感性分析是否必要等問題;檢查數(shù)據(jù),檢查分析計劃中列出的方法是否合適,并進行預(yù)先計劃的分析;報告結(jié)果,包括對缺失數(shù)據(jù)的描述、如何處理缺失數(shù)據(jù)的詳細信息以及所有分析結(jié)果,并根據(jù)缺失數(shù)據(jù)和臨床相關(guān)性進行解釋。此框架為研究者如何仔細考慮缺失數(shù)據(jù)和分析假設(shè)提供了結(jié)構(gòu)化的參考,是對STROBE聲明[29](strengthening the reporting of observational studies in epidemiology)的有效補充。

        結(jié) 語

        本文從醫(yī)學(xué)研究中數(shù)據(jù)的缺失機制和模式出發(fā),簡單介紹了常用的缺失值處理方法,重點介紹了較為常用的多重填補技術(shù)的基本思想和步驟,總結(jié)了多重填補方法及其優(yōu)缺點,以及多重填補的進展。雖然多重填補技術(shù)在缺失值填補中的應(yīng)用越來越廣泛,但是國內(nèi)卻很少有研究在應(yīng)用多重填補時考慮進行敏感性分析來檢驗數(shù)據(jù)的缺失機制以及填補方法的穩(wěn)健性[30]。因此,在多重填補技術(shù)越來越多地被應(yīng)用的同時,建議研究者更加關(guān)注敏感性分析的問題。

        猜你喜歡
        機制分析方法
        隱蔽失效適航要求符合性驗證分析
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        自制力是一種很好的篩選機制
        文苑(2018年21期)2018-11-09 01:23:06
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        破除舊機制要分步推進
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        捕魚
        注重機制的相互配合
        国产综合激情在线亚洲第一页| 日韩av中文字幕波多野九色| 日本一本一道久久香蕉男人的天堂 | 久久综合九色综合久久久 | 久久综合给合综合久久| 国产不卡一区二区三区免费视| 国产精品一区2区三区| av是男人的天堂免费| 欧美性色欧美a在线播放| 亚洲综合区图片小说区| 久久久久亚洲AV成人网毛片| 蜜桃视频成年人在线观看| 成人午夜高潮a∨猛片| 国产亚洲精品久久久久婷婷瑜伽 | 免费国产不卡在线观看| 又黄又爽又色视频| 俺来也俺去啦最新在线| 亚洲成人av一区二区三区| 成人影院羞羞的视频免费观看| 人妻少妇进入猛烈时中文字幕| 五月天中文字幕mv在线| 精品推荐国产精品店| 国产熟女自拍视频网站| 久久精品国产亚洲av高清三区| 国产av国片精品有毛| 亚洲国产精品久久久久秋霞1| 老汉tv永久视频福利在线观看 | 日本在线观看三级视频| 免费在线黄色电影| 久久人人爽人人爽人人av东京热| 精品人伦一区二区三区蜜桃麻豆 | 美女被躁到高潮嗷嗷免费观看| 亚洲人妻调教中文字幕| 美女无遮挡免费视频网站| 国产国拍亚洲精品永久不卡| 99视频一区二区日本| 中文字幕色av一区二区三区| 亚洲国际无码中文字幕| 日韩乱码精品中文字幕不卡| 欧美v国产v亚洲v日韩九九| 久久久久国产一区二区三区 |