趙淑珍,金東鎮(zhèn),李慧慧,賴夢園,黃若谷,毛廣運(yùn),2
1.溫州醫(yī)科大學(xué) 公共衛(wèi)生與管理學(xué)院 預(yù)防醫(yī)學(xué)系,浙江 溫州 325035;2.溫州醫(yī)科大學(xué)附屬眼視光醫(yī)院 國家眼部疾病臨床醫(yī)學(xué)研究中心,浙江 溫州 325027
新藥臨床試驗(yàn)研究中,受試者由于各種原因而中途脫落的現(xiàn)象極為常見,由此導(dǎo)致的數(shù)據(jù)缺失問題不可避免地影響著研究結(jié)論的準(zhǔn)確性和可靠性[1]。雖然缺失數(shù)據(jù)的處理一直是統(tǒng)計(jì)學(xué)的重要研究熱點(diǎn)之一,但目前尚未達(dá)成針對缺失數(shù)據(jù)處理的共識。臨床科研實(shí)踐中對缺失數(shù)據(jù)的處理方式往往較為簡單,甚至帶有個人偏好[2],其中尤以盲目刪除缺失數(shù)據(jù)的相關(guān)記錄和使用末次觀測結(jié)果進(jìn)行結(jié)轉(zhuǎn)最為常見[3]。研究發(fā)現(xiàn),簡單地刪除缺失記錄不僅可能會導(dǎo)致統(tǒng)計(jì)學(xué)把握度(Power)的降低,增加假陰性結(jié)論的發(fā)生風(fēng)險(xiǎn),還可能因破壞了隨機(jī)性及降低樣本的代表性,給試驗(yàn)結(jié)果帶來不可忽視的偏倚效應(yīng)[4]。此外,末次結(jié)轉(zhuǎn)的前提條件是數(shù)據(jù)缺失的機(jī)制必須為完全隨機(jī)缺失,事實(shí)上很少有研究能滿足這一要求,并且由于該方法中的效應(yīng)估計(jì)相對保守,甚至?xí)^大程度影響到研究結(jié)論的準(zhǔn)確性[5]。多年來,盡管各種缺失數(shù)據(jù)的處理方式不斷涌現(xiàn)[6-8],但由于均未同時(shí)充分考慮缺失模式、缺失機(jī)制及缺失比例的影響,尚無能夠完美解決臨床試驗(yàn)中數(shù)據(jù)缺失問題的方法被廣泛認(rèn)可。本研究旨在基于電腦模擬數(shù)據(jù),深入分析評估不同處理策略在相關(guān)數(shù)據(jù)缺失模式、機(jī)制和比例下的性能,為科學(xué)合理地處理新藥臨床試驗(yàn)的缺失數(shù)據(jù)提供依據(jù)。
1.1 數(shù)據(jù)模擬方法 根據(jù)CHRIS等[9]提供的SAS代碼生成完整雙臂優(yōu)效性臨床試驗(yàn)?zāi)M數(shù)據(jù)集,數(shù)據(jù)基本情況見表1,變量包括受試者編號、年齡、性別、訪視時(shí)間和結(jié)局水平測量。其中性別及組別由伯努利分布隨機(jī)生成,總樣本量為500,其中安慰劑組262例,試驗(yàn)組238例,女220例,男280例;年齡和基線指標(biāo)由正態(tài)分布隨機(jī)生成,年齡分布為(48.6±15.2)歲,基線目標(biāo)水平為(99.95±10.74)。訪視時(shí)間分別為基線、給藥后1、2、4、6、14 周。訪視過程中對照組后續(xù)隨訪每次目標(biāo)水平的測量由均數(shù)為100、標(biāo)準(zhǔn)差為10的正態(tài)分布隨機(jī)數(shù)替代,而試驗(yàn)組訪視過程中目標(biāo)水平的測量由上一訪視時(shí)間點(diǎn)的測量結(jié)果加上新的均數(shù)為10,標(biāo)準(zhǔn)差為2的正態(tài)分布隨機(jī)數(shù)替代,完整數(shù)據(jù)集在各個時(shí)點(diǎn)表現(xiàn)見表2。將上述完整模擬數(shù)據(jù)集分別處理成完全隨機(jī)缺失和隨機(jī)缺失機(jī)制下的任意缺失模式和單調(diào)缺失模式。考慮到很少有臨床試驗(yàn)的數(shù)據(jù)缺失比例會超過15%,故此分別設(shè)置了0%~10%、5%~10%和10%~15%三個等級數(shù)據(jù)缺失比例展開相關(guān)研究。
表1 模擬數(shù)據(jù)基本結(jié)構(gòu)
表2 完整模擬數(shù)據(jù)的基本信息
1.2 缺失值數(shù)據(jù)處理方式 目前臨床試驗(yàn)中針對缺失數(shù)據(jù)常用方法有四類:基于完整數(shù)據(jù)集、基于填補(bǔ)、基于極大似然和基于非隨機(jī)缺失機(jī)制。其中,由于基于完整數(shù)據(jù)的方法常將帶有缺失數(shù)據(jù)的記錄或變量直接刪除,違背了意向性分析(intentionto-treat, ITT)原則,并降低檢驗(yàn)效能,最終導(dǎo)致結(jié)論發(fā)生偏倚,因此不推薦其作為臨床試驗(yàn)中處理缺失數(shù)據(jù)的主要方法[10]。
基于填補(bǔ)法是利用已觀測到的數(shù)據(jù)填補(bǔ)未觀測數(shù)據(jù),主要為單一填補(bǔ)和多重填補(bǔ)。其中,單一填補(bǔ)方法中目前最為廣泛使用的主要有基于末次觀測結(jié)轉(zhuǎn)、基線觀測結(jié)轉(zhuǎn)、最差觀測結(jié)轉(zhuǎn),即分別用最后一次觀測數(shù)據(jù)、基線觀測數(shù)據(jù)以及隨訪過程中最差一次觀測數(shù)據(jù)分別進(jìn)行填補(bǔ)。雖然單一填補(bǔ)方式操作簡單,但由于其低估了數(shù)據(jù)的變異,并且對數(shù)據(jù)缺失機(jī)制要求嚴(yán)格[11],常被作為敏感性分析內(nèi)容。同時(shí),作為敏感性分析內(nèi)容之一,最差個例分析也常被納入考量,即對照組用最佳觀測結(jié)轉(zhuǎn),試驗(yàn)組用最差觀測結(jié)轉(zhuǎn)[12]。作為單一填補(bǔ)的延伸,多重填補(bǔ)則給數(shù)據(jù)集中每一個缺失值做n次填補(bǔ),而后對填補(bǔ)好的n個完整數(shù)據(jù)集分別進(jìn)行統(tǒng)計(jì)分析,綜合n次分析結(jié)果后得出最終結(jié)論[13]。多重填補(bǔ)中常用的方法包括回歸模型、預(yù)測均值匹配、全條件定義法(fully conditional specification, FCS)等?;貧w填補(bǔ)指建立填補(bǔ)變量與協(xié)變的回歸方程后,基于此方程從參數(shù)的后驗(yàn)預(yù)測分布模擬出新的方程用于缺失值的填補(bǔ)[14]。預(yù)測均值匹配通過線性回歸填補(bǔ)模型為缺失值計(jì)算得填補(bǔ)值后,選取最接近填補(bǔ)值的K個已觀測數(shù)據(jù)后從中隨機(jī)挑選一個進(jìn)行填補(bǔ)[15]。FCS則是利用單個數(shù)據(jù)的條件分布建立一系列回歸模型逐一填補(bǔ)并迭代[16]。不同方法適用條件不同,如當(dāng)數(shù)據(jù)缺失模式為單調(diào)缺失,缺失變量為連續(xù)型變量時(shí),建議選擇單調(diào)回歸或單調(diào)預(yù)測均值匹配方法進(jìn)行填補(bǔ)。而當(dāng)數(shù)據(jù)缺失模式為任意缺失,缺失變量為連續(xù)型變量時(shí),建議選擇FCS回歸或FCS預(yù)測均值匹配[17]。
基于極大似然的方法不需要對缺失數(shù)據(jù)進(jìn)行填補(bǔ),而是基于觀測數(shù)據(jù)對模型總體參數(shù)進(jìn)行估計(jì)。常用的基于極大似然的方法主要有重復(fù)測量的混合效應(yīng)模型(mixed-effects model repeated measures, MMRM)[18]。由于在重復(fù)測量的數(shù)據(jù)中,重復(fù)測量因素的各水平之間往往存在一定的自相關(guān)性,因此其分析方法有別于一般統(tǒng)計(jì)分析。除選擇合適的固定以及隨機(jī)效應(yīng)外,選擇合適的方差-協(xié)方差矩陣結(jié)構(gòu)對模型進(jìn)行擬合也十分重要。常用的方差-協(xié)方差矩陣結(jié)構(gòu)主要有非結(jié)構(gòu)化協(xié)方差、復(fù)合對稱協(xié)方差、托普利茨協(xié)方差、一階自回歸協(xié)方差等。對均衡完整資料的重復(fù)測量設(shè)計(jì)通常假定其方差-協(xié)方差矩陣結(jié)構(gòu)是非結(jié)構(gòu)化(即任意兩時(shí)點(diǎn)間的相關(guān)不等或不全相等)或復(fù)合對稱的(即任意兩時(shí)點(diǎn)的相關(guān)是相等的)[19]??紤]到重復(fù)測量的時(shí)間點(diǎn)是從大量時(shí)間點(diǎn)中選取出的一個隨機(jī)樣本以及缺失數(shù)據(jù)可能帶來的影響,采用不同的協(xié)方差矩陣結(jié)構(gòu)進(jìn)行敏感性分析也十分有必要。
此外,由于以上處理方法大多針對完全隨機(jī)缺失或隨機(jī)缺失機(jī)制,但在臨床試驗(yàn)中,具體缺失機(jī)制難以確證,因此,實(shí)踐中通常建議增加非隨機(jī)缺失機(jī)制下的缺失數(shù)據(jù)處理方式作為敏感性分析[12]。由于模式混合模型(pattern-mixture models, PMM)[20]對缺失數(shù)據(jù)分布假設(shè)易于解釋并具有臨床意義,在實(shí)踐運(yùn)用較為普遍[11]。
基于以上分析策略,本研究分別采用包括不同協(xié)方差矩陣結(jié)構(gòu)的MMRM模型(非結(jié)構(gòu)化協(xié)方差、復(fù)合對稱協(xié)方差、托普利茨協(xié)方差、一階自回歸協(xié)方差),單一填補(bǔ)(基于末次觀測結(jié)轉(zhuǎn)、基線觀測結(jié)轉(zhuǎn)、最差觀測結(jié)轉(zhuǎn)、最差個例分析)、多重填補(bǔ)(不同填補(bǔ)次數(shù)的預(yù)測均值匹配與回歸)及PMM的協(xié)方差分析(analysis of covariance, ANCOVA)對構(gòu)造的缺失數(shù)據(jù)進(jìn)行處理,具體各缺失值處理方式見表3。以治療14周較基線變化差值為主要療效指標(biāo),對單組療效以及組間療效差異進(jìn)行評估,并與完整數(shù)據(jù)集估計(jì)結(jié)果進(jìn)行比較。
表3 缺失值處理分析方法
2.1 完全隨機(jī)缺失機(jī)制-任意缺失模式 當(dāng)缺失比例小于5%時(shí),不同缺失數(shù)據(jù)處理方式對單組療效以及組間療效差異的估計(jì)結(jié)果均非常接近真實(shí)情況,各方式間未出現(xiàn)明顯差異,見圖1。隨著缺失比例的升高,各種處理方式在同組內(nèi)部各時(shí)點(diǎn)的療效估計(jì)性能均出現(xiàn)了不同程度的下降。此外,單一填補(bǔ)及模式混合模型均會明顯低估治療組的療效,而MMRM及多重填補(bǔ)的結(jié)果則較為穩(wěn)定。值得注意的是,不同MMRM以及基于不同填補(bǔ)次數(shù)和填補(bǔ)方式的多重填補(bǔ)對結(jié)果均無明顯影響。而在組間療效差異估計(jì)中,除了MMRM以及多重填補(bǔ)表現(xiàn)出較高的穩(wěn)定性外,其余方式均會受到不同缺失比例的影響。
圖1 完全隨機(jī)缺失機(jī)制任意缺失模式下不同缺失數(shù)據(jù)處理方式的比較
2.2 完全隨機(jī)缺失機(jī)制-單調(diào)缺失模式 與任意缺失模式比較,單調(diào)缺失模式下各處理方式對療效估計(jì)的誤差更為明顯,見圖2。就對照組而言,缺失比例小于5%時(shí)的估計(jì)誤差較小,當(dāng)缺失率超過5%時(shí),各處理方式均會增加其評估誤差,且明顯高于任意缺失模式。不同填補(bǔ)方式在試驗(yàn)組中的表現(xiàn)差異明顯,各缺失比例下的MMRM與多重填補(bǔ)均不會增加誤差且較為穩(wěn)定,而單一填補(bǔ)方式和模式混合模型則會明顯低估療效,從而大幅增加組間療效的估計(jì)誤差。
圖2 完全隨機(jī)缺失機(jī)制單調(diào)缺失模式下缺失數(shù)據(jù)不同處理方式的比較
2.3 隨機(jī)缺失機(jī)制-任意缺失模式 在對照組療效較基線差異的估計(jì)中,只有當(dāng)缺失比例達(dá)到10%以上時(shí),各種缺失處理方式均會導(dǎo)致較大誤差,見圖3。盡管不同缺失數(shù)據(jù)處理方式在治療組中均未導(dǎo)致明顯的誤差,但仍以MMRM和多重填補(bǔ)的表現(xiàn)更為優(yōu)秀。與此同時(shí),各處理方式對組間療效差異的估計(jì)結(jié)果基本穩(wěn)定一致,提示隨機(jī)缺失機(jī)制-任意缺失模式對缺失值的處理方式并不敏感,各種方式均可用于其缺失數(shù)據(jù)處理。
圖3 隨機(jī)缺失機(jī)制任意缺失模式下缺失數(shù)據(jù)不同處理方式的比較
2.4 隨機(jī)缺失機(jī)制-單調(diào)缺失模式 不同缺失數(shù)據(jù)處理方式在隨機(jī)單調(diào)缺失模式下的表現(xiàn)見圖4,與前述結(jié)果類似,隨著缺失率的升高,各種處理方式對試驗(yàn)組的療效估計(jì)誤差則會越來越大。此外,在眾多的缺失數(shù)據(jù)處理方式中,MMRM對組間療效差異估計(jì)的影響最小,多重填補(bǔ)處理后的ANOVA次之,當(dāng)缺失比例超過10%時(shí),最差個例分析的誤差最大。
圖4 隨機(jī)缺失機(jī)制單調(diào)缺失模式下缺失數(shù)據(jù)不同處理方式的比較
通過定期隨訪的方式追蹤受試者藥物療效的變化情況而收集到的由基線特征和多個訪視點(diǎn)測量結(jié)果構(gòu)成的縱向數(shù)據(jù),是臨床試驗(yàn)中最常見的數(shù)據(jù)類型[6]。而由于訪視過程中受試者可能會因?yàn)楦鞣N原因中途退出,缺失數(shù)據(jù)的出現(xiàn)成為不可避免的問題。但目前尚未在國內(nèi)臨床研究中引起研究者足夠重視,實(shí)際應(yīng)用中,其對缺失數(shù)據(jù)的處理仍存在盲目應(yīng)用統(tǒng)計(jì)方法的現(xiàn)象,給新藥安全有效性的評價(jià)和確證帶來諸多困難[21]。因此,選擇合適的統(tǒng)計(jì)學(xué)方法分析含有缺失數(shù)據(jù)的臨床試驗(yàn)十分重要。
本研究模擬雙臂優(yōu)效性臨床試驗(yàn),根據(jù)三種缺失比例、兩種缺失機(jī)制以及兩種缺失模式設(shè)定12種缺失數(shù)據(jù)集,對每種情形分別采用15種缺失數(shù)據(jù)處理方式[不同協(xié)方差矩陣結(jié)構(gòu)的MMRM模型(非結(jié)構(gòu)化協(xié)方差、復(fù)合對稱協(xié)方差、托普利茨協(xié)方差、一階自回歸協(xié)方差),單一填補(bǔ)(基于末次觀測結(jié)轉(zhuǎn)、基線觀測結(jié)轉(zhuǎn)、最差觀測結(jié)轉(zhuǎn)、最差個例分析)、多重填補(bǔ)(不同填補(bǔ)次數(shù)的預(yù)測均值匹配與回歸)及PMM的ANCOVA]對缺失數(shù)據(jù)進(jìn)行處理,并根據(jù)不同的療效估計(jì)與真實(shí)情況的差異評價(jià)各處理方式的統(tǒng)計(jì)性能。本研究中我們發(fā)現(xiàn),各種缺失數(shù)據(jù)處理方式的性能均會受到數(shù)據(jù)缺失比例、缺失機(jī)制及缺失模式的影響,其中缺失比例及缺失模式的影響更為明顯。
3.1 不同缺失比例下缺失值處理方式的比較 當(dāng)缺失比例小于5%時(shí),不同處理方式對療效估計(jì)的結(jié)果基本穩(wěn)定一致,且與真實(shí)值差距較小,這與一項(xiàng)國外研究結(jié)論相吻合[22]。隨著缺失比例的增加,療效估計(jì)產(chǎn)生的誤差也越大。當(dāng)缺失比例大于5%且小于15%時(shí),不論是完全隨機(jī)缺失機(jī)制還是隨機(jī)缺失機(jī)制,任意缺失模式還是單調(diào)缺失模式,MMRM與多重填補(bǔ)后進(jìn)行協(xié)方差分析在處理缺失值時(shí)均有較優(yōu)性能,但相比之下前者更為穩(wěn)定且由于MMRM處理方法無需對缺失數(shù)據(jù)進(jìn)行填補(bǔ),其納入所有已觀測到的數(shù)據(jù)進(jìn)行建模分析,符合意向性原則[23]等特點(diǎn),其在實(shí)際研究中可能更具實(shí)用價(jià)值。多項(xiàng)國外研究也都表明了MMRM較多重填補(bǔ)及以基線觀測進(jìn)行結(jié)轉(zhuǎn)的缺失數(shù)據(jù)處理方式可能更為優(yōu)越[24-25]。雖然有臨床研究者認(rèn)為當(dāng)數(shù)據(jù)缺失超過10%時(shí),統(tǒng)計(jì)分析很可能存在偏差而應(yīng)采用模式混合模型[26],但本研究發(fā)現(xiàn)即使缺失比例大于10%,用模式混合模型依舊低估了藥物療效。這提示在不滿足非隨機(jī)缺失機(jī)制的情況下使用模式混合模型對療效的估計(jì)可能不足以反應(yīng)真實(shí)情況。
3.2 不同缺失機(jī)制下缺失值處理方式的比較 數(shù)據(jù)的缺失,究其原因,可以歸為三類,即完全隨機(jī)缺失,隨機(jī)缺失和非隨機(jī)缺失[12]。但由于非隨機(jī)缺失機(jī)制中數(shù)據(jù)的缺失與未觀測到數(shù)據(jù)有關(guān),實(shí)際中難以完成模擬,因此,本項(xiàng)研究中只設(shè)置了完全隨機(jī)和隨機(jī)缺失這兩種缺失機(jī)制。我們發(fā)現(xiàn),即使采用相同的缺失值處理策略,完全隨機(jī)缺失機(jī)制下估計(jì)的效應(yīng)值要比隨機(jī)缺失機(jī)制下的估計(jì)值更接近于真實(shí)值。這可能與不同缺失值處理方式有不同適用條件有關(guān),如以末次觀測為結(jié)轉(zhuǎn)的前提條件之一是數(shù)據(jù)完全隨機(jī)缺失[25]。但相比之下,MMRM在完全隨機(jī)以及隨機(jī)缺失機(jī)制下,均表現(xiàn)最為穩(wěn)定,這也與其他研究結(jié)論相一致[6]。
3.3 不同缺失模式下缺失值處理方式的比較 本研究中,各種缺失數(shù)據(jù)處理方法在任意缺失模式下與單調(diào)缺失模式相比,其療效估計(jì)結(jié)果更為穩(wěn)定。但對于縱向隨訪的臨床試驗(yàn)來說,受試者在某次訪視時(shí)失訪,而其在該次訪視之后又繼續(xù)隨訪的情況并不多見,因此,臨床試驗(yàn)中單調(diào)缺失模式下不同缺失值處理方式帶來的影響應(yīng)該更加引起研究者的重視。我們發(fā)現(xiàn),在單調(diào)缺失模式下,除MMRM表現(xiàn)較為穩(wěn)定以外,多重填補(bǔ)后的協(xié)方差分析也有較好表現(xiàn)。一項(xiàng)國內(nèi)研究表明[27],在單調(diào)缺失模式,完全隨機(jī)缺失和隨機(jī)缺失機(jī)制下,只有線性回歸法和預(yù)測均值匹配有較好表現(xiàn)。這提示在缺失模式為單調(diào)缺失的實(shí)際研究中,MMRM或以回歸法和預(yù)測均值匹配為多重填補(bǔ)的協(xié)方差分析應(yīng)當(dāng)優(yōu)先考慮。
雖然目前缺失值處理方法眾多,但不同缺失比例,缺失機(jī)制以及缺失模式下,采用不同處理策略仍會產(chǎn)生不同偏差,因此,研究者應(yīng)結(jié)合試驗(yàn)的自身特點(diǎn)預(yù)先在方案中制定合適的分析策略并進(jìn)行敏感性分析。在雙臂優(yōu)效性臨床試驗(yàn)中,MMRM可能為首選方案。