劉巖 李新龍 商洪才
摘要 目的:闡明校正填補值的模式混合模型原理,實現(xiàn)針刺臨床縱向研究的模型分析。方法:采用3階段方式實現(xiàn)數(shù)據(jù)非隨機缺失機制的模式混合模型構建,運用多重填補技術整合填補數(shù)據(jù)結果,利用SAS 9.4完成模型各參數(shù)估計。結果:從原始數(shù)據(jù)庫中提取378(378/1075,35%)例患者數(shù)據(jù),其中缺失數(shù)據(jù)15(15/25,60%)例,不同校正水平下,電針療效結果穩(wěn)定。結論:校正填補值的模式混合模型與多重填補方法相結合方式,為多重填補法的敏感性分析提供了可靠的方法學支持,為縱向非隨機缺失數(shù)據(jù)臨床研究提供了新的思路。
關鍵詞 模式混合模型;多重填補;敏感性分析;針刺;功能性便秘
Abstract Objective:To clarify the theory of the pattern-mixture models with adjusting imputed values and achieve its model analysis in the clinical trial of acupuncture with longitudinal data. Methods:The three-stage methods were used to construct the pattern-mixture model with non-random data missing mechanism, and the imputed values were merged by the multiple imputation approach. All parameter estimation and test analyses were completed by the SAS 9.4 software. Results:Data of 384 (384/1075, 35%) patients were extracted from the original database, a total of 15 cases were missing (15/25, 60%). The curative effect of electroacupuncture were stable at different correction levels. Conclusion:The combination of pattern-mixture model with adjusting imputed values and multiple imputation provides a reliable methodological support for the sensitivity analysis of the multiple imputation approach, and provides a new idea for the clinical study of longitudinal data with non-random missing mechanism.
Key Words Pattern-Mixture Models; Multiple Imputation; Sensitivity Analysis; Acupuncture; Functional constipation
中圖分類號:R195.1文獻標識碼:Adoi:10.3969/j.issn.1673-7202.2017.06.011
針刺縱向研究中,需要對患者在不同時間點進行多次訪視。其中,假針灸對照設計和長期隨訪等原因引起數(shù)據(jù)缺失的現(xiàn)象難以避免[1]。當前,多重填補法作為處理缺失數(shù)據(jù)有效方式被廣泛使用[2],該方法克服了以往單一填補方法不足,能有效反映缺失數(shù)據(jù)帶來的不確定性,增加了估計的效率[3-4]。該方法填補往往假設缺失數(shù)據(jù)符合隨機缺失機制,即觀察值出現(xiàn)缺失的概率依賴于所觀察的結果,與未觀察部分無關。然而,現(xiàn)有數(shù)據(jù)無法證明該假設是否正確[5],為了評價結果穩(wěn)健性,美國國家研究委員會建議進行違背隨機缺失假設的敏感性分析[1],其中校正填補值的模式混合模型是被推薦的主要方法之一。本文在對其原理進行介紹的基礎上,利用多重填補方式的優(yōu)勢,結合課題組近期發(fā)表的針刺臨床研究實例[6],闡明多重填補條件下該模型校正參數(shù)設定的臨床依據(jù)與統(tǒng)計學解釋,為含有缺失數(shù)據(jù)的中醫(yī)縱向研究數(shù)據(jù)分析提供統(tǒng)計方法學支持。
1 原理與方法
模式混合模型最早有Little教授提出[7],該模型假定觀察值出現(xiàn)缺失概率與未觀測到的結果有關,且還可能與已觀測到的結果有關,即非隨機缺失[8]。因為其缺失機制無法被忽略,包含了未觀測到的數(shù)據(jù)信息,又稱為不可忽略的缺失,該類缺失問題在實際工作中出現(xiàn)非常廣泛[9]。
缺失模式可以根據(jù)數(shù)據(jù)缺失順序可分為單調缺失(Monotone Missing)和非單調缺失(Non-monotone Missing)。單調缺失模式指在某次觀測缺失后再隨訪,均不能獲得其后的觀測值。本研究以單調缺失為例,闡明多重填補條件下模式混合效應原理。
1.1 校正填補值的模式混合模型基本原理
假設某企業(yè)進行一項檢驗某新藥療效的臨床試驗,該試驗2組患者等比例分配,試驗組接受新藥治療,對照組接受安慰劑治療。假設主要療效指標為連續(xù)性變量,其中變量Y0為該指標基線得分,Y1為治療后患者一次隨訪得分;Y0規(guī)定為不含有缺失數(shù)據(jù);Y1含有缺失數(shù)據(jù);R=0表示患者隨訪得分Y1未缺失,R=1表示Y1缺失。模式混合模型方法將整合非缺失變量和缺失變量的分布構建某一變量的分布模型[10],即
1.2 基本算法
無論在隨機缺失或者非隨機缺失機制,傳統(tǒng)的多重填補流程及統(tǒng)計分析步驟分為以下3個方面[12]:1)利用其他變量對含有缺失的變量構建預測方程模型,從預測值的分布中隨機抽取填補缺失值,產生若干個完整數(shù)據(jù)集;2)對每一個填補后的數(shù)據(jù)集使用針對完整數(shù)據(jù)集的統(tǒng)計方法進行分析;3)對來自于各個填補數(shù)據(jù)集的結果可使用“Rubin法則”進行合并,產生最終的統(tǒng)計推斷,該方式考慮到了單一數(shù)據(jù)填補而產生的不確定性。
在MNAR假設條件下,每次對變量的缺失值進行填補過程中將執(zhí)行如下3個步驟[13]:1)對于每個填補連續(xù)性變量,通過全部或部分的完整數(shù)據(jù)擬合回歸模型;2)通過擬合回歸模型的后驗預測分布模擬新模型;3)基于新模型對變量的缺失值進行填補,可以增加特定的位移參數(shù)(Shift Parameters)對填補值進行校正,即y*=y+δ。
2 實例應用
基于課題組近期發(fā)表在美國《內科年鑒》的“針刺治療慢性嚴重功能性便秘的隨機對照試驗”研究中選取部分數(shù)據(jù)及部分訪視點[6],說明模式混合模型具體應用及關鍵參數(shù)設定方法。本研究數(shù)據(jù)集中Group為分組變量,Y0為主要指標完全排凈感的自主排便次數(shù)的基線值(數(shù)值越大說明治療效果越好),Y1-Y2為治療期和隨訪期完全自主排便不同時間點的測量值。見表1。
基線數(shù)據(jù)包括針灸組189例,假電針組189例;完全自主排便次數(shù)0.37±0.61。不同訪視該指標缺失類型見表2,其中訪視Y1、Y2同時缺失的患者11例,其中電針組5例,假針組6例;未缺失數(shù)據(jù)363(96%)例患者。
前期研究設計用于檢驗電針組治療難治性便秘是否優(yōu)于假針灸組[14],假設缺失數(shù)據(jù)為隨機缺失,采用多重填補方法和廣義線性模型方法相結合考察2組間療效,結果證明電針組優(yōu)于假電針組。本研究對該方法進行敏感性分析,假定缺失數(shù)據(jù)為非隨機缺失,采用校正填補值的模式混合模型與多重填補方法相結合的方式,驗證不同條件下結果是否穩(wěn)定。具體方法:利用分組變量及基線數(shù)據(jù)構建回歸模型,考慮治療期間患者最大完全自主排便次數(shù)為10次,設定δ范圍為(-10,10),對Y1-Y2進行非缺失機制條件下填補,整合多重填補方法,并利用模型后驗概率分布的優(yōu)勢產生填補數(shù)據(jù)集100個。對每個填補后的數(shù)據(jù)集進行統(tǒng)計分析,最后結果采用“Rubin法則”進行合并,驗證電針組與假針組在不同δ范圍變化下,組間療效差異是否發(fā)生變化。表3可見,不同參數(shù)下電針組均優(yōu)于對照組,且具有統(tǒng)計學意義。
3 小結
在縱向研究中隨訪時間長,數(shù)據(jù)的缺失現(xiàn)象難以避免。模式混合模型作為驗證隨機缺失機制敏感性方法,得到美國國家研究委員會及眾多雜志所推薦,有研究表明當數(shù)據(jù)缺失機制未知或非隨機缺失時該方法尤為適用。
本文介紹了無論隨機缺失還是非隨機缺失條件,多重填補處理數(shù)據(jù)的步驟,克服了常規(guī)統(tǒng)計思維認為多重填補方法僅限于隨機缺失的假設??紤]到臨床患者數(shù)據(jù)缺失的實際特征規(guī)律,比如完全自主排便不能得到很好提高的患者易出現(xiàn)缺失值,我們引入了帶缺失校正的模式混合模型方法,提供不同校正水平下,2組間完全自主排便平均差值變化。
在我國針灸治療便秘療效顯著,國外針灸治療便秘認知程度較低[15]。本文實例數(shù)據(jù)來自于“針刺治療慢性嚴重功能性便秘的隨機對照試驗”研究,該研究涉及我國15家三甲醫(yī)院,共納入1 075例患者,歷時3年完成,為針刺治療慢性便秘的療效提供了國際認可的高質量循證醫(yī)學證據(jù),是我國針灸界學者發(fā)表的首篇最具國際影響力的研究論文。
這項隨機對照研究旨在評價采用電針治療慢性嚴重功能性便秘的療效,結果發(fā)現(xiàn)8周電針治療可以安全有效地增加慢性嚴重便秘患者的完全自主排便次數(shù),治療結束后療效可持續(xù)12周。該研究采用了模式混合模型與多重填補方法相結合,對缺失數(shù)據(jù)進行填補,并對填補的缺失值進行校正處理。敏感性分析表明不同校正水平下,電針組依舊優(yōu)于假電針組。本文選取部分數(shù)據(jù)和部分訪視點,說明該套處理缺失值的方法、原理、步驟及參數(shù)選取的原則,為國內學者針對隨機缺失假設的敏感性分析提供可操作的方法學指導。
本文僅針對連續(xù)性變量闡釋模式混合模型的方法原理與應用,對于分類資料、等級資料等其他數(shù)據(jù)類型有待后續(xù)延伸;對填補的缺失值進行校正,僅介紹了對2組同時校正的方法,而模式混合模型可以針對某一特定研究組進行校正,比如電針組。盡管目前存在可以處理縱向缺失數(shù)據(jù)的統(tǒng)計方法,但提高臨床試驗質量管理、加強研究實施過程的監(jiān)管和隨訪,最大程度減少缺失才是積極穩(wěn)妥的處理方法。
參考文獻
[1]Little RJ,D′Agostino R,Cohen ML,et al.The prevention and treatment of missing data in clinical trials[J].N Engl J Med,2012,367(14):1355-1360.
[2]Bell ML,F(xiàn)iero M,Horton NJ,et al.Handling missing data in RCTs; a review of the top medical journals[J].BMC Med Res Methodol,2014,14(1):118.
[3]Sterne JA,White IR,Carlin JB,et al.Multiple imputation for missing data in epidemiological and clinical research:potential and pitfalls[J].BMJ,2013, 338(jun291):b2393.
[4]Schafer JL.Analysis of incomplete multivariate data[M].New York:CRC press,1997,79-87.
[5]Yuan Y.Sensitivity analysis in multiple imputation for missing data.In Proceedings of the SAS Global Forum 2014 Conference[C].Washington,DC.March 23-26,2014.
[6]Liu Z,Yan S,Wu J,et al.Acupuncture for Chronic Severe Functional Constipation:A Randomized Trial[J].Ann Intern Med,2016,165(11):761-769.
[7]Little RJ,Wang Y.Pattern-mixture models for multivariate incomplete data with covariates[J].Biometrics,1996,52(1):98-111.
[8]季家超,王剛,張瀟雅,等.數(shù)據(jù)非隨機缺失機制的混合效應模式混合模型分析與應用[J].中國衛(wèi)生統(tǒng)計,2013,30(2):221-225.
[9]耿直,葛丹丹.縱向研究非隨機缺失數(shù)據(jù)分析[C].中國現(xiàn)場統(tǒng)計研究會第12屆學術年會論文集,2005.
[10]Thijs H,Molenberghs G,Michiels B,et al.Strategies to fit pattern-mixture models[J].Biostatistics,2002,3(2):245-265.
[11]Carpenter J,Kenward M.Multiple imputation and its application[M].New York:John Wiley & Sons,2012,104-135.
[12]Yuan Y.Multiple imputation using SAS software[J].J Stat Softw,2011,45(6):1-25.
[13]Ratitch B,O′Kelly M,Tosiello R.Missing data in clinical trials:from clinical assumptions to statistical analysis using pattern mixture models[J].Pharm Stat,2013,12(6):337-347.
[14]Liu Z,Liu J,Zhao Y,et al.The efficacy and safety study of electro-acupuncture for severe chronic functional constipation:study protocol for a multicenter,randomized,controlled trial[J].Trials,2013,14(1):176.
[15]馮麗鵬,李國棟,李峨,等.國內外針灸治療便秘的認知度調查[J].世界中醫(yī)藥,2016,11(11):2411-2414.
(2017-05-10收稿 責任編輯:徐穎)