楊春蘭
(云南師范大學(xué),云南 昆明 650000)
在許多臨床試驗研究中,縱向的生物標志物信息常常與事件結(jié)果的信息一起收集。聯(lián)合模型同時分析了縱向和生存結(jié)果,能夠有效減少參數(shù)估計的偏差,提高統(tǒng)計推斷的效率。聯(lián)合模型不僅可以評估縱向過程與生存結(jié)果之間的關(guān)系,還可以用于預(yù)測,在個性化醫(yī)療計劃的推動下,聯(lián)合建模領(lǐng)域的一個前沿研究方向是利用所有可用的生物標志物信息對患者預(yù)后(如生存概率)進行個性化動態(tài)預(yù)測。
本研究收集到的縱向數(shù)據(jù)是間歇性的,對每個研究對象測試的時間tij都有誤差。為了衡量縱向協(xié)變量對事件風(fēng)險的影響,需要估計潛在的縱向協(xié)變量在時間t的真實度量值mi(t),并成功地重建每個個體的完整縱向歷史信息Mi(t)。通過建立線性混合效應(yīng)模型來分析肝硬化患者凝血酶原指數(shù)的重復(fù)測量隨時間的變化,縱向子模型:
其中,xiT表示固定效應(yīng)β的設(shè)計矩陣,ziT是隨機效應(yīng)bi的設(shè)計矩陣,bi~N(0,D),εi(tij)是誤差項,且εi(tij)~N(0,σ2)。誤差項εi與隨機效應(yīng)bi相互獨立。由于樣條函數(shù)的局部自然和好的數(shù)值特性,Ruppert等[1]認為,樣條函數(shù)比多項式更合適。在聯(lián)合建模結(jié)構(gòu)中,Brown等[2]利用了具有多維隨機效應(yīng)的b樣條,Rizopoulos等[3]考慮了自然3次樣條;另一種方法是在線性混合模型中加入一個附加隨機項,以捕獲未被隨機效應(yīng)捕獲的觀測測量中剩余的序列相關(guān)性,從而對特定個體進展的高度非線性形狀建模。在此框架下,采用線性混合模型為:
其中,ui(t)是均值為0且獨立于bi和εi(t)的隨機過程,mi(t)與式(1)有相同的混合效應(yīng)模型結(jié)構(gòu)。
生存分析在臨床和流行病學(xué)研究中應(yīng)用最廣泛,可能包括死亡、腫瘤的出現(xiàn)、某些疾病的發(fā)展、疾病的復(fù)發(fā)、受孕或戒煙。過去對生存數(shù)據(jù)的研究主要集中在生存概率的估計以及對不同條件下實驗對象生存分布的簡單比較。近年來,研究的重點逐漸轉(zhuǎn)向生存數(shù)據(jù)的統(tǒng)計建模。多個獨立的預(yù)后因素可以同時分析,治療差異可以評估,同時調(diào)整異質(zhì)性和基線特征的不平衡,預(yù)測可以更好地校準。
生存子模型表示在時間t縱向結(jié)果的真實值和非觀測值。為了量化與生存風(fēng)險之間的相關(guān)性,采用比例風(fēng)險模型:
其中,Mi(t)={mi(s),0≤s<t}表示mi到時間點t之前不可觀測的縱向過程的歷史,h0(t)為基線風(fēng)險函數(shù),ωi是基線協(xié)變量,γT表示相應(yīng)的回歸系數(shù)向量,α表示潛在的縱向結(jié)果回歸系數(shù),量化了縱向結(jié)果對肝硬化風(fēng)險的影響。參數(shù)α假設(shè)在時間t發(fā)生肝硬化的風(fēng)險取決于真實的縱向軌跡mi(t),通過其在時間t的值,將兩個子模型聯(lián)合在一起,如果α=0,那么聯(lián)合模型的優(yōu)勢取消,如果α顯著,那么縱向測量指標與是否患肝硬化之間高度相關(guān)。
利用已知的生存函數(shù)和累積危險函數(shù)之間的關(guān)系,可以得到如下生存函數(shù):
HSIEH等[4]指出在聯(lián)合建模結(jié)構(gòu)下,不指定h0(·)的分布可能會導(dǎo)致對參數(shù)估計標準誤差的低估,為解決此問題通常一個標準的選擇使用一個風(fēng)險函數(shù)對應(yīng)于一個已知的參數(shù)分布。
對特定患者以及隨訪期間的特定時間點,希望利用獲得的所有可用信息來預(yù)測生存概率。獲取這些信息將使醫(yī)生能夠更好地了解疾病動態(tài),最終在該特定時間點做出最佳決定。由于目前醫(yī)療實踐中個性化醫(yī)療的趨勢以及這種個性化預(yù)測可發(fā)揮的重要作用,其聯(lián)合建??蚣芤鹆撕芏嗯d趣?;陔S機樣本Dn={Ti,δi,yi;i=1,...,n}的聯(lián)合模型,對預(yù)測提供了一組縱向測量值Yi(t)={yi(s);0≤s<t}且有一個基線協(xié)變量向量ωi的新個體i的生存概率感興趣,在生存時間u>t的前提下,關(guān)注生存時間u>t的條件概率更有意義,即:
充分利用了定義聯(lián)合模型的條件獨立假設(shè),則:
基于式(6)使用bi的經(jīng)典貝葉斯估計推導(dǎo)πi(u|t)的一階估計:
由凝血酶原指數(shù)的縱向軌跡圖可看到患者2的凝血酶原指數(shù)水平波動更加明顯,表明病情惡化;患者25顯示較低的凝血酶原指數(shù)水平更加穩(wěn)定,表明有更高的生存概率。比較πi(u|t)的近似估計與蒙特卡羅公估計,發(fā)現(xiàn)兩者差異較小。由動態(tài)生存概率圖可知,25號患者的存活率高于2號患者,沒有經(jīng)歷死亡或閃失。