中國醫(yī)學(xué)科學(xué)院,阜外醫(yī)院,國家心血管病中心,醫(yī)學(xué)統(tǒng)計(jì)部(102300) 趙延延 李思冬 王 楊 李 衛(wèi)
【提 要】 目的 通過比較一般線性模型、廣義估計(jì)方程及混合效應(yīng)模型在醫(yī)療器械試驗(yàn)定量指標(biāo)縱向數(shù)據(jù)中的估計(jì)效果,探討合適分析方法并提供參考。方法 以非劣效支架試驗(yàn)為例并結(jié)合應(yīng)用蒙特卡洛隨機(jī)模擬的方法,模擬不同樣本量、不同數(shù)據(jù)相關(guān)程度及不同相關(guān)數(shù)據(jù)比例下的縱向數(shù)據(jù),比較不同模型應(yīng)用的準(zhǔn)確性。結(jié)果 在不同數(shù)據(jù)相關(guān)程度及相關(guān)數(shù)據(jù)比例下,不同模型所得能獲得陽性結(jié)果的概率變化規(guī)律有所不同。一般線性模型所得假陽性錯(cuò)誤率隨著相關(guān)數(shù)據(jù)比例的增加而增大,且大于0.05;而廣義估計(jì)方程和混合效應(yīng)模型所得假陽性錯(cuò)誤率穩(wěn)定在0.05附近。結(jié)論 對(duì)于相同定量指標(biāo)縱向數(shù)據(jù),建議結(jié)合實(shí)際數(shù)據(jù)特點(diǎn),采用廣義估計(jì)方程或混合效應(yīng)模型進(jìn)行分析,確保準(zhǔn)確地估計(jì)組間真實(shí)療效。
隨著醫(yī)療器械臨床試驗(yàn)的發(fā)展,縱向數(shù)據(jù)被越來越多地應(yīng)用于醫(yī)療器械臨床試驗(yàn)中,尤其是支架或球囊試驗(yàn),且往往以連續(xù)性指標(biāo)為主要評(píng)價(jià)標(biāo)準(zhǔn)。該縱向數(shù)據(jù)主要以分組數(shù)據(jù)(cluster data)或系統(tǒng)結(jié)構(gòu)數(shù)據(jù)為主,可以看作為同一個(gè)受試者在同一時(shí)間點(diǎn)的多次測(cè)量數(shù)據(jù)。因同一受試者或組內(nèi)數(shù)據(jù)具有相同屬性,其群組或受試者內(nèi)數(shù)據(jù)的相關(guān)性是不能被忽略的[1]。例如,在支架試驗(yàn)中,每個(gè)受試者有多于2個(gè)病變,基于病變水平比較試驗(yàn)組與對(duì)照組術(shù)后9個(gè)月節(jié)段內(nèi)晚期管腔丟失(late lumen loss,LLL)的差異。
目前針對(duì)醫(yī)療器械臨床試驗(yàn)中定量指標(biāo)縱向數(shù)據(jù)的分析,統(tǒng)計(jì)分析方法的應(yīng)用呈現(xiàn)多樣化,且傳統(tǒng)分析方法仍存在應(yīng)用的情況[2-3]。傳統(tǒng)的統(tǒng)計(jì)分析方法包括成組t檢驗(yàn)、方差分析、重復(fù)測(cè)量方差分析、一般線性模型等均要求數(shù)據(jù)滿足獨(dú)立性。因未考慮群組或受試者內(nèi)數(shù)據(jù)的相關(guān)性,會(huì)低估參數(shù)的標(biāo)準(zhǔn)誤,從而高估檢驗(yàn)統(tǒng)計(jì)量[4],增加犯假陽性錯(cuò)誤的概率,可能會(huì)導(dǎo)致將無效的產(chǎn)品誤認(rèn)為有效。而Liang & Zeger提出的廣義估計(jì)方程[5-6]、混合效應(yīng)模型[7]雖被廣泛應(yīng)用于相關(guān)數(shù)據(jù)分析中,但更多應(yīng)用于新藥臨床試驗(yàn)、流行病數(shù)據(jù)分析[8-9]和重復(fù)測(cè)量資料分析[10],在器械臨床試驗(yàn)縱向數(shù)據(jù)中的研究報(bào)道較少。因此,本研究通過隨機(jī)模擬不同情況下的縱向數(shù)據(jù),全面地比較一般線性模型、廣義估計(jì)方程和混合效應(yīng)模型,評(píng)價(jià)其應(yīng)用的準(zhǔn)確性并提供相應(yīng)參考。
1.一般線性模型
對(duì)于一般線性模型,表示為y=β0+β1x1+…+βixi+ε。β0為截距項(xiàng),βi(i=1,2,3,…,k)是第i個(gè)自變量的回歸系數(shù),ε為隨機(jī)誤差項(xiàng)。適用于因變量為定量指標(biāo)分析,建立因變量均值與解釋變量之間的線性關(guān)系。
2.廣義估計(jì)方程
3.混合效應(yīng)模型
混合效應(yīng)模型(mixed effect model)通過引入隨機(jī)效應(yīng)來處理數(shù)據(jù)間的相關(guān)性(即聚集性)。該模型主要由固定效應(yīng)和隨機(jī)效應(yīng)兩部分組成。以一個(gè)簡單的兩水平支架臨床試驗(yàn)資料為例,展示經(jīng)典的隨機(jī)截距模型(即方差成份模型)。假設(shè)第i個(gè)受試者(i=1,2,3,…,nj)第j(j=1,2,3,…,n)個(gè)病變的結(jié)局指標(biāo)為yij,協(xié)變量記為xij=(x1ij,x2ij,x3ij,…,xpij),則yij=β0j+β1x1ij+β2x2ij+…+εij,受試者為水平2,病變?yōu)樗?。其中,β1為協(xié)變量的固定效應(yīng)參數(shù),εij為隨機(jī)誤差項(xiàng);β0j為隨機(jī)變量且假設(shè)β0j=β0+μ0j,β0為固定效應(yīng)參數(shù),為平均截距,反映xij與yij的平均關(guān)系。μ0j為水平2上的隨機(jī)變量,表示第j個(gè)受試者結(jié)局指標(biāo)的平均估計(jì)值與總均數(shù)的離差值,反映第j個(gè)受試者上結(jié)局指標(biāo)的隨機(jī)效應(yīng)。
1.資料
模擬研究將參考冠脈支架臨床試驗(yàn)設(shè)計(jì)進(jìn)行。該試驗(yàn)為前瞻性、多中心、隨機(jī)對(duì)照、非劣效臨床試驗(yàn),術(shù)后12個(gè)月隨訪時(shí)節(jié)段內(nèi)LLL水平假設(shè)為(0.24±0.50)mm(試驗(yàn)組與對(duì)照組相等),非劣效界值設(shè)為0.195mm。顯著性水平取雙側(cè)5%,把握度取85%,按1:1的比例進(jìn)行分組,計(jì)算得到所需的樣本量為240例(每組120例)。
2.方法
采用蒙特卡洛隨機(jī)模擬的方法對(duì)試驗(yàn)組和對(duì)照組12個(gè)月節(jié)段內(nèi)LLL進(jìn)行數(shù)據(jù)模擬。模擬數(shù)據(jù)樣本量大小采用以定量指標(biāo)為主要終點(diǎn)指標(biāo)的非劣效試驗(yàn)樣本量計(jì)算公式[11]獲得。非劣效試驗(yàn)中,一般假設(shè)試驗(yàn)組與對(duì)照組預(yù)期療效水平等同,故影響樣本量大小的指標(biāo)有效應(yīng)值大小(即非劣效界值大小)、變異大小(即兩組合并方差大小)和預(yù)設(shè)把握度大小。本研究通過設(shè)定不同非劣效界值、不同變異水平、不同把握度水平模擬4種不同樣本量方案下的病變水平數(shù)據(jù),比較分析一般線性模型、廣義估計(jì)方程和混合效應(yīng)模型。4種模擬數(shù)據(jù)方案見表1。
表1 不同數(shù)據(jù)模擬方案參數(shù)設(shè)定表
(1)數(shù)據(jù)模擬分布
按照參數(shù)設(shè)定表(表1),分別模擬對(duì)應(yīng)樣本量下的試驗(yàn)組和對(duì)照組受試者12個(gè)月節(jié)段內(nèi)LLL數(shù)據(jù),且LLL總體均數(shù)服從于N(μ,s2)分布。
(2)相關(guān)性及相關(guān)程度
考慮到同一受試者2個(gè)病變之間存在相關(guān)性,參考既往資料,分別設(shè)定同一受試者不同病變之間相關(guān)系數(shù)為0.1,0.3,0.5,0.9,分別代表不相關(guān)(或較低相關(guān))、低相關(guān)、中度相關(guān)及高度相關(guān)。按照試驗(yàn)組既定的均值和標(biāo)準(zhǔn)差通過二元正態(tài)分布進(jìn)行隨機(jī)模擬。
(3)存在2個(gè)病變受試者比例
參考既往支架臨床試驗(yàn),符合入選/排除標(biāo)準(zhǔn)的受試者一般為1~2個(gè)病變,故設(shè)定存在2個(gè)病變受試者不同比例,分別取0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1,共11種情況。
根據(jù)數(shù)據(jù)相關(guān)系數(shù)的不同設(shè)定(4種情況)及存在2個(gè)病變受試者比例的不同取值,理論上每個(gè)試驗(yàn)設(shè)計(jì)及對(duì)應(yīng)樣本量方案下應(yīng)產(chǎn)生44種情況。每種情況下模擬次數(shù)為1000次。
(4)研究中心設(shè)置
基于可行性考慮,以上每種情況下受試者將按照等比例分配到各中心(即平衡設(shè)計(jì))進(jìn)行模擬,中心數(shù)為樣本量×0.05(即存在2個(gè)病變受試者最小比例),如每組樣本量為120例,則生成中心數(shù)為6家。
(5)評(píng)價(jià)指標(biāo)
①分別計(jì)算不同模擬方案下不同模型分析對(duì)應(yīng)的組間(試驗(yàn)組-對(duì)照組)LLL均值差值的95%置信區(qū)間,并獲得非劣效結(jié)論成立(即陽性結(jié)果)時(shí)的概率并比較。其中,能獲得陽性結(jié)果的概率=獲得陽性結(jié)果總次數(shù)/1000×100%。能獲得陽性結(jié)果的概率越大,則提示該模型越容易得到陽性結(jié)果。
②分別計(jì)算不同模擬方案下不同模型分析時(shí)得到的假陽性錯(cuò)誤率并比較。其中,假陽性錯(cuò)誤率=1-95%置信區(qū)間的實(shí)際覆蓋率,95%置信區(qū)間的實(shí)際覆蓋率=包含真值0的95%置信區(qū)間總次數(shù)/1000×100%。
在模擬研究中,數(shù)據(jù)模擬及不同模型分析均采用SAS 9.4實(shí)現(xiàn)。其中,廣義估計(jì)方程分別給出作業(yè)相關(guān)矩陣采用獨(dú)立和等相關(guān)形式的分析結(jié)果。
1.能獲得陽性結(jié)果的概率及比較
從以上4種不同數(shù)據(jù)模擬方案下對(duì)應(yīng)的圖1和表2縱向結(jié)果可以看出:
(1)在相同研究設(shè)計(jì)及樣本量方案、數(shù)據(jù)相關(guān)程度為不相關(guān)(或較低相關(guān))時(shí),隨著2個(gè)病變受試者比例增大,即實(shí)際病變水平樣本量相比較研究設(shè)計(jì)時(shí)病人水平樣本量逐漸增大,一般線性模型、廣義估計(jì)方程(獨(dú)立)、廣義估計(jì)方程(等相關(guān))、混合效應(yīng)模型所得能獲得陽性結(jié)果的概率均呈現(xiàn)逐漸增大的趨勢(shì),混合效應(yīng)模型最小。
圖1 2個(gè)病變受試者比例不同情況下4種方法驗(yàn)證非劣效假設(shè)成立時(shí)的把握度(%)-數(shù)據(jù)模擬一&數(shù)據(jù)模擬二
圖2 2個(gè)病變受試者比例不同情況下4種方法驗(yàn)證非劣效假設(shè)成立時(shí)的把握度(%)-數(shù)據(jù)模擬三&數(shù)據(jù)模擬四
(2)在相同研究設(shè)計(jì)及樣本量方案、數(shù)據(jù)相關(guān)程度為低相關(guān)、中度相關(guān)時(shí),呈現(xiàn)與以上(1)相似的規(guī)律。廣義估計(jì)方程(獨(dú)立)、廣義估計(jì)方程(等相關(guān))、混合效應(yīng)模型所得能獲得陽性結(jié)果的概率均小于一般線性模型;在2個(gè)病變受試者比例≤10%時(shí),一般線性模型、廣義估計(jì)方程(獨(dú)立)、廣義估計(jì)方程(等相關(guān))所得能獲得陽性結(jié)果的概率相差不大,而混合效應(yīng)模型最?。辉?個(gè)病變受試者比例>10%時(shí),廣義估計(jì)方程(獨(dú)立)、廣義估計(jì)方程(等相關(guān))、混合效應(yīng)模型所得能獲得陽性結(jié)果較為接近,而一般線性模型最大。
表2 2個(gè)病變受試者比例不同情況下4種方法能獲得陽性結(jié)果的概率(%)
(3)在相同研究設(shè)計(jì)及樣本量方案、數(shù)據(jù)相關(guān)程度為高度相關(guān)時(shí),隨著2個(gè)病變受試者比例增大,一般線性模型、廣義估計(jì)方程(等相關(guān))、混合效應(yīng)模型所得能獲得陽性結(jié)果的概率均呈現(xiàn)逐漸增大的趨勢(shì),而廣義估計(jì)方程(獨(dú)立)卻呈現(xiàn)先減小后增大的趨勢(shì)。在2個(gè)病變受試者比例為≤10%時(shí),廣義估計(jì)方程(獨(dú)立)、廣義估計(jì)方程(等相關(guān))、混合效應(yīng)模型所得能獲得陽性結(jié)果的概率均小于一般線性模型,且混合效應(yīng)模型最小。在2個(gè)病變受試者比例為>10%時(shí),廣義估計(jì)方程(獨(dú)立)、廣義估計(jì)方程(等相關(guān))、混合效應(yīng)模型所得能獲得陽性結(jié)果的概率均小于一般線性模型,且廣義估計(jì)方程(獨(dú)立)最小。從模擬結(jié)果橫向來看,在相同研究設(shè)計(jì)及樣本量方案、2個(gè)病變受試者比例相同情況下,數(shù)據(jù)相關(guān)程度分別為不相關(guān)、低相關(guān)、中度相關(guān)及高度相關(guān)時(shí),一般線性模型、廣義估計(jì)方程(獨(dú)立)、廣義估計(jì)方程(等相關(guān))、混合效應(yīng)模型所得能獲得陽性結(jié)果的概率有所不同,基本呈現(xiàn)逐漸減小的趨勢(shì);可見數(shù)據(jù)的相關(guān)程度對(duì)以上模型參數(shù)估計(jì)存在一定影響。
2.假陽性錯(cuò)誤率估計(jì)結(jié)果及比較
從表3縱向結(jié)果中可以看出,在相同研究設(shè)計(jì)及樣本量方案、不同數(shù)據(jù)相關(guān)程度下,隨著2個(gè)病變受試者比例增大,一般線性模型分析時(shí)得到的假陽性錯(cuò)誤率基本上呈現(xiàn)逐漸增大的趨勢(shì),且高于顯著性水平0.05。與一般線性模型相比,廣義估計(jì)方程(獨(dú)立)、廣義估計(jì)方程(等相關(guān))、混合效應(yīng)模型所得假陽性錯(cuò)誤率相對(duì)更小,且穩(wěn)定在顯著性水平0.05附近;其中,廣義估計(jì)方程(獨(dú)立)與廣義估計(jì)方程(等相關(guān))所得假陽性錯(cuò)誤率相差不大,混合效應(yīng)模型所得假陽性錯(cuò)誤率最低。
表3 2個(gè)病變受試者比例不同情況下4種方法能獲得陽性結(jié)果的概率(%)
本模擬研究結(jié)果顯示,與廣義估計(jì)方程和混合效應(yīng)模型相比,采用一般線性模型分析具有相關(guān)性的縱向數(shù)據(jù),會(huì)增加獲得陽性結(jié)果的概率,這與已發(fā)表文獻(xiàn)報(bào)道結(jié)果相一致[4,12]。一般線性模型因忽略了受試者內(nèi)數(shù)據(jù)的相關(guān)性,會(huì)導(dǎo)致低估回歸系數(shù)的標(biāo)準(zhǔn)誤差,從而更容易得到陽性結(jié)論。隨著相關(guān)數(shù)據(jù)比例的增加,3種模型所得實(shí)際能獲得陽性結(jié)果的概率均呈現(xiàn)逐漸增大的趨勢(shì),但廣義估計(jì)方程和混合效應(yīng)模型更接近預(yù)先設(shè)定的把握度水平,提示該2種分析方法因考慮了受試者內(nèi)數(shù)據(jù)的相關(guān)性,能更準(zhǔn)確地估計(jì)回歸系數(shù)及其標(biāo)準(zhǔn)誤差[6-7,13],使得結(jié)果可靠。
對(duì)于縱向數(shù)據(jù)分析,當(dāng)相關(guān)數(shù)據(jù)比例≤5%時(shí),混合效應(yīng)模型所得能獲得陽性結(jié)果的概率最小且低于預(yù)先設(shè)定把握度水平,結(jié)果相對(duì)過于保守,而廣義估計(jì)方程(等相關(guān))較小且更接近預(yù)先設(shè)定的把握度水平,采用廣義估計(jì)方程(等相關(guān))分析較為合適;當(dāng)相關(guān)數(shù)據(jù)比例>30%時(shí),混合效應(yīng)模型所得能獲得陽性結(jié)果的概率較小且更接近預(yù)先設(shè)定的把握度水平,采用混合效應(yīng)模型分析較為合適;而當(dāng)相關(guān)數(shù)據(jù)比例為5%~30%時(shí),數(shù)據(jù)的相關(guān)程度不同,結(jié)論會(huì)有所不同,建議應(yīng)結(jié)合實(shí)際數(shù)據(jù)的特點(diǎn)及相關(guān)程度,選擇合適的分析方法。這可能與廣義估計(jì)方程與混合效應(yīng)參數(shù)估計(jì)方法不同有關(guān)[14],廣義估計(jì)方程考慮人群平均效應(yīng),而混合效應(yīng)模型則是通過隨機(jī)效應(yīng)描述個(gè)體間的關(guān)系。對(duì)于廣義估計(jì)方程(獨(dú)立)方法,當(dāng)數(shù)據(jù)相關(guān)程度為中度相關(guān)及以下時(shí),與廣義估計(jì)方程(等相關(guān))分析結(jié)果相差并不大;但當(dāng)數(shù)據(jù)相關(guān)程度較高時(shí),廣義估計(jì)方程(獨(dú)立)出現(xiàn)了所得能獲得陽性結(jié)果的概率低于預(yù)先設(shè)定的把握度,這可能是該方法實(shí)際假設(shè)受試者內(nèi)數(shù)據(jù)相關(guān)系數(shù)為0,導(dǎo)致參數(shù)估計(jì)結(jié)果不準(zhǔn)確,使得結(jié)果不可靠。這與既往研究報(bào)道結(jié)論一致[15],因此,采用廣義估計(jì)方程分析縱向數(shù)據(jù)時(shí),應(yīng)注意考慮數(shù)據(jù)的相關(guān)程度,選擇合適的作業(yè)相關(guān)矩陣。尤其高度相關(guān)的縱向數(shù)據(jù),采用廣義估計(jì)方程(等相關(guān))分析較為合適。
從假陽性錯(cuò)誤率方面看,采用一般線性模型分析具有相關(guān)性的縱向數(shù)據(jù)會(huì)增大假陽性錯(cuò)誤的概率,而采用廣義估計(jì)方程和混合效應(yīng)模型的應(yīng)用更準(zhǔn)確可靠。同時(shí),與廣義估計(jì)方程相比,混合效應(yīng)模型所得結(jié)果相對(duì)更保守。
綜上,對(duì)于醫(yī)療器械臨床試驗(yàn)中具有相關(guān)性的定量指標(biāo)縱向數(shù)據(jù),不宜采用傳統(tǒng)的統(tǒng)計(jì)分析方法,建議結(jié)合實(shí)際數(shù)據(jù)的特點(diǎn),考慮相關(guān)程度及相關(guān)比例等,采用廣義估計(jì)方程或混合效應(yīng)模型進(jìn)行分析,以確保估計(jì)結(jié)果準(zhǔn)確可靠。本模擬研究仍存在一定的局限性。隨機(jī)模擬時(shí)未考慮組內(nèi)相關(guān)系數(shù)的大小、同一受試者>2條觀測(cè)的相關(guān)數(shù)據(jù)、各中心受試者數(shù)量不同等問題;分析時(shí)無法準(zhǔn)確地估計(jì)I類錯(cuò)誤和II類錯(cuò)誤水平,未采用組內(nèi)相關(guān)系數(shù)、估計(jì)回歸系數(shù)、估計(jì)值與真值的差異等來評(píng)估模型的應(yīng)用效果;數(shù)據(jù)模擬場(chǎng)景無法窮盡;所以研究結(jié)果外推性有限。以上不足之處還需在后續(xù)研究中進(jìn)一步探討。
表4 模擬數(shù)據(jù)組織結(jié)構(gòu)及SAS代碼