南方醫(yī)科大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計學(xué)系(510515) 劉偉杰 譚旭輝
【提 要】 目的 比較隨機(jī)縮減法中條件功效和不同先驗分布下的預(yù)測功效兩類指標(biāo)的優(yōu)劣。方法 以試驗組和對照組的兩樣本均數(shù)比較的統(tǒng)計優(yōu)效性檢驗為分析目的,在拒絕型O’Brien & Fleming(OBF法)成組序貫設(shè)計的條件下,通過設(shè)定不同SCP的拒絕閾值γ,在每個期中分析階段計算CP及不同先驗下的PP,并計算各指標(biāo)相應(yīng)的Ⅰ類錯誤、檢驗功效Power、平均樣本量以及平均階段數(shù)。結(jié)果 當(dāng)SCP終止條件為γ=0.80,無信息先驗PP的Ⅰ類錯誤能穩(wěn)定在0.05處左右,而CP和enthusiastic先驗PP的Ⅰ類錯誤則出現(xiàn)明顯膨脹;當(dāng)SCP終止閾值為0.85和0.90,能明顯抑制CP和不同先驗下的PP的Ⅰ類錯誤的膨脹;當(dāng)五階段OBF功效設(shè)定在90%及SCP終止閾值為0.80的條件下,CP、無信息先驗PP以及enthusiastic先驗PP功效分別為87.6%、84%和86.5%。結(jié)論 在期中分析次數(shù)較多的OBF成組序貫設(shè)計條件下,無信息先驗PP效果優(yōu)于CP;在陽性研究中,SCP能大幅減少成組序貫試驗所需的期望樣本量和期望階段數(shù)。隨著SCP終止閾值的增大以及期中分析次數(shù)的減少,CP和不同先驗PP的功效均會出現(xiàn)明顯的下降,而CP和不同先驗PP的Ⅰ類錯誤的膨脹則會被抑制。隨機(jī)縮減法相關(guān)指標(biāo)對于臨床試驗有效性監(jiān)測具有較高的參考價值。
臨床試驗數(shù)據(jù)的安全性和有效性的期中監(jiān)測成為了現(xiàn)代臨床試驗重要組成部分,成組序貫設(shè)計因其期中分析的靈活性成為藥物臨床試驗設(shè)計方法的較好選擇。為了在試驗過程中,能夠?qū)ξ磥淼慕Y(jié)局進(jìn)行預(yù)測,由Lan,Simon & Halperin[1]基于序貫設(shè)計的思想提出的隨機(jī)縮減法(stochastic curtailment procedure,SCP)則是可以有效降低樣本量的試驗數(shù)據(jù)監(jiān)測方法。此外,在Ⅲ期臨床試驗有效性評價中,成組序貫設(shè)計通常會選擇O’Brien & Fleming(下稱OBF法)法[2]。因此,在OBF法成組序貫設(shè)計條件下結(jié)合隨機(jī)縮減法的各個指標(biāo),能否進(jìn)一步提高試驗效率亟待明確。故本文主要以O(shè)BF法作為經(jīng)典期中分析方法,在參數(shù)θ的先驗分布取“客觀性”較強(qiáng)的幾種先驗分布條件下,對隨機(jī)縮減法的條件功效(conditional power,CP)和預(yù)測功效(predictive power,PP)進(jìn)行比較和評估,為該方法在成組序貫設(shè)計中的應(yīng)用提供理論參考。
1.成組序貫設(shè)計
成組序貫設(shè)計(group sequential design)是一種在試驗正式結(jié)束前,能提供多次期中分析的設(shè)計。在該設(shè)計中,因其能較早的終止試驗,從而明顯減少試驗所需樣本量以及時間。從設(shè)計角度來說,成組序貫設(shè)計是將整個試驗劃分成K個階段,每個階段內(nèi)都有一定量的受試者加入,當(dāng)?shù)趉個階段(k=1,2,…,K)結(jié)束后,將之前各個階段試驗結(jié)果累積起來進(jìn)行一次分析。對于拒絕型的成組序貫設(shè)計,如果拒絕H0則試驗結(jié)束,否則繼續(xù)下一階段試驗。在最終試驗階段,其結(jié)果不是接受H0,就是拒絕H0[2]。
期中分析(interim analysis)[3-4]是根據(jù)事先制訂的分析計劃,對累積數(shù)據(jù)進(jìn)行分析并比較處理組間的有效性和安全性。期中分析可提早終止試驗并縮短試驗周期,同時可保證患者以較少的花費得到最佳的治療。由于該過程實際上是對已累積數(shù)據(jù)進(jìn)行重復(fù)性檢驗,為防止Ⅰ類錯誤膨脹,成組序貫設(shè)計在各階段校正檢驗水準(zhǔn),各階段的Ⅰ類錯誤被稱為名義顯著性水準(zhǔn)(nominal significance level)[5]。
2.隨機(jī)縮減法
在臨床試驗中,如果試驗在某階段累積的信息可保證在整個試驗完成時有較大可能性得到拒絕或接受零假設(shè)的結(jié)論,那么試驗即可在此階段結(jié)束?;谝陨弦?guī)則,由Lan[1]提出的隨機(jī)縮減法(SCP),可在試驗過程中的任意一個階段,通過計算SCP的相關(guān)指標(biāo)來判斷試驗是否可以提前終止。SCP指標(biāo)有如下兩類[6]:
(1)條件功效(CP),即以當(dāng)前所納入樣本提供的信息推測最終階段拒絕原假設(shè)的概率:
CPk(θ)=P(RejectH0|θ,accumulated data)
(1)
對于每一階段k=1,…,K-1,在Zk條件下的最后階段ZK的條件分布為:
那么第k階段的CP為
(2)
CP的計算取決于未知的真實效應(yīng)差別θ,一般取現(xiàn)階段的最大似然估計值θMLE[6]。
(2)預(yù)測功效(PP),即依據(jù)θ的先驗信息,并結(jié)合樣本似然函數(shù),以后驗分布作為權(quán)重對θ進(jìn)行積分[7-8]。
(3)
PP相對于CP,有效地避免了直接選擇參數(shù)θ估計值進(jìn)行計算,并以θ的后驗分布作為權(quán)重,計算加權(quán)平均的條件功效。該方法在計算中用θ的后驗分布反映了對θ的不確定性,從而需要事先指定θ的先驗分布。
P(θ|accumulated data)~
(4)
則根據(jù)公式(3)、(4),第k階段的預(yù)測功效為
PPk=
(5)
本研究中所采用的幾種“客觀性”較強(qiáng)的先驗分布如下[9-11]:
Non-informative先驗(無信息先驗):若假設(shè)臨床試驗開始前我們?nèi)鄙僭囼炏嚓P(guān)歷史信息。在這種情況下,先驗參數(shù)會在一個區(qū)間內(nèi)取值沒有任何傾向;
Enthusiastic先驗:當(dāng)臨床試驗結(jié)局支持陰性結(jié)果(Negative Study)時,我們選擇Enthusiastic先驗來計算預(yù)測功效PP,并以此推斷試驗數(shù)據(jù)支持陰性結(jié)果的強(qiáng)度;對于正態(tài)Enthusiastic先驗分布,要求其先驗均值取為θalternative,取Prob{θ≤0}≤α成立時的方差;
Skeptical先驗:當(dāng)臨床試驗結(jié)局支持陽性結(jié)果(positive study)時,我們選擇Skeptical先驗來計算預(yù)測功效PP,并以此來判斷試驗是否終止。對于正態(tài)Skeptical先驗分布,要求其先驗均值取為0,取Prob{θ≥θalternative}≤α成立時的方差;
本文通過隨機(jī)模擬,對拒絕型OBF法成組序貫設(shè)計下條件功效CP和預(yù)測功效PP作為試驗監(jiān)測指標(biāo)的優(yōu)劣性進(jìn)行比較,并評估各種先驗分布對PP的影響;比較不同SCP終止閾值γ對CP和PP監(jiān)測效果的影響。
我們以兩樣本均數(shù)比較的成組序貫為設(shè)計框架,采用SAS 9.3隨機(jī)產(chǎn)生每個階段的模擬試驗數(shù)據(jù)。在期中分析中,通過計算CP和PP的I類錯誤、檢驗功效Power、平均樣本量(average sample number,ASN)以及平均終止階段數(shù)(average stage,AS)等指標(biāo),綜合評價CP和PP的優(yōu)劣性。在模擬過程中,試驗是否終止的判斷是由經(jīng)典OBF期中分析的結(jié)果來決定。
在模擬過程中,以優(yōu)效性假設(shè)檢驗H0:θ=0,H1:θ>0(θA=2),單側(cè)α=0.05,β=0.1(即Power=0.9),經(jīng)典OBF法成組序貫設(shè)計階段數(shù)K=3,4,5為設(shè)計框架;效應(yīng)差值θA=2,共同標(biāo)準(zhǔn)差σ=8,試驗組均值Μt=4或6,對照組均值Μc=4;SCP閾值設(shè)定為0.80、0.85以及0.90;模擬次數(shù)為1000次。具體參數(shù)如下表1所示:
表1 模擬參數(shù)設(shè)定
1.兩總體均數(shù)相同
在兩總體均數(shù)相同條件下,按照表1的參數(shù)設(shè)置,隨機(jī)縮減法的各指標(biāo)的I類錯誤如表2。由表2的陰性模擬研究結(jié)果中可以看出,在終止條件為γ=0.80的5階段和4階段情況下,隨機(jī)縮減法的各指標(biāo)除Skeptical先驗PP以外均有Ⅰ類錯誤膨脹的情況,尤其是指標(biāo)CP的I類錯誤出現(xiàn)較明顯的膨脹。另外,Skeptical先驗通常用于支持陽性試驗結(jié)局,因此在陰性模擬比較中I類錯誤較低,其實際參考意義不大。而在三個階段中的無信息先驗PP的Ⅰ類錯誤能穩(wěn)定在0.05左右。
當(dāng)終止條件設(shè)定為γ=0.85或γ=0.90,隨機(jī)縮減法的各指標(biāo)除CP以外均能較好控制Ⅰ類錯誤膨脹的情況,Ⅰ類錯誤隨著階段數(shù)的減少而降低,當(dāng)階段數(shù)降低到3階段時,指標(biāo)CP的Ⅰ類錯誤概率能控制在0.05左右。
2.兩總體均數(shù)不同
在兩總體均數(shù)不同條件下,按照表1的參數(shù)設(shè)置,隨機(jī)縮減法的各指標(biāo)的功效(Power)、平均樣本量(ASN)及平均終止階段數(shù)(AS)如表3。
由表3的結(jié)果可以看出,在終止條件γ=0.80的5階段情況下,CP、無信息先驗PP和Enthusiastic先驗PP的功效Power均能保持在0.85左右,SCP各指標(biāo)的平均樣本量(ASN)及平均終止階段數(shù)(AS)均比OBF法有明顯的降低。在γ=0.80的各階段情況下,隨著階段數(shù)的減少,SCP各指標(biāo)的功效均會比OBF法有明顯的降低。
表2 兩總體均數(shù)相等時I類錯誤
在相同階段數(shù)的條件下,隨著γ值的增大,SCP各指標(biāo)的功效均會出現(xiàn)明顯下降。此外隨著階段數(shù)的減少,SCP各指標(biāo)的功效均會有明顯的下降。在各階段情況下,SCP各指標(biāo)的平均樣本量(ASN)及平均終止階段數(shù)(AS)仍然比OBF法要低。
表3 兩總體均數(shù)不等時功效(Power)、平均樣本量(ASN)及平均終止階段數(shù)(AS)
本文主要對隨機(jī)縮減法原理進(jìn)行了簡單闡述,并對其在經(jīng)典成組序貫設(shè)計期中分析過程中的應(yīng)用效果進(jìn)行了分析比較。從實際模擬效果來看,在期中分析次數(shù)較多的情況下,CP會明顯增加I類錯誤的風(fēng)險[12],而無信息先驗PP和Skeptical先驗PP均能較好的控制I類錯誤。隨著期中分析次數(shù)的減少,無信息先驗PP和Skeptical先驗PP的I類錯誤控制情況依舊好于條件功效CP。因此,在陰性研究中無信息先驗的PP是優(yōu)于條件功效CP的。這是由于在試驗的早期階段,參數(shù)θ的最大似然估計值θMLE通常是不太穩(wěn)定的,從而使條件功效CP的計算存在較大的誤差,并由此導(dǎo)致在試驗的早期階段過多的拒絕零假設(shè)。對于無信息先驗的PP,由于其計算中依賴的是θ的后驗分布,所以PP的計算是比較合理和穩(wěn)定的。從先驗分布的選擇角度來說,無信息先驗也是較理想的選擇。此外,隨著期中分析次數(shù)的降低,每階段所需的樣本量就會相應(yīng)的增加,從而使參數(shù)θ最大似然估計值趨于穩(wěn)定。這種現(xiàn)象恰恰說了隨著期中分析次數(shù)的減少,條件功效CP的I類錯誤膨脹情況得到明顯的抑制。
在總體均數(shù)不同以及期中分析次數(shù)較多的情況下,基于CP、無信息先驗PP以及Enthusiastic先驗PP的功效Power均能較好的接近OBF法設(shè)定的功效,而相應(yīng)的平均樣本量和平均階段數(shù)均明顯的低于OBF法,尤其是CP比無信息先驗PP更加節(jié)省樣本量。但是,這并不能說明在陽性研究中條件功效CP是優(yōu)于無信息先驗PP的。這是由于CP在試驗的早期階段拒絕零假設(shè),通過放大I類錯誤,從而獲得了較高的功效Power以及較低的樣本量。隨著期中分析次數(shù)的減少,SCP各指標(biāo)的功效均會出現(xiàn)較明顯的下降,這也就意味著SCP各指標(biāo)并不適用于期中分析次數(shù)較少的設(shè)計。
通過整個模擬試驗,我們發(fā)現(xiàn)SCP閾值γ的增加或減少均會明顯影響各個指標(biāo)的I類錯誤和功效,這是由于隨機(jī)縮減法的判斷原理造成的。Jennison[6]的研究表明,SCP閾值γ較理想的取值是在0.8到0.9,這與我們的模擬結(jié)果是一致的。
綜上所述,當(dāng)在OBF法拒絕型成組序貫設(shè)計中,在期中分析次數(shù)較多的情況下,隨機(jī)縮減法中的基于無信息先驗的PP可作為臨床試驗早期決策的輔助參考指標(biāo),從而增加研究人員對未來結(jié)果預(yù)測的信心。