于宣宣 蔣志偉 郭 翔 趙國慶 陳夢鍇 陳 峰 趙 楊 于 浩△ 柏建嶺△
非劣效國際多中心臨床試驗(yàn)中的一致性評(píng)價(jià)*
于宣宣1蔣志偉2郭 翔2趙國慶2陳夢鍇1陳 峰1趙 楊1于 浩1△柏建嶺1△
國際多中心臨床試驗(yàn) 非劣效試驗(yàn) 一致性評(píng)價(jià)
21世紀(jì)以來,國際多中心臨床試驗(yàn)(multi-regional clinical trial,MRCT)的數(shù)量逐年增加。開展MRCT能夠使安全有效的藥物在全球得到更快更廣泛的應(yīng)用,可以減少不必要的臨床試驗(yàn)重復(fù),縮短藥品上市時(shí)間[1]。但同時(shí)也面臨著多個(gè)區(qū)域內(nèi)和區(qū)域間的問題[2],MRCT的結(jié)果能否推至某一個(gè)參加區(qū)域,不同國家對新藥試驗(yàn)有不同的要求。日本衛(wèi)生勞動(dòng)和社會(huì)保障部(ministry of health,labor and welfare,MHLW)提出了兩種一致性評(píng)價(jià)方法,要求滿足兩個(gè)方法中的任意一個(gè),就可以判斷日本區(qū)的療效和MRCT療效一致,試驗(yàn)藥可在日本上市[3]。
當(dāng)前,國內(nèi)外在MRCT一致性評(píng)價(jià)方面的研究主要集中在優(yōu)效性試驗(yàn),尚未見到對非劣效國際多中心臨床試驗(yàn)方面的研究。因此,我們參考優(yōu)效性試驗(yàn)的一致性評(píng)價(jià)方法,提出了三種方法來評(píng)價(jià)在非劣效國際多中心臨床試驗(yàn)中整個(gè)試驗(yàn)非劣效結(jié)論成立的情況下,特定區(qū)域的結(jié)果和整個(gè)試驗(yàn)結(jié)果的一致性。
1.方法一 調(diào)整檢驗(yàn)水準(zhǔn)
我們借鑒Chen在優(yōu)效性試驗(yàn)中提出的調(diào)整檢驗(yàn)水準(zhǔn)的方法[4]提出此法。適當(dāng)?shù)脑龃髾z驗(yàn)水準(zhǔn),若在此檢驗(yàn)水準(zhǔn)下,中國區(qū)試驗(yàn)藥和陽性對照藥差值的可信區(qū)間下限大于設(shè)定的非劣效界值δ,則中國區(qū)試驗(yàn)藥非劣于陽性對照藥,認(rèn)為中國區(qū)和MRCT的結(jié)果具有一致性。
2.方法二 基于μall構(gòu)造距離比值
我們借鑒了日本MHLW提出的方法一的思想構(gòu)造了距離比值
其中μall=0,c為預(yù)先設(shè)定的距離比值的界值,若距離比值大于c,則認(rèn)為中國區(qū)試驗(yàn)藥非劣于陽性對照藥,即中國區(qū)域和整個(gè)試驗(yàn)的結(jié)果具有一致性。此方法可以看作日本方法一在非劣效試驗(yàn)中的轉(zhuǎn)化形式。
其中c為預(yù)先設(shè)定的距離比值的界值,若距離比值大于c,則認(rèn)為中國區(qū)試驗(yàn)藥非劣于陽性對照藥,即中國區(qū)域和整個(gè)試驗(yàn)的結(jié)果具有一致性。
模擬試驗(yàn)基于一個(gè)陽性對照、非劣效MRCT,該試驗(yàn)的目的是評(píng)價(jià)某藥物在精神分裂癥患者中的效應(yīng),主要療效指標(biāo)是:陽性與陰性癥狀量表(positive and negative syndrome scale,PANSS)得分的CFB (change from baseline),即如果試驗(yàn)藥與陽性對照藥CFB差值的95%可信區(qū)間下限大于非劣效界值-5,則認(rèn)為試驗(yàn)藥非劣于陽性對照藥。假設(shè)試驗(yàn)組和對照組PANSS得分的CFB都服從均數(shù)為14、標(biāo)準(zhǔn)差為21的正態(tài)分布。兩組比例為1:1,非劣效界值為-5,檢驗(yàn)效能為90%,采用PASS軟件計(jì)算樣本量為742例。
我們設(shè)計(jì)了3個(gè)模擬試驗(yàn),模擬試驗(yàn)A考察方法一中不同檢驗(yàn)水準(zhǔn)、樣本量比例和中國區(qū)的效應(yīng)值情況下中國區(qū)結(jié)果和MRCT結(jié)果的一致性概率,模擬試驗(yàn)B和C分別考察方法二和方法三在不同界值、樣本量比例和中國區(qū)的效應(yīng)值情況下中國區(qū)結(jié)果和MRCT結(jié)果的一致性概率。其中,三個(gè)模擬試驗(yàn)相關(guān)的參數(shù)及取值如表1。
表1 模擬試驗(yàn)A、B、C參數(shù)設(shè)置
通過樣本量比例加權(quán)的方法計(jì)算非中國區(qū)的效應(yīng)值Δnon-local。模擬數(shù)據(jù)的產(chǎn)生及有關(guān)分析采用SAS 9.2統(tǒng)計(jì)。對中國區(qū)的效應(yīng)值和樣本比例的不同組合,每個(gè)組合模擬5000次,計(jì)算中國區(qū)得到非劣效結(jié)論的次數(shù)占中國區(qū)和MRCT均非劣次數(shù)的比例,作為一致性概率的近似估計(jì)值,以評(píng)價(jià)中國區(qū)和MRCT的一致性。
1.方法一中樣本量比例f、檢驗(yàn)水準(zhǔn)和Δlocal的變化對一致性概率的影響
當(dāng)檢驗(yàn)水準(zhǔn)和樣本量比例固定時(shí),一致性的概率隨著Δlocal的增加而增加,當(dāng)中國區(qū)效應(yīng)值逐漸增加時(shí),更易得到非劣效結(jié)果,故一致性的概率也增加。當(dāng)Δlocal和樣本量比例固定時(shí),一致性的概率隨著檢驗(yàn)水準(zhǔn)的增加而增大。因?yàn)闄z驗(yàn)水準(zhǔn)的增大,可信區(qū)間下限越易大于非劣效界值,故一致性的概率增大(圖1)。
當(dāng)f為不同值時(shí),各變量對一致性概率的影響具有相同的趨勢。Δlocal<0時(shí),不論f如何變化,一致性概率均低于50%,Δlocal<-2時(shí),一致性概率低于30%。而Δlocal>0時(shí),隨著受試者比例的增加,一致性概率增加幅度明顯。若受試者比例f足夠大,即使檢驗(yàn)水準(zhǔn)取較小的值,也會(huì)有較高的一致性概率,例如f=0.3,Δlocal=0,檢驗(yàn)水準(zhǔn)為0.075時(shí),一致性概率能夠達(dá)到62%(圖1)。
圖1 不同檢驗(yàn)水準(zhǔn)、Δlocal的變化對一致性概率的影響
2.方法二中樣本量比例f、c和Δlocal的變化對一致性概率的影響
方法二與方法三均設(shè)置單側(cè)檢驗(yàn)水準(zhǔn)為0.025。Δlocal變化對一致性概率的影響與方法一結(jié)果相同,即在f和c為一定值的情況下,一致性概率隨著Δlocal的增大而增加。當(dāng)Δlocal和樣本量比例固定時(shí),隨著c的增加,一致性概率逐漸減小(圖2)。
f為不同值時(shí),各變量對一致性概率的影響趨勢基本相同(圖2)。當(dāng)Δlocal小于0時(shí),隨著中國受試者比例的增加,三維曲面的傾斜度越大,表明若中國受試者比例增加,則Δlocal和c值的變化對一致性概率的影響增大,提示此種情況下,中國需要較大的受試者比例和較小的界值,才能夠得到較高的一致性概率。例如,Δlocal=-2時(shí),f=0.30,c=0.5,一致性概率僅達(dá)到54.8%。而當(dāng)Δlocal大于或者等于0時(shí),三維曲面的傾斜度隨著中國受試者比例的增加逐漸減小,表明隨著中國受試者比例增加,Δlocal和c的值對一致性概率的影響減小。此時(shí),只需選用較小的受試者比例和嚴(yán)格的界值,即可得到較高的一致性概率。例如,Δlocal=0,f=0.2,c=0.6時(shí),一致性概率就已達(dá)到68.04%。
3.方法三中樣本量比例f、c和Δlocal的變化對一致性概率的影響
方法三各變量的變化對一致性概率的影響趨勢與方法二相同。在變量值相同的情況下,方法三得出的一致性概率略高于方法二。
圖2 評(píng)價(jià)標(biāo)準(zhǔn)(c)和Δlocal的變化對一致性概率的影響
MRCT可促進(jìn)藥物的全球研發(fā),縮短藥物注冊時(shí)間,將藥物同時(shí)推向整個(gè)國際市場[5],但不同國家的法規(guī)部門對本區(qū)域的試驗(yàn)結(jié)果有著自己的考量,要求本區(qū)域的試驗(yàn)結(jié)果與MRCT的結(jié)果一致,可批準(zhǔn)藥物在本區(qū)域上市。
本文從不同的角度提出了三種評(píng)價(jià)非劣效國際多中心試驗(yàn)中特定區(qū)域和MRCT一致性的方法,方法一關(guān)注檢驗(yàn)水準(zhǔn)對一致性概率的影響,方法二與方法三主要探討了某個(gè)區(qū)域與整體試驗(yàn)效應(yīng)間的比例對一致性概率的影響。
方法一通過犧牲檢驗(yàn)精度即適當(dāng)增大檢驗(yàn)水準(zhǔn),在特定區(qū)域的效應(yīng)變化不是很大,并且通常情況下不會(huì)偏離MRCT的效應(yīng),可使一致性概率增加。若特定區(qū)域的效應(yīng)高于MRCT的效應(yīng),檢驗(yàn)水準(zhǔn)可增加少些,反之檢驗(yàn)水準(zhǔn)需多增加些。戚成凱等人建議,在優(yōu)效性試驗(yàn)中,當(dāng)中國區(qū)域效應(yīng)與MRCT的效應(yīng)相等或略低時(shí),建議中國區(qū)域的樣本比例不低于30%,檢驗(yàn)水準(zhǔn)不超過0.5,若中國區(qū)域效應(yīng)遠(yuǎn)低于MRCT效應(yīng),則需要增大中國區(qū)域的樣本比例[6]。戚洋洋等人在生存資料優(yōu)效性設(shè)計(jì)的MRCT中探討決策依據(jù)時(shí)也得出了相同的結(jié)論[7]。
方法二是用目標(biāo)區(qū)域處理效應(yīng)的點(diǎn)估計(jì)到非劣效界值的距離和在設(shè)計(jì)階段設(shè)定的總處理效應(yīng)到非劣效界值的距離的比值,與預(yù)先設(shè)定的評(píng)價(jià)標(biāo)準(zhǔn)比較,得到是否一致的結(jié)論。在模擬試驗(yàn)中,整個(gè)試驗(yàn)的處理效應(yīng)假定為0。但實(shí)際情況下,總處理效應(yīng)往往是未知的,具體項(xiàng)目中可用MRCT處理效應(yīng)點(diǎn)估計(jì)值代替,即方法三。方法三雖不如方法二理想,但可操作性強(qiáng)。模擬試驗(yàn)結(jié)果顯示在相同的一致性概率的情況下,方法三比方法二需要的樣本量略少,在評(píng)價(jià)標(biāo)準(zhǔn)嚴(yán)格時(shí)這種趨勢尤為明顯。
方法二和方法三中Δlocal值大于0和Δlocal值小于0時(shí),各變量值對一致性概率影響作用的大小不同??梢灶A(yù)先估計(jì)Δlocal是否小于0,然后合理決定中國區(qū)域的受試者人數(shù)和評(píng)價(jià)一致性界值。
檢驗(yàn)水準(zhǔn)和距離比值的界值的確定,必須事先征得特定區(qū)域的法規(guī)部門同意后方可開展試驗(yàn),并在方案中寫清楚。
MRCT的樣本量由主要研究目的和假設(shè)檢驗(yàn)決定,而區(qū)域間樣本量的分配需要盡可能使區(qū)域間效應(yīng)滿足一致性。單個(gè)區(qū)域分配的樣本量的比例相對不會(huì)太多,故方法二和方法三可在非劣效試驗(yàn)的樣本量分配中提供參考。若一致性概率較高時(shí)(>80%),樣本量比例較高,此時(shí)兩種方法不太適用。若一致性概率稍小(如60%),則兩種方法有較好的適用性。所以,可根據(jù)實(shí)際情況參考上述兩種方法,在區(qū)域間合理分配樣本量。
若試驗(yàn)設(shè)計(jì)中中國受試者人數(shù)比例上限較低,在方法一中可以適當(dāng)降低檢驗(yàn)的精度。相應(yīng)地,方法二中選用較小的界值得到更高的一致性概率。若試驗(yàn)設(shè)計(jì)中中國受試者人數(shù)比例上限較高,或允許的受試者比例上限較高,則可根據(jù)期望達(dá)到的一致性概率,增加受試者人數(shù),同時(shí)可以適當(dāng)調(diào)整檢驗(yàn)水準(zhǔn)或判定界值。但是,檢驗(yàn)精度的降低會(huì)進(jìn)一步帶來一致性評(píng)價(jià)假陽性錯(cuò)誤增大的問題,這將在我們的進(jìn)一步研究中進(jìn)行探討。
在實(shí)際的國際多中心臨床試驗(yàn)中,需在方案中明確寫明使用哪種方法評(píng)價(jià)一致性,若選用方法一,需確定檢驗(yàn)水準(zhǔn),若選用方法二或方法三,則需確定距離比值的界值,在MRCT結(jié)果顯示試驗(yàn)藥非劣于陽性對照藥的前提下,中國區(qū)域結(jié)果如滿足條件,可認(rèn)為中國區(qū)和MRCT的結(jié)果具有一致性。
在MRCT中,不論是優(yōu)效性試驗(yàn)還是非劣效試驗(yàn),一致性檢驗(yàn)均是試驗(yàn)設(shè)計(jì)和分析中重要的部分。在MRCT中試驗(yàn)藥被證明有效時(shí),一致性檢驗(yàn)則成為幫助區(qū)域衛(wèi)生當(dāng)局決定是否批準(zhǔn)藥物上市的關(guān)鍵步驟[8]。非劣效試驗(yàn)的目標(biāo)不僅是顯示新藥非劣于陽性對照藥,還要證明新藥優(yōu)于安慰劑,而優(yōu)效性試驗(yàn)大都評(píng)價(jià)新藥是否優(yōu)于安慰劑。因此,與優(yōu)效性試驗(yàn)相比,在非劣效試驗(yàn)中評(píng)估所有區(qū)域藥物的效應(yīng)是必要的[9]。
總之,MRCT面臨著諸多挑戰(zhàn),如試驗(yàn)的設(shè)計(jì)、實(shí)施、分析和結(jié)果的解釋[10]。本研究的結(jié)果對開展非劣效國際多中心臨床試驗(yàn)有一定的借鑒意義。本文只模擬了三種方法在定量終點(diǎn)指標(biāo)上的表現(xiàn),對于二分類或生存結(jié)局,我們將做進(jìn)一步研究。
[1] 高珊,鄭曉娜.淺談國際多中心臨床試驗(yàn).科學(xué)時(shí)代,2015,(1):122.
[2] Chen X,Lu N,Nair R,et al.Decision rules and associated sample size planning for regional approval utilizing multiregional clinical trials.Journal of biopharmaceutical statistics,2012,22(5):1001-1018.
[3] Ministry of Health,Labour and Welfare.Basic Principles on Global Clinical Trials,2007:1-11.
[4] Chen X,Lu N,Nair R,et al.Decision rules and associated sample size planning for regional approval utilizing multiregional clinical trials.Journal of Biopharmaceutical Statistics,2012,22(5):1001-1018.
[5] Tsou HH,Chow SC,Lan KK,et al.Proposals of statistical consideration to evaluation of results for a specific region in multi‐regional trials-Asian perspective.Pharmaceutical statistics,2010,9(3):201-206.
[6] 戚洋洋,王陵,虞成凱,等.生存資料優(yōu)效性設(shè)計(jì)的國際多中心臨床試驗(yàn)在目標(biāo)區(qū)的決策依據(jù)探討.中國衛(wèi)生統(tǒng)計(jì),2016,33(2):198-200.
[7] 虞成凱,王陵,戚洋洋,等.基于α調(diào)整的國際多中心臨床試驗(yàn)?zāi)繕?biāo)區(qū)二分類終點(diǎn)有效性研究的橋接方法.中國衛(wèi)生統(tǒng)計(jì),2016,33(1):20-23.
[8] Quan H,Mao X,Chen J,et al.Multi-regional clinical trial design and consistency assessment of treatment effects.Statistics in Medicine,2014,33(13):2191-2205.
[9] Diao G,Zeng D,Ibrahim J G,et al.Statistical design of noninferiority multiple region clinical trials to assess global and consistent treatment effects.Journal of Biopharmaceutical Statistics,2017.
[10] Ando Y,Hamasaki T.Practical issues and lessons learned from multi-regional clinical trials via case examples:a Japanese perspective.Pharmaceutical statistics,2010,9(3):190-200.
國家自然科學(xué)基金(81302512;81773554)
1.南京醫(yī)科大學(xué)公共衛(wèi)生學(xué)院 生物統(tǒng)計(jì)學(xué)系(211166) 2. 默沙東(研發(fā))中國有限公司 生物統(tǒng)計(jì)與決策科學(xué)部
△通信作者:于浩,E-mail:haoyu@njmu.edu.cn; 柏建嶺,E-mail:jbai@njmu.edu.cn
郭海強(qiáng))