中國藥科大學(xué)生物統(tǒng)計(jì)與計(jì)算藥學(xué)研究中心(210009)
言方榮△ 朱惠紅 蔣麗蕓 周 璐 張倩媛
國家社會科學(xué)基金項(xiàng)目(16BTJ021)
△通信作者:言方榮,E-mail:f.r.yan@163.com
生物等效性評價(jià)早期停止條件研究*
中國藥科大學(xué)生物統(tǒng)計(jì)與計(jì)算藥學(xué)研究中心(210009)
言方榮△朱惠紅 蔣麗蕓 周 璐 張倩媛
目的基于貝葉斯方法,研究生物等效性評價(jià)的早期等效和不等效停止條件。方法基于貝葉斯方法建立平均生物等效后驗(yàn)概率的統(tǒng)計(jì)模型,探索生物等效性評價(jià)的早期停止條件,以期在臨床試驗(yàn)早期對生物等效性評價(jià)做出結(jié)論。結(jié)果通過R軟件模擬,給出了不同情況下的早期停止條件,滿足I型錯(cuò)誤率在0.05以下,同時(shí)保證檢驗(yàn)效能在80%以上。早期等效停止邊界參數(shù)在0.7~0.8,早期不等效停止邊界參數(shù)在0.35~0.4。結(jié)論早期停止條件對生物等效性評價(jià)有重要意義,具有臨床推廣價(jià)值。
早期停止 平均生物等效 貝葉斯方法 交叉試驗(yàn)
2016年3月,國務(wù)院辦公廳印發(fā)了《關(guān)于開展仿制藥質(zhì)量和療效一致性評價(jià)的意見》,為落實(shí)有關(guān)事項(xiàng),CFDA對仿制藥生物等效性評價(jià)提出了新的要求,使得生物等效性評價(jià)成為近來討論熱點(diǎn)。傳統(tǒng)的生物等效性評價(jià)方法如單雙側(cè)t檢驗(yàn)法必須在整個(gè)試驗(yàn)結(jié)束時(shí)才能做出結(jié)論,往往所需試驗(yàn)時(shí)間較長。事實(shí)上,在生物等效性評價(jià)臨床試驗(yàn)中,隨著試驗(yàn)的進(jìn)展及信息的不斷更新,可能在試驗(yàn)早期就對藥物生物等效性有了初步認(rèn)識。如何利用已有認(rèn)識開展生物等效性評價(jià),進(jìn)行早期決策,是值得深入探討的問題。
近年來,藥物有效性評價(jià)臨床試驗(yàn)早期停止條件的研究已經(jīng)引起了廣泛關(guān)注。該方法的基本思想是,利用已獲得信息,對藥物效應(yīng)作早期預(yù)測,以判斷是否可以提前終止試驗(yàn)。已有學(xué)者將上述思想運(yùn)用于生物等效性評價(jià),提前判斷受試藥和參比藥是否等效,并早期終止試驗(yàn)。比如成組序貫設(shè)計(jì)[1]的生物等效評價(jià)方法,期中分析時(shí)可根據(jù)現(xiàn)有數(shù)據(jù)進(jìn)行早期評價(jià),在滿足停止條件時(shí)提前做出結(jié)論并終止試驗(yàn)。但此類早期停止需要在試驗(yàn)前分配各階段的I型錯(cuò)誤率(α),對期中分析次數(shù)也有限制。Potvin D[2]提出了兩階段自適應(yīng)設(shè)計(jì),其基本思想是在α=0.05水平下根據(jù)第一階段數(shù)據(jù)估計(jì)效能,若效能≥80%,在該水平下進(jìn)行生物等效性檢驗(yàn),宣布等效或不等效并終止試驗(yàn);若效能<80%,則在α=0.028水平下進(jìn)行生物等效性檢驗(yàn),等效則終止試驗(yàn),否則需要根據(jù)已有數(shù)據(jù)在α=0.028水平下重新估計(jì)樣本量N2,并進(jìn)行第二階段試驗(yàn),然后在α=0.028水平下根據(jù)所有數(shù)據(jù)進(jìn)行生物等效性檢驗(yàn)并結(jié)束試驗(yàn)。但該方法可能會導(dǎo)致樣本量過大,Fuglsang[3]進(jìn)一步推廣了結(jié)論,提出第一階段效能<80%且沒有通過生物等效檢驗(yàn)時(shí)的早期停止條件,主要是對第二階段樣本容量加以限制,如N2>80或N2>4N1(N1為第一階段樣本量),若滿足條件則早期終止試驗(yàn)。雖然此類停止條件的運(yùn)用對I型錯(cuò)誤率影響較小,但是檢驗(yàn)效能受損嚴(yán)重。因此,研究更為有效的早期停止條件,對避免試驗(yàn)的總樣本量過大,同時(shí)縮短試驗(yàn)耗時(shí)有著非常重要的意義。
近年來,貝葉斯方法廣泛應(yīng)用于生物等效性評價(jià)中。該方法能納入試驗(yàn)前知識、專家意見等歷史信息并與試驗(yàn)數(shù)據(jù)結(jié)合,更有效地估計(jì)藥物效應(yīng)。但是,現(xiàn)有研究主要是將貝葉斯方法用于生物等效性檢驗(yàn),并沒有研究早期停止條件。因此,基于貝葉斯方法的特點(diǎn),本文研究該框架下的早期停止條件。首先,本文建立平均生物等效后驗(yàn)概率的統(tǒng)計(jì)模型,然后提出了基于此概率的早期停止條件,并將其用于生物等效性評價(jià),最后通過模擬,給出了不同情況下的早期停止條件。
生物等效性評價(jià)通常使用2×2交叉試驗(yàn)設(shè)計(jì)。假設(shè)有兩種藥物,受試藥(T)和參比藥(R),每個(gè)受試者被隨機(jī)分配到兩種給藥序列(RT,TR)中。接受RT給藥序列的受試者在第一階段接受R藥,第二階段接受T藥,TR給藥序列則與之相反,兩個(gè)階段之間有一個(gè)足夠長的清洗期。所以在實(shí)際研究中,經(jīng)常假設(shè)不存在藥物殘留效應(yīng)。下面是2×2交叉試驗(yàn)設(shè)計(jì)的統(tǒng)計(jì)模型[4]:
Yijk=μ+δik+F(j,k)+Pj+Sk+εijk
(1)
通常假設(shè)第1序列的第1階段的藥物為R藥,則有:
對模型(1)進(jìn)行兩層貝葉斯層次分析。第一層中,假設(shè)參數(shù)滿足以下先驗(yàn)分布:
(2)
其中,N(a,b2)表示均值為a,方差為b2的正態(tài)分布,IG(e,f)表示均值為f/(e-1),方差為f2/[(e-1)2(e-2)]的逆伽瑪分布,先驗(yàn)分布中所有超參數(shù)都假設(shè)已知。
(3)
其中,超參數(shù)c和d都假設(shè)已知。
令δ=(δ11,…,δn11,δ12,…,δn22),則根據(jù)(3)和(4)可得到參數(shù)φ=(θ,δ)的聯(lián)合后驗(yàn)分布:
(4)
根據(jù)上述聯(lián)合后驗(yàn)分布得到藥物效應(yīng)F(j,k)的滿條件后驗(yàn)分布:
F(j,k)|φ(F(j,k) ),y~
(5)
其中θijk=Yijk-μ-δik-Pj-Sk;j=k時(shí)F(j,k)=FR,j≠k時(shí)F(j,k)=FT。
根據(jù)FT和FR的滿條件后驗(yàn)分布,利用吉布斯算法對FT-FR進(jìn)行抽樣,從而得到平均生物等效的后驗(yàn)概率。
1.基于平均生物等效概率的早期停止條件
假設(shè)受試藥(T)和參比藥(R)的對數(shù)效應(yīng)值的總體均值分別為μT和μR,則區(qū)間假設(shè)的檢驗(yàn)為:
H0:μT-μR≤θLorμT-μR≥θUvs.Ha:θL<μT-μR<θU
(6)
其中,等效的上下邊界θU和θL是根據(jù)FDA的規(guī)定得到的,通常取θL= log (0.8),θU= log (1.25)。
根據(jù)該假設(shè)檢驗(yàn),I型錯(cuò)誤率就是在兩藥不滿足生物等效時(shí),經(jīng)檢驗(yàn)得出生物等效的概率。而檢驗(yàn)效能就是在兩藥滿足生物等效的情況下,經(jīng)檢驗(yàn)得出生物等效的概率。
貝葉斯方法的假設(shè)檢驗(yàn)需要計(jì)算公式(6)中Ha的后驗(yàn)概率,即平均生物等效的后驗(yàn)概率,記為PABE,計(jì)算公式如下[5]:
PABE=Pr(平均生物等效|數(shù)據(jù))=Pr[θL (7) 其中(FTr-FRr,r= 1,…,n)是從FT-FR的滿條件后驗(yàn)分布中得到的一個(gè)抽樣樣本,I (·)為示性函數(shù),n表示吉布斯抽樣次數(shù)。 PABE越大,表明受試藥越可能與參比藥等效。相反,PABE越小,表明受試藥越不可能與參比藥等效。根據(jù)貝葉斯思想,隨著數(shù)據(jù)的增加,可以不斷調(diào)整PABE。因此,可將PABE作為指標(biāo),判斷試驗(yàn)是否可以早期停止,宣布等效或不等效。故本文提出下列用于生物等效性評價(jià)的早期停止條件: (1)早期等效停止條件:若PABE>C2,提前終止試驗(yàn),宣布兩藥生物等效。 (2)早期不等效停止條件:若PABE 2.生物等效性評價(jià)的早期停止設(shè)計(jì) 將上述早期停止條件用于生物等效性評價(jià),同時(shí)允許多次期中分析,該方法的評價(jià)過程如下: (1)入組一定的初始樣本量并計(jì)算PABE,本文指定為12人,其是FDA允許進(jìn)行決策的最小研究量[6]。 (2)考慮第k(k=1,2,…,K)次期中分析: 若滿足早期不等效停止條件,則提前停止試驗(yàn),宣布不等效; 若滿足早期等效停止條件,則提前停止試驗(yàn),宣布等效; 否則繼續(xù)進(jìn)行試驗(yàn),入組新的樣本并重復(fù)上述步驟。 (3)達(dá)到最大樣本量Nmax,計(jì)算PABE,如果PABE>C2,認(rèn)為生物等效,否則生物不等效。 本文通過不斷搜索的方法來確定邊界參數(shù)C1和C2,滿足I型錯(cuò)誤率α在5%以下,同時(shí)保證檢驗(yàn)效能1-β(β為II型錯(cuò)誤率)在80%以上。 1.參數(shù)設(shè)置 為確定所提方法的可行性,設(shè)置模擬分析如下:采用標(biāo)準(zhǔn)的2×2交叉試驗(yàn)設(shè)計(jì),并利用下列線性混合效應(yīng)模型產(chǎn)生模擬數(shù)據(jù): 為考察不同的最大樣本量對邊界的影響,模擬Nmax=24,36和48三種情況。同時(shí),為分析個(gè)體間差異對試驗(yàn)設(shè)計(jì)的影響,我們對上述每一種情況模擬個(gè)體間差異較小、中等和較大三種情況,即σ2=0.2,0.5或1。 2.模擬結(jié)果 針對不同情況,利用R 3.1.2編寫吉布斯算法計(jì)算PABE,并重復(fù)模擬1000次。首先在(0.5,1)范圍內(nèi)不斷增大邊界C2,得到不同邊界下的I型錯(cuò)誤率,選取合適的C2控制I類錯(cuò)誤率在0.05以下。C2確定后在(0,0.5)范圍內(nèi)不斷調(diào)整邊界C1,得到不同邊界下的檢驗(yàn)效能,選取C1使效能達(dá)到80%。本文在此只給出其中2種情形的結(jié)果。 圖1 Nmax=24,σ2=1時(shí)的邊界C1、C2確定圖 圖2 Nmax=48,σ2=1時(shí)的邊界C1、C2確定圖 圖1、2分別為Nmax=24和48,σ2=1時(shí)雙側(cè)停止邊界C1、C2的確定結(jié)果。從圖中可以看出,隨著邊界C2的增大,I型錯(cuò)誤率不斷變小,故選取邊界C2為控制I型錯(cuò)誤率在5%以下的最小值。隨著邊界C1的減小,檢驗(yàn)效能不斷變大,故選取邊界C1為保證檢驗(yàn)效能在80%以上的最大值。從圖1右圖可見檢驗(yàn)效能都在80%以下,所以不設(shè)早期不等效停止邊界,而只有早期等效停止C2=0.692。從圖2可以確定界限C1=0.371,C2=0.782。 邊界C1和C2確定后,在H0條件下模擬試驗(yàn)的早期停止概率(PET)和平均樣本量E(N|H0),具體結(jié)果見表1。其中,PET為1000次試驗(yàn)中早期停止的試驗(yàn)次數(shù)所占比例。平均樣本量的計(jì)算公式如下[7]: E(N|H0)=n1+(1-PET1)×n2+…+(1-PET1-…-PETK)×nK+1 (8) 其中,PETi(i=1,…,K)表示第i次期中分析早期停止的概率,ni(i=1,…,K,K+1)表示第i階段入組的樣本量。 從表1可知,(1)當(dāng)最大樣本量一定時(shí),隨著個(gè)體間差異的增大,邊界C1和C2同時(shí)變小,早期停止概率PET則隨著變異度的增大而減小,說明越不容易早期停止,因此平均樣本量不斷增大。(2)當(dāng)個(gè)體間差異σ2一定時(shí),隨著最大樣本量的增大,邊界C1和C2同時(shí)變大,早期停止概率PET和平均樣本量都會增大??梢园l(fā)現(xiàn),最大樣本量與個(gè)體間差異的變化對早期停止條件邊界的影響趨勢相反。(3)所有情形都能控制 I型錯(cuò)誤率在5%以下,同時(shí)檢驗(yàn)效能較高,當(dāng)Nmax=36和48時(shí)能達(dá)到80%以上。 表1 不同參數(shù)情況下的PET和E(N|H0)結(jié)果表 3.試驗(yàn)設(shè)計(jì)示例 以圖2情形為例用于實(shí)際生物等效性評價(jià),可有四類決策情形,具體結(jié)果見圖3。圖3A在第三次期中分析后,PABE大于早期等效停止邊界,提前終止試驗(yàn),宣布等效圖;3B在達(dá)到最大樣本量時(shí)仍不滿足早期停止條件,此時(shí)停止試驗(yàn),宣布不等效;圖3C在第一次期中分析后便滿足早期不等效停止條件,提前終止試驗(yàn),宣布不等效;圖3D在第一次期中分析后便滿足早期等效停止條件,提前終止試驗(yàn),宣布等效。 圖3Nmax=48,σ2=1時(shí)不同決策情形圖 本文研究了基于貝葉斯方法的早期等效和不等效停止條件,用于對生物等效性評價(jià)做出早期判斷。該停止條件在生物等效性評價(jià)中主要有以下特點(diǎn):首先,可以通過不斷增大等效邊界C2使I型錯(cuò)誤率在5%以下,避免患者受到較大風(fēng)險(xiǎn),同時(shí)通過不斷調(diào)整邊界C1達(dá)到效能要求,若不能滿足檢驗(yàn)效能在80%以上,可以增加最大樣本量Nmax。但Nmax的增大會使平均樣本量同時(shí)增大,故不能太大。其次,能夠靈活運(yùn)用于不同個(gè)體間變異的情形,當(dāng)受試者質(zhì)量相差較大時(shí),可以在適用于受試者質(zhì)量相差較小的停止條件下同時(shí)減小邊界C1和C2。最后,基于該早期停止條件的生物等效性評價(jià)方法允許多次期中分析,一旦滿足條件,便可以提前宣布生物等效或不等效并終止試驗(yàn),縮短了試驗(yàn)耗時(shí),對仿制藥的評價(jià)工作具有重要意義。與成組序貫設(shè)計(jì)不同,該方法不需要分配每個(gè)階段的I型錯(cuò)誤率,只需控制全局I型錯(cuò)誤率在5%以下,十分簡便。本文所提早期停止條件尚處于探索階段,如何運(yùn)用到生物等效性評價(jià)的臨床試驗(yàn)中,并符合實(shí)際要求還需要進(jìn)一步研究。 [1] Hauck W,Preston PE,Bois FY.A group sequential approach to crossover trials for average bioequivalence.Journal of biopharmaceutical statistics,1997,7(1):87-96. [2] Potvin D,DiLiberti CE,Hauck WW,et al.Sequential design approaches for bioequivalence studies with crossover designs.Pharmaceutical statistics,2008,7(4):245-262. [3] Fuglsang A.Futility rules in bioequivalence trials with sequential designs.The AAPS journal,2014,16(1):79-82. [4] Souza RM,Achcar JA,Martinez EZ.Use ofbayesian methods for multivariate bioequivalence measures.Journal of biopharmaceutical statistics,2009,19(1):42-66. [5] Ghosh P,Rosner GL.A semi-parametric Bayesian approach to average bioequivalence.Statistics in medicine,2007,26(6):1224-1236. [6] Xu J,Audet C,DiLiberti CE,et al.Optimal adaptive sequential designs for crossover bioequivalence studies.Pharmaceutical statistics,2016,15(1):15-27. [7] 于浩,陳曉媛,柏建嶺,等.腫瘤新藥Ⅱ期臨床試驗(yàn)中的多階段設(shè)計(jì).腫瘤,2008,28(1):68-73. (責(zé)任編輯:鄧 妍)模擬分析
討 論