第四軍醫(yī)大學衛(wèi)生統(tǒng)計學教研室(710032)
胡海霞 王 陵 李嬋娟 夏結(jié)來△
隨著基因組學和分子生物技術(shù)的進步,人們對腫瘤的認識越來越深入,對腫瘤的分類不再局限于組織病理學分型,也開始關注引起腫瘤發(fā)生的基因或分子改變,同時在腫瘤治療方面也開始從傳統(tǒng)的針對腫瘤組織部位的治療模式轉(zhuǎn)向針對腫瘤特異性遺傳變異的治療模式,即靶向治療模式。早在20世紀80年代,全世界范圍內(nèi)就開始研究分子靶向藥物,但很多藥物的臨床試驗遭受了失敗,其原因在于采用傳統(tǒng)的臨床試驗方法進行藥物研發(fā),而沒有在“正確的人群”中進行試驗[1-2],即沒有在有特定靶向分子變異的人群中進行試驗。長春瑞濱與吉非替尼在未經(jīng)選擇的老齡非小細胞肺癌(NSCLC)患者中療效并無差異,而在EGFR FISH陽性的NSCLC患者中,兩者的療效差別有統(tǒng)計學意義,長春瑞濱效果優(yōu)于吉非替尼[3],如果沒有在EGFR FISH陽性的亞人群中進行比較,一個有效藥物很可能就會被埋沒。
隨著新一代測序技術(shù)(next generation sequencing,NGS)的推廣,針對特異性變異進行腫瘤靶向治療的模式越來越成為藥物研發(fā)的熱門方向,對適合靶向藥物研發(fā)的新的臨床試驗設計也顯出了越來越迫切的需求,籃子試驗(basket trial)設計應運而生[4-5]。鑒于國內(nèi)尚無對籃子試驗全面的介紹,本綜述欲從籃子試驗的提出、設計及其目前在抗腫瘤靶向藥物研發(fā)的應用方面進行較詳細的闡述。
由于在同一組織類型的腫瘤中具有某種特異性變異的患者僅占很少一部分,為靶向藥物臨床試驗招募研究對象帶來挑戰(zhàn)[6],而同樣的基因或分子變異可能出現(xiàn)在不同組織類型的腫瘤中,因此籃子試驗將具有同種基因或分子變異的不同腫瘤組織類型的患者全部納入試驗[7],以探索對試驗靶向藥物敏感的腫瘤組織學類型。由于在一個臨床試驗框架下,包括了多種腫瘤類型患者,可以達到多個獨立臨床試驗的目的,因此被形象地稱為“籃子”試驗。其設計示意圖如圖1所示。
據(jù)查閱到的資料顯示,2014年在美國癌癥研究學會(American Association for Cancer Research,AACR)癌癥進展中,籃子試驗作為精準癌醫(yī)學的創(chuàng)新性臨床試驗代表之一,被正式提出。在同年美國臨床腫瘤學會(American Society of Clinical Oncology,ASCO)的會議上,籃子試驗也被多次提到[8]。但籃子試驗思想的應用遠早于其方法的正式提出,2008年伊馬替尼的Ⅱ期開放單臂試驗[9]將所有含酪氨酸激酶相關變異的腫瘤患者全部納入試驗,而不關注其腫瘤的組織學來源,試驗共納入了40種腫瘤類型的患者,對不同腫瘤患者服用伊馬替尼的效果分別進行評價,其設計思想同籃子試驗如出一轍。直到2014年籃子試驗被正式提出后,學術(shù)界對籃子試驗的研究及應用籃子試驗設計的臨床試驗才逐步多了起來。
圖1 籃子試驗設計示意圖
目前根據(jù)藥物的作用機制和腫瘤患者的分子變異選擇情況,有以下幾種類型的籃子試驗[10]:(1)研究一個藥物對同一分子變異的多種腫瘤類型的療效,典型的例子就是威羅菲尼治療含有BRAF V600變異的非黑色素瘤惡性腫瘤的籃子試驗[11]。(2)研究一個藥物對少數(shù)幾種分子變異的多種腫瘤類型的療效,如正在進行的臨床試驗CREATE,研究克唑替尼在含有ALK和/或MET通路變異的多種腫瘤中的療效[12]。(3)研究多個靶向藥物在多種分子變異的多種腫瘤類型中的療效,如正在進行的大型精準醫(yī)學研究MATCH[13]?;@子試驗形式多樣,適用性廣,沒有固定的模式[14],這一特點十分有利于其在靶向治療時代的推廣應用。
傳統(tǒng)的探索性Ⅱ期籃子試驗設計將有相同目標基因異常變異的腫瘤患者按照其腫瘤不同組織部位和分型分為不同的組,根據(jù)不同腫瘤組患者對靶向藥物的反應率(response rate,RR)判斷對藥物敏感的腫瘤組織類型,為以后的驗證性臨床試驗提供依據(jù)[9,15],或?qū)⒒@子試驗思想與Simon最佳兩階段Ⅱ期臨床試驗設計方法[16]相結(jié)合,用最少的樣本量識別對試驗藥物敏感的腫瘤類型[11]。
在Simon最佳兩階段Ⅱ期臨床試驗設計與籃子試驗結(jié)合的基礎上,Kristen Cunanan等人[17]提出將適應性設計和異質(zhì)性檢驗融入籃子試驗的設計方法。即在期中分析時對k個不同腫瘤類型組的反應率進行多組χ2檢驗,計算其同質(zhì)性系數(shù)λ(λ∈(0,1)),λ值大于預設界值時認為組間不同質(zhì),此時分別對每組反應率進行單樣本率檢驗,與終止試驗界值Tsk進行比較,以決定是否終止該組試驗,未終止的試驗組進入第二階段試驗,結(jié)束后再分組分別進行統(tǒng)計分析,做出最后療效的判斷;若其λ值小于預設界值則表示組間同質(zhì),此時將k組合并,進行單樣本率檢驗,與終止試驗界值TC進行比較,若不能終止試驗,則所有組均進入第二階段試驗,結(jié)束后合并分析判斷試驗藥物是否對所有腫瘤組織類型均有效。其流程圖如圖2所示。
圖2 異質(zhì)性檢驗兩階段籃子試驗設計流程圖
這種設計與Simon最佳兩階段設計的籃子試驗相比,當藥物對所有或絕大多數(shù)腫瘤組有效時,可以用較小的樣本量達到較大的檢驗效能,當藥物僅對少數(shù)組織類型的腫瘤有效時,可能會損失一定的檢驗效能,但從總體看,可以節(jié)約樣本量,提高各腫瘤組的檢驗效能,縮短研究時間,是值得嘗試的試驗設計。
Richard Simon[18]提出的貝葉斯籃子試驗設計將貝葉斯思想融入Ⅱ期籃子試驗,試驗設計階段需先確定研究藥物對各個腫瘤組療效的先驗概率Pr[p=x],其中x為k個腫瘤組各自的效應量,僅可取Plo(認為無效的效應量)和Phi(認為有效的效應量)兩個值之一,這兩個值均需根據(jù)臨床專業(yè)知識預先設定,p表示各腫瘤組出現(xiàn)該效應值的概率(p1,p2,…,pk)。此外還需設定組間效應完全關聯(lián)的概率λ和各組均有效的概率γ。根據(jù)試驗期中分析的結(jié)果,計算相應的后驗概率并將計算所得的后驗概率與預先設定的有效終止界值T進行比較,若Pi>T,認為第i腫瘤組有效,終止該組。若Pi<1-T,認為第i組無效,也終止試驗,否則,繼續(xù)進行試驗,直到所有組均被終止或達到預設的最大樣本量N。其流程圖如圖3所示。
圖3 貝葉斯籃子試驗設計流程圖
貝葉斯籃子試驗與傳統(tǒng)探索性籃子試驗相比,不僅在腫瘤組間具有同質(zhì)性時,可以實現(xiàn)組間信息共享,從而減少樣本量,也可以利用試驗設計者或臨床專家的經(jīng)驗估計,以先驗概率的形式體現(xiàn)到試驗中,進一步提高檢驗效能。但兩者均沒有設立對照組,提供的臨床證據(jù)較弱。
籃子試驗同時研究具有相同分子變異的多種腫瘤類型,由于異質(zhì)性的存在,具有相同變異的不同部位的腫瘤對同一靶向藥物的反應不一定相同,而無效腫瘤類型組的存在可能導致整個籃子試驗的失敗,因此籃子試驗目前主要用于探索性試驗[9]和有突破性療效的靶向藥物的驗證性試驗[11,19]。為了克服腫瘤異質(zhì)性的問題,將驗證性籃子試驗推廣應用到所有靶向藥物的Ⅲ期臨床試驗,不同的試驗設計類型相繼被提出。在此主要介紹兩階段適應性設計的驗證性籃子試驗和成組序貫富集設計的驗證性籃子試驗。
2016年,Chen Cong等人[20]提出兩階段適應性設計的驗證性籃子試驗,并研究了其Ⅰ類錯誤控制方法和樣本量計算公式。其思想是k個有相同分子變異的不同組織學類型的腫瘤組分別自設對照,在t點(t表示觀察到的信息在總信息中的比值[21],t點樣本量n=Nt,t∈(0,1))進行期中分析,第一階段試驗結(jié)果(各組標準化計分檢驗統(tǒng)計量Z1i,i=1,2,…,k)顯示試驗藥物對某組織類型的腫瘤很有可能無治療效果(Z1i
圖4 兩階段適應性設計的驗證性籃子試驗流程圖
圖5 成組序貫富集設計的驗證性籃子試驗流程圖
在此基礎上,Beckman[22]提出了k個組共用對照組或采用外部對照的單臂試驗來進一步減少籃子試驗的樣本量。在期中分析時,建議采用結(jié)合外部數(shù)據(jù)來剔除無效組,以減小對合并分析檢驗水準α*的“懲罰”,即采用“Ⅱ期+”方法[23]。在Ⅱ期探索性試驗階段結(jié)束后,對進入驗證性階段的組繼續(xù)隨訪,以獲得其最終結(jié)局數(shù)據(jù),作為兩階段適應性設計的驗證性試驗期中分析剔除無效組的外部數(shù)據(jù)支持。此后,Li Wen 等人[24]提出了兩階段適應性設計籃子試驗最終合并分析治療效應的點估計值計算公式。
籃子試驗中試驗藥物治療無效的腫瘤類型可能會導致整個籃子試驗出現(xiàn)陰性結(jié)果,同理,試驗中治療效果非常好的腫瘤類型可能會導致最終合并分析時高估藥物對其余腫瘤類型的療效。因此,Yuan等人[25]提出了成組序貫富集設計的籃子試驗,主張根據(jù)第一階段試驗結(jié)果同時剔除可能無效腫瘤組和療效非常好的腫瘤組,剩余的組進行合并序貫分析,直到得到有統(tǒng)計學意義的結(jié)果。
以各腫瘤類型組分別自設對照為例,第一階段試驗結(jié)束后,t1點進行期中分析,當腫瘤組標準化計分檢驗統(tǒng)計量小于檢驗下限界值時,接受H10(第一階段原假設),即認為試驗藥物對該腫瘤類型無效(IA={i:Z1i
通過模擬,研究指出最佳t1為0.2~0.5,同時剔除無效腫瘤組和效果很好的腫瘤組相比只剔除無效組可以很好地降低總錯分率(將無效腫瘤組判定為有效或?qū)⒂行[瘤組判定為無效)。兩階段適應性設計和成組序貫富集設計的驗證性籃子試驗都能很好地控制Ⅰ類錯誤,用盡量少的樣本量達到試驗目的。但是兩種方法在設計、操作上相對傳統(tǒng)的平行組設計均較復雜,在實際操作中給臨床試驗者和統(tǒng)計分析人員帶來較大難度。
籃子試驗是為了滿足靶向藥物研發(fā)應運而生的產(chǎn)物,由于其只關注是否有相應的分子變異,而不限制腫瘤組織學來源和分型,為發(fā)病率很低、臨床試驗困難的罕見腫瘤的藥物研發(fā)提供了可能[20];對于藥物研發(fā)企業(yè),籃子試驗用較少的樣本量同時研究一種藥物對多種腫瘤類型的治療效果,可以顯著縮短藥物上市的時間,減少研發(fā)成本;對于FDA、CFDA等藥品審批部門,Ⅱ期籃子試驗結(jié)果可以為其評價申請藥物的療效、安全性提供依據(jù),相信Ⅲ期籃子試驗也將逐漸發(fā)揮其優(yōu)勢性。
但是,籃子試驗作為一個新興的臨床試驗設計方法,在實際操作過程中,仍然有一些局限及需要注意的地方。首先,由于腫瘤自身的異質(zhì)性,同一腫瘤實體內(nèi)部不同部位活檢得到的“驅(qū)動基因”不同,也就可能導致目標變異并不是主要變異的腫瘤被納入到試驗中,降低試驗的檢驗效能。另外,由于基因突變的不穩(wěn)定性,同一腫瘤在接受治療后可能發(fā)生繼發(fā)突變,原先的“乘客基因”變?yōu)椤膀?qū)動基因”[6],或者新的突變使得含有目標變異的腫瘤對相應的靶向治療不再敏感,如含有BRAF V600變異的結(jié)直腸癌由于繼發(fā)組織特異性的EGFR反饋環(huán)路激活導致對威羅菲尼治療不再敏感[26],因此在籃子試驗招募研究對象時,需要對患者腫瘤進行新的活檢檢測,而不能依賴其初次診斷或初次活檢的結(jié)果進行判斷[6]。其次,具有相同分子變異的不同組織部位的腫瘤異質(zhì)性也較大,因此籃子試驗仍然有很大的失敗風險,伊馬替尼Ⅱ期籃子試驗入組40種腫瘤類型的病人,最終只有4種得到FDA的審批[9],因此做好研究腫瘤類型的初篩,盡可能少納入無效腫瘤類型,可以有效提高籃子試驗的成功率,推薦盡可能在傳統(tǒng)試驗已經(jīng)證明有效的靶向藥物和靶點的基礎上開展籃子試驗[22]。在Ⅲ期適應性設計的籃子試驗期中分析時,由于很多生存終點(如總生存率overall survival,OS)需要的隨訪時間長,信息量大,不能很快得出結(jié)論,影響后期患者入組,因此有專家建議期中分析時采用中間終點(如無進展生存期progression-free survival, PFS)來代替最終終點[20,22,24],中間終點即時性好、更靈敏,可以對試驗進行及時調(diào)整[24],但是需要對中間終點和最終終點的關聯(lián)性進行較準確的估計,避免對治療效應點估計的影響。