李戈,楊智榮,趙厚宇,劉志科,宋海波,詹思延,孫鳳
(1.天津中醫(yī)藥大學健康科學與工程學院,天津 301617;2.中國科學院深圳理工大學計算機科學與控制工程學院,深圳 518055;3.英國劍橋大學臨床醫(yī)學院初級醫(yī)療中心,劍橋 CB1 8RN; 4.北京大學公共衛(wèi)生學院流行病與衛(wèi)生統(tǒng)計學系,北京 100191;5.國家藥品監(jiān)督管理局藥品評價中心中藥監(jiān)測和評價部,北京 100022)
藥品/醫(yī)療器械的監(jiān)管覆蓋醫(yī)藥產(chǎn)品從研究開發(fā)開始的全生命周期,是衛(wèi)生管理部門、醫(yī)療機構(gòu)、科研院所、生產(chǎn)銷售企業(yè)和患者等共同關(guān)注的重要話題。在過去的幾十年間,指導(dǎo)衛(wèi)生監(jiān)管決策和臨床指南制定的金標準是隨機對照試驗(randomized controlled trial,RCT)及對既往相關(guān)RCT研究進行的系統(tǒng)評價和Meta分析(systematic review and Meta-analysis,SR/MA),根本原因在于RCT通過隨機化設(shè)置內(nèi)對照的方式可以有效控制基線混雜[1-3]。但是,RCT的研究環(huán)境通常過于理想化,基于RCT研究的證據(jù)效力(efficacy)與實際效果(effectiveness)往往并不相同,有時甚至存在較大差異[4]。此外,RCT研究通常存在多種局限性,例如研究樣本量偏小、隨訪時間較短、研究成本較高、部分研究存在倫理困境而難以實施等[5]。因此,近十幾年,收集/利用真實世界數(shù)據(jù)(real-world data,RWD)開展真實世界研究(real-world study,RWS)產(chǎn)生真實世界證據(jù)(real-world evidence,RWE)的研究方式日益普遍。相比于RCT,RWS人群覆蓋面廣、代表性好、成本低、耗時少且可操作性強,可獲得目標人群應(yīng)用的實際效果和長期安全性證據(jù),其應(yīng)用價值已得到認可[3-7]。
在監(jiān)管決策需求和大數(shù)據(jù)技術(shù)發(fā)展的雙重驅(qū)動下,世界各國衛(wèi)生決策機構(gòu)致力于RWS的方法學研究,以提高RWE的級別[8],為臨床及監(jiān)管決策提供最佳證據(jù)支持[9-10]。2021年4月,我國國家藥品監(jiān)督管理局發(fā)布了《真實世界證據(jù)支持藥物研發(fā)與審評的指導(dǎo)原則(試行)》[11]?;赗WD開展RWS能否產(chǎn)生高質(zhì)量的RWE,取決于研究設(shè)計是否嚴謹以及對偏倚和混雜的控制是否嚴格[12-13]。對比是流行病學研究方法的核心思想之一,通過設(shè)置對照來實現(xiàn),最理想的對比是同質(zhì)的人群在相同時間內(nèi)分別經(jīng)歷暴露和非暴露兩種狀態(tài),不僅可以發(fā)現(xiàn)信號,而且通過模擬反事實場景,增強因果推斷強度。RWD常見于多源異構(gòu)的觀察性數(shù)據(jù),RWS對照設(shè)置的合適與否直接決定了研究質(zhì)量以及RWE的可靠性。
目前,已有學者對基于RWD開展觀察性研究內(nèi)對照選擇方法進行了系統(tǒng)總結(jié)[14-15]。外對照這幾年在RWS中也被廣泛提及,已成為RWS一個重要話題,除了拓展了傳統(tǒng)外對照在觀察性研究中的應(yīng)用場景,在臨床實踐中真實世界外對照試驗(externally controlled trials,ECT)證據(jù)使用頻率也逐漸增加[16]。但迄今為止,筆者尚未見國內(nèi)研究者對RWS的外對照的應(yīng)用進行全面介紹。本文將概述RWS外對照含義、分類、研究設(shè)計、質(zhì)量評估及其應(yīng)用場景。
1.1外對照定義和類別
1.1.1外對照定義 外對照的定義出自隊列研究[17],后來不斷演變,相繼出現(xiàn)過以下稱呼:歷史對照(historical controls)、合成對照(synthetic controls)、自然史對照(natural history controls)、外對比(external comparators)等[18]。隨后拓展至臨床干預(yù)試驗和RWS。外對照是一個相對而非絕對概念,內(nèi)/外對照邊界是一個灰色交叉區(qū)間,需回到流行病學三間分布的理念,取決于對比組間研究對象在時間、空間及人群間的相似性。
RCT可以設(shè)置安慰藥對照、陽性對照、不同劑量對照以及空白對照,與試驗組來自同一目標總體,同期接受干預(yù),屬于內(nèi)對照。當RCT的內(nèi)對照研究人數(shù)不足或者缺乏時,如單臂研究(single-arm trial,SAT),可以從其他試驗或歷史病例中找一組特征相似的研究對象,即在該研究之外合成一個接受不同干預(yù)措施的對比組,即為外對照[19-21]。補充設(shè)置外對照的臨床研究,是一種RCT-RWS混合研究類型。
1.1.2外對照構(gòu)建方式 對于RWS,根據(jù)研究型數(shù)據(jù)庫和研究問題選擇適合的研究設(shè)計,如隊列研究、病例-對照研究、巢式病例-對照研究、自身前后對照研究等[22]。隨著多中心隊列聯(lián)盟構(gòu)建,按照研究框架區(qū)分內(nèi)、外對照并不適合。因此,在應(yīng)用RWD進行RWS設(shè)計時,需要根據(jù)對照組與暴露組的特征分布一致性確定是否設(shè)置外對照。當內(nèi)對照研究人數(shù)不充足時,可依據(jù)暴露組的特征合成一個特征相似的外對照作為補充或者替換內(nèi)對照,這些特征包括社會人口學信息、臨床特征、保險狀態(tài)、就醫(yī)偏好,以及有關(guān)地理、風俗、制度等方面的特征。外對照人群可以來自既往已完成的RCT(歷史外對照),也可以來源于RWD(可以是歷史/平行同期的,也可以是回顧性/前瞻性的),因此根據(jù)外對照與暴露組在時間軸上的關(guān)系,可以構(gòu)建5種外對照,見圖1[3,23]。此外,外對照也可以源自不同于原始研究的地域(如多中心平行對照)或人群(如不同的源人群)[18,23]。
注:用5種顏色區(qū)分5種構(gòu)建方式,其中實線為暴露組,虛線為外對照。圖1 基于RWD構(gòu)建外對照的5種方式Note:Five colors were used to distinguish five kinds of construction methods,where solid line represents exposure group,and dashed line represents the external control.Fig.1 Five ways to construct external control based on RWD
1.1.3設(shè)置外對照的研究類型 利用RWD構(gòu)建外對照時,首先需要尋找與研究問題匹配的數(shù)據(jù)庫,并評估其適用性,確定目標人群的代表性、干預(yù)信息和重要混雜因素記錄的全面性及結(jié)局指標的準確性[22]。然后以傳統(tǒng)的RCT設(shè)計為基準,根據(jù)場景和研究問題利用RWD形成外對照,可以考慮的研究設(shè)計有多種組合:當RCT內(nèi)對照樣本量不充足時,在RWD中匹配合適數(shù)量的外對照;當RCT內(nèi)對照樣本量充足時,在RWD中匹配外對照,增強了研究外推性;對于單臂研究,利用RWD匹配外對照,稱為補充單臂研究結(jié)果的解釋性增強;對于單臂研究,利用RWD或其他臨床試驗合成標準治療(standard of care,SOC)效果作為外對照,而不用個體數(shù)據(jù)(individual patient data,IPD)直接比較;在隊列研究之外為暴露組尋找非暴露組;利用RWD構(gòu)成兩個觀察干預(yù)組,比較實際的干預(yù)效果(effectiveness)[18,24]。
1.2偏倚風險控制及外對照質(zhì)量評估
1.2.1外對照研究的偏倚風險控制 為了提高單臂研究和RWS因果推斷真實性,強化證據(jù)的可信度,必須充分了解ECT的偏倚,并在研究設(shè)計階段減少潛在的偏倚風險[7,22]。流行病學研究中常見偏倚控制措施適用于ECT,常見的偏倚及控制策略有[22]:①選擇偏倚,使用客觀指標作為納入/排除標準,如疾病診斷編碼、金標準檢查結(jié)果及處方藥品構(gòu)建算法定義研究對象。②混雜偏倚,按照試驗組的基本特征合成外對照,如年齡、性別構(gòu)成、臨床分期及合并癥等,但是當基線信息不足或者缺失,則無法預(yù)測和控制殘余混雜。③信息偏倚,試驗組與外對照的暴露、結(jié)局和協(xié)變量的確定和設(shè)置盡可能一致,測量方法和標準一致,對于縱向研究,組間測量時間間隔一致;定義標準并驗證算法,控制處方信息與患者實際用藥不符可能產(chǎn)生的錯分偏倚。另外,外對照與研究觀察組的數(shù)據(jù)集信息缺失程度、類別不一致,填補數(shù)據(jù)或者剔除數(shù)據(jù)都有可能增加額外偏倚[25]。
1.2.2外對照研究的質(zhì)量評估 外對照質(zhì)量評價標準見表1[23],高質(zhì)量的外對照特征與試驗組具有“互換性(exchangeability)”,即受試對象基本特征和結(jié)局指標定義測量高度一致,無明顯偏倚,而且充分考慮了協(xié)變量。為此盡可能利用實施完好的RCT試驗組,并通過合適的統(tǒng)計方法確定臨床特征、場景設(shè)定、人口學分布與當前試驗組的可比性可靠有效。
表1 外對照質(zhì)量評價清單Tab.1 Quality evaluation list of external control
1.3外對照研究統(tǒng)計分析與報告 在進行外對照研究統(tǒng)計分析時,可參考中國真實世界數(shù)據(jù)與研究聯(lián)盟(ChinaREAL)制定的規(guī)范,如預(yù)先制定研究統(tǒng)計分析計劃(statistical analysis plan,SAP),根據(jù)臨床意義預(yù)先設(shè)定效應(yīng)值,計算樣本量,評估和控制偏倚的策略,制定缺失數(shù)據(jù)處理、調(diào)整混雜及敏感性分析的方案等[26]。但是外對照研究統(tǒng)計分析有些特殊性,如貝葉斯模型由基于現(xiàn)有知識的先驗分布,基于當前試驗數(shù)據(jù)的似然分布和更新信息的后驗分布構(gòu)成[18],適合補充了外對照的RCT研究。
1.3.1合成外對照的統(tǒng)計方法 盡管可以直接從外部研究或RWD中收集IPD作外對照,從而在研究內(nèi)降低使用或者不設(shè)內(nèi)對照。但是,由于存在患者特征差異和混雜因素,直接利用IPD或許過于簡單。嚴格使用傾向性評分匹配和Meta分析設(shè)置外對照更可靠和有效[27]。
利用傾向性評分設(shè)置外對照,不僅適用于觀察性研究,也適用于SAT和補充外對照的RCT,最終目的是降低混雜影響,使得對比組間具有互換性[18],從而增強研究的因果推斷能力。
利用隨機效應(yīng)模型的Meta分析獲得外對照的預(yù)測值,根據(jù)數(shù)據(jù)源的類型,可用的方法有:根據(jù)基線調(diào)整協(xié)變量的Meta回歸、多種干預(yù)比較的網(wǎng)狀Meta分析、多結(jié)局變量的多元Meta分析等。該方法考慮了試驗間的異質(zhì)性及不同試驗?zāi)繕巳巳旱漠愘|(zhì)性[27]。數(shù)據(jù)源可以來自多個歷史RCTs的相同安慰藥/干預(yù)組的IPD,也可以整合既往發(fā)表文獻數(shù)據(jù)。目前該方法多用于公開的臨床試驗數(shù)據(jù),亦可嘗試應(yīng)用RWD。
1.3.2外對照研究報告規(guī)范 大部分設(shè)置外對照的研究是RWS,可依據(jù)觀察性研究報告規(guī)范STROBE(The STrengthening the Reporting of Observational Studies in Epidemiology)拓展而來的RECORD(The REporting of studies Conducted using Observational Routinely-collected health Data)[28-29]和事先擬定的SAP撰寫研究報告。特別需要注意報告[22,26]:①數(shù)據(jù)來源和篩選流程。②偏倚評估和處理缺失數(shù)據(jù)方法。③外對照合成的統(tǒng)計方法及理由。④外對照與觀察組比較的統(tǒng)計分析方法選擇及其理由。⑤結(jié)果部分詳細描述基線特征,及各個結(jié)局事件的統(tǒng)計描述和假設(shè)檢驗結(jié)果;主要結(jié)局的敏感性分析結(jié)果。
1.4外對照研究倫理 許多外對照研究設(shè)計通常是在RCT存在倫理問題時的備選方案,因此在倫理問題上外對照研究比傳統(tǒng)RCT更有優(yōu)勢。另外,在利用RWD合成外對照進行RWS時,外對照研究倫理規(guī)范與內(nèi)對照相同,但是因為涉及的人群范圍更大,所以在共享研究需要特別注意確保信息安全。
1.5真實世界研究外對照應(yīng)用實例和場景
1.5.1醫(yī)療實踐中發(fā)生率低的病種 日常診療中的罕見病,病例過少無法實施RCT,通常進行單臂試驗。隨著精準醫(yī)學興起,根據(jù)基因構(gòu)成對很多疾病進行了更細致的亞型劃分,例如非小細胞肺癌(non-small cell lung carcinoma,NSCLC)的表皮生長因子受體(EGFR)突變亞型[23]。復(fù)發(fā)、難治重癥研究困境與之相似。通過合理設(shè)置外對照可以更好地解釋試驗結(jié)果,彌合證據(jù)裂痕,增加獲得審批的概率。截至2019年12月,以單臂試驗證據(jù)提交世界衛(wèi)生組織衛(wèi)生技術(shù)評估(Health Technology Assessment,HTA)審批的項目逐年增加,疾病譜廣泛,以腫瘤、代謝、血液/免疫、感染性疾病為主[16]。案例1:阿維魯單抗(avelumab,商品名 Bavencio),簡稱B藥,基于一項開放標簽、單組、全球多中心Ⅱ臨床試驗(JAVELIN Merkel 200),與同期外對照(以美國和歐洲的平行病例回顧為基線數(shù)據(jù))比較后,2017年獲美國食品藥品管理局(FDA)和EMA批準用于治療罕見且預(yù)后極差的Merkel細胞癌[3];基于歷史外對照(基于電子醫(yī)療數(shù)據(jù)庫和德國腫瘤登記共同構(gòu)建的自然史隊列),2021年5月7日,F(xiàn)DA批準B藥增加適應(yīng)證:用于治療晚期腎細胞癌和擴散的尿路上皮癌[24]。案例2:博納吐單抗(blinatumomab,商品名BLINCYTO),根據(jù)一項多中心單臂臨床試驗與注冊病例形成的歷史外對照比較結(jié)果,2014年獲FDA批準上市,用于治療急性淋巴細胞白血病(acute lymphoblastic leukemia,ALL) 的一個亞型[Ph-陰性 B-前體(R/R) ALL][19]。
1.5.2單臂研究 醫(yī)療器械是多學科技術(shù)與現(xiàn)代醫(yī)學交叉融合的產(chǎn)物,被應(yīng)用在疾病的預(yù)防、診斷、治療、監(jiān)護、康復(fù)等領(lǐng)域,其監(jiān)管評估涵蓋上市前后的整個生命周期[30]。由于倫理學和可行性限制,對Ⅲ類高風險產(chǎn)品無法實施RCT進行評估[30]。美國FDA支持主動監(jiān)測,并逐漸構(gòu)建起醫(yī)療器械生產(chǎn)方、衛(wèi)生技術(shù)評估監(jiān)管方、醫(yī)療服務(wù)方和健康支付方合作體系[31]。常規(guī)收集和分析上市后臨床實踐數(shù)據(jù)和患者體檢數(shù)據(jù),通過利用歷史或同期外對照,產(chǎn)生了諸多安全性/有效性的RWE,進而改善醫(yī)藥產(chǎn)品和技術(shù)的局限性、擴大適應(yīng)證,成為監(jiān)管機構(gòu)審批醫(yī)藥產(chǎn)品和證據(jù)體重新分級的依據(jù)[31]。外科手術(shù)具有侵入性、復(fù)雜性、個體化、高度依賴操作者技能等特點,2009年,IDEAL(The Idea,Development,Exploration,Assessment,and Long-term Follow-up)協(xié)作網(wǎng)正式提出了IDEAL框架與建議,該框架將外科干預(yù)的評價路徑分成5個階段,其中第3階段評價,以當前標準治療為外對照,評估外科創(chuàng)新療效及安全性[32]。即使倫理和可行性都滿足,在RCT完成后,可將安慰藥或SOC對照病例納入到試驗組,繼續(xù)拓展試驗,通過合理設(shè)置外對照獲得長期有效性或安全性結(jié)局證據(jù)。同理,可以設(shè)置外對照完善藥物上市后安全性試驗,并提供附加結(jié)局及終點結(jié)局等方面證據(jù),為監(jiān)管決策在人群外推、擴大適應(yīng)證、合并用藥等方面提供決策依據(jù)[18]。
1.5.3其他潛在場景 開展藥物/醫(yī)療器械經(jīng)濟學RWS,除了可以提供成本和健康相關(guān)證據(jù),有助于合理配置有限的醫(yī)療資源[33],還能同時了解實際醫(yī)療環(huán)境中醫(yī)生和患者的醫(yī)療行為,如可以設(shè)置不同時期的歷史外對照,了解變化和趨勢。結(jié)合RWS中醫(yī)藥研究場景可以有以下幾個方面:評價中醫(yī)藥安全性、發(fā)現(xiàn)規(guī)律提出假說、明確非藥物療法臨床價值和適應(yīng)證、評估疾病預(yù)防技術(shù)、評價中西藥物合并用藥[34]。如中醫(yī)藥的安全性問題,可以在大的隊列聯(lián)盟里找到試驗組和平行外對照,長期監(jiān)測相關(guān)結(jié)局。在預(yù)防慢性病的非免疫規(guī)劃疫苗方面,我國尚有較大發(fā)展空間,如HPV疫苗[35]。安全性是疫苗研發(fā)和推廣的根基和保障[36],為此,疫苗的安全信號監(jiān)測一直以來都是重要話題?;赗WS監(jiān)測數(shù)據(jù),通過歷史外對照或者前瞻性平行外對照,可以估計出各種不良反應(yīng)(adverse drug reaction,ADR)的發(fā)生風險,也可以評估疫苗獲益,有助于疫苗推廣及良性有序發(fā)展,提高一級預(yù)防證據(jù)質(zhì)量,促進人群健康[27]。在這些研究中合理設(shè)置外對照,可以回答非常廣泛的實際問題。
RWD和RWS如何為藥械監(jiān)管、醫(yī)保決策、醫(yī)療健康管理等衛(wèi)生領(lǐng)域的循證監(jiān)管決策提供有力證據(jù)成為重要話題。由于倫理、可行性及過于嚴格的納入/排除標準,RCT不足以回答所有臨床問題,RWE作為補充和替代方案在一些領(lǐng)域的循證監(jiān)管決策中受到重視。相信未來我國生物醫(yī)學領(lǐng)域RWS數(shù)量和質(zhì)量都會有重要突破,為臨床決策和藥械監(jiān)管提供更廣泛、更可靠的證據(jù),在這個過程中依據(jù)流行病學的原理方法恰當選擇外對照是解決問題的技術(shù)之一。當評估藥物/醫(yī)療器械存在倫理問題,或者對其進行適用人群拓展、超說明書使用或者長期使用的有效性和安全性評價時,可以考慮設(shè)置外對照,同時注意選擇合適的外對照形式,提高外對照質(zhì)量,控制研究偏倚,保證研究結(jié)果的真實性和可靠性。