劉東來
中國食品藥品檢定研究院
王佑春
中國食品藥品檢定研究院
許四宏*
中國食品藥品檢定研究院
真實世界研究是圍繞相關(guān)科學(xué)問題,綜合運(yùn)用流行病學(xué)、生物統(tǒng)計學(xué)、循證醫(yī)學(xué)等多學(xué)科方法技術(shù),利用真實世界數(shù)據(jù)開展的研究,相比于傳統(tǒng)臨床試驗,對納入患者病情限定更少、覆蓋人群更廣、樣本量可能較大、研究結(jié)果的外推性可能較好。近年來,真實世界研究產(chǎn)生的真實世界證據(jù),作為直接或輔助的臨床證據(jù),用于支持藥品和醫(yī)療器械的監(jiān)管決策,成為醫(yī)療衛(wèi)生領(lǐng)域的熱點話題。真實世界證據(jù)在體外診斷試劑(in vitro diagnostic,IVD)臨床評價和監(jiān)管中的應(yīng)用,在行業(yè)廣泛、積極的探索下,也展現(xiàn)出了巨大的潛力。
真實世界證據(jù)來源于真實世界數(shù)據(jù),真實世界數(shù)據(jù)是指傳統(tǒng)臨床試驗以外的,從多種來源收集的各種與患者健康狀況和(或)常規(guī)診療及保健有關(guān)的數(shù)據(jù)[1]。相較于傳統(tǒng)臨床試驗,真實世界數(shù)據(jù)具有來源廣泛、患者多樣性和還原真實應(yīng)用場景等特點。真實世界研究由于其特性,常常回答的是與臨床試驗所不同的臨床問題。如何更好地挖掘真實世界數(shù)據(jù)的價值,在遵循倫理原則、符合法規(guī)要求的基礎(chǔ)上,探索真實世界研究的方法、應(yīng)用和邊界,是監(jiān)管機(jī)構(gòu)、研究者和醫(yī)藥企業(yè)等各方共同關(guān)注的焦點。
國內(nèi)外監(jiān)管機(jī)構(gòu)陸續(xù)出臺了多個法規(guī)和指導(dǎo)原則,對真實世界數(shù)據(jù)的研究加以引導(dǎo)和規(guī)范。以下簡單梳理國家藥品監(jiān)督管理局(National Medical Products Administration,NMPA) 出臺的相關(guān)法規(guī)。在藥品審評方面,2020年1月,NMPA 發(fā)布《真實世界證據(jù)支持藥物研發(fā)與審評的指導(dǎo)原則(試行)》,梳理了利用真實世界證據(jù)支持藥物研發(fā)和評價的基本原則和研究方法[2]。2020年8月,NMPA 發(fā)布《真實世界研究支持兒童藥物研發(fā)與審評的技術(shù)指導(dǎo)原則(試行)》,著重介紹了真實世界研究應(yīng)用于兒童藥物研發(fā)這一特定應(yīng)用上的關(guān)注點[3]。2021年4月,國家藥品監(jiān)督管理局藥品審評中心發(fā)布《用于產(chǎn)生真實世界證據(jù)的真實世界數(shù)據(jù)指導(dǎo)原則(試行)》,關(guān)注真實世界研究的根本(即真實世界數(shù)據(jù)),并從多個方面對真實世界數(shù)據(jù)給出了具體要求和指導(dǎo)性建議,以幫助申辦者更好地進(jìn)行數(shù)據(jù)治理,評估真實世界數(shù)據(jù)的適用性[4]。
在醫(yī)療器械審評方面,2020年11月,NMPA 發(fā)布《真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價技術(shù)指導(dǎo)原則(試行)》[1],強(qiáng)調(diào)了應(yīng)在遵循相關(guān)法規(guī)的前提下使用指導(dǎo)原則,詳細(xì)介紹了真實世界數(shù)據(jù)的來源和質(zhì)量評價、真實世界研究的設(shè)計常見類型和統(tǒng)計分析方法,同時列出了將真實世界證據(jù)用于醫(yī)療器械臨床評價的11種常見情形,包括用于支持產(chǎn)品注冊,作為已有證據(jù)的補(bǔ)充;支持適用范圍、適應(yīng)癥、禁忌癥的修改;支持附帶條件批準(zhǔn)產(chǎn)品的上市后研究;作為單組試驗的外部對照等。
我國監(jiān)管部門也在不斷探索將真實世界證據(jù)應(yīng)用于審批實踐。2018年10月,國家藥品監(jiān)督管理局藥品審評中心基于3家醫(yī)院患者的回顧性數(shù)據(jù)研究獲得真實世界證據(jù),擴(kuò)大了貝伐珠單抗的適應(yīng)癥[5]。2020年3月,NMPA 批準(zhǔn)了一款“青光眼引流管”產(chǎn)品的注冊。該產(chǎn)品在注冊中使用了在海南博鰲樂城國際醫(yī)療旅游先行區(qū)收集的臨床真實世界證據(jù)進(jìn)行人種差異評價,成為國內(nèi)首個使用境內(nèi)真實世界數(shù)據(jù)的醫(yī)療器械產(chǎn)品[6]。另有多個藥物和器械進(jìn)入海南臨床真實世界數(shù)據(jù)應(yīng)用試點[7]。海南的試點工作屬于《真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價技術(shù)指導(dǎo)原則(試行)》明確的真實世界證據(jù)用于醫(yī)療器械臨床評價的常見情形之一,即臨床急需進(jìn)口器械在國內(nèi)特許使用中產(chǎn)生的真實世界數(shù)據(jù),可用于支持產(chǎn)品注冊,作為已有證據(jù)的補(bǔ)充。
在法規(guī)引領(lǐng)和相關(guān)案例的啟示下,圍繞藥品和醫(yī)療器械真實世界研究方法和應(yīng)用的探索方興未艾,而真實世界數(shù)據(jù)在體外診斷試劑監(jiān)管領(lǐng)域的應(yīng)用和探索卻未受到充分關(guān)注。雖然《真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價技術(shù)指導(dǎo)原則(試行)》中明確醫(yī)療器械包括體外診斷試劑,但由于體外診斷試劑臨床試驗要求的特殊性,如何開展與之相適應(yīng)的真實世界研究仍有待進(jìn)一步探索。
探索真實世界研究在體外診斷試劑領(lǐng)域的應(yīng)用潛力和價值,需要先考察體外診斷試劑傳統(tǒng)臨床試驗的研究方法。通常情況下,體外診斷試劑臨床試驗采用試驗體外診斷試劑與臨床參考標(biāo)準(zhǔn)(或已上市同類產(chǎn)品)進(jìn)行比較研究的方法,以直接(或間接)評價試驗體外診斷試劑的臨床靈敏度和臨床特異度,從而證明其臨床性能滿足預(yù)期用途的要求。臨床試驗受試者應(yīng)來自產(chǎn)品預(yù)期用途所聲稱的適用人群(目標(biāo)人群),如具有某種癥狀、體征、生理、病理狀態(tài)或某種流行病學(xué)背景等情況的人[8]。
《體外診斷試劑臨床試驗技術(shù)指導(dǎo)原則》建議,體外診斷試劑的臨床試驗受試人群應(yīng)能夠代表目標(biāo)人群的特征,包括人口學(xué)特征(性別、年齡)、癥狀、體征、合并癥以及疾病的階段、部位和嚴(yán)重程度等;同時受試者應(yīng)排除不適合該臨床試驗的生理或病理特征[8]。
如受試者樣本的收集是基于其他臨床研究的受試者選擇要求,或并未依據(jù)任何臨床研究的規(guī)定,則該類樣本對于本次臨床試驗為既往樣本。對于罕見遺傳病、罕見腫瘤基因突變和一些低發(fā)病率的病原體感染等體外診斷試劑而言,使用既往樣本可以有效地拓寬臨床研究的路徑、提高實操的可行性。通過前瞻途徑尋找罕見陽性病例樣本往往耗時漫長、成功率低,回顧性地收集既往罕見陽性病例樣本可以有效地解決靈敏度性能評價的問題。既往樣本的問題在于,其受試者入排標(biāo)準(zhǔn)和樣本采集、處理過程都不是針對臨床目的而預(yù)先規(guī)定,因而可能存在異質(zhì)性和偏倚?!扼w外診斷試劑臨床試驗技術(shù)指導(dǎo)原則》對于既往樣本的使用,有較為明確的提示:特定情況下,申辦者可考慮納入,但需格外注意充分論證可能的選擇偏倚等問題。
回歸到真實世界數(shù)據(jù)的定義,真實世界數(shù)據(jù)是傳統(tǒng)臨床試驗以外的,從多種來源收集的各種與患者健康狀況和(或)常規(guī)診療及保健有關(guān)的數(shù)據(jù)[1]。真實世界數(shù)據(jù)和既往樣本有著相通之處,可以說,既往樣本的信息即屬于一類特殊的真實世界數(shù)據(jù)。使用既往樣本須符合《醫(yī)療器械臨床試驗質(zhì)量管理規(guī)范》《體外診斷試劑臨床試驗技術(shù)指導(dǎo)原則》等法規(guī)規(guī)定及相關(guān)產(chǎn)品技術(shù)審查指導(dǎo)原則的要求,以合法性為前提。此外,對真實世界研究而言,真實世界數(shù)據(jù)的相關(guān)性和可靠性是前提條件。只有明確與研究目的相關(guān)的臨床問題,預(yù)先制定好數(shù)據(jù)采集方案,才能夠得到高質(zhì)量的真實世界數(shù)據(jù),準(zhǔn)確、充分地回答臨床問題。因此,既往樣本的選擇和使用,都需要圍繞臨床問題展開,并預(yù)先確定樣本選取范圍、規(guī)定樣本采集流程和數(shù)據(jù)分析方法,以保證數(shù)據(jù)的真實性、完整性,控制相關(guān)偏倚。
根據(jù)在臨床試驗過程中是否依據(jù)試驗體外診斷試劑檢測結(jié)果對受試者加以干預(yù),可以將體外診斷臨床試驗大致劃分為2 種類型:干預(yù)性研究和觀察性研究。
干預(yù)性研究中,研究者會在試驗體外診斷試劑檢測結(jié)果的基礎(chǔ)上,對患者進(jìn)行對應(yīng)的治療干預(yù)或疾病管理,通過評價治療效果或患者受益,為支持體外診斷試劑安全有效性的判定提供證據(jù)。這種研究設(shè)計往往花費(fèi)和工作量較大、周期較長,通過臨床試驗的方式去開展的可行性較低。
觀察性研究中,試驗體外診斷試劑的檢測結(jié)果不用于患者的管理,不影響臨床決策。臨床試驗中通過評價該檢測結(jié)果與受試者臨床參考標(biāo)準(zhǔn)(或已上市同類產(chǎn)品)判定結(jié)果的一致性,確認(rèn)產(chǎn)品臨床性能。臨床性能研究需要獲得2 個關(guān)鍵信息:一是試驗體外診斷試劑的檢測結(jié)果,此時可能需要受試者在臨床常規(guī)診療外提供額外的樣本以完成檢測;二是受試者的目標(biāo)狀態(tài),此時可能需要讓受試者接受臨床參考標(biāo)準(zhǔn)的檢查(或比對體外診斷試劑的檢測)。根據(jù)以上信息的獲取方式不同,觀察性研究又可大致分為2 種設(shè)計類型[9]。
第一種為前瞻性研究。此時研究者將會對受試者的樣本采集和(或)疾病診斷流程進(jìn)行干預(yù)。也就是說,受試者可能需要專門為臨床試驗進(jìn)行樣本采集和(或)專門為臨床試驗而做臨床參考標(biāo)準(zhǔn)的確認(rèn)檢查。這也是體外診斷試劑臨床試驗最常見的一種情形。前瞻性研究存在的問題包括罕見病例的收集困難、臨床參考標(biāo)準(zhǔn)的依從性差或隨訪周期長等。第二種為回顧性研究。這種類型的研究不會對受試者做任何干預(yù),包括樣本采集和受試者目標(biāo)狀態(tài)的確認(rèn),即在符合倫理要求的前提下,直接使用受試者的剩余樣本和疾病診斷結(jié)果(或比對試劑檢測結(jié)果)?;仡櫺匝芯渴褂玫募礊榧韧鶚颖?,一定程度上屬于真實世界研究的范疇。
干預(yù)性研究和部分的前瞻性研究,由于臨床試驗的執(zhí)行難度高、投入大、周期長,使申辦者不得不權(quán)衡其中的風(fēng)險而不敢輕易投入,從而造成了某些創(chuàng)新和臨床急需產(chǎn)品延遲上市。當(dāng)采取一定研究設(shè)計和統(tǒng)計分析方法,從原本可能存在偏倚和缺陷的真實世界數(shù)據(jù)中提煉出有效科學(xué)證據(jù)時,真實世界研究就為這些創(chuàng)新和臨床急需產(chǎn)品提供了一個補(bǔ)充證據(jù)的途徑。美國食品藥品監(jiān)督管理局(Food and Drug Administration,F(xiàn)DA)依據(jù)真實世界證據(jù),已經(jīng)批準(zhǔn)多個體外診斷試劑產(chǎn)品[10]。
FDA 于2014年批準(zhǔn)EnLite Neonatal TREC Kit 上市。 該產(chǎn)品使用干血斑標(biāo)本,半定量檢測T 細(xì)胞受體重排刪除環(huán)DNA(T-cell receptor excision circle,TREC), 用于新生兒嚴(yán)重聯(lián)合免疫缺陷?。╯evere combined immunodeficiency,SCID)的篩查。TREC 是T 細(xì)胞在胸腺發(fā)育過程中形成的DNA環(huán),反映T 細(xì)胞的胸腺輸出功能,SCID 患兒TREC 水平顯著降低[11]。SCID 患兒若沒有及時干預(yù)治療并重建免疫系統(tǒng),將在1年內(nèi)由于感染而死亡;若能早期發(fā)現(xiàn)并對患兒進(jìn)行及時干預(yù),可以顯著改善患兒預(yù)后[12]。SCID在美國的發(fā)病率為 1/58 000(95%CI:1/80 000~1/46 000)活產(chǎn)嬰兒,我國也將此疾病列入《罕見病診療指南(2019年版)》[12]。由于發(fā)病率低,EnLite Neonatal TREC Kit 通過真實世界研究開展有效性評價,并作為關(guān)鍵證據(jù)支持FDA 上市批準(zhǔn)。該研究的信息摘要簡述如下[11]。
3.1.1 研究類型
觀察性研究,與真實世界醫(yī)療記錄隨訪的臨床結(jié)局比較,評價考核試劑的靈敏度、特異度。
3.1.2 開展地點
丹麥?zhǔn)诽诡D血清研究所(Statens Serum Institute,SSI)。
3.1.3 樣本來源
新生兒篩查樣本來源于丹麥生物樣本庫;同時回顧性納入來自美國的17 例陽性樣本。
3.1.4 臨床結(jié)局獲取
通過丹麥醫(yī)療記錄進(jìn)行12~17 個月的隨訪。
3.1.5 研究結(jié)果和統(tǒng)計分析
入排情況:2012年6月26日~2012年8月6日期間,SSI生物樣本庫按順序接收的樣本6389 例,全部納入研究。排除42 例:取樣時間超期29 例,質(zhì)量不合格樣本1 例,無法通過醫(yī)療記錄獲取隨訪數(shù)據(jù)1 例,重復(fù)性樣本2 例,偏離試驗標(biāo)準(zhǔn)操作流程9 例。剩余6347 例樣本按照試劑盒標(biāo)準(zhǔn)操作流程完成檢測。
隨訪情況:6347 例樣本全部為SCID 陰性。通過疫苗接種和醫(yī)院醫(yī)療記錄確認(rèn)5437 例,剩余910例通過其他登記系統(tǒng)數(shù)據(jù)確認(rèn)。
靈敏度:來源于美國的17例陽性樣本,考核試劑檢測結(jié)果無效1 例( 內(nèi)標(biāo)擴(kuò)增不合格),陽性結(jié)果16 例,靈敏度為100%(16/16,95%CI :79.4%~100%)。
特異度:通過疫苗接種和醫(yī)院醫(yī)療記錄確認(rèn)的5437 例陰性樣本,考核試劑檢測結(jié)果無效11 例,陽性結(jié)果16 例,特異度99.7%(5410/5426,95%CI:99.4%~99.8%)。另一真實世界數(shù)據(jù)確認(rèn)的910 例陰性樣本,特異度99.5%。
3.1.6 真實世界研究特點
新生兒罕見病篩查、生物樣本庫、真實世界隨訪,尤其是真實世界中生物樣本庫和醫(yī)療記錄信息關(guān)聯(lián)性好,數(shù)據(jù)質(zhì)量高,僅有1 例樣本無法通過醫(yī)療記錄隨訪到結(jié)果。整體研究偏倚?。禾囟〞r間段內(nèi)接收的全部樣本,避免了選擇偏倚;排除樣本量只有42 例(0.66%);考核試劑檢測失敗率低(0.2%)。
FDA 于2017年 批 準(zhǔn)SEEKER 系統(tǒng)(儀器+ 試劑)上市。該產(chǎn)品使用干血斑標(biāo)本,定量檢測表1中的4 種酶活性,用于4 種溶酶體貯積癥的新生兒篩查[13]。
表1 SEEKER 系統(tǒng)檢測的4 種酶活性及對應(yīng)疾病、發(fā)病率[13]
SEEKER 系統(tǒng)的有效性驗證完全依托真實世界篩查過程開展,屬于真實世界研究設(shè)計類型之一的實用性臨床試驗。研究信息摘要簡述如下。
3.2.1 研究類型
干預(yù)性研究,嵌入真實世界的新生兒篩查流程,與真實世界篩查所得到的臨床結(jié)局進(jìn)行比較,評價考核產(chǎn)品的靈敏度、特異度,同時獲得考核產(chǎn)品真實世界場景應(yīng)用的魯棒性,以及4 種疾病的發(fā)病率。
3.2.2 開展地點
密蘇里州公共衛(wèi)生實驗室(Missouri State Public Health Laboratory,MSPHL)。
3.2.3 樣本來源
嵌入MSPHL 的常規(guī)篩查程序,所有收到的新生兒篩查樣本。
3.2.4 臨床結(jié)局獲取
首次檢測結(jié)果為陽性的,應(yīng)按篩查流程復(fù)測并進(jìn)行相應(yīng)風(fēng)險評估。綜合判定為篩查陽性的轉(zhuǎn)入后續(xù)確診程序,獲得確診和排除結(jié)果;綜合判定為篩查陰性的進(jìn)入隨訪。
首次檢測結(jié)果為陰性的,判定為篩查陰性,進(jìn)入隨訪。
隨訪依托密蘇里州衛(wèi)生和高級服務(wù)部門(Missouri Department of Health and Senior Services,MDHSS)的主動監(jiān)測項目開展,跟蹤假陰性報告,隨訪時間15 個月。
3.2.5 研究結(jié)果和統(tǒng)計分析
樣本量:預(yù)試驗階段(初始6 個月)入組48 813 名新生兒的干血斑標(biāo)本,對產(chǎn)品進(jìn)行了改良。關(guān)鍵性試驗階段(后續(xù)18 個月)入組105 599 名新生兒的干血斑標(biāo)本,其中510 名因樣本不合格或檢測無效予以剔除,剩余105 089 名。
隨訪情況:根據(jù)MDHSS 的主動監(jiān)測項目,研究期間未有假陰性報告。
靈敏度和特異度:關(guān)鍵性試驗中SEEKER 系統(tǒng)篩查陽性結(jié)果329 例,經(jīng)風(fēng)險評估后136 例轉(zhuǎn)入確診程序,其中7 例脫落,剩余得到37 例臨床真陽性,具體結(jié)果見表2。隨訪期間未有假陰性報告,故考核試劑盒靈敏度100%;4 種檢測物的特異度在99.903%~99.965%。
表2 真實世界數(shù)據(jù)用于新生兒溶酶體貯積癥的篩查分析[13]
4 種新生兒溶酶體貯積癥的發(fā)病率:合并初始6 個月的數(shù)據(jù),24 個月內(nèi)SEEKER 系統(tǒng)篩查后共確診73 個患者,對應(yīng)4 種疾病的數(shù)量和發(fā)病率分析見表3。
表3 真實世界數(shù)據(jù)用于新生兒溶酶體貯積癥的發(fā)病率分析[13]
3.2.6 真實世界研究特點
實用性臨床試驗,完全依托真實世界新生兒篩查流程開展,兼具臨床試驗和真實世界研究的要素。研究不另行設(shè)置入組標(biāo)準(zhǔn),入組的受試者即為研究期間密蘇里州所有接受篩查的新生兒,目標(biāo)人群的代表性強(qiáng)。研究對篩查陽性的受試者進(jìn)行了干預(yù),這部分新生兒樣本將被送去第三方實驗室做確認(rèn)檢測,并按照確認(rèn)檢測結(jié)果判定臨床結(jié)局。對于篩查陰性的新生兒,研究則利用MDHSS 的公共衛(wèi)生監(jiān)測數(shù)據(jù)來關(guān)聯(lián)到臨床結(jié)局。
研究同時融合了真實世界應(yīng)用的場景和條件,加入復(fù)測過程、剔除離群值和風(fēng)險評估等步驟,立體地構(gòu)建了考核產(chǎn)品的評價體系,全面地評價了考核產(chǎn)品的臨床性能、預(yù)測價值和魯棒性。
FDA 于2013年批準(zhǔn)了Illumina MiSeqDx Cystic Fibrosis Clinical Sequencing Assay(K132750)[14]和Illumina MiSeqDx Cystic Fibrosis 139-Variant Assay(K124006)[15]上市。產(chǎn)品采用外周血樣本,檢測囊性纖維化跨膜轉(zhuǎn)導(dǎo)調(diào)節(jié)因子(cystic fibrosis transmembrane conductance regulator,CFTR) 基因變異,K132750 用于囊性纖維化(cystic fibrosis,CF) 的輔助診斷,K124006 用于育齡成人的攜帶者篩查、新生兒和兒童的確診性檢測、疑似囊性纖維化患者的初步檢測輔助診斷[14-15]。根據(jù)《罕見病診療指南(2019年版)》:囊性纖維化新生兒發(fā)病率1/25 000~1/1800;CFTR 基因是目前已知唯一的囊性纖維化致病基因,基因突變導(dǎo)致蛋白功能減少或缺失,所在的上皮細(xì)胞分泌氯離子和水減少,造成上皮細(xì)胞內(nèi)高滲環(huán)境,引起多系統(tǒng)疾?。荒壳耙寻l(fā)現(xiàn)超過 2000 種CFTR基因突變[12]。發(fā)病率低、突變位點多的特點,導(dǎo)致臨床試驗的開展異常困難。
兩款FDA 批準(zhǔn)的囊性纖維化檢測產(chǎn)品,并未開展臨床有效性驗證試驗。CFTR2 公共數(shù)據(jù)庫為變異致病性確定的有效科學(xué)證據(jù)來源,根據(jù)數(shù)據(jù)庫計算的臨床靈敏度和特異度,是FDA 批準(zhǔn)上市的唯一臨床有效性證據(jù)[10]。CFTR2 研究者收集了北美和歐洲的39 696 名囊性纖維化患者的基因型和表型數(shù)據(jù),篩選出159個等位基因頻率≥0.01%的突變患者,結(jié)合臨床表型(汗液氯離子濃度高)和基因功能分析(影響蛋白表達(dá)或者功能),確定了127 個明確致病位點。之前研究已發(fā)現(xiàn)的23 個明確致病位點,在此研究中也全部重現(xiàn),側(cè)面證明了研究方法的準(zhǔn)確性,104 個位點為新發(fā)現(xiàn)致病位點。靈敏度分析顯示,全部患者中,99.79%存在上述127 個變異。對孕齡夫婦進(jìn)行攜帶者篩查時,23 個位點增加到127 個位點后,敏感性從72%增加到91%[16]。突變位點的致病性可以在CFTR2 公共數(shù)據(jù)庫中查詢,隨著科學(xué)認(rèn)知的發(fā)展,數(shù)據(jù)庫持續(xù)更新[16]。
本案例凸顯了高質(zhì)量的公共數(shù)據(jù)庫在罕見病、多位點檢測產(chǎn)品臨床有效性評價中的價值。但需要指出的是,F(xiàn)DA 要求公共數(shù)據(jù)庫對于位點致病性的定義標(biāo)準(zhǔn)要公開、透明、可溯源,檢測產(chǎn)品的結(jié)果解讀需要經(jīng)認(rèn)證的臨床分子遺傳學(xué)家或同等人員解釋,并應(yīng)與其他可用信息(包括臨床癥狀、其他診斷檢測和家族史)一起使用[17]。兩款產(chǎn)品均不適用于獨立診斷、胎兒或胚胎植入前檢測、新生兒篩查[14-15]。
伴隨診斷方向,F(xiàn)DA 于2014年采用附條件的方式批準(zhǔn)了BRACAnalysis CDx 上市[18]。BRACAnalysis CDx 通過檢測卵巢癌患者全血樣本中的胚系BRCA1/2基因變異,并對檢測到的變異進(jìn)行分類,用于奧拉帕利片的相關(guān)用藥指導(dǎo)。所有檢測到的變異將按照一個申請人定義的分類標(biāo)準(zhǔn)劃分到如下5 種類別,分類等級由高到低分別為1(有害/致病)、2(疑似有害/疑似致?。?、3(意義不明確)、4(疑似無害/疑似良性)以及5(無害/良性)。單個樣本可能檢測到多個變異,而不同的變異對應(yīng)的類別可能不同,此時樣本的分類結(jié)果將被報告為分類等級最高的變異所對應(yīng)的類別。
隨著臨床證據(jù)的不斷變化和更新,分類標(biāo)準(zhǔn)也會隨之變化、更新。當(dāng)分類標(biāo)準(zhǔn)發(fā)生變化時,同一個變異可能會被劃分到與之前不同的類別。作為這項批準(zhǔn)所附加的條件之一,申請人被要求在BRACAnalysis CDx 上市后,持續(xù)地監(jiān)測和評估檢測到的所有變異分類,并與之前的分類進(jìn)行比較,以驗證變異分類的魯棒性。由于已發(fā)現(xiàn)的BRCA1/2基因變異有數(shù)千種,且不存在突變熱點,注冊臨床試驗中只驗證了一小部分有害或疑似有害變異的藥物療效。隨著越來越多的BRCA1/2基因變異種類被發(fā)現(xiàn)與奧拉帕利用藥相關(guān),作為另一個附加條件,申請人被要求上市后繼續(xù)評估變異分類是否與用藥效果一致。
病原體檢測方向,F(xiàn)DA 在2019年批準(zhǔn)首個基于高通量測序技術(shù)的人類免疫缺陷病毒(human immunodeficiency virus,HIV)耐藥檢測試劑盒Sentosa?SQ HIV-1 Genotyping Assay上市,共檢測342 個耐藥位點。由于變異位點分布廣泛,難以通過培養(yǎng)或者臨床試驗一一驗證。除了FDA 的《HIV 耐藥基因分型體外診斷試劑》指導(dǎo)原則列出的明確耐藥變異,其他變異位點的臨床有效性證據(jù)來源于斯坦福大學(xué)艾滋病毒耐藥數(shù)據(jù)庫(Stanford HIV drug resistance database)v8.5 版[19]。此公開數(shù)據(jù)庫精心設(shè)計,用于描述、存儲和分析HIV耐藥性數(shù)據(jù),包括基因型和表型、治療及臨床結(jié)局相關(guān)性查詢[20]。
上述案例表明在腫瘤伴隨診斷、病原體耐藥檢測領(lǐng)域,高質(zhì)量的數(shù)據(jù)庫在高通量測序檢測試劑的臨床有效性驗證中,是重要的有效性證據(jù)來源。
綜合前述體外診斷試劑的臨床評價特點和相關(guān)審批案例,可以發(fā)現(xiàn)真實世界研究在體外診斷試劑評價的多個場景下都可能帶來巨大的價值,包括但不限于如臨床結(jié)局研究等執(zhí)行困難的情形、加快罕見病上市、臨床上需要隨訪以確定疾病狀態(tài)、臨床有效性證據(jù)更新較快的情形等。結(jié)合我國法規(guī)要求和真實世界研究在體外診斷試劑領(lǐng)域的發(fā)展程度,應(yīng)注意開展真實世界研究用于支持監(jiān)管決策必須以合法合規(guī)為前提,重點關(guān)注數(shù)據(jù)的相關(guān)性和可靠性,嚴(yán)格進(jìn)行質(zhì)量控制,制定好研究方案和數(shù)據(jù)采集計劃,保障數(shù)據(jù)的真實性和完整性,并主要探索其作為臨床試驗的補(bǔ)充證據(jù)的價值。下面以幾種情況為例對真實世界研究在體外診斷試劑監(jiān)管中的潛在應(yīng)用進(jìn)行探討。
罕見病由于發(fā)病率極低,相關(guān)產(chǎn)品臨床試驗過程中難以獲得足夠的病例數(shù)量,臨床試驗存在困難,生產(chǎn)企業(yè)對該類產(chǎn)品的研發(fā)、生產(chǎn)和注冊申報缺乏積極性[21]。2018年,NMPA 發(fā)布了《國家藥品監(jiān)督管理局關(guān)于發(fā)布用于罕見病防治醫(yī)療器械注冊審查指導(dǎo)原則的通告》[22],以患者受益為中心,科學(xué)解決用于罕見病防治醫(yī)療器械的臨床評價難點,合理減免臨床,以附帶條件批準(zhǔn)方式促進(jìn)該類產(chǎn)品盡快用于臨床,使罕見病患者受益。真實世界數(shù)據(jù)對于罕見病的上市前評價,以及附條件批準(zhǔn)的上市后研究,都可以發(fā)揮作用。前述SCID 的案例展示了從生物樣本庫或大型專科醫(yī)院、相關(guān)研究機(jī)構(gòu)獲得罕見病陽性病例樣本,可以更充分地評價產(chǎn)品的檢測性能。
某已獲批體外診斷試劑產(chǎn)品,其批準(zhǔn)預(yù)期用途為針對某疾病疑似人群的輔助診斷。在臨床常規(guī)實踐中,該產(chǎn)品檢測為陽性的人群,需轉(zhuǎn)診臨床參考標(biāo)準(zhǔn)進(jìn)行確認(rèn),確認(rèn)為該病的患者將接受治療,排除的患者則后續(xù)進(jìn)行隨訪。該產(chǎn)品檢測為陰性的人群不經(jīng)轉(zhuǎn)診,進(jìn)入隨訪流程,見圖1。
圖1 某已獲批輔助診斷試劑產(chǎn)品臨床常規(guī)實踐示例
如上述疾病輔助診斷試劑變更增項預(yù)期用途為風(fēng)險評估和(或)預(yù)后的適用人群,可利用上述真實隨訪數(shù)據(jù),對風(fēng)險評估和預(yù)后的適用人群進(jìn)行臨床評價。他們都是在基線時沒有該疾病的患者(檢測陰性組可通過該產(chǎn)品輔助診斷用途的臨床試驗中的特異度指標(biāo),計算得到其中真正沒有該疾病的人數(shù)),經(jīng)過隨訪一段時間,通過比較基線時檢測結(jié)果陽性但是沒有該疾病的人群和基線時檢測結(jié)果為陰性的人群在最終發(fā)病率上的差異,從而評價該產(chǎn)品用于風(fēng)險評估/疾病預(yù)后的有效性[9]。
隨著深度學(xué)習(xí)在診斷領(lǐng)域的發(fā)展和應(yīng)用,基于多個指標(biāo)聯(lián)合檢測的算法顯現(xiàn)出更優(yōu)的臨床性能,也成為產(chǎn)品開發(fā)的熱點。例如,臨床上經(jīng)常同時進(jìn)行多個標(biāo)志物的檢測,以確認(rèn)一種疾病的狀態(tài)。為了評估胃癌的風(fēng)險,可能同時檢測胃蛋白酶原、胃泌素17 和幽門螺桿菌抗體等指標(biāo);為了診斷卵巢癌,可能同時檢測糖類抗原CA125 和人附睪蛋白4。在這類產(chǎn)品的開發(fā)上,如果產(chǎn)品包含的各單項指標(biāo)都是臨床常用的指標(biāo),在滿足算法訓(xùn)練方案設(shè)計要求的前提下,探索部分研究可以采用真實世界數(shù)據(jù)進(jìn)行算法的訓(xùn)練和臨床驗證。申辦者可以選擇若干家已開展相關(guān)指標(biāo)檢測的臨床單位,收集一定符合要求的病例數(shù)的各指標(biāo)檢測結(jié)果用于不同數(shù)據(jù)集,對診斷模型進(jìn)行補(bǔ)充驗證。
近年來,隨著生物檢測技術(shù)的不斷創(chuàng)新以及個體化醫(yī)療和精準(zhǔn)醫(yī)療的臨床需求逐漸增加,生物醫(yī)藥行業(yè)的新技術(shù)、新成果從研發(fā)向臨床應(yīng)用快速轉(zhuǎn)化落地需求迫切。如病原宏基因組高通量測序檢測試劑,可檢測并分析不同臨床來源樣本中細(xì)菌、真菌、病毒、寄生蟲等已知及未知的病原體,特別是未知新發(fā)病原體,對不明原因發(fā)熱、重癥監(jiān)護(hù)病房(intensive care unit,ICU) 的急危重癥患者等具有顯著臨床意義。但宏基因組高通量測序檢測試劑由于其可檢測病原體數(shù)量較多,難以找到全部真實臨床樣本進(jìn)行分析性能及臨床評價。借鑒FDA 應(yīng)用真實世界證據(jù)審評經(jīng)驗,對復(fù)雜的新技術(shù)新產(chǎn)品,探索采用真實臨床樣本加數(shù)據(jù)庫聯(lián)合進(jìn)行臨床前研究;在臨床研究方面,探索采用注冊臨床試驗加真實世界數(shù)據(jù)驗證方式進(jìn)行臨床研究綜合評價。
真實世界研究包括了資料、方法和使用,即真實世界數(shù)據(jù)的治理和規(guī)范、真實世界研究的設(shè)計和實施、真實世界證據(jù)的要求和應(yīng)用。本文主要探討了體外診斷試劑的一些應(yīng)用可能性和基本路徑,但就真實世界研究在體外診斷領(lǐng)域的落地和發(fā)展而言,仍然脫離不了基礎(chǔ)建設(shè)和方法提升。真實世界研究的根本是真實世界數(shù)據(jù)。就體外診斷試劑而言,可提供有價值數(shù)據(jù)的來源廣泛,如醫(yī)院信息系統(tǒng)數(shù)據(jù)、登記研究數(shù)據(jù)、組學(xué)數(shù)據(jù)等。如何解決這些數(shù)據(jù)的互聯(lián)互通、共建共享,如何保證這些數(shù)據(jù)的正確使用、全面評價,是決定真實世界研究長遠(yuǎn)發(fā)展的基礎(chǔ)問題。真實世界研究的設(shè)計、對偏倚的預(yù)判和控制、統(tǒng)計學(xué)方法的應(yīng)用,乃至于與監(jiān)管機(jī)構(gòu)的事先溝通,都是決定研究能否產(chǎn)生有效科學(xué)證據(jù)的關(guān)鍵因素。
體外診斷試劑的臨床評價有自身的特點和需求,把握這些需求有助于更好地應(yīng)用真實世界數(shù)據(jù),產(chǎn)生真實世界證據(jù)。與此同時,真實世界研究也有本身的規(guī)律,利用好這些規(guī)律可以更快地推動體外診斷試劑真實世界研究的發(fā)展,轉(zhuǎn)化為監(jiān)管決策的依據(jù),并最終讓體外診斷行業(yè)、監(jiān)管機(jī)構(gòu)、臨床機(jī)構(gòu)和患者都從中受益。