1 遼寧省檢驗(yàn)檢測(cè)認(rèn)證中心認(rèn)證審評(píng)院 (遼寧 沈陽(yáng) 110003)
2 遼寧省檢驗(yàn)檢測(cè)認(rèn)證中心醫(yī)療器械檢驗(yàn)檢測(cè)院 (遼寧 沈陽(yáng) 110179)
內(nèi)容提要:《貝葉斯統(tǒng)計(jì)醫(yī)療器械臨床試驗(yàn)應(yīng)用指導(dǎo)原則研究》是在美國(guó)食品藥品管理局(FDA)的“貝葉斯統(tǒng)計(jì)醫(yī)療器械臨床試驗(yàn)應(yīng)用指導(dǎo)原則”理念基礎(chǔ)上,結(jié)合我國(guó)實(shí)際需要,擴(kuò)展貝葉斯臨床設(shè)計(jì)理念在我國(guó)醫(yī)療器械臨床試驗(yàn)中的應(yīng)用思路。
貝葉斯分析在醫(yī)療器械臨床試驗(yàn)中的應(yīng)用始于20世紀(jì)90年代末。其目的是有效地利用大量已有的醫(yī)療器械臨床試驗(yàn)先驗(yàn)信息,同時(shí),改善現(xiàn)有的醫(yī)療器械臨床評(píng)價(jià)方式,使其更適應(yīng)醫(yī)學(xué)技術(shù)的飛速發(fā)展所導(dǎo)致的發(fā)明過(guò)程和更新?lián)Q代明顯加快的情況。美國(guó)器械與輻射防護(hù)中心(Center for Devices and Radiological Health,CDRH)2010年2月5日發(fā)布了《醫(yī)療器械臨床試驗(yàn)貝葉斯統(tǒng)計(jì)應(yīng)用指導(dǎo)原則》,該指導(dǎo)原則不僅對(duì)貝葉斯統(tǒng)計(jì)基本概念,貝葉斯臨床試驗(yàn)設(shè)計(jì),貝葉斯臨床試驗(yàn)分析,貝葉斯上市后監(jiān)測(cè)等問(wèn)題進(jìn)行了全面論述,而且對(duì)貝葉斯統(tǒng)計(jì)的應(yīng)用條件和資料編寫(xiě)等技術(shù)細(xì)節(jié)進(jìn)行了詳盡描述,本文通過(guò)對(duì)FDA《醫(yī)療器械臨床試驗(yàn)貝葉斯統(tǒng)計(jì)應(yīng)用指導(dǎo)原則》進(jìn)行研究和分析,提出貝葉斯臨床試驗(yàn)在我國(guó)應(yīng)用的建議。
貝葉斯統(tǒng)計(jì)是一種從積累的證據(jù)中學(xué)習(xí)的方法。經(jīng)典統(tǒng)計(jì)方法(即頻率法)就是通過(guò)選取一定的樣本信息來(lái)推斷總體數(shù)據(jù)信息,而貝葉斯統(tǒng)計(jì)則是通過(guò)樣本信息加上先驗(yàn)信息來(lái)推斷總體數(shù)據(jù)信息(見(jiàn)圖1)。
圖1.經(jīng)典統(tǒng)計(jì)與貝葉斯統(tǒng)計(jì)關(guān)系
在醫(yī)療器械臨床試驗(yàn)中,經(jīng)典統(tǒng)計(jì)方法,以往的先驗(yàn)信息僅在試驗(yàn)設(shè)計(jì)階段利用,而在數(shù)據(jù)分析階段,以往的先驗(yàn)信息僅被認(rèn)為是正式分析的補(bǔ)充數(shù)據(jù)而不是其中一部分?jǐn)?shù)據(jù)。貝葉斯統(tǒng)計(jì)則是使用貝葉斯理論在考慮數(shù)量利益(即滿足盡可能少的試驗(yàn)樣本量)的前提下正式將以往的先驗(yàn)信息與當(dāng)前的信息結(jié)合,將先驗(yàn)信息和當(dāng)前的試驗(yàn)結(jié)果均考慮作為連續(xù)數(shù)據(jù)流的一部分,因此,每當(dāng)有新數(shù)據(jù)產(chǎn)生,推論就會(huì)更新。
與經(jīng)典統(tǒng)計(jì)相比貝葉斯統(tǒng)計(jì)的優(yōu)點(diǎn)主要有兩點(diǎn):①當(dāng)醫(yī)療器械具有良好的臨床使用相關(guān)的先驗(yàn)信息時(shí),貝葉斯統(tǒng)計(jì)方法可以將此先驗(yàn)信息納入臨床試驗(yàn)的統(tǒng)計(jì)分析,在某些情況下,可減少臨床試驗(yàn)的樣本量。②通過(guò)適當(dāng)?shù)囊?guī)劃,貝葉斯統(tǒng)計(jì)可以提供靈活的試驗(yàn)設(shè)計(jì)過(guò)程中的變化,比如去除不利的治療裝備或修改隨機(jī)計(jì)劃,貝葉斯統(tǒng)計(jì)在臨床試驗(yàn)過(guò)程中可以特別靈活地改變和控制隨機(jī)化。葉斯統(tǒng)計(jì)在處理漏失數(shù)據(jù)方面具有更大的靈活性。其缺點(diǎn)主要也有兩點(diǎn):①在試驗(yàn)設(shè)計(jì)的操作上,貝葉斯設(shè)計(jì)需要大量的模擬設(shè)計(jì),試驗(yàn)設(shè)計(jì)需要的計(jì)算工作量比后期的數(shù)據(jù)分析要大得多,這在經(jīng)典統(tǒng)計(jì)中是難以想象的。②需要專(zhuān)業(yè)人才設(shè)計(jì)和審評(píng),對(duì)審評(píng)人員的能力挑戰(zhàn)極大。
《指導(dǎo)原則》全文共分為8章38節(jié),內(nèi)容可歸納為以下5個(gè)方面[1]。
在《指導(dǎo)原則》前三章,F(xiàn)DA對(duì)醫(yī)療器械臨床試驗(yàn)有關(guān)的貝葉斯統(tǒng)計(jì)基本概念進(jìn)行概述,如先驗(yàn)分布、后驗(yàn)分布、似然函數(shù)、預(yù)測(cè)概率、可交換性等。此外,也闡述了醫(yī)療器械臨床試驗(yàn)中為什么要應(yīng)用貝葉斯統(tǒng)計(jì),貝葉斯統(tǒng)計(jì)在當(dāng)前使用的更普遍的原因以及使用貝葉斯統(tǒng)計(jì)的潛在效益和挑戰(zhàn)。
與經(jīng)典統(tǒng)計(jì)相比,貝葉斯臨床試驗(yàn)設(shè)計(jì)樣本含量的確定和試驗(yàn)設(shè)計(jì)的具體操作有明顯差別,貝葉斯統(tǒng)計(jì)不是事先制定一個(gè)固定的樣本量,而是指定一個(gè)停止試驗(yàn)的標(biāo)準(zhǔn),而經(jīng)典統(tǒng)計(jì)通常需要事先確定樣本含量。此外,為了防止貝葉斯臨床試驗(yàn)設(shè)計(jì)樣本含量確定時(shí)的隨意性,須事先確定最小樣品量和最大樣品量,最小樣本量應(yīng)根據(jù)安全性和有效性等參數(shù)確定,最大樣本量應(yīng)考慮經(jīng)濟(jì)、倫理和規(guī)范等方面要求。在先驗(yàn)信息選取上,應(yīng)采用量化的客觀的先驗(yàn)信息,比如來(lái)自器械自身的信息、對(duì)照組的信息或兩者兼之,不能采用專(zhuān)家意見(jiàn)等主觀先驗(yàn)。在試驗(yàn)設(shè)計(jì)的操作上,貝葉斯設(shè)計(jì)往往涉及大量的統(tǒng)計(jì)模擬。FDA要求提供有關(guān)試驗(yàn)設(shè)計(jì)詳盡的模擬實(shí)驗(yàn)結(jié)果。不同試驗(yàn)環(huán)境和條件的模擬設(shè)計(jì)對(duì)制定滿足需求的貝葉斯試驗(yàn)方案具有重要價(jià)值,但工作量巨大。
同經(jīng)典統(tǒng)計(jì)一樣,貝葉斯統(tǒng)計(jì)推斷包括假設(shè)檢驗(yàn)和區(qū)間估計(jì)。但是,貝葉斯假設(shè)檢驗(yàn)和區(qū)間估計(jì)是以后驗(yàn)分布為基礎(chǔ)的,因此在結(jié)果解釋上和經(jīng)典統(tǒng)計(jì)的意義不完全相同。
在貝葉斯統(tǒng)計(jì)分析中,通常采用期望值概率分析。所謂期望值概率,是指給定結(jié)局在未來(lái)是否發(fā)生的概率,用于決定何時(shí)停止試驗(yàn)、用于預(yù)測(cè)當(dāng)前患者的臨床結(jié)局以及調(diào)整有缺失數(shù)據(jù)的試驗(yàn)結(jié)果和模型檢驗(yàn)等,是一種特殊類(lèi)型的后驗(yàn)概率。在制定臨床試驗(yàn)方案時(shí),可將期望值概率作為停止試驗(yàn)的標(biāo)準(zhǔn),當(dāng)期望值概率足夠高時(shí)則可以停止試驗(yàn)并宣布成功,概率足夠低時(shí)可以認(rèn)定器械不滿足要求而停止試驗(yàn)并減少損失。這一特點(diǎn)顯示了貝葉斯臨床試驗(yàn)的靈活性,具有重要的實(shí)際意義。
貝葉斯統(tǒng)計(jì)有利于醫(yī)療器械的上市后監(jiān)測(cè)數(shù)據(jù)分析。“今天的后驗(yàn)是明天的先驗(yàn)”,可以將上市前研究數(shù)據(jù)的后驗(yàn)分布作為上市后監(jiān)測(cè)的先驗(yàn)分布,并通過(guò)不斷收集上市后監(jiān)測(cè)數(shù)據(jù),再不斷更新先驗(yàn)分布來(lái)提高貝葉斯統(tǒng)計(jì)推斷的質(zhì)量,可有效利用上市后監(jiān)測(cè)數(shù)據(jù)。
《指導(dǎo)原則》還描述了貝葉斯統(tǒng)計(jì)臨床試驗(yàn)資料準(zhǔn)備及提交審評(píng)的技術(shù)細(xì)節(jié),有利于申報(bào)者在醫(yī)療器械臨床試驗(yàn)中正確應(yīng)用貝葉斯統(tǒng)計(jì)方法以及向FDA上報(bào)規(guī)范的臨床試驗(yàn)技術(shù)資料,比如研究方案應(yīng)包含模擬實(shí)驗(yàn)方法、模型選擇方法、可交換性檢查以及計(jì)算方法等。
FDA《指導(dǎo)原則》從方向醞釀、框架擬定、草案形成和最終發(fā)布過(guò)程大概有十年的時(shí)間。早在1998年,F(xiàn)DA舉辦了一次貝葉斯統(tǒng)計(jì)研討會(huì),向申報(bào)者發(fā)出了明確信號(hào):CDRH愿意接受基于貝葉斯方法的申請(qǐng)項(xiàng)目。到2004年已有基于貝葉斯方法的成功案例和獲批產(chǎn)品,在此背景下,F(xiàn)DA與約翰霍普金斯大學(xué)生物統(tǒng)計(jì)學(xué)系、美國(guó)國(guó)立衛(wèi)生研究院舉辦了一次專(zhuān)題研討會(huì),這次研討會(huì)各方所達(dá)成的共識(shí)形成了《醫(yī)療器械臨床試驗(yàn)貝葉斯統(tǒng)計(jì)應(yīng)用指導(dǎo)原則(草案)》,F(xiàn)DA于2006年5月發(fā)布了該草案,在草案公布后,F(xiàn)DA接到了很多有意義的反饋意見(jiàn),這些意見(jiàn)經(jīng)專(zhuān)家討論后于2010年2月形成了最終的指導(dǎo)文件[2]。
醫(yī)療器械臨床試驗(yàn)貝葉斯統(tǒng)計(jì)應(yīng)用,需要一定的社會(huì)科技發(fā)展基礎(chǔ)和監(jiān)管機(jī)構(gòu)的人才儲(chǔ)備基礎(chǔ),因此我國(guó)制訂《醫(yī)療器械臨床試驗(yàn)貝葉斯統(tǒng)計(jì)應(yīng)用指導(dǎo)原則》應(yīng)分階段逐步完成:①進(jìn)行基礎(chǔ)研究,了解貝葉斯統(tǒng)計(jì)方法和國(guó)外的應(yīng)用案例;②依據(jù)審評(píng)能力建設(shè)情況,選擇性試運(yùn)行;③依據(jù)試運(yùn)行情況,制訂《醫(yī)療器械臨床試驗(yàn)貝葉斯統(tǒng)計(jì)應(yīng)用指導(dǎo)原則(試行)》;④推廣運(yùn)行階段;⑤依據(jù)推廣運(yùn)行情況,制訂最終《醫(yī)療器械臨床試驗(yàn)貝葉斯統(tǒng)計(jì)應(yīng)用指導(dǎo)原則》。
3.2.1 要有良好的預(yù)設(shè)計(jì)。在貝葉斯試驗(yàn)中,預(yù)設(shè)計(jì)十分關(guān)鍵,必須在實(shí)驗(yàn)設(shè)計(jì)階段就考慮到以下因素:先驗(yàn)信息、本次試驗(yàn)所能獲得的數(shù)據(jù)及將二者有機(jī)結(jié)合所需的數(shù)學(xué)模型。對(duì)于先驗(yàn)信息的不同選擇或者對(duì)于模型的不同選擇將會(huì)產(chǎn)生不同的結(jié)論。在臨床試驗(yàn)的后期改變先驗(yàn)信息或者計(jì)算模型將可能危及試驗(yàn)結(jié)果的科學(xué)有效性。因此,貝葉斯臨床試驗(yàn)的設(shè)計(jì)需要提交先驗(yàn)信息和計(jì)算模型相關(guān)的規(guī)范和協(xié)議。由于達(dá)成協(xié)議往往是一個(gè)反復(fù)的過(guò)程,在使用貝葉斯統(tǒng)計(jì)時(shí)應(yīng)提前召開(kāi)正式的協(xié)議會(huì)來(lái)確證預(yù)設(shè)計(jì)方法是否科學(xué)合理,并建議與審評(píng)機(jī)構(gòu)溝通協(xié)調(diào)以便就貝葉斯臨床設(shè)計(jì)的基本要求達(dá)成一致。
建議從臨床和統(tǒng)計(jì)兩方面考慮先驗(yàn)信息的選擇是否科學(xué)合理;建議通過(guò)進(jìn)行靈敏性分析來(lái)驗(yàn)證所選擇的數(shù)學(xué)模型在選擇不同先驗(yàn)分布時(shí)的穩(wěn)定性。
3.2.2 建立科學(xué)合理的數(shù)學(xué)模型。使用貝葉斯統(tǒng)計(jì)進(jìn)行臨床試驗(yàn)涉及廣泛的數(shù)學(xué)建模工作,包括選擇能夠反映先驗(yàn)信息的概率分布、多個(gè)先驗(yàn)信息源之間的關(guān)系、協(xié)變量對(duì)于患者治療結(jié)果及漏失數(shù)據(jù)的影響及模型選擇的靈敏度分析。
關(guān)于數(shù)學(xué)模型的選擇,建議與審評(píng)機(jī)構(gòu)以及統(tǒng)計(jì)學(xué)和臨床試驗(yàn)專(zhuān)家進(jìn)行密切合作從而達(dá)成一致。
3.2.3 選擇正確的統(tǒng)計(jì)分析方法和軟件。貝葉斯分析常常計(jì)算強(qiáng)度很大。但是,最近計(jì)算算法和運(yùn)算速度的突破,使人們能夠?qū)崿F(xiàn)對(duì)非常復(fù)雜和現(xiàn)實(shí)的貝葉斯模型進(jìn)行計(jì)算。基本的計(jì)算工具是一種叫Markov Chain Monte Carlo(MCMC)采樣的方法,該方法可模擬隨機(jī)量分布,可用于:分析臨床試驗(yàn)數(shù)據(jù)、檢查模型假設(shè)、設(shè)計(jì)階段評(píng)價(jià)先驗(yàn)概率、模擬評(píng)估各種結(jié)果的概率及估計(jì)樣本量。
目前常用的貝葉斯分析的軟件有WinBUGS,可專(zhuān)用于進(jìn)行貝葉斯計(jì)算。BUGS是“應(yīng)用吉布斯模型進(jìn)行貝葉斯推理”的首字母縮略語(yǔ),是MCMC采樣的一種常見(jiàn)類(lèi)型。WinBUGS催生了另外兩個(gè)軟件包,BRUGS和OpenBUGS。將來(lái)有望出現(xiàn)其他的貝葉斯軟件包。建議在選擇特定的軟件產(chǎn)品之前,應(yīng)就提交材料時(shí)所采用的計(jì)算方法來(lái)咨詢審評(píng)機(jī)構(gòu)的老師。
3.2.4 先驗(yàn)信息的選擇。在先驗(yàn)信息選取上,應(yīng)采用量化的客觀性先驗(yàn),如來(lái)自器械自身的信息、對(duì)照組的信息或兩者兼之。不應(yīng)采用專(zhuān)家意見(jiàn)等主觀先驗(yàn)。
3.2.5 建議提交的審評(píng)文件要求。除了正規(guī)臨床試驗(yàn)方案和臨床試驗(yàn)報(bào)告之外,應(yīng)提交有關(guān)貝葉斯試驗(yàn)設(shè)計(jì)特有的試驗(yàn)計(jì)劃書(shū)。試驗(yàn)計(jì)劃書(shū)應(yīng)包含先驗(yàn)信息、試驗(yàn)終結(jié)的標(biāo)準(zhǔn)、擬定樣本量大小的理由、試驗(yàn)概率、有效樣本量、模型選擇等。
貝葉斯模型的靈活性以及貝葉斯分析計(jì)算技術(shù)的復(fù)雜性大大增加了錯(cuò)誤和誤解發(fā)生的可能性。對(duì)于任何提交的文件,審評(píng)機(jī)構(gòu)應(yīng)進(jìn)行詳細(xì)的統(tǒng)計(jì)審查,包括使用相同的或者替代的軟件進(jìn)行結(jié)果驗(yàn)證。因此建議企業(yè)以電子文檔的形式提交數(shù)據(jù)和使用統(tǒng)計(jì)分析程序獲得的指令集。
3.2.6 貝葉斯分析和頻率論分析可能得出不同的結(jié)論。貝葉斯分析和頻率論分析對(duì)具有相同臨床數(shù)據(jù)會(huì)得出不同的結(jié)論,而且每種結(jié)論都科學(xué)有效。但是如果臨床試驗(yàn)已經(jīng)啟動(dòng),就不建議從頻率論分析改變?yōu)樨惾~斯分析(反之亦然),這種事后分析不科學(xué)合理,往往會(huì)削弱提交材料的可信度。