李靜
臨床研究系列講座
臨床試驗(yàn)設(shè)計(jì):隨機(jī)對照
李靜
隨機(jī)對照臨床試驗(yàn)對于評價(jià)治療措施的療效與安全性是金標(biāo)準(zhǔn),而療效和安全性是臨床醫(yī)生最關(guān)心的問題。因此,臨床研究者應(yīng)學(xué)習(xí)如何科學(xué)設(shè)計(jì)隨機(jī)對照臨床試驗(yàn)。此外,在循證醫(yī)學(xué)時代,正確解讀臨床試驗(yàn)結(jié)果應(yīng)該成為臨床醫(yī)生的一項(xiàng)基本功,就像醫(yī)生要會看化驗(yàn)單、讀X線胸片一樣。正確解讀臨床試驗(yàn)也離不開對科學(xué)設(shè)計(jì)原則的了解。
一項(xiàng)好的臨床試驗(yàn)必須滿足兩個條件,一是回答重要的臨床問題,能夠指導(dǎo)臨床實(shí)踐;二是結(jié)論科學(xué)可靠,有效控制誤差。因此好的臨床試驗(yàn)必須是起源于臨床實(shí)踐,依托流行病學(xué)的方法。科學(xué)的設(shè)計(jì)目的就是要合理控制誤差,保證研究結(jié)果的準(zhǔn)確可靠。誤差分為系統(tǒng)誤差和偶然誤差,系統(tǒng)誤差是指結(jié)局指標(biāo)的差異由其他因素造成,而非由待評價(jià)的治療所致,又稱偏倚。系統(tǒng)誤差是觀察性研究常見的問題,可能高估或者低估療效,但很難確定其方向和程度。隨機(jī)誤差是機(jī)會所致,見于觀察性研究和臨床試驗(yàn),但可以量化。只有當(dāng)真實(shí)療效明顯大于誤差產(chǎn)生的影響時,研究結(jié)論才是可靠的。隨機(jī)對照與合理的樣本量分別能夠有效地控制系統(tǒng)誤差和隨機(jī)誤差,是臨床試驗(yàn)研究設(shè)計(jì)的重要原則。
隨機(jī)對照是消除系統(tǒng)誤差的唯一途徑,科學(xué)的隨機(jī)分組方法能夠確保治療組和對照組具有真正的可比性。隨機(jī)是提供一個時間點(diǎn),從此開始研究各組分開,受試者分到各組的機(jī)會相等,而且不能預(yù)知分組的情況。既然是通過隨機(jī)的分組,理論上能夠確保所有的因素在各組之間都是均衡分布的。這一點(diǎn)較觀察性研究具有無可比擬的優(yōu)越性。因?yàn)橛^察性研究雖然可以通過分層、匹配等方法使已知對結(jié)局指標(biāo)有影響的因素在各組之間達(dá)到平衡,但完全無法平衡未知的影響因素。根據(jù)隨機(jī)的定義,我們可以判斷一個研究是否真正做到了隨機(jī)。有些研究號稱“隨機(jī)”分組,但實(shí)際上并不能滿足隨機(jī)的定義,例如,根據(jù)患者就診日期的奇偶數(shù)分組、 根據(jù)生日的奇偶數(shù)分組、根據(jù)患者參加研究順序的奇偶數(shù)分組,就都不是真正的隨機(jī)。因?yàn)檫@些情況下,研究者都可以在隨機(jī)前預(yù)知受試者將分到哪個組別,如果研究者帶有傾向性,希望受試者分到某個特定的組別,他就有可能采取措施干預(yù)受試者的分組,例如如果是根據(jù)研究順序分組,研究者可以讓受試者等到下一個受試者之后再隨機(jī)入組,就會被分到另一個組別。一旦研究者可以干預(yù)分組,那就破壞了隨機(jī),無法保證各組間的均衡。
一項(xiàng)臨床試驗(yàn)的結(jié)果發(fā)表時,一定要報(bào)告各組受試者的基線特征比較,通常是用表來展示。如果各組之間某些基線特征存在明顯差異,往往是由于隨機(jī)的設(shè)計(jì)存在缺陷或執(zhí)行過程中出了問題。這會讓人質(zhì)疑結(jié)論的可靠性。
隨機(jī)分組是雙盲設(shè)計(jì)的前提條件。1948年現(xiàn)代流行病學(xué)的鼻祖英國人Austin Bradford Hill開展了世界上第一項(xiàng)隨機(jī)對照臨床試驗(yàn),評價(jià)鏈霉素治療肺結(jié)核的療效。這項(xiàng)試驗(yàn)大獲成功,終結(jié)了肺結(jié)核作為不治之癥的權(quán)勢。但這項(xiàng)試驗(yàn)更重要影響在于確立了隨機(jī)對照臨床試驗(yàn)的設(shè)計(jì)原理,他也首次提出雙盲的原則,以及評價(jià)指標(biāo)應(yīng)客觀簡單。
為了保證隨機(jī)對照不被破壞,臨床試驗(yàn)的分析要遵循意向治療分析原則(intention to treat, ITT)。ITT原則是指分析時應(yīng)包含所有被隨機(jī)分組的受試者,而且按照隨機(jī)分配組別進(jìn)行分析,不考慮受試者是否符合入選標(biāo)準(zhǔn),是否違背研究方案,也不考慮受試者實(shí)際接受了何種治療。舉個極端的例子,如果一名受試者隨機(jī)后,當(dāng)天就因意外死亡了,一片研究藥物都沒吃,按照ITT原則,也應(yīng)該納入分析,而不能被排除。同樣,所有失訪的受試者也應(yīng)納入分析。正是出于這條原則,目前臨床試驗(yàn)結(jié)果報(bào)告所必須遵循的CONSORT原則要求以流程圖(圖1)的方式,清楚報(bào)告受試者隨機(jī)及隨訪的過程,具體到每一步驟、每一組別和每一種情況所對應(yīng)的受試者人數(shù)[1]。有了這些信息,就能夠清楚判斷作者是否遵循了ITT原則。
舉2個例子,SPARCLE研究[2]評價(jià)阿托伐他汀預(yù)防腦卒中的療效, 2 365例受試者分到治療組,2 366例分到安慰劑組,治療組有78例撤回知情同意,其中63例生存狀態(tài)不明,此外,還有15例失訪。對照組與之相似。最后分析時,治療組的2 365例和安慰劑組的2 366例受試者全部納入療效分析和安全性分析,一個都沒少。再看另外一個例子,是評價(jià)美托洛爾治療心衰療效的MERIT-HF研究[3],隨機(jī)分組后,治療組有1 995例受試者,安慰劑組有2 001例。隨訪做得非常好,沒有失訪的。但研究結(jié)束時,治療組和安慰劑組分別有228例和242例沒有接受研究治療的。最后也是所有受試者都納入分析。
為什么設(shè)立ITT原則?分析時為什么不能排除停藥的受試者?為什么不能排除失訪的受試者?首先從統(tǒng)計(jì)學(xué)角度而言,ITT分析是對隨機(jī)的保證,研究隨機(jī)分組的時候,分開的各組是平衡的,但隨機(jī)分組之后各個組之間出現(xiàn)任何差異,都有可能是由于各組采取的干預(yù)措施不同而導(dǎo)致的,如果排除某些受試者,就會破壞原本隨機(jī)分組時建立的平衡,導(dǎo)致偏倚。按照隨機(jī)分配的組別,對所有隨機(jī)的受試者進(jìn)行分析,就是為了保證隨機(jī)不被破壞,是對隨機(jī)最大程度的尊重。其次,從臨床角度而言,停藥往往是由于受試者不耐受研究治療,如果排除停藥的受試者,就有可能掩蓋研究治療的不良反應(yīng)。與之類似,失訪有可能是由于死亡,或者由于不耐受研究治療而不再配合隨訪,這也是與研究治療的療效或安全性直接相關(guān)的,如果排除此類患者,勢必抹殺了研究治療與對照之間的差異。
圖1 CONSORT流程圖
因此,ITT分析是隨機(jī)對照臨床試驗(yàn)的首要分析方法,在此基礎(chǔ)上,可以考慮對符合方案的受試者進(jìn)一步分析,補(bǔ)充安全性方面的信息。采用ITT分析,是為了避免系統(tǒng)誤差,但不依從研究方案和失訪者都會導(dǎo)致研究的統(tǒng)計(jì)學(xué)把握度大大降低,使隨機(jī)誤差增加。因此臨床試驗(yàn)實(shí)施管理的一個重點(diǎn)就是盡量避免失訪和不依從方案的情況發(fā)生。如何避免呢?首先是從研究設(shè)計(jì)的角度考慮,其次是加強(qiáng)隨訪的管理,與受試者建立良好的溝通和彼此的信任。
合理的樣本量是減少隨機(jī)誤差的有效方法??茖W(xué)的設(shè)計(jì)包含對樣本量的合理估計(jì)。樣本量不足是臨床研究中常見的問題,將導(dǎo)致研究無法給出明確結(jié)論,說不清楚到底是研究治療無效,還是假陰性。相反,樣本量也不是“韓信點(diǎn)兵,多多益善”,因?yàn)闃颖玖吭黾右馕吨肆?、物力和時間成本的增加,以及納入更多的中心,質(zhì)量控制的難度增加、隨訪質(zhì)量的下降等。不適當(dāng)?shù)臉颖玖恳彩遣粋惱淼?,過大的樣本量會延緩研究結(jié)果的產(chǎn)生和發(fā)布,延誤有效治療在臨床實(shí)踐中的廣泛應(yīng)用。過小的樣本量不足以得出科學(xué)結(jié)論,會影響受試者的獲益。
計(jì)算樣本量的公式比較復(fù)雜,可使用專門的軟件,按照提示輸入相應(yīng)的參數(shù),軟件就能給出計(jì)算結(jié)果。通常影響樣本量的參數(shù)是四個,其中兩個是統(tǒng)計(jì)學(xué)參數(shù),包括統(tǒng)計(jì)學(xué)顯著度和把握度。如果用α和β分別表示Ⅰ型錯誤率(假陽性率)和Ⅱ型錯誤率(假陰性率),則顯著度是α值,統(tǒng)一規(guī)定為0.05。把握度是1-β值,由研究者來決定,越大越好,但把握度越大就意味著需要的樣本量越大。還有兩個參數(shù)與研究要回答的問題本身有關(guān)。一個是對照組終點(diǎn)事件發(fā)生的頻率,另一個是預(yù)期的療效,也就是治療組與對照之間的差異。確定對照組終點(diǎn)事件發(fā)生的頻率是根據(jù)既往研究或預(yù)試驗(yàn)的結(jié)果。預(yù)期的療效只能是估計(jì)值,因?yàn)槿绻呀?jīng)確知效果就不需要開展這項(xiàng)臨床試驗(yàn)了。這幾項(xiàng)參數(shù)中,療效的不確定性最大,其估計(jì)的準(zhǔn)確性對于樣本量計(jì)算的影響也最大。估計(jì)療效的根據(jù)是既往同類研究結(jié)果或待評價(jià)治療的作用機(jī)制及流行病學(xué)數(shù)據(jù)[4]。
根據(jù)公式算出來的只是理論上所需的樣本量,臨床試驗(yàn)實(shí)施過程也會影響到最終實(shí)際需要的樣本量。研究實(shí)施中未必全部受試者都能依從研究方案的要求接受研究治療,依從者在所有受試者中所占的比例是依從率。實(shí)際所需的樣本量是理論樣本量除以依從率的平方。因此,如果依從率是70%,實(shí)際所需樣本量就是理論樣本量的2倍。這一點(diǎn)再次說明臨床試驗(yàn)的設(shè)計(jì)必須考慮研究實(shí)施的合理性,而實(shí)施質(zhì)量對于保證科學(xué)設(shè)計(jì)得以實(shí)現(xiàn)是至關(guān)重要的[5]。
總而言之,隨機(jī)對照是臨床試驗(yàn)設(shè)計(jì)的精髓,因?yàn)槠淠苡行Э刂葡到y(tǒng)誤差,從而使得隨機(jī)對照臨床試驗(yàn)成為療效評價(jià)的金標(biāo)準(zhǔn)。為了保證隨機(jī)的效果不被破壞,臨床試驗(yàn)的首要分析是ITT分析。預(yù)先計(jì)算合理的樣本量能夠減少偶然誤差。
[1] CONSORT Group.CONSORT 2010[EB/OL].http://www.consortstatement.org/, 2017-09-22.
[2] Amarenco P, Bogousslavsky J, Callahan 3rd A, et al. High-dose atorvastatin after stroke or transient ischemic attack. N Engl J Med,2006, 355: 549-559.
[3] Hjalmarson A, Goldstein S, Fagerberg B, et al. Effects of controlledrelease metoprolol on total mortality, hospitalizations, and well-being in patients with heart failure: the Metoprolol CR/XL Randomized Intervention Trial in congestive heart failure (MERIT-HF). MERITHF Study Group. JAMA, 2000, 283: 1295-1302.
[4] Schulz KF, Grimes DA. Sample size calculations in randomised trials:mandatory and mystical. Lancet (London, England), 2005, 365: 1348-1353.
[5] 陳錚鳴, 邵永孚. 臨床隨機(jī)試驗(yàn)原理和方法. 中華腫瘤雜志, 1994,16: 234-236.
2017-09-20)
(編輯:寧田海)
100037 北京市,中國醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院 國家心血管病中心 國家心血管疾病臨床醫(yī)學(xué)研究中心 心血管疾病國家重點(diǎn)實(shí)驗(yàn)室中國牛津國際醫(yī)學(xué)研究中心
李靜 教授 博士研究生導(dǎo)師 主要從事心血管領(lǐng)域大規(guī)模隨機(jī)對照臨床試驗(yàn)和醫(yī)療結(jié)果評價(jià)研究 Email:jing.li@fwoxford.org
R54
C
1000-3614(2017)11-1126-02
10.3969/j.issn.1000-3614.2017.11.022