陳 陽 ,劉媛媛 ,李長平 ,2,胡良平
(1.天津醫(yī)科大學公共衛(wèi)生學院,天津 300070;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029;3.軍事科學院研究生院,北京 100850
當事先知道某兩種藥物或療法的初步信息(如A藥可能比B藥療效差),但其差值可能不會超出專業(yè)上允許的一個界值時,可以考慮采用非劣效性檢驗[1]。本文主要介紹臨床試驗中非劣效性檢驗的相關內(nèi)容,包括非劣效性檢驗的概念、意義以及假設檢驗的原理、重要參數(shù)的解釋和確定。再結(jié)合臨床實例,展示SAS中兩算術均值比較非劣效性t檢驗的應用,并對程序語句和運行結(jié)果進行解釋。
以安慰劑作為對照的隨機雙盲臨床試驗一直被視為藥物開發(fā)中的金標準,然而隨著可應用的有效藥物的不斷出現(xiàn),具有突破性療效的新藥卻越來越少,所以臨床研究的目的也逐漸改變。盡管某些療法能夠提供更高的功效,但其他新療法可能具有更高的安全性或便利性,或更少的經(jīng)濟花費,同時提供相似的功效。為了尋求良好替代療法,提出了非劣效性檢驗。在真實的非劣效臨床研究中,當以陽性藥物作為對照時,實際上是默認了陽性對照的療效是客觀存在且穩(wěn)定的,且已知試驗藥的療效不可能等于或優(yōu)于對照藥的療效,當能證明兩者療效之差未超過臨床上認可的界值時,即可稱為非劣效。如果非劣效性檢驗成立,試驗藥物雖然相比于陽性對照藥物在療效上沒有優(yōu)勢,但考慮到其他方面的優(yōu)點,如給藥方便、原材料豐富、價格便宜、不良反應少等,那么新藥也是值得投入的。此外,在臨床試驗的設計和分析階段,評估非劣性比優(yōu)效性更為復雜,但在某些情況下,非劣效檢驗的原假設可能比通常的優(yōu)效性分析更合理,因為它基于先驗的效應以及安全性信息[2]。隨著臨床試驗中設計和統(tǒng)計分析的不斷改進與規(guī)范,標準陽性對照試驗的非劣效性設計的應用更加廣泛,成為了評價藥物、器械、生物制品和其他醫(yī)學治療的主要工具,近十年內(nèi),評估非劣效性的隨機試驗數(shù)量增加了6倍[3]。目前科研需要發(fā)展具有相當功效但兼具其他優(yōu)點的新方法替代標準方法,在這種前提下,非劣效性試驗的應用就越來越普遍,但與此同時,為了保證結(jié)果和結(jié)論的可靠性,非劣效試驗的報告內(nèi)容和相關的規(guī)定也需要不斷完善[4]。
檢驗假設:μ1表示試驗措施的干預效果(試驗組主要指標的效應值,均數(shù));μ2表示對照措施的干預效果(對照組主要指標的效應值,均數(shù))。
同時還假定:主要指標為高優(yōu)指標,即均值取值大為好(若主要指標為低優(yōu)指標,下面零假設和備擇假設中的不等號需要改變方向,且非劣效界值取正值)。δL表示非劣效界值(通常取負值);α表示檢驗水準(在通常的情況下取α=0.05,單側(cè)檢驗);原假設和備擇假設分別用H0和H1表示?;谝陨隙x,非劣效性檢驗的檢驗假設可表述如下,H0:μ1-μ2≤δL;H1:μ1-μ2>δL。
采用單側(cè)檢驗。當t>t(1-ɑ),n1+n2-2時,差異有統(tǒng)計學意義,拒絕H0,能夠得出試驗組非劣于對照組的結(jié)論[5]。
在非劣效檢驗中使用單側(cè)檢驗,當試驗組療效劣于對照組且其差值小于或等于非劣效界值δL時,不能拒絕H0,尚不能得出試驗組非劣效于對照組的結(jié)論;如果大于非劣效界值δL,則拒絕H0,能夠得出試驗組非劣效于對照組的結(jié)論。
在置信區(qū)間法中,非劣效性試驗僅關注試驗方法相對于對照方法評價指標的效果差值的置信區(qū)間下限的大小。因此,當試驗措施與對照措施的效果差異的單側(cè)95.0%置信區(qū)間完全落在非劣效性界值右側(cè)時,即其單側(cè)95.0%置信區(qū)間的下限大于設定的判斷界值δL時,則可判定非劣效性假設成立。對于兩個均數(shù)比較的非劣效檢驗,按照單側(cè)100(1-α)%的可信度,可以計算單側(cè)置信區(qū)間的下限CL,公式如下:
若(CL,∞)不包括δL,可以得出試驗組療效非劣效于對照組療效的結(jié)論。
美國食品藥品監(jiān)督管理局指出,在非劣效試驗中,設定檢驗界值應基于“恒定假設”,即盡可能確保本次非劣效性試驗中陽性對照藥的療效與既往臨床試驗保持一致。只有當前非劣效試驗與其陽性對照藥的歷史試驗在所有重要研究設計和實施方面均保持一致時,歷史試驗才可用于估計當前非劣效試驗的陽性對照藥療效和非劣效界值[6],否則會導致錯誤的非劣效結(jié)論。非劣效性界值δL設定一般分為兩個步驟,可采用綜合分析法(常用Meta分析法)估計陽性對照的絕對療效M1,計算陽性對照與安慰劑效應之差的95%雙側(cè)置信區(qū)間下限(必須大于0),鑒于療效的一致性和既往的臨床數(shù)據(jù)質(zhì)量,一般M1取值小于計算所得下限值。非劣效性界值|δL|=M2=f*M1,f一般建議取值為0.5。當無法借鑒歷史資料時,臨床試驗的反應率(有效率)高于80%時,|δL|一般可以取陽性對照療效的10%~15%。非劣效性界值應該結(jié)合文獻,由臨床專家確定。根據(jù)經(jīng)驗,血壓可取為0.67 kPa(5 mmHg),膽固醇可取為0.52 mmol/L(20 mg/dL),白細胞可取為0.5×109/L(500個/mm3)[7](注意:前面舉例給出的是非劣效界值的絕對值,代入公式計算時,應取負號,代表“方向”)。若確實沒有公認的文獻資料作為參考依據(jù),需要由在所研究問題方面具有權威性的多位臨床專家共同商定。
【例1】為了比較拉西地平與苯磺酸氨氯地平治療中老年原發(fā)性輕中度高血壓的效果及安全性[8],入選8個中心年齡在50~80歲的輕中度高血壓患者共263例,隨機分為拉西地平組和苯磺酸氨氯地平組,于治療20周后比較兩組患者24 h平均收縮壓,評價拉西地平控制中老年原發(fā)性輕中度高血壓的效果是否不劣于苯磺酸氨氯地平。見表1。
表1 拉西地平組與苯磺酸氨氯地平組24 h平均收縮壓變化情況(mmHg)
基于該成組設計一元定量資料,能夠計算得到樣本量、均數(shù)及標準差,為了比較兩組的24 h平均收縮壓控制效果,可以采用非劣效性檢驗(假定:經(jīng)臨床專家商定,非劣效界值為-5 mmHg),結(jié)合兩組的均數(shù)、標準差判斷該藥物是否有推廣價值。一般認為,降血壓的數(shù)值越多,表明降壓藥的療效越好,故本例的評價指標(血壓下降值)為“高優(yōu)指標”。
SAS程序如下:
【程序說明】第1步設定非劣效性界值L(注意:程序中不便采用δL表示);然后,根據(jù)式(2)計算中間結(jié)果。第2步進行非劣性假設檢驗,根據(jù)式(1)和式(3)計算t值、P值和CL[9]。
【SAS主要輸出結(jié)果及解釋】
以上主要輸出結(jié)果中的utc=1.65071是基于df=132+131-2=261、上尾概率為0.05條件下計算出t分布曲線下的分位數(shù),若采用正態(tài)分布近似取代t分布,則此數(shù)值應該為1.645。
統(tǒng)計與專業(yè)結(jié)論:t=2.57626,P=0.005269056,按照α=0.05(單側(cè)檢驗),拒絕H0,接受H1,可以認為拉西地平控制中老年原發(fā)性輕中度高血壓的效果不劣于苯磺酸氨氯地平。從95%置信區(qū)間下限來看,CL=-3.31148>-5.00,可以認為拉西地平不劣于苯磺酸氨氯地平,該結(jié)論與假設檢驗結(jié)果一致。
【例2】為了觀察地賜康的降血脂療效[10],將79例原發(fā)性高血脂癥患者隨機分為治療組(地賜康沖劑1袋,tid)和對照組(血脂康膠囊2粒,bid),治療8周后,觀察兩組總膽固醇下降的情況,評價地賜康的血脂調(diào)節(jié)效果是否不劣于血脂康膠囊。見表2。
表2 測定79例原發(fā)性高血脂癥患者8周后總膽固醇下降情況(mmol/L)
表2所示屬于成組設計一元定量資料,可以采用非劣效性檢驗比較治療組與對照組的效果。根據(jù)臨床經(jīng)驗,設定非劣效性界值為-0.52 mmol/L,以進行后續(xù)的非劣效性檢驗,試判斷地賜康沖劑是否具有推廣和應用價值。
SAS程序如下:
【程序說明】第一步,根據(jù)原始定量數(shù)據(jù)建立臨時數(shù)據(jù)集“example2”,程序?qū)υ囼灲M和對照組有明確的要求,第一組為試驗組,第二組為對照組。第二步,在TTEST過程中,sides=u表示采用上單側(cè)檢驗,h0=-0.52為設定的非劣效性界值;“alpha=0.10”代表求均值之差的雙側(cè)90.0%置信區(qū)間,相當于單側(cè)95.0%置信區(qū)間。
【SAS主要輸出結(jié)果及解釋】
以上結(jié)果分別為兩組總膽固醇變化量的均值以及它們差值的均值、標準差、標準誤、雙側(cè)90.0%(相當于單側(cè)95.0%)置信區(qū)間等信息。
根據(jù)方差齊性檢驗的結(jié)果(EqualityofVariances),F(xiàn)=1.91,P>0.05,認為兩總體方差相等。對應的t檢驗結(jié)果中,應該參照匯總方法(Pooled),對應方差相等時的計算結(jié)果。
若采用置信區(qū)間法,需要參考兩組效應差值的95%CLMean的下限,再與δL(取負值)進行比較,得出統(tǒng)計結(jié)論。
統(tǒng)計與專業(yè)結(jié)論:t=2.14,P=0.0179,按照α=0.05,拒絕H0,接受H1,可以認為地賜康的血脂調(diào)節(jié)效果不劣于血脂康膠囊,結(jié)合地賜康沖劑價格以及患者的服藥依從性,可以考慮在臨床推廣應用。此外,按照單側(cè)95%的置信度,兩組效應差值的置信區(qū)間下限CL為-0.3473>-0.52(非劣效界值),可以下非劣效性的結(jié)論,與假設檢驗的結(jié)果一致,即可以認為地賜康的血脂調(diào)節(jié)效果非劣效于血脂康膠囊的血脂調(diào)節(jié)效果。
在非劣效性分析中,先驗確定了兩種治療方法之間的可接受的差異δL,但非劣效性界值的設定是研究設計時最復雜的問題。由于確定的非劣效界值一般很小,導致非劣效設計中陽性對照的樣本量需求大于安慰劑對照,而樣本量的確定高度依賴于界值和試驗方法的效應,這些都必須明確而具有現(xiàn)實性[11]。關于非劣效或者等效性研究的文獻有很多混亂及缺陷,如界值的正確選取、樣本量的合理計算等。造成這一問題的重要原因是術語缺乏統(tǒng)一性和通透性,這是應用新方法時不可避免的。但可以預料的是,隨著這些方法的應用和研究指南的不斷改善,科學研究將會向著正確的方向更進一步[12]。
少數(shù)情況下當安慰劑對照不被允許或違反倫理,或者想要與已上市的有效藥物或標準治療方案進行比較以求能獲得一個新的治療選擇時,可以考慮進行非劣效性分析。這種類型的分析存在一些缺點,如依賴于之前對照的結(jié)果以及確定非劣效界值較復雜。但是這些缺點可能會被其優(yōu)點所抵消,如能夠包含多種終點類型(二分類、有序變量、連續(xù)變量等),基于治療方法和適應癥,能夠比安慰劑對照更具有倫理學意義。
隨著非劣效設計的普遍應用,需注意在研究過程中遵守和維持此類有效性研究的基本原則和報告標準。通過合理的設計和執(zhí)行,非劣效性試驗能夠提供具有臨床價值的創(chuàng)新治療方案。