胡純嚴(yán) ,胡良平 ,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
在常規(guī)的臨床研究中,研究者常關(guān)注的是藥物的療效和安全性,對兩種藥物或治療方案的效果進(jìn)行比較時,通常都采用一般差異性檢驗(yàn)[1-2];而在新藥(或醫(yī)療器械)的臨床試驗(yàn)研究中,雖然仍關(guān)注療效和安全性,但在對療效進(jìn)行評價時,常需要結(jié)合臨床實(shí)際,提出一些應(yīng)當(dāng)滿足的前提條件(例如對兩種藥物的有效率進(jìn)行比較時,要求試驗(yàn)藥的有效率不應(yīng)比對照藥的有效率低10%,才允許試驗(yàn)藥投入生產(chǎn)并進(jìn)入臨床使用),以便使療效的評價更加科學(xué)、合理和實(shí)用。也就是除一般差異性檢驗(yàn)之外,還可能需要采取非劣效性檢驗(yàn)或等效性檢驗(yàn)或優(yōu)效性檢驗(yàn)[3]。本文將結(jié)合臨床實(shí)際,介紹與“兩總體率比較的非劣效性檢驗(yàn)”有關(guān)的內(nèi)容。
非劣效性檢驗(yàn)是指主要研究目的為顯示試驗(yàn)藥的治療效果在臨床上不比陽性對照藥差的試驗(yàn)。在試驗(yàn)設(shè)計(jì)階段需要設(shè)定一個界值δL(通常取負(fù)值,代表“差或劣”),將其代入檢驗(yàn)統(tǒng)計(jì)量中進(jìn)行計(jì)算。若計(jì)算結(jié)果為P≤α(通常取α=0.05),就可以明確判定試驗(yàn)藥的療效非劣效于對照藥;反之亦然[3-4]。
【例1】為評價度洛西汀腸溶膠囊(試驗(yàn)藥,簡稱A藥)治療抑郁癥的效果,采用隨機(jī)、雙盲、氟西?。▽φ账帲喎QB藥)平行對照的方法進(jìn)行試驗(yàn)。受試者分別口服度洛西汀腸溶膠囊或氟西汀膠囊,共觀察6周。其中,試驗(yàn)組111例患者,對照組117例患者。治療后,試驗(yàn)組和對照組的有效率分別為87.39%(有效例數(shù)n=97)和88.89%(有效例數(shù)n=104)。根據(jù)臨床實(shí)際,設(shè)置非劣效性界限為-10%。試評價度洛西汀腸溶膠囊治療抑郁癥的效果是否非劣效于氟西汀膠囊的治療效果[5]。臨床資料見表1。
表1 兩組患者的治療效果
【對數(shù)據(jù)結(jié)構(gòu)的分析】該資料的試驗(yàn)因素為“藥物種類”,其兩個水平分別為“度洛西汀腸溶膠囊”與“氟西汀膠囊”,觀測指標(biāo)為“有效率”,所以該資料為成組設(shè)計(jì)一元定性資料。
【統(tǒng)計(jì)分析方法的選擇】研究者的研究目的是評價度洛西汀腸溶膠囊治療抑郁癥的效果是否非劣效于氟西汀膠囊的治療效果,并且設(shè)定了非劣效性界值δL=-10%,這時應(yīng)選用非劣效性檢驗(yàn)。
1.3.1 檢驗(yàn)假設(shè)
給出檢驗(yàn)假設(shè),并規(guī)定檢驗(yàn)水準(zhǔn)α的值。
H0:πT-πR≤ δL;
H1:πT-πR> δL;
α=0.05(單側(cè))。
1.3.2 檢驗(yàn)統(tǒng)計(jì)量
所需要的檢驗(yàn)統(tǒng)計(jì)量如下式:
拒絕域?yàn)閆>Z1-α。
在式(1)中,檢驗(yàn)統(tǒng)計(jì)量Z服從標(biāo)準(zhǔn)正態(tài)分布;(PT、nT)與(PR、nR)分別為試驗(yàn)組(T)與對照組(R)的“樣本率、樣本含量”;δL為非劣效性界值(通常取負(fù)值)。
1.3.3 基于檢驗(yàn)統(tǒng)計(jì)量Z的取值計(jì)算單側(cè)尾端概率
根據(jù)檢驗(yàn)水準(zhǔn)查表或借助相應(yīng)的SAS函數(shù)進(jìn)行計(jì)算,獲得檢驗(yàn)統(tǒng)計(jì)量Z的臨界值(針對手工計(jì)算而言)和(或)標(biāo)準(zhǔn)正態(tài)分布尾端的概率(針對統(tǒng)計(jì)軟件而言)。
1.3.4 得出統(tǒng)計(jì)學(xué)結(jié)論和專業(yè)結(jié)論
根據(jù)拒絕還是不能拒絕H0的結(jié)果,得出統(tǒng)計(jì)學(xué)結(jié)論,最后結(jié)合專業(yè)知識得出專業(yè)結(jié)論。
基于SAS語言和標(biāo)準(zhǔn)正態(tài)分布函數(shù)等知識[6]并按式(1)進(jìn)行編程,就可間接實(shí)現(xiàn)兩總體率比較非劣效性Z檢驗(yàn)。
SAS程序如下:
【程序說明】變量名后面為“_t”與“_r”分別代表“試驗(yàn)組”與“對照組”相應(yīng)的量(包括樣本含量與有效率);有效率采用6位小數(shù)表示的目的是使計(jì)算結(jié)果盡可能精確,以助于與后面基于FREQ過程直接計(jì)算的結(jié)果具有一定的可比性;在評價指標(biāo)為高優(yōu)指標(biāo)時(例如本例中為“有效率”,其值越大越好),非劣效性界值應(yīng)采用負(fù)值來表示。
【SAS輸出結(jié)果】
【統(tǒng)計(jì)學(xué)結(jié)論】因Z=1.983,P=0.023696(單側(cè)概率)<0.05,所以,應(yīng)拒絕H0,接受H1。
【專業(yè)結(jié)論】在非劣效界值δL=-10%的前提條件下,度洛西汀腸溶膠囊治療抑郁癥的效果非劣效于氟西汀膠囊的治療效果。
由于SAS中FREQ過程包含了幾乎絕大多數(shù)定性資料假設(shè)檢驗(yàn)方法[7],故此處將采用FREQ過程來直接實(shí)現(xiàn)兩總體率比較非劣效性Z檢驗(yàn)。
SAS程序如下:
【程序說明】各組中的數(shù)據(jù)應(yīng)為“有效例數(shù)”與“無效例數(shù)”,而不適合直接采用“有效率”;程序中noninf表示進(jìn)行非劣效性檢驗(yàn);MARGIN=0.10表示非劣效界值(注意:因?yàn)樵赟AS程序的“tables”語句中的選項(xiàng)“noninf”指明為“非劣效性檢驗(yàn)”,故此處非劣效界值不使用負(fù)值)。
【SAS主要輸出結(jié)果及解釋】
因Z=1.9828,P=0.0237,說明度洛西汀腸溶膠囊治療抑郁癥的效果非劣效于氟西汀膠囊的治療效果;若利用置信區(qū)間來判斷,由計(jì)算結(jié)果可知:兩有效率之差的90%置信區(qū)間為[-0.0855,0.0555],因置信區(qū)間位于δL=-0.10的右側(cè),說明非劣效性結(jié)論成立。
3.1.1 影響非劣效性檢驗(yàn)結(jié)果的因素
3.1.1.1 概述
非劣效性檢驗(yàn)結(jié)果不是絕對的,隨著條件的改變,最終的檢驗(yàn)結(jié)果也會發(fā)生相應(yīng)的改變。具體地說,影響其結(jié)果的因素有“顯著性水平α”“非劣效性界值δL”和“樣本含量”。
3.1.1.2 α的取值對非劣效性檢驗(yàn)結(jié)果的影響
非劣效性檢驗(yàn)結(jié)果與δL和α的取值有密切關(guān)系。例如在本文中,若保持δL=-10%,但取α=0.01,則無法得出“非劣效”的結(jié)論(因p=0.0237>0.01);文獻(xiàn)[8]要求,進(jìn)行非劣效性檢驗(yàn)時取α=0.025(單側(cè))。事實(shí)上,這只是把犯假陽性錯誤的概率從常規(guī)的0.05降低到0.025;與此同時,犯假陰性錯誤的概率會有所增大。因?yàn)榉橇有詸z驗(yàn)本身就要求進(jìn)行“單側(cè)檢驗(yàn)”,而檢驗(yàn)水準(zhǔn)α的取值在統(tǒng)計(jì)學(xué)上習(xí)慣取0.05或0.01,一般來說,其取值不應(yīng)隨采取“雙側(cè)檢驗(yàn)”還是“單側(cè)檢驗(yàn)”而改變。這一點(diǎn)從本文“2.2”中的SAS輸出結(jié)果中就可看出:在沒有特別設(shè)定顯著性水平[即采用SAS軟件中默認(rèn)的顯著性水平α=0.10(雙側(cè)),等價于α=0.05(單側(cè))]的前提條件下,進(jìn)行非劣效性檢驗(yàn),SAS在計(jì)算出Z值和單側(cè)概率的同時,還給出了兩率之差的“90%置信區(qū)間”。這就意味著在此置信區(qū)間的左、右兩端各去掉了“5%”,也就是說,其單側(cè)尾端概率(即設(shè)定非劣效性檢驗(yàn)的顯著性水平)為α=0.05。
3.1.1.3 δL的取值對非劣效性檢驗(yàn)結(jié)果的影響
就本文例1而言,若取α=0.05但將δL取為“-5%”,得到的結(jié)果為Z=0.81623,P=0.20718>0.05,此時,就無法得出“非劣效”的結(jié)論了。由此可知,非劣效界值的確定是至關(guān)重要的。一般來說,其值的確定應(yīng)有充分的臨床專業(yè)知識為依據(jù)。通常需要結(jié)合已有文獻(xiàn)提供的信息、當(dāng)前臨床試驗(yàn)研究預(yù)試驗(yàn)的結(jié)果和多位從事所研究問題且有豐富臨床經(jīng)驗(yàn)的專家的共識,綜合考慮來確定δL的取值。
3.1.1.4 樣本含量對非劣效性檢驗(yàn)結(jié)果的影響
在本文例1中,若保持取顯著性水平α=0.05、δL=-10%、A藥的有效率為87.27%(與表1中的87.39%接近)、B藥的有效率為88.14%(與表1中的88.89%接近),但兩組的樣本含量都減少一半,即A藥組有效例數(shù)為48例、無效例數(shù)為7例;B藥組有效例數(shù)為52例、無效例數(shù)為7例。此時,進(jìn)行非劣效性檢驗(yàn),其結(jié)果為Z=1.4832,P=0.0689>0.05,結(jié)論就變成了“A藥劣效于B藥”。
而需注意的是,在擬開展非劣效性試驗(yàn)研究之初期,就應(yīng)當(dāng)按照已知的條件[包括兩組估計(jì)的有效率、顯著性水平α的值、檢驗(yàn)效能(1-β)的值和非劣效性界值δL的值],找到相應(yīng)的計(jì)算公式,估計(jì)出合適的樣本含量[3]。
3.1.2 主要療效評價指標(biāo)的臨床意義
在進(jìn)行非劣效性檢驗(yàn)時,一個常被忽視的問題是評價指標(biāo)的臨床意義。具體地說,就是應(yīng)明確當(dāng)前的評價指標(biāo)究竟屬于“高優(yōu)指標(biāo)(指標(biāo)取值越大越好,如治愈率)”還是“低優(yōu)指標(biāo)(指標(biāo)取值越小越好,如死亡率)”。當(dāng)面對高優(yōu)指標(biāo)時,通常情況下,試驗(yàn)組指標(biāo)的取值低于對照組指標(biāo)的取值時才適合考慮選用“非劣效性檢驗(yàn)”;如果在較大樣本含量的預(yù)試驗(yàn)中,已獲得的試驗(yàn)結(jié)果是“試驗(yàn)組指標(biāo)的取值明顯高于對照組指標(biāo)的取值”,此時,不適合選用“非劣效性檢驗(yàn)”,而應(yīng)當(dāng)考慮選用“等效性檢驗(yàn)”或“優(yōu)效性檢驗(yàn)”[3]。
3.1.3 δL是否總是取負(fù)值
在進(jìn)行非劣效性檢驗(yàn)時,統(tǒng)計(jì)學(xué)教科書上通常都默認(rèn)把δL取為“負(fù)值”,代表試驗(yàn)藥療效比對照藥療效“差”。事實(shí)上,這樣做有一個隱含的前提,即療效的評價指標(biāo)為“高優(yōu)指標(biāo)”。而當(dāng)療效的評價指標(biāo)為低優(yōu)指標(biāo)時,若擬采用非劣效性檢驗(yàn),此時,其界值δL應(yīng)取正值。
本文介紹了兩總體率比較非劣效性Z檢驗(yàn)的原理、方法和SAS實(shí)現(xiàn)。在SAS實(shí)現(xiàn)方面,介紹了基于SAS語言編程間接實(shí)現(xiàn)兩總體率比較非劣效性Z檢驗(yàn)以及基于SAS中FREQ過程直接實(shí)現(xiàn)與前面提及的相同計(jì)算。在后者中,還給出了兩總體率之差的置信區(qū)間?;谥眯艆^(qū)間也可以判斷非劣效性結(jié)論是否成立。