胡純嚴 ,胡良平 ,2*
(1.軍事科學院研究生院,北京 100850;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
雖然統(tǒng)計分析方法多種多樣,但臨床科研工作者最常用的分析方法是一般差異性檢驗[1-2]。為了使假設(shè)檢驗的結(jié)果不僅具有統(tǒng)計學意義,還具有臨床實際意義,在處理臨床資料時常需要選用3種特殊的差異性檢驗,即非劣效性檢驗、等效性檢驗和優(yōu)效性檢驗[3]。本文將結(jié)合臨床實際,介紹與“兩總體率比較優(yōu)效性檢驗”有關(guān)的內(nèi)容。
優(yōu)效性檢驗是指主要研究目的為顯示試驗藥的治療效果優(yōu)效于對照藥(安慰劑對照或陽性對照)的試驗。在試驗設(shè)計階段需要設(shè)定一個界值δU,來界定試驗藥的優(yōu)效性[3-4]。
【例1】為觀察復方薤白膠囊治療慢性支氣管炎急性發(fā)作期痰熱郁肺證的效果。隨機選取240例符合要求的患者,均分為2組,試驗組口服復方薤白膠囊,對照組口服芩暴紅止咳膠囊,療程均為10 d。兩組的有效率分別為96.67%(有效例數(shù)n=116)和92.50%(有效例數(shù)n=111),如果試驗組的有效率超過對照組5%,才能認為復方薤白膠囊優(yōu)效于芩暴紅止咳膠囊,試評價復方薤白膠囊是否優(yōu)效于芩暴紅止咳膠囊[5]。臨床資料見表1。
表1 兩組患者的治療效果
【對數(shù)據(jù)結(jié)構(gòu)的分析】該資料的試驗因素為“藥物種類”,其兩個水平分別為“復方薤白膠囊”與“芩暴紅止咳膠囊”,觀測指標為“有效率”,所以該資料為成組設(shè)計一元定性資料。
【統(tǒng)計分析方法的選擇】研究者的研究目的是評價復方薤白膠囊治療慢性支氣管炎急性發(fā)作期痰熱郁肺證的效果是否優(yōu)效于芩暴紅止咳膠囊治療效果,并且設(shè)定了優(yōu)效性界值δU=5%,這時應選用優(yōu)效性檢驗。
【例2】某一臨床試驗中觀察某新藥A對某種腫瘤臨床癥狀的控制效果,以某標準藥物B作對照行隨訪研究。所有患者同時入組,觀察期為1年,主要評價指標為癥狀改善率。臨床資料見表2,如果設(shè)定優(yōu)效性界值為6%,試判斷藥物A是否優(yōu)效于藥物B。臨床資料見表2。
表2 兩組患者的癥狀改善情況
1.3.1 檢驗假設(shè)
給出檢驗假設(shè),并規(guī)定檢驗水準α的值。
H0:πT-πR≤δU;
H1:πT-πR>δU;
α=0.05(單側(cè))。
1.3.2 檢驗統(tǒng)計量
所需要的檢驗統(tǒng)計量如下式:
拒絕域為Z>Z1-α。
在式(1)中,檢驗統(tǒng)計量Z服從標準正態(tài)分布;(PT、nT)與(PR、nR)分別為試驗組(T)與對照組(R)的“樣本率、樣本含量”;δU為優(yōu)效性界值。
1.3.3 基于檢驗統(tǒng)計量Z的取值計算單側(cè)尾端概率
根據(jù)檢驗水準查表或借助相應的SAS函數(shù)進行計算,獲得檢驗統(tǒng)計量Z的臨界值(針對手工計算而言)和(或)標準正態(tài)分布尾端的概率(針對統(tǒng)計軟件而言)。
1.3.4 得出統(tǒng)計學結(jié)論和專業(yè)結(jié)論
根據(jù)拒絕還是不能拒絕H0的結(jié)果,給出統(tǒng)計學結(jié)論,最后結(jié)合專業(yè)知識給出專業(yè)結(jié)論。
基于SAS語言和標準正態(tài)分布函數(shù)等知識[6]并按式(1)進行編程,就可間接實現(xiàn)兩總體率比較優(yōu)效性Z檢驗。
SAS程序如下:
【程序說明】變量名后面的“_t”與“_r”分別代表“試驗組”與“對照組”相應的量(包括樣本含量與有效率);有效率用6位小數(shù)表示的目的是使計算結(jié)果盡可能精確一些,這樣就與后面基于FREQ過程直接計算的結(jié)果具有一定的可比性。
【SAS輸出結(jié)果】
【統(tǒng)計學結(jié)論】因Z=-0.28639,P=0.61271(單側(cè)概率)>0.05,所以,應接受H0。
【專業(yè)結(jié)論】在優(yōu)效界值δU=5%的前提條件下,尚不能認為復方薤白膠囊治療慢性支氣管炎急性發(fā)作期痰熱郁肺證的效果優(yōu)效于芩暴紅止咳膠囊的治療效果。
由于SAS中FREQ過程包含了幾乎絕大多數(shù)定性資料假設(shè)檢驗方法[7],所以,此處將采用此過程來直接實現(xiàn)兩總體率比較優(yōu)效性Z檢驗。
SAS程序如下:
【程序說明】各組中的數(shù)據(jù)應為“有效例數(shù)”與“無效例數(shù)”,而不適合直接采用“有效率”;程序中sup表示進行優(yōu)效性檢驗;MARGIN=0.05表示優(yōu)效界值。
【SAS主要輸出結(jié)果及解釋】
因Z=-0.2864,P=0.6127,說明尚不能認為復方薤白膠囊治療慢性支氣管炎急性發(fā)作期痰熱郁肺證的效果優(yōu)效于芩暴紅止咳膠囊的治療效果。若利用置信區(qū)間來判斷,由計算結(jié)果可知:兩有效率之差的90%置信區(qū)間為[-0.0062,0.0895],因置信區(qū)間包含δU=0.05,說明優(yōu)效性結(jié)論不成立。
3.1.1 影響優(yōu)效性檢驗結(jié)果的因素
3.1.1.1 概述
優(yōu)劣效性檢驗結(jié)果不是絕對的,隨著條件的改變,最終的檢驗結(jié)果也會發(fā)生相應的改變,影響其結(jié)果的因素有“顯著性水平α”“優(yōu)效性界值δU”和“樣本含量”。
3.1.1.2 α的取值對優(yōu)效性檢驗結(jié)果的影響
優(yōu)效性檢驗結(jié)果不是絕對的,與顯著性水平α的取值有密切關(guān)系?,F(xiàn)以本文例2數(shù)據(jù)為例,若取顯著性水平α=0.05,δU=6%,得到的計算結(jié)果為Z=1.7925,P=0.0365(單側(cè)概率)<α=0.05,即可以認為藥物A優(yōu)效于藥物B。若取顯著性水平α=0.025,δU=6%,得到的計算結(jié)果為Z=1.7925,P=0.0365(單側(cè)概率)>α=0.025,即不能認為藥物A優(yōu)效于藥物B。
3.1.1.3 δU的取值對優(yōu)效性檢驗結(jié)果的影響
優(yōu)效性檢驗結(jié)果與優(yōu)效性界值δU的取值有密切關(guān)系?,F(xiàn)以本文例2數(shù)據(jù)為例,若取顯著性水平α=0.05,δU=6%,得 到 的 計 算 結(jié) 果 為Z=1.7925,P=0.0365(單側(cè)概率)<α=0.05,即可以認為藥物A優(yōu)效于藥物B。若取顯著性水平α=0.05,但取δU=10%,得到的計算結(jié)果為Z=1.1361,P=0.1280(單側(cè)概率)>α=0.05,即不能認為藥物A優(yōu)效于藥物B。
3.1.1.4 樣本含量對優(yōu)效性檢驗結(jié)果的影響
現(xiàn)以本文例2數(shù)據(jù)為例,若取顯著性水平α=0.05,δU=6%,若直接按表2中的數(shù)據(jù)進行優(yōu)效性檢驗,其結(jié)論為“藥物A優(yōu)效于藥物B”。若將各組的樣本含量各減少一半,即A藥物組有效例數(shù)為41例(有效率為62.12%)、無效例數(shù)為25例;B藥物組有效例數(shù)為30例(有效率為45.45%)、無效例數(shù)為36例,基本保持兩組的有效率分別與表2中的接近。此時,優(yōu)效性檢驗的結(jié)果為Z=1.2466,P=0.1063(單側(cè)概率)>α=0.05,即不能認為藥物A優(yōu)效于藥物B,與前面的結(jié)論正好相反。需注意的是,在擬開展優(yōu)效性試驗研究之初期,就應當按照已知的條件[包括兩組估計的有效率、顯著性水平α的值、檢驗效能(1-β)的值和優(yōu)效性界值δU的值],找到相應的計算公式,估計出合適的樣本含量[3]。
3.1.2 主要療效評價指標的臨床意義
在進行優(yōu)效性檢驗時,一個常被忽視的問題是評價指標的臨床意義。具體地說,就是應明確當前的評價指標究竟屬于“高優(yōu)指標(指標取值越大越好,如治愈率)”還是“低優(yōu)指標(指標取值越小越好,如死亡率)”。當面對高優(yōu)指標時,通常情況下,試驗組指標的取值高于對照組指標的取值時才適合考慮選用“優(yōu)效性檢驗”;如果在較大樣本含量的預試驗中,已獲得的試驗結(jié)果是“試驗組指標的取值明顯低于對照組指標的取值”,若此時仍堅持選用“優(yōu)效性檢驗”就不太符合常理了。按正常思維,此時應當考慮選用“非劣效性檢驗”或“等效性檢驗”。
3.1.3 δU是否總是取正值
在進行優(yōu)效性檢驗時,統(tǒng)計學教科書上通常都默認把δU取為“正值”,代表試驗藥療效比對照藥療效“好”。事實上,這樣做有一個隱含的前提,即療效的評價指標為“高優(yōu)指標”。而當療效的評價指標為低優(yōu)指標時,若擬采用優(yōu)效性檢驗,此時,其優(yōu)效界值δU應取負值。
本文介紹了兩總體率比較優(yōu)效性Z檢驗的原理、方法和SAS實現(xiàn)。在SAS實現(xiàn)方面,介紹了基于SAS語言編程間接實現(xiàn)兩總體率比較優(yōu)效性Z檢驗以及基于SAS中FREQ過程直接實現(xiàn)與前面提及的相同計算。在后者中,還給出了兩總體率之差的置信區(qū)間。基于置信區(qū)間也可以判斷優(yōu)效性結(jié)論是否成立。