胡純嚴(yán) ,胡良平 ,2*
(1.軍事科學(xué)院研究生院,北京 100850;
2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
在對(duì)臨床資料進(jìn)行統(tǒng)計(jì)分析時(shí),研究者常選擇的統(tǒng)計(jì)分析方法是差異性檢驗(yàn)。其中,一般差異性檢驗(yàn)[1-3]僅考慮差異是否具有統(tǒng)計(jì)學(xué)意義,而3種特殊差異性檢驗(yàn),即非劣效性檢驗(yàn)、等效性檢驗(yàn)和優(yōu)效性檢驗(yàn)[4]除了考慮差異應(yīng)具有統(tǒng)計(jì)學(xué)意義外,還需要考慮應(yīng)具有“臨床意義”。本文將結(jié)合臨床實(shí)際,介紹與“兩總體率比較的等效性檢驗(yàn)”有關(guān)的內(nèi)容。
等效性檢驗(yàn)是指主要研究目的為顯示兩種治療效果之間的差別大小在臨床上并無(wú)重要意義的試驗(yàn)。在試驗(yàn)設(shè)計(jì)階段需要設(shè)定等效性界值(δL,δU)來(lái)界定兩種藥物或兩種治療方案的等效性[4-5]。
【例1】一個(gè)新的抗腫瘤藥物A與臨床有效藥物B對(duì)照進(jìn)行臨床試驗(yàn),選取300例符合要求的患者并隨機(jī)均分成兩組,分別接受A藥和B藥治療。試驗(yàn)結(jié)果為A藥的有效率是58.00%(有效例數(shù)n=87),B藥的有效率是46.00%(有效例數(shù)n=69)?,F(xiàn)根據(jù)臨床實(shí)際,設(shè)置等效性界限為10%,試問(wèn)兩種藥物是否等效[6]?臨床資料見表1。
表1 兩組患者的治療效果
【對(duì)數(shù)據(jù)結(jié)構(gòu)的分析】該資料的試驗(yàn)因素為“藥物種類”,其兩個(gè)水平分別為“藥物A”與“藥物B”,觀測(cè)指標(biāo)為“有效率”,所以該資料為成組設(shè)計(jì)一元定性資料。
【統(tǒng)計(jì)分析方法的選擇】研究者的研究目的是評(píng)價(jià)兩種藥物抗腫瘤效果是否等效,并且設(shè)定了等效性界值δL=-10%、δU=10%,這時(shí)應(yīng)選用等效性檢驗(yàn)。
【例2】在伊曲康唑治療手足癬的平行對(duì)照臨床試驗(yàn)中,335例患者入選,166例患者服用伊曲康唑400 mg/d,服藥1周(治愈92例),169例患者服用伊曲康唑100 mg/d,連續(xù)服藥4周(治愈98例)。設(shè)定等效性界值為12%,試問(wèn)兩種治療方案是否等效?臨床資料見表2。
表2 兩組患者的真菌感染治愈率
1.3.1 檢驗(yàn)假設(shè)
規(guī)定整個(gè)等效性檢驗(yàn)的檢驗(yàn)水準(zhǔn)α(每個(gè)單側(cè)檢驗(yàn)的檢驗(yàn)水準(zhǔn)為α'=α/2)的值。
1.3.2 檢驗(yàn)統(tǒng)計(jì)量
在式(1)和式(2)中,檢驗(yàn)統(tǒng)計(jì)量Z服從標(biāo)準(zhǔn)正態(tài)分布;(PT、nT)與(PR、nR)分別為試驗(yàn)組(T)與對(duì)照組(R)的“樣本率、樣本含量”;δL與δU分別為等效性界值的下限(下限取負(fù)值)與上限。
1.3.3 基于檢驗(yàn)統(tǒng)計(jì)量Z的取值計(jì)算單側(cè)尾端概率
根據(jù)檢驗(yàn)水準(zhǔn)查表或借助相應(yīng)的SAS函數(shù)進(jìn)行計(jì)算,獲得檢驗(yàn)統(tǒng)計(jì)量Z的臨界值(針對(duì)手工計(jì)算而言)和(或)標(biāo)準(zhǔn)正態(tài)分布尾端的概率(針對(duì)統(tǒng)計(jì)軟件而言)。
1.3.4 得出統(tǒng)計(jì)學(xué)結(jié)論和專業(yè)結(jié)論
根據(jù)拒絕還是不能拒絕H0的結(jié)果,得出統(tǒng)計(jì)學(xué)結(jié)論,最后結(jié)合專業(yè)知識(shí)得出專業(yè)結(jié)論。需注意,須同時(shí)拒絕H0(1)和H0(2),方能得出等效性結(jié)論。
基于SAS語(yǔ)言和標(biāo)準(zhǔn)正態(tài)分布函數(shù)等知識(shí)[7]并按式(1)和式(2)進(jìn)行編程,就可間接實(shí)現(xiàn)兩總體率比較等效性Z檢驗(yàn)。
由于典型的太行山地質(zhì)構(gòu)造,受儲(chǔ)水層含水量的限制,和順縣境內(nèi)泉水出漏量較小,聯(lián)村集中供水工程不易采用泉水作為供水水源,而單村供水水源采用較多。主要優(yōu)點(diǎn):(1)當(dāng)?shù)氐乃Y源達(dá)到充分利用,有效控制了地下水的開采量,使所屬區(qū)域的地下水得到充分涵養(yǎng)。(2)山泉水水質(zhì)優(yōu)良是很好的飲用水水源。(3)水源建設(shè)形式簡(jiǎn)單,投資費(fèi)用較小,多數(shù)山泉水所處地形較高屬于高地泉,水借重力流向高位水塔,后期運(yùn)行費(fèi)用低。
SAS程序如下:
【程序說(shuō)明】變量名后面的“_t”與“_r”分別代表“試驗(yàn)組”與“對(duì)照組”相應(yīng)的量(包括樣本含量與有效率)。等效性下界值應(yīng)采用負(fù)值來(lái)表示。
【SAS輸出結(jié)果】
【統(tǒng)計(jì)學(xué)結(jié)論】因Z1=3.841,P=0.000061(單側(cè)概率)<0.025,所以,應(yīng)拒絕H0(1),接受H1(1),又因Z2=0.349,P=0.63654(單側(cè)概率)>0.025,所以,應(yīng)接受H0(2)。
【專業(yè)結(jié)論】在等效界值為(-0.10,0.10)的前提條件下,藥物A與藥物B不等效。
由于SAS中FREQ過(guò)程包含了幾乎絕大多數(shù)定性資料假設(shè)檢驗(yàn)方法[8],所以,此處將采用此過(guò)程來(lái)直接實(shí)現(xiàn)兩總體率比較等效性Z檢驗(yàn)。
SAS程序如下:
【程序說(shuō)明】各組中的數(shù)據(jù)應(yīng)為“有效例數(shù)”與“無(wú)效例數(shù)”,而不適合直接采用“有效率”。程序中equiv表示進(jìn)行等效性檢驗(yàn),MARGIN=0.10表示等效界值(即下界值為-0.10、上界值為0.10),若下界值與上界值的絕對(duì)值不相等,需要明確寫出,例如:MARGIN=(-0.12,0.15)(注意:下界值必須采用負(fù)數(shù))。
第1部分輸出結(jié)果:
第2部分輸出結(jié)果:
【統(tǒng)計(jì)學(xué)結(jié)論】由第1部分輸出結(jié)果可知:因Z1=3.8414,P<0.0001(單側(cè)概率)<0.025,所以,應(yīng)拒絕H0(1),接受H1(1)。又因Z2=0.3492,P=0.6365(單側(cè)概率)>0.025,所以,應(yīng)接受H0(2)。由第2部分輸出結(jié)果可知:兩總體率之差的90%置信區(qū)間為[0.0258,0.2142],該區(qū)間包含了等效性上界值δU=0.10,說(shuō)明與上界值對(duì)應(yīng)的等效性檢驗(yàn)未通過(guò),即不等效。
【專業(yè)結(jié)論】在等效界值為(-0.10,0.10)的前提條件下,藥物A與藥物B不等效。
等效性檢驗(yàn)結(jié)果不是絕對(duì)的,隨著條件的改變,最終的檢驗(yàn)結(jié)果也會(huì)發(fā)生相應(yīng)的改變。具體地說(shuō),影響其結(jié)果的因素有“顯著性水平α”“等效性界值(δL,δU)”和“樣本含量”。
3.1.1 α的取值對(duì)等效性檢驗(yàn)結(jié)果的影響
等效性檢驗(yàn)結(jié)果與顯著性水平α有密切關(guān)系?,F(xiàn)以例2的數(shù)據(jù)為例,若取每個(gè)單側(cè)檢驗(yàn)的顯著性水平α=0.025,等效界值取為(-0.12,0.12),計(jì)算結(jié)果為Z1=1.7428,P=0.0407>α=0.025;Z2=-2.6911,P=0.0037<α=0.025,結(jié)論為兩藥不等效。若取每個(gè)單側(cè)檢驗(yàn)的顯著性水平α=0.05,由前面的計(jì)算結(jié)果(兩個(gè)P值都小于0.05)可知,結(jié)論為兩藥等效。
3.1.2 等效性界值(δL,δU)的取值對(duì)等效性檢驗(yàn)結(jié)果的影響
等效性檢驗(yàn)結(jié)果與等效性界值(δL,δU)的取值也有密切關(guān)系?,F(xiàn)仍以例2的數(shù)據(jù)為例,若取每個(gè)單側(cè)檢驗(yàn)的顯著性水平α=0.025,等效界值取為(-0.12,0.12),計(jì)算結(jié)果為Z1=1.7428,P=0.0407>α=0.025;Z2=-2.6911,P=0.0037<α=0.025,結(jié)論為兩藥不等效。若取每個(gè)單側(cè)檢驗(yàn)的顯著性水平α=0.025,等效界值取為(-0.14,0.14),計(jì)算結(jié)果為Z1=2.1123,P=0.0173<α=0.025;Z2=-3.0606,P=0.0011<α=0.025,結(jié)論為兩藥等效。
3.1.3 樣本含量對(duì)等效性檢驗(yàn)結(jié)果的影響
若保持“3.1.3”中“兩藥不等效”情況的大部分條件不變,僅改變樣本含量,例如,兩組樣本含量都擴(kuò)大10倍,即A藥組有效例數(shù)為920例,無(wú)效例數(shù)為740例;B藥組有效例數(shù)為980例,無(wú)效例數(shù)為710例。計(jì)算結(jié)果為Z1=5.5113,P<0.0001;Z2=-8.5100,P<0.0001,結(jié)論就變?yōu)椤皟伤幍刃А?。即使樣本含量擴(kuò)大2倍,也能得出“兩藥等效”的結(jié)論。需注意的是,在擬開展等效性試驗(yàn)研究之初期,就應(yīng)當(dāng)按照已知的條件[包括兩組估計(jì)的有效率、顯著性水平α的值、檢驗(yàn)效能(1-β)的值和等效性界值(δL,δU)的值],找到相應(yīng)的計(jì)算公式,估計(jì)出合適的樣本含量[4]。
本文介紹了兩總體率比較等效性Z檢驗(yàn)的原理、方法和SAS實(shí)現(xiàn)。在SAS實(shí)現(xiàn)方面,介紹了基于SAS語(yǔ)言編程間接實(shí)現(xiàn)兩總體率比較等效性Z檢驗(yàn)以及基于SAS中FREQ過(guò)程直接實(shí)現(xiàn)與前面提及的相同計(jì)算。在后者中,還給出了兩總體率之差的置信區(qū)間?;谥眯艆^(qū)間也可以判斷等效性結(jié)論是否成立。