姚婷婷 ,李長(zhǎng)平 ,2,胡良平 ,馬 駿 ,劉媛媛 *
(1.天津醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,天津 300070;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029;3.軍事科學(xué)院研究生院,北京 100850*通信作者:劉媛媛,E-mail:ivyuan10@126.com)
在進(jìn)行成組設(shè)計(jì)一元定量資料兩總體均值之間的比較時(shí),傳統(tǒng)差異性檢驗(yàn)的零假設(shè)為兩個(gè)總體均值相等,其統(tǒng)計(jì)推斷往往僅限于兩者的差異是否有統(tǒng)計(jì)學(xué)意義?;诮o定的顯著性水平α,若P>α,意味著統(tǒng)計(jì)上“不能拒絕零假設(shè)”,但并非說明零假設(shè)(兩均值相等)一定成立;若P≤α,雖然可“拒絕零假設(shè)”,但也只能推斷兩者之間的差異在統(tǒng)計(jì)學(xué)上是認(rèn)可的,而不能評(píng)價(jià)其差異的大小。在臨床上,新藥臨床試驗(yàn)的開展越來越多,由于差異性檢驗(yàn)不能準(zhǔn)確區(qū)分兩種藥物療效差異的方向性并體現(xiàn)差異大小所代表的臨床實(shí)際意義,于是,優(yōu)效性檢驗(yàn)、等效性檢驗(yàn)和非劣效性檢驗(yàn)被提出并廣泛應(yīng)用[1-2]。本文主要介紹臨床試驗(yàn)中優(yōu)效性檢驗(yàn)的相關(guān)內(nèi)容,包括優(yōu)效性檢驗(yàn)的概念、假設(shè)檢驗(yàn)的原理、樣本量的估計(jì)和界值的確定,再結(jié)合臨床實(shí)例,介紹兩算術(shù)均值比較優(yōu)效性t檢驗(yàn)及SAS實(shí)現(xiàn)。
優(yōu)效性檢驗(yàn)的主要目的是檢驗(yàn)試驗(yàn)藥的治療效果是否優(yōu)于對(duì)照藥(安慰劑對(duì)照或陽(yáng)性對(duì)照)。對(duì)于尚未上市的藥品,無論是創(chuàng)新藥還是仿制藥,以安慰劑作為對(duì)照時(shí),應(yīng)證實(shí)其優(yōu)效性[2];選擇已上市的同一治療領(lǐng)域的藥物作為陽(yáng)性對(duì)照藥時(shí)(陽(yáng)性藥物的選擇應(yīng)考慮陽(yáng)性對(duì)照藥有效性的既有證據(jù)和陽(yáng)性對(duì)照藥物效應(yīng)的穩(wěn)定性[3]),當(dāng)預(yù)試驗(yàn)的結(jié)果表明試驗(yàn)藥的效果不僅比對(duì)照藥效果好,而且兩者之間效應(yīng)指標(biāo)的差量在數(shù)量上相當(dāng)可觀,結(jié)合臨床專業(yè)知識(shí)可知,此差量具有臨床上的實(shí)際意義,此時(shí)為了通過正式臨床試驗(yàn),顯示試驗(yàn)藥的治療效果優(yōu)于對(duì)照藥,可選用優(yōu)效性檢驗(yàn)[4]。在試驗(yàn)設(shè)計(jì)階段需要設(shè)定一個(gè)界值δU來界定試驗(yàn)藥的優(yōu)效性。δU取正值,表示“方向”,即當(dāng)療效指標(biāo)為高優(yōu)指標(biāo)時(shí),試驗(yàn)藥的效應(yīng)指標(biāo)的取值大于陽(yáng)性藥的效應(yīng)指標(biāo)的取值,這是一個(gè)單側(cè)檢驗(yàn)。
對(duì)兩均值比較的優(yōu)效性試驗(yàn),若評(píng)價(jià)指標(biāo)為高優(yōu)指標(biāo),如生存時(shí)間,即均值越大表明療效越好,其相應(yīng)的檢驗(yàn)假設(shè)如下。
無效假設(shè)H0:μT-μR≤δU(兩種藥物療效相等或試驗(yàn)藥劣于對(duì)照藥)
備擇假設(shè)H1:μT-μR>δU(試驗(yàn)藥優(yōu)于對(duì)照藥)
對(duì)兩均值比較的優(yōu)效性試驗(yàn),若評(píng)價(jià)指標(biāo)為低優(yōu)指標(biāo),如疾病持續(xù)時(shí)間,即均值越小表明療效越好,其相應(yīng)的檢驗(yàn)假設(shè)為:
無效假設(shè)H0:μR-μT≤δU(兩種藥物療效相等或試驗(yàn)藥劣于對(duì)照藥)
備擇假設(shè)H1:μR-μT>δU(試驗(yàn)藥優(yōu)于對(duì)照藥)
其中,μT為試驗(yàn)組總體均值,μR為對(duì)照組總體均值,δU為優(yōu)效性界值,當(dāng)δU為0時(shí),分析方法與差異性檢驗(yàn)相同。
以下基于“高優(yōu)指標(biāo)”的前提,給出成組設(shè)計(jì)一元定量資料兩均值比較時(shí)優(yōu)效性檢驗(yàn)所需要的t檢驗(yàn)統(tǒng)計(jì)量:
在實(shí)際應(yīng)用中,還可采用置信區(qū)間法檢驗(yàn),它是分析時(shí)最直接的方法,且相比于假設(shè)檢驗(yàn)可提供更多的信息。對(duì)于兩個(gè)均值比較的優(yōu)效性檢驗(yàn),按單側(cè)(1-α)%的置信度,計(jì)算單側(cè)置信區(qū)間下限CL,公式如下:
若(CL,∞)不包括δU,即CL>δU,可以得出試驗(yàn)組療效優(yōu)于對(duì)照組的結(jié)論[5]。
從臨床意義上確認(rèn)藥物的療效,界值的確定不可缺少。在優(yōu)效性試驗(yàn)中,界值是指試驗(yàn)藥與對(duì)照藥之間相差的臨床上認(rèn)可的最小值[6]。優(yōu)效性試驗(yàn)中僅用一個(gè)界值,界值的確定必須在試驗(yàn)設(shè)計(jì)階段完成并在試驗(yàn)方案中闡明,若有修訂,必須在揭盲之前進(jìn)行并陳述理由。
在確定界值時(shí),若δU太小,將可能把療效遠(yuǎn)不如對(duì)照藥的藥物判斷為優(yōu)效或等效;若δU太大,則可能將本來可推廣應(yīng)用的比對(duì)照藥更有效的藥物誤判為無效而得不到及時(shí)上市。但在實(shí)踐中界值的確定往往較復(fù)雜,需根據(jù)已有的文獻(xiàn)資料、設(shè)計(jì)類型及數(shù)據(jù)的分布類型,從臨床認(rèn)識(shí)水平及成本效益等多方面綜合考慮,將統(tǒng)計(jì)學(xué)推理和臨床判斷相結(jié)合[2]。
兩均值比較的優(yōu)效性臨床試驗(yàn)樣本量大小與兩組均值、標(biāo)準(zhǔn)差、優(yōu)效性界值、I類錯(cuò)誤和II類錯(cuò)誤大小以及兩組例數(shù)分配比例有關(guān)。兩組均值相差越小,所需樣本量越大;優(yōu)效性界值越大,所需樣本量越大;所設(shè)定的允許犯的I類錯(cuò)誤和II類錯(cuò)誤越小,所需樣本量越大[7]。對(duì)于兩均值比較的優(yōu)效性試驗(yàn),對(duì)照組樣本量估計(jì)公式如下:
上式中,μT和μC分別為試驗(yàn)組和對(duì)照組均值,σ為標(biāo)準(zhǔn)差(假設(shè)兩組標(biāo)準(zhǔn)差相同);α和β分別為犯I類錯(cuò)誤和II類錯(cuò)誤的概率;K為試驗(yàn)組與對(duì)照組例數(shù)分配比,可根據(jù)估計(jì)的對(duì)照組樣本量和分配比例K獲得試驗(yàn)組樣本量。
試驗(yàn)中,還應(yīng)考慮資料質(zhì)量、患者依從性等問題,若受試者脫落,應(yīng)在實(shí)際臨床試驗(yàn)操作中擴(kuò)充一定的病例數(shù)來校正估計(jì)實(shí)際的樣本含量。
【例1】比較泮托拉唑與奧美拉唑?qū)ο詽兂鲅颊咧寡男Ч?]。將80例消化性潰瘍出血患者隨機(jī)分為泮托拉唑組和奧美拉唑組,記錄兩組患者的出血停止時(shí)間,評(píng)價(jià)泮托拉唑?qū)ο詽兂鲅颊咧寡男Ч欠駜?yōu)于奧美拉唑(假定:經(jīng)臨床專家商定,優(yōu)效性界值取0.6 d)。數(shù)據(jù)見表1。
表1 泮托拉唑組與奧美拉唑組的出血停止時(shí)間(d)
該資料為成組設(shè)計(jì)一元定量資料,目的是評(píng)價(jià)泮托拉唑?qū)ο詽兂鲅颊咧寡男Ч欠駜?yōu)于奧美拉唑,并設(shè)定了優(yōu)效性界值,這時(shí)采用優(yōu)效性檢驗(yàn)。本例中,評(píng)價(jià)指標(biāo)為出血停止時(shí)間,數(shù)值越小表明療效越好,故評(píng)價(jià)指標(biāo)為低優(yōu)指標(biāo)。
SAS程序如下[9]:
【程序說明】在以上SAS程序中,下標(biāo)為“2”的代表對(duì)照組;由于評(píng)價(jià)指標(biāo)為低優(yōu)指標(biāo),故在計(jì)算t檢驗(yàn)統(tǒng)計(jì)量時(shí),公式(1)的分子上兩算術(shù)均值的順序要互換一下。第1步定義樣本含量、兩組樣本均值、樣本標(biāo)準(zhǔn)差和優(yōu)效性界值;第2步計(jì)算兩組樣本均值的離均差平方和;第3步計(jì)算兩組的合并方差和兩樣本平均值之差的標(biāo)準(zhǔn)誤;第4步進(jìn)行假設(shè)檢驗(yàn),計(jì)算檢驗(yàn)統(tǒng)計(jì)量t值、P值;第5步計(jì)算均值差值單側(cè)置信區(qū)間下限CL;PRINT過程步輸出計(jì)算結(jié)果。
【SAS主要輸出結(jié)果及解釋】
統(tǒng)計(jì)與專業(yè)結(jié)論:t=2.63117,P=0.005125328,按照α=0.05(單側(cè)檢驗(yàn)),拒絕H0,接受H1,可以認(rèn)為泮托拉唑?qū)ο詽兂鲅颊咧寡男Ч麅?yōu)于奧美拉唑。從95%置信區(qū)間下限來看,CL=0.71020>0.6,可以認(rèn)為泮托拉唑?qū)ο詽兂鲅颊咧寡男Ч麅?yōu)于奧美拉唑,該結(jié)論與假設(shè)檢驗(yàn)結(jié)果一致。
【例2】沿用例1中的信息,根據(jù)樣本均值、標(biāo)準(zhǔn)差模擬出與例1中樣本含量相同的隨機(jī)數(shù)。評(píng)價(jià)泮托拉唑?qū)ο詽兂鲅颊咧寡男Ч欠駜?yōu)于奧美拉唑(假定:經(jīng)臨床專家商定,優(yōu)效性界值取0.6 d)。
SAS程序如下:
【程序說明】第一步,根據(jù)例1中的樣本均值、標(biāo)準(zhǔn)差產(chǎn)生兩組服從各組對(duì)應(yīng)樣本均值、標(biāo)準(zhǔn)差的正態(tài)分布的隨機(jī)數(shù),通過seed設(shè)置種子數(shù),使模擬數(shù)據(jù)具有重現(xiàn)性;第二步,在TTEST過程中,“sides=u”表示采用上單側(cè)檢驗(yàn),“h0=0.6”為設(shè)定的優(yōu)效性界值;“alpha=0.10”代表求均值之差的雙側(cè)90.0%置信區(qū)間,相當(dāng)于單側(cè)95.0%置信區(qū)間。由于評(píng)價(jià)指標(biāo)為低優(yōu)指標(biāo),故將試驗(yàn)組設(shè)為第二組(group2),對(duì)照組設(shè)為第一組(group1)。
【SAS主要輸出結(jié)果及解釋】
以上結(jié)果分別為兩組出血停止時(shí)間的均值以及它們差值的均值、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、雙側(cè)90.0%(相當(dāng)于單側(cè)95.0%)置信區(qū)間等信息。
根據(jù)方差齊性檢驗(yàn)的結(jié)果(EqualityofVariances),F(xiàn)=2.25,P<0.05,認(rèn)為兩總體方差不等。對(duì)應(yīng)的t檢驗(yàn)結(jié)果中,應(yīng)該參照Satterthwaite方法。
統(tǒng)計(jì)與專業(yè)結(jié)論:t=2.91,P=0.0024,按照α=0.05(單側(cè)檢驗(yàn)),拒絕H0,接受H1,可以認(rèn)為泮托拉唑?qū)ο詽兂鲅颊咧寡男Ч麅?yōu)于奧美拉唑。從95%置信區(qū)間下限來看,CL=0.7612>0.6,可以認(rèn)為泮托拉唑的效果優(yōu)于奧美拉唑,該結(jié)論與假設(shè)檢驗(yàn)結(jié)果一致,即可以認(rèn)為泮托拉唑?qū)ο詽兂鲅颊咧寡男Ч麅?yōu)于奧美拉唑。
基于不同的研究目的,臨床試驗(yàn)有不同的類型,而且試驗(yàn)類型必須在試驗(yàn)設(shè)計(jì)階段確定。然而,實(shí)際工作中有些情況完全確定下來并不容易,例如對(duì)新產(chǎn)品的研發(fā)定位如果在療效上有足夠的信心認(rèn)為試驗(yàn)藥優(yōu)于陽(yáng)性對(duì)照藥,則可直接采用優(yōu)效性試驗(yàn);如果新產(chǎn)品的療效與陽(yáng)性對(duì)照藥比較并無明顯優(yōu)勢(shì),但有足夠的信心認(rèn)為療效相差處于臨床可接受范圍,關(guān)鍵是有其他方面的明顯優(yōu)勢(shì),這時(shí)可選擇非劣效性試驗(yàn)。如果對(duì)試驗(yàn)藥療效的優(yōu)勢(shì)把握不大,一般不適合貿(mào)然設(shè)計(jì)為優(yōu)效性試驗(yàn),可考慮先設(shè)計(jì)成非劣效性試驗(yàn),如果試驗(yàn)結(jié)果經(jīng)過統(tǒng)計(jì)分析(前提是基于臨床認(rèn)可的優(yōu)效性界值)能顯示出優(yōu)效性,則可按優(yōu)效性下結(jié)論,具體見文獻(xiàn)[10-11]。若按照優(yōu)效性試驗(yàn)設(shè)計(jì),而沒有得出優(yōu)效性結(jié)論,則通常不再考慮進(jìn)行非劣效推斷,畢竟在優(yōu)效性試驗(yàn)設(shè)計(jì)時(shí)一般不會(huì)考慮非劣效界值的問題,如果事后確定非劣效界值將會(huì)引入偏倚,導(dǎo)致I類錯(cuò)誤膨脹[11]。
本文詳細(xì)介紹了優(yōu)效性檢驗(yàn)的相關(guān)內(nèi)容。當(dāng)檢驗(yàn)一種藥物的療效是否優(yōu)于另一種藥物時(shí),采用優(yōu)效性試驗(yàn),在進(jìn)行試驗(yàn)設(shè)計(jì)時(shí)應(yīng)注意陽(yáng)性對(duì)照藥的選擇、界值的確定及效應(yīng)指標(biāo)定義等。當(dāng)對(duì)新藥的研發(fā)定位不明確時(shí),即對(duì)試驗(yàn)藥的療效優(yōu)勢(shì)把握不大時(shí),建議采用非劣效試驗(yàn)設(shè)計(jì)。