復(fù)旦大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)與社會(huì)醫(yī)學(xué)教研室,公共安全教育部重點(diǎn)實(shí)驗(yàn)室(200032) 肖林海 趙耐青
在實(shí)際的臨床試驗(yàn)中,有時(shí)由于諸多因素的限制,并不總能進(jìn)行隨機(jī)對(duì)照的臨床試驗(yàn),特別是在某些醫(yī)療器械臨床試驗(yàn)中,往往由于倫理學(xué)或臨床操作可行性的問題,很難進(jìn)行隨機(jī)對(duì)照的臨床試驗(yàn)。因此,一些非隨機(jī)對(duì)照的設(shè)計(jì)方法應(yīng)運(yùn)而生,目標(biāo)值法(objective performance criteria, OPC)設(shè)計(jì)就是其中之一,該法通常為單臂臨床試驗(yàn)(single-arm clinical trial),故又叫單組目標(biāo)值法[1]。
目標(biāo)值法的臨床試驗(yàn)是將被試產(chǎn)品的主要評(píng)價(jià)指標(biāo)的雙側(cè)95%置信區(qū)間的上/下限與預(yù)先設(shè)定的目標(biāo)值進(jìn)行比較的單組試驗(yàn),通常其主要評(píng)價(jià)指標(biāo)為定性指標(biāo)或定量指標(biāo),而定量指標(biāo)的研究問題本質(zhì)是單樣本定量資料與總體的比較,可采用單樣本t檢驗(yàn)完成,該問題已得到較好的解決[2]。
針對(duì)定性指標(biāo),本文以結(jié)局為二分類變量時(shí)以率作為終點(diǎn)評(píng)價(jià)指標(biāo)的單組臨床試驗(yàn)為研究背景,就目標(biāo)值法的樣本含量估計(jì)和統(tǒng)計(jì)分析方面存在的問題進(jìn)行討論。
二分類變量以率作為終點(diǎn)評(píng)價(jià)指標(biāo)的單組臨床試驗(yàn),其統(tǒng)計(jì)學(xué)本質(zhì)實(shí)際是樣本率與總體率比較的問題。經(jīng)典的估計(jì)樣本量的方法是采用漸進(jìn)正態(tài)法,可利用以下公式[2]:
其中:Z1-α、Z1-β為標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)。
P1:被試產(chǎn)品預(yù)期的主要評(píng)價(jià)指標(biāo)值(如:有效率、成功率、事件發(fā)生率等)
P0:目標(biāo)值
α:犯第I類錯(cuò)誤的概率;
β:犯第II類錯(cuò)誤的概率
但用該方法進(jìn)行樣本含量的估計(jì)時(shí),要求結(jié)局事件發(fā)生率P1不太接近于1或0。且樣本量n足夠大時(shí),特別是當(dāng)nP1和n(1-P1)都大于5時(shí),才可以采用漸進(jìn)正態(tài)估計(jì)的方法進(jìn)行統(tǒng)計(jì)分析。
上述樣本量計(jì)算公式,雖然計(jì)算簡便,但不夠準(zhǔn)確,尤其是在實(shí)際臨床試驗(yàn)中,結(jié)局事件發(fā)生率靠近極端的情況,此時(shí)估計(jì)樣本含量出現(xiàn)的偏差相對(duì)更大。
對(duì)于定性指標(biāo)的單組目標(biāo)值試驗(yàn),除漸進(jìn)正態(tài)法外,也可采用精確概率法作為樣本量與統(tǒng)計(jì)分析的方法。以下重點(diǎn)闡述精確概率法進(jìn)行單組目標(biāo)值法的樣本量估計(jì)原理,并通過Stata編程進(jìn)行實(shí)現(xiàn)。
1.精確概率法假設(shè)檢驗(yàn)的基本思想:
精確概率法的基本思想與其他假設(shè)檢驗(yàn)的基本思想是類似的,其本質(zhì)是把樣本點(diǎn)或檢驗(yàn)統(tǒng)計(jì)量的各種可能取值的范圍分為拒絕域和不拒絕域,并且在H0為真的情況下,樣本點(diǎn)或檢驗(yàn)統(tǒng)計(jì)量出現(xiàn)在拒絕域的概率≤α。因此,當(dāng)樣本點(diǎn)或檢驗(yàn)統(tǒng)計(jì)量落在拒絕域范圍時(shí),則拒絕H0,反之,則不拒絕H0。
以下以單側(cè)檢驗(yàn)為例,具體闡述如下:
右單側(cè)檢驗(yàn):H0:π=π0vsH1:π>π0
左單側(cè)檢驗(yàn):H0:π=π0vsH1:π<π0
其中,π0為目標(biāo)值,π為樣本所代表的總體的反應(yīng)率,定義顯著性水平為α。
如果樣本點(diǎn)x屬于拒絕域,根據(jù)假設(shè)檢驗(yàn)的小概率事件原理,則所有小于Px時(shí)對(duì)應(yīng)的事件A出現(xiàn)的次數(shù)i,更應(yīng)歸入拒絕域內(nèi),并且拒絕域范圍內(nèi)所有取值點(diǎn)的累計(jì)概率應(yīng)≤α。對(duì)于單側(cè)檢驗(yàn),只需要根據(jù)H1的方向,計(jì)算樣本點(diǎn)及H1方向的所有累計(jì)概率。因此,
2.把握度的計(jì)算
記樣本所在總體的實(shí)際發(fā)生率為πT。
3.單側(cè)檢驗(yàn)的樣本量估計(jì)方法
右單側(cè)檢驗(yàn)的樣本量估計(jì):
給定α和β,給定H0:π=π0和給定樣本所在總體的發(fā)生率πT
(1)由于單樣本檢驗(yàn)的樣本量一般都是大于5,所以初始樣本量為5,用計(jì)算機(jī)軟件,對(duì)每固定一個(gè)樣本量n,
(2)選擇滿足xk使PR-value(xk)≤α且滿足|PR-value(xk)-α|≤|PR-value(x)-α|,如果找不到xk,則n增加1,重復(fù)上述過程,直到找到xk使PR-value(xk)≤α且滿足|PR-value(xk)-α|≤|PR-value(x)-α|
(4)如果power<1-β,則n增加1,重復(fù)第(2)步,第(3)步,直至滿足power≥1-β,終止,這個(gè)n就是所要估計(jì)的樣本量。
左單側(cè)檢驗(yàn)的樣本量估計(jì):
給定α和β,給定H0:π=π0和給定樣本所在總體的發(fā)生率πT
(1)由于單樣本檢驗(yàn)的樣本量一般都是大于5,所以初始樣本量為5,用計(jì)算機(jī)軟件,對(duì)每固定一個(gè)樣本量n,
(2)選擇滿足xk使PL-value(xk)≤α且滿足|PL-value(xk)-α|≤|PL-value(x)-α|,如果找不到xk,則n增加1,重復(fù)上述過程,直到找到xk使PL-value(xk)≤α且滿足|PL-value(xk)-α|≤|PL-value(x)-α|
(4)如果power<1-β,則n增加1,重復(fù)第(2)步,第(3)步,直至滿足power≥1-β,終止,這個(gè)n就是所要估計(jì)的樣本量。
Stata是一個(gè)小型的統(tǒng)計(jì)軟件,統(tǒng)計(jì)功能非常全面,運(yùn)算速度非??靃3]。ado文件是用Stata自己的語言編寫的高級(jí)統(tǒng)計(jì)模塊。本文編寫的ado程序文件是按前文所述的算法用Stata實(shí)現(xiàn)精確概率法估計(jì)單樣本率檢驗(yàn)的樣本量估計(jì)。
1、程序名為sampleexact。
該程序有4個(gè)參數(shù),第一個(gè)參數(shù)是alpha:第I類錯(cuò)誤,第二個(gè)參數(shù)是 beta:第II類錯(cuò)誤,第三個(gè)參數(shù)是P0:目標(biāo)總體率,第四個(gè)參數(shù)是P1:樣本所代表的總體的發(fā)生率。
下面是編寫的程序:
clear
capture program drop sampleexact
program define sampleexact/*定義程序名為sampleexact*/
version 11
args alpha beta p0p1/*要求輸入的四個(gè)參數(shù)*/
quietly {
if ‘p1’>‘p0’{/*右單側(cè)*/
local i=5/*設(shè)置初始樣本量為5*/
while ‘i’<=200000{
local k=int(‘i’*‘p0’+0.5)/*設(shè)置觀察到的事件發(fā)生數(shù)k*/
while ‘k’<=‘i’{
bitesti ‘i’ ‘k’ ‘p0’/*bitesti命令*/
if r(p_u)<=‘a(chǎn)lpha’ {/*右單側(cè)的概率小于alpha */
local kkk=‘k’
bitesti ‘i’ ‘k’ ‘p1’
if r(p_u)>(1-‘beta’ ){ /*要求把握度大于1-beta */
scalar nn=‘i’/*此時(shí)的i即為算得的樣本量nn */
local i=1000000000
}
local k=‘i’+1
}
else {
local k=‘k’+1
}
}
local i=‘i’+1
}
}
else {/*左單側(cè)*/
local i=5
while ‘i’<=20000{
local kk=int(‘i’*‘p0’+0.5)
local k=‘kk’
while ‘k’>=0{
bitesti ‘i’ ‘k’ ‘p0’
if r(p_l)<=‘a(chǎn)lpha’ {
local kkk=‘k’
bitesti ‘i’ ‘k’ ‘p1’
if r(p_l)>(1-‘beta’) {/*要求把握度大于1-beta */
scalar nn=‘i’
local i=10000000
}
local k=-1
}
else {
local k=‘k’-1
}
}
local i=‘i’+1
}
}
}
local nnn=nn
if ‘p0’<‘p1’{
di "右單側(cè)檢驗(yàn)的樣本量估計(jì)"
}
else {
di "左單側(cè)檢驗(yàn)的樣本量估計(jì)"
}
di "sample size=" nn /*輸出樣本量的計(jì)算結(jié)果,為nn*/
bitesti ‘nnn’ ‘kkk’ ‘p0’
bitesti ‘nnn’ ‘kkk’ ‘p1’
if ‘p0’<‘p1’{
di "右單側(cè)檢驗(yàn)的power=" r(p_u) /*輸出檢驗(yàn)的把握度*/
}
else {
di "左單側(cè)檢驗(yàn)的power=" r(p_l) /*輸出檢驗(yàn)的把握度*/
}
end
2. ado程序文件使用方法
將該ado程序文件復(fù)制到Stata安裝目錄下的adoase,然后在Stata操作界面上輸入連接命令net set ado Stata 安裝目錄(首次使用時(shí)需要輸入)。如安裝在C盤,則輸入命令: net set ado c:stataadoase 即可。最后,在命令窗口輸入欲實(shí)現(xiàn)的統(tǒng)計(jì)分析命令即可。
以事件發(fā)生率很低為例,假定單側(cè)檢驗(yàn)的α=0.05,Power=0.80,p0=0.05,預(yù)期事件發(fā)生率為0.001。
用精確概率法算得的樣本量為59,正態(tài)近似法算得的樣本量為62。分別進(jìn)行精確概率法的假設(shè)檢驗(yàn)和正態(tài)近似法的假設(shè)檢驗(yàn),利用SAS9.3軟件模擬10000次,所得結(jié)果見表1。
表1 模擬結(jié)果
由上述結(jié)果可看出,在事件發(fā)生率很低,本例為0.001時(shí),用正態(tài)近似法算得樣本量為62,但不滿足nP1大于5的條件。在此情況下,仍用正態(tài)近似法與精確法算得的樣本量進(jìn)行假設(shè)檢驗(yàn),由結(jié)果看出,精確法檢驗(yàn)的一類錯(cuò)誤要遠(yuǎn)小于近似法,其把握度也更高,且在真實(shí)的率差別減小時(shí),兩者的把握度差別也更明顯。
樣本量估計(jì)是臨床試驗(yàn)設(shè)計(jì)中極為重要的環(huán)節(jié),充足的樣本量才能保證試驗(yàn)有足夠的把握度發(fā)現(xiàn)實(shí)際存在的差異。無論采用漸進(jìn)正態(tài)法還是精確概率法,在結(jié)果分析(即計(jì)算結(jié)果95%置信區(qū)間)時(shí)所采用的方法應(yīng)與試驗(yàn)設(shè)計(jì)時(shí)一致。即使用漸進(jìn)正態(tài)法估計(jì)樣本量時(shí),則結(jié)果的分析也要基于漸進(jìn)正態(tài)法。若采用精確概率法估計(jì)樣本量時(shí),則結(jié)果的分析要基于精確概率法。如果試驗(yàn)設(shè)計(jì)時(shí)采用漸進(jìn)正態(tài)法計(jì)算樣本量,但結(jié)果分析時(shí)卻采用精確概率法計(jì)算95%置信區(qū)間,則可能導(dǎo)致研究實(shí)際的把握度無法達(dá)到設(shè)計(jì)時(shí)的預(yù)期水平。
本文并沒有對(duì)雙側(cè)檢驗(yàn)進(jìn)行樣本量估計(jì),是因?yàn)橛镁_概率法與漸進(jìn)正態(tài)法原理不同。采用漸進(jìn)正態(tài)法時(shí),對(duì)α=0.05的雙側(cè)檢驗(yàn),由于概率分布的對(duì)稱性,其對(duì)實(shí)際問題單側(cè)檢驗(yàn)時(shí)的假陽性率為0.025。但用精確概率法檢驗(yàn)時(shí),由于二項(xiàng)分布的不對(duì)稱性,若采用雙側(cè)檢驗(yàn)則無法保證單側(cè)的假陽性率為0.025。由于實(shí)際研究的問題往往是單側(cè)的,因此建議精確概率法檢驗(yàn)時(shí)采用單側(cè)檢驗(yàn),這樣才能保證,假陽性率仍為0.025。
在成琪等人的文章[4]中,也對(duì)單組臨床試驗(yàn)?zāi)繕?biāo)值法的精確樣本含量估計(jì)給出了常見參數(shù)的樣本量估計(jì)結(jié)果列表,本文利用Stata程序也算出相應(yīng)參數(shù)時(shí)的樣本量,與成琪等人列表中得到的樣本量估計(jì)一致,但利用Stata程序更加方便快捷,且不受限于參數(shù)的設(shè)定。
本文給出了二分類變量以率為結(jié)局指標(biāo)的單組臨床試驗(yàn)?zāi)繕?biāo)值法樣本含量計(jì)算的精確方法,并給出了Stata程序,可使研究者對(duì)樣本量的估計(jì)更加方便和準(zhǔn)確,在實(shí)際研究中有較好的推廣意義。
參 考 文 獻(xiàn)
1.呂德良,李雪迎,朱賽楠,等. 目標(biāo)值法在醫(yī)療器械非隨機(jī)對(duì)照臨床試驗(yàn)中的應(yīng)用. 中國衛(wèi)生統(tǒng)計(jì),2009,26(3):258-260.
2.趙耐青主編. 衛(wèi)生統(tǒng)計(jì)學(xué). 北京:高等教育出版社,2008.
3.StataCorp.Stata Statistical Software: Release 11. College Station, TX: StataCorp LP,2009.
4.成琪,劉玉秀,陳林,等. 單組臨床試驗(yàn)?zāi)繕?biāo)值法的精確樣本含量估計(jì)及統(tǒng)計(jì)推斷. 中國臨床藥理學(xué)與治療學(xué),2011,(5):517-522.