南方醫(yī)科大學生物統(tǒng)計學系(510515)
張娟娟 黃 云 陳平雁△
?
·應用研究·
衛(wèi)生經(jīng)濟學評價中基于貝葉斯NMB模型的樣本量估計方法及SAS實現(xiàn)
南方醫(yī)科大學生物統(tǒng)計學系(510515)
張娟娟黃云陳平雁△
【提要】目的通過SAS編程實現(xiàn)Bayesian方法在衛(wèi)生經(jīng)濟學評價中的樣本量估計,彌補該領域樣本量計算在操作上的不足。方法概括性地介紹Bayesian方法的理論背景,以及分析階段和設計階段的先驗信息對樣本量估計的重要性,給出樣本量估算的不等式。編寫SAS宏程序,利用迭代算法估算出不同參數(shù)組合下的樣本量。結果通過舉例展示了三種情形下的樣本量估計結果,包括:分析階段較弱、設計階段較強的先驗信息,分析階段較弱、設計階段適當?shù)南闰炐畔ⅲ约胺治鲭A段、設計階段相同的先驗信息。效果與成本的相關系數(shù)(含方向)、效應量、意愿支付界值與所需樣本量呈負相關。此外,先驗信息越強,所需樣本量越小。結論本文的SAS程序可以實現(xiàn)不同效應量、相關系數(shù)、意愿支付界值等參數(shù)組合下的Bayesian樣本量估計結果,還包括了經(jīng)典的頻率方法。
成本效果樣本量Bayesian方法SAS編程詞首字母大寫
傳統(tǒng)的衛(wèi)生經(jīng)濟學評價往往只作為臨床試驗的次要評價指標,原因是新藥注冊時不要求提供衛(wèi)生經(jīng)濟學數(shù)據(jù)[1]。隨著臨床試驗的衛(wèi)生經(jīng)濟學評價迅速發(fā)展,澳大利亞和加拿大提出新藥在批準報銷之前必須提供成本效果數(shù)據(jù)[2-3],ISPOR(international society for pharmacoeconomics and outcomes research)也給出了臨床試驗的衛(wèi)生經(jīng)濟學評價專業(yè)指導意見[4-5],從而使得衛(wèi)生經(jīng)濟學評價在新藥審批及醫(yī)療費用報銷中日益受到重視。臨床試驗的經(jīng)濟學評價首先需要考慮樣本量問題。近二十年有關衛(wèi)生經(jīng)濟學評價的樣本量估計方法被陸續(xù)提出,包括模擬方法[6],基于成本數(shù)據(jù)的分布提出的參數(shù)和非參數(shù)方法[7],基于Fieller準則的置信區(qū)間法[8],機會成本法[9]等基于經(jīng)典頻率理論的方法,也有相應的Bayesian方法[1,10]。雖然樣本量估計的方法學逐步發(fā)展,但目前尚缺乏相應的專用統(tǒng)計軟件或便利程序,從而阻礙了衛(wèi)生經(jīng)濟學評價領域中樣本量估計的普遍應用,尤其是計算過程較為復雜的Bayesian方法的應用。
本文將首先介紹Bayesian方法的理論背景,然后通過SAS 9.4編程實現(xiàn)不同參數(shù)設置下的樣本量估計,并分析各參數(shù)與樣本量及檢驗效能之間的相互影響,以期為該方法的應用提供便利工具和參考意見。
1.衛(wèi)生經(jīng)濟學評價的貝葉斯NMB模型
衛(wèi)生經(jīng)濟學評價中,常用的成本效果評價指標為凈效益(net monetary benefit,NMB),即
NMB=K△e-△c=K(μ1-μ2)-(γ1-γ2)
(1)
NMB是新方法與標準方法在貨幣尺度上的相對凈效益,是關于K的函數(shù)。式中,K表示意愿支付的界值(willing to pay,WTP),△e代表兩種方法效果的均數(shù)差,即μ1-μ2,μ1和μ2分別表示兩種方法的平均效果;△c代表兩種方法成本的均數(shù)差,即γ1-γ2,γ1和γ2分別表示兩種方法的平均成本。當NMB=0時,表示新方法相對于標準方法沒有多余的效益;當NMB>0時,表示新方法相對于標準方法是具有成本效果的。與普通的Bayesian方法(只考慮單一的先驗信息)不同,這里在分析階段和設計階段分別考慮了不同的先驗信息。
(1)分析階段
在分析階段,如果獲得數(shù)據(jù)的后驗概率至少為ω使得NMB>0,那么我們可以認為研究結果是陽性的,即新方法是具有成本效果的。ω的含義和傳統(tǒng)假設檢驗中的1-α非常類似,在Bayesian分析中,當先驗概率很弱時,其結果和傳統(tǒng)頻率理論得到的結果是相等的,此時ω=1-α。頻率方法中降低水平可以使結論更嚴格,同樣地,Bayesian方法中也可通過提高ω的值使得結論更加嚴格。
(2)設計階段
在設計階段,我們需要每組有充足的樣本量(n1和n2)使得陽性結果出現(xiàn)的概率至少為δ,即P(NMB>0)>δ。δ與頻率理論中的檢驗效能相似,但又有所不同。頻率理論中,我們假定一個真實的NMB,然后計算樣本NMB大于等于假定值的概率即為檢驗效能。而Bayesian方法中,我們假定NMB的先驗分布,然后計算先驗分布下的平均檢驗效能即為。如果設計階段NMB有很強的先驗分布,那么NMB可以取一個特定值NMB0。另一方面,如果設計階段的先驗信息很弱,那么NMB將很可能為正向的極端值或負向的極端值,致使無法求得合適的樣本量。因此,設計階段NMB應有適當?shù)南闰灧植肌?/p>
該方法假設樣本成本和效果數(shù)據(jù)服從聯(lián)合正態(tài)分布,雖然個體觀測值不服從正態(tài)分布,但是根據(jù)中心極限定理,當樣本足夠大時將會接近正態(tài)分布。同時,假設先驗分布也服從正態(tài)分布。
2.模型求解
根據(jù)分析階段的目的,獲得陽性結果需要滿足如下不等式:
(2)
(3)
(4)
其中,ρ1和ρ2分別表示每組效果與成本的相關系數(shù),n1和n2分別表示兩組的樣本量,σ1與σ2表示兩組效果的標準差,τ1與τ2表示兩組成本的標準差。
在設計階段,我們需要選擇兩組合適的樣本量使得能夠以δ的概率滿足公式(2)。因此,綜合考慮分析階段和設計階段的先驗分布,公式(2)變?yōu)椋?/p>
(5)
(6)
② 當分析階段的先驗信息很弱,設計階段有適當?shù)南闰炐畔r;③ 普通的Bayesian試驗設計方法,其中ma=md,Va=Vd。后面的實例分析將針對這三種類型逐一分析。
3.SAS程序
通過SAS的IML模塊實現(xiàn)上文公式(5)的樣本量估計,以下是SAS程序以及樣本量估計時所需的參數(shù)解釋。輸入分析階段和設計階段的先驗期望及方差、樣本標準差、成本與效果的相關系數(shù)、組間樣本量的比值、意愿支付界值、omega和delta即可得到最小組的樣本量估計值。其中omega和delta為公式(5)中的ω和δ。
%letm_analysis={5,6000,6.5,7200};/*分析階段的期望值,依次為第一組效果、第一組成本、第二組效果和第二組成本*/
%letm_design={5,6000,6.5,7200};/*設計階段的期望值,向量元素含義同上*/
%letv_analysis=.;/*分析階段的方差矩陣,如果分析其逆為0的情況則賦值為缺省值“.”,反之賦值為相應的方差矩陣即可*/
%letv_design={4 0 3 0,0 10000000 0 0,3 0 4 0,0 0 0 10000000};/*設計階段的方差矩陣*/
%letsd={4.04,8700,4.04,8700};/*樣本標準差,依次為第一組效果、第一組成本、第二組效果和第二組成本*/
%letp={0,0};/*依次為第一組和第二組中成本與效果的相關系數(shù)*/
%letr=1;/*第二組與第一組樣本量的比值,如n1∶n2=1∶2,則r=2,此時得到的是較小組的樣本量*/
%letk=10000;/*意愿支付界值*/
%letomega=0.975;/*取得陽性結果的后驗概率,*/
%letdelta=0.7;
prociml;
va=&v_analysis;
ifva=.thenva_inv=0;
elseva_inv=inv(va);
a={-&k,1,&k,-1};
sigma1=&sd[1]##2;
sigma2=&sd[3]##2;
tau1=&sd[2]##2;
tau2=&sd[4]##2;
s=j(4,4,0);/*樣本方差矩陣*/
s[1,1]=sigma1/i;
s[1,2]=&p[1]#&sd[1]#&sd[2]/i;
s[2,1]=&p[1]#&sd[1]#&sd[2]/i;
s[2,2]=tau1/i;
s[3,3]=sigma2/(&r#i);
s[3,4]=&p[2]#&sd[3]#&sd[4]/(&r#i);
s[4,3]=&p[2]#&sd[3]#&sd[4]/(&r#i);
s[4,4]=tau2/(&r#i);
vv=inv(va_inv+inv(s));/*后驗方差矩陣*/
left=t(a)*vv*(va_inv*&m_analysis+inv(s)*&m_design);/*不等式左邊*/
right1=abs(quantile(“normal”,1-&omega))#sqrt(t(a)*vv*a);/*不等式右邊第一項*/
right2=abs(quantile(“normal”,1-&delta))#sqrt(t(a)*vv*inv(s)*(&v_design+s)*inv(s)*vv*a);
index=left-right1-right2;/*不等式右邊第二項*/
ifindex>=0thenstop;/*不等式成立則停止迭代*/
end;
printi;/*最小組所需的樣本量*/
quit;
利用上文的SAS程序分析常見的分析階段和設計階段三種不同的先驗信息組合下樣本量的估計。為了便于比較,本文引用與O′HaganA[1]相同的例子,Briggs和Tambour[11]也利用頻率方法分析過這個例子。
1.分析階段先驗信息弱,設計階段先驗信息強
表中給出了不同效應量(1.5和0.8)、不同相關系數(shù)(0、0.5和-0.5)以及不同意愿支付界值(10000、20000和30000)下的樣本量估計結果??梢娦枯^大時需要的樣本量相對較小,這與公式(5)一致。不等式左邊為兩個先驗期望值的加權,效應量越大左邊越大,不等式越容易成立。再者,效果與成本的相關系數(shù)也會對樣本量的估計結果產(chǎn)生影響,從表中可以看出相關系數(shù)正向越大所需樣本量越小,反之,負向越大所需樣本量越大,這與ALMJ[6]在文中的結論一致。此外,隨著意愿支付界值的升高,所需樣本量越小。
表1 分析階段先驗信息弱,設計階段先驗信息強時樣本量估計結果
2.分析階段先驗信息弱,設計階段先驗信息適當
樣本量估計結果見表2。
表2 分析階段先驗信息弱,設計階段先驗信息適當時樣本量估計結果
與情形①不同的是效應量大小的設置。效應量為0.8時超出了迭代算法中設置的最大樣本量(N=100000),現(xiàn)實情況下不具有操作性,故表2給出了效應量分別為1.5和1.0時的樣本量估計結果。與表1的結果相比,相同參數(shù)條件下表2中所需的樣本量相對較大,原因是情形①中設計階段的先驗信息非常強。先驗信息越強,所需樣本量相對越小。其他參數(shù)之間的規(guī)律與情形①保持一致。
3.分析階段和設計階段先驗信息相等
本例中,我們假設分析階段和設計階段都有適當?shù)南闰炐畔?,且相等。即,ma=md,Va=Vd取值情況與情形②相同。其中,考慮到效應量等于0.8時的不可操作性本例也給出了1.5和1.0兩種情況下的結果。此時,樣本量的估計結果見表3。
與表2的結果相比可以看出,相同參數(shù)條件下,分析階段有適當?shù)南闰炐畔⒁部梢詼p少所需要的樣本量。其他參數(shù)之間的規(guī)律與情形①保持一致。
表3 分析階段和設計階段先驗信息相等時樣本量估計結果
衛(wèi)生經(jīng)濟學評價中樣本量的估計方法包括頻率方法和Bayesian方法,Bayesian方法的優(yōu)勢是可以看到分析階段和設計階段不同先驗信息對樣本量估計的重要性。而且,Bayesian方法還可以包含頻率方法,并求得相等的樣本量,這也體現(xiàn)了該方法的靈活性。近二十年成本效果分析的方法學日益發(fā)展,但是應用方面樣本量的計算受到很大限制,很大程度上是由于沒有專用的統(tǒng)計軟件或便利的程序?qū)崿F(xiàn)。為了彌補該領域發(fā)展的不足,本文基于O′Hagan A等人的文章[1]給出了Bayesian方法的SAS實現(xiàn)。用SAS編寫成宏,只需要輸入所需參數(shù)就可以得到樣本量的估計結果。
本文只給出了平行設計中Bayesian方法的樣本量估計,后續(xù)將考慮不同試驗設計下的樣本量估計方法,如配對設計、交叉設計等。
[1]O′Hagan A,Stevens JW.Bayesian assessment of sample size for clinical trials of cost-effectiveness.Medical Decision Making,2001,21(6):219-230.
[2]Australia Commonwealth Department of Human Services and Health.Guidelines for the Pharmaceutical Industry on Preparation of Submissions to the Pharmaceutical Benefits Advisory Committee:Including Major Submissions Involving Economic Analysis.Canberra:Australia Government Publishing Service,1995.
[3]Canadian Coordinating Office for Health Technology Assessment.Guidelines for Economic Evaluation of Pharmaceuticals:Canada(2nd ed).Ottawa:Canadian Coordinating Office for Health Technology Assessment,1997.
[4]Ramsey SD,Willke RJ,Briggs AH,et al.Good research practices for cost effectiveness analysis alongside clinical trials:the ISPOR RCT-CEA Task Force report.Value in Health,2005,8(5):521-33.
[5]Ramsey SD,Willke RJ,Glick H,et al.Cost-Effectiveness Analysis Alongside Clinical Trials II-An ISPOR Good Research Practices Task Force Report.Value in Health,2015,18(2):161-172.
[6]AL MJ,Van Hout BA.Michel BC,et al.Sample size calculation in economic evaluations,Health Economics,1998,7(4):327-335.
[7]Laska EM,Meisner M,Siegel C.Power and sample size in cost-effectiveness analysis,Medical Decision Making,1999,19(3):339-343.
[8]Willan AR,O′Brien BJ.Sample size and power issues in estimating incremental cost-effectiveness ratios from clinical trials data.Health Economics,1999,8(3):203-211.
[9]Gafni A,Walter SD,Birch S,et al.An opportunity cost approach to sample size calculation in cost-effectiveness analysis.Health Economics,2008,17(1):99-107.
[10]O′Hagan A,Stevens JW,Montmartin J.Bayesian cost-effectiveness analysis from clinical trial data.Statistics in Medicine,2001,20(5):733-753.
[11]Briggs A,Tambour M.The design and analysis of stochastic cost-effectiveness studies for the evaluation of health care interventions.Drug Information Journal,2001,35(4):1455-1468.
(責任編輯:鄧妍)
陳平雁,Email:chenpy99@126.com
=10to100000;/*設定迭代過程的初始值和最大值*/