謝穎,宗欣,孫利華(沈陽藥科大學(xué)工商管理學(xué)院,沈陽市 110016)
·藥物經(jīng)濟學(xué)·
非參數(shù)Bootstrap法在成本-效果置信區(qū)間估計中的應(yīng)用
謝穎*,宗欣,孫利華#(沈陽藥科大學(xué)工商管理學(xué)院,沈陽市 110016)
目的:為我國藥物經(jīng)濟學(xué)評價人員提供一種計算增量成本-效果置信區(qū)間的簡便、可靠方法。方法:通過查閱、綜合總結(jié)國外的相關(guān)文獻,詳細介紹了非參數(shù)Bootstrap方法的思想和數(shù)學(xué)特性,并舉例說明了構(gòu)建置信區(qū)間的方法。結(jié)果與結(jié)論:非參數(shù)Bootstrap方法作為構(gòu)建置信區(qū)間的一種簡便、可靠方法,可應(yīng)用于藥物經(jīng)濟學(xué)領(lǐng)域置信區(qū)間的構(gòu)建。但是當數(shù)據(jù)呈明顯偏態(tài)或者樣本量不夠大時,仍需謹慎使用。
非參數(shù)Bootstrap法;置信區(qū)間;成本-效果比
在藥物經(jīng)濟學(xué)評價中存在很多不確定因素,這極大地影響了評價結(jié)果的信度和效度。按性質(zhì)可將不確定性因素分為與數(shù)據(jù)有關(guān)的不確定性和與評價過程有關(guān)的不確定性。數(shù)據(jù)中的不確定性通常是由于抽樣誤差造成,為了降低由抽樣誤差引起的不確定性因素的影響,可通過計算成本效果點估計的95%置信區(qū)間來增加評價結(jié)果的可靠性。目前,國內(nèi)鮮有研究人員對計算成本效果置信區(qū)間的方法和應(yīng)用作詳細介紹。筆者介紹一種非參數(shù)Bootstrap法計算成本-效果置信區(qū)間,以期為藥物經(jīng)濟學(xué)研究人員提供簡便、可靠的評價方法。
藥物經(jīng)濟學(xué)評價大多與臨床試驗平行展開。通常臨床試驗的樣本量很有限,且成本數(shù)據(jù)和效果數(shù)據(jù)在不同個體間通常具有可變性,尤其是成本數(shù)據(jù)通常是呈現(xiàn)偏態(tài)的,例如,治療藥物引起個別患者嚴重不良反應(yīng)的費用,增量成本-效果值(ICER)屬于非線性比值的本質(zhì)也對偏態(tài)有一定的影響。所謂的偏態(tài)分布是指集中位置偏向一側(cè),兩側(cè)頻數(shù)分布不對稱。當樣本增大時,其均數(shù)趨向正態(tài)分布。因此,傳統(tǒng)的以數(shù)據(jù)呈正態(tài)分布為假設(shè)條件的統(tǒng)計分析技術(shù),除非樣本量足夠大,否則不能用來分析數(shù)據(jù)常呈現(xiàn)偏態(tài)分布的藥物經(jīng)濟學(xué)評價的結(jié)果。那么,在無法確定成本和效果數(shù)據(jù)分布的情況下,該使用什么方法呢?針對以上問題,有學(xué)者提出使用非參數(shù)Bootstrap方法作為一種模擬抽樣分布的方法。
2.1 Bootstrap的再抽樣思想
Bootstrap法的再抽樣方法同一般的抽樣方法不同,它采用的是可放回的再抽樣方法,即每個數(shù)值在一次抽樣中,可重復(fù)出現(xiàn)。在此,我們舉例簡單地介紹一下它的可放回的重復(fù)抽樣思想。如圖1所示,假設(shè)樣本量n=6,均值為4.46,經(jīng)過3次的可放回重復(fù)抽樣,可得3個不同的均值。
圖1 Bootstrap法再抽樣思想Fig 1 The concept for re-sampling of Bootstrap method
2.2 Bootstrap法的應(yīng)用
在藥物經(jīng)濟學(xué)領(lǐng)域中,置信區(qū)間的計算,除了非參數(shù)Bootstrap法外,另外還有2種較為常用的參數(shù)方法,它們是泰勒級數(shù)展開法(Taylor series method)和Fieller法。
Fieller理論為了避免Ⅰ型錯誤而降低了檢驗功效[2],還假設(shè)ICER值的分子分母服從二元正態(tài)分布。雖然考慮了樣本ICER值分布的不對稱性,然而,事實上很難證明二元正態(tài)分布的假設(shè),特別是當樣本很小的情況[3]。此外,該方法可能返回不合理的置信限值,例如:返回一個負值,而實際應(yīng)用中只可能出現(xiàn)正值[3]。泰勒級數(shù)展開法假設(shè)成本效果比估計值呈正態(tài)分布,且計算的置信區(qū)間會不對稱地低估區(qū)間的上限[4]。
由于成本效果數(shù)據(jù)通常為非正態(tài)分布,而用于計算置信區(qū)間的傳統(tǒng)參數(shù)方法是建立在正態(tài)分布的假設(shè)上。Bootstrap方法不需要任何關(guān)于ICER分布的假設(shè),且一般的統(tǒng)計分析軟件都支持Bootstrap用于計算置信區(qū)間的功能。筆者建議使用該法計算ICER的置信區(qū)間。在此以計算ICER的置信區(qū)間為例,對Bootstrap法在置信區(qū)間的應(yīng)用作詳細說明。
2.2.1 ICER。成本-效果分析結(jié)果最終以ICER進行表示,即分別為實驗組和對照組的平均成本,和分別為實驗組和對照組的平均效果值。各種用于構(gòu)建ICER置信限的參數(shù)方法已經(jīng)被提出,例如Box法、Fieller準則和Taylor級數(shù)。然而,鑒于成本效果數(shù)據(jù)分布的未知性質(zhì),我們將通過非參數(shù)Bootstrap法進行成本效果置信區(qū)間的計算。
2.2.2 Bootstrap分布?;谠S多重復(fù)抽樣樣本,一個統(tǒng)計量的Bootstrap分布代表了該統(tǒng)計量的抽樣分布,而抽樣分布是基于許多抽樣樣本得出的。Bootstrap分布是接近正態(tài)的,且其中心非常接近原始樣本分布的中心,也就是說,Bootstrap分布的均值作為原始樣本的均值估計量幾乎沒有偏差。Bootstrap標準誤差同基于理論得出的估計值非常一致。因此,Bootstrap分布可以很好地模擬抽樣分布[5]。
丁勇,桂林電子科技大學(xué)計算機與信息安全學(xué)院教授、副院長,廣西密碼學(xué)與信息安全重點實驗室主任;主要研究方向為公鑰密碼理論、同態(tài)加密、密碼安全協(xié)議、區(qū)塊鏈等;主持國家自然科學(xué)基金、中國密碼發(fā)展基金、國防預(yù)研基金、廣西區(qū)自然科學(xué)基金等項目10余項;發(fā)表論文60余篇,其中SCI/EI檢索30余篇,出版學(xué)術(shù)專著1部、工信部規(guī)劃教材1部。
使用實驗數(shù)據(jù)來生成一個關(guān)于ICER的Bootstrap分布,要求做到以下幾步(假設(shè)在實驗組有ne名患者和在對照組有nc名患者):
第一,從實驗組數(shù)據(jù)中采用可放回的方式生成ne個成本/效果數(shù)據(jù)對的樣本。然后利用這些數(shù)據(jù)分別計算和的Bootstrap估計值和。
第二,類似的,可放回的從對照組數(shù)據(jù)中生成nc個成本/效果數(shù)據(jù)對的樣本。然后利用這些數(shù)據(jù)分別計算和的Bootstrap估計值和。
關(guān)于重復(fù)抽樣次數(shù)B,Efron和Tibshirani表明“理想”的Bootstrap估計值是對應(yīng)于無限次的Bootstrap再抽樣,通常至少為1 000次。重復(fù)抽樣結(jié)束后,將比值按從小(好)到大(差)的順序進行排列,以便置信區(qū)間的計算。
2.2.3 Bootstrap置信區(qū)間。Bootstrap在藥物經(jīng)濟學(xué)中的應(yīng)用主要是用于構(gòu)建結(jié)果指標(如ICER)的置信區(qū)間,即Bootstrap置信區(qū)間。它主要有5種方法,分別是正態(tài)近似法、Bootstrap百分位方法、偏差糾正百分位法、BCa法和百分位-t法。第1種方法是使用標準誤差的Bootstrap估計值且假設(shè)統(tǒng)計量的抽樣分布呈正態(tài)分布來計算統(tǒng)計量的置信區(qū)間。因此,當實際上抽樣分布為非正態(tài)分布時,運用該方法所得的結(jié)果是不準確的。在藥物經(jīng)濟學(xué)領(lǐng)域中,假設(shè)ICER的分布呈正態(tài)分布是不合適的。第2種方法假設(shè)ICER的Bootstrap重復(fù)值是無偏頗的,而事實上比值估計量是偏頗的,且Bootstrap重復(fù)值將放大樣本估計值的偏頗。前2種方法在數(shù)據(jù)嚴重失真、抽樣分布呈明顯偏態(tài)分布和評價目標要求較高的準確性或者評價結(jié)果的利益關(guān)系很大時可信度不夠大。事實上,已有研究表明從樣本數(shù)據(jù)計算而來的ICER是總體ICER真實值的有偏估計[6]。后3種方法都考慮了該因素。百分位-t法雖然考慮了估計的抽樣分布存在的不對稱性,但是它使用了完全不同的方法[1],因此,本文將不對其作具體介紹。BCa法就是通過對標準正態(tài)累積分布函數(shù)的修正來調(diào)整百分位點,它作為偏差糾正百分比法的一種改進,其基本思想同偏差糾正百分比法相同,被證明在各種假設(shè)條件下都能很好地構(gòu)建置信區(qū)間[6]。本文僅介紹如何運用簡單的偏差糾正百分比法來構(gòu)建ICER的置信區(qū)間,以便于更容易地理解如何通過調(diào)整百分位點,從而計算置信區(qū)間。
偏差糾正百分位法調(diào)整了Bootstrap估計中存在的任何偏差,且就像它的名字顯示的,基于百分位的方法就是使用生成的Bootstrap分布的百分位來確定置信區(qū)間。以下,筆者將詳細介紹如何通過偏差糾正法計算置信限。
第一,計算偏差校正常數(shù),即Z0(標準正態(tài)離差)。
第二,使用這種偏差校正常數(shù)來調(diào)整被用于計算期望置信區(qū)間的的百分位,如此的話,偏差校正的置信區(qū)間的下限是Bootstrap估計值在Φ[Za/2+2Z0]×100百分位位置上的值,且上限是在Φ[Z1-a/2+2Z0]×100百分位位置上的值;a是期望的置信水平,例如:0. 05;Za/2是與a/2相關(guān)的標準正態(tài)離差。
Bootstrap的優(yōu)點是不考慮增量成本和效果的分布是否獨立,缺點是計算的精確度與重復(fù)抽樣的次數(shù)有關(guān),且其理論基礎(chǔ)還受到懷疑[1]。例如,ICER可能出現(xiàn)2種情況下的負值,一是成本節(jié)省且效果更大的情況,另一種是成本更大但效果更差的情況。由于Bootstrap隨機抽樣的性質(zhì),可能致使出現(xiàn)大量的負值以至最后的置信限值為負值,此時界限大小是不相關(guān)的,只有正負號才是重要的。基于百分位法的Bootstrap置信區(qū)間的計算需對ICER值進行排序,顯然對負值進行排序是無意義的。因此,如果是第二種情況,排序時應(yīng)直接將負值放在最小的位置。Briggs等還提出,如果ICER值的分母獲得0值或者接近0值的概率很顯著,那么Bootstrap的理論假設(shè)也將受到質(zhì)疑。因為,如果效果差值接近于0,那么ICER的值將非常大,致使抽樣分布呈不對稱分布。但有研究對Box法、Taylor級數(shù)展開法、Fieller法和Bootstrap法進行比較,結(jié)果表明Bootstrap法是計算可信區(qū)間的可靠方法[6]。
總而言之,Bootstrap法能夠解決傳統(tǒng)方法建立在數(shù)據(jù)呈正態(tài)分布或需大樣本的局限性。但是,當數(shù)據(jù)呈明顯偏態(tài)且樣本較小時,對該方法的應(yīng)用仍需謹慎。
[1]Briggs AH,Wonderling DE,Mooney CZ.Pulling costeffectiveness analysis up by its bootstraps:a non-parametric approach to confidence interval estimation[J].Health Econ,1997,6(4):327.
[2]Mennemeyer ST,Cyr LP.A bootstrap approach to medical decision analysis[J].J Health Econ,1997,16(6):741.
[3]Chaudhary MA,Stearns SC.Estimating confidence intervals for cost-effectiveness ratios:an example from a randomized trial[J].Stat Med,1996,15(13):1 447.
[4]Polsky D,Glick HA,Willke R,et al.Confidence intervals for cost-effectiveness ratios:a comparison of four methods[J].Health Econ,1997,6(3):243.
[5]Hesterberg T,Moore DS,Monaghan S,et al.Bootstrap Methods and Permutation Tests,2nd edition[EB/OL]. http://bcs.whfreeman.com/ips5e/content/cat_080/pdf/moore14.pdf.2009-5-22.
[6]Campbell MK,Torgerson DJ.Bootstrapping:estimating confidence intervals for cost-effectiveness ratios[J].Q J Med,1999,92:177.
Application of Non-parametric Bootstrap Method in the Evaluation of Confidence Intervals of Cost-effectiveness
XIE Ying,ZONG Xin,SUN Li-hua(College of Business Administration,Shenyang Pharmaceutical University,Shenyang 110016,China)
OBJECTIVE:To provide a simple and reliable method to estimate confidence intervals of incremental cost-effectiveness ratios for pharmacoeconomics evaluation in China.METHODS:Through retrieving relevant foreign literature,the idea and mathematical properties of non-parametric Bootstrap method were described and the method for calculating confidence intervals were explained by giving an example.RESULTS&CONCLUSION:Non-parametric Bootstrap method is simple and reliable for the calculation of confidence intervals of pharmacoeconomics.When the distribution of samples is skewed significantly or the sample size is not plenty enough,we still need to be cautious to adopt non-parametric Bootstrap method.
Non-parametric Bootstrap method;Confidence intervals;Cost-effectiveness ratio
R956
A
1001-0408(2010)22-2027-03
2009-11-19
2010-03-01)
*碩士研究生。研究方向:藥物經(jīng)濟學(xué)。E-mail:bishuiye3@163. com
#通訊作者:教授,博士研究生導(dǎo)師,博士。研究方向:藥物經(jīng)濟學(xué)、醫(yī)藥投資效益與管理。電話:024-23986553