孫園園,余 正,李洪超(中國藥科大學(xué)國際醫(yī)藥商學(xué)院,南京211198)
健康效用值測量中的映射法及其相關(guān)模型概述
孫園園*,余 正#,李洪超(中國藥科大學(xué)國際醫(yī)藥商學(xué)院,南京211198)
目的:為將非效用量表測量結(jié)果轉(zhuǎn)化為健康效用值提供方法學(xué)參考。方法:查閱國內(nèi)外文獻(xiàn),總結(jié)健康效用值測量中的映射法及其相關(guān)模型,并以生存質(zhì)量量表測量結(jié)果轉(zhuǎn)換成歐洲五維健康量表效用值為例,介紹各模型在概率映射中的應(yīng)用。結(jié)果:映射法可通過建立非效用量表和效用量表之間的映射關(guān)系,進(jìn)而得到健康效用值;其常用模型包括普通最小二乘法(OLS)模型、最小絕對離差法(CLAD)模型、Tobit模型、多元Logistic回歸(MNL)模型、貝葉斯網(wǎng)絡(luò)(BN)模型等。其中,OLS模型相對簡單,預(yù)測效度較好,但會受到天花板效應(yīng)的限制;Tobit模型不受天花板或地板效應(yīng)的限制,當(dāng)誤差項滿足方差齊性及正態(tài)性時,其預(yù)測結(jié)果優(yōu)于OLS模型;CLAD模型可用于誤差項非方差齊性不適用Tobit模型的情況;MNL模型先通過回歸分析確定一種健康狀態(tài),再確定其效用值;BN模型預(yù)測效度較好,且不涉及計量經(jīng)濟(jì)學(xué)中的諸多假設(shè)和限制條件,但其構(gòu)建過程受領(lǐng)域?qū)<业挠绊戄^大。使用MNL或BN模式計算健康效用值的方法主要有蒙特卡洛模擬法、期望效用值法和最大可能概率法等。利用擬合優(yōu)度、調(diào)整擬合優(yōu)度、平均誤差、均方誤差、平均絕對誤差等指標(biāo)進(jìn)行模型性能評價,可選出最優(yōu)模型,進(jìn)而計算健康效用值。結(jié)論:由于各映射模型各有優(yōu)缺點(diǎn),在臨床研究中需要根據(jù)實(shí)際情況選擇不同的映射模型。
映射法;健康效用值;映射模型;生存質(zhì)量量表;歐洲五維健康量表
在目前的健康相關(guān)生存質(zhì)量(Health-related quality of life,HRQOL)測量和藥物經(jīng)濟(jì)學(xué)評價中,質(zhì)量調(diào)整生命年(Quality-adjusted life years,QALY)已成為衡量產(chǎn)出和健康測量的標(biāo)準(zhǔn)指標(biāo),而QALY計算的關(guān)鍵在于健康效用值的測量。健康效用值是個體對不同健康狀態(tài)的偏好程度,通常由基于偏好的HRQOL測量工具效用量表測量得到,如歐洲五維健康量表(EuroQol group’s 5-domain,EQ-5D)、健康效用指數(shù)(Health utility index,HUI)、健康指數(shù)量表(Quality of well-being,QWB)和六維健康調(diào)查短表(Short form 6D,SF-6D)等[1]。不過在臨床研究中,一些通用或疾病專用的非基于偏好的非效用量表也被頻繁使用,如健康調(diào)查簡表(Medical outcomes study 36-item short from health survey,SF-36)、生存質(zhì)量量表(Medical outcomes study 12-item short form health survey,SF-12)和帕金森疾病調(diào)查問卷等[2]。其中,EQ-5D量表(效用量表),包含5個維度,分別為行動能力(Mobility)、自理能力(Self care)、日?;顒幽芰Γ║sual activities)、疼痛或不舒服(Pain/discomfort)以及焦慮或抑郁(Anxiety/depression)。每個維度下對應(yīng)3個反應(yīng)水平:“水平1”代表“沒有任何困難”,“水平2”代表“有些困難”,“水平3”代表“極度困難”。SF-12量表(非效用量表)包含12個條目,用以測量被測對象整體健康、體能、日?;顒泳?、身體疼痛、心理健康和社交活動等方面的狀態(tài)。每個條目對應(yīng)3~5個反應(yīng)水平(即每個條目下被測對象作出回答的選項),以對應(yīng)3個反應(yīng)水平的條目為例:“水平1”代表“限制很多”,“水平2”代表“限制一點(diǎn)點(diǎn)”,“水平3”代表“一點(diǎn)也沒有限制”。最后,根據(jù)12個條目的得分情況分別得到身體健康總分(Physical component summary,PCS)和精神健康總分(Mental component summary,MCS),總分越高說明被測對象的身體健康狀態(tài)、精神健康狀態(tài)越好[3]。由于健康效用值才是基于人群偏好的HRQOL測量結(jié)果,因此需要將非效用量表得到的結(jié)果轉(zhuǎn)化成健康效用值。為解決上述問題,可以使用映射法建立非效用量表和效用量表之間的映射關(guān)系,進(jìn)而得到健康效用值。筆者通過查閱國內(nèi)外文獻(xiàn),以將SF-12量表測量結(jié)果轉(zhuǎn)換成EQ-5D效用值為例,介紹健康效用測量中的映射法及其相關(guān)模型,為非效用量表測量結(jié)果轉(zhuǎn)化為健康效用值提供方法學(xué)參考。
映射法是利用映射模型估計非效用測量方法和效用測量方法的關(guān)系,運(yùn)用回歸方法,以非效用量表的某一類指數(shù)為自變量、效用量表的某一類指數(shù)為因變量建立回歸方程,并對所建立的回歸方程進(jìn)行擬合度檢驗(yàn),最后利用該方程預(yù)測健康效用值的方法[4]。使用映射法將非效用量表的測量結(jié)果轉(zhuǎn)換成健康效用值的過程分為兩種:一種是運(yùn)用映射模型建立非效用量表和效用量表健康效用值之間的映射關(guān)系,直接預(yù)測健康效用值,如普通最小二乘法(Ordinary least square,OLS)模型、最小絕對離差法(Censored least absolute deviations,CLAD)模型和Tobit模型;另一種是通過多元Logistic回歸(Multinomial logistic regression,MNL)模型和貝葉斯網(wǎng)絡(luò)(Bayesian networks,BN)模型等,先建立非效用量表和效用量表各維度下反應(yīng)水平之間的映射關(guān)系,再利用各反應(yīng)水平的預(yù)測概率和效用量表的積分系統(tǒng)計算健康效用值[4]。
目前,常用的映射模型主要有計量經(jīng)濟(jì)學(xué)的OLS模型、CLAD模型、Tobit模型以及MNL模型等,而BN模型的應(yīng)用則相對較少[5]。
OLS是計量經(jīng)濟(jì)學(xué)中應(yīng)用較多的一種參數(shù)估計方法,主要通過最小化誤差的平方和來建立擬合度最好的回歸方程[6]。由于OLS要求自變量和因變量均為連續(xù)型變量,因此當(dāng)自變量為非效用量表總分、各維度得分或各條目水平得分,因變量為效用量表的效用值時,就可使用此模型。如,以SF-12量表PCS和MCS為自變量,以EQ-5D量表效用值為因變量,可使用OLS模型建立回歸方程,進(jìn)行健康效用值的預(yù)測[7]。
OLS模型相對簡單,對數(shù)據(jù)要求也較少,而且預(yù)測效度也較好,因此應(yīng)用較廣泛。但是OLS模型受到天花板效應(yīng)的限制,即作為因變量的效用值取值上限為1,所以該模型理論上并不完全適用于這種情況[7]。
Tobit模型也稱為樣本選擇模型、受限因變量模型,由James Tobin于1958年提出,是因變量滿足某種約束條件下取值的模型[8]。
當(dāng)因變量的取值受到限制,會出現(xiàn)天花板或地板效應(yīng),如EQ-5D量表效用值以1為上限的天花板效應(yīng)。此時,若使用OLS估計回歸系數(shù)就容易出現(xiàn)偏倚,而遵循最大似然法概念的Tobit模型就成為估計回歸系數(shù)的一個較好選擇。
當(dāng)因變量上限為1時,Tobit模型如下所示:
其中,yi為因變量,即效用量表的健康效用值;yi*為實(shí)際觀測值;xi為自變量,即影響效用值的非效用量表中某類指標(biāo);β’為未知參數(shù);ui為誤差項,且服從正態(tài)分布,即ui~N(0,σ2)。
當(dāng)誤差項滿足方差齊性及正態(tài)性時,Tobit模型預(yù)測結(jié)果優(yōu)于OLS;如果誤差項不滿足方差齊性或者非正態(tài)性,用Tobit模型也會產(chǎn)生較大偏倚[9]。
由于CLAD對誤差項的分布形式和方差齊性不作要求,以及對截尾數(shù)據(jù)穩(wěn)健性較好,因此可用于誤差項非方差齊性(不適用Tobit模型)的情況。其基本原理是通過最小化誤差項的絕對值之和來估算回歸系數(shù)。
CLAD模型也考慮到了天花板效應(yīng),設(shè)定健康效用值的上限為1。除了考慮PCS、MCS及其交互作用外,Sullivan PW等[5]的CLAD模型中還包含被測對象的年齡、性別、種族、受教育程度、收入水平和疾病狀況等因素,以便小幅度地提高預(yù)測效度。
前文介紹的OLS模型、Tobit模型和CLAD模型或多或少存在一些問題,如天花板或地板效應(yīng)。此外,通過回歸方程預(yù)測的結(jié)果是一個健康效用值,而不是效用量表各維度下的反應(yīng)水平,可能會出現(xiàn)預(yù)測結(jié)果為效用量表中沒有定義過的健康狀態(tài)。于是,Gray AM等[10]提出了一種“基于反應(yīng)水平映射”的方法,即MNL模型。如,基于SF-12量表12個條目的測量結(jié)果進(jìn)行MNL模型模擬,可得出EQ-5D量表各維度下各反應(yīng)水平的預(yù)測概率,確定一種健康狀態(tài);再利用蒙特卡洛模擬法(Monte Carlo simulation method,MCSM)、期望效用值法(Expected-utility method,EUM)或最大可能概率法(Mostlikely probability method,MLPM)計算出EQ-5D量表的效用值。
此外,MNL模型還有一個優(yōu)點(diǎn)。MNL模型產(chǎn)生的回歸方程預(yù)測的是效用量表各維度下各反應(yīng)水平的概率,需要再用效用量表的積分系統(tǒng)計算健康效用值。因此,為了得到基于不同國家水平的效用值,可使用不同國家版本的效用量表,這樣可避免前面3種方法必須進(jìn)行不同國家水平效用值換算的問題[11]。
BN用來表示變量間的概率依賴關(guān)系,由一個有向無環(huán)圖(Directed acyclic graph,DAG)和條件概率表(Conditional probability table,CPT)組成。其中,DAG由代表變量的節(jié)點(diǎn)及連接這些節(jié)點(diǎn)的有向邊組成[12]。對于健康測量來說,一個節(jié)點(diǎn)代表一種健康維度,節(jié)點(diǎn)的狀態(tài)反映出該健康維度下可能的反應(yīng)水平[13]。節(jié)點(diǎn)分為父節(jié)點(diǎn)和子節(jié)點(diǎn),對于子節(jié)點(diǎn)(xi)與其父節(jié)點(diǎn)[π(xi)],條件概率分布為P{xi|π(xi)}。對于一組離散變量,網(wǎng)絡(luò)的聯(lián)合概率分布可表示為[13]:
例如,假設(shè)SF-12量表條目二和EQ-5D量表Selfcare(自理能力)維度的BN節(jié)點(diǎn)結(jié)構(gòu)和條件概率如圖1所示(其中,“HMODACT12”和“SELFEQ5D”分別代表SF-12量表條目二和EQ-5D量表自理能力維度)[14]:
圖中,MA代表SF-12量表的條目二“Health limits moderate activities”,并且有3個反應(yīng)水平(1,2,3);SC代表EQ-5D量表自理能力“Self-care”維度,同樣包含3個反應(yīng)水平(1,2,3)。假設(shè)MA和SC的發(fā)生是相互獨(dú)立的,那么聯(lián)合概率分布計算[14]如下:
其中,i和j分別為MA和SC的反應(yīng)水平。
圖1 SF-12量表條目二和EQ-5D量表自理能力維度的BN節(jié)點(diǎn)結(jié)構(gòu)和條件概率Tab 1BN node structure and conditional probability of the item 2 in SF-12 scale and Self-care dimension in EQ-5D scale
與計量經(jīng)濟(jì)學(xué)方法相比,使用BN模型建立非效用量表和效用量表健康維度之間的概率映射關(guān)系有很多優(yōu)勢。首先,BN模型沒有關(guān)于回歸方程以及函數(shù)形式的諸多假設(shè)和限制條件;其次,BN模型不僅預(yù)測效度好,還可將變量之間的關(guān)系圖形化,有助于研究人員進(jìn)一步探究非效用量表和效用量表不同條目和健康維度之間的相關(guān)性[15]。當(dāng)然,BN模型也存在一定的局限性。由于BN結(jié)構(gòu)的構(gòu)建受領(lǐng)域?qū)<乙庖姷挠绊戄^大,具有較強(qiáng)的隨意性,所以目前應(yīng)用較少。
使用MNL或BN模型,可以幫助建立SF-12量表和EQ-5D量表之間的概率映射關(guān)系,得到EQ-5D量表各維度下各反應(yīng)水平的預(yù)測概率,再利用EQ-5D量表的積分系統(tǒng)采用一定方法計算出健康效用值[16]?,F(xiàn)筆者主要介紹一下MCSM、EUM和MLPM 3種計算方法。
Gray AM等[10]建議使用MCSM,目前這種方法使用較多。以英國版EQ-5D量表為例,具體方法如下:
通過MCSM產(chǎn)生服從均勻分布的0~1之間的5個隨機(jī)數(shù)(ui,可以是小數(shù)),比較隨機(jī)數(shù)和BN預(yù)測的EQ-5D各維度下每種反應(yīng)水平概率的大小,將研究個體分配到各維度下對應(yīng)的反應(yīng)水平。P1(x)、P2(x)、P3(x)分別為3種反應(yīng)水平“沒有任何困難(level 1)”、“有些困難(level 2)”和“極度困難(level 3)”的預(yù)測概率,x代表EQ-5D量表的5個維度。每個隨機(jī)數(shù)(ui)將按如下方法分配一種EQ-5D維度下的一種對應(yīng)反應(yīng)水平。預(yù)測EQ-5D量表反應(yīng)水平:
=1,如果ui≤P1i(x)
=2,如果P1i(x)<ui≤[1-P3i(x)]
=3,如果ui>[1-P3i(x)]
通過上式計算可以得到一種預(yù)測的健康狀態(tài),如健康狀態(tài)“23211”,然后使用EQ-5D積分系統(tǒng)計算預(yù)測的EQ-5D效用值為0.331[17]。
EUM是一種比較精確的方法,其通過應(yīng)用代數(shù)方程計算出的效用值正好等于使用MCSM重復(fù)模擬得到的結(jié)果。
以英國版EQ-5D量表為例,EUM計算公式[18]如下:
其中,Expected_Disutilities的計算方法如下:
上述公式中,“Expected_Disutility(mobility)”為“‘mobility’維度下的預(yù)期非效用”;“Expected_Disutility(any response with some/severe problems)”為“‘任何非完全健康狀態(tài)’的預(yù)期非效用”;“Expected_Disutility(any response with severe problems)”為“‘至少有一個維度處于水平3’的預(yù)期非效用”;P1、P2、P3分別為相應(yīng)維度處于水平1、水平2、水平3的概率值。
在MLPM中,預(yù)測反應(yīng)水平取各維度下3種反應(yīng)水平中預(yù)測概率最大的。和MCSM相似,得到一種確定的健康狀態(tài)之后使用EQ-5D積分系統(tǒng)計算預(yù)測的EQ-5D效用值[18]。
預(yù)測反應(yīng)水平i
=1,如果P1i(x)>P2i(x)且P1i(x)>P3i(x)
=2,如果P2i(x)>P1i(x)且P2i(x)>P3i(x)
=3,如果P3i(x)>P1i(x)且P3i(x)>P2i(x)
評價幾種模型的性能,可以使用以下常用指標(biāo):(1)擬合優(yōu)度和調(diào)整擬合優(yōu)度。擬合優(yōu)度主要用來檢驗(yàn)?zāi)P蛯Q-5D效用實(shí)際觀測值的擬合程度,等于因變量變差中模型所能解釋部分所占的比重;當(dāng)解釋變量為多元時,應(yīng)使用調(diào)整擬合優(yōu)度。擬合優(yōu)度和調(diào)整擬合優(yōu)度越大,表明模型擬合優(yōu)度越好。(2)平均誤差(Mean error,ME)、均方誤差(Mean squared error,MSE)和平均絕對誤差(Mean absolute error,MAE)。用ME、MSE和MAE 3個指標(biāo)來衡量EQ-5D效用預(yù)測值與實(shí)際觀測值之間的偏差,借此評價模型的預(yù)測能力。上述指標(biāo)的值越小,說明預(yù)測值與實(shí)際觀測值之間的偏差越小,即模型的預(yù)測能力越好。此外,還可以利用散點(diǎn)圖和Pearson相關(guān)系數(shù)等方法或指標(biāo)來評價、比較模型的性能。
映射法是一種將非效用量表測量結(jié)果轉(zhuǎn)化成健康效用值的有效方法,目前國內(nèi)的相關(guān)研究還較少。在本文中,筆者對映射法常用的幾種模型如OLS模型、CLAD模型、Tobit模型和MNL模型以及近年來國外研究中推薦的新方法BN模型進(jìn)行了概述,指出每種模型的優(yōu)缺點(diǎn)和進(jìn)行模型性能評價時參考的指標(biāo)。以上方法中,BN模型預(yù)測效度較好,且不涉及計量經(jīng)濟(jì)學(xué)中的諸多假設(shè)和限制條件,但由于BN的構(gòu)建過程受領(lǐng)域?qū)<业挠绊戄^大,隨意性較大,因此目前應(yīng)用相對較少。此外,筆者還對概率映射中的MCSM、EUM和MLPM計算方法作了簡要介紹,希望可為國內(nèi)相關(guān)研究中健康效用的測量提供參考。
[1]蔣艷,王煊,朱文濤.生命質(zhì)量量表在藥物經(jīng)濟(jì)學(xué)評價中的選擇及應(yīng)用[J].中國藥物評價,2014,31(5):313-316.
[2]何燕,趙龍超,劉丹萍,等.SF-36和SF-12在人群生命質(zhì)量調(diào)查中的性能比較研究[J].現(xiàn)代預(yù)防醫(yī)學(xué),2017,44(5):852-862.
[3]伍紅艷,孫利華.兩種常用EQ-5D量表效用值積分體系的比較及其對成本效用分析結(jié)果的影響探討[J].中國衛(wèi)生經(jīng)濟(jì),2012,31(7):9-11.
[4]付希婧,梁敏洪,孫茂,等.映射法在健康效用值測量中的應(yīng)用研究[J].中國衛(wèi)生經(jīng)濟(jì),2014,33(10):32-35.
[5]Sullivan PW,Ghushchyan V.Mapping the EQ-5D index from the SF-12:US general population preferences in a nationally representative sample[J].Med Decis Making,2006,26(4):401-409.
[6]劉明.普通最小二乘法的幾何分析[J].統(tǒng)計與決策,2012(4):90-92.
[7]Franks P,Lubetkin EI,Gold MR,et al.Mapping the SF-12 to the EuroQol EQ-5D index in a national US sample[J].Med Decis Making,2004,24(3):247-254.
[8]周華林,李雪松.Tobit模型估計方法與應(yīng)用[J].經(jīng)濟(jì)學(xué)動態(tài),2012(5):105-119.
[9]Austin PC,Escobar M,Kopec JA.The use of the tobit model for analyzing measures of health status[J].Qual Life Res,2000,9(8):901-910.
[10]Gray AM,Rivero-Arias O,Clarke PM.Estimating the association between SF-12 responses and EQ-5D utility values by response mapping[J].Med Decis Making,2006,26(1):18-29.
[11]Chuang LH,Kind P.Converting the SF-12 into the EQ-5D:an empirical comparison of methodologies[J].Pharmacoeconomics,2009,27(27):491-505.
[12]胡春玲.貝葉斯網(wǎng)絡(luò)研究綜述[J].合肥學(xué)院學(xué)報(自然科學(xué)版),2013,23(1):33-40.
[13]Neapolitan RE.Learning Bayesian networks[M].New Jersey:Pearson Education Inc.,2004:481-527.
[14]Le QA,Doctor JN.Probabilistic mapping of descriptive health status responses onto health state utilities using Bayesian networks:an empirical analysis converting SF-12 into EQ-5D utility index in a national US sample[J].Med Care,2011,49(5):451-460.
[15]Borchani H,Bielza C,Marti Nez-Marti NP,et alMarkov blanket-based approach for learning multi-dimensional Bayesian network classifiers:an application to predict the European quality of life-5 dimensions(EQ-5D)from the 39-item parkinson’s disease questionnaire(PDQ-39)[J].J Biomed Inform,2012,45(6):1175-1184.
[16]伍紅艷,劉國恩,官海靜.EQ-5D健康量表效用積分體系的構(gòu)建研究:基于我國西南地區(qū)的實(shí)證分析[J].中國藥房,2016,27(14):1877-1881.
[17]Dolan P.Modeling valuations for EuroQol health states[J].Med Care,1997,35(11):1095-1108.
[18]Mortimer D,Segal L.Comparing the incomparable?A systematic review of competing techniques for converting descriptive measures of health status into QALY-weights[J].Med Decis Making,2008,28(1):66-89.
Overview of the Mapping Method and Relevant Models in Health Utility Values Measurement
SUN Yuanyuan,YU Zheng,LI Hongchao(School of International Pharmaceutical Business,China Pharmaceutical University,Nanjing 211198,China)
OBJECTIVE:To provide methodological reference for converting non-utility scale measurement results into health utility values.METHODS:Referring to domestic and foreign literatures,mapping methods and relevant models in health utility measurement were summarized.The effect of each model on probability mapping was introduced by taking the Medical outcomes study 12-item short form health survey measurement results converting into the EuroQol group’s 5-domain utility values as example.RESULTS:The mapping methods can be adopted to obtain the health utility values by establishing the mapping relationship between non-utility scale and utility scale.The common models included ordinary least square(OLS)model,censored least absolute deviations(CLAD)model,Tobit model,multinomial Logistic regression(MNL)model,Bayesian networks(BN)model,etc.OLS model was relatively simple with a good predictive validity,but it would be limited by the ceiling effect;Tobit model was not limited by the ceiling or floor effect,when the error term satisfied the variance homogeneity and normality,prediction result of Tobit model was better than OLS model;CLAD model can be used for the situation of Tobit model unsuitable for non-variance homogeneity of the error term;MNL model firstly determined a health state by regression analysis and then determined its utility value;the prediction validity of BN model was good and it didn’t involved many assumptions and restrictions condition in econometrics,but the construction of BN model was greatly influenced by domain experts.Main methods for the calculation of health utility value with MNL or BN model were Monte Carlo simulation method,expected-utility method,most-likely probability methed,etc.We can carry out the model performance evaluation by using theR2,the adjustedR2,the mean error,the mean squared error and the mean absolute error,and then select the optimal model to calculate health utility values.CONCLUSIONS:Due to the advantages and disadvantages of each mapping model,it is necessary to select different mapping models based on the actual conditions.
Mapping method;Health utility value;Mapping model;Medical outcomes study 12-item short form health survey;EuroQol group’s 5-domain
R956
A
1001-0408(2017)29-4045-05
DOI10.6039/j.issn.1001-0408.2017.29.04
*碩士研究生。研究方向:藥物經(jīng)濟(jì)學(xué)。電話:025-86185038。E-mail:824580932@qq.com
#通信作者:副教授,碩士生導(dǎo)師,碩士。研究方向:醫(yī)藥國際商務(wù)、藥物經(jīng)濟(jì)學(xué)。電話:025-86185038。E-mail:1513370906@qq.com
2016-07-26
2017-07-17)
(編輯:楊小軍)