馬曉敏 賈衛(wèi)東 楊 朔 梁穎芳 周 峰 李粵平 陳 舸 李麗霞 周舒冬 郜艷暉△ 楊 翌
?
有限混合模型在肝硬化住院患者醫(yī)療費用研究中的應(yīng)用*
馬曉敏1賈衛(wèi)東2楊 朔1梁穎芳2周 峰1李粵平2陳 舸1李麗霞1周舒冬1郜艷暉1△楊 翌1
目的 針對醫(yī)療費用的偏峰、厚尾分布特征,探討有限混合模型(finite mixture model,F(xiàn)MM)在識別肝硬化患者住院費用異質(zhì)性、提高醫(yī)療費用預(yù)測精度等方面的可行性,為準(zhǔn)確估計和預(yù)測醫(yī)療費用提供統(tǒng)計方法學(xué)支持。方法 介紹FMM原理,并將其應(yīng)用于廣州市第八人民醫(yī)院肝硬化住院患者醫(yī)療費用研究,識別群體異質(zhì)性,分析異質(zhì)性來源,并與單成分廣義線性模型的預(yù)測效果進(jìn)行比較。結(jié)果 對2 760名肝硬化患者住院費用進(jìn)行FMM分析,最優(yōu)模型為包括低、中等和高費用3個成分,擬合優(yōu)度與預(yù)測效果均高于廣義線性模型,異質(zhì)性來源分析進(jìn)一步驗證了FMM識別各類患者的能力。結(jié)論 FMM能夠有效地識別醫(yī)療費用的異質(zhì)性,解決醫(yī)療費用偏峰和厚尾分布問題,提高醫(yī)療費用預(yù)測精度。
醫(yī)療費用 有限混合模型 群體異質(zhì)性
目前,我國醫(yī)療費用快速增長,占GDP的比重不斷升高[1]。醫(yī)療費用的分布極其特殊,多數(shù)個體費用低于平均水平,少數(shù)個體費用極高,表現(xiàn)為極度正偏峰和厚尾特征;如采用傳統(tǒng)基于正態(tài)假設(shè)的模型會導(dǎo)致大多數(shù)患者的預(yù)測費用高于實際,出現(xiàn)沃貝貢湖效應(yīng)(lake Wobegon effect)[2]。因此有學(xué)者用中位數(shù)、秩和檢驗等非參數(shù)方法進(jìn)行分析[3-4],衛(wèi)生經(jīng)濟(jì)學(xué)領(lǐng)域被廣泛接受和決策者主要關(guān)心的統(tǒng)計指標(biāo)仍是人群平均費用。考慮到費用的特殊分布,近年也有學(xué)者采用廣義線性模型擬合醫(yī)療費用[5-6]。
臨床上患者狀況千差萬別,而醫(yī)療費用的特殊分布也提示患者群體存在嚴(yán)重的異質(zhì)性,如假設(shè)醫(yī)療費用的分布來自多個分布的混合可為精準(zhǔn)估計醫(yī)療費用提供一個新思路。有限混合模型(finite mixture model,F(xiàn)MM)基于回歸分析和聚類分析思想,將初始分布假設(shè)為不同分布的混合,用于識別群體間的異質(zhì)性,目前在經(jīng)濟(jì)學(xué)、生物學(xué)、物理和醫(yī)學(xué)領(lǐng)域多有應(yīng)用。本文介紹有限混合模型并將其應(yīng)用于肝硬化患者醫(yī)療費用的估計中,為更精準(zhǔn)的評價和預(yù)測醫(yī)療費用提供方法學(xué)支持,為高費用患者監(jiān)測和干預(yù)提供方法借鑒。
(1)
混合模型使用極大似然法進(jìn)行參數(shù)估計,表示為
(2)
(3)
FMM的實際應(yīng)用中,需要事先指定成分個數(shù),然后根據(jù)AIC、BIC等指標(biāo)確定成分?jǐn)?shù),進(jìn)而估計各成分的權(quán)數(shù)及特征參數(shù),最后對隨機(jī)觀測X作出分類。FMM可采用SAS 9.3的proc fmm過程實現(xiàn)[7]。
表1顯示4成分的FMM中-2logL和AIC最低,但3成分時BIC值和Pearson統(tǒng)計量最低,因此最優(yōu)模型選擇3成分FMM。
圖1為模型中3個成分分布,可看出初始分布呈典型的偏峰、厚尾特征。分解為3個成分后,成分1峰
表1 不同成分?jǐn)?shù)的有限混合模型和廣義線性模型適配指標(biāo)
*:即廣義線性模型。
值較高,變異度較小,包含了較多低費用患者;成分2峰值略低,變異度較大,中等費用患者占多數(shù);成分3無明顯分布峰,包含各類費用患者、特別是高費用患者。因此成分1、2和3可分別代表低、中和高費用患者的住院費用分布。
表2顯示3成分FMM中各成分比例、分布特征及絕對平均預(yù)測誤差??梢姵煞?患者最多(52%),平均醫(yī)療費用(9135.50)和方差(23 729 701.50)最低;成分3比例最低(10%),但平均醫(yī)療費用(43 250.64元)和方差(1 417 134 742.73)均最高。在住院費用預(yù)測方面,F(xiàn)MM的絕對平均預(yù)測誤差比廣義線性模型大大減小。
圖1 3成分有限混合模型各成分分布
成分特征3成分的有限混合模型*成分1成分2成分3廣義線性模型*混合概率0.520.380.10尺度參數(shù)3.522.881.321.64期望(元)9135.5019934.3243250.6416574.41方差23729701.50137997330.831417134742.73167594577.11MAPE5793.0210553.18
*:模型均為Gamma分布,Log鏈接
表3 有限混合模型各成分患者的人口學(xué)及臨床特征,n(%)
續(xù)表3
*:0為單純肝硬變;1為肝硬變伴食管靜脈曲張;2為肝硬變伴食管靜脈曲張破裂出血。**:M(P25~P75)
表3顯示屬于各成分的患者其人口學(xué)及臨床特征??梢钥吹?,和成分1患者相比,成分2和成分3患者多傾向于大年齡、使用抗病毒藥物、并伴食管靜脈曲張,甚至破裂出血的患者,病情更加嚴(yán)重,住院天數(shù)也更長。比較3個成分患者的各項費用也可看出,從成分1到3,患者各項費用均增加,尤其是西藥費和其他費用,成分3患者中位數(shù)費用是成分1患者的10倍和25倍左右。可見運用FMM分析住院醫(yī)療費用可有效識別患者的異質(zhì)性,將不同特征的各類患者很好地區(qū)分。
本研究將Gamma分布的有限混合模型應(yīng)用于肝硬化住院患者的醫(yī)療費用研究,結(jié)果顯示肝硬化患者的住院費用表現(xiàn)出明顯的沃貝貢湖效應(yīng),而FMM可有效識別患者異質(zhì)性,成功地將肝硬化患者醫(yī)療費用分解為三個Gamma分布的混合,分別表示低、中和高住院費用的患者。其中,低費用成分患者比例最高、變異度最小,恰當(dāng)?shù)亟忉屃丝側(cè)巳褐凶≡嘿M用的偏峰特征;而高費用成分比例最低、變異度最大,正體現(xiàn)了醫(yī)療費用分布中的厚尾現(xiàn)象。采用FMM識別出3個成分后,進(jìn)一步探索成分間的異質(zhì)性來源。結(jié)果顯示高費用患者多數(shù)年齡大、病情嚴(yán)重、住院天數(shù)長,而且各項費用成分也均高;和低費用患者相比,相差最大的西藥費和其他費用竟高達(dá)10倍和25倍之多,反映了這部分病情嚴(yán)重的患者接受特殊治療而產(chǎn)生了高額費用。這些結(jié)果進(jìn)一步驗證了FMM在根據(jù)醫(yī)療費用識別患者群體異質(zhì)性方面的能力和可靠性。近期國外亦有學(xué)者將FMM應(yīng)用于老年人醫(yī)療費用研究,識別出四種不同的成分費用,并研究不同成分間各類慢性病對費用的影響,為政府制定醫(yī)療政策和高費用人群監(jiān)測干預(yù)提供了指導(dǎo)性建議[8]。本研究中識別到的高費用患者,也可作為下一步費用監(jiān)測和干預(yù)的目標(biāo)群體。
對于醫(yī)療費用的特殊分布問題,國內(nèi)外許多研究者曾采用廣義線性模型來擬合[5-6,9]。和FMM相比,擬合Gamma分布的廣義線性模型是Gamma分布有限混合模型的特例,該法不考慮患者人群的異質(zhì)性,將醫(yī)療費用分布作為一個整體進(jìn)行估計。本研究結(jié)果也顯示廣義線性模型擬合的費用分布效果劣于FMM,而擬合效果的減弱進(jìn)一步導(dǎo)致預(yù)測精度的降低。
本文應(yīng)用FMM時采取了空模型進(jìn)行分析。實際工作中,也可以根據(jù)研究目的和數(shù)據(jù)特征時將協(xié)變量引入模型,如引入臨床檢驗信息或共病信息,區(qū)分各種成分的同時研究費用的影響因素。此外,本研究基于Gamma同質(zhì)分布混合,而有限混合模型支持多種鏈接和分布函數(shù)[7],不僅可探索同質(zhì)混合,也可分析成分間不同分布的混合,在應(yīng)用上更為復(fù)雜,需要更多的后續(xù)研究。
[1]朱川.我國近年衛(wèi)生費用增長及分析.中國外資,2013(4):226-227.
[2]Deb P,Burgess J F.A Quasi-experimental Comparison of Econometric Models for Health Care Expenditures.Hunter College Department of Econometric Working Papers,2003:212.
[3]金琦,何其勇,趙云波,等.1540例肝硬化患者住院費用影響因素分析.中國衛(wèi)生統(tǒng)計,2016,33(1):91-93.
[4]李仁鵬,張麗,徐愛強(qiáng),等.山東省乙型肝炎病毒感染相關(guān)疾病經(jīng)濟(jì)負(fù)擔(dān)分析.中國衛(wèi)生經(jīng)濟(jì),2013(12):8-10.
[5]羅開明,吳黎軍.基于秩和檢驗和廣義線性模型的單病種結(jié)算研究.中國衛(wèi)生統(tǒng)計,2015(4):655-657.
[6]楊彩霞,孫廣恭,常艷群,等.腦梗死患者住院費用影響因素分析.中國衛(wèi)生統(tǒng)計,2011(6):706-707.
[7]Dave Kessler A M.Introducing the FMM Procedure for Finite Mixture Models.SAS Global Forum 2012,2012(2012):328.
[8]Eckardt M,Brettschneider C,van den Bussche H,et al.Analysis of Health Care Costs in Elderly Patients with Multiple Chronic Conditions Using a Finite Mixture of Generalized Linear Models.Health Econ,2017,26(5):582-599.
[9]Dasa V,DeKoven M,Sun K,et al.Clinical and cost outcomes from different hyaluronic acid treatments in patients with knee osteoarthritis:evidence from a US health plan claims database.Drugs Context,2016,5:212296.
(責(zé)任編輯:郭海強(qiáng))
The Application of Finite Mixture Model in the Study of Medical Expenditures for Liver Cirrhosis Inpatients
Ma Xiaomin,Jia Weidong,Yang Shuo,et al
(DepartmentofEpidemiologyandBiostatistics,PublicHealthSchool,GuangdongPharmaceuticalUniversity(510310),Guangzhou)
Objective To explore the finite mixture model(FMM)in identification of heterogeneity of medical cost of liver cirrhosis inpatients and feasibility of improving the prediction precision,we provide statistical methodology support for accurate estimation and forecast in terms of the skewed and heavy tail distribution characteristics of medical expenditures.Methods The principle of FMM is introduced and applied to medical expenditures of liver cirrhosis inpatients from the eighth people's hospital of Guangzhou to identify population heterogeneity,and then we analyze sources of heterogeneity,and compare the prediction results with single component of generalized linear model.Results After modeling the medical expenditures of 2 760 liver cirrhosis inpatients by FMM,the three gamma distribution components of FMM is fitted,including the low expenditures,median expenditures,high expenditures.The goodness-of-fit and predictive effect of FMM are better than the generalized linear model,and the source of heterogeneity analysis further verifies identification ability of FMM.Conclusion The finite mixture model has a good effect on identifying heterogeneity of hospitalization medical expenditures,solving the problem of the skewed and heavy tail distribution characteristics of medical expenditures,finally improve the predictive accuracy.
Medical expenditures;Finite mixture model;Heterogeneity of population
國家自然科學(xué)基金(No.71573059)
1.廣東藥科大學(xué)公共衛(wèi)生學(xué)院流行病學(xué)與衛(wèi)生統(tǒng)計學(xué)系(510310)
2.廣州市第八人民醫(yī)院
△通信作者:郜艷暉,E-mail:gao_yanhui@163.com