許瓊瓊 肖 靜 沈 康 仲亞琴 強(qiáng)福林 吳徐明 袁麗萍 高月霞△
?
基于決策樹(shù)模型食管癌病例組合研究*
許瓊瓊1肖靜1沈康2仲亞琴1強(qiáng)福林2吳徐明2袁麗萍2高月霞1△
【提要】目的探索南通市食管癌病例的DRGs分組方案及費(fèi)用標(biāo)準(zhǔn),為相關(guān)部門決策提供依據(jù)。方法對(duì)2006-2013年南通市腫瘤醫(yī)院以食管癌為主要診斷的11784例病案數(shù)據(jù)進(jìn)行多重線性回歸分析,篩選分類節(jié)點(diǎn)變量,運(yùn)用決策樹(shù)模型進(jìn)行病例分組,采用絕對(duì)值法和相對(duì)權(quán)重法對(duì)住院費(fèi)用的標(biāo)準(zhǔn)進(jìn)行測(cè)算。結(jié)果治療方法、首次入院、年齡、性別、伴隨疾病、并發(fā)癥、轉(zhuǎn)歸等作為食管癌病例分類節(jié)點(diǎn)的關(guān)鍵變量,建立了21個(gè)DRGs組及住院費(fèi)用標(biāo)準(zhǔn)。結(jié)論病例分組結(jié)果合理,住院費(fèi)用標(biāo)準(zhǔn)和病種權(quán)重可以作為相關(guān)部門參考。
食管癌住院費(fèi)用疾病診斷相關(guān)組決策樹(shù)
食管癌是中國(guó)常見(jiàn)的惡性腫瘤之一,嚴(yán)重威脅著居民健康。據(jù)報(bào)道,2010年江蘇省食管癌的發(fā)病率為41.93/10萬(wàn),死亡率31.15/10萬(wàn),腫瘤發(fā)病率和死亡率均排名第3[1]。食管癌患者的疾病負(fù)擔(dān)較重,住院費(fèi)用比較高,變異比較大,最小值在1萬(wàn)元,最大值近30萬(wàn),平均4.7萬(wàn)元[2-3]。這主要與國(guó)內(nèi)現(xiàn)行的醫(yī)保付費(fèi)方式有關(guān),按服務(wù)項(xiàng)目的后付制支付方式,導(dǎo)致過(guò)度醫(yī)療和醫(yī)療費(fèi)用快速增長(zhǎng)。按病種支付等預(yù)付制,被認(rèn)為是有效控制醫(yī)療費(fèi)用增長(zhǎng)的支付方式之一。早在1983年美國(guó)引進(jìn)基于DRGs分組的預(yù)付費(fèi)機(jī)制[4],有效地控制了醫(yī)療費(fèi)用的增加。歐洲很多國(guó)家相繼引進(jìn)基于DRGs的支付機(jī)制[5]。2012年中國(guó)政府在北京的6家醫(yī)院進(jìn)行DRGs付費(fèi)制度試點(diǎn)改革,改革后患者的住院總費(fèi)用降低了6.2%,個(gè)人自付費(fèi)用降低了10.5%[6]。DRGs分組是基于疾病自身特點(diǎn)、治療手段、有無(wú)并發(fā)癥或合并癥等情況,根據(jù)資源消耗的程度制定付費(fèi)疾病分組標(biāo)準(zhǔn)。國(guó)內(nèi)學(xué)者從20世紀(jì)80年代開(kāi)始,研究探討建立適合我國(guó)國(guó)情的疾病診斷相關(guān)分組及費(fèi)用標(biāo)準(zhǔn)制定和成本核算,如陳龍[7]等對(duì)高血壓患者進(jìn)行了DRGs病例組合的費(fèi)用測(cè)算,楊曉蓉[8]對(duì)循環(huán)系統(tǒng)的病例組合方案進(jìn)行制定和評(píng)價(jià)。國(guó)內(nèi)還沒(méi)有食管癌患者的病例組合研究報(bào)道,本研究對(duì)南通市某腫瘤??漆t(yī)院11 784例食管癌患者進(jìn)行住院費(fèi)用分析,基于數(shù)據(jù)挖掘的決策樹(shù)模型進(jìn)行DRGs分組及費(fèi)用測(cè)算評(píng)價(jià),為醫(yī)保預(yù)付費(fèi)制度實(shí)施提供依據(jù)。
1.數(shù)據(jù)來(lái)源
數(shù)據(jù)來(lái)源于南通市腫瘤醫(yī)院2006年1月至2013年12月診斷為食管惡性腫瘤的住院病人病案首頁(yè)數(shù)據(jù)庫(kù),將出院主診斷不是食管癌的病案剔除。為了減少離群值對(duì)研究結(jié)果的影響,數(shù)據(jù)預(yù)處理的排除標(biāo)準(zhǔn)如下:(1)將住院天數(shù)小于1或大于100天的病案剔除;(2)將住院費(fèi)用小于1%或大于99%的病案剔除。經(jīng)過(guò)篩選納入的有效數(shù)據(jù)為11784例,年齡最小22歲,最大99歲,平均年齡(63.82±8.30)歲,中位年齡64歲。
2.研究變量及賦值
本研究以住院費(fèi)用作為因變量,所有住院費(fèi)用用當(dāng)年的居民消費(fèi)價(jià)格指數(shù)(CPI)調(diào)整,住院費(fèi)用最小值為1855元,最大值70969元,平均(22065±14667)元。以年齡、性別、首次入院、伴隨疾病等作為自變量,進(jìn)行多重線性回歸,用方差膨脹因子(VIF)進(jìn)行共線性診斷,篩選分類節(jié)點(diǎn)變量。變量分布及賦值見(jiàn)表1,樣本中有63.4%的病人醫(yī)療保險(xiǎn)狀況為自費(fèi),該樣本主要是異地就醫(yī)的病人。
表1 11784例食管癌患者基本特征及賦值
3.病例組合方法
采用SPSS20.0軟件進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析和決策樹(shù)模型(decision tree)構(gòu)建與修剪[9],卡方自動(dòng)交互檢測(cè)(CHAID)算法構(gòu)建決策樹(shù),交叉驗(yàn)證方法(cross validation)對(duì)樹(shù)模型自動(dòng)修剪,樣本群數(shù)為10。住院天數(shù)為影響食管癌住院費(fèi)用的重要變量[10,14],本研究將住院天數(shù)作為影響變量納入決策樹(shù)模型。以住院費(fèi)用為因變量,以住院天數(shù)為影響變量,以性別、年齡、伴隨疾病、并發(fā)癥、治療方法等作為分類節(jié)點(diǎn)。本研究參數(shù)設(shè)置使用:決策樹(shù)最大深度為3,父節(jié)點(diǎn)的最小樣本數(shù)為100,子節(jié)點(diǎn)的最小樣本數(shù)為50,拆分節(jié)點(diǎn)的檢驗(yàn)水準(zhǔn)α=0.05。分組效果評(píng)價(jià):組間的差異用非參數(shù)Kruskal-Wallis檢驗(yàn),組內(nèi)變異用變異系數(shù)(CV)來(lái)檢驗(yàn)分組的合理性。
1.分類節(jié)點(diǎn)變量篩選
住院費(fèi)用多重線性回歸結(jié)果見(jiàn)表2,從標(biāo)準(zhǔn)偏回歸系數(shù)可知,手術(shù)、放療及化療對(duì)住院費(fèi)用的影響最大,其次是首次入院和醫(yī)保方式對(duì)住院費(fèi)用的影響較大,疾病轉(zhuǎn)歸、年齡、性別、有無(wú)伴隨疾病及有無(wú)并發(fā)癥也是住院費(fèi)用的影響因素。模型的共線性診斷表明,所有VIF<5,可以認(rèn)為不存在共線性問(wèn)題。以治療方式、首次入院、疾病轉(zhuǎn)歸、有無(wú)并發(fā)癥、有無(wú)伴隨病、年齡和性別作為分類節(jié)點(diǎn)變量。
表2 食管癌住院費(fèi)用多重線性回歸分析
2.分類結(jié)果
本研究11 784例食管癌病例共形成21個(gè)DRGs組合,各分組的均數(shù)、中位數(shù)、標(biāo)準(zhǔn)差及變異系數(shù)見(jiàn)表3。為確定分組的合理性,我們對(duì)各病例組合進(jìn)行非參數(shù)Kruskal-Wallis檢驗(yàn),結(jié)果均是P<0.001,說(shuō)明住院費(fèi)用組間異質(zhì)性較好。各病例組合變異系數(shù)CV值見(jiàn)表3,中位數(shù)與均數(shù)比較接近,說(shuō)明組內(nèi)差異較小,分組較為合理。
表3 食管癌DRGs分組結(jié)果(住院費(fèi)用,元)
3.病例組合住院費(fèi)用的相關(guān)標(biāo)準(zhǔn)制定
基于以上方法病例分組后,可以用住院費(fèi)用中位數(shù)制定費(fèi)用參考值的標(biāo)準(zhǔn)[11],計(jì)算住院費(fèi)用上限時(shí),采用各組合住院預(yù)測(cè)費(fèi)用的75%加1.5倍四分位間距[12]。本研究中,食管癌患者住院費(fèi)用超過(guò)費(fèi)用上限定義為超標(biāo)費(fèi)用,超標(biāo)總例數(shù)為978,占本次研究總例數(shù)的8.3%。計(jì)算各DRG組的病種權(quán)重[13],是指該種DRG組合的例均住院費(fèi)用與所有病例平均費(fèi)用的比值,權(quán)重越高,說(shuō)明病人消耗的資源越多,具體見(jiàn)表4。
表4 食管癌DRGs分組的住院費(fèi)用標(biāo)準(zhǔn)及病種權(quán)重
本研究中基于決策樹(shù)中的回歸樹(shù)模型,將11784例食管癌病例根據(jù)不同的治療方案分成21個(gè)組,組間異質(zhì)性較大,組內(nèi)異質(zhì)性較小,分組合理。分組變量沒(méi)有選擇住院天數(shù),主要是考慮到國(guó)內(nèi)還沒(méi)有實(shí)施規(guī)范化的臨床路徑管理,住院天數(shù)的變異較大,這與國(guó)內(nèi)現(xiàn)有的研究一致[7-8,12]。住院天數(shù)作為影響住院費(fèi)用的重要變量[10,14],不能作為分組變量,可以作為影響變量,納入到?jīng)Q策樹(shù)模型。與現(xiàn)有的研究相比,這是本研究在模型設(shè)定方面的重要改進(jìn)。與傳統(tǒng)的多重線性回歸相比,決策樹(shù)模型不要求變量具有特定的分布,對(duì)存在離群值和有偏分布的數(shù)據(jù)不太敏感,通過(guò)交叉驗(yàn)證等方法對(duì)模型進(jìn)行合理剪枝,可達(dá)到穩(wěn)定可重復(fù)的效果[14]。缺失值的處理也是決策樹(shù)模型一大優(yōu)勢(shì),本研究將缺失值作為單獨(dú)一類,獨(dú)立分組效果較好,符合臨床實(shí)踐中實(shí)際住院費(fèi)用的分布。
分類節(jié)點(diǎn)變量選擇合理,分組效果較好。首次入院是影響腫瘤住院費(fèi)用的重要變量,本研究發(fā)現(xiàn)在化療治療病例組合中,首次入院組住院費(fèi)用的中位數(shù)較高,這在醫(yī)療保險(xiǎn)相關(guān)部門決策中參考價(jià)值較大。治療效果、年齡、并發(fā)癥和伴隨疾病是影響各組的主要變量,手術(shù)組病例組合中,有并發(fā)癥組的費(fèi)用高于沒(méi)有并發(fā)癥;放療病例組合中,59歲以上治愈組費(fèi)用最高。另外,沒(méi)有將醫(yī)保方式納入到?jīng)Q策樹(shù)模型,主要是由于分組決定因素是疾病的社會(huì)學(xué)特征與疾病特征。在醫(yī)保部門實(shí)際運(yùn)用過(guò)程中,可以根據(jù)各地醫(yī)?;I資情況,在住院費(fèi)用標(biāo)準(zhǔn)基礎(chǔ)上適當(dāng)?shù)卦黾訖?quán)重。另外,疾病嚴(yán)重程度未能納入回歸樹(shù)模型中[15],主要與病案質(zhì)量有關(guān),在以后的研究中應(yīng)進(jìn)一步完善。
本研究從2006年到2013年時(shí)間跨度比較長(zhǎng),研究樣本量大,通過(guò)交叉驗(yàn)證剪枝,病例組合分組可重復(fù)性強(qiáng),病例組合費(fèi)用具有很強(qiáng)的參考價(jià)值。在醫(yī)保部門實(shí)際應(yīng)用中,主要有住院費(fèi)用絕對(duì)值法和病種相對(duì)權(quán)重系數(shù)法[13]。相對(duì)權(quán)重系數(shù)法是指先根據(jù)一定的原則確定一個(gè)基準(zhǔn)組合,用各組合的平均費(fèi)用與基準(zhǔn)組合平均費(fèi)用的比值表示相關(guān)權(quán)重系數(shù)。通過(guò)計(jì)算各病種相對(duì)權(quán)重系數(shù),可以連接所有的病種,進(jìn)行按病種分值結(jié)算,體現(xiàn)醫(yī)保支付的科學(xué)性。因此,醫(yī)保部門在實(shí)際運(yùn)用過(guò)程中,可以根據(jù)這些分組費(fèi)用之間的比例關(guān)系,醫(yī)保基金的實(shí)際支付能力,確定一個(gè)合適的參考值。病例組合醫(yī)療費(fèi)用的參考價(jià)值在于分類標(biāo)準(zhǔn)的確定,而不是具體的費(fèi)用絕對(duì)值的大小。
[1]韓仁強(qiáng),武鳴,俞浩,等.2010年江蘇省腫瘤登記地區(qū)惡性腫瘤發(fā)病與死亡.江蘇預(yù)防醫(yī)學(xué),2015,1:5-10.
[2]葉斌.食管癌手術(shù)患者住院費(fèi)用及影響因素研究.浙江大學(xué),2015.
[3]胡志平,馮向先,潘雄飛.食管癌患者住院費(fèi)用影響因素分析.中國(guó)公共衛(wèi)生,2013,3:315-317.
[4]Hsiao WC,Sapolsky HM,Dunn DL,et.al.Lessons of the New Jersey DRG payment system.Health Affair,1986,5(2):32-45.
[5]Busse R,Geissler A,Aaviksoo A,et al.Diagnosis-related groups in Europe:moving towards transparency,efficiency and quality in hospitals.Open University Press,Maidenhead,93-114.
[6]Jian W,Lu M,Chan KY,et al.Payment reform pilot in Beijing hospitals reduced expenditures and out-of-pocket payments per admission.Health Affair,2015,34(10):1745-52.
[7]陳龍,馬利,何文英,等.高血壓住院患者DRGs分組方法研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2015,32(1):110-111.
[8]楊曉蓉,吳明.循環(huán)系統(tǒng)病例DRGs組合研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2010,27(2):163-165.
[9]Fetter RB,Mills RE,Riedel DC,et al.The application of diagnostic specific cost profiles to cost and reimbursement control in hospitals.Journal of Medical Systems,1977,1:137-49.
[10]楊梅,肖靜,陳德喜,等.8288例食管癌患者住院費(fèi)用影響因素的通徑分析.現(xiàn)代預(yù)防醫(yī)學(xué),2013,5:801-803.
[11]董軍,胡德奎,陳劍偉,等.病種費(fèi)用控制標(biāo)準(zhǔn)實(shí)驗(yàn)研究.中華醫(yī)院管理雜志,2001,9:529-531.
[12]高建民,鄭古崢玥,詹梅,等.基于疾病診斷相關(guān)組合的住院費(fèi)用標(biāo)準(zhǔn)合理化探討.中國(guó)衛(wèi)生經(jīng)濟(jì),2013,3(1):22-24.
[13]趙一鳴.對(duì)回歸樹(shù)的建模與應(yīng)用一文的幾點(diǎn)補(bǔ)充.中華預(yù)防醫(yī)學(xué)雜志,2003,27(3):141-145.
[14]高建民,鄭古崢玥,詹梅,等.疾病診斷相關(guān)分組分類節(jié)點(diǎn)變量的選擇及其分組結(jié)果的合理性評(píng)價(jià).中國(guó)衛(wèi)生經(jīng)濟(jì),2013,3(1):16-19.
(責(zé)任編輯:劉壯)
Case-Mix Study of Patients with Esophageal Cancer Based on Decision Tree
Xu Qiongqiong,Xiao Jing,Shen Kang,et al
(Department of Health Statistics,School of Public Health,Nantong University(226004),Nantong)
ObjectiveThe study explored the case-mix diagnosis-related-groups of patients with esophageal cancer in Nantong and developed related health expense standards,so as to provide evidence for related departments′ decisions.MethodsAccording to 11 784 inpatients with the principal diagnosis as esophageal cancer from 2006 to 2013 in Nantong tumor hospital,multiple regression model was employed to screening the classification node variables,and the decision tree model was applied to set up the case-mix diagnosis-related-groups.The absolute value method and relative weights were used to calculate the standard.ResultsThe main classification node variables were therapies,first hospitalization,age,gender,concomitant diseases,complication,and prognosis.21 diagnosis-related-groups and related health expense standards were established.ConclusionCase-mix diagnosis-related-groups are reasonable,and the health expense standards and related case weight could make
for related departments.
Esophageal cancer;Hospitalization expense;Diagnosis-related-groups;Decision tree
南通市科技局社會(huì)發(fā)展項(xiàng)目資助(HS2013004);南通大學(xué)博士科研啟動(dòng)基金(14B16)
高月霞,E-mail:gaoyuexia1103@163.com
1.南通大學(xué)公共衛(wèi)生學(xué)院流行病衛(wèi)生統(tǒng)計(jì)系(226004)
2.南通市腫瘤醫(yī)院科教科
中國(guó)衛(wèi)生統(tǒng)計(jì)2016年4期