北京大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生政策與管理系(100191)
張靚囡 李璟媛 馮 文△
【提 要】 目的 支付標(biāo)準(zhǔn)的測(cè)算是DRG實(shí)施中的關(guān)鍵環(huán)節(jié),本研究旨在分析比較四種常用的數(shù)據(jù)裁剪方法,為實(shí)際付費(fèi)做好準(zhǔn)備,也為后續(xù)的研究與實(shí)踐提供啟示及方法改進(jìn)的依據(jù)。方法 利用中段區(qū)間法和縮尾法對(duì)某市二級(jí)醫(yī)院2017-2019年出院病例的住院費(fèi)用離群值進(jìn)行裁剪,用變異系數(shù)、總體方差減少系數(shù)、Kruskal-Wallis H統(tǒng)計(jì)量及ROC曲線評(píng)價(jià)不同方法裁剪后對(duì)DRG分組效能的影響。結(jié)果 四種方法裁剪離群值后對(duì)DRG分組效能指標(biāo)均有改善,但改善程度各有不同,最適宜的裁剪方法為方法2(裁剪上限Q3+1.5IQR,裁剪下限Q1-0.5IQR)。綜合評(píng)價(jià)離群值裁剪前后CV、RIV以及ROC曲線的變化,可以得到實(shí)現(xiàn)更佳分組效能的數(shù)據(jù)裁剪方法。結(jié)論 恰當(dāng)裁剪離群值可規(guī)避醫(yī)?;鸬牟槐匾速M(fèi)、維持醫(yī)院經(jīng)濟(jì)平穩(wěn)運(yùn)行、減少患者疾病負(fù)擔(dān),地方醫(yī)保局可根據(jù)實(shí)際住院數(shù)據(jù)恰當(dāng)選取裁剪方法。
疾病診斷相關(guān)分組(diagnosis related groups,DRG)是綜合考慮患者的疾病診斷、手術(shù)操作、治療方式、個(gè)體特征等因素,將病例進(jìn)行分類的一種患者分組方案[1]。該方法關(guān)注的是“臨床過程”和“資源消耗”兩個(gè)維度,分組結(jié)果要保障同一個(gè)DRG內(nèi)的病例臨床過程相似,資源消耗相近[2],進(jìn)而以DRG組為單位制定費(fèi)用標(biāo)準(zhǔn)進(jìn)行付費(fèi)。
在根據(jù)歷史出院病例進(jìn)行DRG分組及病組均數(shù)計(jì)算、權(quán)重測(cè)算時(shí),若組內(nèi)包含遠(yuǎn)高于大多數(shù)患者住院費(fèi)用水平的病例,將會(huì)導(dǎo)致該組的住院費(fèi)用平均值被高估[3],使該組的付費(fèi)權(quán)重測(cè)算值增大,不僅會(huì)占用其余病組的預(yù)付金額,還會(huì)帶來醫(yī)保基金的浪費(fèi)。反之,該病組的平均費(fèi)用將被低估,付費(fèi)權(quán)重測(cè)算值偏低,會(huì)使該類病組收不抵支,可能會(huì)導(dǎo)致醫(yī)院推諉該類患者,不僅會(huì)對(duì)醫(yī)院管理決策產(chǎn)生重大影響,也將給患者帶來沉重經(jīng)濟(jì)負(fù)擔(dān)[4]。
2019年10月《國(guó)家醫(yī)療保障疾病診斷相關(guān)分組(CHS-DRG)分組與付費(fèi)技術(shù)規(guī)范》中提出“精確付費(fèi)是DRG實(shí)施的重要保障”。同年,國(guó)家醫(yī)保局、財(cái)政部、國(guó)家衛(wèi)生健康委、國(guó)家中醫(yī)藥局聯(lián)合印發(fā)的《關(guān)于印發(fā)按疾病診斷相關(guān)分組付費(fèi)國(guó)家試點(diǎn)城市名單的通知》中指出“對(duì)于付費(fèi)異常高值或異常低值的病組,可按項(xiàng)目付費(fèi)”,但離群值裁剪的指標(biāo)及范圍如何界定目前尚無(wú)統(tǒng)一規(guī)定。
中段區(qū)間法(也稱四分位間距法)(interquartile range,IQR)和縮尾法(winsorize)是目前最為常見的患者住院費(fèi)用離群值裁剪的兩種方法。在不同的研究中,研究者又設(shè)置了不同的參數(shù)。如歐洲學(xué)者分別在2003[3]和2008年[5]的研究中采用了中段區(qū)間法,但后者對(duì)極低界值的設(shè)定參數(shù)與前者不同。在縮尾法中,取上下2.5%[6]和上下1%[7-8]是常見的臨界值設(shè)定方法。在國(guó)內(nèi)各地試行DRG之后,學(xué)者在不同的研究中選擇了不同的數(shù)據(jù)裁剪方法,如張宏等人的研究[9]選用住院費(fèi)用的第75百分位數(shù)加1.5倍四分位數(shù)間距的方法裁剪高離群值,袁麗萍等人的研究[10]剔除了住院費(fèi)用小于1%或大于99%的病例等。國(guó)際上,F(xiàn)rancesc Cots[3]等人的研究中比較了不同離群值裁剪方法的效果和影響,而國(guó)內(nèi)還鮮見相關(guān)比較研究。
本研究旨在通過對(duì)某市二級(jí)醫(yī)院2017-2019年出院病例的住院費(fèi)用進(jìn)行裁剪,分析比較四種常用的數(shù)據(jù)裁剪方法的影響,從而選取較為合適的方法,達(dá)到降低DRG病組內(nèi)數(shù)據(jù)變異程度、提升分組效能、提高DRG病組權(quán)重測(cè)算可靠性的目的,為后續(xù)實(shí)際付費(fèi)做好準(zhǔn)備,同時(shí)也為后續(xù)相關(guān)領(lǐng)域的研究提供啟示及方法改進(jìn)的依據(jù)。
本研究采用2020年6月18日國(guó)家醫(yī)保局印發(fā)的《醫(yī)療保障疾病診斷相關(guān)分組(CHS-DRG)細(xì)分組方案(1.0版)》(共618組)對(duì)我國(guó)西南地區(qū)某市21家二級(jí)醫(yī)院2017-2019年52.8萬(wàn)條出院病例進(jìn)行疾病分組,以DRG病組例數(shù)≥30例為穩(wěn)定病組,保留526739條出院病例,共計(jì)369組。
(1)數(shù)據(jù)裁剪方法
本研究采用四種常用的離群值裁剪方法,具體公式如下:
方法1:裁剪上限=Q3+1.5×IQR,裁剪下限=Q1-1.5×IQR,式中,IQR是住院費(fèi)用分布的下四分位數(shù)(Q1)和上四分位數(shù)(Q3)之間的差值[3,11]。
方法2:裁剪上限=Q3+1.5×IQR,裁剪下限=Q1-0.5×IQR[5,12]。
方法3:針對(duì)CV>1的病組,按照方法1公式裁剪(為避免過度裁剪,該方法只裁剪存在較大變異問題的病組)。
方法4:裁剪上限=住院費(fèi)用的第97.5個(gè)百分位數(shù),裁剪下限=住院費(fèi)用的第2.5個(gè)百分位數(shù)[13-14]。
(2)分組效能評(píng)價(jià)指標(biāo)
①組內(nèi)異質(zhì)性評(píng)價(jià):變異系數(shù)(coefficient of variation,CV)是檢驗(yàn)統(tǒng)計(jì)數(shù)據(jù)聚類擬合度的重要指標(biāo)[15],國(guó)際上通常把變異系數(shù)作為從ADRG到DRG尋找分類節(jié)點(diǎn)的標(biāo)志[16]。本研究用DRG組內(nèi)住院費(fèi)用的變異系數(shù),反映各DRG組內(nèi)不同病例住院費(fèi)用的差異度(離散度),原則上要求組內(nèi)變異系數(shù)小于1。CV值越小,說明組內(nèi)的變異越小,分組效果越好[10]。
②組間異質(zhì)性評(píng)價(jià)
總體方差減少系數(shù)(reduction in variance,RIV):為DRG組間差異度,CHS-DRG用RIV來衡量DRG系統(tǒng)的分組效能,RIV越大說明DRG組間異質(zhì)程度越強(qiáng),分組系統(tǒng)的區(qū)分度越高,分組效果越好。通常要求RIV值達(dá)到70%以上[17]。
完全隨機(jī)設(shè)計(jì)秩和(Kruskal-Wallis H)檢驗(yàn):可檢驗(yàn)不符合正態(tài)分布的多個(gè)獨(dú)立樣本間是否來自不同的總體分布,當(dāng)P<α(α為檢驗(yàn)水準(zhǔn))差異有統(tǒng)計(jì)學(xué)意義時(shí),認(rèn)為多個(gè)總體間相比較有差異[18-19]。本研究中,各病組的次均住院費(fèi)用不滿足正態(tài)分布,故使用KW統(tǒng)計(jì)量檢驗(yàn)各病組經(jīng)不同裁剪方法得到的各組次均費(fèi)用是否有統(tǒng)計(jì)學(xué)差異。
③分組效果合理性的綜合評(píng)價(jià):受試者工作曲線(receiver operator characteristic curve,ROC)的檢驗(yàn)變量是分別用方法1、方法2、方法4判斷病例是否為極值,狀態(tài)變量是經(jīng)裁剪強(qiáng)度最小的方法3判斷病例是否為極值。
(3)統(tǒng)計(jì)學(xué)方法
采用Excel 2019及SPSS 26.0進(jìn)行數(shù)據(jù)庫(kù)的整理與分析。采用前述指標(biāo)對(duì)DRG分組效能進(jìn)行評(píng)價(jià),Kruskal-Wallis H檢驗(yàn)水準(zhǔn)α=0.05。計(jì)數(shù)資料以率、百分比表示。
結(jié)果顯示,各病組變異系數(shù)范圍為0.25~2.87,有3個(gè)病組CV>2,有114個(gè)(31%)病組CV>1,說明在病組費(fèi)用測(cè)算過程中,首先需要處理極值以減少對(duì)病組資源消耗水平的估計(jì)偏差。各病組患者的次均住院費(fèi)用呈偏態(tài)分布,除2個(gè)病組偏度<0外,各病組的偏度系數(shù)均>0,說明病組普遍呈現(xiàn)正偏態(tài)分布。有17個(gè)病組的偏態(tài)系數(shù)>10,右側(cè)長(zhǎng)尾明顯,極大值是影響病組費(fèi)用分布的主要因素。各病組的峰度范圍為-0.95~506.12,普遍呈現(xiàn)尖峰態(tài),見圖1。
四種裁剪方法對(duì)于數(shù)據(jù)庫(kù)的裁剪比例各有不同。對(duì)數(shù)據(jù)庫(kù)裁剪強(qiáng)度最大的是方法2,其裁剪比例最高(8.35%),裁剪去除的極大值與極小值比例也最高,分別占5.36%和2.99%;其次為方法1(5.47%),其裁剪去除的極大值比例同方法2,而裁剪低限較方法2寬松,故裁剪去除的極小值比例低于方法2,為0.11%;方法4上下限各裁剪2.50%,裁剪比例低于方法1和2;裁剪比例最低的為方法3(1.30%),見表1。
圖1 裁剪前患者住院費(fèi)用變異系數(shù)、峰度與偏度
結(jié)果顯示,入組病組和穩(wěn)定病組有超過25%的病組內(nèi)病例住院費(fèi)用差異較大,方法1、2和3裁剪后數(shù)據(jù)庫(kù)中有1.63%的病組內(nèi)病例住院費(fèi)用差異較大,方法4裁剪后數(shù)據(jù)庫(kù)中僅0.54%的病組內(nèi)(共計(jì)8例)病例住院費(fèi)用差異較大,見表2。
表1 某市二級(jí)醫(yī)院2017-2019年歷史數(shù)據(jù)按 CHS-DRG細(xì)分組入組數(shù)據(jù)次均費(fèi)用裁剪基本情況
表2 某市二級(jí)醫(yī)院2017-2019年歷史數(shù)據(jù)裁剪前后病組內(nèi)次均費(fèi)用變異情況
經(jīng)過不同數(shù)據(jù)裁剪方式,RIV值從穩(wěn)定病組的0.30最高提升至方法2裁剪后的0.57,即組間變異能夠解釋57%的總變異。相比之下,方法1對(duì)初始值的RIV貢獻(xiàn)值低于方法2,為0.25;方法3對(duì)初始值的貢獻(xiàn)僅為0.08;方法4最差,為-0.01。
多個(gè)獨(dú)立樣本的Kruskal-Wallis H檢驗(yàn)結(jié)果顯示,穩(wěn)定病組庫(kù)和經(jīng)四種裁剪方式裁剪后病例庫(kù)各DRG組間卡方值所對(duì)應(yīng)的P值均為<0.001,說明各組間病例次均費(fèi)用的差異有統(tǒng)計(jì)學(xué)意義,即分組效果較好,見表3。
表3 某市二級(jí)醫(yī)院2017-2019年歷史數(shù)據(jù)裁剪前后的DRG組間差異情況
用ROC曲線評(píng)價(jià)病例組合分類合理性。結(jié)果顯示,三種方法的曲線下面積均大于無(wú)效面積0.5(P<0.05)。其中方法1的曲線下面積最大,為0.979,高于方法2的0.964,方法4的曲線下面積略低,為0.695,詳見表4、圖2。
表4 三種數(shù)據(jù)裁剪方法的ROC曲線檢驗(yàn)
圖2 三種數(shù)據(jù)裁剪方法的ROC曲線
研究顯示,不同的離群值裁剪方法對(duì)分組效能的改善程度不同。在有同樣的CV值改善和KW檢驗(yàn)通過的情況下,方法1和方法2在其他分組效能指標(biāo)上各有所長(zhǎng),方法1在盡可能保留原始數(shù)據(jù)方面優(yōu)于方法2,方法2對(duì)RIV值的改善程度略優(yōu)于方法1。由于方法2對(duì)離群值的裁剪沒有超過10%,因此,對(duì)于本次分組數(shù)據(jù),本研究認(rèn)為用方法2對(duì)DRG分組效能改善的程度最佳,方法1為次優(yōu)選擇,見表5。
表5 四種數(shù)據(jù)裁剪方法結(jié)果
數(shù)據(jù)裁剪對(duì)不同病組的影響不同。本研究中方法1和方法2裁剪的高費(fèi)用病例數(shù)最多(28219例),分析裁剪去除的高費(fèi)用病例數(shù)占前10位的DRG組及其占比。結(jié)果顯示,對(duì)“尿路結(jié)石、阻塞及尿道狹窄,不伴并發(fā)癥或合并癥”的影響最大,裁剪掉的高費(fèi)用病例數(shù)超過10%,其次是“腦缺血性疾患”、“呼吸系統(tǒng)感染/炎癥”,裁剪掉的高費(fèi)用病例數(shù)占比分別為6.13%和5.81%,見表6。
表6 數(shù)據(jù)裁剪去除高費(fèi)用病例數(shù)占前10位的DRG組及其占比
DRG將幾十萬(wàn),甚至幾百萬(wàn)份病例納入600余個(gè)病組,故需要評(píng)價(jià)病例分組的合理性,即分組效能。本研究顯示,除個(gè)別病組外,絕大部分DRG病組的費(fèi)用數(shù)據(jù)呈現(xiàn)正偏態(tài)分布,數(shù)據(jù)分布陡峭,因此需去掉離群值再判斷分組效能。本研究中費(fèi)用數(shù)據(jù)的特征與既往研究一致[20],采用四種方法裁剪離群值,并通過CV值、RIV值、KW統(tǒng)計(jì)量、ROC曲線反映裁剪前后DRG分組效能。結(jié)果顯示,四種方法裁剪離群值后對(duì)DRG分組效能指標(biāo)均有改善,但改善程度各有不同。
就裁剪強(qiáng)度而言,方法2整體裁剪強(qiáng)度最大,其對(duì)極大值的裁剪強(qiáng)度與方法1相同,對(duì)極小值的裁剪強(qiáng)度超過方法1;其次是方法4;方法3裁剪強(qiáng)度最低,此法只針對(duì)CV>1的病組裁剪,裁剪比例最小,無(wú)論是極大值還是極小值裁剪例數(shù)均最少,裁剪后對(duì)RIV的改善不足,存在極值處理不足的情況。
數(shù)據(jù)裁剪降低了病組的組內(nèi)變異,CV值明顯減小,從最初139個(gè)CV值大于1的病組(共計(jì)97359例)最低減少到方法4裁剪后的2個(gè)病組(共計(jì)8例),起到了DRG病組歸集的作用。組間變異結(jié)果顯示,經(jīng)KW檢驗(yàn)后,四種方法裁剪后各組間病例次均費(fèi)用差異均有統(tǒng)計(jì)學(xué)意義,但經(jīng)方法2裁剪后RIV值改善最為明顯,較初始值0.30已經(jīng)有了較為明顯的提升,方法1、3、4的RIV值依次降低,且方法4對(duì)組間變異較初始并無(wú)改善作用。
綜合ROC評(píng)價(jià)結(jié)果顯示,以方法3作參考變量,方法1的曲線下面積最大,方法2略低,方法4最低,且均大于無(wú)效面積。說明由不同方法裁剪后的數(shù)據(jù)庫(kù),各DRG組間的住院費(fèi)用均有統(tǒng)計(jì)學(xué)差異,進(jìn)一步說明裁剪后分組結(jié)果具有合理性,以方法1的裁剪效果最好。
去除離群值病例數(shù)前10位DRG組的分析發(fā)現(xiàn),有9個(gè)組超高限病例數(shù)占比超過5%,其中包括1組占比超10%的LX15病組,提示醫(yī)院可能存在住院適應(yīng)癥和診療行為不規(guī)范問題,提示地方醫(yī)保局加強(qiáng)關(guān)注。
本研究通過對(duì)不同數(shù)據(jù)裁剪方法的比較,顯示在特定的數(shù)據(jù)分布特征下,不同的離群值裁剪方法實(shí)現(xiàn)了不同程度的分組效能改善。對(duì)離群值進(jìn)行恰當(dāng)?shù)牟眉魩椭t(yī)保合理確定疾病治療成本,進(jìn)行精準(zhǔn)定價(jià);促使醫(yī)院規(guī)范診療行為,加強(qiáng)成本管理,在控制費(fèi)用的同時(shí)保障患者診療質(zhì)量與安全,提高患者就醫(yī)滿意度,實(shí)現(xiàn)醫(yī)、患、保的三方共贏。
離群值處理的效果首先取決于原始數(shù)據(jù)分布特征,本研究探索不同的數(shù)據(jù)處理方法后,確定了對(duì)于本次數(shù)據(jù)最適宜的數(shù)據(jù)裁剪方法,并不意味著該方法適用于所有地區(qū)、所有分組方案的DRG數(shù)據(jù)。不同地區(qū)和不同類型的醫(yī)院,應(yīng)該進(jìn)一步探索對(duì)于不同分布特征的數(shù)據(jù)的處理方法,以把握DRG數(shù)據(jù)裁剪方法的普遍適用性。