■ 林曙光 吳芊芊 王應(yīng)明 吳勤德
“在婦產(chǎn)醫(yī)院,年輕婦女每1 000例手術(shù)中有5例死亡,這一比例過高;而在老年罕見癌癥患者醫(yī)院,每1 000例手術(shù)中有110例死亡,這一比例可能非常低”[1],這意味著醫(yī)療衛(wèi)生服務(wù)存在嚴(yán)重的非同質(zhì)性。Golany等[2]研究表明,利用數(shù)據(jù)包絡(luò)分析(data envelopment analysis,DEA)進(jìn)行績效評價時,決策單元(DMU)必須滿足同質(zhì)性,即擁有相同的目標(biāo)或任務(wù)、具有相同的外部環(huán)境和相同的投入產(chǎn)出指標(biāo)及量綱等。因此,傳統(tǒng)DEA模型的標(biāo)準(zhǔn)假設(shè)不適用于非同質(zhì)醫(yī)療服務(wù)的績效評價。Cook等[3]提出具有相同類型投入不同類型產(chǎn)出的DEA模型,Li等[4]和Lin等[5]將其應(yīng)用于醫(yī)療衛(wèi)生績效評價。但對于具有相同投入、產(chǎn)出配置下的非同質(zhì)問題,這些方法并不適用。例如三級醫(yī)院、二級醫(yī)院和鄉(xiāng)鎮(zhèn)衛(wèi)生院,這些醫(yī)療機(jī)構(gòu)都有住院、門診、手術(shù)等醫(yī)療服務(wù),外部看它們具有相同種類的投入和產(chǎn)出,內(nèi)部看它們科室的設(shè)置和功能職責(zé)各不一樣,不存在明確的可對比的決策子單元,如果簡單以出院人次衡量產(chǎn)出不準(zhǔn)確。即使同一醫(yī)院的不同科室,一些科室(如口腔科)通常接收更多癥狀較輕的患者,而另一些科室(如心血管)通常接收病情較危急的患者,如果簡單以手術(shù)人次衡量產(chǎn)出是不準(zhǔn)確。
醫(yī)療衛(wèi)生績效評價體系最重要的特點(diǎn)是評價結(jié)果的準(zhǔn)確性。調(diào)整工具的選擇對評價結(jié)果的可靠性有重要影響[6]。在幾種可用的調(diào)整工具中,診斷相關(guān)組(diagnosis-related group,DRG)廣泛應(yīng)用于醫(yī)療衛(wèi)生管理。DRG在急癥護(hù)理醫(yī)院提供多產(chǎn)品視圖,將資源消耗模式相似的患者分類為具有臨床意義的類別[7]。DRG根據(jù)不同群體的特點(diǎn)賦予不同權(quán)重。疾病的嚴(yán)重性/復(fù)雜性越高,住院時間越長,治療費(fèi)用越昂貴,其權(quán)重越高,反之亦然[8]。如今,DRG已成為一種流行的評估醫(yī)療衛(wèi)生績效的工具[9]。DRG組數(shù)和病例組合指數(shù)(case mix index,CMI)等指標(biāo)常用于績效評價[10],但這些都是獨(dú)立的指標(biāo),不采用其他方法無法給出綜合得分或排名[11]。雖然這些DRG指標(biāo)可以考慮通過權(quán)重構(gòu)成一個綜合得分,但這些指標(biāo)是從不同的維度進(jìn)行評價,如何選取權(quán)重也是一個問題。此外,雖然DRG的病種權(quán)重考慮了病種相對平均水平的資源消耗,并沒考慮醫(yī)療服務(wù)提供者的投入要素(如醫(yī)護(hù)人員、醫(yī)療設(shè)施等),不能衡量DMU的整體效率。因此,DEA和DRG的結(jié)合可能是吸收兩者優(yōu)點(diǎn)、規(guī)避兩者缺點(diǎn)的一種很好的方式。
本研究旨在使用DRG和DEA的框架來評估醫(yī)療衛(wèi)生的績效,并且存在非期望產(chǎn)出的情況下對DMU進(jìn)行評價和完全排名。由于DRG通常用于急性護(hù)理(不包括慢性護(hù)理)[12],因此本研究關(guān)注住院患者急性護(hù)理(不包括慢性護(hù)理)的績效評估。
國內(nèi)較少有文獻(xiàn)研究DRG與DEA結(jié)合的方法進(jìn)行醫(yī)療服務(wù)績效評價,在中國知網(wǎng)和萬方數(shù)據(jù)庫只檢索到6篇相關(guān)文獻(xiàn)[13-18]。但這些研究存在不足,比如吳朝陽等[13]用CMI調(diào)整門診量,楊威等[14]將醫(yī)療收入作為投入指標(biāo),這些用法值得商榷。此外,這些研究大多無法實(shí)現(xiàn)完全排名,而且對非期望產(chǎn)出(或稱低優(yōu)指標(biāo),假設(shè)為z)處理不一致,采用取其倒數(shù)(1/z)或被1減(1-z),這在遇到零值或大于等于1時會有問題。外文文獻(xiàn)關(guān)于此類研究較豐富,O’Neill等[19]、Ni Luasa等[20]和Kohl等[21]對此做了綜述,但外文文獻(xiàn)關(guān)于此類研究大多局限在病例組合(case mix)的應(yīng)用,對DRG的應(yīng)用并不充分。鑒于現(xiàn)有研究不足,本文構(gòu)建可以處理非同質(zhì)病例復(fù)雜度和非期望產(chǎn)出的DRGDEA超效率評價框架,實(shí)現(xiàn)醫(yī)療服務(wù)績效的綜合評價和全面排名。
DEA需要仔細(xì)選擇投入和產(chǎn)出,因?yàn)樾屎芸赡苁艿疆a(chǎn)出定義以及所包括的投入和產(chǎn)出數(shù)量的影響[22]。然而,如果DEA是一個一般的基準(zhǔn)問題,那么投入和非期望產(chǎn)出通常是“越小越好”類型的績效衡量,而期望產(chǎn)出通常是“越大越好”類型的績效衡量。對于產(chǎn)出數(shù)據(jù)中的零值,正如Kuosmanen[23]所指出,如果想要反映一個DMU不產(chǎn)生某個產(chǎn)出的實(shí)際效率,就應(yīng)該使用非徑向模型。因此,本研究選擇非徑向的基于松弛測度(SBM)模型作為績效評價的基本DEA模型。
在討論效率問題時,首先要確定生產(chǎn)可能集(PPS)及其有效邊界,然后確定度量非效率決策單元效率的方法。設(shè)n個DMU集合J={1,2,…,n}。DEA模型假設(shè)生產(chǎn)可能集包含觀測單元,用T={(x,y):x∈能夠生產(chǎn)y∈}。F?re等[24]指出,在規(guī)模收益回報(bào)不變(constant returns to scale,CRS)時,任何DMU都可以徑向擴(kuò)張或收縮形成其他可行的DMU,當(dāng)存在負(fù)值數(shù)據(jù)時會造成不一致。然而,在規(guī)模收益回報(bào)可變(variable returns to scale,VRS)時不會存在此問題。因此,以下模型均采用VRS假設(shè)。首先,本研究先為投入松弛和產(chǎn)出松弛定義了邊界,如式(1)。
接著使用式(1)構(gòu)造改進(jìn)的SBM模型,用于存在負(fù)值數(shù)據(jù)時區(qū)分低效DMU(效率值小于1)和有效DMU(效率值大于等于1)。
式中Ⅱ={i│Pi->0,i=1,…,m},={r│Pr+>0,r=1,…,s}是為了避免零值的除數(shù)P-和P+。由于P-iri(i∈Ⅱ)和Pr+(r∈)總是非負(fù),如果DMUk存在負(fù)數(shù),模型(2)也能計(jì)算效率。
式(2)對于有效DMU所顯示的效率值均為1,無法進(jìn)一步區(qū)分和排名,因此利用式(1)構(gòu)造超效率SBM模型來檢測有效DMU中可能的有界投入節(jié)約(si-/Pi-)和有界產(chǎn)出盈余(sr+/Pr+)。
資料來源于北京公共衛(wèi)生信息中心基于首頁醫(yī)療記錄數(shù)據(jù),從文獻(xiàn)[25]匯編了21所大型公立綜合醫(yī)院共254 191個急癥住院病例。該數(shù)據(jù)使用PKU-DRG進(jìn)行分組。由于DRG主要用于急性護(hù)理,因此數(shù)據(jù)不包括慢性和特殊護(hù)理病例。
表1列出了選取的變量及其定義。從人力資源和資產(chǎn)的角度選擇醫(yī)生、護(hù)士和床位的數(shù)量作為投入;從醫(yī)療服務(wù)容量、范圍和能力的角度,選擇出院人數(shù)、D R G組數(shù)、CMI作為正向產(chǎn)出;而時間效率指數(shù)(time efficiency index,TEI)、費(fèi)用效率指數(shù)(charges efficiency index,CEI)和低風(fēng)險(xiǎn)組住院死亡率(inpatient mortality at low-risk group,IMLRG)越小越好,作為負(fù)向產(chǎn)出[26]。
表1 變量和投入產(chǎn)出集合的定義
CMI、TEI、CEI和IMLRG的詳細(xì)定義見文獻(xiàn)[25]。CMI意味著疾病的復(fù)雜性,它可以用作風(fēng)險(xiǎn)調(diào)整參數(shù)。調(diào)整的出院人次(adjusted discharges,aDischarges)、調(diào)整的TEI(adjusted TEI,aTEI)和調(diào)整的CEI(adjustedCEI,aCEI)的公式如下:
aDischarges越大,表示出院的復(fù)雜病例越多;aTEI越大,表示考慮疾病復(fù)雜度下治療所用的時間比平均水平高;aCEI越大,表示考慮疾病復(fù)雜度下治療所花的費(fèi)用比平均水平高。為了調(diào)查效率分?jǐn)?shù)對各種投入和產(chǎn)出的敏感性,本研究設(shè)置4個投入-產(chǎn)出集合(Set),如表1所示。
CMI可以作為調(diào)整參數(shù),也可作為考核指標(biāo)。Set 1未采用CMI作為調(diào)整參數(shù)或考核指標(biāo),產(chǎn)出指標(biāo)只選取出院人次和低風(fēng)險(xiǎn)組住院死亡率(IMLRG);Set 2將CMI作為一個調(diào)整參數(shù),但只調(diào)整出院人次;Set 3納入DRG組數(shù)、TEI、CEI等考核指標(biāo),將CMI作為一個考核指標(biāo)而不是一個調(diào)整參數(shù);Set 4將CMI作為一個調(diào)整參數(shù),對出院人次、TEI、CEI進(jìn)行調(diào)整。表1中aY1表示調(diào)整產(chǎn)出1,即調(diào)整的出院人次;aY4表示調(diào)整產(chǎn)出4,即aTEI;aY5表示調(diào)整產(chǎn)出5,即aCEI。
表2總結(jié)了投入和產(chǎn)出的基本描述性統(tǒng)計(jì),包括最大值、最小值、平均值、標(biāo)準(zhǔn)差和變化范圍。它表明變量變化很大。以FTE醫(yī)生數(shù)為例,該變量的取值范圍為279~978,標(biāo)準(zhǔn)差為216。同樣的現(xiàn)象也出現(xiàn)在其他變量中。各變量的變化范圍和標(biāo)準(zhǔn)差較大,說明各醫(yī)院經(jīng)營規(guī)模存在較大差異,這也為本研究在所提出的模型中使用VRS假設(shè)提供了依據(jù)。
表2 統(tǒng)計(jì)性描述
對4個投入產(chǎn)出集合運(yùn)行本文提出的D E A模型[即式(2)和式(3)],得到各醫(yī)院的效率值和相應(yīng)的排名。表3的第2、4、6和8列給出了效率值,第3、5、7和9列給出了相應(yīng)的排名。最后一列是各醫(yī)院對4個集合平均得分的變異系數(shù)(coefficient of variance,CV)。醫(yī)院總體CV均值為0.077,說明大多數(shù)醫(yī)院的效率值對不同的投入產(chǎn)出集合并不十分敏感。H醫(yī)院效率值波動最大,標(biāo)準(zhǔn)差為0.156,CV為0.180。在沒有進(jìn)行CMI調(diào)整的Set 1和Set 3,效率最高的都是A醫(yī)院。在進(jìn)行CMI調(diào)整的Set 2和Set 4,效率最高的都是L醫(yī)院。雖然L醫(yī)院的出院人次低于具有最高出院人次的A醫(yī)院,但L醫(yī)院具有最高的CMI(2.087),是A醫(yī)院CMI(1.134)的1.8倍。經(jīng)CMI調(diào)整后,L醫(yī)院的效率高于A醫(yī)院。4個集合排名末位都是T醫(yī)院。T醫(yī)院期望產(chǎn)出和非期望產(chǎn)出處于中等水平,與其擁有最多的床位和醫(yī)生的投入并不匹配,排名末位在情理之中。
表3 4個投入產(chǎn)出集合的運(yùn)行結(jié)果
圖1列出了Set 1和2,Set 3和4的成對比較,考察CMI調(diào)整對效率值的影響。其中圖1(A),橫軸代表Set 1,縱軸代表Set 2,對角線代表兩者相等;從圖中可以看出,除了2個DMU(G和L),經(jīng)CMI調(diào)整的Set 2的大部分DMU的效率值不高于未經(jīng)CMI調(diào)整的Set 1的效率值。在圖1(B),橫軸代表Set 3,縱橫代表Set 4,對角線代表兩者相等;從圖中可以看出,除了2個DMU(L和S),經(jīng)CMI調(diào)整的Set 4的大部分DMU的效率值不高于未經(jīng)CMI調(diào)整的Set 3的效率值。由此可見,變量未經(jīng)CMI調(diào)整,其效率值可能高估。
圖1 Set 1和2,Set 3和4的成對比較
圖2是對Set 1和3、Set 2和4的兩兩比較,考察時間效率指數(shù)和費(fèi)用效率指數(shù)對效率的影響,其坐標(biāo)表示與圖1相似。圖2(A)顯示,除了2個DMU(P和U),Set 3大多數(shù)DMU的效率不低于Set 1。圖2(B)顯示,除了2個DMU(P和U),Set 4大多數(shù)DMU的效率不低于 Set 2。這表明引入時間效率指數(shù)和費(fèi)用效率指數(shù)的評價有利于從患者的視角提升醫(yī)療服務(wù)績效。
圖2 Set 1和3,Set 2和 4的成對比較
表4顯示4個集合效率與相應(yīng)產(chǎn)出的Spearman秩相關(guān)性。第2行顯示,未經(jīng)調(diào)整的出院人次(Y1)與Set 1、Set 3的效率的相關(guān)系數(shù)為負(fù)值且較小。這是因?yàn)槲唇?jīng)調(diào)整的出院人次,其產(chǎn)出并不能體現(xiàn)因治療更加復(fù)雜疾病而產(chǎn)生的績效,但出院人次的增加意味著醫(yī)生、護(hù)士、床位等投入的增加。投入的增加無法體現(xiàn)產(chǎn)出的增加,從而未經(jīng)調(diào)整的出院人次與效率呈輕微負(fù)相關(guān)。相反地,從第3行可以看出調(diào)整的出院人次(aY1)與Set 2和Set 4的效率呈正相關(guān),表明調(diào)整的出院人次對于效率值的正向作用。
表4 產(chǎn)出與4個投入產(chǎn)出集效率值的Spearman秩相關(guān)系數(shù)
第4行顯示低風(fēng)險(xiǎn)組住院死亡率(IMLRG)對于效率值的影響。Set 2效率受IMLRG負(fù)向影響大于Set 1,Set 4效率受IMLRG負(fù)向影響大于Set 3。這表明指標(biāo)經(jīng)過CMI調(diào)整后,IMLRG對于效率負(fù)向影響更強(qiáng)。
第5行和第6行顯示在Set 3中,DRG組數(shù)和CMI都作為單獨(dú)指標(biāo)考核時,CMI對于效率值的影響遠(yuǎn)大于DRG組數(shù)(0.179 vs. 0.061);而在Set 4中,DRG組數(shù)對效率幾乎沒有影響(-0.003)。這表明引入DRG績效評價后,醫(yī)院管理的重點(diǎn)應(yīng)優(yōu)先提高治療復(fù)雜疾病的技術(shù)即提供專而精的服務(wù),而不是擴(kuò)大醫(yī)療服務(wù)范圍。
第7~10行,從患者的醫(yī)療費(fèi)用和時間成本評價醫(yī)療服務(wù)績效。不管是TEI-CEI或是aTEI-aCEI,可以看出CEI相關(guān)系數(shù)的絕對值高于TEI,aCEI相關(guān)系數(shù)的絕對值高于aTEI,表明在醫(yī)院管理中,降低患者的醫(yī)療費(fèi)用優(yōu)先于降低患者的時間成本。這建議醫(yī)院管理重點(diǎn)應(yīng)鼓勵降低醫(yī)療服務(wù)成本,促進(jìn)精細(xì)化管理,減輕患者醫(yī)療費(fèi)用負(fù)擔(dān)。
本研究提出了融合DRG和DEA的DRG-DEA評價框架,以評估醫(yī)療服務(wù)績效,這有助于:(1)提供未經(jīng)和經(jīng)病例組合調(diào)整的績效信息;(2)通過DRG分組,能夠辨識大概率由于醫(yī)療護(hù)理不當(dāng)引起的死亡,使死亡率成為評價醫(yī)療服務(wù)質(zhì)量的負(fù)向指標(biāo);(3)利用評價結(jié)果可以為提高醫(yī)院效率提供一些建議,并幫助管理人員知道如何有目標(biāo)地努力,或在哪里發(fā)揮有限的資源,以使他們的回報(bào)最大化;(4)體現(xiàn)了以患者為中心的理念,既考慮出院人次等期望產(chǎn)出,也考慮住院時長、醫(yī)療費(fèi)用和低風(fēng)險(xiǎn)死亡率等非期望產(chǎn)出。本研究提出的以患者為中心的績效評價體現(xiàn)了我國提出的“以人民健康為中心”的醫(yī)療衛(wèi)生服務(wù)理念,這是未來醫(yī)療衛(wèi)生服務(wù)績效評價值得研究的方向。