劉丹
摘 要:目的 通過對城鎮(zhèn)居民醫(yī)療保險報銷費用與數據挖掘結合,綜合分析筆者所在醫(yī)院大病費用的構成及依賴關系,為進一步改善醫(yī)療服務質量提供理論依據。方法 采用數據基本計算方法和決策樹模型構建,探索醫(yī)療費用相關數據和數據間依賴關系。結果 報銷大病居民為9073人,住院10368人次,總計報銷12135人次,醫(yī)療總費用為17842.82萬元,基本保險報銷9536.62萬元,占53.45%;心腦血管疾病和惡性腫瘤成為報銷的主體,分別為16.09%和14.51%;對醫(yī)療費用影響最大的是醫(yī)療類型,其次為疾病種類,最不明顯的是性別。結論 慢性病是該院大病報銷的主要病種,醫(yī)療類別是重要的影響醫(yī)療費用的因素,完善慢性病就診流程,是解決醫(yī)療費用的重要措施之一。
關鍵詞:數據挖掘 城鎮(zhèn)居民 醫(yī)療保險
中圖分類號:TP27 文獻標識碼:A 文章編號:1674-098X(2017)07(c)-0128-02
隨著我國醫(yī)療保險體制的不斷完善和醫(yī)療保險范圍的不斷擴大,城鎮(zhèn)職工基本醫(yī)療保險與城鎮(zhèn)居民醫(yī)療保險已經基本覆蓋。而基本醫(yī)療保險針對大病風險依然存在,衛(wèi)生部國家衛(wèi)生服務調查顯示[1]:住院患者中,由于經濟困難或者費用太高而要求出院的患者占有比例高達36.8%,其中大病患者是此人群的主要群體[2]。數據挖掘是從不完全大量的,或者模糊、隨機的數據庫中,應用分析工具,在大量數據中發(fā)現數據間關系并建立模型,挖掘潛在有用信息的過程[3]。本研究利用計算機技術結合數據挖掘的理論方法,對醫(yī)療保險中大病保險數據進行分析,收到很好效果,現報道如下。
1 資料與方法
1.1 樣本和數據的選擇
本研究選取本院2014年1月至2016年12月的城鎮(zhèn)居民數據庫作為研究數據對象,主要包括:重大疾病住院記錄報銷記錄和門診隨訪報銷記錄兩部分,具體為患者基本信息數據庫,包括性別、年齡、醫(yī)保報銷種類等數據;反應疾病類型和醫(yī)療費用數據庫,和醫(yī)療服務費用補償數據庫,數據來源于該院醫(yī)保科。
1.2 方法
1.2.1 數據清洗方法
運用計算機篩選功能,將全部數據進行清洗,在17152條數據中,篩選出1053條重復信息,核實剩余信息,篩選數據的異常值或者空項,將無法核實的信息進行刪除,刪除信息3964條信息,本次研究有效信息為12135條。將有效信息進行歸類整理,采用國際分類標準ICD-10進行分類,取其前三位有效代碼。
1.2.2 數據挖掘工具
本研究選取Excel 2010和SPSS 22.0兩種軟件進行數據挖掘分析,通過Excel 2010的SQL Server的程序完成數據挖掘的基本計算,將整理完善的數據導入SPSS 22.0中,對數據進行深層次計算。
1.2.3 數據分析方法
(1)數據基本算法:計算數據的均值、中位數、標準差、方差等數據并分析其數據分布情況,利用數據透視表法分析匯總值,通過數據列表的方式對每個數據進行多重比較。從眾多數據中,找到數據可能存在的關系或者數據異常情況等[4]。
(2)決策樹:結合Excel 2010和SPSS 22.0軟件,采用寬度優(yōu)先策略和預排序的方式,從無序、雜亂無規(guī)則的數據中推理出分類規(guī)則,從而得到決策樹的表現方式,可用于對數據對象的識別,并針對數據進行預測。通過決策樹數據集中屬性進行測試,從決策樹的根節(jié)點到葉節(jié)點的路徑實現類別預測。
2 結果
2.1 基本資料
本次數據分析顯示,報銷大病居民為9073人,住院10368人次,共報銷12135人次,男性4384人,女性4689人,成年人4274人,占84.25%。醫(yī)療總費用為17842.82萬元,基本保險報銷9536.62萬元,占53.45%,商業(yè)保險報銷3082.05萬元,占17.27%,患者個人支付5224.15萬元,占29.28%。
2.2 疾病類型
按照報銷次數和人數比較分析發(fā)現,本醫(yī)院報銷最主要的是以慢性病為主,其中心腦血管疾病和惡性腫瘤成為報銷的主體(見表1)。
2.3 醫(yī)療費用的影響因素
本研究通過結合一般資料調查,共計篩選出5個類別的因素與醫(yī)療費用具有關聯(lián),通過決策樹模型預測各屬性之間的依賴關系,按照依賴關系的大小,對醫(yī)療費用影響最大的是醫(yī)療類型,其次為疾病種類,最不明顯的是性別(見圖1)。
根據上述排序,以醫(yī)療類別為節(jié)點對決策樹進行進一步分析,醫(yī)療費用被自行分為5個區(qū)間,即為<6093元;6093~23085元;23085~45931元;45931~79525元;≥79525元,根據決策樹模型,在門診診療中,有99.41%的醫(yī)療費用小于6093區(qū)間,超過本區(qū)間的基本以慢性腎病為主,占0.42%;在住院診療中,以6093~23085元區(qū)間最多,占73.18%。在疾病種類分析中,占用費用最高的疾病為慢性缺血性心臟病,其次為慢性腎病,說明此兩種疾病是大病費用最高的病種,而在所以關系屬性之中,都與住院時間具有重要關系,精神類疾病、惡性腫瘤、慢性腎病診療時間均較長,普遍超過12d,而住院時間的增加,也直接導致了醫(yī)療衛(wèi)生服務費用上漲。
3 討論
本次研究發(fā)現,醫(yī)療總費用為17842.82萬元,基本保險(包括城鎮(zhèn)職工基本醫(yī)療保險和城鎮(zhèn)居民基本醫(yī)療保險)報銷9536.62萬元,占53.45%,商業(yè)保險報銷3082.05萬元,占17.27%,患者個人支付5224.15萬元,占29.28%。雖然基本保險仍然占較高比例,但是個人支出部分仍然較高,近30%的比例通過個人支付完成,這在一定程度上增加了個人醫(yī)療衛(wèi)生費用的支出。
在病種方面分析發(fā)現,慢性病依然是該院就診的主體病種,前幾位均屬于慢性病范疇,而在大病風險上,排名靠前的為腦卒中和慢性缺血性心臟病,惡性腫瘤也呈較快增長趨勢,而且惡性腫瘤也是造成高額醫(yī)療費用的主要部分,即為研究發(fā)現[5],惡性腫瘤的居民自付比例在18.36~21.09%之間,而在該院的自付比例高于這個范圍,說明在惡性腫瘤的治療過程中,注重醫(yī)保政策的解讀,規(guī)范診療慢性病的制度,合理應用恰當治療方案,有助于提高報銷比例,從而減輕患者疾病負擔。
通過計算機輔助數據挖掘技術,發(fā)現在該院醫(yī)療費用依賴程度最高的為醫(yī)療類型,門診相對費用較低,而住院患者費用較高,這也屬于正常診療規(guī)范范疇。疾病的類型和住院時間均是醫(yī)療費用依賴較高的項目。值得一提的是本次決策樹模型是應用綜合評價離群點完成的,在普通的模型中,離群點屬于異常值范疇,往往是要剔除的,而在醫(yī)保費用中,由于疾病狀況、病情的輕重、住院時長等因素的影響[6],離群點也是具有重要意義的,因此在后期決策樹模型的準確性驗證方面,得到了比較好的效果,也因此證實了醫(yī)療費用的真實依賴關系。
綜上所述,慢性病是該院大病報銷的主要病種,醫(yī)療類別是重要的影響醫(yī)療費用的因素,完善慢性病就診流程,是解決醫(yī)療費用的重要措施之一。
參考文獻
[1] 中國衛(wèi)生部.2011年醫(yī)療衛(wèi)生改革階段性評估調查[Z].
[2] 吳群紅,李葉,徐玲,等.醫(yī)療保險制度對降低我國居民災難性支出的效果分析[J].中國衛(wèi)生政策研究,2012(9): 62-66.
[3] 王麗珍,周麗華,陳紅梅,等.數據倉庫與數據挖掘原理及應用[M].北京:科學出版社,2008.
[4] 霍繼合.基于web的數據挖掘技術研究[D].東北財經大學,2005.
[5] 孫冬悅,孫紐云,房珊杉,等.大病醫(yī)療保障制度的國際經驗及啟示[J].中國衛(wèi)生政策研究,2013(1):13-20.
[6] 張宗久,周軍,梁銘會,等.推進我國大病保障制度建設工作的思考與設想[J].中國衛(wèi)生政策研究,2013(1):6-10.endprint