郝 倩 章 平
(杭州醫(yī)學(xué)院 杭州 310013) (1杭州醫(yī)學(xué)院 杭州 310013 2浙江大學(xué) 杭州 310058)
醫(yī)保支付連接醫(yī)療衛(wèi)生服務(wù)供需雙方,在新醫(yī)改中具有戰(zhàn)略地位[1],發(fā)揮基礎(chǔ)性、引導(dǎo)作用。以醫(yī)保支付改革為杠桿,協(xié)同推進(jìn)醫(yī)療、醫(yī)保、醫(yī)藥“三醫(yī)聯(lián)動”是當(dāng)前我國新醫(yī)改重點(diǎn)任務(wù)和關(guān)鍵突破口。按疾病診斷相關(guān)分組(Diagnosis Related Groups,DRG)付費(fèi)的方式是依據(jù)患者疾病嚴(yán)重程度、治療方法復(fù)雜程度以及醫(yī)療資源消耗程度等因素將住院患者分成若干組(即DRG組),以組為單位制定付費(fèi)標(biāo)準(zhǔn)[2-3]。該方式廣泛用于住院患者醫(yī)療費(fèi)用支付或預(yù)算管理,已成為國際公認(rèn)、相對科學(xué)有效的醫(yī)療費(fèi)用控制管理方式[4],可在醫(yī)療和醫(yī)保機(jī)構(gòu)之間建立風(fēng)險共擔(dān)機(jī)制,優(yōu)化衛(wèi)生資源配置,評估臨床績效,控制醫(yī)療費(fèi)用,平衡醫(yī)保、醫(yī)院、醫(yī)生和患者的利益[5],從而實(shí)現(xiàn)價值醫(yī)療[6]。20世紀(jì)80年代我國引入DRG并參照國際經(jīng)驗(yàn)開展地方層面試點(diǎn),由理論研究逐步轉(zhuǎn)向?qū)嵺`應(yīng)用并推廣,同時出現(xiàn)編碼高套、編碼低套、分解住院、治療不足、推諉患者和醫(yī)?;鹬С鲈鲩L過快等問題和弊端[7]。隨著付費(fèi)方式、基金運(yùn)行模式的變化,基金支出監(jiān)管方式與手段將面臨新挑戰(zhàn),《國家醫(yī)療保障局關(guān)于做好2019年醫(yī)療保障基金監(jiān)管工作的通知》[8]明確要求,充分運(yùn)用大數(shù)據(jù)方法,結(jié)合實(shí)際支付方式,推進(jìn)智能監(jiān)控,提升監(jiān)管實(shí)效。
在DRG付費(fèi)方式下,可通過醫(yī)保監(jiān)管引導(dǎo)和測評醫(yī)療服務(wù)供給側(cè)行為及結(jié)果,優(yōu)化資源配置,提高醫(yī)療衛(wèi)生服務(wù)供給側(cè)及醫(yī)保機(jī)構(gòu)治理能力,實(shí)現(xiàn)價值醫(yī)療。利用DRG大數(shù)據(jù)分析系統(tǒng),可對醫(yī)院住院結(jié)算單據(jù)進(jìn)行全面監(jiān)管,增強(qiáng)醫(yī)保部門監(jiān)管能力,快速、高效、準(zhǔn)確地發(fā)現(xiàn)醫(yī)療保險費(fèi)用中編碼套高、分解住院、虛假住院等違規(guī)行為,及時提出處理意見,以提高醫(yī)?;鹗褂眯?、規(guī)范醫(yī)療服務(wù)行為、控制醫(yī)療費(fèi)用不合理上漲。
以云平臺架構(gòu)、人工智能、大數(shù)據(jù)分析技術(shù)為基礎(chǔ),通過對醫(yī)療保險數(shù)據(jù)的整合共享,建立DRG醫(yī)療保險大數(shù)據(jù)監(jiān)管系統(tǒng),實(shí)現(xiàn)覆蓋DRG基金結(jié)算全流程的醫(yī)保基金智能監(jiān)控。系統(tǒng)需求分析如下:通過人工智能建模技術(shù)建立病案收集、匯總過程中的質(zhì)量監(jiān)控機(jī)制;利用數(shù)據(jù)挖掘算法建立DRG分組過程中的醫(yī)?;鹌墼p行為監(jiān)控機(jī)制;應(yīng)用大數(shù)據(jù)分析方法建立DRG基金結(jié)算分配過程中的數(shù)據(jù)分析監(jiān)控機(jī)制,使醫(yī)保部門盡早發(fā)現(xiàn)基金運(yùn)行過程中的問題及風(fēng)險,保障基金安全。
DRG醫(yī)保監(jiān)管系統(tǒng)以現(xiàn)有DRG基金結(jié)算平臺內(nèi)病案數(shù)據(jù)、DRG分組結(jié)果數(shù)據(jù)、基金撥付結(jié)果數(shù)據(jù)為基礎(chǔ),應(yīng)用醫(yī)學(xué)知識圖譜、大數(shù)據(jù)智能分析算法等核心技術(shù)手段,解決DRG付費(fèi)模式下的病案質(zhì)量、相關(guān)欺詐行為監(jiān)控等問題,并實(shí)現(xiàn)醫(yī)?;鹬С龅拇髷?shù)據(jù)分析、監(jiān)測與管控。按照“厚平臺,薄應(yīng)用”的設(shè)計(jì)思路,將DRG基金結(jié)算平臺總體架構(gòu)分為4層,由下至上分別是基礎(chǔ)設(shè)施層、基礎(chǔ)平臺層、應(yīng)用平臺層和業(yè)務(wù)應(yīng)用層,見圖1。
圖1 總體架構(gòu)
DRG醫(yī)保監(jiān)管系統(tǒng)負(fù)責(zé)基金正常運(yùn)行,保障基金安全,與醫(yī)保DRG結(jié)算業(yè)務(wù)流程密切相關(guān)、緊密聯(lián)系,涉及以下主要業(yè)務(wù)流程:病案采集過程中對病案質(zhì)量進(jìn)行智能監(jiān)控,對存在問題的病案信息通過公示機(jī)制告知醫(yī)療機(jī)構(gòu)進(jìn)行修正及反饋;DRG分組完成后,根據(jù)分組結(jié)果對DRG相關(guān)醫(yī)療服務(wù)欺詐行為進(jìn)行監(jiān)控,對問題病歷進(jìn)行標(biāo)記,后續(xù)由人工重點(diǎn)干預(yù)審核;基金分配完成后,通過大數(shù)據(jù)分析技術(shù)對基金撥付情況進(jìn)行監(jiān)控;實(shí)時對DRG監(jiān)管數(shù)據(jù)、結(jié)果進(jìn)行匯總,在醫(yī)保管理部門形成總體監(jiān)控界面,實(shí)時監(jiān)測基金運(yùn)行情況,見圖2、圖3。
圖2 業(yè)務(wù)關(guān)聯(lián)關(guān)系
圖3 邏輯架構(gòu)
3.3.1 AMQP異步通信協(xié)議 高級消息隊(duì)列協(xié)議(Advanced Message Queuing Protocol,AMQP)提供統(tǒng)一消息服務(wù),是面向消息的中間件設(shè)計(jì)。基于此協(xié)議的客戶端與消息中間件可傳遞消息,不受客戶端/中間件不同產(chǎn)品、開發(fā)語言等條件限制。
3.3.2 Redis數(shù)據(jù)緩存 遠(yuǎn)程字典服務(wù)(Remote Dictionary Server,Redis)是一個基于內(nèi)存可持久化的日志型、Key-Value數(shù)據(jù)庫。Redis支持push/pop、add/remove、取交集并集和差集及更豐富的操作??芍芷谛缘貙⒏聰?shù)據(jù)寫入磁盤或者將修改操作寫入追加的記錄文件,實(shí)現(xiàn)主從(master-slave)同步。為保證效率數(shù)據(jù)緩存在內(nèi)存中。
3.3.3 Storm分布式數(shù)據(jù)處理 Apache Storm是用Clojure語言編寫的分布式實(shí)時大數(shù)據(jù)處理系統(tǒng)。Hadoop平臺執(zhí)行批處理操作,數(shù)據(jù)處理延時較高;Storm可實(shí)現(xiàn)數(shù)據(jù)源源不斷流入,并對其進(jìn)行實(shí)時處理。Storm用于在容錯和水平可擴(kuò)展方法中處理大量數(shù)據(jù),通過Apache ZooKeeper管理分布式環(huán)境和集群狀態(tài),可并行地對實(shí)時數(shù)據(jù)執(zhí)行各種操作。
3.3.4 ElasticSearch全文檢索 ElasticSearch是基于Lucene的搜索服務(wù)器,其基于RESTful Web接口提供分布式多用戶的全文搜索引擎,由Java開發(fā)并作為Apache許可條款下的開放源碼發(fā)布,主要用于全文檢索,底層是倒排索引,允許用戶接近實(shí)時地存儲、搜索、分析數(shù)據(jù),具有穩(wěn)定、可靠、部署和使用方便等特點(diǎn)。
3.3.5 Docker虛擬化 Docker是開源應(yīng)用容器引擎,可解決技術(shù)更新問題。開發(fā)者可打包應(yīng)用以及依賴包到可移植容器中,然后發(fā)布到 Linux 機(jī)器上,也可實(shí)現(xiàn)虛擬化。容器完全使用沙箱機(jī)制,相互間沒有任何接口。
3.3.6 FastDFS FastDFS是開源輕量級分布式文件系統(tǒng),對文件進(jìn)行管理,功能包括文件存儲、同步、訪問(上傳、下載)等,解決大容量存儲和負(fù)載均衡問題。
平臺對整體服務(wù)器集群進(jìn)行清晰劃分,針對不同功能采用相對應(yīng)的集群部署方案,包括負(fù)載均衡、緩存服務(wù)、Web服務(wù)、算法、文件服務(wù)、消息服務(wù)、應(yīng)用服務(wù)、數(shù)據(jù)庫服務(wù)等服務(wù)器集群,共同支撐應(yīng)用的高并發(fā)、高性能和高可用需求,見圖4。
圖4 系統(tǒng)部署架構(gòu)
在病案套高及反套低校驗(yàn)時,在編碼識別問題中可將病歷的收費(fèi)項(xiàng)目序列等同隱馬可夫鏈的輸出序列,病歷的編碼序列等同隱馬可夫鏈的狀態(tài)序列,將編碼識別問題轉(zhuǎn)化為求隱馬可夫鏈最優(yōu)狀態(tài)序列的過程。采用知識圖譜和大數(shù)據(jù)分析技術(shù),在歷史醫(yī)保信息基礎(chǔ)上發(fā)現(xiàn)相關(guān)規(guī)律,實(shí)現(xiàn)多維度知識間關(guān)系的可視化展示,挖掘異常點(diǎn),識別患者和醫(yī)院的醫(yī)保欺詐行為,為反欺詐提供線索,實(shí)現(xiàn)對患者個體和醫(yī)療機(jī)構(gòu)的監(jiān)管。
針對醫(yī)療機(jī)構(gòu)編造虛假病歷形成虛假住院、空掛床等惡意騙保行為,可根據(jù)虛假病歷診療和收費(fèi)項(xiàng)目與醫(yī)療機(jī)構(gòu)其他歷史病歷具有一致性的特點(diǎn),通過文本挖掘的方式提取病歷診療特征項(xiàng),計(jì)算診療特征項(xiàng)權(quán)重,將診療特征項(xiàng)進(jìn)行向量化,計(jì)算兩個文本的余弦相似度,判斷兩個病歷是否一致。TF-IDF是用于信息檢索與數(shù)據(jù)挖掘的常用加權(quán)技術(shù),用以評估某字詞對于一個文件集或一個語料庫中一份文件的重要程度。
大數(shù)據(jù)分析過程中采用標(biāo)桿分析法設(shè)定參考值。標(biāo)桿分析法常用于統(tǒng)計(jì)分析管理中,將各項(xiàng)活動與從事該項(xiàng)活動最佳者進(jìn)行比較,從而提出行動方法,以彌補(bǔ)自身不足。醫(yī)?;鸸芾頇C(jī)構(gòu)可以根據(jù)自身需求和地區(qū)數(shù)據(jù)情況,對各類指標(biāo)設(shè)定內(nèi)部和外部參考標(biāo)桿,形成地區(qū)DRG付費(fèi)管理標(biāo)準(zhǔn)。
5.1.1 DRG病案質(zhì)量監(jiān)控 病案首頁信息是DRG分組的主要依據(jù),分組信息主要來自醫(yī)療機(jī)構(gòu)上傳的醫(yī)保結(jié)算清單數(shù)據(jù)。在病案合規(guī)性校驗(yàn)方面,基于病案學(xué)規(guī)則,發(fā)現(xiàn)醫(yī)療機(jī)構(gòu)醫(yī)保結(jié)算清單中存在的明顯錯誤,主要包括基礎(chǔ)信息校驗(yàn)、診斷信息校驗(yàn)、手術(shù)信息校驗(yàn)和手術(shù)診斷對應(yīng)關(guān)系校驗(yàn)4部分內(nèi)容。面對病案套高及反套低校驗(yàn)問題,人工智能校驗(yàn)主要采用隱馬可夫模型算法,傳統(tǒng)規(guī)則性校驗(yàn)基于國際疾病分類(International Classification of Diseases,ICD)第10版和第9版,通過病案學(xué)規(guī)則進(jìn)行識別分析。在病案反套高校驗(yàn)方面,主要包括主診斷高套校驗(yàn)、無效診斷校驗(yàn)、無效手術(shù)校驗(yàn)和編碼拆分校驗(yàn),其中編碼拆分校驗(yàn)屬于傳統(tǒng)規(guī)則性校驗(yàn),其他屬于人工智能校驗(yàn)。采用隱馬可夫模型,基于收費(fèi)項(xiàng)目、診斷與手術(shù)編碼的相關(guān)性,采用人工智能方法識別各編碼收費(fèi)項(xiàng)目特征因子,從而推斷1次住院的診斷與手術(shù)編碼,通過特征因子排序確定主診斷與主手術(shù)。當(dāng)醫(yī)療機(jī)構(gòu)填寫的診斷和手術(shù)編碼在收費(fèi)項(xiàng)目中找不到特征因子時,說明醫(yī)療機(jī)構(gòu)填寫了無效診斷、手術(shù)進(jìn)行套高。當(dāng)醫(yī)療機(jī)構(gòu)填寫的主診斷與收費(fèi)項(xiàng)目特征因子排序不符時,說明醫(yī)療機(jī)構(gòu)有將次要診斷替換主診斷的可能。ICD10和ICD9中有1類診斷/手術(shù)編碼是聯(lián)合診斷/手術(shù),病案學(xué)上明確規(guī)定當(dāng)兩個相關(guān)診斷/手術(shù)同時出現(xiàn)時應(yīng)填寫聯(lián)合診斷/手術(shù),編碼拆分校驗(yàn)時醫(yī)院可能通過拆分聯(lián)合編碼實(shí)現(xiàn)編碼套高。在病案反套低校驗(yàn)方面,主要包括主手術(shù)選擇錯誤校驗(yàn)、主診斷套低校驗(yàn)、手術(shù)漏傳校驗(yàn)、診斷漏傳校驗(yàn)和籠統(tǒng)編碼校驗(yàn),其中籠統(tǒng)編碼校驗(yàn)屬于傳統(tǒng)規(guī)則性校驗(yàn),其他屬于人工智能校驗(yàn)。當(dāng)醫(yī)療機(jī)構(gòu)漏填診斷、手術(shù)或者將資源消耗較少的診斷、手術(shù)填為主診斷和主手術(shù)時,算法可通過收費(fèi)項(xiàng)目的相關(guān)性發(fā)現(xiàn)相應(yīng)情況從而提出修改建議。ICD10和ICD9中均存在一些籠統(tǒng)編碼,用于表示部位不確定的疾病或手術(shù),在DRG分組時籠統(tǒng)編碼會采用就低不就高原則,編入費(fèi)用較低的病組。
5.1.2 DRG醫(yī)保欺詐監(jiān)控 由于DRG采用打包付費(fèi),其欺詐行為主要體現(xiàn)在通過不合理手段降低病例住院費(fèi)用和增加住院人數(shù)方面,主要采用虛假住院、低標(biāo)準(zhǔn)入院和分解住院3種欺詐手段。虛假住院指完全編造住院治療資料騙取醫(yī)?;鸬钠墼p行為,呈現(xiàn)醫(yī)療機(jī)構(gòu)聚集性、患者聚集性、時間聚集性和病例相似性等特點(diǎn),通過數(shù)據(jù)聚集性指標(biāo)可發(fā)現(xiàn)虛假住院情況。病例聚集性監(jiān)測應(yīng)用自然語言處理技術(shù)發(fā)現(xiàn)編造病例的欺詐違法問題,通過余弦相似算法判斷兩個病例是否一致。時空聚集性核查通過人工智能領(lǐng)域的知識圖譜技術(shù),以圖查找方式尋找患者時空聚集性,對于聚集性較強(qiáng)的醫(yī)院和患者需要進(jìn)行重點(diǎn)核查。低標(biāo)準(zhǔn)入院指降低住院指征將不符合住院條件的參保人收治入院,從而獲取更多醫(yī)保基金補(bǔ)償?shù)男袨?。結(jié)合DRG付費(fèi)和低標(biāo)準(zhǔn)入院的特點(diǎn),在監(jiān)管規(guī)則設(shè)計(jì)中定義滿足以下任一情況的病例作為低標(biāo)準(zhǔn)入院的高風(fēng)險病例:主手術(shù)為日間手術(shù)或門診手術(shù)的病例;病例均費(fèi)低于DRG病組均費(fèi)的50%,且檢查項(xiàng)目費(fèi)用占比低于DRG標(biāo)準(zhǔn)界值,DRG標(biāo)準(zhǔn)界值通過模型計(jì)算得到,每個DRG界值不同;病例均費(fèi)低于DRG病組均費(fèi)的50%,而且住院過程中出現(xiàn)以下情況(N1、N2、N3表示住院天數(shù)):一是入院后連續(xù)N1天只有檢查沒有治療和藥品,二是入院后連續(xù)N2天只有物理治療沒有藥物治療,三是入院后連續(xù)N3天只有藥物治療沒有檢查;N1、N2、N3的閾值根據(jù)大數(shù)據(jù)測算每個DRG病組的診療行為規(guī)律進(jìn)行設(shè)定。分解住院指未按照臨床出院標(biāo)準(zhǔn)規(guī)定,為患者辦理多次出院、住院手續(xù)以規(guī)避醫(yī)療保險的最高限額或獲得更多利益的行為,是DRG付費(fèi)過程中重點(diǎn)管控的問題。結(jié)合DRG付費(fèi)和分解住院的特點(diǎn),通過以下方式監(jiān)測醫(yī)療機(jī)構(gòu)分解住院行為:提取30天內(nèi)有重復(fù)住院行為的病例;采用TF-IDF法計(jì)算病例的特征因子權(quán)重值,特征因子區(qū)分檢查、治療、藥品、耗材等大類;采用余弦相似度計(jì)算兩次住院之間各診療項(xiàng)目大類之間的相關(guān)性;如發(fā)現(xiàn)兩次住院在治療、藥品等維度相似度大于0.9則認(rèn)為有較大分解住院可能性。
5.1.3 DRG大數(shù)據(jù)分析監(jiān)控 醫(yī)保大數(shù)據(jù)分析的維度多種多樣,從地理屬性上分為統(tǒng)籌區(qū)維度、醫(yī)院維度、科室維度和醫(yī)生維度,從參保人屬性分為基金維度、人員類別維度,從DRG屬性可以分為主要診斷分類(Major Diagnostic Category,MDC)維度、DRG組合包維度、DRG病組維度。費(fèi)用趨勢分析方面,綜合DRG付費(fèi)地區(qū)所有數(shù)據(jù)集中分析當(dāng)前時點(diǎn)不同維度的費(fèi)用趨勢,包括基金使用情況、基金增長率、實(shí)際超支/盈余額、預(yù)計(jì)年終超支/盈余額、病例數(shù)、例均費(fèi)用、例均自費(fèi)費(fèi)用等指標(biāo)變化趨勢、同比環(huán)比情況,設(shè)定1個標(biāo)準(zhǔn)差作為監(jiān)控閾值,超出監(jiān)控閾值時予以提示。費(fèi)用結(jié)構(gòu)分析方面,將DRG費(fèi)用結(jié)構(gòu)拆分為治療、檢查、檢驗(yàn)、藥品、耗材等大類,綜合全地區(qū)數(shù)據(jù)剔除DRG異常數(shù)據(jù)后,選擇醫(yī)療質(zhì)量管理較好、控費(fèi)能力較高醫(yī)院的DRG數(shù)據(jù)作為標(biāo)桿數(shù)據(jù),形成本地區(qū)所有DRG各費(fèi)用大類的標(biāo)桿對照值,以1個標(biāo)準(zhǔn)差作為標(biāo)桿對照閾值;重點(diǎn)分析醫(yī)院DRG病組的費(fèi)用結(jié)構(gòu)情況,對超過閾值的醫(yī)院DRG病組進(jìn)行重點(diǎn)監(jiān)控;此外方差減少量(Reduction In Variance,RIV),病例組合指數(shù)(Case Mix Index,CMI),高低倍率病例占比,平均住院日,人次人頭比,住院人次/門診人次等指標(biāo)對DRG運(yùn)行情況有較為重要的指示意義,也可作為監(jiān)控指標(biāo)。DRG病組專項(xiàng)管控分析方面,根據(jù)基金管理目的將現(xiàn)有DRG分成多個具有內(nèi)部相關(guān)性大類,可展示不同類型病組的變化情況及其對基金的影響,實(shí)現(xiàn)精細(xì)化管理。
5.2.1 醫(yī)?;饘?shí)時監(jiān)測 通過類似交通指揮中心的大屏幕實(shí)時監(jiān)測基金運(yùn)行情況。分統(tǒng)籌區(qū)展示當(dāng)前時點(diǎn)基金使用情況、基金增長率、實(shí)際超支/盈余額、預(yù)計(jì)年終超支/盈余額、病例數(shù)、病組數(shù)、例均費(fèi)用、RIV、各醫(yī)療機(jī)構(gòu)實(shí)際超支/盈余額、各醫(yī)療機(jī)構(gòu)預(yù)計(jì)年終超支/盈余額、前10位增長最快的病組或醫(yī)療機(jī)構(gòu)、前10位超支/盈余最多的病組或醫(yī)療機(jī)構(gòu)等。分統(tǒng)籌區(qū)、分月份展示基金使用情況、基金增長率、實(shí)際超支/盈余額、各醫(yī)療機(jī)構(gòu)實(shí)際超支/盈余額、病例數(shù)、病組數(shù)、例均費(fèi)用、RIV等。
5.2.2 DRG基金結(jié)算智能監(jiān)控 對應(yīng)用人工智能技術(shù)發(fā)現(xiàn)的病案質(zhì)量違規(guī)問題和醫(yī)保欺詐行為病例以及監(jiān)控過程中大數(shù)據(jù)分析結(jié)果,通過各類圖表如柱狀圖、餅狀圖、折線圖進(jìn)行可視化展現(xiàn)并標(biāo)注說明情況。對病案編碼準(zhǔn)確性及其他由數(shù)據(jù)質(zhì)量引起的問題,向醫(yī)療機(jī)構(gòu)公示、修正、反饋進(jìn)行處理。系統(tǒng)發(fā)現(xiàn)重點(diǎn)問題并標(biāo)記后由人工后續(xù)跟進(jìn)核實(shí)。
由于DRG付費(fèi)模式本身存在設(shè)計(jì)缺陷,醫(yī)?;鹬悄鼙O(jiān)管任重道遠(yuǎn),相較按項(xiàng)目付費(fèi)方式將面臨更大壓力。在升級完善現(xiàn)有DRG基金結(jié)算系統(tǒng)基礎(chǔ)上,對DRG付費(fèi)全流程進(jìn)行多維度監(jiān)管以提供精準(zhǔn)的醫(yī)保欺詐預(yù)警,提前識別并解決醫(yī)?;鸬娘L(fēng)險,有效監(jiān)管醫(yī)療行為;另外應(yīng)加強(qiáng)多部門協(xié)作,建立 DRG 績效評價體系和考核機(jī)制,以保證DRG分配基金的支付效率。