◆王煥力
(中國科學技術(shù)大學附屬第一醫(yī)院信息中心安徽 230000)
《關(guān)于加快推進人口健康信息化建設(shè)的指導(dǎo)意見》明確要求充分利用物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等新技術(shù),提升居民健康信息化應(yīng)用水平[1]。在“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展中,第三方支付和互聯(lián)網(wǎng)醫(yī)院等信息化建設(shè)帶來醫(yī)療支付交易碎片化、數(shù)據(jù)大量化、結(jié)算賬戶分散化等問題。集團醫(yī)院分院區(qū)財務(wù)各自為政,存在問題被進一步放大,現(xiàn)有財務(wù)信息系統(tǒng)已經(jīng)不能滿足集團醫(yī)院經(jīng)營管理需要[2]。利用大數(shù)據(jù)技術(shù)建立醫(yī)療支付統(tǒng)一平臺,集團財務(wù)對分院區(qū)統(tǒng)籌管理,做好各院區(qū)的財務(wù)對賬,資金劃撥,提高財務(wù)數(shù)據(jù)透明度、加強財務(wù)監(jiān)管和運行監(jiān)督、保證資金安全。同時利用大數(shù)據(jù)研究方法,對醫(yī)院財務(wù)運行數(shù)據(jù)做分析、挖掘和利用,有效地服務(wù)于集團醫(yī)院的經(jīng)營管理和財務(wù)決策,促進醫(yī)院發(fā)展。
數(shù)據(jù)作為醫(yī)療支付大數(shù)據(jù)平臺的基礎(chǔ),為獲取到優(yōu)質(zhì)數(shù)據(jù),平臺采用了針對性方法進行處理如下:
(1)大量(Volume)的醫(yī)療支付數(shù)據(jù)。平臺對醫(yī)院收入數(shù)據(jù)要求統(tǒng)一編碼規(guī)范[3],提供標準的銀行支付、移動支付、醫(yī)保支付、資金批量代付等接口,將多個分院區(qū)的門診、急診、體檢、住院、餐飲、小賣部、停車繳費等各種場景的支付數(shù)據(jù)全部納入平臺。對于支出數(shù)據(jù),平臺對接院內(nèi)資金管理系統(tǒng)、銀企直連系統(tǒng)、稽核系統(tǒng)等,最終實現(xiàn)多個分院區(qū)的資金收入與支出進行集中和統(tǒng)一管理。
(2)種類和來源多樣(Variety)的醫(yī)療支付數(shù)據(jù)。數(shù)據(jù)按結(jié)構(gòu)可分為結(jié)構(gòu)化和非結(jié)構(gòu)化方式,其中結(jié)構(gòu)化數(shù)據(jù)包含充值交易、掛號交易、銀企直連、醫(yī)保結(jié)算等業(yè)務(wù)。非結(jié)構(gòu)化數(shù)據(jù)包括藥品供應(yīng)商提供的紙質(zhì)結(jié)算單掃描件、銀行現(xiàn)金存款單掃描件等,這些種類和來源多樣的醫(yī)療支付數(shù)據(jù)可使用分布式部署數(shù)據(jù)庫、陣列式存儲、數(shù)據(jù)切分、Cassandra(非結(jié)構(gòu)化的非關(guān)系型數(shù)據(jù)庫)等方式進行保存。
(3)真實準確(Veracity)的醫(yī)療支付數(shù)據(jù)。支付成功的訂單記錄交易檢索號或流水號;支付異常訂單可采用自動補償機制或事務(wù)方式進行處理,保證交易原子性[4],杜絕單邊賬發(fā)生。平臺使用多方對賬模式(包含HIS方、支付渠道方、業(yè)務(wù)系統(tǒng)方等),平賬后將多院區(qū)歸集資金分賬數(shù)據(jù)發(fā)送至資金清算平臺,確保支付數(shù)據(jù)真實準確。
醫(yī)院業(yè)務(wù)系統(tǒng)數(shù)量和種類繁多,例如為患者提供服務(wù)的線上就醫(yī)系統(tǒng)、互聯(lián)網(wǎng)醫(yī)院系統(tǒng)、醫(yī)院綜合運營管理系統(tǒng)等,這些系統(tǒng)產(chǎn)生大量的數(shù)據(jù)需清洗后才能使用,處理方式如下:
(1)對數(shù)據(jù)進行結(jié)構(gòu)化處理。原系統(tǒng)票據(jù)數(shù)據(jù)類型和種類的較多,大部分為紙質(zhì)結(jié)算單、紙質(zhì)對賬單等,這種非結(jié)構(gòu)化的數(shù)據(jù)基本需人工處理,無法實現(xiàn)電子化留存,無法用于后期大數(shù)據(jù)的應(yīng)用。近幾年深度學習技術(shù)的發(fā)展,單據(jù)識別(Invoice Optical Character Recognition)技術(shù)已經(jīng)逐步普及,通過OCR技術(shù)將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為結(jié)構(gòu)化數(shù)據(jù)處理,后期快速大數(shù)據(jù)特征提取及應(yīng)用。
(2)對數(shù)據(jù)進行標準化處理。由于各支付渠道無法統(tǒng)一接口規(guī)范,導(dǎo)致賬單格式和內(nèi)容各不相同,部分醫(yī)保類型甚至缺少對賬用的明細賬單,平臺無法對這類未清洗的數(shù)據(jù)進行使用[5]。非標準化數(shù)據(jù)通過數(shù)據(jù)文件層、數(shù)據(jù)提取設(shè)置層、數(shù)據(jù)校驗入庫層后可轉(zhuǎn)為標準化數(shù)據(jù)。數(shù)據(jù)文件層使用系統(tǒng)接口抓取或手工上傳文件的形式獲取到非標數(shù)據(jù);數(shù)據(jù)提取設(shè)置層通過可視化頁面,設(shè)置數(shù)據(jù)提取規(guī)則,比如可以設(shè)置金額+就診號+日期+隨機數(shù)四者聯(lián)合作為唯一索引;數(shù)據(jù)校驗入庫層對錯誤的數(shù)據(jù)進行篩查,如收款交易為負數(shù)的數(shù)據(jù)不能入庫。
以往各分院區(qū)財務(wù)依據(jù)業(yè)務(wù)場景逐個對結(jié)算銀行進行對賬,集團再進行匯總合并核對分院的賬,基礎(chǔ)對賬工作耗時且錯誤率高。通過醫(yī)療支付大數(shù)據(jù)平臺統(tǒng)一支付接口,集團財務(wù)無須手動核對分院區(qū)賬務(wù),實現(xiàn)結(jié)算賬戶的統(tǒng)一管理,跨院區(qū)的單邊賬和退費的集中處理。平臺獲取到各分院所有的支付數(shù)據(jù)后,可實現(xiàn)諸如預(yù)交金模式的資金稽核管理,通過患者分院區(qū)預(yù)交金使用明細規(guī)則出具日清分核查報表。
醫(yī)療支付大數(shù)據(jù)平臺涵蓋醫(yī)院全場景的收入與支出,數(shù)據(jù)經(jīng)過結(jié)構(gòu)化處理與正確性驗證,可直接用于各種維度的統(tǒng)計與分析,解決以往集團對分院區(qū)財務(wù)資金無法實時應(yīng)用分析的痛點。
通過支付大數(shù)據(jù)分析實現(xiàn)財務(wù)的精細化管理,例如:
(1)平臺支付數(shù)據(jù)經(jīng)標準化入庫后輸出財務(wù)標準運營指標,按年計算醫(yī)保回款率(實際年度醫(yī)保到賬總額/年度醫(yī)保支付凈額)。
(2)使用K均值聚類算法(k-means)發(fā)現(xiàn)患者在支付環(huán)節(jié)花費較長時間的共性原因,比如集中在某個科室且支付方式為自助機支付,那么可推測是該科室的自助機擺放位置或者數(shù)量需要調(diào)整,最終提升患者支付體驗。
(3)還可以根據(jù)過往數(shù)據(jù)做出一些預(yù)測,例如根據(jù)以往同期商保支付數(shù)據(jù)預(yù)測當期商保預(yù)估支付的金額后,醫(yī)院可以與商保中心溝通預(yù)支預(yù)付款,減少資金墊付[6]。
通過機器學習方法對大數(shù)據(jù)平臺數(shù)據(jù)進行挖掘,利用預(yù)測指導(dǎo)模型對集團財務(wù)部門實現(xiàn)指導(dǎo)和決策,具體步驟如下:
(1)確認需要預(yù)測的問題和指標。通過大數(shù)據(jù)預(yù)測特定患者存在支付困難,讓醫(yī)院管理團隊及早發(fā)現(xiàn)并協(xié)助患者解決支付問題,用于減少壞賬的發(fā)生和增加資金沉淀[7]。
(2)通過對數(shù)據(jù)特征碼的特征提取和選擇評估,可以獲得一批可以用來預(yù)期要解決問題的特征。例如對于存在支付困難度的患者,特征碼可以是支付時間、年齡、支付渠道、支付方式、支付金額、支付地點、是否車禍患者等屬性,同時特征碼也可以是需要經(jīng)過一定統(tǒng)計計算的量,例如住院合計支付過的人數(shù)、住院預(yù)交金透支次數(shù)等,甚至還可以是一些較復(fù)雜的算法得到的結(jié)果,例如通過 KNN (knearest neighbors algorithm)算法得到的是否省外患者、是否繳費積極患者。
(3)提取正確的特征后,通過模型建立從特征到目標之間的關(guān)系。針對預(yù)測型的問題,單個的模型又通常叫作預(yù)測器,例如車禍患者的住院繳費單是由多人支付完成,按照醫(yī)院經(jīng)驗這類人群容易出現(xiàn)因糾紛而造成壞賬的情況?,F(xiàn)階段平臺以醫(yī)院經(jīng)驗?zāi)P蜑橹?,因為機器學習尤其是監(jiān)督型學習,需要大量的結(jié)果反饋,在解決很多實際問題的時候,大量的反饋需要投入過多人力資源且有可能對患者造成打擾。未來諸如神經(jīng)網(wǎng)絡(luò)(常用的如后向神經(jīng)網(wǎng)絡(luò))、線性分類器(如LR)、支持向量機(SVM)、線性回歸等算法模型同樣可用于模型到目標的關(guān)系中。
(4)不管是根據(jù)醫(yī)院經(jīng)驗創(chuàng)建的經(jīng)驗?zāi)P?,還是機器學習的算法模型,單一模型的預(yù)測結(jié)果往往不盡人意,例如上文車禍患者如果有多人支付的經(jīng)驗?zāi)P停粚嚨溁颊哂行?。但是如果將成百上千個模型融合起來,就可以取得覆蓋更全、準確度更好的預(yù)測效果。模型需要大量的訓(xùn)練,訓(xùn)練需要結(jié)果反饋,結(jié)果反饋包含正確結(jié)果反饋與錯誤結(jié)果反饋,錯誤結(jié)果反饋,在實際應(yīng)用中相對比較容易,比如要和每一個模型預(yù)測結(jié)果為有支付困難的患者溝通確認,成本較高,還有可能打擾到預(yù)測錯誤的患者,但未預(yù)測到的錯誤結(jié)果(如產(chǎn)生了壞賬)更容易發(fā)現(xiàn),因此平臺采用AdaBoosting算法方法來融合模型。經(jīng)過平臺不斷調(diào)整模型和醫(yī)院對模型預(yù)測結(jié)果的及時反饋,模型訓(xùn)練一段時間后可以得到比較穩(wěn)定的預(yù)測結(jié)果。也因此醫(yī)療支付大數(shù)據(jù)平臺的建設(shè)與應(yīng)用,不光需要信息科技專業(yè)的人員,還需要具備豐富實踐經(jīng)驗的醫(yī)院其他部門的協(xié)助,才能取到好的效果。
綜上所述,通過醫(yī)療支付大數(shù)據(jù)的探索和應(yīng)用,解決醫(yī)療信息化建設(shè)過程中產(chǎn)生的交易碎片化、數(shù)據(jù)大量化、結(jié)算賬戶分散化等問題。集中并規(guī)范了收支數(shù)據(jù),從而為集團和分院區(qū)提供標準、準確、精細化的財務(wù)指標,有效監(jiān)控了集團院區(qū)的經(jīng)濟活動,達到精細化管理的目的,為防范和控制財務(wù)風險、提高經(jīng)濟效益和社會效益做出了突出貢獻。通過對醫(yī)療支付大數(shù)據(jù)應(yīng)用平臺的數(shù)據(jù)進行挖掘與分析,優(yōu)化就醫(yī)過程的支付體驗[8],利用機器學習預(yù)測模型預(yù)測患者未來支付能力,有效提升醫(yī)院回款速度同時降低了醫(yī)院的壞賬率,有效地服務(wù)于醫(yī)院的經(jīng)營管理和財務(wù)決策。