吳恒亮(副教授),于本海(博士生導(dǎo)師),翟宇翔(高級(jí)審計(jì)師),張巍巍
據(jù)人社部統(tǒng)計(jì),截至目前,我國(guó)醫(yī)保參保人數(shù)超過(guò)13 億人,參保覆蓋率已達(dá)到95%以上,每年醫(yī)?;鹗杖氤^(guò)1 萬(wàn)億元。但醫(yī)保詐騙案件卻層出不窮,造成了醫(yī)?;鸬木薮髶p失。審計(jì)署在2017 年醫(yī)保基金的專(zhuān)項(xiàng)審計(jì)工作中,共發(fā)現(xiàn)欺詐、違法和違規(guī)問(wèn)題金額超過(guò)15 億元,約占抽查資金總金額的0.46%。研究醫(yī)保欺詐審計(jì)問(wèn)題,關(guān)系到我國(guó)社會(huì)醫(yī)療保險(xiǎn)制度能否持續(xù)、健康地發(fā)展,具有重要的經(jīng)濟(jì)價(jià)值和現(xiàn)實(shí)意義。
在傳統(tǒng)計(jì)算機(jī)醫(yī)保審計(jì)模式下,主要采用SQL數(shù)據(jù)庫(kù)查詢(xún)技術(shù)來(lái)獲取醫(yī)保欺詐線(xiàn)索,僅限于對(duì)結(jié)構(gòu)化醫(yī)保數(shù)據(jù)的處理和分析[1]。隨著醫(yī)保覆蓋面的不斷擴(kuò)大,醫(yī)保數(shù)據(jù)呈現(xiàn)出規(guī)模大、多樣化、異構(gòu)性、高價(jià)值和低密度等大數(shù)據(jù)特征,對(duì)醫(yī)保審計(jì)數(shù)據(jù)的采集、存儲(chǔ)、分析和處理等工作提出了巨大挑戰(zhàn)。同時(shí),國(guó)內(nèi)人口流動(dòng)日益頻繁,居民異地就醫(yī)需求增長(zhǎng)迅速,跨省、跨市醫(yī)保就醫(yī)結(jié)算正逐步推行。如果仍以市或縣級(jí)為單位,采用“各自為政”“單兵作戰(zhàn)”的組織模式進(jìn)行審計(jì),勢(shì)必造成大量醫(yī)保欺詐行為被漏審,影響審計(jì)質(zhì)量和監(jiān)督效果。面對(duì)海量、多源、異質(zhì)的醫(yī)保數(shù)據(jù),為突破傳統(tǒng)審計(jì)技術(shù)瓶頸,克服傳統(tǒng)抽樣、離散、“單兵作戰(zhàn)”審計(jì)模式帶來(lái)的局限性和缺陷,緩解審計(jì)任務(wù)繁重和力量不足之間的矛盾,審計(jì)機(jī)關(guān)只能通過(guò)引入新技術(shù)、創(chuàng)新審計(jì)方法、轉(zhuǎn)變審計(jì)模式來(lái)化解當(dāng)前遇到的困境。
醫(yī)保欺詐識(shí)別是開(kāi)展醫(yī)保審計(jì)工作的關(guān)鍵和重點(diǎn)。國(guó)外對(duì)醫(yī)保欺詐識(shí)別問(wèn)題的研究起步較早,實(shí)證研究較多,主要采用統(tǒng)計(jì)分析、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等方法,如神經(jīng)網(wǎng)絡(luò)[2]、邏輯回歸[3]、主成分分析[4]、貝葉斯[5]、聚類(lèi)分析[6]、關(guān)聯(lián)規(guī)則[7]、支持向量機(jī)[8]、異常檢測(cè)[9]等。國(guó)內(nèi)文獻(xiàn)定性研究較多,主要集中在欺詐類(lèi)型、欺詐原因分析及防范對(duì)策等方面[10]。近年來(lái),國(guó)內(nèi)一些學(xué)者開(kāi)始利用統(tǒng)計(jì)模型、數(shù)據(jù)挖掘等技術(shù)進(jìn)行實(shí)證研究。史徑宇等[11]通過(guò)引入指標(biāo)權(quán)重改進(jìn)聚類(lèi)分析算法,采用無(wú)監(jiān)督學(xué)習(xí)方法實(shí)現(xiàn)了醫(yī)保欺詐識(shí)別;邱瑞[12]采用頻繁模式挖掘算法對(duì)醫(yī)保騙保行為進(jìn)行了模式挖掘;陳清鳳等[13]將主成分分析、K-Means 聚類(lèi)方法和判別分析等三種方法相結(jié)合建立了醫(yī)保欺詐識(shí)別模型。
國(guó)外政府和學(xué)者對(duì)大數(shù)據(jù)環(huán)境下醫(yī)保等領(lǐng)域的政府審計(jì)研究多側(cè)重于大數(shù)據(jù)審計(jì)的具體操作層面,包括大數(shù)據(jù)環(huán)境下的審計(jì)模型、審計(jì)安全、主要制約因素及解決方法等方面[14]。英國(guó)、美國(guó)、挪威等國(guó)家在審計(jì)實(shí)務(wù)中已經(jīng)廣泛應(yīng)用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等技術(shù)和工具[15]。
相比而言,國(guó)內(nèi)學(xué)者對(duì)醫(yī)保等領(lǐng)域的大數(shù)據(jù)審計(jì)研究更偏重于理論,如必要性和挑戰(zhàn)性[16]、模式轉(zhuǎn)變[17]、政策建議[18]等,指導(dǎo)大數(shù)據(jù)審計(jì)實(shí)踐的研究相對(duì)較少。劉國(guó)城、王會(huì)金[15]指出,未來(lái)的研究應(yīng)基于“數(shù)據(jù)科學(xué)”和“工程學(xué)”視角,從技術(shù)層面開(kāi)展大數(shù)據(jù)在審計(jì)中的應(yīng)用研究;鄭偉等[19]從大數(shù)據(jù)審計(jì)的邏輯流程以及大數(shù)據(jù)平臺(tái)的網(wǎng)絡(luò)架構(gòu)和應(yīng)用架構(gòu)等方面探討了在大數(shù)據(jù)環(huán)境下進(jìn)行數(shù)據(jù)式審計(jì)的操作路徑;陳偉、居江寧[1]基于大數(shù)據(jù)可視化技術(shù)對(duì)醫(yī)院藥品加成問(wèn)題進(jìn)行了挖掘分析。總的來(lái)看,國(guó)內(nèi)學(xué)術(shù)界有關(guān)醫(yī)保等領(lǐng)域的大數(shù)據(jù)審計(jì)研究,無(wú)論在內(nèi)容深度還是廣度上都有待進(jìn)一步提高。
從我國(guó)醫(yī)保等領(lǐng)域的大數(shù)據(jù)審計(jì)實(shí)踐來(lái)看,大數(shù)據(jù)技術(shù)在政府審計(jì)中的應(yīng)用尚處于起步和探索階段,缺乏成熟的大數(shù)據(jù)審計(jì)技術(shù)方案和可借鑒的經(jīng)驗(yàn),只有部分地區(qū)的審計(jì)機(jī)關(guān)真正開(kāi)啟了大數(shù)據(jù)審計(jì)的探索和建設(shè)工作,在醫(yī)保領(lǐng)域開(kāi)展大數(shù)據(jù)審計(jì)工作的地區(qū)更少。
本文依據(jù)大數(shù)據(jù)審計(jì)在其他領(lǐng)域應(yīng)用的經(jīng)驗(yàn)和教訓(xùn),結(jié)合湖北、山東、天津、河南、河北、江蘇、浙江等地區(qū)在醫(yī)保等領(lǐng)域的大數(shù)據(jù)審計(jì)實(shí)踐情況,從技術(shù)、管理和模型三個(gè)維度,提出了“自上而下”的醫(yī)保大數(shù)據(jù)審計(jì)建設(shè)實(shí)施路徑,包括大數(shù)據(jù)文化建設(shè)、總體規(guī)劃、團(tuán)隊(duì)組建、平臺(tái)搭建、流程設(shè)計(jì)以及難題突破等五個(gè)方面,梳理總結(jié)了部分省市的優(yōu)秀做法,并針對(duì)各省市存在的問(wèn)題提出了合理化建議,以期對(duì)各地區(qū)審計(jì)機(jī)關(guān)開(kāi)展醫(yī)保大數(shù)據(jù)審計(jì)工作提供指導(dǎo)和參考。
大數(shù)據(jù)審計(jì)文化建設(shè)就是要在整個(gè)審計(jì)機(jī)關(guān)建立一種“用大數(shù)據(jù)說(shuō)話(huà)、用大數(shù)據(jù)管理以及用大數(shù)據(jù)決策”的價(jià)值觀和制度體系,讓大數(shù)據(jù)成為開(kāi)展各項(xiàng)審計(jì)工作的基礎(chǔ)。
建設(shè)大數(shù)據(jù)審計(jì)文化,要擺脫傳統(tǒng)醫(yī)保審計(jì)思維桎梏,轉(zhuǎn)變審計(jì)理念,將大數(shù)據(jù)思維和理念引入審計(jì)機(jī)關(guān),不斷提高醫(yī)保審計(jì)人員的整體素質(zhì)。一方面,應(yīng)定期組織專(zhuān)家講座、培訓(xùn)、經(jīng)驗(yàn)交流會(huì)等活動(dòng),從領(lǐng)導(dǎo)層到每一個(gè)基層審計(jì)人員,全面提高其對(duì)醫(yī)保大數(shù)據(jù)審計(jì)的認(rèn)識(shí),將大數(shù)據(jù)思維融入審計(jì)機(jī)關(guān)文化建設(shè)中。另一方面,應(yīng)設(shè)立專(zhuān)項(xiàng)基金,鼓勵(lì)醫(yī)保審計(jì)人員利用大數(shù)據(jù)搞“科研”,對(duì)優(yōu)秀項(xiàng)目給予資金、人員、數(shù)據(jù)和政策等方面的支持,營(yíng)造良好的大數(shù)據(jù)審計(jì)氛圍。在具體醫(yī)保審計(jì)項(xiàng)目中,應(yīng)鼓勵(lì)審計(jì)人員積極運(yùn)用大數(shù)據(jù)分析技術(shù)開(kāi)展醫(yī)保審計(jì)工作,通過(guò)項(xiàng)目實(shí)踐不斷積累成功經(jīng)驗(yàn)。
目前,我國(guó)政府審計(jì)機(jī)關(guān)審計(jì)職責(zé)范圍廣泛,涉及財(cái)政、地稅、社保、醫(yī)保等多個(gè)專(zhuān)業(yè)領(lǐng)域,醫(yī)保審計(jì)僅是其監(jiān)督職責(zé)之一。雖然不同專(zhuān)業(yè)審計(jì)在內(nèi)容、方法等方面存在一些差異,但在計(jì)劃制定、方案實(shí)施、組織管理等活動(dòng)上具有相似性和一致性。如果大數(shù)據(jù)審計(jì)建設(shè)不做總體規(guī)劃,只考慮在醫(yī)?;蚱渌麊蝹€(gè)專(zhuān)業(yè)領(lǐng)域內(nèi),或者只在市或縣級(jí)范圍內(nèi)實(shí)施,勢(shì)必造成“信息孤島”現(xiàn)象,破壞審計(jì)業(yè)務(wù)的系統(tǒng)性和整體性,也會(huì)出現(xiàn)重復(fù)投資建設(shè)、系統(tǒng)擴(kuò)展難和集成難等問(wèn)題。從實(shí)踐調(diào)查來(lái)看,多數(shù)省市審計(jì)機(jī)關(guān)能夠意識(shí)到總體規(guī)劃的必要性,但有些地區(qū)審計(jì)機(jī)關(guān)對(duì)于如何開(kāi)展總體規(guī)劃并不清楚,有些則急于在大數(shù)據(jù)審計(jì)方面實(shí)現(xiàn)單點(diǎn)突破而使規(guī)劃流于形式,甚至還有不少地級(jí)市、縣級(jí)審計(jì)機(jī)關(guān)正著手或已開(kāi)展市縣級(jí)大數(shù)據(jù)審計(jì)平臺(tái)建設(shè)工作,而只有少數(shù)幾個(gè)省市能從全省角度出發(fā),制定真正意義上的大數(shù)據(jù)審計(jì)總體規(guī)劃。
綜上所述,審計(jì)機(jī)關(guān)在實(shí)施大數(shù)據(jù)審計(jì)之前,應(yīng)該站在全局的高度,從全省審計(jì)總體業(yè)務(wù)出發(fā),做好頂層設(shè)計(jì),制定全省統(tǒng)一的大數(shù)據(jù)審計(jì)平臺(tái)建設(shè)總體規(guī)劃,建立全省統(tǒng)一的大數(shù)據(jù)審計(jì)平臺(tái)。湖北省審計(jì)廳在“金審二期”工程的基礎(chǔ)上,構(gòu)建了如圖1 所示的大數(shù)據(jù)審計(jì)平臺(tái)應(yīng)用系統(tǒng)架構(gòu)[20]。從系統(tǒng)功能來(lái)看,架構(gòu)中的系統(tǒng)可以分為兩類(lèi):一是審計(jì)管理方面的系統(tǒng),二是不同專(zhuān)業(yè)領(lǐng)域的審計(jì)分析系統(tǒng)??偟膩?lái)看,該架構(gòu)遵循了系統(tǒng)獨(dú)立性設(shè)計(jì)的原則,既能保證各個(gè)子系統(tǒng)的相對(duì)獨(dú)立,又能保證各個(gè)子系統(tǒng)通過(guò)共享數(shù)據(jù)實(shí)現(xiàn)互聯(lián)互通,從而形成一個(gè)有機(jī)整體,這樣可以大大提高平臺(tái)的靈活性和可變性,對(duì)構(gòu)建和實(shí)施省市縣三級(jí)審計(jì)機(jī)關(guān)協(xié)同審計(jì)組織模式[17],實(shí)現(xiàn)審計(jì)工作的統(tǒng)一監(jiān)管和調(diào)控提供了技術(shù)支撐和保障。
圖1 湖北省審計(jì)廳大數(shù)據(jù)審計(jì)平臺(tái)應(yīng)用系統(tǒng)架構(gòu)
1.成立專(zhuān)門(mén)的醫(yī)保審計(jì)大數(shù)據(jù)分析部門(mén)。在大數(shù)據(jù)環(huán)境下,醫(yī)保審計(jì)工作模式的變化必然要求審計(jì)機(jī)關(guān)對(duì)組織結(jié)構(gòu)做出適應(yīng)性的改變和調(diào)整。審計(jì)機(jī)關(guān)需要成立一個(gè)專(zhuān)門(mén)的醫(yī)保審計(jì)大數(shù)據(jù)分析部門(mén),主要由數(shù)據(jù)管理員、數(shù)據(jù)分析建模師和業(yè)務(wù)數(shù)據(jù)分析師等組成,負(fù)責(zé)數(shù)據(jù)采集、整理、清理以及分析模型構(gòu)建等工作,通過(guò)集中分析、篩選疑點(diǎn),為審計(jì)計(jì)劃制定、實(shí)施方案組織等提供重要依據(jù)。數(shù)據(jù)分析建模師由擁有大數(shù)據(jù)分析技術(shù)和經(jīng)驗(yàn)的人員擔(dān)任,業(yè)務(wù)數(shù)據(jù)分析師是指具有豐富醫(yī)保審計(jì)經(jīng)驗(yàn)的業(yè)務(wù)人員。構(gòu)建模型以數(shù)據(jù)分析建模師為主導(dǎo),業(yè)務(wù)數(shù)據(jù)分析師給予業(yè)務(wù)支持。
2.為醫(yī)保審計(jì)項(xiàng)目小組設(shè)置大數(shù)據(jù)分析員角色。在傳統(tǒng)的醫(yī)保審計(jì)工作模式下,為完成某項(xiàng)審計(jì)計(jì)劃安排的審計(jì)任務(wù),需要成立審計(jì)項(xiàng)目小組,包括組長(zhǎng)、主審和組員等角色。在大數(shù)據(jù)審計(jì)模式下,雖然對(duì)“總體分析”發(fā)現(xiàn)的疑點(diǎn)可以進(jìn)行“分散核查”,但也同樣需要成立審計(jì)項(xiàng)目小組,且在該項(xiàng)目組中需要增設(shè)大數(shù)據(jù)分析員角色,專(zhuān)門(mén)負(fù)責(zé)審計(jì)項(xiàng)目的數(shù)據(jù)現(xiàn)場(chǎng)采集、清理、存儲(chǔ)、模型應(yīng)用以及結(jié)果分析等相關(guān)工作。
大數(shù)據(jù)平臺(tái)建設(shè)是實(shí)施醫(yī)保大數(shù)據(jù)審計(jì)的基礎(chǔ),選擇和搭建一個(gè)適合自己的醫(yī)保大數(shù)據(jù)平臺(tái)對(duì)審計(jì)機(jī)關(guān)來(lái)說(shuō)至關(guān)重要,技術(shù)選型失敗會(huì)大大增加項(xiàng)目實(shí)施風(fēng)險(xiǎn)。調(diào)查發(fā)現(xiàn),目前各省市審計(jì)機(jī)關(guān)由于缺乏大數(shù)據(jù)技術(shù)知識(shí)、經(jīng)驗(yàn)和相關(guān)人才,在建設(shè)方式、技術(shù)選擇和產(chǎn)品選型等方面存在諸多誤區(qū),比如認(rèn)為利用傳統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)即可建立大數(shù)據(jù)平臺(tái),將Hadoop 技術(shù)等同于大數(shù)據(jù)平臺(tái),盲目迷信大數(shù)據(jù)能力及服務(wù)商大數(shù)據(jù)產(chǎn)品性能等。
首先,審計(jì)機(jī)關(guān)應(yīng)該確定如何搭建醫(yī)保大數(shù)據(jù)平臺(tái),即采取何種建設(shè)方式。目前,我國(guó)企業(yè)進(jìn)行大數(shù)據(jù)平臺(tái)建設(shè)主要采取三種方式,即本地自建大數(shù)據(jù)平臺(tái)、使用云服務(wù)商提供的大數(shù)據(jù)服務(wù)以及購(gòu)買(mǎi)大數(shù)據(jù)集成產(chǎn)品等。從各地區(qū)審計(jì)機(jī)關(guān)調(diào)查來(lái)看,多數(shù)省市選擇采用第一種方式,相對(duì)而言,該種方式對(duì)技術(shù)人才的要求較高,實(shí)施難度較大,成本也較高,但從長(zhǎng)遠(yuǎn)來(lái)看,平臺(tái)的靈活性、兼容性、擴(kuò)展性、經(jīng)濟(jì)性以及維護(hù)性等更加理想。部分省市采取折中方案,即在原有平臺(tái)的基礎(chǔ)上擴(kuò)展大數(shù)據(jù)分析功能來(lái)構(gòu)建大數(shù)據(jù)審計(jì)平臺(tái),如天津市審計(jì)局在2017年采取公開(kāi)招標(biāo)的方式,為其聯(lián)網(wǎng)審計(jì)監(jiān)督平臺(tái)(“一張網(wǎng)”管理系統(tǒng))采購(gòu)數(shù)據(jù)分析服務(wù)。該種方式是否適合還要看原有基礎(chǔ)平臺(tái)是否采用大數(shù)據(jù)技術(shù)或具備大數(shù)據(jù)采集、存儲(chǔ)和處理能力,否則只是權(quán)宜之計(jì),非長(zhǎng)久之策。
其次,審計(jì)機(jī)關(guān)需要從自己的實(shí)際情況出發(fā),選擇適合自己的技術(shù)路徑。由于醫(yī)保大數(shù)據(jù)平臺(tái)承擔(dān)著從醫(yī)保數(shù)據(jù)采集、存儲(chǔ)、分析到可視化等各項(xiàng)處理任務(wù),就目前來(lái)看,單純依靠某項(xiàng)技術(shù)或某個(gè)產(chǎn)品是不現(xiàn)實(shí)的,需要綜合不同的大數(shù)據(jù)技術(shù)和產(chǎn)品,構(gòu)建一個(gè)完善的大數(shù)據(jù)生態(tài)系統(tǒng)。而且,不同技術(shù)或產(chǎn)品由于側(cè)重點(diǎn)不同,在功能和性能上都存在著一些差異,需要進(jìn)行區(qū)分和篩選。
審計(jì)機(jī)關(guān)在技術(shù)選型時(shí)需要做好以下兩方面的工作:一是對(duì)自身的信息化現(xiàn)狀、數(shù)據(jù)情況、大數(shù)據(jù)應(yīng)用的業(yè)務(wù)場(chǎng)景、技術(shù)力量等方面進(jìn)行全方位的梳理和評(píng)估,找準(zhǔn)自己的需求定位。一般來(lái)說(shuō),數(shù)據(jù)源的特點(diǎn)、數(shù)據(jù)采集方式和數(shù)據(jù)分析的應(yīng)用場(chǎng)景等幾個(gè)方面基本決定了醫(yī)保大數(shù)據(jù)平臺(tái)的技術(shù)選型。二是根據(jù)定義的功能和性能需求進(jìn)行技術(shù)選型或產(chǎn)品選型,全面評(píng)估待選大數(shù)據(jù)技術(shù)或產(chǎn)品是否滿(mǎn)足自己的功能需求,是否滿(mǎn)足醫(yī)保大數(shù)據(jù)審計(jì)所規(guī)定的技術(shù)指標(biāo)要求,如可靠性、擴(kuò)展性、高效性、容錯(cuò)性、開(kāi)源性、安全性、易用性、數(shù)據(jù)挖掘能力、R和Python語(yǔ)言的支持能力等。
大數(shù)據(jù)環(huán)境下,醫(yī)保審計(jì)技術(shù)、方法和模式的轉(zhuǎn)變,必然帶來(lái)審計(jì)流程的變化。因此,需要做好大數(shù)據(jù)環(huán)境下醫(yī)保審計(jì)流程的設(shè)計(jì)工作。醫(yī)保大數(shù)據(jù)分析主要包括數(shù)據(jù)采集與清理、數(shù)據(jù)存儲(chǔ)與管理、算法選擇與設(shè)計(jì)、構(gòu)建分析模型、欺詐分析、檢查結(jié)果可視化和欺詐決策等環(huán)節(jié),如圖2所示。
圖2 大數(shù)據(jù)環(huán)境下的醫(yī)保審計(jì)邏輯流程
1.數(shù)據(jù)采集與清理。這一環(huán)節(jié)是整個(gè)流程的起點(diǎn),要明確數(shù)據(jù)來(lái)源,積極拓寬數(shù)據(jù)采集范圍,廣泛運(yùn)用大數(shù)據(jù)抽取與集成技術(shù),通過(guò)多種采集方式來(lái)獲取醫(yī)保數(shù)據(jù)。采集的原始數(shù)據(jù)往往是“臟數(shù)據(jù)”“亂數(shù)據(jù)”,必須經(jīng)過(guò)數(shù)據(jù)清洗、數(shù)據(jù)變換和數(shù)據(jù)集成等清理環(huán)節(jié),以滿(mǎn)足大數(shù)據(jù)分析技術(shù)和算法對(duì)數(shù)據(jù)的要求。
2.數(shù)據(jù)存儲(chǔ)與管理。對(duì)經(jīng)過(guò)預(yù)處理的醫(yī)保數(shù)據(jù),根據(jù)數(shù)據(jù)規(guī)模、結(jié)構(gòu)類(lèi)型以及訪(fǎng)問(wèn)的實(shí)效性等特點(diǎn),分別選擇適合的大數(shù)據(jù)存儲(chǔ)與管理技術(shù)工具(如分布式文件系統(tǒng)HDFS、分布式數(shù)據(jù)庫(kù)MPP、非關(guān)系型數(shù)據(jù)庫(kù)NoSQL等)予以存儲(chǔ)。
3.算法選擇與設(shè)計(jì)及模型構(gòu)建。醫(yī)保欺詐行為種類(lèi)繁多,檢測(cè)方法各不相同。數(shù)據(jù)分析建模師需要根據(jù)不同欺詐行為的外在表現(xiàn)和特征,選擇適合的數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)方法和算法以構(gòu)建模型,然后通過(guò)模型評(píng)估、參數(shù)調(diào)整以獲取最優(yōu)的分析模型。
4.欺詐分析。業(yè)務(wù)數(shù)據(jù)分析師(即醫(yī)保審計(jì)業(yè)務(wù)人員)使用欺詐分析模型完成具體的欺詐檢測(cè)工作,并將發(fā)現(xiàn)的疑點(diǎn)提交人工復(fù)核。
5.檢測(cè)結(jié)果可視化及欺詐決策。使用大數(shù)據(jù)可視化技術(shù),將模型分析結(jié)果以圖形方式展示給業(yè)務(wù)數(shù)據(jù)分析師和首席數(shù)據(jù)官,進(jìn)而達(dá)到欺詐決策支持的目的。
在醫(yī)保大數(shù)據(jù)審計(jì)流程中,數(shù)據(jù)采集和分析模型構(gòu)建是最為關(guān)鍵、最為困難的兩個(gè)環(huán)節(jié),下面重點(diǎn)對(duì)這兩個(gè)問(wèn)題進(jìn)行闡述。
1.破解醫(yī)保大數(shù)據(jù)審計(jì)“數(shù)據(jù)采集”難題。
(1)醫(yī)保數(shù)據(jù)來(lái)源。醫(yī)保數(shù)據(jù)涉及參保人信息、基金運(yùn)行管理數(shù)據(jù)、參保人在醫(yī)院、藥店以及基層醫(yī)療機(jī)構(gòu)接受醫(yī)療服務(wù)時(shí)所產(chǎn)生的各種信息,如患者病歷檔案、住院信息、處方信息、檢查項(xiàng)目和購(gòu)藥信息等,還包括藥企、藥店進(jìn)銷(xiāo)數(shù)據(jù)、社保、民政、工商、公安以及從互聯(lián)網(wǎng)上獲取的數(shù)據(jù)等。其中,醫(yī)院、藥店、醫(yī)保機(jī)構(gòu)、藥企以及基層醫(yī)療機(jī)構(gòu)等信息系統(tǒng)是醫(yī)保大數(shù)據(jù)審計(jì)的主要數(shù)據(jù)來(lái)源。當(dāng)前,由于我國(guó)醫(yī)保長(zhǎng)時(shí)間的城鄉(xiāng)割裂,醫(yī)保管理存在以統(tǒng)籌區(qū)域(多數(shù)是縣級(jí))為單位、各自獨(dú)立以及所采用的信息系統(tǒng)技術(shù)不一致等問(wèn)題,醫(yī)保數(shù)據(jù)表現(xiàn)出多源、標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)量大、數(shù)據(jù)質(zhì)量低等特點(diǎn),給醫(yī)保審計(jì)數(shù)據(jù)采集和清理工作帶來(lái)很大的困難。
(2)數(shù)據(jù)采集方式。目前,審計(jì)機(jī)關(guān)主要采取由被審計(jì)單位手工報(bào)送數(shù)據(jù)的方式進(jìn)行數(shù)據(jù)采集,存在不報(bào)送、報(bào)送不及時(shí)、報(bào)送不全面、數(shù)據(jù)質(zhì)量低等問(wèn)題,對(duì)拓展醫(yī)保審計(jì)廣度和深度,提升醫(yī)保審計(jì)監(jiān)督質(zhì)量和效率造成了嚴(yán)重的負(fù)面影響。在大數(shù)據(jù)環(huán)境下,必須堅(jiān)持“數(shù)據(jù)先行”原則,采取定期報(bào)送、按需收集和在審計(jì)中收集等多種數(shù)據(jù)收集方式,積極做好醫(yī)保數(shù)據(jù)采集工作。一方面要加強(qiáng)對(duì)被審計(jì)單位報(bào)送數(shù)據(jù)的督導(dǎo)工作,對(duì)不按規(guī)定報(bào)送數(shù)據(jù)的單位要及時(shí)反饋、協(xié)調(diào)解決。例如,山東省審計(jì)廳專(zhuān)門(mén)制定了定期報(bào)送數(shù)據(jù)的規(guī)章制度,對(duì)數(shù)據(jù)報(bào)送中出現(xiàn)的問(wèn)題及時(shí)反饋給當(dāng)?shù)仡I(lǐng)導(dǎo),或向省政府報(bào)告,將其納入重點(diǎn)審計(jì)整改范圍,逐步破解了“數(shù)據(jù)報(bào)送難”問(wèn)題[21]。另一方面,開(kāi)發(fā)與被審計(jì)單位信息系統(tǒng)的數(shù)據(jù)接口,利用計(jì)算機(jī)平臺(tái)直接從被審計(jì)單位采集或采取上傳的方式收集原始的醫(yī)保審計(jì)數(shù)據(jù),提高數(shù)據(jù)采集效率和質(zhì)量,保證數(shù)據(jù)的真實(shí)性,防止“假賬真審”。
(3)數(shù)據(jù)清理問(wèn)題??梢岳脭?shù)據(jù)分析、數(shù)據(jù)挖掘等技術(shù)和工具進(jìn)行醫(yī)保數(shù)據(jù)整理、清理和標(biāo)準(zhǔn)化工作,克服數(shù)據(jù)不準(zhǔn)確、不一致以及數(shù)據(jù)缺失等帶來(lái)的弊端。例如,湖北省審計(jì)廳采用文本挖掘和分詞技術(shù),基于醫(yī)學(xué)詞匯包,將1700 多家醫(yī)院對(duì)“床位費(fèi)”的2300多種不同表達(dá)方式,全部轉(zhuǎn)換成“床位費(fèi)”[22]。又如,山東省審計(jì)廳從該省衛(wèi)計(jì)委及其所屬單位采集的醫(yī)保數(shù)據(jù),由于來(lái)源眾多,涉及340多個(gè)不同版本、不同結(jié)構(gòu)的信息系統(tǒng),為此該廳專(zhuān)門(mén)成立了一支“破譯團(tuán)隊(duì)”,按照編碼規(guī)則編寫(xiě)數(shù)據(jù)轉(zhuǎn)換腳本,對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理形成醫(yī)保標(biāo)準(zhǔn)數(shù)據(jù)表[21]。
2.破解醫(yī)保大數(shù)據(jù)審計(jì)“數(shù)據(jù)分析”難題。
(1)分析模型是醫(yī)保審計(jì)大數(shù)據(jù)平臺(tái)的核心組件和引擎。不同專(zhuān)業(yè)審計(jì)由于在審計(jì)目標(biāo)、內(nèi)容和數(shù)據(jù)等方面存在較大差異,審計(jì)方法必然會(huì)有所不同,細(xì)化不同專(zhuān)業(yè)領(lǐng)域的審計(jì)分析模型將是未來(lái)研究的重點(diǎn)[16]。在醫(yī)保領(lǐng)域,傳統(tǒng)審計(jì)模式下主要是構(gòu)建查詢(xún)分析模型,隨著云計(jì)算、大數(shù)據(jù)和人工智能技術(shù)的不斷發(fā)展,工業(yè)界、學(xué)術(shù)界提出了許多適合大數(shù)據(jù)環(huán)境的醫(yī)保審計(jì)建模方法,可以對(duì)醫(yī)保數(shù)據(jù)進(jìn)行深度挖掘和分析,實(shí)現(xiàn)查詢(xún)型向挖掘型分析方法的轉(zhuǎn)變,如下表所示。但是,由于種種原因,這些方法和技術(shù)多數(shù)還停留在學(xué)術(shù)研究和實(shí)驗(yàn)階段。
基于統(tǒng)計(jì)分析、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的醫(yī)保審計(jì)分析模型與算法表
調(diào)查發(fā)現(xiàn),目前很多地區(qū)審計(jì)機(jī)關(guān)對(duì)醫(yī)保審計(jì)大數(shù)據(jù)分析存在認(rèn)識(shí)不清、認(rèn)識(shí)不到位的問(wèn)題。第一,有些省市仍然停留在傳統(tǒng)的數(shù)據(jù)分析思維上,有些甚至將查詢(xún)分析型審計(jì)誤認(rèn)為是大數(shù)據(jù)分析審計(jì)。第二,大多數(shù)省市所采取的大數(shù)據(jù)分析技術(shù)比較單一,應(yīng)用最多的技術(shù)是數(shù)據(jù)關(guān)聯(lián)比對(duì)分析,但其本質(zhì)仍是SQL數(shù)據(jù)庫(kù)查詢(xún)技術(shù),只不過(guò)建立在大數(shù)據(jù)分析平臺(tái)基礎(chǔ)之上,采用分布式數(shù)據(jù)存儲(chǔ)和檢索技術(shù),使其吞吐量、執(zhí)行效率和查詢(xún)范圍有了比較大的提升。第三,應(yīng)用數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等大數(shù)據(jù)分析技術(shù)的案例還比較少,其中湖北、山東等地區(qū)在醫(yī)保大數(shù)據(jù)審計(jì)建模方面積極探索、大膽嘗試,已經(jīng)取得了一定成效。例如,湖北省審計(jì)廳在醫(yī)保大數(shù)據(jù)審計(jì)中,利用大數(shù)據(jù)分析工具R-Studio 和聚類(lèi)分析方法,從1700 多家醫(yī)院中鎖定了7 家治療項(xiàng)目總費(fèi)用明顯異常的醫(yī)院,作為審計(jì)疑點(diǎn)和線(xiàn)索[22]??偟膩?lái)看,目前我國(guó)包括醫(yī)保在內(nèi)的各種專(zhuān)業(yè)審計(jì)所采用的分析技術(shù)手段還非常有限,遠(yuǎn)遠(yuǎn)沒(méi)有發(fā)揮出大數(shù)據(jù)分析技術(shù)的作用。因此,大數(shù)據(jù)分析模型的構(gòu)建和應(yīng)用,將是未來(lái)各個(gè)審計(jì)機(jī)關(guān)研究的重點(diǎn)和急需攻破的難題。
(2)破解“數(shù)據(jù)分析”難題的關(guān)鍵是大數(shù)據(jù)分析人才的培養(yǎng)。當(dāng)前,很多審計(jì)機(jī)關(guān)已經(jīng)積累了大量的醫(yī)保數(shù)據(jù),部分省市也建立了大數(shù)據(jù)基礎(chǔ)平臺(tái),但大數(shù)據(jù)分析人才嚴(yán)重缺乏,分析團(tuán)隊(duì)組建都是基于現(xiàn)有計(jì)算機(jī)人員和審計(jì)業(yè)務(wù)骨干,這些人員并不具備大數(shù)據(jù)分析所需要的技能和素質(zhì),已成為制約其持續(xù)發(fā)展的重要瓶頸。因此,加大大數(shù)據(jù)分析人才的培養(yǎng)力度,快速高效地培養(yǎng)醫(yī)保大數(shù)據(jù)審計(jì)所需要的各類(lèi)人才,是審計(jì)機(jī)關(guān)開(kāi)展醫(yī)保大數(shù)據(jù)審計(jì)工作的當(dāng)務(wù)之急和長(zhǎng)遠(yuǎn)發(fā)展之策。
目前,獲取醫(yī)保大數(shù)據(jù)審計(jì)分析人才的途徑主要有以下幾種:①依靠人才引進(jìn)。近年來(lái),我國(guó)大數(shù)據(jù)市場(chǎng)規(guī)模增長(zhǎng)迅速,大數(shù)據(jù)人才缺口非常大,供需矛盾非常突出。顯然,通過(guò)人才引進(jìn)來(lái)獲得經(jīng)驗(yàn)豐富的大數(shù)據(jù)分析人才還是比較困難的。②培訓(xùn)現(xiàn)有的計(jì)算機(jī)和醫(yī)保審計(jì)業(yè)務(wù)人員。與傳統(tǒng)數(shù)據(jù)分析相比,大數(shù)據(jù)分析需要掌握的知識(shí)和技術(shù)更加寬泛,涉及數(shù)學(xué)、計(jì)算機(jī)、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)以及自然語(yǔ)言處理等多個(gè)領(lǐng)域的綜合知識(shí),學(xué)習(xí)門(mén)檻較高,需要投入大量的學(xué)習(xí)時(shí)間,并不斷積累實(shí)踐經(jīng)驗(yàn)。因此,在短時(shí)間內(nèi)通過(guò)技術(shù)培訓(xùn)提升醫(yī)保審計(jì)人員大數(shù)據(jù)分析能力也不太現(xiàn)實(shí)。③加強(qiáng)與國(guó)內(nèi)高校和科研機(jī)構(gòu)的合作。高校和科研機(jī)構(gòu)具有人才和技術(shù)優(yōu)勢(shì),湖北省審計(jì)廳能在短時(shí)間內(nèi)取得醫(yī)保大數(shù)據(jù)審計(jì)建模方面的突破,主要是源于該廳與武漢大學(xué)計(jì)算機(jī)學(xué)院開(kāi)展了大數(shù)據(jù)技術(shù)合作[20]。因此,審計(jì)機(jī)關(guān)必須走出去,積極尋求和開(kāi)展技術(shù)合作,這是審計(jì)機(jī)關(guān)短時(shí)間內(nèi)提升醫(yī)保大數(shù)據(jù)分析建模能力,實(shí)現(xiàn)快速起步的有效途徑。當(dāng)然,從長(zhǎng)遠(yuǎn)發(fā)展來(lái)看,前兩種人才培養(yǎng)方式也必須同時(shí)推進(jìn),缺一不可。
在云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)不斷發(fā)展和進(jìn)步的今天,基于數(shù)據(jù)挖掘和人工智能的大數(shù)據(jù)分析技術(shù)必將成為提高醫(yī)保審計(jì)質(zhì)量和效能的重要驅(qū)動(dòng)力。因此,探索大數(shù)據(jù)環(huán)境下的醫(yī)保審計(jì)新模式、新技術(shù)和新方法,是我國(guó)各級(jí)審計(jì)機(jī)關(guān)和學(xué)術(shù)界亟須研究的重要課題。本文在文獻(xiàn)梳理和對(duì)各省市大數(shù)據(jù)審計(jì)實(shí)踐調(diào)查的基礎(chǔ)上,針對(duì)醫(yī)保審計(jì)目前存在的問(wèn)題和難題,提出了指導(dǎo)審計(jì)機(jī)關(guān)進(jìn)行醫(yī)保大數(shù)據(jù)審計(jì)的基本思路,以期在學(xué)術(shù)界和審計(jì)機(jī)關(guān)的共同努力下,讓醫(yī)保大數(shù)據(jù)審計(jì)在各級(jí)審計(jì)機(jī)關(guān)中早日落地,從而破解傳統(tǒng)醫(yī)保審計(jì)模式和方法在大數(shù)據(jù)環(huán)境下面臨的困境和難題。