醫(yī)?;饘徲媽儆诘湫偷臄?shù)據(jù)密集型項目,審計中所涉及到的數(shù)據(jù)量大、業(yè)務(wù)復(fù)雜,而且關(guān)聯(lián)單位范圍廣,涉及外部數(shù)據(jù)種類多,如何迅速從海量數(shù)據(jù)中精準找出審計疑點,是審計人員需要思考的主要問題。傳統(tǒng)的醫(yī)?;鸫髷?shù)據(jù)審計主要依靠編寫SQL語句的方式進行,在這種模式下,一方面難以對各類數(shù)據(jù)進行全面多維度的分析;另一方面分析出來的結(jié)果多數(shù)以二維表的形式展示,無論是審計人員還是被審計單位都難以深層次地理解和運用分析結(jié)果。因此,采用可視化分析技術(shù)對醫(yī)保基金相關(guān)數(shù)據(jù)進行建模分析,可以幫助審計人員更好地理解和運用數(shù)據(jù),從而提升審計監(jiān)督的質(zhì)效。
一、引言
2023年5月,國務(wù)院辦公廳印發(fā)了《關(guān)于加強醫(yī)療保障基金使用常態(tài)化監(jiān)管的實施意見》(國辦發(fā)〔2023〕17號),要求加快構(gòu)建權(quán)責(zé)明晰、嚴密有力、安全規(guī)范、法治高效的醫(yī)保基金使用常態(tài)化監(jiān)管體系。這對審計機關(guān)對醫(yī)?;鸬氖虑?、事中、事后的監(jiān)管職責(zé)提出了更高的要求。隨著醫(yī)?;鸸芾砘緦崿F(xiàn)了市級統(tǒng)籌,業(yè)務(wù)范圍涉及人社、醫(yī)保、稅務(wù)等多個部門和地區(qū),數(shù)據(jù)涵蓋了參保繳費、結(jié)算、診療、財政補助以及相關(guān)的圖片信息等。因此,醫(yī)?;鸬膶徲嬅媾R著業(yè)務(wù)復(fù)雜、數(shù)據(jù)量大、關(guān)聯(lián)眾多的復(fù)雜局面。如果僅僅依靠傳統(tǒng)的大數(shù)據(jù)審計方式,審計的時效性和覆蓋范圍將受到極大的限制,難以滿足對醫(yī)?;饎討B(tài)監(jiān)督和更深層次的審計需求。
二、醫(yī)?;鸫髷?shù)據(jù)審計現(xiàn)狀
自審計機關(guān)開展大數(shù)據(jù)審計工作以來,審計機關(guān)對于醫(yī)?;鸬拇髷?shù)據(jù)審計的方式主要采用以下兩種方法:一種是通過編寫SQL語句查詢分析方法,根據(jù)常識性、合規(guī)性、排他性等規(guī)則,對醫(yī)?;鸸芾砗褪褂眠^程中可能存在的問題進行研判分析,構(gòu)建相應(yīng)的分析模型,然后通過Access、SQL、Oracle、神通等通用數(shù)據(jù)庫或AO2011、金審三期等專用審計軟件中運行,以查找出相關(guān)的疑點線索;另一種是借助Excel、WPS等電子表格軟件對數(shù)據(jù)進行排序、篩選、分類匯總、數(shù)據(jù)透視等分析。但是,隨著大數(shù)據(jù)審計的深入開展,這兩種傳統(tǒng)的數(shù)據(jù)分析方式的弊端日益凸顯。主要有以下幾點。
一是電子表格難以處理大量的數(shù)據(jù)。Excel、WPS等電子表格軟件能夠存儲的數(shù)據(jù)量非常小,最多可以存儲1048576行、16384列的數(shù)據(jù),無法對大量的數(shù)據(jù)進行有效的分析和處理。處理數(shù)據(jù)時使用排序、篩選、分類匯總等功能或者內(nèi)置VBA編程處理分析數(shù)據(jù)時響應(yīng)速度慢,且VBA語句要求審計人員具有一定的編程基礎(chǔ),效率不高。
二是分析建模需要復(fù)雜的語句。無論采用數(shù)據(jù)庫還是專業(yè)的審計軟件,都需要在深入了解數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)上再編寫煩瑣的SQL語句。這對審計人員的技術(shù)水平要求較高,而且如果被審計單位的配合程度較差,不提供數(shù)據(jù)字典等基礎(chǔ)資料,更加難以操作。而且,一旦涉及到大量的數(shù)據(jù),查詢分析的過程需要很長時間才會有結(jié)果,有時甚至需要幾個小時。
三是分析結(jié)果內(nèi)在的邏輯和關(guān)聯(lián)性難以把握。無論是電子表格還是SQL查詢分析,所分析出來的結(jié)果往往是以二維表格的形式展示。有的分析結(jié)果涉及上萬甚至十幾萬條記錄,數(shù)據(jù)量大、記錄條數(shù)多,顯示的結(jié)果十分枯燥,而且不形象。不僅審計人員無法準確把握分析結(jié)果內(nèi)在的邏輯和關(guān)聯(lián)性,而且被審計單位核實分析結(jié)果也難以關(guān)注到重點,核實確認難度較大,效率較低。
四是NoSQL非結(jié)構(gòu)化數(shù)據(jù)難以建模分析。隨著信息化水平的不斷提升,大數(shù)據(jù)審計時代醫(yī)?;鹚婕暗臄?shù)據(jù)量不斷增加,涉及到的數(shù)據(jù)類型和結(jié)構(gòu)更加復(fù)雜。醫(yī)保基金審計所面臨的不單單是結(jié)構(gòu)化數(shù)據(jù),還有很多半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),比如人像數(shù)據(jù)和XML存儲文件。如果是通過人工排查核對的方式查找問題并發(fā)現(xiàn)疑點線索,不僅時間效率上難以保證,而且在深度發(fā)現(xiàn)審計線索特征以及復(fù)雜性隱蔽的疑點方面也存在很大的不足。
因此,數(shù)據(jù)可視化技術(shù)的出現(xiàn),其形象多樣直觀的數(shù)據(jù)分析和結(jié)果展示方式,為審計人員適應(yīng)常態(tài)化審計監(jiān)督新形勢,從整體上把握醫(yī)保基金管理和使用情況,快速發(fā)現(xiàn)可疑數(shù)據(jù)提供了一個非常重要的手段。這對于加強醫(yī)?;鹗褂贸B(tài)化監(jiān)管,保障醫(yī)保基金安全運行、提高基金使用效率、規(guī)范醫(yī)療服務(wù)行為、減輕群眾看病就醫(yī)負擔(dān)具有重要的意義。
三、數(shù)據(jù)可視化概述
數(shù)據(jù)可視化是大數(shù)據(jù)領(lǐng)域的一個重要內(nèi)容,其核心思想是對大量抽象復(fù)雜難以理解的數(shù)據(jù)按照其特征屬性值進行歸納和提取,將這些特征屬性值以圖片、圖表、視頻等形式直觀地呈現(xiàn)出來,可以從不同的維度觀察數(shù)據(jù),從而對數(shù)據(jù)進行更深入的分析,以提高數(shù)據(jù)使用者決策的速度。簡單來說,數(shù)據(jù)可視化就是通過圖形化手段,將復(fù)雜的數(shù)據(jù)以一種概要的形式抽提出來,包括相應(yīng)單位各屬性和變量模型清晰有效地表達出來的數(shù)據(jù)中的信息。用戶通過數(shù)據(jù)可視化可以洞察數(shù)據(jù)中的規(guī)律。
目前,數(shù)據(jù)可視化工具分為開源的編程工具以及商業(yè)化的桌面軟件。開源的編程工具如Python的Matplotlib、Pandas組件。R語言的Visreg組件可以實現(xiàn)數(shù)據(jù)的可視化。這種開源的編程工具可以適應(yīng)多種類型的數(shù)據(jù),同時可以根據(jù)使用者的需求,靈活多變地選擇數(shù)據(jù)可視化的呈現(xiàn)方式,但是對使用者的編程能力有較高的要求。商業(yè)化的桌面化軟件比較主流的有Teablue或者PowerBI軟件。這種成熟的桌面化軟件無需使用者具有編程知識。在使用中根據(jù)軟件的操作指引執(zhí)行操作,即可進行數(shù)據(jù)的可視化分析,但是靈活度有所缺失。無論是開源的編程工具還是商業(yè)化的桌面軟件在審計過程中都可以使數(shù)據(jù)分析結(jié)果更科學(xué)直觀地呈現(xiàn)出來。審計人員可以根據(jù)審計情況的復(fù)雜程度和自身的分析習(xí)慣靈活選用可視化工具。
四、數(shù)據(jù)可視化技術(shù)的具體應(yīng)用
在醫(yī)?;鸬膶徲嬛?,有個重要的審計事項是基金的整體收支情況。對醫(yī)?;鸬恼w收支情況進行審計,可以對醫(yī)保基金是否正常繳存、是否存在惡意欠繳、是否存在可疑支出等情況進行總體的判斷。正常情況下,我們的大數(shù)據(jù)審計方式是通過獲取后臺業(yè)務(wù)數(shù)據(jù),利用SQL、Oracle等編寫語句進行計算和分類匯總分析,再根據(jù)分析出來的疑點逐一核實查證。但是,傳統(tǒng)方式分析出來的疑點雜而多,很難做出直觀的判斷。因此,我們采用Python+Teablue的可視化分析方式,對某地區(qū)2022年的基金整體收支情況進行分析。首先,使用Python的Matplotlib、Pandas組件編寫語句分析年度收支情況表,分析語句和結(jié)果如下圖所示。
通過圖1,我們可以看到2022年3月份的收入處于最低點,5月份的支出明顯高于其他月份。那么,就可以以這兩個月份為重點,檢查是否存在費用欠繳和可疑的支出。以醫(yī)保欠費問題審計為例,部分企業(yè)忽視職工利益,在經(jīng)營正常的情況下不按規(guī)定繳納。這對于困難職工的繳費而言,可能涉及財政補貼資金未能充分發(fā)揮效應(yīng)的問題。傳統(tǒng)審計分析出的結(jié)果,發(fā)現(xiàn)欠繳的記錄有上萬條甚至幾十萬條,涉及多個市區(qū)和單位,醫(yī)保部門核實起來十分困難。沒有重點大海撈針地去核查無疑費時又費力,還不一定能夠達到效果。這就需要進行精準的定位。審計人員根據(jù)前期的分析結(jié)果,使用Teablue工具,按照地區(qū)和行業(yè)分組可以清楚地看到哪個地區(qū)的哪個行業(yè)未參保的人數(shù)最多,應(yīng)當(dāng)繳費的金額等,一目了然,便于審計人員確定下一步審計的重點。
因此不難看出,數(shù)據(jù)可視化技術(shù)將數(shù)據(jù)處理結(jié)果以可視化圖形展示,可以提高審計人員的認知水平。簡潔直觀的呈現(xiàn)方式具有更強的可讀性,不僅有利于提高審計人員的整體把控性,還有利于被審計單位提高審計結(jié)果的使用率。同時,審計人員進一步觀察以可視化形式呈現(xiàn)的審計結(jié)果,對已作出的審計判斷進行驗證和補充,便于從整體上把握被審計大數(shù)據(jù)的情況,快速發(fā)現(xiàn)可疑數(shù)據(jù),從而提高審計效率。
五、總結(jié)和思考
醫(yī)?;鹂梢暬瘜徲嫷奶剿骱蛯嵺`表明,數(shù)據(jù)可視化技術(shù)可以更簡潔地表達大數(shù)據(jù)環(huán)境下海量的數(shù)據(jù)信息,節(jié)約了審計資源,提升了審計效率,取得了顯著的審計成果。審計人員通過數(shù)據(jù)可視化技術(shù)進行大數(shù)據(jù)審計,主要有以下幾個優(yōu)勢。
一是直觀高效的數(shù)據(jù)分析方式??梢暬臄?shù)據(jù)分析方式是基于人體感官角度進行的,可以使審計人員更為直觀地對數(shù)據(jù)進行觀察和分析,從而進一步挖掘有效信息,發(fā)現(xiàn)潛藏的風(fēng)險點和疑點線索。無論是編程工具還是商業(yè)化的桌面軟件都能夠?qū)崿F(xiàn)人機之間的友好交互。相較于傳統(tǒng)的數(shù)據(jù)分析方式,可視化的分析速度得到了極大的提升,特別是桌面化的商業(yè)軟件,無須編寫復(fù)雜且冗長的算法語句,其內(nèi)置的算法分析模型,即便是沒有計算機專業(yè)背景的審計人員,也可以迅速投入大數(shù)據(jù)分析工作中去。
二是豐富多樣的數(shù)據(jù)展現(xiàn)形式。數(shù)據(jù)可視化分析的結(jié)果展示,除了常見的條形圖和折線圖之外,審計人員還可以根據(jù)自身的喜好以及審計需求、結(jié)果展示的需要等,選擇更加容易觀察和形象的圖像、圖表類型,如熱力圖、標簽云圖、氣泡圖等。這不僅使審計人員可以對數(shù)據(jù)信息展開不同層次多維度分析,保障了數(shù)據(jù)信息分析結(jié)果的真實性、有效性,而且可以對數(shù)據(jù)信息特征進行豐富多樣的展示,便于審計人員減少判斷失誤,做出正確決策,降低審計風(fēng)險。
三是多樣數(shù)據(jù)之間的關(guān)聯(lián)分析。區(qū)別于傳統(tǒng)的關(guān)系型數(shù)據(jù)分析,數(shù)據(jù)可視化分析的數(shù)據(jù)類型得到了極大的擴展。不僅可以分析結(jié)構(gòu)化的數(shù)據(jù),還可以關(guān)聯(lián)PDF、Word、XML等多種類型和結(jié)構(gòu)的數(shù)據(jù)進行分析,打破不同地區(qū)、不同時間、不同類型數(shù)據(jù)間的“信息孤島”,從而更為清晰直觀地發(fā)現(xiàn)海量數(shù)據(jù)之間存在的內(nèi)在聯(lián)系,方便審計人員快速尋找審計線索,明確后續(xù)的審計思路,即時對審計風(fēng)險制定出精準有效的決策。因此,某種程度上來說數(shù)據(jù)可視化技術(shù)是非常規(guī)審計中的“特種兵”,為醫(yī)?;鸬某B(tài)化審計監(jiān)督提供了必要的手段。同時,數(shù)據(jù)可視化分析也可以實現(xiàn)對醫(yī)?;饠?shù)據(jù)的趨勢性分析,發(fā)現(xiàn)未來醫(yī)?;鹬锌赡艽嬖诘膬A向性問題,達到“防已病治未病”的效果。
習(xí)近平總書記在中央審計委員會第一次會議上強調(diào)“科技強審,加強審計信息化建設(shè)”“向信息化要資源、向大數(shù)據(jù)要效率”。我們需要積極轉(zhuǎn)變審計思維、方式方法和管理模式,完善提升自身知識結(jié)構(gòu)體系,提高審計素質(zhì),充分運用以信息技術(shù)為代表的新技術(shù)、新理念,對審計所需要的數(shù)據(jù)進行有效的收集、歸納、處理和分析,同時高度重視信息安全問題,真正發(fā)揮好審計的“免疫系統(tǒng)”作用,履行審計監(jiān)督職責(zé)。
(作者單位:江蘇省泰州市審計局)