大數(shù)據(jù)審計是審計機(jī)關(guān)遵循大數(shù)據(jù)理念,運用大數(shù)據(jù)技術(shù)方法和工具,對數(shù)量巨大、來源分散、格式多樣的經(jīng)濟(jì)社會運行數(shù)據(jù),開展的跨層級、跨地域、跨系統(tǒng)、跨部門和跨業(yè)務(wù)深入挖掘與分析。大數(shù)據(jù)審計的理論框架主要由審計大數(shù)據(jù)、審計大數(shù)據(jù)分析技術(shù)和大數(shù)據(jù)審計平臺構(gòu)成。
大數(shù)據(jù)審計首先要堅持“數(shù)據(jù)先行”,只有高質(zhì)量的基礎(chǔ)數(shù)據(jù)才能成為大數(shù)據(jù)審計分析的基礎(chǔ)。
1.審計數(shù)據(jù)
審計數(shù)據(jù)中包含結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),按照數(shù)據(jù)來源可劃分為依托外部的公共資源、審計基礎(chǔ)資源、審計業(yè)務(wù)資源、審計知識資源以及審計共享信息。依托外部的公共資源是指互聯(lián)網(wǎng)或其他公共渠道能夠獲得的審計需要的相關(guān)信息;審計基礎(chǔ)資源是審計管理全流程中形成的審計計劃、審計證據(jù)、審計底稿、審計報告和審計決定等全部文檔資料;審計業(yè)務(wù)資源主要是指專題性行業(yè)數(shù)據(jù);審計知識資源主要是以知識發(fā)現(xiàn)和知識管理為目標(biāo),收集的審計方法、審計法律法規(guī)、質(zhì)量管理、審計事項等知識信息;審計共享信息主要是依托國家電子政務(wù)外網(wǎng)和國家級、省級公共數(shù)據(jù)交換平臺,用于各級政府機(jī)關(guān)政務(wù)共享的數(shù)據(jù)。
2.大數(shù)據(jù)采集和預(yù)處理
對審計數(shù)據(jù)分析有價值的數(shù)據(jù)都應(yīng)納入采集范圍,主要采集技術(shù)有ETL、網(wǎng)絡(luò)爬取和數(shù)據(jù)眾包采集。數(shù)據(jù)預(yù)處理即對采集到的數(shù)據(jù)進(jìn)行清洗、填補(bǔ)、平滑、合并、規(guī)格化,以及檢查一致性等處理,并對數(shù)據(jù)的多種屬性進(jìn)行初步組織,主要包含數(shù)據(jù)清理、數(shù)據(jù)集成與變換以及數(shù)據(jù)規(guī)約。ETL(Extract-Transform-Load)是將數(shù)據(jù)從來源端經(jīng)過抽取、轉(zhuǎn)換、加載至目的端,為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘分析提供數(shù)據(jù)支持。對于非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)結(jié)構(gòu)化數(shù)據(jù)采集,我們利用聚焦爬取工具,對聚焦爬取的審計主題信息,進(jìn)行去重、分類等加工處理,建立索引并以搜索的方式滿足用戶的需求。
3.數(shù)據(jù)儲存與管理
數(shù)據(jù)儲存技術(shù)主要有分布式文件系統(tǒng)、關(guān)系數(shù)據(jù)庫、非關(guān)系數(shù)據(jù)庫(NoSQL)、數(shù)據(jù)倉庫、云計算和云存儲等,建立數(shù)據(jù)庫時必須要遵循標(biāo)準(zhǔn)化原則、擴(kuò)展性原則、可維護(hù)性原則和開放性原則。目前對于海量數(shù)據(jù)的存儲和管理,在硬件上一般應(yīng)用服務(wù)器集群架構(gòu),在軟件上應(yīng)用分布式文件系統(tǒng)。其優(yōu)點是存儲量大,可以方便地實現(xiàn)TB級別的數(shù)據(jù)存儲;可靠性高,集群的各個結(jié)點可以實現(xiàn)負(fù)載均衡,不會因為一個結(jié)點出錯而造成整個服務(wù)停止;擴(kuò)展性強(qiáng),集群可以通過增加結(jié)點來提高整個系統(tǒng)的吞吐率。
審計數(shù)據(jù)分析是實現(xiàn)審計大數(shù)據(jù)價值的直接途徑,分析方法主要有驗證型分析、查詢型分析和挖掘型分析。驗證型分析主要是驗證采集的數(shù)據(jù)是否真實、完整、有效,是否包含審計人員需要的全部信息;查詢型分析一般通過數(shù)據(jù)庫工具依照法規(guī)、邏輯關(guān)系等一定的規(guī)則查詢數(shù)據(jù)中存在的疑點問題;挖掘型分析是挖掘海量數(shù)據(jù)中蘊涵的數(shù)據(jù)模式與規(guī)律,來發(fā)現(xiàn)審計線索和分析解決審計問題,并預(yù)測趨勢和行為的數(shù)據(jù)分析模式。
審計大數(shù)據(jù)的分析需要高性能的平臺,來滿足海量數(shù)據(jù)處理的需求,提升分析的效率和效果。
大數(shù)據(jù)審計云平臺能夠滿足審計大數(shù)據(jù)的采集、存儲、預(yù)處理、建模和分析需要,主要由基礎(chǔ)設(shè)施層、數(shù)據(jù)存儲層、數(shù)據(jù)分析層和平臺應(yīng)用層構(gòu)成?;A(chǔ)設(shè)施層包含服務(wù)器、網(wǎng)絡(luò)、操作系統(tǒng)、存儲設(shè)備和數(shù)據(jù)接口等軟硬件設(shè)備。數(shù)據(jù)存儲層除了借助云計算環(huán)境和分布式文件系統(tǒng)HDFS建立審計數(shù)據(jù)庫以外,還包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)存儲、數(shù)據(jù)管理、數(shù)據(jù)檢索、數(shù)據(jù)審批和數(shù)據(jù)加密等功能。數(shù)據(jù)分析層為數(shù)據(jù)分析技術(shù)和分析模型,包括查詢式分析模型和挖掘式分析模型。平臺應(yīng)用層主要運用數(shù)據(jù)分析工具、語句轉(zhuǎn)換工具、數(shù)據(jù)切分工具和R語言文本挖掘工具等開展數(shù)據(jù)分析、疑點分發(fā)和數(shù)據(jù)挖掘,對分析結(jié)果進(jìn)行可視化展現(xiàn),生成審計分析報告。
深化大數(shù)據(jù)審計是適應(yīng)時代發(fā)展的必然選擇,是實現(xiàn)審計全覆蓋的必由之路。新時代國家審計發(fā)展必須堅持科技強(qiáng)審,革新傳統(tǒng)審計方法,加強(qiáng)信息化基礎(chǔ)建設(shè),向信息化要資源,向大數(shù)據(jù)要效率。
按照黨中央、國務(wù)院對審計工作提出的“對公共資金、國有資產(chǎn)、國有資源和領(lǐng)導(dǎo)干部履行經(jīng)濟(jì)責(zé)任情況實行審計全覆蓋”的明確要求,必須構(gòu)建大數(shù)據(jù)審計工作模式,實現(xiàn)“集中分析、發(fā)現(xiàn)疑點、分散核查、系統(tǒng)研究”的數(shù)字化審計方式。大數(shù)據(jù)審計工作模式應(yīng)做好頂層設(shè)計,充分發(fā)揮審計計劃項目管理的統(tǒng)領(lǐng)作用,立足“兩統(tǒng)籌”工作要求,科學(xué)安排正式計劃項目,統(tǒng)籌審計資源,統(tǒng)一組織、整體聯(lián)動、發(fā)揮合力,實現(xiàn)有深度、有重點、有步驟、有成效的審計全覆蓋。
要將大數(shù)據(jù)思維融入項目管理和業(yè)務(wù)實施全過程,從頂層設(shè)計出發(fā),研究大數(shù)據(jù)審計需要的資源、支撐環(huán)境,并對大數(shù)據(jù)環(huán)境下的審計全過程、各環(huán)節(jié)重新進(jìn)行規(guī)劃,分解審計業(yè)務(wù)管理流程,動態(tài)整合審計資源,優(yōu)化審計作業(yè)鏈,實現(xiàn)大數(shù)據(jù)審計流程再造。大數(shù)據(jù)審計流程主要由年度計劃項目審計流程和日常數(shù)據(jù)分析流程兩部分工作內(nèi)容組成。
1.日常數(shù)據(jù)分析流程
日常數(shù)據(jù)分析流程是指將數(shù)據(jù)采集、整理和分析的工作分解到平時,根據(jù)審計需求和年度項目計劃定期采集財政、稅務(wù)、被審計單位等審計數(shù)據(jù)和第三方審計相關(guān)的行業(yè)數(shù)據(jù),并按照國家行業(yè)標(biāo)準(zhǔn)、審計數(shù)據(jù)規(guī)劃或國家審計數(shù)據(jù)中心的統(tǒng)一要求,整理和校驗數(shù)據(jù),提高數(shù)據(jù)質(zhì)量。在數(shù)據(jù)收集整理完成后,技術(shù)人員系統(tǒng)研究數(shù)據(jù)內(nèi)容、特征和相互關(guān)系,充分對數(shù)據(jù)進(jìn)行挖掘分析,為擬定項目計劃意向、挖掘?qū)徲嬛攸c疑點和建立各行業(yè)分析模型、完善優(yōu)化審計方法庫提供信息支持。
2.年度計劃項目審計流程
年度計劃項目審計流程分為計劃階段、準(zhǔn)備階段、集中分析階段、現(xiàn)場實施階段和報告階段。其中準(zhǔn)備階段和集中分析階段是大數(shù)據(jù)審計工作流程區(qū)別于傳統(tǒng)審計工作流程的兩個階段。
在計劃階段,由綜合處圍繞服務(wù)黨委、政府工作中心,關(guān)注社會熱點,結(jié)合審計工作實際,以及日常數(shù)據(jù)分析工作提供的疑點參考來明確審計計劃意向,擬定年度審計項目計劃,廳黨組對審計項目計劃進(jìn)行審核后,綜合處正式下達(dá)年度審計項目計劃。
在準(zhǔn)備階段,各業(yè)務(wù)處室根據(jù)年度審計項目計劃制定審計工作方案,數(shù)據(jù)部門根據(jù)審計工作方案、審計重點和數(shù)據(jù)行業(yè)類別組建不同的數(shù)據(jù)分析團(tuán)隊。數(shù)據(jù)分析團(tuán)隊根據(jù)審計工作方案進(jìn)行預(yù)先研判,對大數(shù)據(jù)運用做出統(tǒng)籌謀劃,明確項目的審計重點,緊扣審計工作方案開展調(diào)查了解,摸清審計所需的數(shù)據(jù)資源并收集完整。
在集中分析階段,數(shù)據(jù)分析團(tuán)隊利用關(guān)聯(lián)分析、趨勢分析、聚類分析等數(shù)據(jù)挖掘技術(shù),建立分析模型,形成分析結(jié)果和問題疑點線索,實現(xiàn)數(shù)據(jù)分析的批量化、深度化與準(zhǔn)確化,減少現(xiàn)場審計時間。數(shù)據(jù)分析團(tuán)隊?wèi)?yīng)當(dāng)注重總體宏觀分析和重點分析相結(jié)合,既要從整體層次上把握被審計單位主要特點、運營規(guī)律和發(fā)展趨勢,指導(dǎo)審計人員確定審計重點,又要以問題為導(dǎo)向篩選線索,為審計取證提供明確具體的目標(biāo)。為提高疑點線索的精準(zhǔn)打擊率,在這一階段增加“試審”環(huán)節(jié),按照數(shù)據(jù)初步分析結(jié)果選點進(jìn)行抽樣驗證,根據(jù)試審結(jié)果修正和完善數(shù)據(jù)分析模型,再由技術(shù)人員對分析結(jié)果進(jìn)行審核,人工篩查刪除其中非正常數(shù)據(jù)或特殊業(yè)務(wù)情景,反復(fù)修正數(shù)據(jù)分析模型,進(jìn)一步縮小疑點范圍。
在現(xiàn)場實施階段,現(xiàn)場審計組根據(jù)數(shù)據(jù)分析團(tuán)隊下發(fā)的疑點進(jìn)行核實,同時落實其他審計事項。數(shù)據(jù)分析團(tuán)隊要密切追蹤疑點核實情況,及時了解現(xiàn)場核查小組工作中遇到的問題,適時調(diào)整分析思路,細(xì)化分析指標(biāo),確保大數(shù)據(jù)分析的精準(zhǔn)度;及時發(fā)掘現(xiàn)場核查發(fā)現(xiàn)的趨勢性、典型性、普遍性問題,通過動態(tài)簡報、情況調(diào)度會等形式指導(dǎo)各現(xiàn)場核查小組調(diào)整方向、把握重點,真正做到現(xiàn)場審計與非現(xiàn)場審計的深度融合,有效推動疑點落實。
在報告階段,審計組在提交審計報告、完成審計文書資料歸檔的同時將疑點核實情況反饋給數(shù)據(jù)分析團(tuán)隊。數(shù)據(jù)分析團(tuán)隊根據(jù)疑點核實的效果及時對數(shù)據(jù)審計思路、數(shù)據(jù)采集范圍、數(shù)據(jù)整理過程、數(shù)據(jù)分析模型、疑點核實情況進(jìn)行歸納總結(jié),形成數(shù)據(jù)分析報告,并調(diào)整和改進(jìn)分析方法,完善審計方法庫。
一是提高數(shù)據(jù)使用效率。自上而下完善審計數(shù)據(jù)規(guī)劃,全方位、常態(tài)化地積累各行業(yè)、各領(lǐng)域數(shù)據(jù),進(jìn)一步加強(qiáng)數(shù)據(jù)標(biāo)準(zhǔn)化建設(shè);加大數(shù)據(jù)共享力度,實現(xiàn)跨地域、跨行業(yè)、跨系統(tǒng)的數(shù)據(jù)挖掘分析;強(qiáng)化數(shù)據(jù)管理與安全保障,完善數(shù)據(jù)管理制度和安全工作流程,加強(qiáng)保密管理。二是建立全國統(tǒng)籌協(xié)調(diào)、層次清晰、功能齊全的大數(shù)據(jù)審計云平臺。一方面,要構(gòu)建審計存儲云,通過Hadoop云計算框架下的HDFS、MapReduce、NoSQL等技術(shù),實現(xiàn)異構(gòu)數(shù)據(jù)的分布式存放和高效處理,實現(xiàn)動態(tài)負(fù)載均衡和分布式熱備份。另一方面,要構(gòu)建審計分析云,利用分布式文件系統(tǒng)和并行計算技術(shù),將海量審計數(shù)據(jù)分到云上多個數(shù)據(jù)節(jié)點進(jìn)行實時批處理分析,并及時反饋分析結(jié)果,提高分析效率。三是構(gòu)建審計大數(shù)據(jù)分析模型體系。審計分析技術(shù)建模體現(xiàn)了審計業(yè)務(wù)和計算機(jī)算法的高度有機(jī)結(jié)合,科學(xué)構(gòu)建審計大數(shù)據(jù)分析模型,實現(xiàn)國家審計系統(tǒng)共享,可以極大程度上降低人員知識水平和知識結(jié)構(gòu)不足帶來的審計差異,真正實現(xiàn)智能化審計,提高大數(shù)據(jù)審計工作的質(zhì)量和效率。四是進(jìn)一步推動審計技術(shù)創(chuàng)新。提高創(chuàng)新意識,提升創(chuàng)新能力,加強(qiáng)大數(shù)據(jù)預(yù)處理、深度分析挖掘、可視化交互等關(guān)鍵技術(shù)工具的開發(fā)應(yīng)用。充分利用高等院校和科研機(jī)構(gòu)的資源優(yōu)勢,建立合作研發(fā)模式。建立創(chuàng)新激勵制度,開展審計數(shù)據(jù)分析技術(shù)評選,對優(yōu)秀創(chuàng)新成果進(jìn)行表彰獎勵。
一是牢固樹立大數(shù)據(jù)審計思維和理念。思想是行動的先導(dǎo),要加大宣傳力度,使審計人員深刻認(rèn)識到大數(shù)據(jù)審計是事關(guān)審計事業(yè)長遠(yuǎn)發(fā)展的重大工程;建立大數(shù)據(jù)審計思維,主動學(xué)習(xí)信息化知識,夯實大數(shù)據(jù)審計能力,將總體思維、關(guān)聯(lián)思維、預(yù)測思維融入審計實施全過程。二是科學(xué)開展大數(shù)據(jù)審計培訓(xùn)。在培訓(xùn)規(guī)劃上,按照培訓(xùn)需求和目標(biāo)的不同,采取經(jīng)常性培訓(xùn)、專項培訓(xùn)和骨干培訓(xùn)相結(jié)合、案例教學(xué)和以審代訓(xùn)相結(jié)合等方式開展;在培訓(xùn)對象上,促進(jìn)審計系統(tǒng)內(nèi)的培訓(xùn)名額區(qū)域平衡,爭取在一定時間內(nèi)完成對審計人員培訓(xùn)的全覆蓋;在培訓(xùn)內(nèi)容上,既要兼顧工作必備信息化能力,又要兼顧行業(yè)類專題培訓(xùn),也要對新技術(shù)新方法進(jìn)行知識更新。三是打造高端數(shù)據(jù)分析團(tuán)隊。高端數(shù)據(jù)分析團(tuán)隊要把握全局,加強(qiáng)對大數(shù)據(jù)環(huán)境下審計目標(biāo)、思路與模式的研究,提出有價值的分析需求;為審計項目提供分析指導(dǎo)和技術(shù)支持,為項目管理、領(lǐng)導(dǎo)決策提供可靠信息;構(gòu)建、優(yōu)化大數(shù)據(jù)分析模型,達(dá)到宏觀分析和制度執(zhí)行效果探索等目的。
大數(shù)據(jù)審計得到法律支持和制度支撐,是大數(shù)據(jù)技術(shù)在國家審計監(jiān)督中充分發(fā)揮作用的關(guān)鍵前提。大數(shù)據(jù)等審計信息化技術(shù)應(yīng)用的法規(guī)制度配套工作是一項復(fù)雜的系統(tǒng)工程,要放在國家層面大數(shù)據(jù)立法框架中進(jìn)行。應(yīng)從國家層面健全頂層設(shè)計和系統(tǒng)性規(guī)劃,完善政府大數(shù)據(jù)管理使用相關(guān)法規(guī)制度,從根本上打破行業(yè)部門信息壁壘,真正實現(xiàn)數(shù)據(jù)共享。
應(yīng)根據(jù)審計工作特點完善審計大數(shù)據(jù)法規(guī)制度。在審計法、審計法實施條例的修訂過程中,明確被審計單位應(yīng)當(dāng)提供的電子數(shù)據(jù)及技術(shù)文檔;明確建立電子數(shù)據(jù)定期報送工作機(jī)制;明確審計大數(shù)據(jù)的安全性、保密性規(guī)定;明確規(guī)范采集、存儲、使用電子數(shù)據(jù)得出的結(jié)論依法合規(guī)作為審計證據(jù)的相關(guān)規(guī)定等。要建立健全與大數(shù)據(jù)時代相適應(yīng)的審計標(biāo)準(zhǔn)和準(zhǔn)則,為強(qiáng)力推進(jìn)大數(shù)據(jù)審計保駕護(hù)航。
審計機(jī)關(guān)應(yīng)整合現(xiàn)有資金渠道,積極爭取本級政府的支持,加大財政投入,明確審計大數(shù)據(jù)基礎(chǔ)設(shè)施總體建設(shè)需求,規(guī)劃詳細(xì)建設(shè)方案,加快金審工程三期建設(shè)步伐,加強(qiáng)對軟硬件設(shè)備的更新與維護(hù)。上級審計機(jī)關(guān)應(yīng)深入掌握各地區(qū)大數(shù)據(jù)基礎(chǔ)建設(shè)進(jìn)度不平衡的情況,組織、協(xié)調(diào)、指導(dǎo)下級審計機(jī)關(guān)金審工程建設(shè),建設(shè)省、市、縣之間的數(shù)據(jù)專網(wǎng),開通數(shù)據(jù)傳輸功能,深度挖掘現(xiàn)有設(shè)備的潛力,提高現(xiàn)有設(shè)備的利用效率,全面提升信息化、大數(shù)據(jù)技術(shù)在審計業(yè)務(wù)和管理工作中的應(yīng)用水平。
近幾年,湖北省審計系統(tǒng)堅持科技強(qiáng)審,強(qiáng)化大數(shù)據(jù)審計思維,確立了“制度是保障、人才是根本、平臺是基礎(chǔ)、數(shù)據(jù)是核心、技術(shù)是關(guān)鍵”的數(shù)字化審計發(fā)展思路,初步構(gòu)建了大數(shù)據(jù)審計體系。
湖北省各級審計機(jī)關(guān)均針對信息化建設(shè)制定了相關(guān)制度,如湖北省審計廳制定出臺了《湖北省金審工程三期項目建設(shè)實施意見》《湖北省審計基礎(chǔ)數(shù)據(jù)規(guī)劃》等指導(dǎo)性文件,對全省審計信息化工作進(jìn)行了統(tǒng)籌部署;武漢市審計局印發(fā)了《2018年至2020年武漢市大數(shù)據(jù)審計三年行動計劃》;十堰市審計局積極爭取市政府出臺了《關(guān)于定期報送審計電子數(shù)據(jù)的通知》;荊門市審計局制定了《荊門市審計信息化發(fā)展規(guī)劃(2017-2020年)》等,這些文件的出臺為大數(shù)據(jù)審計提供了強(qiáng)有力的制度保障。
一是開發(fā)了湖北省全省審計計劃項目管理系統(tǒng)和湖北省審計對象庫,建設(shè)內(nèi)容包括:全省計劃項目統(tǒng)一管理、全省項目實施統(tǒng)一管理、全省項目資料統(tǒng)一管理、全省審計人員統(tǒng)一管理、全省審計計劃項目綜合分析和全省審計對象管理。系統(tǒng)實現(xiàn)了審計計劃項目從制定、執(zhí)行到審計報告全流程管理;省市縣三級的計劃項目申報、審核、資料交互管理;各審計機(jī)關(guān)審計項目和審計組人員的人力資源分配管理;歷年審計成果管理,提高了審計項目管理的科學(xué)性,為大數(shù)據(jù)審計項目的順利開展提供了保障。二是開發(fā)了可擴(kuò)展的湖北省數(shù)據(jù)資源目錄系統(tǒng),實現(xiàn)了全省集中存儲的數(shù)據(jù)資源、類型、結(jié)構(gòu)的統(tǒng)一管理和可視化統(tǒng)計展示,有效提升了數(shù)據(jù)存儲效能和利用率。三是開發(fā)了數(shù)據(jù)智能采集校驗報送工具,實現(xiàn)了省市縣三級審計機(jī)關(guān)一鍵完成數(shù)據(jù)的采集、清洗、整理、轉(zhuǎn)換及上傳省廳數(shù)據(jù)中心的全部流程。四是開發(fā)了可擴(kuò)展的財政審計分析云平臺,采用分布式并行技術(shù),固化了總體分析、疑點分析和關(guān)聯(lián)分析三大類40個審計分析模型,省市縣三級可通過不同級別的賬戶、密碼登錄分析平臺,實現(xiàn)了各級協(xié)同作業(yè)。五是打造了全省審計專網(wǎng)、數(shù)據(jù)分析網(wǎng)、視頻會商系統(tǒng)等各級審計機(jī)關(guān)的互聯(lián)互通、統(tǒng)一的工作平臺,有力整合了湖北省審計機(jī)關(guān)的人力、技術(shù)和數(shù)據(jù)資源,推動了審計工作向大數(shù)據(jù)審計模式轉(zhuǎn)變。
1.數(shù)據(jù)規(guī)劃
運用數(shù)據(jù),必須首先做到數(shù)據(jù)標(biāo)準(zhǔn)化。2018年,按照“以用為本”的原則編制了《湖北省審計基礎(chǔ)數(shù)據(jù)規(guī)劃》(圖1),共涉及全省財政、地稅、養(yǎng)老保險、學(xué)校、社會救助、安居工程等19類審計數(shù)據(jù)、110張審計標(biāo)準(zhǔn)表,其中市、縣負(fù)責(zé)采集報送的數(shù)據(jù)標(biāo)準(zhǔn)表40張,省廳負(fù)責(zé)采集的數(shù)據(jù)標(biāo)準(zhǔn)表70張,初步形成既能滿足審計署統(tǒng)一定期報送需要,又能滿足項目審計和聯(lián)網(wǎng)審計需要,同時兼顧各地業(yè)務(wù)信息系統(tǒng)差異的數(shù)據(jù)標(biāo)準(zhǔn)。
圖1 湖北省審計數(shù)據(jù)規(guī)劃文檔結(jié)構(gòu)圖
2.數(shù)據(jù)采集
目前湖北省審計廳數(shù)據(jù)中心有服務(wù)器近百臺,存儲能力近200TB,電子數(shù)據(jù)積累量共達(dá)48.3TB,存儲了包含財政、地稅、部門財務(wù)、教育、社保、農(nóng)業(yè)、扶貧、企業(yè)、醫(yī)院、經(jīng)責(zé)、自然資源資產(chǎn)、公共等12個行業(yè)的數(shù)據(jù)。湖北省已初步建立了數(shù)據(jù)定期采集機(jī)制,每年通過聯(lián)網(wǎng)實時收集、定期報送、發(fā)函溝通等方式采集數(shù)據(jù),建立了全省數(shù)據(jù)采集、校驗、標(biāo)準(zhǔn)化和上傳的通道。
3.數(shù)據(jù)安全
湖北省審計廳為實現(xiàn)數(shù)據(jù)管理的科學(xué)化和規(guī)范化,一是制定了《審計業(yè)務(wù)數(shù)據(jù)管理試行辦法》和《數(shù)據(jù)安全管理試行辦法》,對數(shù)據(jù)中心的軟硬件配置、數(shù)據(jù)分類、數(shù)據(jù)的采集使用機(jī)制、數(shù)據(jù)安全等內(nèi)容進(jìn)行全過程管理。二是最小授權(quán)原則訪問數(shù)據(jù)。數(shù)據(jù)中心在網(wǎng)絡(luò)上與審計專網(wǎng)、電子政務(wù)外網(wǎng)進(jìn)行了隔離,僅兩臺終端能夠訪問,并設(shè)置一臺終端為數(shù)據(jù)輸出端,既兼顧了數(shù)據(jù)安全,又能滿足數(shù)據(jù)輸出的需求。當(dāng)有數(shù)據(jù)分析需求時,則將數(shù)據(jù)中心的數(shù)據(jù)遷移至數(shù)據(jù)分析服務(wù)器上,設(shè)置若干訪問終端,分析結(jié)束后收回所分配的權(quán)限,并遷移結(jié)果數(shù)據(jù)至數(shù)據(jù)中心。
近年來,湖北省審計廳高度重視審計人員的計算機(jī)培訓(xùn)工作,每年通過多方式、多層次、多渠道開展計算機(jī)相關(guān)培訓(xùn)。一是按照審計署要求,通過自行組織培訓(xùn)、統(tǒng)一參加考試的方式,積極開展計算機(jī)中級培訓(xùn)。截至2019年底,全省共有637人獲得審計署計算機(jī)審計中級證書,實現(xiàn)了每個市州和區(qū)縣的全覆蓋。二是積極選派人員參加審計署數(shù)據(jù)分析師高級培訓(xùn)班,目前全省已有6人通過署高級考試,并自行組織了二期數(shù)據(jù)分析師高級培訓(xùn)班。截至2019年底,計算機(jī)高級專家覆蓋了全省17個市州、45個區(qū)縣。三是組織開展了7期大數(shù)據(jù)審計實訓(xùn)班,采取項目帶動、以審代訓(xùn)、實操演練相結(jié)合的方式,參訓(xùn)人員實現(xiàn)市州和區(qū)縣的全覆蓋。四是開展計算機(jī)中級后續(xù)培訓(xùn)班,促使現(xiàn)有中級人員從技術(shù)型人才向?qū)<倚腿瞬呸D(zhuǎn)變。同時整合全省審計系統(tǒng)計算機(jī)審計和傳統(tǒng)審計隊伍,組建審計數(shù)據(jù)分析團(tuán)隊,加強(qiáng)對大數(shù)據(jù)環(huán)境下審計目標(biāo)與思路的研究,加大對大數(shù)據(jù)技術(shù)的研究和開發(fā)力度,提出有價值的分析需求,構(gòu)建、優(yōu)化大數(shù)據(jù)分析模型。
近年來,湖北省審計機(jī)關(guān)按照大數(shù)據(jù)審計模式,科學(xué)制定審計項目,整合全省資源,依據(jù)再造的大數(shù)據(jù)審計流程,積極創(chuàng)新數(shù)據(jù)挖掘分析方法,大數(shù)據(jù)審計運用初見成效,大數(shù)據(jù)審計體系已初步形成。
在財政審計領(lǐng)域,審計覆蓋面擴(kuò)大,基本實現(xiàn)全覆蓋。2015年以來,湖北省審計廳按照大數(shù)據(jù)審計模式,運用大數(shù)據(jù)審計流程,組建數(shù)據(jù)分析團(tuán)隊,在全國率先實現(xiàn)了省級110個部門及1032個二三級單位“橫向到邊”的全覆蓋,全省各級審計機(jī)關(guān)部門預(yù)算執(zhí)行審計總體覆蓋面已達(dá)70%以上,初步形成了總體和重點問題分析模型體系。2018年,湖北省審計廳開始探索運用OCR語義識別技術(shù)和文本模糊匹配技術(shù),完成了110個省直部門的預(yù)算文本及1400個項目文本的轉(zhuǎn)化,實現(xiàn)項目預(yù)算明細(xì)表與國庫集中支付、部門財務(wù)核算數(shù)據(jù)的關(guān)聯(lián)分析,將10個人4個月的工作量縮短為10個人10天的工作量,極大地提高了工作效率。通過連續(xù)幾年深入推進(jìn)的部門預(yù)算執(zhí)行全覆蓋審計,進(jìn)一步提升了財經(jīng)法規(guī)的嚴(yán)肅性,規(guī)范了預(yù)算管理和財務(wù)收支行為,省直部門及所屬單位預(yù)算執(zhí)行情況取得了較好的效果。
在民生審計領(lǐng)域,智能化與集約化并進(jìn),節(jié)約審計資源。2018年底,湖北省審計廳首次組織民生資金大數(shù)據(jù)審計項目,對13大類25項資金274億元民生資金開展審計。按大數(shù)據(jù)審計流程抽調(diào)了專業(yè)技術(shù)人員30人組建分析團(tuán)隊,采集了117個地方50套標(biāo)準(zhǔn)數(shù)據(jù)表,編寫分析模型125個,經(jīng)過多輪數(shù)據(jù)分析及人工排查,篩查出疑點28萬條。在民生資金數(shù)據(jù)采集階段利用Sqoop數(shù)據(jù)傳輸技術(shù)和Hadoop為基礎(chǔ)的數(shù)據(jù)智能采集校驗報送系統(tǒng),僅用兩天就完成了全省4077張表的校驗上傳,有效提高了數(shù)據(jù)報送的效率和質(zhì)量。民生資金大數(shù)據(jù)審計項目摸清了各地民生類專項資金底數(shù),揭示反映了挪用專項資金、惠農(nóng)惠民資金發(fā)放不到位、資金發(fā)放對象身份不合規(guī)以及資金落實不到位百姓未能享受政策等問題,促使資金管理部門對問題立行整改,老百姓權(quán)益受到保障。
在醫(yī)院審計領(lǐng)域,精準(zhǔn)揭示了問題,提升了審計質(zhì)量。近年來湖北省審計廳對2013年編制的《醫(yī)院收費系統(tǒng)審計指南》進(jìn)行了修訂,形成醫(yī)院數(shù)據(jù)審計方法體系。根據(jù)審計需要制定了醫(yī)院通用的藥品管理標(biāo)準(zhǔn)表4張、耗材設(shè)備管理標(biāo)準(zhǔn)表3張和門診住院收費標(biāo)準(zhǔn)表2張,形成藥品超標(biāo)準(zhǔn)收費、藥品溢庫、不可收費耗材、自立服務(wù)項目、超標(biāo)準(zhǔn)收取診療費等25個審計模型,為醫(yī)院審計的開展提供了通用精準(zhǔn)的審計方法體系。同時積極研究醫(yī)院數(shù)據(jù)挖掘分析方法,利用聚類分析技術(shù),制作出一個1799家醫(yī)院名稱3066個項目名稱的費用匯總矩陣,將離群點醫(yī)院的項目收費作為審計疑點,鎖定7家醫(yī)院異常治療項目的總費用遠(yuǎn)遠(yuǎn)高于其他醫(yī)院,查出虛假治療費用的問題。醫(yī)院的審計模型精準(zhǔn)度高,轉(zhuǎn)化疑點的取證率達(dá)到70%,極大地提升了審計質(zhì)量。
在資源環(huán)境審計領(lǐng)域,運用地理信息技術(shù),實現(xiàn)精準(zhǔn)打擊。湖北省審計廳從2016年開始探索自然資源審計全覆蓋,出臺了《領(lǐng)導(dǎo)干部自然資源資產(chǎn)離任審計指南》和《自然資源大數(shù)據(jù)審計指引表》。2018年完成對水利、林業(yè)、國土、環(huán)保、測繪、農(nóng)業(yè)、安監(jiān)、發(fā)改各部門進(jìn)行調(diào)研、采集相關(guān)數(shù)據(jù),設(shè)計審計模型139個。每年在市縣領(lǐng)導(dǎo)干部自然資源資產(chǎn)離任審計審前準(zhǔn)備和數(shù)據(jù)集中分析中,通過圖斑疊加比對等技術(shù)篩出一千多處疑點線索,為審計組查找問題提供有力依據(jù)。