劉 玉,徐 志
(1.南京審計(jì)大學(xué) 實(shí)驗(yàn)中心,江蘇 南京,211815)(2.南京市江寧區(qū)審計(jì)局,江蘇 南京,211100)
當(dāng)前基層審計(jì)工作的開(kāi)展主要采用財(cái)務(wù)報(bào)表的方式,所使用的審計(jì)數(shù)據(jù)來(lái)自會(huì)計(jì)信息系統(tǒng)[1]。隨著大數(shù)據(jù)技術(shù)的不斷進(jìn)步,審計(jì)數(shù)據(jù)逐漸向著多源化、異質(zhì)化發(fā)展,以大數(shù)據(jù)為依據(jù)開(kāi)展審計(jì)活動(dòng),對(duì)于整個(gè)審計(jì)領(lǐng)域的發(fā)展都有極大影響[2]。在更為復(fù)雜的工作環(huán)境下,創(chuàng)新審計(jì)模式,設(shè)計(jì)大數(shù)據(jù)審計(jì)平臺(tái)成為當(dāng)務(wù)之急。
文獻(xiàn)[3]應(yīng)用云計(jì)算技術(shù),采用Hadoop算法,構(gòu)建審計(jì)全覆蓋驅(qū)動(dòng)平臺(tái),根據(jù)大數(shù)據(jù)審計(jì)平臺(tái)的設(shè)計(jì)要求,從理念和策略等多方面分析平臺(tái)構(gòu)建重點(diǎn),通過(guò)數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)可視化等多個(gè)方面探索審計(jì)新方法,但該方法的審計(jì)數(shù)據(jù)質(zhì)量較低。文獻(xiàn)[4]在審計(jì)平臺(tái)設(shè)計(jì)過(guò)程中融合大數(shù)據(jù)技術(shù),從平臺(tái)設(shè)計(jì)、信息支撐等方面提出了審計(jì)數(shù)據(jù)平臺(tái)設(shè)計(jì)的新思路,但該審計(jì)平臺(tái)的審計(jì)效率較低。文獻(xiàn)[5]依托于IaaS(infrastructure as a service,基礎(chǔ)設(shè)施即服務(wù))和PaaS(platform as a service,平臺(tái)即服務(wù))技術(shù),把大數(shù)據(jù)審計(jì)平臺(tái)的工作過(guò)程劃分為數(shù)據(jù)采集與處理、數(shù)據(jù)分析和數(shù)據(jù)結(jié)果顯示等環(huán)節(jié),以此為基礎(chǔ),構(gòu)建平臺(tái)的基礎(chǔ)層、服務(wù)層、應(yīng)用層與終端層,在云計(jì)算環(huán)境下,構(gòu)建審計(jì)平臺(tái)并實(shí)施大數(shù)據(jù)審計(jì)技術(shù),但其對(duì)審計(jì)數(shù)據(jù)的利用率較低。
針對(duì)上述審計(jì)平臺(tái)所表現(xiàn)出的缺點(diǎn),本文構(gòu)建了新的基層審計(jì)機(jī)關(guān)大數(shù)據(jù)審計(jì)平臺(tái),綜合硬件設(shè)計(jì)和軟件設(shè)計(jì)兩方面,提升平臺(tái)數(shù)據(jù)審計(jì)性能,并將其應(yīng)用于實(shí)際審計(jì)工作中。
前置采集機(jī)包括中央處理器、屏幕顯示器、計(jì)算機(jī)接口等多個(gè)部件,具備數(shù)據(jù)實(shí)時(shí)采集、自動(dòng)傳輸?shù)榷喾N功能[6]。本文將其作為一種信息化工具應(yīng)用于大數(shù)據(jù)審計(jì)平臺(tái)中,采集審計(jì)大數(shù)據(jù)并將其保存或發(fā)布至數(shù)據(jù)中心。根據(jù)審計(jì)需求,利用前置采集機(jī)獲取所需數(shù)據(jù),采用無(wú)線(xiàn)網(wǎng)絡(luò),將前置采集機(jī)與數(shù)據(jù)中心相連,實(shí)時(shí)更新審計(jì)數(shù)據(jù)。
單刀雙擲網(wǎng)絡(luò)開(kāi)關(guān)作為一種數(shù)據(jù)傳輸權(quán)限控制設(shè)備,主要由動(dòng)端和不動(dòng)端構(gòu)成。所謂的單刀就是開(kāi)關(guān)的動(dòng)端,與電源線(xiàn)相連接。而雙擲則是電源輸出的兩個(gè)端口,亦是不動(dòng)端。通過(guò)對(duì)不動(dòng)端的控制,實(shí)現(xiàn)電源輸出方向的控制。單刀雙擲網(wǎng)絡(luò)開(kāi)關(guān)的應(yīng)用既可以完成兩臺(tái)設(shè)備的同時(shí)控制,也可以對(duì)一臺(tái)設(shè)備的運(yùn)轉(zhuǎn)方向進(jìn)行實(shí)時(shí)轉(zhuǎn)換。
前置采集機(jī)與單刀雙擲網(wǎng)絡(luò)開(kāi)關(guān)兩個(gè)硬件的設(shè)計(jì),為軟件設(shè)計(jì)提供了支撐,為大數(shù)據(jù)審計(jì)平臺(tái)建設(shè)奠定了基礎(chǔ)。
大數(shù)據(jù)審計(jì)平臺(tái)的工作基礎(chǔ)是數(shù)據(jù),所以在審計(jì)平臺(tái)的軟件設(shè)計(jì)中,需要構(gòu)建數(shù)據(jù)中心[7]。數(shù)據(jù)中心主要由元數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)和審計(jì)資源庫(kù)3個(gè)模塊構(gòu)成。將審計(jì)所需的原始數(shù)據(jù)采集完成后,按照審計(jì)標(biāo)準(zhǔn)和審計(jì)案例等信息完成數(shù)據(jù)處理加工。本文采用IDE(integrated drive electronics,集成驅(qū)動(dòng)器電子裝置)作為核心數(shù)據(jù)存儲(chǔ)技術(shù),將處理后的數(shù)據(jù)按照結(jié)構(gòu)化形式統(tǒng)一保存起來(lái)。
在構(gòu)建數(shù)據(jù)中心時(shí),融入?yún)^(qū)塊鏈分布式賬本的技術(shù)。區(qū)塊鏈技術(shù)是以時(shí)間順序?yàn)榛A(chǔ),將鏈?zhǔn)綌?shù)據(jù)按順序連接起來(lái),采用分布式節(jié)點(diǎn)共識(shí)算法達(dá)到保存數(shù)據(jù)的目的[8]。由于上述技術(shù)具備不可篡改的特點(diǎn),使得數(shù)據(jù)中心內(nèi)保存的數(shù)據(jù)具有交叉驗(yàn)證的能力。將所有采集處理后的數(shù)據(jù)加蓋時(shí)間戳,保證記載文件具有可追溯性。除了保存數(shù)據(jù)之外,數(shù)據(jù)中心的主要功能在于管理采集轉(zhuǎn)換來(lái)的數(shù)據(jù),使得審計(jì)平臺(tái)中的大量原始數(shù)據(jù)以及應(yīng)用數(shù)據(jù)資源得到良好維護(hù)。數(shù)據(jù)中心依靠相關(guān)語(yǔ)句全面管理審計(jì)數(shù)據(jù)應(yīng)用。在平臺(tái)應(yīng)用過(guò)程中,依據(jù)審計(jì)目的和業(yè)務(wù)需求,選取數(shù)據(jù)源中符合要求的數(shù)據(jù),生成數(shù)據(jù)集市[9]。通過(guò)數(shù)據(jù)中心的應(yīng)用,為審計(jì)平臺(tái)的實(shí)現(xiàn)提供數(shù)據(jù)支撐。
數(shù)據(jù)中心構(gòu)建的步驟為:第一,定義數(shù)據(jù)采集流程。該數(shù)據(jù)采集模塊應(yīng)能提供可視化的數(shù)據(jù)采集流程和各種二次開(kāi)發(fā)接口,可以實(shí)現(xiàn)數(shù)據(jù)提取、整理、裝載等功能。它的引擎可以支持 SQL server、Oracle等大型的主流數(shù)據(jù)庫(kù)和其他文本數(shù)據(jù)庫(kù);第二,確定數(shù)據(jù)采集周期。結(jié)合被審核業(yè)務(wù)的特點(diǎn),采集過(guò)程可以人工啟動(dòng),也可以采用定期自動(dòng)增量采集,根據(jù)被審核單位的不同,設(shè)定采集周期。裝入并運(yùn)行數(shù)據(jù)采集模板。通過(guò)設(shè)置好的數(shù)據(jù)采集模板,生成數(shù)據(jù)采集可執(zhí)行文件,在前置機(jī)啟動(dòng)運(yùn)行。
審計(jì)過(guò)程中可以通過(guò)多種方式得到有價(jià)值的信息,但是在海量的數(shù)據(jù)中,審計(jì)項(xiàng)目所能應(yīng)用的僅僅是少部分內(nèi)容,將這些有價(jià)值的信息找出來(lái)需要消耗大量的系統(tǒng)資源,造成審計(jì)效率較低[10]。本文針對(duì)上述問(wèn)題采用聚焦網(wǎng)絡(luò)爬蟲(chóng)算法分析當(dāng)前審計(jì)數(shù)據(jù)內(nèi)容,并獲取抓取的URL與原數(shù)據(jù)的聯(lián)系,保證采集數(shù)據(jù)價(jià)值更高,聚焦爬蟲(chóng)的基本流程如圖1所示。
圖1 審計(jì)聚焦網(wǎng)絡(luò)爬蟲(chóng)
基于聚焦爬蟲(chóng)技術(shù),融合深度優(yōu)先搜索策略,以某一個(gè)網(wǎng)頁(yè)為開(kāi)端,選擇其中某一個(gè)超鏈接開(kāi)始搜索,直至到達(dá)該超鏈接的最底層頁(yè)面。完成上述操作后,回到最初頁(yè)面,選定其他超鏈接重復(fù)上述操作。依靠最佳優(yōu)先搜索方法計(jì)算主題相似性,采集對(duì)應(yīng)審計(jì)數(shù)據(jù)。排序過(guò)程中,首先基于聚焦爬蟲(chóng)技術(shù),得到數(shù)據(jù)中單詞出現(xiàn)的頻率:
(1)
(2)
式中:|D|為審計(jì)數(shù)據(jù)文件總數(shù);|{j∶ti∈|D|}|為包含單詞ti的文檔數(shù)。根據(jù)完成權(quán)重的排序,得到單詞權(quán)重:
W=fTF×fIDF
(3)
根據(jù)上述單詞權(quán)重計(jì)算結(jié)果,獲取主題的相關(guān)性。其中,向量空間的維數(shù)與關(guān)鍵字?jǐn)?shù)量n保持一致,依據(jù)每個(gè)關(guān)鍵字k的權(quán)重,獲取不同維度的值。而主題q中關(guān)鍵字k的權(quán)重表示為fkq,通過(guò)海量數(shù)據(jù),得到采集數(shù)據(jù)主題定義α:
(4)
根據(jù)關(guān)鍵字所出現(xiàn)的次數(shù),獲取出次數(shù)的占比。其中,關(guān)鍵字出現(xiàn)的最高頻率設(shè)為1,根據(jù)其他關(guān)鍵字出現(xiàn)頻率xi,該頁(yè)面向量的維度值為xiWi。根據(jù)審計(jì)數(shù)據(jù),得到數(shù)據(jù)采集頁(yè)面主題定義β:
(5)
根據(jù)相似性排序篩選出最符合要求的URL,得到計(jì)算收獲率P表示頁(yè)面主題的相關(guān)性:
P= cos(α,β) =
(6)
依據(jù)審計(jì)要求,設(shè)置相似度閾值。當(dāng)式(6)計(jì)算結(jié)果大于閾值,表示所采集的數(shù)據(jù)頁(yè)面與審計(jì)主體相關(guān)度較高,可以將其添加至采集隊(duì)列中。將上述采集數(shù)據(jù)進(jìn)行處理,采用數(shù)據(jù)轉(zhuǎn)換引擎將所有采集的數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一格式。采用SQL語(yǔ)句對(duì)數(shù)據(jù)進(jìn)行編程,從中剔除沖突數(shù)據(jù),并將其中的缺失數(shù)據(jù)有效補(bǔ)充。數(shù)據(jù)處理流程如圖2所示。
圖2 數(shù)據(jù)處理過(guò)程示意
通過(guò)上述的數(shù)據(jù)采集和處理過(guò)程,完成相關(guān)審計(jì)數(shù)據(jù)的分析和轉(zhuǎn)換,并將處理后的數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)中心,為后續(xù)數(shù)據(jù)分析審計(jì)提供支撐。
基層審計(jì)機(jī)關(guān)大數(shù)據(jù)審計(jì)平臺(tái)設(shè)計(jì)中,最重要的環(huán)節(jié)是審計(jì)數(shù)據(jù)分析。本文采用歷史經(jīng)驗(yàn)生成審計(jì)準(zhǔn)則,并將審計(jì)數(shù)據(jù)中的異常信息標(biāo)注出來(lái),完成審計(jì)預(yù)警。而審計(jì)分析實(shí)際上是對(duì)審計(jì)信息的異常數(shù)據(jù)分類(lèi),所以采用機(jī)器學(xué)習(xí)中的樸素貝葉斯算法,并結(jié)合Logistic回歸模型,完成審計(jì)分析模型的建立。作為常見(jiàn)的分類(lèi)方法之一,樸素貝葉斯算法計(jì)算公式為
(7)
式中:T為條件概率;x、y為兩個(gè)待分類(lèi)項(xiàng)。在樸素貝葉斯算法應(yīng)用過(guò)程中,將審計(jì)過(guò)程劃分為以下3個(gè)部分:首先是準(zhǔn)備階段,在確定審計(jì)業(yè)務(wù)的特征后,劃分待分類(lèi)項(xiàng)屬性信息,生成審計(jì)樣本;通過(guò)計(jì)算上述分類(lèi)中不同類(lèi)別出現(xiàn)的頻率,完成分類(lèi)器訓(xùn)練;最后,采用訓(xùn)練結(jié)束后的分類(lèi)器,完成審計(jì)數(shù)據(jù)分類(lèi)統(tǒng)計(jì)。
之后,采用Logistic回歸模型,對(duì)上述分類(lèi)數(shù)據(jù)完成二次分類(lèi)。Logistic回歸模型表示為
(8)
其中,審計(jì)數(shù)據(jù)向量g(v)中包含m個(gè)獨(dú)立變量v。通過(guò)Logistic回歸模型統(tǒng)計(jì)分類(lèi)事件頻率,獲取條件概率T。之后,應(yīng)用極大似然估計(jì)方法,獲取模型參數(shù),并根據(jù)回歸模型獲取審計(jì)數(shù)據(jù)分析結(jié)果。
在大數(shù)據(jù)審計(jì)平臺(tái)中,需要將審計(jì)結(jié)果以可視化形式體現(xiàn)出來(lái)。本文采用計(jì)算機(jī)圖像技術(shù)將審計(jì)結(jié)果轉(zhuǎn)換為圖形或圖像。平臺(tái)可視化設(shè)計(jì)包含兩個(gè)方面:可視化交互分析和可視化結(jié)果展示,前者可以完成審計(jì)知識(shí)的深入分析,后者可以將審計(jì)證據(jù)立體化呈現(xiàn)。以人工智能作為可視化設(shè)計(jì)的基礎(chǔ),模擬人類(lèi)智能處理隱性數(shù)據(jù)。并且,審計(jì)結(jié)果中包含的非結(jié)構(gòu)化文本,可以在可視化處理模式下,轉(zhuǎn)換為結(jié)構(gòu)化可視文本。利用數(shù)據(jù)結(jié)構(gòu)之間的關(guān)聯(lián),將時(shí)間標(biāo)簽和地理位置,以多態(tài)高維時(shí)空數(shù)據(jù)的形式展示出來(lái)。
審計(jì)平臺(tái)應(yīng)用過(guò)程中,預(yù)先設(shè)定審計(jì)主體的可能狀態(tài),并利用各種顏色和亮度將審計(jì)數(shù)據(jù)中包含的隱藏信息表現(xiàn)出來(lái)。以參數(shù)優(yōu)化為基礎(chǔ),構(gòu)建映射模型,實(shí)現(xiàn)抽象要素與具體要素的映射,獲取可視化結(jié)構(gòu)數(shù)據(jù)。采用圖形繪制的方式,應(yīng)用可視化工具可以將審計(jì)結(jié)果轉(zhuǎn)化為立體化目標(biāo)視圖。根據(jù)審計(jì)可視化結(jié)果,在完成目標(biāo)盤(pán)視圖評(píng)價(jià)的前提下,將審計(jì)大數(shù)據(jù)分析結(jié)果呈現(xiàn)出來(lái),保證審計(jì)疑點(diǎn)被提取出來(lái)。
在信息化迅速發(fā)展的時(shí)代背景下,Q省以審計(jì)廳為首的基層審計(jì)機(jī)關(guān)也開(kāi)始在審計(jì)活動(dòng)中引入大數(shù)據(jù)技術(shù),大大提升審計(jì)效率。本文以Q省已有的信息化建設(shè)為基礎(chǔ),搭建了大數(shù)據(jù)審計(jì)平臺(tái),并且以該省為平臺(tái)應(yīng)用試點(diǎn)單位,審計(jì)當(dāng)年公務(wù)支出公款消費(fèi)情況,對(duì)審計(jì)平臺(tái)應(yīng)用的過(guò)程和結(jié)果進(jìn)行分析。
確定審計(jì)目標(biāo)為Q省公務(wù)支出公款消費(fèi)情況,成立專(zhuān)門(mén)的審計(jì)工作組并提出審計(jì)計(jì)劃,運(yùn)用大數(shù)據(jù)審計(jì)平臺(tái)開(kāi)展審計(jì)行動(dòng)。本次審計(jì)過(guò)程中,需要以省財(cái)政廳的采購(gòu)指標(biāo)、預(yù)算編制等作為審計(jì)數(shù)據(jù),通過(guò)多部門(mén)的公務(wù)支出公款消費(fèi)數(shù)據(jù)對(duì)比得到質(zhì)量較高的審計(jì)結(jié)果。因此,平臺(tái)應(yīng)用過(guò)程中與省廳財(cái)政處、省外僑辦等多個(gè)機(jī)構(gòu)相聯(lián)系,采集審計(jì)所需數(shù)據(jù),如圖3所示。
圖3 數(shù)據(jù)采集
本次審計(jì)主要對(duì)比近3年的數(shù)據(jù)。根據(jù)圖3所示的幾個(gè)部分獲取相應(yīng)數(shù)據(jù),并完成審計(jì)數(shù)據(jù)歸集,作為大數(shù)據(jù)審計(jì)平臺(tái)工作的數(shù)據(jù)基礎(chǔ)。
針對(duì)上述采集的數(shù)據(jù)進(jìn)行處理。由于Q省公務(wù)支出公款消費(fèi)審計(jì)涉及多個(gè)部門(mén),每個(gè)部門(mén)的信息化建設(shè)有很大差異,使得采集到的數(shù)據(jù)格式多樣,造成審計(jì)效率較低。為保證審計(jì)數(shù)據(jù)采集質(zhì)量,選定專(zhuān)業(yè)人員監(jiān)督數(shù)據(jù)預(yù)處理工作,對(duì)于符合要求的數(shù)據(jù)直接保存到數(shù)據(jù)中心,對(duì)不符合要求的數(shù)據(jù)要求被審計(jì)單位重新提供。在大數(shù)據(jù)審計(jì)平臺(tái)內(nèi),利用審計(jì)數(shù)據(jù)轉(zhuǎn)換模塊依托SQL語(yǔ)句處理采集到的數(shù)據(jù),將來(lái)自不同部門(mén)的數(shù)據(jù)格式轉(zhuǎn)化為統(tǒng)一標(biāo)準(zhǔn),并將預(yù)處理后的數(shù)據(jù)保存至數(shù)據(jù)中心。數(shù)據(jù)處理完成后,匯總?cè)绫?所示。
表1 數(shù)據(jù)匯總 元
將上述數(shù)據(jù)輸入審計(jì)數(shù)據(jù)分析模型,通過(guò)數(shù)據(jù)挖掘的方式提取出審計(jì)疑點(diǎn)。由表1可知,Q省公務(wù)支出公款消費(fèi)主要包括公務(wù)招待、因公出國(guó)與公車(chē)運(yùn)行3個(gè)方面。相比其他兩項(xiàng),公車(chē)運(yùn)行費(fèi)用支出隨意性強(qiáng),對(duì)其監(jiān)督和管理較弱,因此,審計(jì)過(guò)程中以該部分為重點(diǎn)。具體數(shù)據(jù)分析中,又以部門(mén)維修費(fèi)支出情況、燃油費(fèi)支出變化情況,以及公車(chē)維修費(fèi)單車(chē)輪胎情況3項(xiàng)內(nèi)容的異常變化,作為審計(jì)重點(diǎn)。
在控制經(jīng)費(fèi)總體規(guī)模的情況下,分析部門(mén)維修費(fèi)支出變化。由于很多基層部門(mén)會(huì)將預(yù)算額度和預(yù)算指標(biāo)相混淆,對(duì)于車(chē)輛不變而維修費(fèi)變化較大的數(shù)據(jù),需要進(jìn)一步核實(shí)變化原因。2019-2021年部門(mén)維修費(fèi)用變化情況如圖4所示。
圖4 2019-2021年部門(mén)維修費(fèi)用變化情況
由圖4可知,X3部門(mén)2019年維修費(fèi)用支出與2020年、2021年維修費(fèi)用變化較大,需要思考年度維修費(fèi)用報(bào)銷(xiāo)是否存在遞延情況,也就是說(shuō)年度維修費(fèi)用結(jié)算的開(kāi)始與結(jié)束時(shí)間是否符合實(shí)際情況。并且,對(duì)于該部門(mén)2020年的費(fèi)用控制措施深入調(diào)查,分析部門(mén)維修費(fèi)用是否存在虛列支出或掛賬消費(fèi)的情況。
根據(jù)公車(chē)年度油耗特征,分析部門(mén)燃油費(fèi)支出情況,將油耗量特別大、特別小的數(shù)據(jù)作為審查疑點(diǎn)。由于可能會(huì)出現(xiàn)購(gòu)買(mǎi)油卡用于其他車(chē)輛的情況,審計(jì)人員需要對(duì)油卡購(gòu)買(mǎi)管理情況重點(diǎn)關(guān)注。近3年的燃油費(fèi)用支出變化如圖5所示。
圖5 2019-2021年燃油費(fèi)變化情況
由圖5可知,X3、X4部門(mén)的燃油費(fèi)支出變化存在明顯疑點(diǎn)。審計(jì)人員對(duì)單位油卡購(gòu)買(mǎi)賬冊(cè)重新查看,分析以上兩個(gè)部門(mén)購(gòu)買(mǎi)油卡的支出情況與單位的實(shí)際車(chē)輛消耗是否相符,從而得出審計(jì)結(jié)果,發(fā)出審計(jì)預(yù)警。
最后,對(duì)于Q省公車(chē)運(yùn)行數(shù)據(jù)中的輪胎維修次數(shù)進(jìn)行分析??偨Y(jié)車(chē)輛輪胎維修情況,近3年總價(jià)6 000元以上且單個(gè)輪胎2 000元以上的輪胎維修次數(shù)如圖6所示。
圖6 2019-2021年輪胎維修次數(shù)
由圖6可知,2020年輪胎維修次數(shù)明顯多于2019年和2021年,需要分析該年份車(chē)輛維修情況,并分析送去維修的車(chē)輛是否屬于本單位,從而明確車(chē)輛的維修費(fèi)是否符合實(shí)際支出情況。
將上述數(shù)據(jù)綜合考慮,結(jié)合分析結(jié)果和預(yù)設(shè)疑點(diǎn)發(fā)出審計(jì)預(yù)警。通過(guò)研究可知,本次平臺(tái)應(yīng)用案例中所呈現(xiàn)出的疑點(diǎn)主要分為2批,共包括26個(gè)模型500個(gè)以上的審計(jì)疑點(diǎn),關(guān)聯(lián)60多個(gè)基層部門(mén)。將上述審計(jì)疑點(diǎn)以相同的格式匯總,并根據(jù)疑點(diǎn)來(lái)源和進(jìn)一步核查結(jié)果,生成審計(jì)報(bào)告,完成審計(jì)平臺(tái)的整體應(yīng)用。
在以往的大數(shù)據(jù)平臺(tái)中,各部門(mén)數(shù)據(jù)之間具有較高的分散性,無(wú)法將信息價(jià)值完整地展現(xiàn)出來(lái)。本文設(shè)計(jì)的大數(shù)據(jù)審計(jì)平臺(tái),對(duì)采集的多個(gè)單位相關(guān)數(shù)據(jù)進(jìn)行處理分析,綜合數(shù)據(jù)內(nèi)容展開(kāi)審計(jì)活動(dòng)。經(jīng)測(cè)算本文平臺(tái)的數(shù)據(jù)離散程度保持在2%~5%,極大提升了大數(shù)據(jù)的使用價(jià)值。平臺(tái)通過(guò)數(shù)據(jù)的采集與轉(zhuǎn)換,提升了信息整合能力,有效提高了審計(jì)效率。
大數(shù)據(jù)技術(shù)的運(yùn)用有利于提高審計(jì)數(shù)據(jù)質(zhì)量,促進(jìn)審計(jì)業(yè)務(wù)流程創(chuàng)新。本文設(shè)計(jì)的大數(shù)據(jù)審計(jì)平臺(tái),通過(guò)數(shù)據(jù)中心、數(shù)據(jù)采集與轉(zhuǎn)換、數(shù)據(jù)分析模型完成整體數(shù)據(jù)審計(jì),表現(xiàn)出良好的工作性能。將大數(shù)據(jù)審計(jì)平臺(tái)在基層審計(jì)機(jī)關(guān)中推廣應(yīng)用,有利于提高基層審計(jì)效率,提升審計(jì)工作智能化水平,進(jìn)一步滿(mǎn)足基層審計(jì)機(jī)關(guān)日益提升的審計(jì)工作要求。