蔡乙萍 舒若敏
摘 要:大數據審計是現代審計發(fā)展的必由之路,是國家治理體系和治理能力現代化的重要保證。目前,中國迫切需要一系列比較成熟的方法來構建大數據審計平臺,以滿足大數據時代智能審計的需要。大數據審計平臺的構建涉及審計理論、大數據科學、計算機科學等學科,具有各種適用技術和復雜的構建機制。本文將大數據審計平臺分為收集、預處理、分析和可視化四個子平臺。在方法支持、過程建模和運行機制的基礎上,對各子平臺進行了專題研究,旨在為大數據審計的實踐提供建設性思路。
關鍵詞:大數據審計 平臺構建 數據挖掘 過程建模
大數據審計是以大數據為背景的專業(yè)審計主體,根據具體規(guī)范,審計科學和大數據科學程序的使用和方法:通過大數據收集,開展獨立監(jiān)督活動,驗證重大財務事項,業(yè)務管理活動和被審計單位相關資料的可靠性。近年來,中國政府高度重視大數據審計的建設。 目前,中國迫切需要一系列豐富的大數據審計理論來指導實踐,從而大大提高審計主體利用信息方法挖掘問題的能力,從宏觀上進行評估,判斷和分析。 為此,本文在審計大數據采集,預處理,分析,可視化等模塊的基礎上,深入探討了大數據審計平臺的構建機制。
一、大數據審計平臺建設的理論分析
大數據審計平臺的構建遵循系統理論,結構理論,協同理論和控制理論的思想。大數據的關鍵技術涵蓋了收集,預處理,存儲和管理,分析和挖掘,演示和應用五個技術方面。大數據審計平臺涵蓋多個子平臺,按照具體邏輯進行集成。為大數據處理技術全面整合到大數據審計平臺建設,以平臺為視角展示大數據審計。在整個設計過程中,本文特別以分類為理論基礎的五大技術將分裂為大數據審計集,預處理,分析和可視化是一個研究的平臺,其中,內置的存儲技術建立子平臺時,必須發(fā)現具體審計的內在本質和邏輯規(guī)則基于細節(jié)深入系統地處理大數據對象,熟悉其任務需求。只有這樣才能完成相關子平臺的過程分解和功能分解,“主題技術數據庫”下的子科學建立平臺,有效選擇各子平臺的“過程建模小組”,在戰(zhàn)略層面上有效提升大數據審計整體平臺建設的質量和水平。基于跨學科理論的視角相互融合并通過四個平臺的分解,加強大數據分析的應用,嘗試在實際需求下應用于平臺的相應技術,全力以“應用技術組”為軸,比較分析不同的建模技術,有效地促進了審計實踐的大數據路由,抽象和智能化。
二、審計大數據采集平臺的建立和運行
在大數據時代,審計數據收集渠道得到了廣泛的擴展,主要涵蓋了互聯網平臺下的媒體信息,門戶網站和搜索報價。引擎和社交網絡數據;正在審查的單位的貨幣數據,以及一系列非貨幣數據,如業(yè)務戰(zhàn)略,技術研發(fā),社會關系,治理能力和組織環(huán)境;經驗數據,業(yè)務數據,管理 審計實體內的數據和預測數據;其他渠道,如日志數據,傳感器數據,經濟數據,行業(yè)數據,政策數據等。審計大數據不是上述渠道的分散收購和機械化,而是 在特定邏輯框架下整合指導本地化和有機集成。
三、審計大數據預處理平臺的建立和運行
審計大數據預處理平臺由數據存儲,提取,清理,轉換和加載等模塊組成。近年來,大數據存儲基礎審計采用傳統的存儲模式,審計主體應熟悉各種分布式存儲技術。其核心是網絡存儲技術,靈活高效的元數據管理,系統開發(fā),應用和負載存儲優(yōu)化,優(yōu)化,存儲層數據動態(tài)調度和優(yōu)化,數據災難以及存儲屬性等優(yōu)化技術。審計主體需要選擇適用的數據存儲子系統基于大數據結構的特點。對于結構化數據,采用分布式數據庫存儲。對于簡單的半結構化數據,采用分布式鍵值存儲。對于復雜的半結構化數據,采用分布式表存儲。對于視頻,圖片和其他非結構化數據,分布式文件存儲被采納。
審計大數據提取包括全量提取和增量提取。 全量提取是復制和遷移源數據庫中的所有數據并增加提取是基于前者從源表中提取新添加,刪除和修改的數據。 具體方法包括時間戳,觸發(fā)器,日志比較和全表比較。審計主體應建立適合他們的大數據提取方案。 例如,web標簽提取算法可用于結構化數據,基于本體的web標簽提取算法可用于半結構化數據,而基于規(guī)則的數據提取算法可用于非結構化數據。
四、建立審計大數據分析平臺
審計大數據分析平臺的構建必須依賴于過程建模,建模的動態(tài)因素包括:(1)分布式并行處理。審計主體在分布式并行處理系統的幫助下,海量目標數據可以分成塊,并由多臺計算機協同處理?;跁r間和空間的并行計算,可以同時執(zhí)行多條指令,從而及時擴展問題解決規(guī)模,解決復雜的審計計算問題。(2)引擎組件。審計主體可以使用云引擎來執(zhí)行應用程序設計各種功能,或使用相同的“云”來執(zhí)行不同要求的審計分析。工作流程是開發(fā)適用的過程邏輯,確保審計分析的靈活性,可維護性和穩(wěn)定性。審計主體需要通過基于流向管理,流程節(jié)點管理和流程樣本管理的芯片處理器來增強審計分析引擎,以促進審計分析的同步實施和效率優(yōu)化。(3)方法庫。(4)相關軟件工具。審計大數據分析平臺需要整合現有的成熟分析軟件,如SPSS,SAS,R語言等。
五、審計大數據可視化平臺的建立和運行
審計大數據可視化基于計算機輔助設計,圖像處理,信號處理,圖形,計算機視覺和其他學科。利用計算機圖形和圖像處理等相關技術,將審計大數據信息的內部結構轉換為圖形或圖像進行顯示,實現交互處理。
參考文獻
[1] 呂勁松,王志成等.2017.大數據環(huán)境下商業(yè)銀行審計非結構化數據研究[J].軟科學(1):141-144.
[2] 秦榮生.2014.大數據、云計算技術對審計的影響研究[J].審計研究(6):23-28.
[3] 王崇業(yè).2017.基于大數據的傳統財務報表持續(xù)審計模型重構[J].財會通訊(7):111-113.
[4] 魏建祥.2016.大數據環(huán)境下政府審計模式轉變[J].財會月刊(22):64-67.
[5] 張元鳴,陳苗等.2016.非結構化表格文檔數據抽取與組織模型研究[J].浙江工業(yè)大學學報(5):487-494.
[6] 鄭偉,張立民,楊莉.2016.試析大數據環(huán)境下的大數據審計模式[J].審計研究(4):20-27.