謝景偉 程華安
(1.湖南大眾傳媒職業(yè)技術(shù)學(xué)院財務(wù)建設(shè)處,湖南長沙410100;2.湖南大眾傳媒職業(yè)技術(shù)學(xué)院管理學(xué)院,湖南長沙410100)
基于數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)的計算機審計模型構(gòu)建
謝景偉1程華安2
(1.湖南大眾傳媒職業(yè)技術(shù)學(xué)院財務(wù)建設(shè)處,湖南長沙410100;2.湖南大眾傳媒職業(yè)技術(shù)學(xué)院管理學(xué)院,湖南長沙410100)
利用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)建立計算機審計模型,解決了數(shù)據(jù)存儲量的問題,數(shù)據(jù)倉庫按照多維數(shù)據(jù)集的方式存儲數(shù)據(jù),并建立索引,審計人員可以高效、快速地訪問被審計單位的數(shù)據(jù);同時,采用數(shù)據(jù)挖掘技術(shù),可以對審計數(shù)據(jù)進行全方位、多角度、深層次的分析,快速發(fā)現(xiàn)審計線索,提高審計人員工作效率,是對傳統(tǒng)審計模型的一次突破。
數(shù)據(jù)倉庫;數(shù)據(jù)挖掘技術(shù);審計模型;構(gòu)建
隨著計算機技術(shù)的廣泛應(yīng)用,高職院校的內(nèi)部審計工作也由傳統(tǒng)的手工審計向計算機審計轉(zhuǎn)變,審計人員能通過軟件獲取所需的審計數(shù)據(jù),但憑個人的經(jīng)驗面對審計軟件提取的大量數(shù)據(jù)有點無能為力,這對保證審計質(zhì)量增加了一定的風(fēng)險。如何通過計算機技術(shù)幫助審計人員從海量數(shù)據(jù)中提取審計所需要的信息,利用數(shù)據(jù)之間隱藏的關(guān)系發(fā)現(xiàn)問題進行重點審計,提高審計質(zhì)量,達(dá)到審計目的,是亟待解決的問題。本文探討如何利用數(shù)據(jù)倉庫技術(shù)和數(shù)據(jù)挖掘技術(shù)為審計人員快速、準(zhǔn)確地提供數(shù)據(jù)的綜合信息,構(gòu)建計算機審計模型,以加快審計速度,提高審計質(zhì)量。
(一)數(shù)據(jù)倉庫技術(shù)
一般審計軟件的數(shù)據(jù)庫大多是以表格的形式存儲日常處理過程中產(chǎn)生的數(shù)據(jù),審計人員能按需求進行簡單的存儲、分析、查詢等操作。但隨著電子技術(shù)特別是計算機技術(shù)的飛速發(fā)展,單位業(yè)務(wù)基本都通過計算機來完成,加之業(yè)務(wù)量不斷增大,需要處理的數(shù)據(jù)不斷增加,信息更加復(fù)雜,傳統(tǒng)的數(shù)據(jù)庫已不能滿足復(fù)雜的數(shù)據(jù)分析、處理的要求。對不同類型的數(shù)據(jù)進行分離、存儲,特別是將分析型數(shù)據(jù)和操作型數(shù)據(jù)分離,對分析型數(shù)據(jù)按照審計的需要進行二次處理,建立相對獨立的分析環(huán)境,對數(shù)據(jù)進行分析,就形成了數(shù)據(jù)倉庫。它著重于數(shù)據(jù)的綜合分析,是圍繞著審計主題的數(shù)據(jù)存儲介質(zhì)。倉庫中的數(shù)據(jù)是相對穩(wěn)定、高度集中的,能按照審計主題進行組織,隨時間的變化不斷更新。數(shù)據(jù)倉庫以存儲的數(shù)據(jù)為基礎(chǔ),利用多種數(shù)據(jù)處理工具完成重要信息的提取,以滿足不同審計主題對于分析型數(shù)據(jù)的要求,能擴大數(shù)據(jù)的存儲,并加強數(shù)據(jù)管理,保證數(shù)據(jù)的完全一致性,支持多種方式的分析,由管理部分、存儲部分和應(yīng)用部分組成。
(二)數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù)是從數(shù)據(jù)庫、數(shù)據(jù)倉庫等數(shù)據(jù)存儲介質(zhì)中挖掘隱含的、潛在的、有用的知識,以輔助決策或更新原有知識,它是一個完整、可重復(fù)的過程。它通過明確業(yè)務(wù)、數(shù)據(jù)的選取、預(yù)處理、轉(zhuǎn)換、挖掘、分析等過程,發(fā)現(xiàn)數(shù)據(jù)的關(guān)聯(lián)關(guān)系,對數(shù)據(jù)進行分類、預(yù)測、聚類,發(fā)現(xiàn)孤立點,發(fā)現(xiàn)數(shù)據(jù)的規(guī)律和趨勢,從而在未被發(fā)現(xiàn)或者沒有明確假設(shè)條件的情況下發(fā)現(xiàn)知識,挖掘有用信息。
由此看來,如果將兩者結(jié)合起來,在數(shù)據(jù)倉庫中運用數(shù)據(jù)挖掘技術(shù)可以產(chǎn)生更好的分析結(jié)果,發(fā)現(xiàn)更復(fù)雜、更有價值的信息。兩者相輔相成又各有差異,數(shù)據(jù)倉庫技術(shù)的發(fā)展促使數(shù)據(jù)挖掘技術(shù)的發(fā)展,但數(shù)據(jù)挖掘技術(shù)不一定必須依賴于數(shù)據(jù)倉庫技術(shù),它也可直接從審計軟件的數(shù)據(jù)庫或其他存儲介質(zhì)中挖掘數(shù)據(jù)。若將兩者結(jié)合應(yīng)用,將使數(shù)據(jù)挖掘更加精、準(zhǔn)、快。
如前所述,將數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)結(jié)合起來,針對現(xiàn)有計算機審計模型的不足,能夠構(gòu)建出適合現(xiàn)有審計環(huán)境的新型計算機審計模型,提高審計質(zhì)量和服務(wù)效率(見下圖)。
圖 基于數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)的計算機審計模型
該模型主要由信息收集系統(tǒng)、數(shù)據(jù)倉庫、分析系統(tǒng)和數(shù)據(jù)服務(wù)系統(tǒng)組成。
(一)信息收集系統(tǒng)
主要是在審計前期階段通過不同途徑廣、快、精、準(zhǔn)地獲取各類審計信息,包括初始電子數(shù)據(jù)、初始紙質(zhì)數(shù)據(jù)、初始外部數(shù)據(jù),收集好后進行簡單的處理,為數(shù)據(jù)倉庫提供基礎(chǔ)數(shù)據(jù)。
(二)審計數(shù)據(jù)倉庫
主要是對信息系統(tǒng)中提取的信息進行清理、轉(zhuǎn)換、載入等處理,并將這些信息按審計主題進行存儲,同時將這些信息按審計主題的需要,多角度、多層次地以交叉表、直方圖等多種形式展現(xiàn)出來,為審計分析做好準(zhǔn)備。
(三)審計分析系統(tǒng)
主要由簡單分析工具、多維分析工具、挖掘模塊和知識庫組成。其中簡單分析工具主要借鑒查詢和統(tǒng)計技術(shù),為審計提供報表分析和數(shù)據(jù)查詢;多維分析工具主要采用統(tǒng)計圖形、多維方式的報表顯示數(shù)據(jù),便于審計中對數(shù)據(jù)進行逐層細(xì)化和深入分析;挖掘模塊主要集中了該技術(shù)中的多種算法,將不同算法按類進行封裝,方便按審計主題調(diào)用數(shù)據(jù);知識庫主要是利用庫中已存儲的審計規(guī)則、挖掘出的有效數(shù)據(jù)、審計人員的審計經(jīng)驗積累等為審計快速發(fā)現(xiàn)有價值數(shù)據(jù)提供幫助。
(四)審計數(shù)據(jù)服務(wù)
主要是對審計分析系統(tǒng)中所獲取的數(shù)據(jù)進行評價,按照審計主題,確定審計重點,分析結(jié)果展示,形成審計報告。
(一)信息收集系統(tǒng)
信息收集系統(tǒng)是模型中計算機審計的輸入系統(tǒng),它由不同的數(shù)據(jù)服務(wù)器組成。被審計單位的所有信息,按照獲取的方式、來源、類型不同,系統(tǒng)將這些信息進行分類后,裝入不同的數(shù)據(jù)服務(wù)器,為審計過程中獲取有用數(shù)據(jù)清除障礙。該系統(tǒng)的數(shù)據(jù)按來源不同采用不同的方式獲取。
1.內(nèi)部信息。如果審計單位和被審計單位使用的系統(tǒng)相同,則只需將兩個系統(tǒng)對接,采用直接讀取數(shù)據(jù)的方式即可。若雖系統(tǒng)不同,但審計單位的信息系統(tǒng)可以直接訪問被審計單位信息系統(tǒng)的數(shù)據(jù)庫,也可采用直接讀取數(shù)據(jù)的方式。如果不能采用上述兩種方式,則需要采用專用的導(dǎo)入導(dǎo)出工具將不同類型的數(shù)據(jù)先轉(zhuǎn)換成標(biāo)準(zhǔn)格式的數(shù)據(jù),然后再轉(zhuǎn)換成審計信息系統(tǒng)所需格式的數(shù)據(jù)。
2.外部信息。將外部信息轉(zhuǎn)換成標(biāo)準(zhǔn)格式,壓縮、加密后通過網(wǎng)絡(luò)傳輸,再將其解壓,利用轉(zhuǎn)換工具將其轉(zhuǎn)換成系統(tǒng)所需的格式。
3.移動存儲介質(zhì)上的信息。一般是按標(biāo)準(zhǔn)格式存儲的,只需利用轉(zhuǎn)換工具將其轉(zhuǎn)換成系統(tǒng)所需的格式即可。
(二)數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是該模型中的重要組成部分,是對數(shù)據(jù)進行存儲、分類、簡單分析的場所。審計人員需根據(jù)不同的審計主題設(shè)計不同的數(shù)據(jù)倉庫,按類進行存儲,提供相對獨立的環(huán)境,使數(shù)據(jù)能不斷循還往復(fù)、不斷反饋、不斷完善地進行處理和分析。
1.數(shù)據(jù)倉庫模型的設(shè)計。一是確定審計主題,審計人員需對審計業(yè)務(wù)進行歸納,確定數(shù)據(jù)倉庫的主題,并對其進行審計事實的描述和對事實信息屬性的描述。二是對邏輯模型進行設(shè)計,設(shè)計的數(shù)據(jù)倉庫需保證存儲量足夠且不能降低查詢效率。三是對物理模型進行設(shè)計,以確定數(shù)據(jù)的存儲位置和索引策略,按照不同的審計主題確定存儲位置并設(shè)計索引字段,為下一步的數(shù)據(jù)查找提供方便。
2.數(shù)據(jù)倉庫數(shù)據(jù)處理的設(shè)計。一是數(shù)據(jù)清理,主要是指對不規(guī)范、不完整、不合理、冗余的數(shù)據(jù)按照規(guī)范的格式謹(jǐn)慎進行清理,一般對不同類型的數(shù)據(jù)采用不同的工具進行清理,常見的清理工具有Excel、審計軟件、SQL Server、SQL查詢語言等。對于不完整的數(shù)據(jù)通過手工輸入進行糾正。對于錯誤值,利用統(tǒng)計分析中的偏差分析、回歸分析、常識性規(guī)則庫、簡單規(guī)則庫檢查數(shù)值進行糾錯。二是數(shù)據(jù)轉(zhuǎn)換,指對清理出來的數(shù)據(jù)在數(shù)據(jù)倉庫中找到合適的轉(zhuǎn)換工具,將操作型數(shù)據(jù)轉(zhuǎn)換成分析型數(shù)據(jù),為審計分析做好準(zhǔn)備。三是數(shù)據(jù)驗證,指審計人員對數(shù)據(jù)的真實性、完整性進行驗證,確保審計分析可靠。常用的數(shù)據(jù)驗證主要有4種方式,利用不同的業(yè)務(wù)規(guī)則、數(shù)據(jù)關(guān)系完整性、統(tǒng)計抽樣、數(shù)據(jù)記錄的總量或主要變量的統(tǒng)計等指標(biāo)進行驗證。
3.多維數(shù)據(jù)庫的設(shè)計。經(jīng)過處理的數(shù)據(jù)一般以二維的結(jié)構(gòu)存儲在數(shù)據(jù)倉庫中,這就需要審計人員利用聯(lián)機分析工具將這些數(shù)據(jù)處理成多維數(shù)據(jù)集存入多維數(shù)據(jù)倉庫,以便查詢分析。
(三)數(shù)據(jù)挖掘
對于一般的數(shù)據(jù),審計人員只需按照審計主題設(shè)置一定的篩選條件,采用聯(lián)機分析處理技術(shù)對審計數(shù)據(jù)進行分析,并將分析結(jié)果以數(shù)據(jù)和圖表的形式展示出來,快速地實現(xiàn)審計分析。對于復(fù)雜的數(shù)據(jù),審計人員需要掌握更多的計算機挖掘算法,建立挖掘模塊,按照主題的要求選擇合理的挖掘算法,找出有價值的線索,常用的算法有決策樹法、統(tǒng)計分析法、關(guān)聯(lián)規(guī)則法、人工神經(jīng)網(wǎng)絡(luò)法等。審計數(shù)據(jù)經(jīng)數(shù)據(jù)挖掘模塊處理后,數(shù)據(jù)之間將會存在一定的關(guān)系,主要表現(xiàn)為呈現(xiàn)出一定的規(guī)律或異常,通常把它叫作“知識”,對審計知識進行存儲的系統(tǒng)叫“知識庫”。知識庫中不但存儲了大量審計事實,還包含審計規(guī)則和處理機制,審計人員可以直接采用里面的信息進行審計推理,從而得出審計結(jié)論。
綜上所述,利用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)建立計算機審計模型,解決了數(shù)據(jù)存儲量的問題,數(shù)據(jù)倉庫按照多維數(shù)據(jù)集的方式存儲數(shù)據(jù),并建立索引,審計人員可以高效、快速地訪問被審計單位的數(shù)據(jù);同時,采用數(shù)據(jù)挖掘技術(shù),可以對審計數(shù)據(jù)進行全方位、多角度、深層次的分析,快速發(fā)現(xiàn)審計線索,提高審計人員工作效率,是對傳統(tǒng)審計模型的一次突破。
(責(zé)任編輯陶新艷)
F239
A
1671-5454(2016)02-0082-03
10.16261/j.cnki.cn43-1370/z.2016.02.023
2016-04-21
謝景偉(1978-),男,湖南望城人,湖南大眾傳媒職業(yè)技術(shù)學(xué)院副教授,研究方向:計算機及應(yīng)用技術(shù)研究。程華安(1978-),女,湖南華容人,湖南大眾傳媒職業(yè)技術(shù)學(xué)院副教授,研究方向:財務(wù)管理應(yīng)用研究。
本文為湖南教育科學(xué)規(guī)劃“十二五”課題研究項目“基于數(shù)字湖南視覺下高職院校計算機審計應(yīng)用研究”(編號:XJK011CZJ084)的研究成果。