廣東科技學(xué)院 文 勇
在企業(yè)管理信息化環(huán)境下,錯(cuò)綜復(fù)雜的交易事項(xiàng)均可實(shí)時(shí)在線錄入,形成企業(yè)經(jīng)營(yíng)管理的數(shù)據(jù)倉(cāng)庫(kù)。審計(jì)對(duì)象由傳統(tǒng)的紙質(zhì)資料演變?yōu)殡娮訑?shù)據(jù),審計(jì)工作從傳統(tǒng)的關(guān)注數(shù)據(jù)真實(shí)可靠性審計(jì)發(fā)展到IT系統(tǒng)的安全性、內(nèi)部控制的完善有效性審查和評(píng)價(jià)。審計(jì)人員需從海量的數(shù)據(jù)中獲得充分、適當(dāng)?shù)膶徲?jì)證據(jù),發(fā)表恰當(dāng)?shù)膶徲?jì)意見。利用數(shù)據(jù)挖掘技術(shù)對(duì)原始信息和復(fù)雜問題進(jìn)行篩選,智能地發(fā)現(xiàn)蘊(yùn)藏在數(shù)據(jù)中的模式和規(guī)律,獲得并檢測(cè)事件,提供審計(jì)線索,降低審計(jì)成本和審計(jì)風(fēng)險(xiǎn),提高審計(jì)效率。
隨著ERP和電子商務(wù)的普及應(yīng)用,以現(xiàn)場(chǎng)人工操作為主的傳統(tǒng)審計(jì)方式已不能適應(yīng)網(wǎng)絡(luò)時(shí)代經(jīng)濟(jì)發(fā)展的需求,連續(xù)審計(jì)應(yīng)運(yùn)而生。連續(xù)審計(jì)是指審計(jì)人員無論何時(shí)何地,都可通過網(wǎng)絡(luò),訪問被審計(jì)單位的數(shù)據(jù)中心,開展實(shí)時(shí)在線審計(jì)。其過程包括數(shù)據(jù)采集、數(shù)據(jù)傳輸、數(shù)據(jù)存儲(chǔ)與數(shù)據(jù)處理四個(gè)階段。在數(shù)據(jù)處理環(huán)節(jié),可以運(yùn)用數(shù)據(jù)挖掘、在線分析處理等手段對(duì)采集到的海量數(shù)據(jù)進(jìn)行分析處理。限于篇幅,以下僅討論數(shù)據(jù)挖掘在審計(jì)分析中的運(yùn)用。
數(shù)據(jù)挖掘技術(shù)在審計(jì)分析中應(yīng)用的基本過程是:1.利用數(shù)據(jù)庫(kù)系統(tǒng)的數(shù)據(jù)導(dǎo)入導(dǎo)出功能、ODBC和審計(jì)軟件等方法采集被審計(jì)單位信息系統(tǒng)的數(shù)據(jù)。2.對(duì)數(shù)據(jù)進(jìn)行清洗、集成、轉(zhuǎn)換和規(guī)約等預(yù)處理工作。3.依據(jù)法規(guī)、財(cái)務(wù)業(yè)務(wù)處理邏輯、數(shù)據(jù)勾稽關(guān)系以及審計(jì)經(jīng)驗(yàn)等途徑構(gòu)建模型,從審計(jì)數(shù)據(jù)中提取信息和知識(shí),這是一個(gè)循環(huán)迭代的創(chuàng)新過程,要經(jīng)過多次的試驗(yàn)、反饋、修正,才能獲得一個(gè)高質(zhì)量的模型。4.對(duì)業(yè)務(wù)范圍、識(shí)別無效、數(shù)據(jù)異常等情況進(jìn)行事件統(tǒng)計(jì)。5.利用OLAP(聯(lián)機(jī)數(shù)據(jù)分析處理)工具對(duì)審計(jì)數(shù)據(jù)進(jìn)行切片、切塊、轉(zhuǎn)軸、上卷、下鉆等多方位、多角度的職業(yè)分析,以迅速找到審計(jì)線索并提出處理建議。
(一)分類和預(yù)測(cè) 分類是通過分析數(shù)據(jù)特征(如:結(jié)構(gòu)性指標(biāo)、盈利性指標(biāo)、現(xiàn)金流量指標(biāo)等),選擇訓(xùn)練樣本,構(gòu)建模型(即分類器),將數(shù)據(jù)劃分為不同的類別,并采取不同的審計(jì)策略。如:在存貨審計(jì)時(shí),根據(jù)重要性原則將存貨分為A、B、C三種類型,不同類型存貨確定不同的抽查規(guī)模。常用的分類算法有決策樹分類法、貝葉斯分類法、神經(jīng)網(wǎng)絡(luò)分類法、遺傳分類法、模糊集分類法、K-最近鄰分類法、粗糙集分類法等。預(yù)測(cè)是根據(jù)歷史資料找出規(guī)律,創(chuàng)建模型,并依模型預(yù)測(cè)未知的或缺省的數(shù)據(jù)值。當(dāng)預(yù)測(cè)值與審計(jì)值不一致甚至差異較大時(shí),可列為審計(jì)重點(diǎn)。如:在壞賬準(zhǔn)備審計(jì)時(shí),根據(jù)債務(wù)人的資信狀況、歷史數(shù)據(jù),賬齡分析,預(yù)測(cè)出的壞賬準(zhǔn)備與被審計(jì)單位實(shí)際計(jì)提的壞賬準(zhǔn)備存在較大差異時(shí),審計(jì)人員可能據(jù)此認(rèn)為壞賬準(zhǔn)備存在重大錯(cuò)報(bào)風(fēng)險(xiǎn),應(yīng)予以充分關(guān)注。
(二)聚類分析 聚類分析是根據(jù)同一聚類的對(duì)象相似,不同聚類對(duì)象相異的原理,將審計(jì)對(duì)象分成若干個(gè)群體(簇),它常用來檢測(cè)局外情況。如:在控制測(cè)試過程中,用聚類分析法進(jìn)行交易分組;在工程項(xiàng)目招標(biāo)的控制環(huán)節(jié)中,用聚類分析法構(gòu)造投標(biāo)人的評(píng)價(jià)指標(biāo)體系,對(duì)投標(biāo)人進(jìn)行量化考核和判別分類,為選擇投標(biāo)人提供客觀公正的參考意見;在客戶關(guān)系管理中,以客戶的消費(fèi)額或利潤(rùn)貢獻(xiàn)等為標(biāo)準(zhǔn),將客戶分為三個(gè)類別(即關(guān)鍵客戶群、主要客戶群、普通客戶群),并采取不同的營(yíng)銷策略和管理措施。
(三)關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)大量數(shù)據(jù)集合間有價(jià)值的聯(lián)系。在審計(jì)中,運(yùn)用關(guān)聯(lián)規(guī)則可以分析安全事件間的關(guān)聯(lián),檢測(cè)審計(jì)數(shù)據(jù)中存在的潛在關(guān)系,提高審計(jì)風(fēng)險(xiǎn)預(yù)警水平。如:根據(jù)客房數(shù)量、租金水平和空置率,可以檢查一棟酒店大樓租金收入的完整性;根據(jù)存貨進(jìn)、銷、存記錄以及產(chǎn)品產(chǎn)量與成本項(xiàng)目的聯(lián)系,可以檢查被審計(jì)單位成本費(fèi)用的合理性;利用相關(guān)賬戶余額、四大財(cái)務(wù)報(bào)表金額以及財(cái)務(wù)比率之間的勾稽關(guān)系,可以發(fā)現(xiàn)企業(yè)是否有假賬真做、真賬假做等現(xiàn)象。然而,關(guān)聯(lián)規(guī)則仍然可能得出某些數(shù)據(jù)關(guān)系的錯(cuò)誤判斷,主要原因是審計(jì)數(shù)據(jù)的時(shí)間效應(yīng)。為克服這種因素造成的風(fēng)險(xiǎn),加權(quán)關(guān)聯(lián)規(guī)則應(yīng)用到了審計(jì)業(yè)務(wù)中。
(四)序列模式 序列模式與關(guān)聯(lián)模式相似,但序列模式的對(duì)象是以時(shí)間的先后來區(qū)別的。在審計(jì)中,運(yùn)用序列分析找出被審計(jì)單位入侵行為的序列關(guān)系,發(fā)現(xiàn)隱藏在審計(jì)數(shù)據(jù)中有規(guī)律的事件序列模式。
(五)離群點(diǎn)挖掘 離群數(shù)據(jù)挖掘是從錯(cuò)綜復(fù)雜的數(shù)據(jù)中挖掘出不滿足一般模式或規(guī)律、行為異常的小部分?jǐn)?shù)據(jù)(即離群點(diǎn))的過程。離群點(diǎn)通常摻雜在高維數(shù)據(jù)的異常數(shù)據(jù)中,這些異常數(shù)據(jù)可能給企業(yè)帶來重大影響,如在賬表中的個(gè)別異常數(shù)據(jù)可能預(yù)示著企業(yè)的違規(guī)行為。通過運(yùn)用離群點(diǎn)挖掘算法,可有效地進(jìn)行審計(jì)數(shù)據(jù)預(yù)處理,快速定位可疑數(shù)據(jù),自動(dòng)提取管理模式和業(yè)務(wù)模式。所以,離群點(diǎn)挖掘在貸款審批、信用卡欺詐、電子商務(wù)犯罪、網(wǎng)絡(luò)入侵檢測(cè)、醫(yī)療分析、天氣預(yù)報(bào)等眾多領(lǐng)域得到成功應(yīng)用。但對(duì)于大規(guī)模動(dòng)態(tài)變化的高維數(shù)據(jù)集時(shí),離群點(diǎn)挖掘算法的計(jì)算量太大,耗的時(shí)間較多。因此,增量式離群點(diǎn)挖掘算法逐漸受到業(yè)界青睞。
(六)異常點(diǎn)檢測(cè) 異常點(diǎn)檢測(cè)是數(shù)據(jù)挖掘中常用的方法之一,它是從海量審計(jì)數(shù)據(jù)中挖掘出具有異常行為和特征的數(shù)據(jù)對(duì)象,主要應(yīng)用于低維數(shù)據(jù)空間,如IT系統(tǒng)入侵檢測(cè)、信用卡透支檢測(cè)等領(lǐng)域。
(七)孤立點(diǎn)檢測(cè) 孤立點(diǎn)檢測(cè)是一個(gè)重要的數(shù)據(jù)挖掘類型,用來發(fā)現(xiàn)與審計(jì)數(shù)據(jù)源中的異常值(即孤立點(diǎn))。審計(jì)中的可疑點(diǎn)通常表現(xiàn)為孤立點(diǎn),可能是數(shù)據(jù)變異(如:季節(jié)性生產(chǎn)的企業(yè),旺季銷量很可觀,而淡季銷量嚴(yán)重下滑,應(yīng)屬于正常情況。),也可能是執(zhí)行錯(cuò)誤或舞弊違規(guī)(如:某上市公司在某一年報(bào)中資產(chǎn)減值準(zhǔn)備出現(xiàn)很大變動(dòng),可能是企業(yè)利用短期資產(chǎn)減值準(zhǔn)備進(jìn)行盈余管理)。但是,并非全部孤立點(diǎn)均是錯(cuò)誤數(shù)據(jù)。所以,還需運(yùn)用檢查、觀察、詢問、函證、重新計(jì)算、重新執(zhí)行和分析程序等常規(guī)審計(jì)方法,并結(jié)合被審計(jì)單位實(shí)際情況,才能查找出相應(yīng)的錯(cuò)誤數(shù)據(jù)。
(一)調(diào)查評(píng)估被審計(jì)單位及其環(huán)境 運(yùn)用數(shù)據(jù)挖掘的分類方法從數(shù)據(jù)倉(cāng)庫(kù)中提取被審計(jì)單位信息,包括行業(yè)狀況、法律與市場(chǎng)環(huán)境、單位性質(zhì)、單位戰(zhàn)略、經(jīng)營(yíng)范圍、經(jīng)營(yíng)風(fēng)險(xiǎn)、會(huì)計(jì)政策、財(cái)務(wù)業(yè)績(jī)?cè)u(píng)價(jià)、業(yè)務(wù)處理流程以及IT系統(tǒng)的硬件、軟件、文檔資料和數(shù)據(jù)庫(kù)系統(tǒng)等。然后,用分類和預(yù)測(cè)方法分析歷史數(shù)據(jù)和經(jīng)營(yíng)指標(biāo),并通過對(duì)內(nèi)部控制、單位評(píng)分、財(cái)務(wù)比率等方面的關(guān)聯(lián)分析,尋找風(fēng)險(xiǎn)誘因,并以此為標(biāo)準(zhǔn),評(píng)估單位審計(jì)風(fēng)險(xiǎn)是否在可接受的水平。
(二)控制測(cè)試 控制測(cè)試的主要過程如下:(1)確定測(cè)試的程序。信息系統(tǒng)控制測(cè)試分為一般控制測(cè)試和應(yīng)用控制測(cè)試兩個(gè)方面。一般控制測(cè)試就是審查被審單位的各項(xiàng)控制是否健全以及執(zhí)行效果,包括:組織控制測(cè)試、程序開發(fā)與變更控制的測(cè)試、程序和數(shù)據(jù)訪問控制的測(cè)試、計(jì)算機(jī)運(yùn)行控制的測(cè)試等。應(yīng)用控制測(cè)試主要是針對(duì)信息系統(tǒng)程序控制進(jìn)行審查,包括:業(yè)務(wù)流程的測(cè)試、輸入、處理、輸出控制的測(cè)試等。通常先進(jìn)行一般控制測(cè)試,若發(fā)現(xiàn)一般控制存在嚴(yán)重簿弱環(huán)節(jié),則需增加應(yīng)用控制測(cè)試的工作量。在特殊情況下,也可以兩者同時(shí)測(cè)試。(2)確定測(cè)試對(duì)象。測(cè)試對(duì)象主要包括內(nèi)部控制系統(tǒng)的不足和關(guān)鍵控制環(huán)節(jié)。此時(shí),要在測(cè)試技術(shù)、測(cè)試難度、測(cè)試成本與測(cè)試效果等因素之間進(jìn)行權(quán)衡。(3)選擇測(cè)試工具和技術(shù)。比較著名的數(shù)據(jù)挖掘工具有:如國(guó)外的Visual Assurance(德勤公司)、COSO軟件(國(guó)際內(nèi)部審計(jì)師協(xié)會(huì))、IntelligentMiner(IBM公司)、QUEST(IBM公司Almaden研究中心)、Enterprise Miner(SAS公司)、MineSet(SGI公司和美國(guó)Standford大學(xué))、Clementine(SPSS公司)、DBMiner(加拿大Simon Fraser大學(xué))、Weka(新西蘭Waikato大學(xué))等,其中Weka是一款開源的數(shù)據(jù)挖掘工具,它功能強(qiáng)大,集成了大部分?jǐn)?shù)據(jù)挖掘算法,提供了可視化的界面,有較好的數(shù)據(jù)預(yù)處理功能,可以方便地進(jìn)行二次開發(fā)。國(guó)內(nèi)有Dminer(上海復(fù)旦德門公司)、Open Miner(東北大學(xué)軟件中心)、Geni-Sage DataMining Analysis System(天津天才博通公司)、Highway Decision Center(青島海爾青大公司)等數(shù)據(jù)挖掘工具。借助國(guó)外的數(shù)據(jù)挖掘工具,可以測(cè)試控制運(yùn)行的有效性和確定控制是否得到執(zhí)行,也可以用于各種交易事項(xiàng)、賬戶余額、財(cái)務(wù)報(bào)告披露的細(xì)節(jié)測(cè)試與實(shí)質(zhì)性分析程序。而國(guó)內(nèi)的數(shù)據(jù)挖掘工具主要用于安全審計(jì)中的具體數(shù)據(jù)挖掘。(4)設(shè)計(jì)測(cè)試方法與數(shù)據(jù)。在控制測(cè)試環(huán)節(jié)中,應(yīng)采用手工測(cè)試和計(jì)算機(jī)輔助測(cè)試相結(jié)合的方式。手工測(cè)試可采用觀察、詢問、檢查、重新執(zhí)行、穿行測(cè)試等方法,計(jì)算機(jī)輔助測(cè)試可采用平行模擬、集成測(cè)試、數(shù)據(jù)檢測(cè)、程序編碼審查與比較、跟蹤、快照、數(shù)據(jù)查詢、賬表分析、審計(jì)抽樣、統(tǒng)計(jì)分析、數(shù)值分析等方法。(5)進(jìn)行測(cè)試,分析和評(píng)價(jià)測(cè)試結(jié)果。分析評(píng)價(jià)每項(xiàng)控制措施的測(cè)試結(jié)果,進(jìn)而評(píng)價(jià)整個(gè)內(nèi)部控制系統(tǒng)的有效性,以確定實(shí)質(zhì)性測(cè)試的范圍。
(三)實(shí)質(zhì)性程序 在實(shí)質(zhì)性程序階段,審計(jì)人員綜合運(yùn)用數(shù)據(jù)挖掘方法對(duì)評(píng)估的被審單位重大錯(cuò)報(bào)風(fēng)險(xiǎn)實(shí)施細(xì)節(jié)測(cè)試和實(shí)質(zhì)性分析程序。包括:對(duì)財(cái)務(wù)報(bào)告及其所依據(jù)的賬簿、憑證記錄核對(duì)或調(diào)節(jié),對(duì)財(cái)務(wù)報(bào)告編制中所作的重大會(huì)計(jì)分錄與相關(guān)調(diào)整。借助于數(shù)據(jù)挖掘技術(shù)、計(jì)算機(jī)輔助審計(jì)技術(shù)和電子表格,審計(jì)人員能詳細(xì)審查海量數(shù)據(jù),快速篩選出隱藏的樣本,“洞察”到異常數(shù)據(jù)的死角,提高審閱大量交易的效率和效果。如:在存貨實(shí)質(zhì)性程序過程中,利用關(guān)聯(lián)規(guī)則、聚類分析等方法,將被審期間的存貨周轉(zhuǎn)率、毛利率、存貨與流動(dòng)資產(chǎn)總額之比等財(cái)務(wù)指標(biāo)與預(yù)算期望值、歷史數(shù)據(jù)、行業(yè)數(shù)據(jù)作比較,若結(jié)果在預(yù)期或正常的范圍內(nèi),則為存貨余額的“存在”、“完整性”、“計(jì)價(jià)與分?jǐn)偂闭J(rèn)定提供了有力的佐證,反之,則需實(shí)施更詳細(xì)的細(xì)節(jié)測(cè)試。在銷售與收款交易的實(shí)質(zhì)性程序階段,運(yùn)用孤立點(diǎn)檢測(cè)、離群點(diǎn)挖掘、關(guān)聯(lián)規(guī)則等方法,可以發(fā)現(xiàn)交易額大的銷售、未開銷售發(fā)票、憑證就記入總賬和報(bào)表的銷售、臨近年終的異常銷售等,為審計(jì)人員提供審計(jì)線索,以便進(jìn)一步追蹤調(diào)查,落實(shí)問題。
(四)完成審計(jì)工作和編制審計(jì)報(bào)告 審計(jì)人員在完成上述審計(jì)步驟后,還應(yīng)整理、評(píng)價(jià)審計(jì)證據(jù);復(fù)核審計(jì)工作底稿和財(cái)務(wù)會(huì)計(jì)報(bào)告,考慮期后事項(xiàng);匯總審計(jì)差異,提請(qǐng)被審單位調(diào)整或披露;與被審單位溝通,形成審計(jì)意見,編制審計(jì)報(bào)告;實(shí)施后續(xù)審計(jì)。在這個(gè)過程中,也可以借助于數(shù)據(jù)挖掘工具、計(jì)算機(jī)輔助審計(jì)軟件和電子表格自動(dòng)完成或輔助完成審計(jì)工作。
總之,數(shù)據(jù)挖掘式審計(jì)在我國(guó)尚處于初級(jí)階段,許多方面還需加強(qiáng)研究和完善。如:(1)在綜合利用已有的數(shù)據(jù)挖掘技術(shù)基礎(chǔ)上,開發(fā)出新的數(shù)據(jù)挖掘方法和算法,提高數(shù)據(jù)挖掘的效率和效果。特別是要?jiǎng)?chuàng)新數(shù)據(jù)采集方法和數(shù)據(jù)處理方法,使數(shù)據(jù)采集和處理更通用、更方便。如:傳統(tǒng)的數(shù)據(jù)挖掘算法面對(duì)TB級(jí)以上的海量審計(jì)數(shù)據(jù)集時(shí)顯得力不從心。云計(jì)算——這一具有具有超強(qiáng)計(jì)算能力、低能耗、低成本等優(yōu)勢(shì)的新型計(jì)算技術(shù)給數(shù)據(jù)挖掘式審計(jì)帶來了新的曙光,它解決了海量審計(jì)數(shù)據(jù)挖掘的高效計(jì)算與分布式存儲(chǔ)問題。因此,將已有的數(shù)據(jù)挖掘算法部署到云計(jì)算環(huán)境下實(shí)現(xiàn),探索新的基于云計(jì)算平臺(tái)的并行數(shù)據(jù)挖掘技術(shù),可以為更豐富、更復(fù)雜的海量審計(jì)數(shù)據(jù)挖掘問題提供新的理論和方法。(2)提高數(shù)據(jù)挖掘系統(tǒng)的適應(yīng)性和可維護(hù)性,當(dāng)被審計(jì)系統(tǒng)升級(jí)更新后,數(shù)據(jù)挖掘系統(tǒng)也能輕易地進(jìn)行修改調(diào)整。(3)建立健全審計(jì)檢測(cè)風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系,定量評(píng)價(jià)數(shù)據(jù)挖掘技術(shù)帶來的檢測(cè)風(fēng)險(xiǎn),將審計(jì)風(fēng)險(xiǎn)降至可接受的低水平。(4)XBRL在財(cái)務(wù)業(yè)務(wù)一體化的推廣和應(yīng)用是信息化潮流所向,構(gòu)建基于XBRL的數(shù)據(jù)挖掘模型,審計(jì)分析以XBRL格式表示的財(cái)務(wù)業(yè)務(wù)數(shù)據(jù)是一個(gè)具有現(xiàn)實(shí)意義的重大課題。(5)提高審計(jì)人員的綜合素質(zhì)。由于數(shù)據(jù)挖掘方法各式各樣,每種方法在運(yùn)用時(shí)都要綜合多學(xué)科的知識(shí)和技能,這就要求審計(jì)人員不但要精通審計(jì)業(yè)務(wù),掌握數(shù)據(jù)挖掘的技術(shù),而且還要熟練運(yùn)用數(shù)據(jù)挖掘工具,因此,技能培訓(xùn)就顯得尤為重要。
[1] 時(shí)現(xiàn)、李庭燎譯:《全球信息系統(tǒng)審計(jì)指南(下)》,中國(guó)時(shí)代經(jīng)濟(jì)出版社2010年版。
[2] 王會(huì)金:《中觀信息系統(tǒng)審計(jì)風(fēng)險(xiǎn)控制體系研究》,《審計(jì)與經(jīng)濟(jì)研究》2012年第1 期。
[3] 胡俊俊、孫靜:《一種新型的計(jì)算機(jī)審計(jì)模型》,《計(jì)算機(jī)工程與應(yīng)用》2008年第3 期。