楊淑慧+潘德寶+徐芬+李磊
隨著中國(guó)人民銀行信息化水平的不斷提升,先后引入和升級(jí)了許多業(yè)務(wù)系統(tǒng),記錄和處理各項(xiàng)業(yè)務(wù)的經(jīng)營(yíng)狀況、處理活動(dòng),形成了各類業(yè)務(wù)數(shù)據(jù)庫(kù),儲(chǔ)存了海量業(yè)務(wù)數(shù)據(jù),大踏步邁入了大數(shù)據(jù)時(shí)代。面對(duì)大數(shù)據(jù)時(shí)代的到來(lái),各級(jí)人民銀行內(nèi)部審計(jì)部門要保持高度的危機(jī)意識(shí)、未雨綢繆,正確認(rèn)識(shí)大數(shù)據(jù)分析的理論核心數(shù)據(jù)挖掘技術(shù),逐步將數(shù)據(jù)挖掘技術(shù)引入人民銀行內(nèi)部審計(jì)工作。通過(guò)數(shù)據(jù)的全面掌握、挖掘技術(shù)的廣泛運(yùn)用,實(shí)現(xiàn)對(duì)風(fēng)險(xiǎn)的前瞻、全面、深入和持續(xù)的審計(jì)覆蓋,提高審計(jì)質(zhì)量,規(guī)避審計(jì)風(fēng)險(xiǎn),從更高層面為人民銀行業(yè)務(wù)發(fā)展提供更具戰(zhàn)略性、系統(tǒng)性和前瞻性的審計(jì)建議,改善組織運(yùn)營(yíng),增加組織價(jià)值。
一、基本概念
(一)大數(shù)據(jù)
大數(shù)據(jù)又稱巨量數(shù)據(jù),所涉及的數(shù)據(jù)量規(guī)模巨大到無(wú)法使用傳統(tǒng)工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理并整理成有價(jià)值的信息。大數(shù)據(jù)具有數(shù)據(jù)容量巨大、數(shù)據(jù)類型紛繁、數(shù)據(jù)價(jià)值密度低和處理速度要求快的特點(diǎn)。
大數(shù)據(jù)對(duì)內(nèi)部審計(jì)工作具有重要影響:一是促使審計(jì)方式向連續(xù)審計(jì)轉(zhuǎn)變。隨著信息技術(shù)迅速發(fā)展,連續(xù)審計(jì)的重要性日益凸顯,大數(shù)據(jù)技術(shù)及大數(shù)據(jù)基礎(chǔ)使連續(xù)審計(jì)成為可能,連續(xù)審計(jì)可以降低傳統(tǒng)審計(jì)過(guò)程中的時(shí)滯問(wèn)題,降低審計(jì)錯(cuò)誤和風(fēng)險(xiǎn),為組織提供咨詢?cè)鲋捣?wù);二是促進(jìn)審計(jì)抽樣向系統(tǒng)化、智能化和模塊化發(fā)展。數(shù)據(jù)量的爆炸式增長(zhǎng)使審計(jì)人員無(wú)法使用現(xiàn)行的抽樣審計(jì)方法揭示舞弊行為和技術(shù)性錯(cuò)誤。大數(shù)據(jù)時(shí)代的審計(jì)抽樣算法可以對(duì)審計(jì)數(shù)據(jù)進(jìn)行分析,進(jìn)行數(shù)據(jù)挖掘,找出特征數(shù)據(jù),縮小抽取樣本的數(shù)量,降低審計(jì)成本、提高審計(jì)效率;利用關(guān)聯(lián)規(guī)則,預(yù)測(cè)被審計(jì)單位運(yùn)營(yíng)風(fēng)險(xiǎn)的高低,幫助審計(jì)人員確定審計(jì)重點(diǎn),實(shí)現(xiàn)精確打擊;三是促進(jìn)審計(jì)成果的轉(zhuǎn)化與應(yīng)用。促進(jìn)對(duì)以往審計(jì)中獲取的大量信息資料的匯總、歸納,從中找出內(nèi)在規(guī)律、共性問(wèn)題和發(fā)展趨勢(shì),通過(guò)匯總歸納宏觀性和綜合性較強(qiáng)的審計(jì)信息,為領(lǐng)導(dǎo)決策提供依據(jù);通過(guò)對(duì)帶有共性、普遍性、傾向性的問(wèn)題進(jìn)行挖掘,提煉出問(wèn)題與數(shù)據(jù)中的關(guān)聯(lián)性,可以將所有問(wèn)題通過(guò)IT手段檢查出來(lái);將審計(jì)成果進(jìn)行知識(shí)化留存;通過(guò)大數(shù)據(jù)技術(shù),將問(wèn)題規(guī)則化并固化到系統(tǒng)中,以便于計(jì)算或判斷問(wèn)題發(fā)展趨勢(shì)、對(duì)問(wèn)題進(jìn)行預(yù)警等。
(二)數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(Data Mining,DM)是一種計(jì)算機(jī)輔助技術(shù),用于從海量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中抽取出潛在的、有效的、新穎的、有用的和最終可以理解的知識(shí)的過(guò)程,又稱數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)(Knowledge Discover of Database,KDD)。數(shù)據(jù)挖掘即能針對(duì)特定7876數(shù)據(jù)庫(kù)進(jìn)行簡(jiǎn)單的檢索和查詢,又能進(jìn)行多層次、全方位的統(tǒng)計(jì)、分析、綜合和推理,越來(lái)越多的組織開始對(duì)記錄交易活動(dòng)、經(jīng)營(yíng)狀況和市場(chǎng)信息的海量數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,從而獲得有價(jià)值的信息,提高組織的盈利水平和競(jìng)爭(zhēng)能力。審計(jì)人員可將具有相似性的會(huì)計(jì)數(shù)據(jù)進(jìn)行聚類分組,從而發(fā)現(xiàn)異常賬目。
二、大數(shù)據(jù)視角下的人民銀行內(nèi)部審計(jì)模型
根據(jù)人民銀行業(yè)務(wù)實(shí)際和大數(shù)據(jù)處理要求,構(gòu)建了由數(shù)據(jù)獲取、數(shù)據(jù)整理、數(shù)據(jù)挖掘和審計(jì)應(yīng)用四階段構(gòu)成的人民銀行大數(shù)據(jù)審計(jì)模型,模型流程如圖1。
圖1 人民銀行大數(shù)據(jù)審計(jì)模型
(一)數(shù)據(jù)獲取。人民銀行內(nèi)審部門應(yīng)結(jié)合轄區(qū)業(yè)務(wù)實(shí)際,積極開展風(fēng)險(xiǎn)評(píng)估工作,確定各業(yè)務(wù)風(fēng)險(xiǎn)排序,擬定審計(jì)主題,針對(duì)特定的審計(jì)目標(biāo)和審計(jì)內(nèi)容進(jìn)行廣泛而深入的審前調(diào)查,掌握審計(jì)的范圍、審計(jì)的內(nèi)容、審計(jì)所需的信息。根據(jù)審前調(diào)查情況,審計(jì)人員有目的性的收集和整理與審計(jì)相關(guān)的數(shù)據(jù),服務(wù)于審計(jì)項(xiàng)目。該階段審計(jì)人員在保證不影響被審計(jì)單位業(yè)務(wù)系統(tǒng)的平穩(wěn)、持續(xù)運(yùn)行前提下,采取諸如Microsoft SQL Server 2000等數(shù)據(jù)轉(zhuǎn)換工具,獲取、更新和維護(hù)審計(jì)相關(guān)數(shù)據(jù)。
(二)數(shù)據(jù)整理。該階段審計(jì)人員在充分分析數(shù)據(jù)質(zhì)量的情況下,運(yùn)用數(shù)據(jù)庫(kù)各表之間的勾稽關(guān)系,剔除垃圾數(shù)據(jù),清理、轉(zhuǎn)換、載入和驗(yàn)證提取的數(shù)據(jù),建立審計(jì)數(shù)據(jù)庫(kù)××,數(shù)據(jù)庫(kù)中的審計(jì)數(shù)據(jù)是集成的、一致的、高質(zhì)量的,便于后續(xù)審計(jì)工作的開展。數(shù)據(jù)庫(kù)是面向特定審計(jì)主題的,不同被審計(jì)單位的審計(jì)主題不同,因此審計(jì)人員要為不同審計(jì)對(duì)象設(shè)計(jì)不同的數(shù)據(jù)庫(kù)××,設(shè)計(jì)數(shù)據(jù)庫(kù)××包括數(shù)據(jù)庫(kù)××模型設(shè)計(jì)及數(shù)據(jù)處理設(shè)計(jì),是一個(gè)循環(huán)往復(fù)、不斷優(yōu)化的過(guò)程,需要不斷地反饋和不斷地完善。該階段審計(jì)人員主要任務(wù)是為采集到的審計(jì)數(shù)據(jù)建立一個(gè)獨(dú)立與被審計(jì)單位數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)××,提供適合聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘的數(shù)據(jù)存儲(chǔ)環(huán)境。
(三)數(shù)據(jù)挖掘。該階段審計(jì)人員可以使用簡(jiǎn)單分析和多維分析工具對(duì)數(shù)據(jù)庫(kù)××進(jìn)行數(shù)據(jù)分析,如:采用聯(lián)機(jī)分析處理的切塊、切片、旋轉(zhuǎn)和鉆取等技術(shù),對(duì)審計(jì)數(shù)據(jù)進(jìn)行比較分析、比率分析、趨勢(shì)分析等。但在海量數(shù)據(jù)情況下,審計(jì)人員必須采用諸如統(tǒng)計(jì)分析、決策樹、人工神經(jīng)網(wǎng)絡(luò)和關(guān)聯(lián)規(guī)則等數(shù)據(jù)挖掘算法,對(duì)數(shù)據(jù)庫(kù)××進(jìn)行數(shù)據(jù)挖掘。
1.選擇數(shù)據(jù)挖掘算法。不同數(shù)據(jù)挖掘算法的思路、步驟、功能和應(yīng)用領(lǐng)域不盡相同,審計(jì)人員應(yīng)根據(jù)審計(jì)主題選擇挖掘方法,以得到對(duì)審計(jì)有指導(dǎo)意義的知識(shí)。
2.建立數(shù)據(jù)挖掘模型。選擇數(shù)據(jù)挖掘算法后,從分析數(shù)據(jù)入手,從數(shù)據(jù)庫(kù)××中提取主要變量,剔除無(wú)關(guān)變量,建立適合該算法的數(shù)據(jù)挖掘模型。
3.驗(yàn)證數(shù)據(jù)挖掘模型。從數(shù)據(jù)庫(kù)××中選取多個(gè)樣本數(shù)據(jù),對(duì)挖掘模型進(jìn)行驗(yàn)證,確保數(shù)據(jù)挖掘模型實(shí)現(xiàn)既定審計(jì)目的。
4.運(yùn)行數(shù)據(jù)挖掘模型。挖掘模型的運(yùn)行由專業(yè)計(jì)算機(jī)工具完成,審計(jì)人員要認(rèn)真評(píng)估挖掘結(jié)果,判定挖掘結(jié)果的準(zhǔn)確性和有效性,保證挖掘結(jié)果得出正確審計(jì)結(jié)論。評(píng)估結(jié)果可能導(dǎo)致退回到之前的階段,重新選擇數(shù)據(jù)集合、數(shù)據(jù)挖掘算法或調(diào)整挖掘算法參數(shù)。
5.構(gòu)造審計(jì)知識(shí)庫(kù)。數(shù)據(jù)挖掘模型運(yùn)行后,會(huì)呈現(xiàn)隱藏在數(shù)據(jù)庫(kù)××中的一些規(guī)律或者展示異常審計(jì)數(shù)據(jù),這些規(guī)律或者異常稱之為審計(jì)知識(shí),不同的審計(jì)知識(shí)存儲(chǔ)在一起即構(gòu)成了審計(jì)知識(shí)庫(kù),審計(jì)人員利用審計(jì)知識(shí)提取審計(jì)線索或違規(guī)及風(fēng)險(xiǎn)情況。