張婧婧
審計數(shù)據(jù)采集既是大數(shù)據(jù)審計的第一步,也是大數(shù)據(jù)審計成功開展的必要前提。審計數(shù)據(jù)采集不僅會影響對被審計單位的審計結(jié)論,還會影響整個審計項目資源的投入產(chǎn)出,做好審計數(shù)據(jù)采集具有至關(guān)重要的意義。在實際的數(shù)據(jù)采集中,應(yīng)著重注意以下幾個方面。
一、應(yīng)充分了解被審計單位信息系統(tǒng)。
在審計項目開展前的審前調(diào)查階段,應(yīng)著重對被審計單位信息系統(tǒng)進行詳細了解。一方面是財務(wù)系統(tǒng),區(qū)分清楚是代理記賬還是被審計單位自己記賬,如果是代理記賬,則可從財政系統(tǒng)統(tǒng)一采集;如果是自己記賬,就要了解被審計單位財務(wù)軟件,主要有財務(wù)軟件名稱、版本情況、后臺數(shù)據(jù)庫名稱及版本、近幾年是否升級、等級保護等一系列信息。另一方面是業(yè)務(wù)系統(tǒng),要了解被審計單位主要業(yè)務(wù)開展情況,所采用的信息系統(tǒng)名稱、版本類型、后臺數(shù)據(jù)庫名稱及版本、處理的主要業(yè)務(wù)、業(yè)務(wù)流程及流程圖、涉及的外部單位、等級保護等情況。審前調(diào)查時,可提前將要采集的上述兩類信息系統(tǒng)的要素制成表格,由被審計單位填報即可。
二、應(yīng)根據(jù)數(shù)據(jù)的實際情況選擇不用的采集方式
實際采集中,主要有以下SQL Server、Oracle、ACCESS三種數(shù)據(jù)庫,下面分別就以上三種數(shù)據(jù)庫,介紹一下不同的數(shù)據(jù)采集方式。
1、SQL Server數(shù)據(jù)庫。目前,大部分用友軟件、一部分金蝶軟件的后臺是SQL Server數(shù)據(jù)庫,SQL Server數(shù)據(jù)庫也是目前市場上比較成熟和穩(wěn)定的數(shù)據(jù)庫。被審計單位提供的SQL Server數(shù)據(jù)文件主要有兩種,一種是采用數(shù)據(jù)備份方式備份的數(shù)據(jù),文件后綴一般是.bak,采集時先將該數(shù)據(jù)還原在SQL Server數(shù)據(jù)庫中,之后再使用數(shù)據(jù)采集軟件連接SQL Server數(shù)據(jù)庫,進行數(shù)據(jù)采集即可;另一種是采用數(shù)據(jù)分離方式備份的數(shù)據(jù),主數(shù)據(jù)文件后綴一般是.mdf,日志文件后綴一般是.ldf,采集時先將主數(shù)據(jù)文件附加在SQL Server數(shù)據(jù)庫中,之后再使用數(shù)據(jù)采集軟件采集即可。同時,采集時應(yīng)注意數(shù)據(jù)庫的版本問題,目前大部分單位使用的SQL Server 2008R2,如果還原時出現(xiàn)“架構(gòu)不一致”等類似問題,一般是數(shù)據(jù)庫版本與當前數(shù)據(jù)庫版本不一致所致,此時就需要調(diào)整當前數(shù)據(jù)庫。
2、Oracle數(shù)據(jù)庫。Oracle數(shù)據(jù)庫是目前世界上流行最廣的一款關(guān)系數(shù)據(jù)庫管理系統(tǒng),具有系統(tǒng)可移植性好、使用方便、功能強大、高效可靠的優(yōu)點,所以一些大型企事業(yè)單位一般采用Oracle數(shù)據(jù)庫。Oracle數(shù)據(jù)庫的備份方式分為普通備份和數(shù)據(jù)泵備份,備份數(shù)據(jù)的數(shù)據(jù)文件后綴一般為.dmp,日志文件后綴一般為.log,還原時,要根據(jù)被審計單位的備份方式選擇還原方式,最好能夠保證還原方式與備份方式一致,成功率較高。若被審計單位采用的數(shù)據(jù)泵備份方式,還必須要求被審計單位提供數(shù)據(jù)備份時建表空間的語句、建用戶的語句以及數(shù)據(jù)字典,便于快速還原,減少調(diào)試過程。
3、ACCESS數(shù)據(jù)庫。由于ACCESS數(shù)據(jù)庫本身的局限性,近幾年,使用ACCESS數(shù)據(jù)庫的財務(wù)軟件較少,主要是一部分金蝶財務(wù)軟件和其他財務(wù)軟件。ACCESS數(shù)據(jù)庫的備份文件一般為.mdb或者.ais,此類文件一般直接通過數(shù)據(jù)采集軟件直接采集即可。采集中經(jīng)常出現(xiàn)數(shù)據(jù)加密、缺少模板等問題,需要根據(jù)實際情況進行數(shù)據(jù)解密或者增加模板。
三、應(yīng)注意在數(shù)據(jù)采集過程預(yù)判預(yù)防風(fēng)險
數(shù)據(jù)采集是大數(shù)據(jù)審計的第一步,從審計數(shù)據(jù)采集的維度來看,審計人員在開展大數(shù)據(jù)審計工作時需要采集的數(shù)據(jù)分為財務(wù)數(shù)據(jù)、外部數(shù)據(jù)和審計知識三部分。被審計單位的財務(wù)數(shù)據(jù)可以通過被審計單位人員自行上報、內(nèi)網(wǎng)傳輸以及審計人員現(xiàn)場采集等方式進行采集,在內(nèi)容上主要體現(xiàn)為被審計單位財務(wù)軟件的數(shù)據(jù)庫,具體包含了被審計單位的憑證庫、各類臺賬、報表等。外部數(shù)據(jù)可以利用大數(shù)據(jù)爬蟲技術(shù)實施采集,例如可以在本級財政局官網(wǎng)上爬取所有被審計單位公示的“三公經(jīng)費”數(shù)據(jù)等。審計知識的調(diào)用則是通過內(nèi)部傳輸實施采集,審計人員應(yīng)當只有復(fù)制審計知識的權(quán)限。
對于審計證據(jù)而言,無論使用何種取證方式,數(shù)據(jù)的真實性是一切的基礎(chǔ)。被審計單位的結(jié)構(gòu)化數(shù)據(jù)往往形式上真實性相對較高,但是卻存在著由于主、客觀因素導(dǎo)致的數(shù)據(jù)缺失和錯報;而從互聯(lián)網(wǎng)、外部機構(gòu)獲取的非結(jié)構(gòu)化數(shù)據(jù),例如社交媒體、視頻、行業(yè)總體調(diào)研報告,來源更為龐雜,則更需要進行有效的甄別和驗證。因此,審計數(shù)據(jù)采集主要存在數(shù)據(jù)質(zhì)量、數(shù)據(jù)獲取、數(shù)據(jù)安全的風(fēng)險,導(dǎo)致在審計的過程中因為數(shù)據(jù)鏈不完善、數(shù)據(jù)不真實而降低審計效率、影響審計結(jié)果。
具體來看,數(shù)據(jù)質(zhì)量方面的風(fēng)險包括審計人員未對數(shù)據(jù)的準確性、完整性、一致性、唯一性、適時性、有效性進行檢查、驗證,導(dǎo)致出現(xiàn)虛假數(shù)據(jù)和錯誤數(shù)據(jù)。數(shù)據(jù)獲取方面的風(fēng)險包括審計人員采集數(shù)據(jù)時,采集不屬于審計范圍內(nèi)的數(shù)據(jù),向他人泄露被審計單位的秘密,或者進行其他非法行為。數(shù)據(jù)安全方面的風(fēng)險包括數(shù)據(jù)安全防護不到位,使用非專用設(shè)備對數(shù)據(jù)進行處理或傳輸過程,造成數(shù)據(jù)被網(wǎng)絡(luò)攻擊導(dǎo)致數(shù)據(jù)被泄露、破壞、丟失。實際操作過程中,要根據(jù)以上可能存在的風(fēng)險進行提前預(yù)判和防范。
四、應(yīng)與被審計單位相關(guān)人員充分溝通
審計數(shù)據(jù)采集時,一般情況下第一次采集的成功率在70%左右,有近三分之一的數(shù)據(jù)會出現(xiàn)不同的問題,有些是備份方式不對、有些是沒有按照要求備份、有些備份不完整、有些數(shù)據(jù)格式不對等等。遇到問題時,要與被審計單位積極溝通,明確告知被審計單位數(shù)據(jù)采集要求,明確所要采集的數(shù)據(jù)基本格式、一般后綴和大小等信息。此外,要求被審計單位要既采集后臺數(shù)據(jù)庫數(shù)據(jù)、也采集財務(wù)軟件前臺數(shù)據(jù),前臺數(shù)據(jù)留作備用,減少再次進行采集的時間和成本,盡可能提高一次性采集成功率。
此外,特別要強調(diào)的是,數(shù)據(jù)采集時,數(shù)據(jù)采集人員可能能夠接觸到被審計單位方方面面的數(shù)據(jù),既有財務(wù)數(shù)據(jù)也有業(yè)務(wù)數(shù)據(jù),甚至是涉密數(shù)據(jù),因此要牢固樹立數(shù)據(jù)安全意識和數(shù)據(jù)保密意識。做到只采集需求數(shù)據(jù)、只通過規(guī)定計算機進行數(shù)據(jù)采集、只用光盤不用U盤等容易攜帶病毒的存儲介質(zhì),對每天接收的數(shù)據(jù)進行采集整理后存入保險柜,非相關(guān)人員不得接近被審計單位數(shù)據(jù),從而做到對自己負責(zé)、對單位負責(zé)、對被審計單位的數(shù)據(jù)負責(zé)。