郭芊菡 云南省澄江縣審計(jì)局
近年來,大數(shù)據(jù)在全球持續(xù)火熱地發(fā)展,成為了當(dāng)前全球重要的戰(zhàn)略性資源,大數(shù)據(jù)技術(shù)已成為各個(gè)行業(yè)未來發(fā)展的方向。隨著這一趨勢(shì)的演進(jìn),近年來,我國(guó)對(duì)大數(shù)據(jù)的發(fā)展、管理、利用和監(jiān)督工作越來越重視。2018年3月19日,胡澤君審計(jì)長(zhǎng)在部長(zhǎng)通道回答問題時(shí)指出,要“積極推進(jìn)大數(shù)據(jù)審計(jì),堅(jiān)持科技強(qiáng)審”,并在全國(guó)審計(jì)機(jī)關(guān)會(huì)議上再次要求各地審計(jì)工作者要“不斷強(qiáng)化大數(shù)據(jù)思維”。大數(shù)據(jù)審計(jì)將是數(shù)字化審計(jì)發(fā)展的必然趨勢(shì),也是審計(jì)人員應(yīng)對(duì)海量多元數(shù)據(jù)審計(jì)挑戰(zhàn)的“良方”。
雖然大數(shù)據(jù)技術(shù)為審計(jì)工作的開展提供了不少便利,但有時(shí)用數(shù)據(jù)材料計(jì)算出來的正確答案,不一定就是事實(shí)真相,近年來全球就出現(xiàn)了數(shù)個(gè)大數(shù)據(jù)分析預(yù)測(cè)失敗的案例。也就是說,有時(shí)數(shù)據(jù)也是會(huì)“騙人”的。2017年資深數(shù)據(jù)科學(xué)家Karolis Urbonas就曾以“用數(shù)據(jù)說謊”為題發(fā)表了相關(guān)文章,指出了三種用數(shù)據(jù)誤導(dǎo)人的方法,希望數(shù)據(jù)分析從業(yè)者引以為戒。因此,審計(jì)人員在大數(shù)據(jù)時(shí)代下應(yīng)用新技術(shù)提高審計(jì)效率的同時(shí),也要謹(jǐn)防數(shù)據(jù)分析中的陷阱,確保審計(jì)的真實(shí)性和有效性。
數(shù)據(jù)選擇性偏差是指在數(shù)據(jù)分析研究的過程中,因樣本數(shù)據(jù)選擇的偏向性或非隨機(jī)性導(dǎo)致分析結(jié)果存在的偏差,其本質(zhì)上是一種認(rèn)知傾向。數(shù)據(jù)分析人員在數(shù)據(jù)的選擇和收集時(shí),由于個(gè)人傾向或數(shù)據(jù)來源的因素,導(dǎo)致過分強(qiáng)調(diào)某一方面的數(shù)據(jù),而不顧其它潛在可能性的數(shù)據(jù),以至出現(xiàn)了所選擇的樣本不能代表全體的情況,這樣會(huì)使數(shù)據(jù)分析人員陷入樣本偏離的“陷阱”中,分析結(jié)果必然受數(shù)據(jù)樣本的片面性的影響而存在一定偏差,最終造成了數(shù)據(jù)分析資源的浪費(fèi)。
因此,審計(jì)部門的審計(jì)人員在面對(duì)異常龐大的數(shù)據(jù)資源時(shí),需要盡可能的去獲取完整的數(shù)據(jù)。但現(xiàn)實(shí)世界中的數(shù)據(jù)異常雜亂,數(shù)據(jù)缺失的情況經(jīng)常出現(xiàn)甚至不可避免。面對(duì)審計(jì)數(shù)據(jù)缺失不全的情況,審計(jì)人員要具體問題具體分析,可以通過最高頻數(shù)、屬性相關(guān)關(guān)系等手段來合理地填充缺失值,避免盲目刪除缺省值造成數(shù)據(jù)愈發(fā)不全。而當(dāng)基層審計(jì)部門的數(shù)據(jù)分析能力不足時(shí),數(shù)據(jù)可以進(jìn)行一定的抽樣選擇,審計(jì)者必須建立合理的樣本選擇模型,確保抽樣數(shù)據(jù)的隨機(jī)性不受個(gè)人傾向影響。
數(shù)據(jù)證實(shí)性偏見是一種經(jīng)典的心理誤導(dǎo)問題。數(shù)據(jù)分析人員本應(yīng)處于絕對(duì)客觀的角度進(jìn)行分析,但是當(dāng)數(shù)據(jù)分析人員事先存在某種假設(shè)或觀點(diǎn)時(shí),數(shù)據(jù)分析人員便會(huì)快速地從數(shù)據(jù)中尋找可證實(shí)該假設(shè)的證據(jù),用數(shù)據(jù)來配合假設(shè),在這種情況下,尋找到的第一個(gè)相關(guān)記錄就很有可能被當(dāng)做證據(jù),而忽視掉那些可能推翻我們?cè)居^點(diǎn)的信息。當(dāng)數(shù)據(jù)分析人員依照該思路進(jìn)行分析時(shí),如果事先的假設(shè)是存在欠缺的,那么這種偏見會(huì)將數(shù)據(jù)分析引入歧路,導(dǎo)致數(shù)據(jù)分析陷入證實(shí)性偏見之中。
在大數(shù)據(jù)審計(jì)時(shí)代,審計(jì)人員在審計(jì)工作中應(yīng)培養(yǎng)證偽意識(shí)和換位思考的能力,在審計(jì)準(zhǔn)備階段要制定好嚴(yán)格且客觀的審計(jì)要求。在驗(yàn)證疑點(diǎn)和假設(shè)時(shí),應(yīng)該全面地收集支持正反兩面結(jié)論的數(shù)據(jù)和證據(jù),有意識(shí)地從多角度看待問題,從反面去思考,去質(zhì)疑。這樣的話,結(jié)論會(huì)更加可靠,也會(huì)更接近真實(shí),從而避免證實(shí)性偏見的影響,確保審計(jì)證據(jù)和審計(jì)結(jié)果的準(zhǔn)確性。同時(shí),借助人工智能技術(shù),用“電腦”代替“人腦”進(jìn)行數(shù)據(jù)分析,也可有效地避免審計(jì)工作中“人腦”的主觀性,使審計(jì)結(jié)果更加貼近事實(shí)真相。
幸存者偏差,也叫“沉默的數(shù)據(jù)”,是數(shù)據(jù)分析過程中常見的邏輯錯(cuò)誤,指的是數(shù)據(jù)分析者只注意到經(jīng)過某種篩選而產(chǎn)生的結(jié)果,而沒有意識(shí)到篩選的過程所存在的問題,因此忽略了被篩選掉的關(guān)鍵信息。在大數(shù)據(jù)時(shí)代下開展審計(jì)分析工作,更要警惕幸存者偏差現(xiàn)象。隨著數(shù)據(jù)種類的豐富和數(shù)據(jù)量的激增,很容易讓人產(chǎn)生一種把握全局的錯(cuò)覺,從而迷失在大數(shù)據(jù)的海洋中。殊不知,我們面對(duì)的大數(shù)據(jù)也許僅能代表我們所關(guān)心的極小部分,以此為基礎(chǔ)分析得到的結(jié)論,無論技術(shù)方法有多么新穎,如果角度存在偏差,得到的結(jié)論就會(huì)“謬以千里”。
為避免在審計(jì)分析中出現(xiàn)幸存者偏差,審計(jì)人員要注重審前的調(diào)查研究,在審計(jì)準(zhǔn)備階段,對(duì)被審單位的業(yè)務(wù)工作和流程進(jìn)行深刻的認(rèn)識(shí)和理解,充分了解數(shù)據(jù)中重要的影響因素,如此,審計(jì)人員才能做出正確的判斷和預(yù)估。在審計(jì)數(shù)據(jù)分析過程中,審計(jì)人員要判斷樣本數(shù)據(jù)和剩余數(shù)據(jù)之間是否存在顯著差異,在取得了一定審計(jì)結(jié)論后,要通過分析剩余樣本數(shù)據(jù),驗(yàn)證審計(jì)結(jié)論。
在大數(shù)據(jù)時(shí)代,相關(guān)性數(shù)據(jù)分析的方法為大數(shù)據(jù)審計(jì)延展出了一系列新的視野,使人們看到了很多以前不曾注意到的聯(lián)系,數(shù)據(jù)間的相關(guān)性幫助我們更多、更深入地了解研究對(duì)象,甚至有不少人提出了“要相關(guān),不要因果”的口號(hào)。大數(shù)據(jù)挖掘背景下,相關(guān)性與因果性的討論仍在繼續(xù)。舍恩伯格在《大數(shù)據(jù)時(shí)代》中表示“要全體不要抽樣,要效率不要絕對(duì)精確,要相關(guān)不要因果”。而我國(guó)李國(guó)杰院士認(rèn)為:在大數(shù)據(jù)中,看起來毫不相關(guān)的兩件事同時(shí)或相繼出現(xiàn)的現(xiàn)象比比皆是,相關(guān)性本身并沒有多大價(jià)值,關(guān)鍵是找對(duì)了“相關(guān)性”背后的理由,才是新知識(shí)或新發(fā)現(xiàn)。
作為審計(jì)數(shù)據(jù)分析工作者,我們要明確用大數(shù)據(jù)得出的只是相關(guān)關(guān)系,而非因果關(guān)系。大數(shù)據(jù)的相關(guān)關(guān)系并沒有替代因果關(guān)系,相關(guān)性并不意味著因果性。大數(shù)據(jù)環(huán)境下,相關(guān)關(guān)系能告訴我們“是什么”,而因果關(guān)系可以告訴我們“為什么”。在大數(shù)據(jù)審計(jì)分析的過程中,我們不能僅僅停留在發(fā)現(xiàn)相關(guān)性上,更要繼續(xù)向更深層次研究因果關(guān)系,找出背后的為什么,這樣才能真正弄清問題背后的原因,才能通過大數(shù)據(jù)審計(jì)發(fā)現(xiàn)審計(jì)對(duì)象背后存在的真正問題。
在新的時(shí)代背景下,審計(jì)的環(huán)境也發(fā)生了翻天覆地的變化,大數(shù)據(jù)技術(shù)的運(yùn)用將對(duì)審計(jì)工作產(chǎn)生難以估量的推動(dòng)作用,大數(shù)據(jù)審計(jì)成為了審計(jì)工作的未來發(fā)展方向。作為基層審計(jì)工作者,我們要不斷加強(qiáng)大數(shù)據(jù)思維,提升大數(shù)據(jù)審計(jì)能力。同時(shí),在對(duì)數(shù)據(jù)量巨大、類型多樣的審計(jì)數(shù)據(jù)進(jìn)行分析時(shí),我們也要警惕這些常見的數(shù)據(jù)分析陷阱,不能因新科技所帶來的便利而產(chǎn)生思維惰性,要不斷強(qiáng)化大數(shù)據(jù)思維,保障審計(jì)方向的正確性,確保審計(jì)證據(jù)和審計(jì)結(jié)果的真實(shí)性和準(zhǔn)確性,更加有效地實(shí)現(xiàn)大數(shù)據(jù)技術(shù)運(yùn)用與審計(jì)工作的有機(jī)結(jié)合。