陳 偉
近年來,大數(shù)據(jù)技術(shù)的研究與發(fā)展為審計(jì)工作帶來了機(jī)遇和挑戰(zhàn),目前國(guó)內(nèi)外高度關(guān)注大數(shù)據(jù)技術(shù)在審計(jì)工作中的應(yīng)用。2015年12月中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)的《關(guān)于實(shí)行審計(jì)全覆蓋的實(shí)施意見》指出“要求構(gòu)建大數(shù)據(jù)審計(jì)工作模式”;2017年3月中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)的《關(guān)于深化國(guó)有企業(yè)和國(guó)有資本審計(jì)監(jiān)督的若干意見》提出“創(chuàng)新審計(jì)理念,完善審計(jì)監(jiān)督體制機(jī)制,改進(jìn)審計(jì)方式方法”;國(guó)際內(nèi)部審計(jì)師協(xié)會(huì)2017年發(fā)布了《理解與審計(jì)大數(shù)據(jù)》指南(GTAG,2017);美國(guó)注冊(cè)會(huì)計(jì)師協(xié)會(huì)(American Institute of Certified Public Accountants ,AICPA)(2014)分析了大數(shù)據(jù)環(huán)境對(duì)審計(jì)工作的影響。
國(guó)內(nèi)外學(xué)術(shù)界也高度關(guān)注大數(shù)據(jù)技術(shù)在審計(jì)中的應(yīng)用。Gepp(2018)研究了大數(shù)據(jù)在審計(jì)研究與實(shí)踐中的現(xiàn)狀與未來機(jī)遇;筆者分析了大數(shù)據(jù)審計(jì)的現(xiàn)狀與發(fā)展(陳偉,2017),以及大數(shù)據(jù)環(huán)境下電子數(shù)據(jù)審計(jì)的機(jī)遇、挑戰(zhàn)與方法(陳偉,2016),研究了大數(shù)據(jù)環(huán)境下基于模糊匹配的審計(jì)方法(陳偉,2016),大數(shù)據(jù)環(huán)境下基于數(shù)據(jù)可視化技術(shù)的電子數(shù)據(jù)審計(jì)方法(陳偉,2017),基于Benford定律的大數(shù)據(jù)審計(jì)方法(陳偉,2017),基于大數(shù)據(jù)可視化技術(shù)的審計(jì)線索特征挖掘方法(陳偉,2018),以及基于網(wǎng)絡(luò)爬蟲技術(shù)的大數(shù)據(jù)審計(jì)方法(陳偉,2018)等。Wang(2015)調(diào)查發(fā)現(xiàn):數(shù)據(jù)審計(jì)在審計(jì)工作中具有重要的作用,但社會(huì)審計(jì)和內(nèi)部人員對(duì)數(shù)據(jù)審計(jì)重視和應(yīng)用還不夠。Brown-Liburd(2015)認(rèn)為要多關(guān)注審計(jì)人員處理大數(shù)據(jù)的能力,比如如何對(duì)審計(jì)人員進(jìn)行大數(shù)據(jù)審計(jì)方面的培訓(xùn),如何開發(fā)大數(shù)據(jù)審計(jì)工具或借助其他領(lǐng)域的軟件工具來開展大數(shù)據(jù)審計(jì)。
綜上所述,隨著大數(shù)據(jù)技術(shù)在審計(jì)領(lǐng)域中的應(yīng)用,大數(shù)據(jù)審計(jì)成為目前審計(jì)工作中的一個(gè)重要內(nèi)容,為了適應(yīng)審計(jì)事業(yè)發(fā)展的需要,培養(yǎng)大數(shù)據(jù)審計(jì)人才越來越重要。如何設(shè)計(jì)大數(shù)據(jù)審計(jì)案例,培養(yǎng)審計(jì)人員的大數(shù)據(jù)審計(jì)能力越來越重要。本文基于Python工具,以金融審計(jì)為例,設(shè)計(jì)基于可視化分析技術(shù)的大數(shù)據(jù)審計(jì)應(yīng)用案例。
人類非常擅長(zhǎng)通過視覺獲取有用信息,一圖勝千言?,F(xiàn)代數(shù)據(jù)分析也日益依賴通過呈現(xiàn)圖形來揭示含義和表達(dá)結(jié)果。目前,針對(duì)審計(jì)行業(yè),關(guān)于大數(shù)據(jù)技術(shù)的相關(guān)研究與應(yīng)用一般包括大數(shù)據(jù)智能分析技術(shù)、大數(shù)據(jù)可視化分析技術(shù)以及大數(shù)據(jù)多數(shù)據(jù)源綜合分析技術(shù),其中,大數(shù)據(jù)可視化分析技術(shù)是目前大數(shù)據(jù)審計(jì)應(yīng)用比較成熟和主流的內(nèi)容。常見的大數(shù)據(jù)可視化分析技術(shù)包括:柱狀圖(Bar Chart)、 折 線 圖(Line Chart)、小提琴圖(Violin plot)、散點(diǎn)圖(Scatter Chart)、氣泡圖(Bubble Chart)、 餅 圖(Pie Chart)、 雷達(dá)圖(Radar Chart)、地區(qū)分布圖(Choropleth Map)、樹地圖(Tree Map)、熱力圖(Heat Map)、標(biāo)簽云(Tag Cloud)等。
在何種情況下應(yīng)該用何種可視化方法,才能夠讓審計(jì)數(shù)據(jù)分析達(dá)到最佳的效果是大數(shù)據(jù)可視化分析技術(shù)在審計(jì)中應(yīng)用的重點(diǎn)。比如,在分析我國(guó)新型農(nóng)村社會(huì)養(yǎng)老保險(xiǎn)制度的發(fā)展情況時(shí),對(duì)每年、每個(gè)地方、每個(gè)參保人員的信息進(jìn)行逐一計(jì)算后,當(dāng)把數(shù)據(jù)在地圖軟件上可視化之后,其具有的特點(diǎn)就能很好地顯現(xiàn)出來,審計(jì)人員便可以輕松地看出全國(guó)各地新型農(nóng)村社會(huì)養(yǎng)老保險(xiǎn)制度近年來的發(fā)展變化情況。
江漢證券公司是江漢省重點(diǎn)金融機(jī)構(gòu),根據(jù)江展市審計(jì)局2018年的審計(jì)計(jì)劃安排,現(xiàn)對(duì)該公司進(jìn)行經(jīng)濟(jì)責(zé)任審計(jì)。其中的重點(diǎn)內(nèi)容之一是審計(jì)該公司2013-2018年期間的股票交易數(shù)據(jù)中是否存在內(nèi)幕交易的違規(guī)現(xiàn)象。假設(shè)現(xiàn)已獲得相關(guān)大數(shù)據(jù),其中,處理后的相關(guān)股票交易數(shù)據(jù)(注:本案例中相關(guān)數(shù)據(jù)已經(jīng)過脫密處理)示例如圖1所示。
目前,常用的大數(shù)據(jù)可視化分析工具主要包括:(1)開源的、可編程的工具,如R語言、Python等;(2)商業(yè)化軟件工具,如Tableau、SAS等??紤]到大數(shù)據(jù)可視化分析工具Python是比較簡(jiǎn)單的、開源的大數(shù)據(jù)可視化分析軟件,本文根據(jù)目前開展大數(shù)據(jù)審計(jì)的需要,以Python為例,分析散點(diǎn)圖、條形圖、折線圖、直方圖、氣泡圖、小提琴圖等常用的數(shù)據(jù)可視化分析技術(shù)。
整個(gè)案例內(nèi)容設(shè)計(jì)如下:
1.審前準(zhǔn)備階段
掌握如何進(jìn)行審前準(zhǔn)備,如何編寫審計(jì)通知書、如何編寫審計(jì)實(shí)施方案等文件。
2.審計(jì)實(shí)施階段
掌握如何編寫審計(jì)需求單、如何進(jìn)行數(shù)據(jù)采集與分析、如何借助大數(shù)據(jù)可視化技術(shù)探究該公司2013-2018年期間的股票交易數(shù)據(jù)中是否存在內(nèi)幕交易的違規(guī)現(xiàn)象、如何編寫審計(jì)取證單、如何編寫審計(jì)工作底稿等審計(jì)文書。
3.審計(jì)報(bào)告階段
掌握如何編寫審計(jì)報(bào)告征求意見稿(審計(jì)事實(shí)確認(rèn)書)、如何編寫審計(jì)報(bào)告等文件。
綜上所述,如何借助大數(shù)據(jù)可視化技術(shù)探究該公司2013-2018年期間的股票交易數(shù)據(jù)中是否存在內(nèi)幕交易的違規(guī)現(xiàn)象,獲得審計(jì)證據(jù),是開展大數(shù)據(jù)審計(jì)的關(guān)鍵,因此,本文重點(diǎn)分析實(shí)現(xiàn)大數(shù)據(jù)審計(jì)的幾種常用可視化分析技術(shù)。
圖1 相關(guān)股票交易數(shù)據(jù)示例
圖2 基于Python語言的散點(diǎn)圖分析方法示例
1.散點(diǎn)圖分析方法簡(jiǎn)介
散點(diǎn)圖可以用于表示X、Y軸坐標(biāo)之間數(shù)據(jù)的變化關(guān)系,借助可視化分析工具,X、Y軸坐標(biāo)之間數(shù)據(jù)的變化關(guān)系可以被可視化地分析并展示出來。
2.散點(diǎn)圖分析方法的實(shí)現(xiàn)
散點(diǎn)圖分析方法在審計(jì)工作中具有一定的用途,比如,在金融審計(jì)中,通過散點(diǎn)圖分析,審計(jì)人員可以分析客戶購(gòu)買股票的情況,從而判斷客戶購(gòu)買股票的類型是否比較單一?;谝陨戏治觯捎肞ython語言實(shí)現(xiàn)了針對(duì)某一股票交易數(shù)據(jù)的散點(diǎn)圖分析方法,其分析結(jié)果示例如圖2所示。在圖2中,X軸表示被分析的客戶編號(hào),Y軸表示被分析的客戶購(gòu)買股票的代碼。
由圖2不難發(fā)現(xiàn):客戶編號(hào)為C024、C038、C046、C064的客戶購(gòu)買股票的類型比較單一。
1.條形圖分析方法簡(jiǎn)介
條形圖是數(shù)據(jù)分析中常用的圖形之一。通過條形圖,可以把數(shù)據(jù)表中列或行數(shù)據(jù)生成條形圖,從而可以直觀地顯示各個(gè)項(xiàng)目之間的比較情況。條形圖的主要特點(diǎn)是:方便審計(jì)人員很容易地看出各個(gè)項(xiàng)目數(shù)據(jù)的大?。蝗菀妆容^各個(gè)項(xiàng)目數(shù)據(jù)之間的差別。
2.條形圖分析方法的實(shí)現(xiàn)
條形圖分析方法在審計(jì)工作中具有一定的用途,比如,在金融審計(jì)中,通過散點(diǎn)圖分析,審計(jì)人員可以分析客戶購(gòu)買股票的情況,從而判斷客戶購(gòu)買股票的類型是否比較單一?;谝陨戏治觯捎肞ython語言實(shí)現(xiàn)了針對(duì)某一股票交易數(shù)據(jù)的條形圖分析方法,其分析結(jié)果示例如圖3所示。在圖3中,X軸表示被分析的客戶編號(hào),Y軸表示被分析的客戶所購(gòu)買的股票總數(shù)。
由圖3不難發(fā)現(xiàn):客戶編號(hào)為C024、C038、C046、C064的客戶購(gòu)買股票的類型比較單一,這些客戶是審計(jì)人員關(guān)注的重點(diǎn)。
1.折線圖分析方法簡(jiǎn)介
折線圖是數(shù)據(jù)分析中常用的圖形之一。通過折線圖,可以把數(shù)據(jù)表中列或行數(shù)據(jù)生成折線圖,從而可以直觀地顯示各個(gè)項(xiàng)目數(shù)據(jù)之間的比較情況。折形圖的主要特點(diǎn)是:方便審計(jì)人員很容易地看出各個(gè)項(xiàng)目數(shù)據(jù)的大??;容易比較各個(gè)項(xiàng)目數(shù)據(jù)之間的差別。折線圖可以顯示隨時(shí)間(根據(jù)常用比例設(shè)置)而變化的連續(xù)數(shù)據(jù),因此非常適用于顯示在相等時(shí)間間隔下數(shù)據(jù)的趨勢(shì)。
2.折線圖分析方法的實(shí)現(xiàn)
折線圖分析方法在審計(jì)工作中具有一定的用途,比如,在金融審計(jì)中,通過折線圖分析,審計(jì)人員可以分析客戶購(gòu)買股票的情況,從而判斷客戶購(gòu)買股票的類型是否比較單一。基于以上分析,采用Python語言實(shí)現(xiàn)了針對(duì)某一股票交易數(shù)據(jù)的折線圖分析方法,其分析結(jié)果示例如圖4所示。在圖4中,X軸表示被分析的客戶編號(hào),Y軸表示被分析的客戶所購(gòu)買的股票總數(shù)。
由圖4不難發(fā)現(xiàn):客戶編號(hào)為C024、C038、C046、C064的客戶購(gòu)買股票的類型比較單一,這些客戶是審計(jì)人員關(guān)注的重點(diǎn)。
1.直方圖分析方法簡(jiǎn)介
直方圖是一種展示數(shù)據(jù)頻率的特殊柱狀圖,利用直方圖,可以對(duì)數(shù)據(jù)進(jìn)行頻率分析,從而幫助審計(jì)人員了解數(shù)據(jù)的分布情況。
2.直方圖分析方法的實(shí)現(xiàn)
直方圖分析方法在審計(jì)工作中具有一定的用途,比如,在金融審計(jì)中,通過直方圖分析,審計(jì)人員可以分析客戶購(gòu)買股票的頻率,從而判斷客戶購(gòu)買股票的類型是否比較單一?;谝陨戏治?,采用Python語言實(shí)現(xiàn)了針對(duì)某一股票交易數(shù)據(jù)的直方圖分析方法,其分析結(jié)果示例如圖5所示。在圖5中,X軸表示被分析的客戶編號(hào),Y軸表示被分析的客戶購(gòu)買股票的頻率。
由圖5不難發(fā)現(xiàn):客戶編號(hào)為C024、C038、C046、C064的客戶購(gòu)買股票的類型比較單一,這些客戶是審計(jì)人員關(guān)注的重點(diǎn)。
圖3 基于Python語言的條形圖分析方法示例
圖4 基于Python語言的折線圖分析方法示例
圖5 基于Python語言的直方圖分析方法示例
1.氣泡圖分析方法原理分析
氣泡圖可以用于表示X、Y軸坐標(biāo)之間數(shù)據(jù)的變化關(guān)系,并可以通過圖中散點(diǎn)的大小來直觀感受其所表示的數(shù)值大小。氣泡圖類似散點(diǎn)圖,像給散點(diǎn)圖上色,不同之處是氣泡圖允許在圖表中額外加入一個(gè)表示大小的變量進(jìn)行對(duì)比。
2.氣泡圖分析方法的實(shí)現(xiàn)
氣泡圖分析方法在審計(jì)工作中具有一定的用途,比如,在金融審計(jì)中,氣泡圖可以幫助審計(jì)人員分析客戶購(gòu)買股票的類型是否比較單一,但不能整體了解客戶購(gòu)買股票的獲利情況。通過氣泡圖,審計(jì)人員可以整體了解客戶購(gòu)買股票的獲利情況。
基于以上分析,采用Python語言實(shí)現(xiàn)了針對(duì)某一股票交易數(shù)據(jù)的氣泡圖分析方法,客戶購(gòu)買股票及獲利金額規(guī)模情況分析結(jié)果示例如圖6所示。在圖6中,X軸表示被分析的客戶編號(hào),Y軸表示被分析的客戶所購(gòu)買股票的代碼。
由圖6不難發(fā)現(xiàn):客戶編號(hào)為C024和C064的客戶購(gòu)買股票的類型比較單一,且購(gòu)買的股票獲利較大(如標(biāo)的為B1608的股票),這些客戶數(shù)據(jù)是審計(jì)人員關(guān)注的重點(diǎn)。
1.小提琴圖分析方法簡(jiǎn)介
小提琴圖(Violin plot)結(jié)合了箱線圖與核密度估計(jì)圖的特點(diǎn),用于顯示數(shù)據(jù)的分布形狀及其概率密度。
2.小提琴圖分析方法的實(shí)現(xiàn)
小提琴圖分析方法在審計(jì)工作中具有一定的用途,比如,在金融審計(jì)中,通過小提琴圖分析,審計(jì)人員可以分析客戶購(gòu)買股票的頻率,從而判斷客戶購(gòu)買股票的類型是否比較單一?;谝陨戏治觯捎肞ython語言實(shí)現(xiàn)了針對(duì)某一股票交易數(shù)據(jù)的小提琴圖分析方法,客戶購(gòu)買股票及獲利金額規(guī)模情況分析結(jié)果示例如圖7所示。在圖7中,小提琴的寬度表示客戶購(gòu)買股票類型的數(shù)量,小提琴的高度表示客戶購(gòu)買股票的獲利金額。
由圖7不難發(fā)現(xiàn):客戶編號(hào)為C024和C064的客戶購(gòu)買股票的類型比較單一,且獲利較大,是審計(jì)人員關(guān)注的重點(diǎn)。而客戶編號(hào)為C038和C046的客戶雖然購(gòu)買股票的類型比較單一,但購(gòu)買股票獲利很小,沒有太多可疑之處。
同理,可以基于Python語言實(shí)現(xiàn)熱力圖分析方法、標(biāo)簽云分析方法等,從而更全面地練習(xí)基于可視化分析技術(shù)的大數(shù)據(jù)審計(jì)方法。由于篇幅所限,筆者另文討論。
圖6 基于Python語言的氣泡圖分析方法示例
圖7 基于Python語言的小提琴圖分析方法示例
本文根據(jù)目前國(guó)內(nèi)外大數(shù)據(jù)審計(jì)人才培養(yǎng)的實(shí)際需要,探索基于可視化分析技術(shù)的大數(shù)據(jù)審計(jì)案例設(shè)計(jì)。由于篇幅所限,關(guān)于大數(shù)據(jù)智能分析技術(shù)、大數(shù)據(jù)多數(shù)據(jù)源綜合分析技術(shù)在審計(jì)中的應(yīng)用案例,筆者將另文討論。另外,今后學(xué)術(shù)界、實(shí)務(wù)界以及審計(jì)軟件供應(yīng)商應(yīng)該提供更多的大數(shù)據(jù)審計(jì)案例,以滿足大數(shù)據(jù)審計(jì)學(xué)習(xí)的需要。