吳 瓊
作為我國民生事業(yè)的關鍵環(huán)節(jié),扶貧問題一直以來是我國政府的重點關注對象。十八大上黨中央將扶貧事業(yè)納入實現第一個百年目標的戰(zhàn)略布局中,拉開全面脫貧的序幕;十九大從新的高度定義扶貧事業(yè)的布局部署,并實現了貧困人口、貧困發(fā)生率和貧困村等指標的大幅度下降;2019年2月,李克強總理在國務院常務會議上強調重點關注深度貧困地區(qū)的脫貧工作,確保貧困人口達到“兩不愁三保障”,并指出要達成減貧人數達1000萬以上的扶貧工作目標[1],種種跡象表明,我國政府越來越重視扶貧事業(yè)的推進。
近年來,經濟全球化趨勢的推動和大數據技術的發(fā)展逐步推動了審計工作的信息化。2020年全國審計工作會議將“扎實推進審計項目審計組織方式‘兩統籌’和大數據審計,提高審計質量和效率”作為2020年7項重點工作思路之一[2],同時,人工智能、物聯網等新興概念的引進使得扶貧審計事業(yè)信息化的程度越來越高,原有的文本數據漸漸被電子數據所替代,信息化的飛速發(fā)展使得扶貧審計中風險識別的難度加大,傳統的審計方法無法滿足大數據時代審計信息化的發(fā)展需要,扶貧審計方法急需得到創(chuàng)新。
綜上所述,信息化已逐漸成為扶貧審計工作中的重要組成部分,其發(fā)展也一定程度上決定了審計工作的質量和效率,而大數據可視化作為審計信息化的重要組成部分,其在審計工作中的具體運用也受到越來越多的關注。雖然目前已有部分學者研究了相關的大數據審計技術方法,但針對扶貧審計的大數據可視化技術研究尚且不足,本文基于目前對大數據技術的現狀和發(fā)展(陳偉,2017)[3],結合相關學者針對大數據技術在扶貧審計中的應用研究(陳偉,2019)[4],深入探究大數據可視化技術在扶貧審計案例中的具體應用。
信息技術的快速發(fā)展也帶來了新型審計技術的變革,目前大數據環(huán)境下主流的審計技術方法主要包括三大類,一是大數據智能分析技術,該技術主要依賴數據挖掘、算法模型以及開發(fā)工具的支持,通過跨學科、多領域知識的交叉融合,對復雜龐大的數據群進行處理,從而對審計數據進行智能分析,其發(fā)展趨勢主要體現五大方面:AI賦能、一體化、云服務、開放共享以及可定制[5];二是大數據多數據源綜合分析技術,其主要通過數據查詢等技術方法對收集所得的各類數據進行多角度比對和綜合分析,以發(fā)現數據集與數據集之間的關聯,從而幫助審計人員發(fā)現潛在的審計問題和審計線索;三是大數據可視化技術,該技術方法主要通過各類靜態(tài)、動態(tài)可視圖表生動鮮明地呈現審計人員對數據的直觀分析,改革了傳統的審計數據信息的呈現形式。在動態(tài)交互式的界面中,審計人員更易對數據進行查看和比對分析,同時,以Web頁面為依托的動態(tài)圖表能更直觀地展現審計工作的實質內涵,從而幫助審計人員在審查、比較審計數據中能更好地總結其數據的潛在規(guī)律。
數據可視化技術是信息時代大數據技術的重要分支之一,其主要是通過生動形象的圖形將繁瑣的數據表現出來,便于審計人員從中探求數據背后的規(guī)律和潛在的問題。目前,多種可編程的工具對于數據可視化的應用研究已經開展到一定階段,主要包括兩類:一是可視化工具產品,具體有Splunk、EverString、Tableau等;二是可進行可視化分析的編程工具,具體有R語言、python等。其中,python因其龐大的可視化庫而在數據分析中占有相對的優(yōu)勢,本文以python為依托,利用python中各類可視化庫對扶貧數據進行整體和部分的關聯分析,以探究扶貧數據中潛在的審計問題,并就存疑點進行深入剖析。
1.3.1 大數據可視化技術下扶貧審計所需數據
1)被審計單位主動提供的內部數據,主要包括兩類,一是體現被審計單位自身經營狀況的文書報告,二是扶貧項目相關的具體數據,即被認定為扶貧項目資助對象的低收入農戶人員的相關信息,同時輔之以相關判定資助對象的文書標準,對已登記在冊的低收入人員身份信息進行進一步的核實和確認,以保證扶貧項目真正做到落實到戶、落實到人,避免發(fā)生扶貧專項資金截留挪用或虛假申報的情況。
2)審計人員搜集的外部數據,具體包括財政數據、工商數據、稅務數據、金融數據、農機登記數據和其他與扶貧項目相關的網上公開數據,以分析扶貧項目涉及的低收入人員中是否存在財政供養(yǎng)人員和相關公司的股東、法人、投資者,詳細了解低收入人員的納稅、房屋交易、車輛購置、股票賬戶以及農機設備登記情況,同時結合相應的公開數據,幫助審計人員判斷數據之間的勾稽關系,輔助尋找審計線索。
1.3.2 基于大數據可視化技術的扶貧審計原理
結合相關大數據可視化技術,基于大數據可視化技術的扶貧審計方法原理總體可概括為:審計機關和審計人員通過對審計單位的審前調查,利用對相關人員的訪問以及現場調查等技術,獲取被審計單位內部的扶貧現狀數據如扶貧人員名單、本市扶貧政策規(guī)范等,同時利用python進行對網絡公開數據進行爬蟲,獲取相應的外部數據如全國貧困人口分布、該市相關財政數據、工商數據、稅務數據、金融數據、農機登記數據等,接著對搜集到的內外部數據進行預處理,基于“總體分析、發(fā)現疑點、分散核實、系統研究”的審計思路[6],利用大數據可視化技術對該市低收入農戶數據、財政數據、工商數據以及全國貧困人口分布現狀進行整體建模和比對分析,審計人員根據數據分析獲得的可視化結果,同時結合自身的職業(yè)敏感度和專業(yè)能力,對可視化的圖像和動態(tài)圖形進行觀測、識別和分析,以發(fā)現可視化結果中存在的審計疑點(比如低收入農戶數據和財政數據、工商數據存在交叉等),從而獲取審計線索,并從審計線索出發(fā),開展后續(xù)的進一步審計和延伸取證,獲取相應地審計線索,提供防范和化解風險的審計建議,充分發(fā)揮審計應有的功能。
扶貧事業(yè)是我國政府重點關注的民生事業(yè),關系著人民的幸福指數和生活福祉,本文以精準扶貧,加緊實現決戰(zhàn)脫貧攻堅目標任務為背景,以聚集眾多貧困人口的xx省某xx縣扶貧審計為例,結合當地審計局當年的審計計劃和扶貧政策要求,考察xx縣2013-2017年期間貧困人口的精準識別落實情況,探究大數據可視化技術在扶貧審計中的應用效果,現已獲取xx省xx縣低收入農戶名單信息、相關的工商數據和財政供養(yǎng)人員等大數據(相關數據已經過脫密處理)。
目前主流的大數據分析工具主要包含兩類,一類是商業(yè)化的可視類軟件工具,一類是開源的、可編程的工具,本文選用簡單且易操作的數據分析軟件python,利用其囊括的眾多可視化庫,實現扶貧數據的可視化分析。
2.2.1 基于韋恩圖和雙軸圖的低收入農戶、財政人員和工商人員總體分析
雙軸圖一般指含有多個y軸(≥2)的坐標圖,多以折線圖+柱狀圖的形式展現,它通過多圖例的形式將幾組差別較大數據之間的關聯展現出來。借助python的pyecharts庫可以實現動態(tài)的雙軸圖,具體分析結果見圖1。在圖1中,x軸代表分布低收入農戶的鄉(xiāng)鎮(zhèn)名稱,左側y軸代表低收入農戶、財政人員和工商人員的數量,右側y軸代表各鄉(xiāng)鎮(zhèn)含多重身份人員(即既是低收入農戶又是財政人員或工商人員的相關人員)的比例,當鼠標點擊不同圖例,雙軸圖上隨即展現對應的數值。從圖1中可以發(fā)現,東林鎮(zhèn)桃花村、安陽鎮(zhèn)北巷村以及江林鎮(zhèn)梁河村含有的多重身份人員比例較大,審計人員應將這幾個鄉(xiāng)鎮(zhèn)納入重點審計對象,對其扶貧現狀進行進一步的延伸取證。
圖2 基于python的扶貧身份確認和工作年限比對分析
2.2.2 基于折線圖的多重身份人員進一步分析
抽離出13個多重身份人員的具體信息,對其進行深入分析。首先比對低收入農戶中同時又有事業(yè)編制的人員,借助python構建折線圖(見圖2),比對其被確認為貧困人員的時間和成為公務員的時間,考察該人員是被確認為貧困人員后再考取考公務員,還是已經是事業(yè)單位人員卻仍被列為貧困人員,在圖2中可以看出杜西西等3人已經成為國家財政供養(yǎng)人員后仍被列為貧困人口,劉衛(wèi)偉在同一年被確認為公務員和貧困人員,應對這些人員的具體情況進行核實,對不合規(guī)但仍被確認為低收入農戶的人員進行相應的審計整改。
在大數據時代,隨著信息技術的飛速發(fā)展和全國范圍內扶貧工作的廣泛展開,傳統的數據查詢等大數據審計技術方法已經不能滿足日益膨脹的扶貧審計數據分析需求,利用大數據可視化技術開展扶貧審計不失為一種可行性研究方法。本文基于這樣的時代現實需要,利用python探索了一系列的大數據可視化技術,并通過具體的案例分析展現可視化技術在審計工作中發(fā)揮的優(yōu)勢,同時利用可視化結果驗證了大數據可視化技術應用在扶貧審計中的有效性和可行性,一定程度上彌補了常用的數據查詢等大數據技術在數據分析中的不足。與此同時,由于大數據可視化技術相對于數據查詢等技術方法對審計人員的信息化能力要求更高,因此培養(yǎng)掌握信息技術的審計人員也成為審計事業(yè)發(fā)展的重中之重,審計人員應不斷更新自己的知識儲備和專業(yè)素養(yǎng),以適應新時代對審計信息技術人才的需求。