□袁佳
截至2020年底,中國石化已在超過60個國家(地區(qū))設有常設機構(gòu)300余個,主要分為全資分子公司(項目部)、參股合資企業(yè)、聯(lián)合作業(yè)企業(yè)等三大類。中國石化境外審計監(jiān)督力量主要分為兩個層面:一是集團層面,專門成立境外審計中心負責對境外機構(gòu)進行監(jiān)督,該中心現(xiàn)有人員35人;二是企業(yè)層面,在各涉外單位建立獨立審計部門或與其他業(yè)務部門合署辦公對其管轄境外機構(gòu)開展審計。
從資源配給與中國石化境外資產(chǎn)規(guī)模對比看,各類專兼職審計人員配備仍處于嚴重不足的狀態(tài)。國家和集團層面都對境外機構(gòu)監(jiān)督的檢查頻率和要求越來越高,但境外審計的現(xiàn)狀是境外企業(yè)規(guī)模與監(jiān)督力量嚴重不匹配。再加上疫情在全球范圍內(nèi)的長期影響,遠程審計成為唯一的審計監(jiān)督途徑,審計風險與壓力陡增。境外遠程審計對信息技術(shù)和智能工具的需求更緊迫,通過技術(shù)改變目前境外規(guī)模和審計力量嚴重不匹配的困境,成為提高審計效率確保審計質(zhì)量的重要途徑之一。
開展遠程審計主要存在以下風險和困難:一是目前多數(shù)境外業(yè)務尚未建立統(tǒng)一數(shù)據(jù)管理平臺;二是境外業(yè)務數(shù)據(jù)資源共享不夠,各類業(yè)務信息系統(tǒng)查詢權(quán)限開通受限;三是信息化和時差等因素對審前調(diào)查和現(xiàn)場審計約束較多、影響效率;四是因境外業(yè)務信息化程度差異較大,國內(nèi)初步實現(xiàn)的大數(shù)據(jù)審計方法、技能、模型等難以適用。
為降低遠程審計風險,解決上述問題,遠程審計對信息技術(shù)的需求較國內(nèi)審計更迫切,且存在特殊方面。
一是數(shù)據(jù)獲取。遠程訪問數(shù)據(jù)有兩個渠道。第一,被審計單位開通訪問權(quán)限,并且可從境內(nèi)遠程登錄業(yè)務系統(tǒng),在這種情況下,需求主要是確保被審計單位的權(quán)限開通要滿足業(yè)務查詢需求,確保有足夠權(quán)限查看相應業(yè)務數(shù)據(jù);第二,無法通過遠程訪問被審計單位業(yè)務系統(tǒng),只能由被審計單位從系統(tǒng)中導出相關(guān)數(shù)據(jù),在這種場景下,需求主要是確保被審計單位提供的數(shù)據(jù)的真實完整,無刪減和篩選。
二是數(shù)據(jù)清洗。針對境外審計單位提供的海量數(shù)據(jù),格式繁多,數(shù)據(jù)獲取只是第一步,需要將源數(shù)據(jù)進行結(jié)構(gòu)化和清洗,去掉干擾信息,才能為審計人員所用,便于后續(xù)分析,查找異常。因此在審計過程中,一線審計人員的迫切需要如Excel等具有數(shù)據(jù)處理、格式轉(zhuǎn)換功能的工具快速轉(zhuǎn)換格式、清洗數(shù)據(jù)。
三是數(shù)據(jù)分析。主要針對清洗后的數(shù)據(jù),審計組需要對其利用excel Power B,以及python編程等大數(shù)據(jù)智能工具進行全樣本數(shù)據(jù)分析,將從業(yè)務系統(tǒng)中導出的海量數(shù)據(jù)進行關(guān)聯(lián)性分析,結(jié)合查證需求,將邏輯關(guān)系確定,完成建模,利用數(shù)據(jù)模型查找異常點,并對異常數(shù)據(jù)快速統(tǒng)計。
一是數(shù)據(jù)采集的方法。
在實施境外遠程審計中,數(shù)據(jù)采集的方法主要有以下幾種:物理拷貝、后臺抽取、定制軟件采集、網(wǎng)絡采集、遠程訪問、數(shù)據(jù)集市。采集數(shù)據(jù)種類范圍逐漸擴大,除了結(jié)構(gòu)化數(shù)據(jù),還非常重視非結(jié)構(gòu)化數(shù)據(jù)的采集。隨著大數(shù)據(jù)技術(shù)的發(fā)展,對非結(jié)構(gòu)化數(shù)據(jù)采集運用網(wǎng)絡爬蟲技術(shù)實現(xiàn)了更廣泛、全面的采集。
線下文本類數(shù)據(jù)的采集。當前,信息技術(shù)可以更高效地對文本類數(shù)據(jù)采集,除了較為成熟的OCR(光學字符識別)技術(shù)幫助文本的識別和文檔的轉(zhuǎn)換,將紙質(zhì)文檔及掃描格式文件轉(zhuǎn)化成結(jié)構(gòu)化可提取的文件格式,以便后續(xù)批量數(shù)據(jù)采集和智能分析,還可以利用開源計算機視覺庫OpenCV等快速應用圖像、物體識別等,結(jié)合編程語言,從圖像、視頻中進行檢測、識別,應用于像資產(chǎn)盤點審計查證的信息收集。
線下表格類數(shù)據(jù)的采集。目前,已有通用類的軟件工具可以幫助審計人員將不可編輯的圖片類或是PDF格式的文檔,直接轉(zhuǎn)化為表格類可編輯的文檔。在境外審計中常常關(guān)注的資金預算審查中,審計人員需要被審計單位合作伙伴的籌款通知書中的資金預算數(shù)據(jù)與被審計單位收到的實際賬單中的資金支出數(shù)據(jù),審計人員要將識別出的電子表格以Excel的形式儲存于本地。
系統(tǒng)數(shù)據(jù)采集。通過定制高度自動化、智能化的數(shù)據(jù)抽取和底稿生成工具(軟件),實現(xiàn)快速的財務數(shù)據(jù)導出和標準化底稿自動生成、規(guī)范化數(shù)據(jù)整理。支持多個財務系統(tǒng)高速數(shù)據(jù)提取,節(jié)約審計人員從不同的分支機構(gòu)收集數(shù)據(jù)的時間,數(shù)據(jù)清理節(jié)省了審計人員準備數(shù)據(jù)的工作量,格式化的數(shù)據(jù)可以直接使用。
網(wǎng)絡信息采集。在互聯(lián)網(wǎng)網(wǎng)絡頁面中隱藏了可免費公開訪問的有效數(shù)據(jù)集,可對審計工作起到重要作用。基于網(wǎng)絡爬蟲技術(shù)的審計大數(shù)據(jù)采集與分析的方法在審計項目中應用具有可行性和實用性。
二是數(shù)據(jù)清洗應用實踐。
典型數(shù)據(jù)分析流程包括明確目標、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)、報告撰寫,以對境外資金預算執(zhí)行審計為例,當被審計單位提供的不是系統(tǒng)的格式化數(shù)據(jù)時,第一步用OCR技術(shù)采集到了該審查所需的表格之后,接下來并不是直接開展分析,而是對數(shù)據(jù)質(zhì)量進行審查,首先我們要對識別出來的表格數(shù)據(jù)審查其是否存在缺失值、重復值及異常值的問題,在進行數(shù)據(jù)處理時我們需要先將這些數(shù)據(jù)問題處理掉,這一過程也叫做數(shù)據(jù)清洗。在實際數(shù)據(jù)分析項目中,面對龐大的數(shù)據(jù)可以用多種軟件來實現(xiàn)數(shù)據(jù)清洗。
三是數(shù)據(jù)分析應用實踐。
中國石化推動審計信息化建設,將初步形成圍繞財務、采購、銷售、工程等業(yè)務領域的審計數(shù)據(jù)資源和審計數(shù)據(jù)模型體系,目前已建立85個審計預警模型。
由于數(shù)據(jù)專區(qū)仍在建設過程中,對數(shù)據(jù)治理情況不一的境外數(shù)據(jù)來說,其審計查證需要以一個更加靈活、更加快捷的方式來建立分析過程。傳統(tǒng)的數(shù)據(jù)分析模型建設周期從數(shù)月至一兩年不等,還必須嚴格地以清晰的審計業(yè)務需求為前提,且受限于數(shù)據(jù)來源的系統(tǒng)本身的設計,數(shù)據(jù)細節(jié)無法進行有效動態(tài)挖掘。由于數(shù)據(jù)預警與分析維度多樣,更新迭代是發(fā)現(xiàn)問題、形成分析結(jié)論的必由之路,在實際做分析之前很難預先設計出來,分析思路與分析過程是相輔相承的,并且境外實際業(yè)務也處于不斷變化之中,所以根據(jù)當時分析需求建設出的模型往往開發(fā)出來就“過氣”了。
面對多樣的境外業(yè)務,需要一種過程結(jié)果持續(xù)循環(huán)的新型工作方式,敏捷分析和快速建模不講求大規(guī)模的數(shù)據(jù)建模,直接利用輕型分析應用,針對各類數(shù)據(jù)快速進行監(jiān)測、分析業(yè)務探索。它能很好地適應監(jiān)測、分析業(yè)務需求快速變化的特點,它的顯著特征是輕量、快速、靈活,便于開展動態(tài)業(yè)務分析。當然,好的方法還要有好的軟件工具作為支撐,進行數(shù)據(jù)分析的工具有很多種,但數(shù)據(jù)分析的步驟,無非是明確目標、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)及報告撰寫這幾個步驟。數(shù)據(jù)分析工具如Python、Excel、R、SPSS、SAS、SQL等,Power BI、Tableau是支持敏捷分析的有效工具。有一定基礎編程語言的審計人員,可以運用編譯的程序進行數(shù)據(jù)分析。而Python相較于JAVA、C++而言,代碼量小,開發(fā)周期短,運行速度非常快。