劉鳳委(博士生導師),楊 月
數(shù)字經(jīng)濟時代環(huán)境下,技術創(chuàng)新和應用與時俱進,大數(shù)據(jù)、人工智能、區(qū)塊鏈等新興技術的發(fā)展對審計監(jiān)督活動產(chǎn)生了前所未有的深刻影響。一方面,大數(shù)據(jù)等新興技術在經(jīng)濟活動中廣泛應用,使得審計對象的形態(tài)、特征發(fā)生了前所未有的變化;另一方面,作為經(jīng)濟監(jiān)督活動的審計自身也在發(fā)生深刻的變革,傳統(tǒng)審計手段逐步被新興審計手段所取代(姜江華,2022)。傳統(tǒng)審計模式也已經(jīng)不能適應大數(shù)據(jù)環(huán)境下的審計工作,審計需要從傳統(tǒng)的審計思維向持續(xù)審計思維、全量信息思維、以人為本思維和智能審計思維轉變,以大數(shù)據(jù)技術為核心開展審計工作成為審計發(fā)展的新趨勢(王海洪等,2021)。2014年,國務院發(fā)布《關于加強審計工作的意見》,提出將大數(shù)據(jù)技術應用于國家審計,提高信息化技術應用程度。2015年,國務院在《促進大數(shù)據(jù)發(fā)展行動綱要》中提出國家大數(shù)據(jù)戰(zhàn)略,進一步強調(diào)大數(shù)據(jù)的重要性。面對大數(shù)據(jù)等數(shù)字技術的產(chǎn)生和發(fā)展,審計人員需要應時而變來適應由此帶來的變化,面對日益龐大的數(shù)據(jù)量以及復雜的數(shù)據(jù)環(huán)境,利用更加高效的審計手段對被審計對象進行審計(秦榮生,2014),新時代信息技術下審計技術與方法的研究已經(jīng)成為當下以及今后一段時期亟需研究的重大問題。
近年來,我國資本市場頻繁出現(xiàn)嚴重的上市公司資金舞弊問題,顯著干擾了資本市場的有序運行,影響了注冊會計師行業(yè)的聲譽。2021年12月31日,中國注冊會計師協(xié)會(簡稱“中注協(xié)”)發(fā)布的《關于做好上市公司2021年年報審計工作的通知》中指出:“貨幣資金項目屬于五個高風險審計領域之一,注冊會計師應當予以高度關注,以更有效地識別、評估和應對財務報表重大錯報風險?!庇捎谪泿刨Y金項目的固有風險較高,注冊會計師在審計過程中應當設置較低的重要性水平,并通過監(jiān)盤庫存現(xiàn)金、檢查銀行對賬單和余額表、函證銀行存款余額等實質性程序降低檢查風險。但在實務中,這些程序由于執(zhí)行力度不夠或方法欠佳,尚不能完全應對企業(yè)的貨幣資金舞弊問題。在對涉及貨幣資金造假的上市公司的審計機構出具的行政處罰決定書中,經(jīng)常性指出會計師事務所“貨幣資金審計程序存在缺陷”“實質性程序執(zhí)行不到位”,進而未能識別出虛假銀行流水、大額未達賬項等。由于現(xiàn)有審計程序更多地側重于審查與庫存現(xiàn)金、銀行存款相關的余額,而對每筆交易的來源、發(fā)生額的關注度不夠,在針對貨幣資金項目進行審計時很可能忽略潛藏的漏洞。
傳統(tǒng)審計注重從會計報表項目出發(fā)追尋審計線索,然而財務報表項目是對海量原始數(shù)據(jù)聚合壓縮后的信息,這一過程也遺漏了很多有價值的內(nèi)容,注冊會計師僅通過財務報表獲取的科目余額所呈現(xiàn)的信息有限且準確性不足,如果不對背后的原始現(xiàn)金流水予以足夠關注,在針對貨幣資金項目審計時很可能忽略潛藏的漏洞。2019年中注協(xié)發(fā)布的《審計準則問題解答第12號——貨幣資金審計》(簡稱《問題解答第12號》)中也提到“要關注貨幣資金的發(fā)生額,包括銀行交易流水、交易憑證等”,更加肯定了現(xiàn)金流水的價值?,F(xiàn)金流水數(shù)據(jù)屬于企業(yè)的原始數(shù)據(jù),是編制財務報表的原材料之一,由于其具有海量、難以被篡改、管理頻率高等特點,比財務報表的顆粒度更加細致,能夠更加真實、準確地刻畫出企業(yè)的資金全貌。但傳統(tǒng)審計模式不僅無法獲取這些數(shù)據(jù),方法上也無法實現(xiàn)對海量數(shù)據(jù)的全覆蓋,而當前大數(shù)據(jù)技術的蓬勃發(fā)展為處理海量現(xiàn)金流水數(shù)據(jù)提供了有力的技術支撐。中注協(xié)在《問題解答第12號》中明確提出利用數(shù)據(jù)分析等技術,核查銀行收付款流水的可行性。針對現(xiàn)金流水數(shù)據(jù)的處理,數(shù)據(jù)挖掘技術是不容忽視的工具,在連續(xù)五年發(fā)布的影響中國會計從業(yè)人員的信息技術評選中,數(shù)據(jù)挖掘技術一直位居前列。本文以此為切入點,利用數(shù)據(jù)挖掘技術對企業(yè)的原始現(xiàn)金流水數(shù)據(jù)展開分析,以探索大數(shù)據(jù)時代下貨幣資金審計的新思路。
1.現(xiàn)金軌跡數(shù)據(jù)源于軌跡數(shù)據(jù)思想。軌跡數(shù)據(jù)屬于計算機應用技術領域的概念,源于位置感知應用,又稱為“軌跡大數(shù)據(jù)”“時空軌跡數(shù)據(jù)”等,它是指通過對某一物體運動過程進行采樣而獲得的數(shù)據(jù),一般包含物體運動的位置、時間、速度等信息,該物體可以是單一個體,也可以是基于某一特征而劃分的群體。軌跡數(shù)據(jù)具有時空、運動、語義、異頻采樣特征,同時符合大數(shù)據(jù)的“5V”特征(Volume、Velocity、Variety、Veracity、Value),往往通過數(shù)據(jù)挖掘技術對此類數(shù)據(jù)進行處理分析(高強等,2017)。如果將企業(yè)現(xiàn)金作為研究對象,現(xiàn)金在不同賬戶間的流入與流出可以看作是現(xiàn)金的運動過程,以賬戶為節(jié)點,就能夠模擬出現(xiàn)金運動軌跡;同時,由于每條銀行流水都記錄了交易時間、賬戶名稱、交易原因等信息,與軌跡數(shù)據(jù)的時空、運動、語義特征具有較高的重合度,因此在利用數(shù)據(jù)挖掘技術分析原始現(xiàn)金流水的研究中,本文借鑒了軌跡數(shù)據(jù)的思想,提出“現(xiàn)金軌跡數(shù)據(jù)”的概念。現(xiàn)金軌跡數(shù)據(jù)指的是以企業(yè)現(xiàn)金總體為研究對象,記錄現(xiàn)金在各個賬戶間運動軌跡的數(shù)據(jù)①,如圖1所示。
圖1 現(xiàn)金軌跡數(shù)據(jù)概念構成
2.現(xiàn)金軌跡數(shù)據(jù)比傳統(tǒng)的現(xiàn)金流水概念更具優(yōu)越性?,F(xiàn)金流水屬于傳統(tǒng)財務領域中的概念,現(xiàn)金軌跡數(shù)據(jù)則是大數(shù)據(jù)時代背景下的產(chǎn)物。從外延來看,“現(xiàn)金流水”與“現(xiàn)金軌跡數(shù)據(jù)”所反映的客觀事物都是現(xiàn)金,二者等同;但從內(nèi)涵來看,二者的側重點不盡一致。現(xiàn)金流水體現(xiàn)的是現(xiàn)金的體量屬性,即金額多少。在現(xiàn)代漢語詞典中,“流水”一詞的引申義為銷售額,如流水收入。古人云:“流水者,按日挨登如流水之盈科漸進也②?!睆臅嫷慕嵌葋砜矗w現(xiàn)了流水賬就是每日登記入賬金額的過程,如同流水不斷充盈,奔涌向前。現(xiàn)金軌跡數(shù)據(jù)的內(nèi)涵更為豐富。“軌跡”一詞與“流水”不同,它指的是以時間為尺度,記錄物體在空間上的運動過程。從物理學的角度來看,這一運動過程包括了路程(長度)、方向、速度、曲率等許多特征;同時,在軌跡數(shù)據(jù)的可視化中,如果研究對象為群體,繪制線條的粗細、密集程度還能反映出體量大小??梢?,現(xiàn)金軌跡數(shù)據(jù)這一概念涵蓋了現(xiàn)金的體量(金額)、時間、空間等多個屬性(如圖2所示)。針對同一對象,現(xiàn)金流水與現(xiàn)金軌跡數(shù)據(jù)兩種概念的背后體現(xiàn)的是兩套不同的范式:在不同的時代背景下,借助不同的概念引導人們對同一事物轉變思考角度,再借助不同的算法,從而最終加工出不同的信息產(chǎn)物(李琳等,2021)。
圖2 現(xiàn)金軌跡數(shù)據(jù)與現(xiàn)金流水概念比較
3.現(xiàn)金軌跡數(shù)據(jù)概念引領數(shù)據(jù)挖掘新角度。在自然科學領域,新概念的提出往往需要經(jīng)歷嚴謹?shù)膶嶒灢拍艿贸鼋Y論;而在會計等人文社會科學領域,新概念的產(chǎn)生建立在思辨的基礎之上。概念是思維的基本因素(孫建中,1988),定義概念體現(xiàn)了認識客觀事物的方式,同時引導新的思維方式,切換概念意味著轉變思考的角度。在傳統(tǒng)會計中,由于現(xiàn)金流水具有金額屬性,滿足貨幣計量的會計基本假設之一,通過既定的會計準則,能夠輸出會計的最終產(chǎn)品——現(xiàn)金流量表,為報表使用者服務。在當前大數(shù)據(jù)時代背景下,數(shù)據(jù)挖掘技術是不同于會計準則的另一套方法,在分析數(shù)據(jù)的過程中,為提煉出更多隱藏的信息,不應當僅關注現(xiàn)金的金額屬性。以現(xiàn)金軌跡數(shù)據(jù)③概念作為引領,有助于分析者跳出傳統(tǒng)范式的框架,從數(shù)據(jù)挖掘本身出發(fā),充分利用時間、空間、語義等更多維度的特征,使貨幣資金信息不是停留在靜態(tài)余額上,而是動態(tài)探索每筆交易的運動軌跡,更好地發(fā)現(xiàn)數(shù)據(jù)之間的往來關系,從而更有助于發(fā)現(xiàn)潛藏問題。
4.現(xiàn)金軌跡數(shù)據(jù)影響審計思維與模式。基于知識管理理論DIKW模型(Ackoff,1989),數(shù)據(jù)是信息的原料,信息是具備結構化和指向性的數(shù)據(jù)集合,是數(shù)據(jù)提煉出的產(chǎn)品,人類大腦特質決定了很難直接處理數(shù)據(jù),而是先對數(shù)據(jù)進行降維,并從信息中獲取知識和智慧。會計信息生產(chǎn)系統(tǒng)運行的本質,也是利用特定規(guī)則算法對會計數(shù)據(jù)實現(xiàn)數(shù)據(jù)降維的過程(李琳等,2021)。傳統(tǒng)財務報表審計對象,往往是從會計信息出發(fā)來探尋審計線索,而會計信息本身在生產(chǎn)加工過程中并不是對所有數(shù)據(jù)的完整記錄,數(shù)據(jù)降維到會計信息過程中丟掉了本來很有價值的數(shù)據(jù)。在大數(shù)據(jù)技術應用普及的時代,隨著記錄、存儲、處理數(shù)據(jù)能力的不斷提高,可供記錄的數(shù)據(jù)顆粒度更細、體量更大,那些原本被拋棄的“無用”的數(shù)據(jù)現(xiàn)在不僅能夠被記錄,而且可以被納入計算。大數(shù)據(jù)審計可以有效利用數(shù)據(jù)挖掘和處理技術,直接從財務原始數(shù)據(jù)出發(fā)去獲得關鍵審計線索,放棄以往的抽樣審計邏輯,直接基于全樣本數(shù)據(jù),利用大數(shù)據(jù)技術處理海量數(shù)據(jù)并獲得關鍵審計結論。因此,相較于傳統(tǒng)會計信息觀所強調(diào)的現(xiàn)金流水定義,現(xiàn)金軌跡數(shù)據(jù)概念存在顯著不同,它是對資金流動過程中在虛擬電子賬戶中存留的所有數(shù)據(jù)信息進行全方位記錄并直接用于審計活動,改變了原有的審計思維與模式,體現(xiàn)了數(shù)字技術在審計領域的創(chuàng)新應用。
大數(shù)據(jù)審計工作需要將數(shù)據(jù)、分析和審計工作三方面綜合起來進行,通過數(shù)據(jù)采集、數(shù)據(jù)預處理、數(shù)據(jù)存儲等技術對數(shù)據(jù)進行加工處理以獲得價值密度更高的數(shù)據(jù)集?,F(xiàn)金軌跡數(shù)據(jù)來源于企業(yè)內(nèi)部,是整個數(shù)據(jù)挖掘流程的原材料,會計師事務所承接審計業(yè)務后,可以要求被審計單位提供原始的現(xiàn)金軌跡數(shù)據(jù)。海量繁雜的原始數(shù)據(jù)難以直接有效地加以利用,需要經(jīng)過層層數(shù)據(jù)挖掘步驟,對數(shù)據(jù)提純,最終為注冊會計師提供有價值的盡調(diào)分析報告。因此,數(shù)據(jù)挖掘的流程設計至關重要,完整的數(shù)據(jù)挖掘流程包括數(shù)據(jù)預處理、自動校驗數(shù)據(jù)質量、數(shù)據(jù)標簽化處理、多維度數(shù)據(jù)分類與聚類、風險預警、數(shù)據(jù)可視化六步④。
1.數(shù)據(jù)預處理。原始數(shù)據(jù)的質量直接影響到數(shù)據(jù)挖掘的結果,也會進一步影響審計質量和效率。由于財務人員專業(yè)水平、公司系統(tǒng)規(guī)范、開戶銀行提供的流水字段要求不一致或者被審計單位刻意隱瞞等,會計師事務所獲得的原始數(shù)據(jù)往往存在著關鍵字段缺失、數(shù)據(jù)記錄重復、存在異常值、偽造對賬單等問題,為保證數(shù)據(jù)的準確性、完整性、一致性、時效性和可信性等,必須進行數(shù)據(jù)預處理,這是數(shù)據(jù)挖掘的第一步。結合現(xiàn)金軌跡數(shù)據(jù)的特點,數(shù)據(jù)預處理階段的工作主要包括數(shù)據(jù)選擇、數(shù)據(jù)集成、數(shù)據(jù)清洗和數(shù)據(jù)變換。
2.自動校驗數(shù)據(jù)質量。數(shù)據(jù)預處理完成后,系統(tǒng)能夠自動識別每條數(shù)據(jù),為進一步提升審計數(shù)據(jù)質量,保證后續(xù)數(shù)據(jù)挖掘結果的可靠性,需要對數(shù)據(jù)的完整性、重復性、真實性進行校驗。
完整性校驗主要基于連續(xù)性特征,這一特征也是現(xiàn)金軌跡數(shù)據(jù)比財務報表信息真實性更高的原因之一,如果僅關注貨幣資金的余額,那么現(xiàn)金的連續(xù)性特征往往容易被注冊會計師忽略。
重復性校驗的原理與數(shù)據(jù)預處理階段中的數(shù)據(jù)清洗相同,出于數(shù)據(jù)挖掘準確性的考量以及審計要求,被審計單位提供的原始現(xiàn)金軌跡數(shù)據(jù)的時間跨度一般為一年甚至更長,涉及上萬條記錄,而這些記錄往往是經(jīng)由日度、月度數(shù)據(jù)匯總后產(chǎn)生的,在匯總過程中,難免會出現(xiàn)數(shù)據(jù)重疊的情況。重復性校驗能夠補充初次數(shù)據(jù)清洗時的遺漏,通過系統(tǒng)自動捕捉高度相似的記錄,經(jīng)由人工確認后剔除重復記錄,從而避免二次計算對結果產(chǎn)生影響。
真實性校驗主要是根據(jù)各銀行的數(shù)據(jù)特性來校驗數(shù)據(jù)質量,防止虛假的交易記錄。真實性檢驗可以利用數(shù)據(jù)規(guī)律發(fā)現(xiàn)問題,譬如可以進行利息檢查,活期利息與賬戶的每日余額強相關,基于對賬單數(shù)據(jù)所覆蓋的時間范圍及各個銀行活期利息結算規(guī)律,系統(tǒng)可以重新計算活期利息。如果數(shù)據(jù)被篡改過,錯誤的活期利息就會像滾雪球一樣被不斷疊加,進而影響到后期余額,造成真實與賬面的余額差異越來越大。此外,采用Benford相關系數(shù)檢驗,也可以發(fā)現(xiàn)潛在的問題。Benford定律認為,自然界中大部分數(shù)據(jù)(包括財務數(shù)據(jù))的首位數(shù)字n出現(xiàn)的概率大致服從P(n)=log(1+1/n)的分布,當數(shù)據(jù)的分布不滿足該定律時,將存在人為修改數(shù)據(jù)的可能。通過Benford定律進行檢驗,當相關系數(shù)低于0.76時,需要進一步檢查數(shù)據(jù)的真實性。
總的來說,自動校驗環(huán)節(jié)可以基于數(shù)據(jù)本身進行,而不依賴于任何人的經(jīng)驗判斷,數(shù)據(jù)檢驗的客觀性和準確性將會提高。
3.數(shù)據(jù)標簽化處理。在對原始數(shù)據(jù)進行預處理和多次校驗之后,數(shù)據(jù)的質量又將進一步提高,但海量的現(xiàn)金軌跡數(shù)據(jù)依然不能為注冊會計師提供直觀的審計證據(jù),下一步將根據(jù)每條數(shù)據(jù)的特征以及審計重點、重要性水平等,給每條數(shù)據(jù)打上專屬標簽,便于后續(xù)從不同維度進行分類處理?,F(xiàn)金軌跡數(shù)據(jù)的標簽化處理是分類和聚類分析的前提,標簽的類型主要分為客觀標簽和智能標簽兩類。客觀標簽依據(jù)的信息較為明確,主要包括交易的時間、金額以及對方名稱。智能標簽針對的是現(xiàn)金軌跡數(shù)據(jù)中文本字段的內(nèi)容,主要運用自然語言處理(NLP)技術,對對手方名稱、企業(yè)備注、銀行備注進行關鍵詞的自動抽取,按照每個關鍵詞出現(xiàn)的權重進行分類。
4.多維度數(shù)據(jù)分類與聚類。在每條數(shù)據(jù)都打上標簽之后,系統(tǒng)可以根據(jù)這些特征對數(shù)據(jù)進行分類。比如根據(jù)重要性水平,定義大額交易,將標簽為100萬~300萬元、300萬元以上的數(shù)據(jù)都分類為大額交易。從邏輯關系上來說,每一種分類均由滿足幾個共同標簽的數(shù)據(jù)組成。
數(shù)據(jù)聚類是指將數(shù)據(jù)劃分成組或簇的過程,與數(shù)據(jù)分類不同,選擇聚類方法的數(shù)據(jù)的類標簽是未知的。由于部分數(shù)據(jù)反映的信息有誤或者模棱兩可,無法確定合適的標簽進行分類,對于這部分數(shù)據(jù),可以通過相關性聚類的方法,利用計算機的無監(jiān)督或半監(jiān)督學習,挖掘數(shù)據(jù)之間的內(nèi)在聯(lián)系,從而建立新的標簽或者添加到已有標簽中去,以確保每條交易記錄都貼上相應的標簽,便于后續(xù)檢索。
總的來說,基于歷史現(xiàn)金軌跡數(shù)據(jù)建立數(shù)據(jù)模型進行預測,可以得到相應的類標簽結果,根據(jù)類標簽結果可以對交易記錄進行分類預測;而對于缺少類標簽的交易記錄,可借助聚類分析的方法挖掘隱藏的內(nèi)部規(guī)律,進一步輔助分類。值得注意的是,每條數(shù)據(jù)的類標簽并不是唯一的,因為每個字段能夠反映出數(shù)據(jù)的不同維度,從不同維度出發(fā)都將獲得不同的標簽號,這些標簽號組合在一起,將形成每條數(shù)據(jù)與眾不同的特征。
5.風險預警。在對多維的現(xiàn)金軌跡數(shù)據(jù)進行分類與聚類處理后,數(shù)據(jù)檢索將變得切實可行,系統(tǒng)可以通過設置不同的算法檢索出可能存在異常的數(shù)據(jù),從現(xiàn)金流層面評估被審計單位在貨幣資金項目中存在的風險。
首先是異常值預警?,F(xiàn)金軌跡數(shù)據(jù)層面的異常值不僅包括金額上的極大值和極小值,還包含數(shù)據(jù)的周期性波動,比如穩(wěn)定的供應商付款頻率發(fā)生變化,租金、快遞費用等日常經(jīng)營支出在某月突然中斷等,都屬于異常值預警的范疇。其次是大額收支預警。系統(tǒng)在所有的支出記錄—供應商支付這個類別的交易中,針對交易時間為90天以內(nèi)的數(shù)據(jù)進行如下條件的篩選預警:滿足單筆交易金額≥50萬元的供應商付款數(shù)據(jù),且該筆交易金額≥企業(yè)對該供應商3年內(nèi)所有支出金額的P75⑤×2,則這筆交易默認為大額支出。如果篩選出數(shù)據(jù)對應的供應商在3年以內(nèi)的交易筆數(shù)<10筆,則不參與預警計算提示,付款失敗后的重新支付也不計算在內(nèi)。大額收入的篩選方法與支出預警相同。最后是疑似挪用公款預警。系統(tǒng)對超過1條的數(shù)據(jù)進行如下邏輯的篩選并預警:在90天的時間范圍內(nèi),針對同一個交易對手方,如果對該對手方(個人)有一筆支出交易發(fā)生后,30天內(nèi)又發(fā)生了一筆同樣對手方和同樣金額的收入交易,且單筆交易金額≥5萬元,則系統(tǒng)預警此類交易為疑似挪用公款交易。付款失敗后的重新支付不計算在內(nèi),同時排除非整數(shù)金額。
6.數(shù)據(jù)可視化。數(shù)據(jù)可視化隱藏了數(shù)據(jù)挖掘背后復雜的數(shù)據(jù)和算法,最終以直觀、淺顯易懂的圖表形式向用戶展現(xiàn)所需的信息,注冊會計師可以通過圖表了解被審計單位在完整審計期間內(nèi)資金的變化情況。根據(jù)注冊會計師的審計需要,現(xiàn)金軌跡數(shù)據(jù)挖掘的可視化產(chǎn)品是盡調(diào)分析報告。盡調(diào)分析報告中主要通過基本的統(tǒng)計描述圖表反映不同維度下的企業(yè)現(xiàn)金分布情況,包括直方圖、散點圖、分位數(shù)圖、餅狀圖等,根據(jù)適用的圖表類型繪制,比如:根據(jù)交易發(fā)生時間(分鐘級別數(shù)據(jù)),繪制交易時間頻率分布圖,觀察各時段交易發(fā)生的頻率分布;根據(jù)公司賬戶支出/收入/余額(時間序列數(shù)據(jù),人民幣為記賬本位幣),繪制收入支出頻數(shù)對比圖,觀察各時段賬戶進出賬金額分布,尋找異常金額值,并分析收支關聯(lián)信息;根據(jù)企業(yè)和銀行的備注,推測出每筆交易的用途,判斷款項類型,繪制出收入(支出)類型餅狀圖。
A公司是一家致力于研發(fā)和銷售特色甜品的餐飲企業(yè),經(jīng)營范圍內(nèi)的許可項目為食品銷售,一般項目包括餐飲企業(yè)管理、品牌管理、餐飲服務和工藝禮品銷售等。A公司下設一家子公司a,其上游公司主要涉及乳業(yè)、食品、物業(yè)、廠房租賃、塑料制品等幾十家公司,下游公司以外賣平臺和第三方支付平臺為主。
A公司聘請Z會計師事務所為其進行上市審計,在獲取了A公司的原始數(shù)據(jù)后,由于數(shù)據(jù)體量龐大、時間跨度長、涉及跨銀行條目眾多,Z會計師事務所利用現(xiàn)金軌跡數(shù)據(jù)挖掘的流程與方法,從海量數(shù)據(jù)中層層抽絲剝繭,發(fā)現(xiàn)A公司的某筆貸款行為和供應商付款情況疑似異常。
1.識別疑似騙取貸款。在對A公司(被審計方)及a公司(A公司的子公司)的銀行交易記錄實施一系列數(shù)據(jù)挖掘流程后,大額收支預警提示,系統(tǒng)鎖定出其中兩條大額現(xiàn)金軌跡數(shù)據(jù)。第一條數(shù)據(jù)是金額為1000萬元的現(xiàn)金支出,由A公司付款給B公司(根據(jù)其他信息顯示,B公司為A公司穩(wěn)定的上游供應商),識別出該條數(shù)據(jù)的算法為:系統(tǒng)在所有支出記錄—供應商支付這一類別的交易中,針對交易時間為90天以內(nèi)的交易進行篩選預警,篩選條件為單筆交易金額≥50萬元的供應商付款支出,且該筆交易金額≥企業(yè)對該供應商3年內(nèi)所有支出金額的P75×2,滿足以上條件的交易默認為大額支出。第二條數(shù)據(jù)是現(xiàn)金流入,金額也為1000萬元,由未知賬戶X流入A公司,識別出該條數(shù)據(jù)的算法與第一筆類似:在所有現(xiàn)金流入的交易中,針對交易時間為90天以內(nèi)的交易進行篩選預警,篩選條件為單筆交易金額≥50萬元的客戶收款記錄,且該筆交易金額≥企業(yè)對該客戶3年內(nèi)所有收入金額的P75×2,滿足以上條件的交易默認為大額收入。
根據(jù)銀行提供的信息,A公司支付給供應商B公司的貨款1000萬元系銀行貸款所得,在按照既定程序完成了信用風險評估后,銀行批準了該項以償付貨款為目的的企業(yè)貸款。有明確的銀行交易記錄證明,A公司在獲取1000萬元貸款后第一時間將資金匯入了B公司賬戶,但就在該筆交易發(fā)生3天之后,又存在未知賬戶X匯入1000萬元到A公司賬戶。由于兩筆交易金額相同,現(xiàn)金流入與流出的時間間隔相近,初步懷疑A公司的貸款行為存在異常,因此,需要對該1000萬元貸款相關的現(xiàn)金軌跡展開進一步核查。
首先,確定核查的時間范圍。根據(jù)以往的審計經(jīng)驗和現(xiàn)金軌跡的運動規(guī)律,A公司潛在的非正常資金運作極可能發(fā)生在鎖定的兩筆現(xiàn)金流出與流入之間,因此以這兩筆1000萬元支出與收入發(fā)生的時間分別為起、止點,明確核查的時間跨度為3天。其次,確定核查的賬戶范圍。在已獲取的A公司及其子公司a公司的所有銀行交易記錄中,選取對方賬戶名稱為B公司、A公司(對a公司而言)、a公司(對A公司而言)及X賬戶的記錄條目。最后,確定核查的金額范圍。對于金額維度,系統(tǒng)設定的篩選條件為單筆或拆分后總金額與1000萬元差異在5%以內(nèi)的交易⑥,包括現(xiàn)金的支出與收入,該篩選方法考慮了拆分收付款的可能性。在執(zhí)行了上述核查程序后,結果發(fā)現(xiàn):在a公司的交易記錄中,存在一筆來自B公司1000萬元的現(xiàn)金流入和兩筆匯入X賬戶的現(xiàn)金流出,金額分別為100萬元和900萬元。在查找了有向圖中的所有環(huán)路之后⑦,最終重構出完整的現(xiàn)金運動軌跡,如圖3所示。
圖3 A公司疑似騙貸現(xiàn)金軌跡
2.識別客戶異常付款。A公司在日常經(jīng)營活動中發(fā)生的付款事項主要包括供應商采購、日常運營(租金、維修費、水電能源費)等,一般來說,在正常經(jīng)營狀態(tài)下,這些支出在時間維度上會呈現(xiàn)出周期性規(guī)律,且金額也穩(wěn)定在一定區(qū)間內(nèi)。利用現(xiàn)金軌跡數(shù)據(jù)的時間特征,將付款信息與A公司的歷史數(shù)據(jù)進行縱向比較,識別出違背以往周期性規(guī)律的單筆付款數(shù)據(jù)。
考慮到識別客戶異常付款記錄的準確度,需要根據(jù)付款方及付款理由的不同,分別查看。一般來說,根據(jù)原始數(shù)據(jù)中的備注字段以及后續(xù)數(shù)據(jù)的預處理,所有對手方的付款記錄都對應了各自不同維度的標簽,比如由付款理由劃分的貨款結算、借款利息收入等,由賬戶名稱和賬戶號區(qū)分出的不同付款方,包括公司和個人。
在調(diào)查A公司客戶的付款情況時,在所有客戶付款記錄下,選取了A公司較為穩(wěn)定的客戶B公司一年內(nèi)的付款情況,據(jù)此生成B公司付款周期散點圖,見圖4。
圖4 B公司付款周期散點圖
根據(jù)散點分布情況,可以看出:B公司對A公司的付款周期為半個月,且每次付款時間主要集中在月中(每月15日前后)和月末(每月30日前后),這些規(guī)律在Z會計師事務所與A公司溝通后得到了初步證實。此外,由于涉及銀行轉賬等資金往來,企業(yè)間的交易一般發(fā)生在工作日(周一到周五)。結合以上規(guī)律,可觀察到a、b、c三點存在一定異常,a點交易發(fā)生在月初,b、c點交易發(fā)生在非工作日,值得審計人員進一步關注。
同時,根據(jù)大量的企業(yè)實際調(diào)研,從每日24h內(nèi)交易發(fā)生的次數(shù)來看,企業(yè)的交易發(fā)生時間段主要集中在工作時間內(nèi),且呈現(xiàn)出雙駝峰或三駝峰的趨勢,具體分布如圖5所示。
圖5 A公司24h內(nèi)平均交易次數(shù)分布折線圖
圖5顯示,A公司的交易發(fā)生時間段大體滿足規(guī)律分布,7點為交易高峰期,10~11點、13點為交易次高峰,6點之前和18點之后,交易次數(shù)呈現(xiàn)斷崖式下降。凌晨尤其在0點前后的交易,多為銀行自動處理。根據(jù)上述規(guī)律,查看付款周期中識別出的a、b、c三點具體的交易時間,可進一步判斷B公司付款的合理性。在調(diào)出原始記錄后發(fā)現(xiàn),a點交易發(fā)生在工作時間內(nèi),A公司在收到款項后當天,即發(fā)生了大額采購支出,據(jù)此推測A公司可能要求B公司提前付款,以滿足自身資金周轉需求;b、c點交易均發(fā)生在周末18點之后,僅從現(xiàn)金軌跡數(shù)據(jù)的層面無法得到合理解釋,因此應當作為重點關注的付款交易,由注冊會計師結合其他審計程序進一步查明。
3.實例應用評價。相比于傳統(tǒng)的審計方法,利用數(shù)據(jù)挖掘技術的好處在于:核查范圍有能力涵蓋企業(yè)全部原始現(xiàn)金交易記錄,識別過程中的篩選算法沒有割裂每條數(shù)據(jù)間的勾稽關系,而是通過篩選條件一步步將相互關聯(lián)的現(xiàn)金軌跡數(shù)據(jù)從海量數(shù)據(jù)中選取出來,推測出合乎邏輯的現(xiàn)金流動關系,同時還能利用歷史數(shù)據(jù)驗證新數(shù)據(jù),推測出不符合歷史規(guī)律的異常值,有效地彌補了人工審計的短板。
對于騙貸行為的識別,本質上抓住了企業(yè)正常消耗貸款后,一般會假借多個關聯(lián)方將資金轉回的心理,以1000萬元為線索追蹤現(xiàn)金在幾個賬戶間往來的蛛絲馬跡,蘊含了經(jīng)驗總結而來的審計邏輯,但也存在一定偶然性,一旦1000萬元在更長的時間跨度內(nèi)被拆分成更多筆更小金額的交易在更多賬戶間流入與流出,核查的難度將大大增加。
在識別客戶異常付款行為中,客戶的回款能力主要體現(xiàn)為基于時間特征的及時性和周期性,這些付款規(guī)律也是識別異常的主要依據(jù)。面對海量的付款數(shù)據(jù),如果沒有明確的規(guī)則指引,僅靠人工將無從查起。當然,這些規(guī)律受制于企業(yè)及其客戶本身的規(guī)模和內(nèi)部控制的嚴格程度,一些管理混亂的企業(yè)本身的對外付款情況很可能是雜亂無章的,因此,如果客戶付款的散點分布情況無規(guī)律可循,也值得企業(yè)特別關注。
由此可見,利用現(xiàn)金軌跡數(shù)據(jù)挖掘的方法能夠在很大程度上幫助審計人員發(fā)現(xiàn)問題,但挖掘方法本身的設定也離不開審計經(jīng)驗和規(guī)律總結,計算機技術是輔助手段,審計人員仍需參考其他審計證據(jù),作出理性判斷。因此,無論是疑似騙取貸款還是客戶異常付款問題,上述流程設計都僅從數(shù)據(jù)角度對異?,F(xiàn)象提出疑問,并不能百分百確定A公司存在隱瞞欺詐行為,若要進一步證實結論,還需挖掘每條數(shù)據(jù)背后更深層的語義特征。具體來說,在Z會計師事務所獲取大數(shù)據(jù)分析報告后,針對疑似騙貸的事項,審計人員需要大量調(diào)取相關交易的原始憑證,詢問貸款銀行、供應商B公司等,針對客戶異常付款情況,需要向A公司及其供應商詢問,評價每項交易商業(yè)理由的真實性和合規(guī)性,才能得出更加可靠的審計結論。
由于上市公司財務報表質量不佳、貨幣資金舞弊行為頻繁出現(xiàn),社會公眾以及監(jiān)管機構對于獨立第三方會計師事務所的審計責任要求越來越高。盡管如此,實際審計過程中,注冊會計師依然面臨重重“內(nèi)憂外患”:被審計單位資金流水體量龐大,數(shù)據(jù)真實性與完整性難辨;許多會計師事務所依然采用傳統(tǒng)的審計方式進行人工核查,不僅效率極低,而且難以發(fā)現(xiàn)問題。由于技術手段的欠缺以及上市公司的刻意隱瞞,為免于擔責,會計師事務所有時只能被迫辭任。否則,對于上市公司的貨幣資金舞弊行為,接受審計業(yè)務委托的會計師事務所總是難辭其咎,在證監(jiān)會給會計師事務所開出的一張張“罰單”中,往往明確指出:“針對貨幣資金審計程序,注冊會計師未勤勉盡責?!碑斍?,大數(shù)據(jù)技術的發(fā)展為會計師事務所擺脫這一困境提供了良好的契機,越來越多的會計師事務所逐步將數(shù)據(jù)采集、數(shù)據(jù)挖掘以及分析預測技術等應用到審計業(yè)務中,以注冊舞弊審查師協(xié)會(ACFE)為代表的機構,也積極開展大數(shù)據(jù)反舞弊、大數(shù)據(jù)審計等業(yè)務交流活動,用大數(shù)據(jù)技術助力未來的審計行業(yè)發(fā)展。
本文認為,未來會計、審計領域的變革必將借助大數(shù)據(jù)技術的東風,實現(xiàn)質變的飛躍。如何利用好原始的現(xiàn)金軌跡數(shù)據(jù)乃至未來的其他財務數(shù)據(jù),運用數(shù)據(jù)挖掘等諸多技術將這些數(shù)據(jù)加工為有價值的信息,是未來會計與審計重點的發(fā)展應用方向之一。未來大數(shù)據(jù)技術在會計、審計領域的應用過程中,應注重以下幾點:
1.擴大數(shù)據(jù)源,提升數(shù)據(jù)感知能力。從數(shù)據(jù)到信息的加工處理過程中,數(shù)據(jù)是基礎的原材料,是整個系統(tǒng)的起點,數(shù)據(jù)量越豐富,最終獲取的信息量很可能越大。對企業(yè)來說,現(xiàn)金軌跡數(shù)據(jù)只是眾多原材料中的一種,還有更多的原始數(shù)據(jù)亟待深入挖掘,無論是財務數(shù)據(jù)還是非財務數(shù)據(jù),都可以運用更敏銳的數(shù)據(jù)感知設備選擇并采集有價值的數(shù)據(jù)并納入系統(tǒng),這對拓展會計、審計領域應用實踐具有重要作用。
2.優(yōu)化算法,推動系統(tǒng)迭代升級。算法是由數(shù)據(jù)形成信息的工具,由于整個系統(tǒng)的要素一直隨著環(huán)境和使用者需求的變化而處于不斷變化之中,算法也需要順勢而變,不斷優(yōu)化升級。一方面,針對同樣的原材料,不同的算法會導致不同的信息產(chǎn)物,這就要求算法具有多樣性;另一方面,隨著數(shù)據(jù)量的增加,原有的算法很可能不再適用,需要面對新的原材料,設計新的算法,這就要求算法具有更新性。
3.發(fā)揮人力在系統(tǒng)中的協(xié)調(diào)作用。在計算機日益發(fā)達從而取代大量人工的時代,人力仍然是整個會計系統(tǒng)中最靈活的要素,其在系統(tǒng)中發(fā)揮的協(xié)調(diào)、把控作用是無可取代的。無論是識別有價值的數(shù)據(jù),還是制定匹配的算法,都離不開人的參與,數(shù)字技術在會計與審計領域的嵌入并不意味著對人的替代,不斷提升人力的專業(yè)素質,以及在人際協(xié)同發(fā)展中更好地發(fā)揮各自的價值將是更為有效的發(fā)展方向。
【注 釋】
①需要指出,本文現(xiàn)金軌跡數(shù)據(jù)聚焦于銀行交易記錄,企業(yè)內(nèi)部庫存現(xiàn)金直接收付較少,因此忽略不計。此外,由于現(xiàn)金具有同質性,現(xiàn)金軌跡數(shù)據(jù)研究的是現(xiàn)金總量的變化情況,而非對某一貨幣的追蹤。比如,從企業(yè)某賬戶中流入的100元與流出的100元盡管并非同一貨幣,但由于二者是同質的,在研究時將被作為企業(yè)現(xiàn)金的一部分,無差別地納入考量。
②出自清朝縣令黃六鴻的《福惠全書·錢谷·流水收簿》一書,為“流水”一詞引申義的由來。
③由于筆者已詳細闡釋了本文的核心概念——現(xiàn)金軌跡數(shù)據(jù),為避免混淆,下文將不再出現(xiàn)“現(xiàn)金流水”“軌跡數(shù)據(jù)”等概念,統(tǒng)一由“現(xiàn)金軌跡數(shù)據(jù)”代替。
④本文數(shù)據(jù)獲取方法、處理技術及案例應用均來源于“見知數(shù)據(jù)公司”,該公司建立了現(xiàn)金流盡調(diào)平臺,可智能核查每一條流水信息,讓數(shù)據(jù)缺失、流水造假無所遁形,并且通過對數(shù)據(jù)的分析梳理,可以發(fā)覺核心客戶、關聯(lián)交易以及隱性負債等盡調(diào)風險,及時發(fā)現(xiàn)隱藏漏洞。
⑤P75表示上四分位數(shù)金額。
⑥疑似拆分付款的篩選算法在流程設計中已詳細說明,5%為根據(jù)以往案例總結得出的安全邊際。
⑦每個賬號之間的交易,即識別出的每一條數(shù)據(jù)本質上可以看作賬戶到賬戶之間的一條路徑,將所有路徑連接起來,利用算法判斷是否存在閉合的環(huán)路,上述案例中有環(huán)路則表示最初流出企業(yè)的貸款極有可能又回到了企業(yè)。