財務欺詐行為會給一個組織的長期可持續(xù)發(fā)展帶來嚴重后果,也會對其雇員、投資者以及整體經濟產生不利影響。美國歷史上幾起大的破產案件均涉及參與大型欺詐行為的公司。此外,這個問題似乎有全球影響力。注冊舞弊稽核師協(xié)會估計,世界范圍內每年的財務欺詐損失超過1萬億美元。這一估計是基于記錄的數百個每年發(fā)生在歐洲、亞洲、非洲、南北美洲和大洋洲的財務欺詐案例以及許多未發(fā)現(xiàn)的欺詐(和由此造成的損失)事實。因此,促進檢測財務欺詐行為的自動化方法的發(fā)展越來越受重視。然而,大多數方法產生的效果并不理想。因此,繼續(xù)檢測財務欺詐是商業(yè)智能技術面臨的一項重要挑戰(zhàn)。
現(xiàn)有的財務欺詐檢測方法無法提供足夠的欺詐檢測功能,大多數對美國公司的研究發(fā)現(xiàn)檢出率小于70% 。此外,許多之前的研究利用內部(即非公用的)數據,獲取時成本高且耗時,而且通常對很多利益相關者來說不可用。
最近商業(yè)智能(BI)技術的發(fā)展已經提升了與復雜問題域相關的發(fā)現(xiàn)模式的潛力,例如欺詐。因為BI工具有助于更好地了解組織的內外部環(huán)境,強有力的財務欺詐檢測方法可使利益相關者群體獲益:投資者、審計公司和監(jiān)管機構。
為實現(xiàn)這一目標,我們采用設計科學范式來指導IT項目,元欺詐框架的開發(fā) 。在這樣做的過程中,我們選擇了元學習作為內核理論來指導IT項目的設計。元學習是一種特殊的機器學習形式,能夠了解學習過程本身,以增強獲取結果的質量。元欺詐框架包括四部分,提倡使用源于公開可獲取的財務報表和強有力的分類機制的一套豐富的措施。
先前的研究使用來自美國公司的數據普遍獲得不充分的結果,典型地,欺詐檢出率低于70%。這些結果導致有人提出,基于財務報告的數據不能準確識別財務欺詐(至少在美國公司這一環(huán)境中)。普華永道的研究人員最近做了一項研究獲得64%或更低的欺詐檢出率 。這些研究和之前的其他研究局限性的結果表明使用財務方法和分類方法不夠。
設計科學是一種強有力的范式,對IT項目的開發(fā)提供了具體的指示,包括構造、模型、方法和實例 。在設計科學范式中,方法定義過程。它們?yōu)槿绾谓鉀Q問題提供了指南,那就是,如何搜索答案空間 。先前的幾個研究已經利用設計科學方法開發(fā)BI 技術包括方法和實例。因此,我們受啟發(fā)開發(fā)了一種強有力的財務欺詐檢測框架(即,方法)。
在缺乏足夠的設計指導方針下創(chuàng)建IT項目,許多研究強調需要設計理論來幫助統(tǒng)領開發(fā)進程。我們用元學習作為一種核心理論來指導所提議的財務欺詐檢測框架的開發(fā) (Brazdil et al. 2008)。
元學習是一種特殊的機器學習形式,使用通過機器學習或數據挖掘過程獲得的專門知識來改善在未來應用中獲取的結果的質量 (Brazdil et al. 2008)。盡管機器學習提供了大量的算法來完成一項任務卻沒有提供有關特定算法的具體應用環(huán)境的指南指導,相反,元學習提供了解學習過程本身的方式來獲得關于哪些基本功能和算法可以得到最有效應用的知識 (Brazdil et al. 2008)。我們假定一種元學習方法特別適合于財務欺詐檢測,由于該問題域的復雜性,動態(tài)性和對抗性 (Virdhagriswaran and Dakin 2006)。
20 世紀80年代末 90 年代初大量研究者開發(fā)了元學習,他們試圖整合幾種機器學習策略來提高整體精度(e.g., Wolpert 1992)。元學習術語是由 Chan and Stolfo (1993)創(chuàng)造的,他們提出以自適應方式結合多種機器學習技術的結果來提高精度的方法。 這種方法已演變成在各種各樣的應用程序域中研究的活動流 (Brazdil et al.2008; Vilalta and Drissi 2002)。共同地,元學習提供了大量的指南來提高關于特定問題任務的機器學習能力。
在機器學習中,學習偏差指任何偏好選擇一種假設,而該假設解釋了同樣被其他假設所接受的數據 (Mitchell 1997)。從另一個層面看,元學習的兩個關鍵方面是聲明性和程序性偏差(Brazdil et al. 2008)。聲明性偏差指定表示假設空間,它受所含屬性數量和類型的約束(即,特征空間)。程序性偏差屬于分類器以某種方式來對歸納假設排序強加限制。
一種有效的元學習策略會為給定的分類任務動態(tài)識別聲明性和程序性偏差的適當級別(Vilalta and Drissi 2002)。聲明性偏差可以通過改變特征空間受到操縱(即,通過擴展或收縮),而程序性偏差可以通過選擇合適的預測模型或組合模型來改(Giraud-Carrier et al. 2004; Vilalta and Drissi 2002)。
元欺詐框架是非常有效的,對于不同的利益相關者成本設置,合法的和欺詐召回超過80%。元欺詐顯著改善性能勝過現(xiàn)有方法。使用元學習方法增強財務欺詐檢測的可行性。(作者單位為山西財經大學會計學院)