趙于卓 黃子瑩
摘 要:本文在回顧舞弊識別理論、指標(biāo)和模型研究相關(guān)文獻(xiàn)的基礎(chǔ)上,以482個舞弊公司和非舞弊公司為研究樣本,基于舞弊三角理論選取財務(wù)指標(biāo)、財務(wù)增量指標(biāo)和非財務(wù)指標(biāo)構(gòu)建綜合指標(biāo)體系,得到GA-BP舞弊識別模型。大數(shù)據(jù)技術(shù)下數(shù)據(jù)全面化、多維化的特點賦予審計對象,審計過程多元化、復(fù)雜化的特征,給審計工作帶來新的挑戰(zhàn),將大數(shù)據(jù)技術(shù)和舞弊識別模型創(chuàng)新結(jié)合能賦予審計工作以新的生命力,為全面審計提供堅實的基礎(chǔ),提高審計質(zhì)量和效率。
關(guān)鍵詞:財務(wù)舞弊;GA-BP模型;舞弊三角理論;大數(shù)據(jù)
中圖分類號:F275 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-0298(2021)06(b)--05
近年來國內(nèi)財務(wù)舞弊案件迭出,如2019年的康美藥業(yè)、康得新以及2020年的瑞幸等,不僅損害了投資者利益和市場可信度,影響證券市場資源配置功能的發(fā)揮,還對中國上市公司的聲譽造成嚴(yán)重影響。舞弊動因更加復(fù)雜多樣,舞弊方式不斷新式化,國家對上市公司的監(jiān)管也日益加強,識別公司財務(wù)舞弊的方法成為社會焦點。
本文以舞弊三角理論為基礎(chǔ),結(jié)合前人已有研究,構(gòu)建了基于財務(wù)信息與非財務(wù)信息的指標(biāo)體系,共計64個指標(biāo),作為智能算法識別舞弊的基礎(chǔ)。根據(jù)412個公司樣本擬合,并用70個樣本進(jìn)行測試,得到了一個精準(zhǔn)有效的GA-BP舞弊識別模型。同時將模型進(jìn)行擴(kuò)展,為構(gòu)建一個以數(shù)據(jù)處理為核心組織,基于大數(shù)據(jù)技術(shù)進(jìn)行自動分析與識別的審計框架提供了初步方案。
1 文獻(xiàn)綜述
1.1 舞弊動因理論
孫麗亞(2010)從“三元素”理論出發(fā),分析三元素的內(nèi)在關(guān)系,創(chuàng)建了與舞弊特征相關(guān)的識別卡。洪葒等(2012)利用“GONE”理論探究得出影響五項舞弊發(fā)生的重大因素。此外,管楊威等(2014)選擇“CRIME”舞弊動機(jī)五因素論為研究依據(jù),對60個上市公司舞弊與非舞弊樣本進(jìn)行對比檢驗獲得較好應(yīng)用能力的識別模型。
1.2 舞弊指標(biāo)
彭子坤等(2013)立足非財務(wù)指標(biāo)從舞弊行為的根本原因出發(fā)認(rèn)識該行為,以公司治理信息和外部環(huán)境信息來對非財務(wù)信息進(jìn)行分類,分析現(xiàn)在舞弊識別中的缺陷與滯后性。而熊方軍(2015)立足財務(wù)指標(biāo),通過對幾十家舞弊和非舞弊公司的16個財務(wù)指標(biāo)構(gòu)建以Logistic模型為基石的舞弊識別方法,對數(shù)據(jù)進(jìn)行剖析后認(rèn)為:公司財務(wù)指標(biāo)的數(shù)據(jù)樣本容量大小影響著預(yù)測正確率,容量越小正確率越高。
1.3 舞弊識別模型
夏明等(2015)選取神經(jīng)網(wǎng)絡(luò)組合模型,以BP、RPF神經(jīng)網(wǎng)絡(luò)的實驗結(jié)果為基礎(chǔ),提出RPF-BP組合模型,效法于生物體內(nèi)神經(jīng)網(wǎng)絡(luò),具有較好的自適應(yīng)及容錯性和應(yīng)用性,為有效識別會計舞弊提供了新的思路和方法。與之不同的是楊貴軍等(2019)使用基于Benford律的Logistic模型,創(chuàng)造性地提出創(chuàng)建一個Benford因子并將其帶入到Logistic模型。另外,潘夢雪(2019)基于有較高準(zhǔn)確率的預(yù)測算法隨機(jī)森林,結(jié)合2014—2017年400多家有舞弊行為的公司進(jìn)行建模驗證,得到具有實用價值的風(fēng)險識別模型。
由上述的文獻(xiàn)可以得知,在舞弊識別模型、指標(biāo)、舞弊動因理論的選擇上,學(xué)術(shù)界針對不同方向都得到了較為豐富的成果。本文旨在前人研究的基礎(chǔ)上進(jìn)行創(chuàng)新性優(yōu)化,以期獲得具有更高可信度和實用價值的舞弊識別模型。
2 GA-BP模型構(gòu)建
2.1 神經(jīng)網(wǎng)絡(luò)選取
人工神經(jīng)網(wǎng)絡(luò)中的BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)應(yīng)用最為廣泛,其常見結(jié)構(gòu)有三層,分別是輸入、隱含與輸出層,不同層之間的神經(jīng)元之間可以利用通道進(jìn)行信息傳輸。神經(jīng)元與通道構(gòu)成了一個非線性有向圖,具有很強的學(xué)習(xí)能力與處理能力,可以根據(jù)輸入數(shù)據(jù)修改每條通道的權(quán)重,從而映射出未知結(jié)構(gòu)的數(shù)據(jù)關(guān)系。
該模型的重點在于權(quán)矩陣的確定。選取個學(xué)習(xí)樣本,每個樣本有個指標(biāo)值和1個輸出值,所以期望輸出值構(gòu)成了目標(biāo)向量,輸出值構(gòu)成了向量,把與之間的誤差逐層逆向傳遞給上一層,通過不斷修正神經(jīng)元間信號通道的權(quán)重來減少誤差,當(dāng)誤差減小到預(yù)先設(shè)定的標(biāo)準(zhǔn),則學(xué)習(xí)狀態(tài)結(jié)束。
2.2 遺傳算法優(yōu)化
雖然BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力較強,但收斂速度較慢,易困于局部最優(yōu)解,為克服這一缺點選用遺傳算法(Genetic Algorithm ,GA)進(jìn)行優(yōu)化。遺傳算法借鑒自然界遺傳機(jī)制與適者生存思想,模擬生物遺傳進(jìn)化過程,通過選擇、交叉、變異等操作循環(huán)繁殖來挖掘最優(yōu)個體,縮小最優(yōu)解范圍,用于優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型的權(quán)值閾值。
2.3 GA-BP模型構(gòu)建
GA-BP模型算法的主要步驟如下。
2.3.1 網(wǎng)絡(luò)初始化
首先需要確定神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),包括網(wǎng)絡(luò)層數(shù)和權(quán)值閾值個數(shù),并賦予初始值,確定網(wǎng)絡(luò)的學(xué)習(xí)規(guī)則,這里引入動量項,使得學(xué)習(xí)因子可以根據(jù)需要變化。其中
為學(xué)習(xí)因子,影響網(wǎng)絡(luò)收斂速度;為動量因子,影響誤差修正力度,一般取0.9。
2.3.2 種群初始化
確定染色體的長度并進(jìn)行編碼,產(chǎn)生一個初始種群,每一個都代表網(wǎng)絡(luò)中一個對應(yīng)的權(quán)重。
2.3.3 適應(yīng)度函數(shù)
將網(wǎng)絡(luò)預(yù)測誤差絕對值和的倒數(shù)作為遺傳算法中的適應(yīng)度函數(shù)。
2.3.4 遺傳操作
(1)選擇操作
根據(jù)適應(yīng)度函數(shù)計算個體適應(yīng)值作為篩選依據(jù),采用輪盤賭注法確定父代染色體,適應(yīng)度值越大被選中的概率越高,體現(xiàn)了適者生存思想。第個染色體被選中的概率為:
(2)交叉操作
根據(jù)數(shù)值交叉法,以交叉概率對染色體、的第個基因進(jìn)行交叉操作,產(chǎn)生新個體和,其余部分直接進(jìn)行復(fù)制。
(3)變異操作
以突變概率對染色體的第個基因進(jìn)行突變操作產(chǎn)生新個體。
2.3.5 尋找最優(yōu)個體
根據(jù)每次計算的適應(yīng)度值進(jìn)行判斷,若達(dá)到設(shè)定的精度要求,或循環(huán)次數(shù)達(dá)到所設(shè)的最大迭代次數(shù),則循環(huán)終止得到最優(yōu)個體,解碼便可獲取最優(yōu)權(quán)值、閾值。
2.3.6 訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)
將最優(yōu)權(quán)值、閾值賦給BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,計算輸出向量與目標(biāo)向量的總誤差,若未達(dá)到預(yù)定標(biāo)準(zhǔn)則反向更新權(quán)值、閾值,通過正反向的交替過程逐步提高預(yù)測精度,如圖1所示。
3 樣本及指標(biāo)體系
3.1 樣本選擇
本文研究數(shù)據(jù)全部來自證監(jiān)會、國泰安CSMAR數(shù)據(jù)庫以及滬深證券交易所。
(1)舞弊樣本選擇??紤]到處罰決定與行為發(fā)生相比存在一定的時滯性,近期存在舞弊行為的公司可能未被處罰,導(dǎo)致被誤認(rèn)為非舞弊公司,本文所選取的舞弊公司樣本來源于2015—2019年證監(jiān)會處罰公告,最終選取了2014—2018年發(fā)生舞弊的263個公司。
樣本篩選過程考慮以下方面。由于處罰原因并非都是舞弊,所以擅自改變資金用途、操縱股價等非舞弊行為導(dǎo)致違規(guī)的樣本需剔除;部分上市公司多年度發(fā)生了舞弊行為,為避免樣本重復(fù)僅選擇第一次發(fā)生舞弊年份的信息;剔除金融業(yè)上市公司,因報表結(jié)構(gòu)與其他行業(yè)差異較大;剔除ST公司及上市未滿三年的公司,具體如表1所示。
(2)非舞弊樣本選擇。為了避免樣本規(guī)模因素對模型構(gòu)建產(chǎn)生影響,按照舞弊樣本與非舞弊樣本1∶1的原則選取對應(yīng)年度的263個非舞弊公司樣本。
篩選原則為可比性。配對的兩個公司資產(chǎn)總額比值控制在80%~120%;具有相同的股票代碼開頭;所處行業(yè)相同,行業(yè)劃分以證監(jiān)會行業(yè)分類(2012)中的第一級作為依據(jù)。非舞弊公司在配對年度需已上市滿三年。
3.2 指標(biāo)選取
(1)財務(wù)信息指標(biāo)。根據(jù)舞弊三角理論可知財務(wù)指標(biāo)可以在一定程度上反映出公司的經(jīng)營壓力,基于客觀性和可行性的原則,本文從償債能力、經(jīng)營能力、盈利能力等七大方面選取了典型財務(wù)指標(biāo),以反映公司的發(fā)展?fàn)顩r,如表3所示。
(2)財務(wù)信息增量指標(biāo)。當(dāng)公司處于穩(wěn)定發(fā)展階段時,其財務(wù)指標(biāo)不會發(fā)生較大波動,若公司試圖通過虛增利潤或虛列資產(chǎn)等方式粉飾數(shù)據(jù),其相關(guān)的財務(wù)指標(biāo)便會發(fā)生較大的波動,偏離真實的發(fā)展趨勢。針對上述23個財務(wù)指標(biāo)分別將舞弊年份與上一年進(jìn)行對比,求出增量數(shù)據(jù)ΔX1,ΔX2,…ΔX23,其中是從營業(yè)收入變動率與總資產(chǎn)變動率的差距探討與舞弊的關(guān)系。
(3)非財務(wù)信息指標(biāo)。當(dāng)公司有較好的治理水平和股權(quán)結(jié)構(gòu),能做到權(quán)利相互制衡、職務(wù)分離時,則在一定程度上制約舞弊行為發(fā)生。本文從機(jī)會角度選取股權(quán)結(jié)構(gòu)、治理綜合信息以及三會情況相關(guān)指標(biāo)。三因素之一的借口可以通過薪酬合理體現(xiàn),其與高管對公司的不滿情緒有反向關(guān)系,具體選取17個指標(biāo)如表4所示。
4 實證分析
4.1 獨立樣本T檢驗
在模型擬合過程中,舞弊組與非舞弊組間沒有顯著差異的指標(biāo)貢獻(xiàn)度較低,故采用獨立樣本T檢驗的方法,確定舞弊樣本與非舞弊樣本對同一指標(biāo)的表現(xiàn)是否有顯著差別,即均值和方差是否來源于同一總體。從而對已選定的變量進(jìn)行初步篩選,便于高效構(gòu)建模型。
為了盡可能保證數(shù)據(jù)的真實性,減少缺失值對檢驗的干擾,應(yīng)剔除指標(biāo)缺失較多的公司,并刪除其配對公司,得到482個公司樣本,剩余空缺值用所屬的舞弊組或非舞弊組的平均值填補,然后通過SPSS進(jìn)行檢驗。
在分析上述64個指標(biāo)的獨立樣本T檢驗結(jié)果時,首先根據(jù)萊文方差等同性檢驗值判斷指標(biāo)是否具有方差齊性,然后選擇對應(yīng)類別的Sig.檢驗結(jié)果,如表5所示。
共篩選出8個在0.05顯著水平下具有顯著差異的指標(biāo),分別為資產(chǎn)負(fù)債率增量ΔX3應(yīng)收賬款周轉(zhuǎn)率增量ΔX6、固定資產(chǎn)周轉(zhuǎn)率增量ΔX8、營業(yè)毛利率、財務(wù)杠桿、
營業(yè)收入變動率與總資產(chǎn)變動率之差、流通股比例和股東大會召開次數(shù)。
4.2 數(shù)據(jù)預(yù)處理
因為不同指標(biāo)的量綱和數(shù)量級都有差異,為了消除其對模型的影響,首先應(yīng)對指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理,具體處理公式為
其中,為第個指標(biāo)的第個數(shù)據(jù),為第個指標(biāo)的最小值,為第個指標(biāo)的最大值。
主成分分析法可進(jìn)一步濃縮指標(biāo),但根據(jù)8個指標(biāo)的KMO和巴特利特檢驗可知,KMO=0.528不符合主成分分析的前提條件,故不進(jìn)行降維轉(zhuǎn)換,如表6所示。
4.3 GA-BP模型訓(xùn)練與分析
在本文構(gòu)建的舞弊識別模型中,將篩選出的8個指標(biāo)作為輸入量,是否為舞弊公司作為輸出數(shù)據(jù),其中-1代表非舞弊,1代表舞弊,用MATLAB2016B進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練。
將482個公司樣本分為訓(xùn)練組和測試組,訓(xùn)練組412個樣本用于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),測試組70個樣本用于對神經(jīng)網(wǎng)絡(luò)的有效性進(jìn)行檢驗,得到GA-BP模型的識別準(zhǔn)確度如表7所示。
綜合來看,不論是訓(xùn)練樣本還是測試樣本,其對舞弊組識別的準(zhǔn)確率都要高于非舞弊組,即傾向于誤判為舞弊組。根據(jù)預(yù)測準(zhǔn)確度來看,模型對未知公司的舞弊識別能力較高,大致為79%,說明構(gòu)建的GA-BP模型可以作為信度較高的舞弊識別模型之一,在未來大數(shù)據(jù)環(huán)境下可以進(jìn)一步挖掘更具有代表性的指標(biāo),探究如何更加有效地利用智能算法識別舞弊行為。
5 應(yīng)用與展望
5.1 大數(shù)據(jù)在財務(wù)審計中的應(yīng)用特點
信息化時代使會計信息由孤立的系統(tǒng)變成一個關(guān)于財務(wù)信息、人力資源、產(chǎn)品生產(chǎn)供應(yīng)與銷售為一體的綜合復(fù)雜信息系統(tǒng)。而大數(shù)據(jù)時代的到來,正是使這種信息數(shù)據(jù)結(jié)構(gòu)由單一、局部變成多維、全面,使得多種舞弊行為更易被分析識別,壓縮了企業(yè)舞弊空間。
5.1.1 對象全面性
大數(shù)據(jù)時代不再是對單一的財務(wù)報表或財務(wù)信息進(jìn)行分析,而是對財務(wù)指標(biāo)與非財務(wù)指標(biāo)多個方面的信息進(jìn)行分析,對所有可能獲得的公司財務(wù)信息進(jìn)行分析,大大提高了審計對象的全面性和審計結(jié)果的準(zhǔn)確性。
5.1.2 過程便捷性
大數(shù)據(jù)分析模式下,因為可以獲得全部數(shù)據(jù)與指標(biāo),因此通過智能化選擇對實時獲得的數(shù)據(jù)信息進(jìn)行篩選和處理,對于多個可能性同時進(jìn)行信息處理,精準(zhǔn)找到將要得到的數(shù)據(jù)結(jié)果。
5.2 大數(shù)據(jù)在財務(wù)審計中的風(fēng)險
5.2.1 信息數(shù)據(jù)更改
隨著電子信息技術(shù)日益增強,企業(yè)的信息數(shù)據(jù)面臨企業(yè)內(nèi)部與外界兩部分干擾,通過公司內(nèi)部信息技術(shù)更改企業(yè)數(shù)據(jù),達(dá)成舞弊結(jié)果,外部人員通過信息技術(shù)手段惡意更改企業(yè)數(shù)據(jù),兩方面皆會對審計結(jié)果產(chǎn)生重大影響。
5.2.2 信息數(shù)據(jù)缺失
電子形式的審計數(shù)據(jù)存在的穩(wěn)定性嚴(yán)重依賴于信息系統(tǒng),因此信息系統(tǒng)平臺的安全性與可靠性變得至關(guān)重要。其次電子審計數(shù)據(jù)在傳遞過程中極易發(fā)生更改與缺失,使得審計數(shù)據(jù)的真實性、可靠性、安全性有極大的隱患。
5.2.3 系統(tǒng)處理可靠性
在計算機(jī)根據(jù)模型進(jìn)行審計識別時,識別模型對于審計數(shù)據(jù)處理的結(jié)果存在不確定性,即審計模型結(jié)果的可信度問題。局限于審計識別模型的科學(xué)方法,多數(shù)審計模型的結(jié)果準(zhǔn)確性存在信任問題。
5.3 大數(shù)據(jù)對企業(yè)財務(wù)舞弊的影響
5.3.1 舞弊動因多元性
大數(shù)據(jù)時代下,數(shù)據(jù)價值的增大使企業(yè)生產(chǎn)銷售營銷面臨更加復(fù)雜的情況,同時企業(yè)財務(wù)信息透明化,使得企業(yè)之間的競爭壓力更加激烈,也可能使得舞弊行為的成本更低,導(dǎo)致舞弊行為的產(chǎn)生。
5.3.2 舞弊方法多樣性
互聯(lián)網(wǎng)+財務(wù)模式的快速發(fā)展使得監(jiān)管監(jiān)督機(jī)制無法即時更新,導(dǎo)致監(jiān)管部分失效,某些財務(wù)舞弊得以滋生。并且,大數(shù)據(jù)模式下,數(shù)據(jù)的關(guān)聯(lián)性、豐富性、龐大性和各種互聯(lián)網(wǎng)技術(shù)的快速發(fā)展使財務(wù)舞弊產(chǎn)生的方式方法更加多樣化。
5.3.3 舞弊識別弱化性
互聯(lián)網(wǎng)時代由于市場發(fā)展迅速,識別舞弊行為存在滯后性,市場監(jiān)管對于舞弊行為的判斷能力較弱,所以應(yīng)建立強力完善的財務(wù)審計機(jī)制,提高審計人員的能力,獲得更加高效有實用性的財務(wù)審計工具。
5.4 大數(shù)據(jù)與創(chuàng)新財務(wù)舞弊識別模型的意義
隨著大數(shù)據(jù)時代的深化發(fā)展,會計審計工作持續(xù)更新增進(jìn),將會建立更加完善和全面的財務(wù)審計機(jī)制,糾察各類財務(wù)舞弊行為。大數(shù)據(jù)時代下的財務(wù)工作信息化和財務(wù)舞弊識別模型的創(chuàng)新在其中有著至關(guān)重要的作用。
5.4.1 財務(wù)舞弊模型判斷準(zhǔn)確性提高
財務(wù)信息系統(tǒng)對于信息處理能力的準(zhǔn)確性一直是審計工作的關(guān)鍵因素,預(yù)測模型的準(zhǔn)確率起著決定性的作用。因此創(chuàng)新財務(wù)舞弊模型,創(chuàng)建有可靠性和實用價值的模型給審計人員選擇方法上提供了多樣性。
5.4.2 為全面審計提供可能性
現(xiàn)代企業(yè)財務(wù)信息化的不斷提高,傳統(tǒng)升級模式抽樣方法忽略了未抽取樣本存在舞弊的可能性。而在大數(shù)據(jù)時代,通過企業(yè)信息化平臺集中獲取數(shù)據(jù)帶入相關(guān)審計模型進(jìn)行綜合審計,可以避免此類方法的缺陷,減小企業(yè)的舞弊空間。
5.4.3 提升舞弊行為的審計質(zhì)量與效率
大數(shù)據(jù)時代,審計人員通過計算機(jī)等互聯(lián)網(wǎng)平臺對數(shù)據(jù)進(jìn)行快速分類和整合,應(yīng)用智能化快速識別舞弊行為,相比傳統(tǒng)審計模式,提升了審計工作的速度與準(zhǔn)確性,同時也提升了審計人員的工作技術(shù)水平。
參考文獻(xiàn)
孫麗亞.基于“三元素”理論的企業(yè)財務(wù)舞弊識別[J].財會月刊,2010(05):5-7.
洪葒,胡華夏,郭春飛.基于GONE理論的上市公司財務(wù)報告舞弊識別研究[J].會計研究,2012(08):84-90+97.
管揚威,朱衛(wèi)東.基于CRIME五因素論的ST公司財務(wù)舞弊識別[J].財會月刊,2014(16):12-16.
彭子坤,曾志勇.基于非財務(wù)信息的財務(wù)舞弊識別問題綜述[J].財會通訊,2013(14):55-57.
熊方軍.基于財務(wù)指標(biāo)分析的上市公司會計舞弊識別研究[J].財會通訊,2015(24):3-6+129.
夏明,李海林,吳立源.基于神經(jīng)網(wǎng)絡(luò)組合模型的會計舞弊識別[J].統(tǒng)計與決策,2015(16):49-52.
楊貴軍,周亞夢,孫玲莉,等.基于Benford律的Logistic模型及其在財務(wù)舞弊識別中的應(yīng)用[J].統(tǒng)計與信息論壇,2019,34(08):50-56.
潘夢雪.基于隨機(jī)森林的上市公司舞弊風(fēng)險識別模型研究[D].杭州:杭州電子科技大學(xué),2019.
高利,芳何磊,李藝瑋.企業(yè)反賄賂內(nèi)部審計的主觀動因研究——基于世茂集團(tuán)的案例分析[J].重慶工商大學(xué)學(xué)報(社會科學(xué)版).2020,37(02):75-86.
Abstract: Based on a review of the literature on Fraud Identification Theories, indicators and models, 482 fraud firms and non-fraud firms were selected as the research samples. According to the Triangle Theory of Fraud, financial index, financial increment index and non-financial index are selected to build a comprehensive index system. GA-BP Fraud Identification Model is Fitted. Under the background of big data, comprehensive and multi-dimensional characteristics of data endow audit objects and audit processes with the characteristics of diversification and complexity, which brings new challenges to audit. Innovative combination of big data technology and Fraud Detection Model can give new vitality to audit, provide a solid foundation for comprehensive audit, and improve the quality and efficiency of audit.
Keywords: financial fraud; GA-BP Model; Fraud Triangle Theory; big data