亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于XGBoost算法的財務(wù)造假識別研究

        2022-09-21 02:55:16王圣潔
        關(guān)鍵詞:財務(wù)指標舞弊違規(guī)

        王圣潔

        (青島大學 經(jīng)濟學院, 山東 青島 266061 )

        為有效改善融資環(huán)境,拓寬融資渠道,2021年10月在北京召開的中央經(jīng)濟工作會議中明確提出全面推行注冊制,企業(yè)融資環(huán)境得到大幅改善,眾多企業(yè)乘著注冊制的東風得以蓬勃發(fā)展。資本市場的價值發(fā)現(xiàn)功能則越來越依托于企業(yè)持續(xù)的信息披露,信息披露真實、準確與完整對投資者而言至關(guān)重要。在可以預(yù)見的將來,全面注冊制改革會使上市企業(yè)數(shù)量激增,如何在眾多上市企業(yè)中及時發(fā)現(xiàn)財務(wù)造假,決定了A股市場的參與者能否享受到中國經(jīng)濟發(fā)展的紅利,也是監(jiān)管機構(gòu)所面臨的嚴峻現(xiàn)實問題。在傳統(tǒng)監(jiān)管渠道受限的新形勢下,以機器學習替代人的學習,再加以人的輔助識別,可以更有效地對企業(yè)是否違規(guī)做出準確判斷,使得證券市場參與者可以在真實信息中進行投資決策,促進我國資本市場繼續(xù)平穩(wěn)發(fā)展。

        1 文獻綜述

        1.1 舞弊風險因子理論

        財務(wù)造假有兩方面的誘因。一方面是管理層主管的動機。馬永義等[1]對比違規(guī)企業(yè)與未違規(guī)企業(yè)的財務(wù)報表,認為公司內(nèi)部對利益的追逐是導(dǎo)致我國財報信息失真、財務(wù)舞弊多發(fā)的最主要原因;Huang等[2]按照企業(yè)生命周期理論對處于不同生命周期的企業(yè)進行分析,認為在企業(yè)發(fā)展的不同階段,影響舞弊動機的關(guān)鍵要素也不同。另一方面是客觀上由于監(jiān)管缺位所帶來的舞弊機會。王守海等[3]將受處罰公司與未受處罰公司的報表進行對比,發(fā)現(xiàn)公司制度的不完善是財務(wù)違規(guī)公司產(chǎn)生財務(wù)舞弊的主要誘因;趙彥昌[4]發(fā)現(xiàn),董事會成員數(shù)量與公司違規(guī)披露行為成反比,董事會人數(shù)越多,會計違規(guī)披露的機會越少;Ozdemir[5]的研究表明,董事會的多樣性使得對公司的管理與控制更為有效,從而使公司違規(guī)減少。

        1.2 財務(wù)舞弊識別模型

        洪文洲等[6]選取2004—2013年間財務(wù)報表造假的44家上市企業(yè)作為樣本,構(gòu)建了包含27個核心指標的符合中國資本市場現(xiàn)狀的logistic回歸模型,研究發(fā)現(xiàn)舞弊企業(yè)的其中11個指標與非舞弊企業(yè)有顯著性差異;李清等[7]提出logistic回歸中可能會遇到的問題,即logistic回歸適用的前提是舞弊企業(yè)與非舞弊企業(yè)可以明確區(qū)分,而事實是學者可以從證監(jiān)會等公開渠道獲取確定的舞弊企業(yè),而作為對照組的非舞弊企業(yè),其是否進行了舞弊往往需要許多專業(yè)的判斷,具有一定的不確定性;Mukherjee等[8]等通過Logistic回歸、高斯樸素貝葉斯模型和隨機森林、決策樹兩類非參數(shù)方法對財務(wù)造假進行判斷,發(fā)現(xiàn)隨機森林與決策樹分類器的識別性能最佳;Jan[9]嘗試使用遞歸神經(jīng)網(wǎng)絡(luò)和長短時網(wǎng)絡(luò)兩種深度學習算法構(gòu)建財務(wù)違規(guī)模型,實證結(jié)果表明,作為RNN模型的特殊形式,LSTM模型在所有性能指標上均優(yōu)于RNN模型,LSTM模型實現(xiàn)了性能上的全超越;酈金粱等[10]在公司財務(wù)違規(guī)識別領(lǐng)域首次對XGBoost算法進行了初探,在50%的覆蓋度下有近80%的準確率;張培榮[11]依據(jù)文獻篩選識別財務(wù)造假的重要性指標,對制造業(yè)樣本進行檢驗,證實了XGBoost的良好性能;洪湛輝[12]依據(jù)出現(xiàn)頻率選取了11個自變量并通過分箱法進行數(shù)據(jù)的分析,使用滬深主板數(shù)據(jù)進行訓(xùn)練,在驗證環(huán)節(jié),模型使用被風險警示企業(yè)的財務(wù)數(shù)據(jù)作為驗證集,成功預(yù)測到了ST企業(yè)進行財務(wù)造假的情況,起到了預(yù)警作用;梁龍躍等[13]認為,審計報告是企業(yè)信息披露中的重要部分,使用BERT方法對文本特征進行提取,研究發(fā)現(xiàn),加入這些描述性文本后,模型的識別效率顯著提升。

        1.3 現(xiàn)有研究的不足及研究設(shè)想

        現(xiàn)有研究具有以下不足:(1)指標選取依賴過往文獻,沒有針對財務(wù)造假的新形勢、新手段做出更新。選取的指標也多為低維線性數(shù)據(jù),不能發(fā)揮機器學習算法處理高階數(shù)據(jù)的優(yōu)越性,以這些指標構(gòu)建的指標體系解釋能力不強;(2)當前研究多使用隨機森林與GBDT算法,而近年在機器學習競賽中性能強大的XGboost算法卻還未有較多應(yīng)用,在識別效率上具有一定的缺失。

        鑒于此,本文以A股市場上市公司作為研究樣本,結(jié)合監(jiān)管動態(tài)更新指標體系,并加入高階非線性的指標,以完善財務(wù)造假的識別體系。在算法使用上,本文選取XGBoost算法,并針對識別領(lǐng)域的實際需求優(yōu)化模型參數(shù),試圖構(gòu)建性能更優(yōu)異的識別模型。

        2 指標與模型

        2.1 財務(wù)造假識別指標體系構(gòu)造

        本文以舞弊風險因子模型作為研究變量的選取基礎(chǔ),并加入了能發(fā)揮識別作用的非財務(wù)指標,構(gòu)建基礎(chǔ)指標體系,見表1,尋找對企業(yè)識別財務(wù)造假具有關(guān)鍵作用的指標。

        表1 基礎(chǔ)指標體系Tab.1 Initial input index system

        續(xù)表

        2.1.1 數(shù)據(jù)來源

        本文以2016—2021年間A股市場上市公司的數(shù)據(jù)作為研究標的,使用CSMAR國泰安數(shù)據(jù)庫與WIND萬得數(shù)據(jù)庫進行數(shù)據(jù)的搜集與整合工作,并通過國家企業(yè)信用信息公示系統(tǒng)、裁判文書網(wǎng)對企業(yè)的非財務(wù)信息加以驗證。

        2.1.2 數(shù)據(jù)選擇

        通過CSMAR數(shù)據(jù)庫中近6年證券監(jiān)督管理機構(gòu)對有關(guān)公司的處罰公告,提取303家因財務(wù)造假受到處罰的樣本公司,排除了15家金融類企業(yè),最終挑選出符合研究標準的企業(yè)288家,493個樣本。按1∶1的比例選取一定標準的未違規(guī)企業(yè)的財務(wù)數(shù)據(jù)作為對照組,保持樣本總體的平衡性,最終選擇了986個樣本,包括493個實驗組樣本與493個對照組樣本,共計41 412個樣本數(shù)據(jù)。

        2.2 財務(wù)造假識別模型構(gòu)建

        XGBoost是處理分類問題性能優(yōu)異的訓(xùn)練模型,本文依照陳天橋博士于2016年提出的XGBoost算法設(shè)置訓(xùn)練的目標函數(shù):

        (1)

        2.3 模型性能測度方法

        機器學習領(lǐng)域常用的綜合評價方法是ROC曲線。ROC曲線使用正反樣本衡量識別精度,考慮到現(xiàn)有文獻對識別精度較偏重而忽略了模型覆蓋度的情況,本文結(jié)合混淆矩陣對ROC曲線的橫縱坐標做了一定的修改,從而在測量精度與覆蓋度兩個維度對模型性能進行評估測試,定義如下兩個指標:準確率=TP/(TP+FP) ,覆蓋率=TP/(TP+FN),其中,TP代表違規(guī)樣本被正確識別為違規(guī)的樣本數(shù),F(xiàn)P代表未違規(guī)樣本被錯誤識別為違規(guī)的樣本數(shù),F(xiàn)N代表違規(guī)樣本被錯誤識別為未違規(guī)的樣本數(shù)。

        2.4 模型參數(shù)優(yōu)化

        使用隨機方法選擇90%的數(shù)據(jù)作為樣本訓(xùn)練組數(shù)據(jù),剩余10%作為樣本測試組數(shù)據(jù),同時,在訓(xùn)練方法上采用十折交叉驗證的方法,將訓(xùn)練數(shù)據(jù)分為十組,其中九組用作訓(xùn)練,剩余一組用作驗證,通過Harmonica算法優(yōu)化參數(shù),見表2。

        表2 XGBoost算法優(yōu)化后參數(shù)Tab.2 Parameter after optimization of XGBoost algorithm

        3 模型性能測試與結(jié)果分析

        鑒于資本市場上財務(wù)報表使用者的需求多樣,監(jiān)管部門希望及時找到財務(wù)報表造假的企業(yè),維護資本市場良好運轉(zhuǎn);投資者則希望找到更多的未違規(guī)企業(yè),以期將更多運行良好的企業(yè)納入自己的選股池,分散股票市場風險。因此,為了滿足不同報表使用者的需求,本文對優(yōu)化參數(shù)后的模型進行測試,評價其在面對違規(guī)公司和未違規(guī)公司時的性能。

        3.1 識別財務(wù)違規(guī)企業(yè)

        證券監(jiān)管部門的首要目標是及時精準發(fā)現(xiàn)上市公司的財務(wù)舞弊行為,打擊違法行為,維護資本市場良性發(fā)展,因此證券監(jiān)管部門更關(guān)心模型在識別違規(guī)企業(yè)時的性能,如圖1所示,隨著模型覆蓋率的提高,模型的準確率有所下滑,原因在于為了提高覆蓋度,學習器會將盡可能多的樣本都判定為違規(guī)類別,因此導(dǎo)致準確率的下降。由圖1可知,經(jīng)檢驗的模型對樣本外數(shù)據(jù)的判別準確度從18%到100%,相應(yīng)地,識別范圍的比例從100%到5%。

        圖1 違規(guī)樣本的準確率與覆蓋率曲線Fig.1 Accuracy and coverage curve of illegal sample inspection

        在實際應(yīng)用中,證券監(jiān)管部門可以根據(jù)目標在準確率與覆蓋率之間進行權(quán)衡。若監(jiān)管部門想要以100%的準確率找到違規(guī)公司,則可以從選取企業(yè)的樣本中找到5%的典型違規(guī)公司,進而證監(jiān)會可以將這些公司當做典型予以打擊。若是監(jiān)管部門希望對A股上市公司進行一次全面篩查,可以通過調(diào)整參數(shù),以40%的準確率找到近半數(shù)的違規(guī)公司,從而縮小需要篩查的范圍,用識別模型替代初篩的工作。

        3.2 挑選安全投資標的

        投資者沒有執(zhí)法權(quán),也不關(guān)心企業(yè)是否違規(guī),相比較而言,投資者更關(guān)心的是哪些股票沒有違規(guī),因此,股票市場投資者最大的需求是找到足夠多可以安全投資的企業(yè),將其股票加入股票投資池。這就需要投資者衡量自身愿意承擔的風險與期望擴充的股票規(guī)模的關(guān)系,如果投資者愿意承受更高的錯誤率,可以加入投資池的未違規(guī)企業(yè)的數(shù)量也就更多,相反,如果投資者完全不能承受錯判的風險,模型識別出來的未違規(guī)企業(yè)就會變少,但是更能保證每一個判斷都是精確的。本文通過調(diào)節(jié)樣本閾值生成了未違規(guī)樣本的準確率與覆蓋率曲線,如圖2所示,模型在樣本內(nèi)識別找出70%的未違規(guī)公司時,仍能保證90%以上的準確率,即使在模型找出全部的未違規(guī)公司時,也能保證85%的準確率。

        圖2 未違規(guī)樣本的準確率與覆蓋率曲線Fig.2 Accuracy and coverage curve of non-compliance sample inspection

        把模型帶入實際應(yīng)用中,2021年底A股市場約有4 000家公司,根據(jù)統(tǒng)計我國的上市公司中平均違約率為17%,即約有640家企業(yè)進行了財務(wù)違規(guī)的操作。如果通過訓(xùn)練后的機器學習模型進行判斷,則可以從17%違約概率的樣本中,篩選出錯誤率為8.7%,涵蓋70%未違規(guī)企業(yè)的股票投資池,即找到2 352家可以投資的公司,只需承擔8.7%的錯誤風險,這大大拓寬了資本市場投資者的選股范圍,這證明從為投資者選股的角度來說,學習器的效果已經(jīng)非常顯著了。并且,如果對訓(xùn)練好的模型進行外包并加入可視化操作窗口,投資者就可以根據(jù)自身能接受的風險水平與期望拓寬的股票池之間權(quán)衡,在85%~100%的精確度上自由選擇,以獲取不同數(shù)量未違規(guī)公司股票。

        3.3 穩(wěn)健性檢驗

        為了證實本文構(gòu)建的包含財務(wù)指標與非財務(wù)指標的上市公司財務(wù)造假識別模型的良好性質(zhì),本文在機器學習三大類算法,即傳統(tǒng)分類算法、神經(jīng)網(wǎng)絡(luò)算法、集成學習算法中分別選取代表性算法,其中,在傳統(tǒng)分類算法中選擇支持向量機模型,在神經(jīng)網(wǎng)絡(luò)算法中選取BP神經(jīng)網(wǎng)絡(luò)模型,在集成學習算法中分別選取了采用Bagging策略的隨機森林算法與采取Boosting策略的GBDT算法,并利用上述4種算法分別調(diào)試參數(shù),與本文算法針對同一樣本分別展開預(yù)測,最終通過繪制的ROC曲線評價其性能,結(jié)果見表3。

        由表3可知,本文XGBoost算法的優(yōu)異性能得到了驗證;此外,不管通過何種機器學習算法驗證,其都能有近八成以上的準確率,F(xiàn)1分數(shù)在七成以上,這說明了無論采用何種訓(xùn)練策略,構(gòu)建的包含財務(wù)指標與非財務(wù)指標的財務(wù)造假識別指標體系都具有一貫的良好表現(xiàn),從而,指標體系識別財務(wù)造假的穩(wěn)健性得以檢驗。

        表3 模型性能結(jié)果評價Tab.3 Performance evaluation of SVM, RF, Ann and AdaBoost models

        3.4 特征重要性圖表

        通過XGBoost算法可以生成指標特征重要性表,確定對識別財務(wù)造假最重要的指標變量,根據(jù)決策樹的算法邏輯,最重要的指標是使不確定性下降最多的指標。故本文只列出前十個重要特征,見表4。

        表4 特征重要性表Tab.4 Characteristic importance chart

        由表4本文分析總結(jié)并得出以下結(jié)論:

        1)非財務(wù)指標的重要性開始凸顯,這與文獻綜述中的結(jié)論相左,一個合理的解釋是,傳統(tǒng)方法不能保證數(shù)據(jù)的平衡性。在一般的樣本中,未采取財務(wù)造假手段的公司占大多數(shù),使得識別模型更多向非舞弊企業(yè)傾斜,從而導(dǎo)致對財務(wù)舞弊樣本的學習不充分,不能有效地反映舞弊企業(yè)的重要特征;當數(shù)據(jù)平衡之后,非財務(wù)指標的重要性有明顯提高,在排名前十的重要性特征中有五個是非財務(wù)指標,尤其是企業(yè)涉訴案件數(shù)排名第一。這說明在有側(cè)重的非平衡數(shù)據(jù)集中,財務(wù)指標對非財務(wù)舞弊公司刻畫效果極佳;而在平衡數(shù)據(jù)集中,非財務(wù)數(shù)據(jù)的重要性隨之也在上升,這代表非財務(wù)指標在識別企業(yè)財務(wù)造假方面具有優(yōu)良的性質(zhì)。

        2)涉訴案件數(shù)、審計意見類型、股權(quán)集中度、三會召開情況和股票換手率五項非財務(wù)指標是識別上市公司財務(wù)舞弊的關(guān)鍵性指標。如果一個企業(yè)與眾多客戶供應(yīng)商都走到了訴訟公堂的地步,那說明企業(yè)的經(jīng)營情況已經(jīng)極大惡化,為了挽回敗局,企業(yè)進行了財務(wù)造假,用虛假披露穩(wěn)定市值,從而繼續(xù)經(jīng)營;第二重要的特征是審計意見類型,一般來說,隨著證券監(jiān)督管理部門對提供證券中介服務(wù)機構(gòu)的管理日益嚴格,審計機構(gòu)伙同上市公司共同造假的代價越來越沉重,這使得審計機構(gòu)為了自身持續(xù)的發(fā)展,從嚴核查企業(yè)財務(wù)報表,如實發(fā)表審計意見,同時,審計人員的專業(yè)性可以幫助投資者規(guī)避其專業(yè)性不足的缺點,并提供上市公司是否財務(wù)造假的明確意見,幫助資本市場識別企業(yè)財務(wù)造假問題;排名第三位的是股權(quán)集中度,這說明股權(quán)結(jié)構(gòu)也會在很大程度上影響企業(yè)是否進行舞弊的重大決策,當一股獨大且經(jīng)營不佳時,公司的三會治理結(jié)構(gòu)形同虛設(shè),公司整體的運營也會發(fā)生偏離;股票換手率指標也在前十之列,上市公司股價反映了市場投資者對公司的信心,而證券市場投資者建立信心的基礎(chǔ)是公司經(jīng)過審計的報表,因此,一旦公司知情股東發(fā)現(xiàn),自身根據(jù)信息對公司股價產(chǎn)生的預(yù)期低于證券市場參與者通過閱讀公司財務(wù)報表所產(chǎn)生的預(yù)期,他們就會通過大規(guī)模的賣出交易降低股票下跌所帶來的損失。

        基于此,本文對證券監(jiān)督管理部門提出以下幾點政策建議:

        1)證券監(jiān)督機構(gòu)應(yīng)當更加關(guān)注上市公司涉及訴訟的情況,可以采取與人民法院、仲裁委建立互連互通的溝通系統(tǒng),及時知曉企業(yè)所涉及的重大訴訟。其次,要強化中介機構(gòu)的職能,要求其對企業(yè)所涉及的重大訴訟及時上報,并要求公司與保薦機構(gòu)主動對涉案情況進行排查,及時提交訟所出具的法律意見書;同時,對外披露企業(yè)所面臨的訴訟情況,對投資者發(fā)出風險警示。

        2)提高審計機構(gòu)的角色地位,加強對審計機構(gòu)的監(jiān)督與處罰力度。審計后的財務(wù)報表可以視為審計機構(gòu)對被審計公司的背書,但是這種背書也是一把雙刃劍,審計機構(gòu)受雇于上市公司,其審計的獨立性可能受到威脅,一旦審計機構(gòu)因報酬問題對上市公司做出妥協(xié),報表的真實性就無從保證。因此,首先要提高審計機構(gòu)在資本市場中的角色地位,具有糾錯的話語權(quán)。而證券市場的投資者,并非都具有財務(wù)的專業(yè)性,可以信賴的就是經(jīng)過審計的財務(wù)報表,在這種情況下其有極大可能相信財務(wù)數(shù)據(jù)并得出完全錯誤的判斷。因此,證券監(jiān)督管理部門加強對財務(wù)造假的監(jiān)管,要加大對審計機構(gòu)的懲處力度,使其不能也不敢參與企業(yè)的造假活動。

        3)解決企業(yè)融資困難問題,為企業(yè)減負。之所以現(xiàn)金比率與資產(chǎn)負債率成為影響企業(yè)是否舞弊的重要因素,一個原因在于我國現(xiàn)在的融資渠道單一,多數(shù)企業(yè)只有向銀行貸款這一種方式,而在企業(yè)出現(xiàn)財務(wù)問題需要貸款救急來維持生產(chǎn)乃至扭轉(zhuǎn)敗局時,糟糕的財務(wù)狀況又不符合銀行貸款所要求的高標準,不免有些企業(yè)為了生存鋌而走險,選擇在財務(wù)報表上造假。因此證券監(jiān)督管理部門可以適當放開債券的發(fā)行門檻,允許這些陷入財務(wù)困境或融資困難的企業(yè)發(fā)行紓困債券或集合債券,或者由上下游國有企業(yè)牽頭,發(fā)行供應(yīng)鏈金融債券,只有拓寬了融資渠道,才能使那些只是因為受環(huán)境影響而面臨資金短缺的企業(yè)不至于鋌而走險,從而抑制其進行財務(wù)造假的動機,減少舞弊行為的發(fā)生。

        4 結(jié)束語

        本文的主要研究成果有如下幾個方面:

        1)將XGBoost算法引入舞弊識別領(lǐng)域,驗證了該算法在財務(wù)造假識別應(yīng)用中的可行性。

        2)本文設(shè)計的能夠有效識別企業(yè)財務(wù)造假的指標體系,包含了代表企業(yè)經(jīng)營與狀況的財務(wù)指標與非財務(wù)指標,利用XGBoost訓(xùn)練生成了識別預(yù)警模型,可以供證券市場監(jiān)管部門與股票投資者依照自身的需求對上市公司是否進行財務(wù)造假進行判斷,性能優(yōu)異。

        3)利用XGBoost生成的特征重要性表,確定了對于識別具有重要作用的特征指標,并借此對如何利用這些重要特征指標找到企業(yè)財務(wù)造假的事實提出政策建議:重視企業(yè)涉訴案件在識別企業(yè)舞弊中的重要作用,提高審計機構(gòu)的角色地位,解決企業(yè)融資困難問題。

        猜你喜歡
        財務(wù)指標舞弊違規(guī)
        違規(guī)借調(diào)的多重“算計”
        淺談財務(wù)舞弊與防范
        活力(2021年6期)2021-08-05 07:24:28
        “啄木鳥”專吃“違規(guī)蟲”
        會計電算化環(huán)境下會計舞弊的應(yīng)對策略
        我國金融機構(gòu)股價和主要財務(wù)指標的相關(guān)性分析
        違規(guī)試放存放 爆炸5死1傷
        勞動保護(2018年5期)2018-06-05 02:12:09
        全國國有企業(yè)主要財務(wù)指標
        違規(guī)逆行之后
        全國國有企業(yè)主要財務(wù)指標
        我國上市公司財務(wù)舞弊識別模型初探
        人妻无码在线免费| 丰满熟妇乱又伦| 午夜国产精品一区二区三区| 久久久午夜精品福利内容| 国产精品综合女同人妖| 黄色毛片在线看| 日韩精品无码一区二区三区四区| 好爽要高潮了在线观看| 国产成熟人妻换╳╳╳╳| av在线免费观看大全| 麻豆国产乱人伦精品一区二区| 国产在线 | 中文| 国产一区二区三区成人| 久久这里都是精品一区| 国产尤物精品福利视频| 亚洲字幕中文综合久久| 一区二区高清视频在线观看| 国产午夜影视大全免费观看| 中文字幕在线日亚州9| 国产精品久久久久av福利动漫| 国产精品亚洲一区二区三区16| 夜夜春精品视频| 久久99国产精品久久| av一区二区三区有码| 男人天堂av在线成人av| 欧美人和黑人牲交网站上线| 一区二区三区中文字幕p站| 色中文字幕视频在线观看| 亚洲狠狠网站色噜噜| 男人的天堂无码动漫av| 国产免费操美女逼视频| 亚洲成精品动漫久久精久| 亚洲乱码av中文一区二区| 欧洲美女熟乱av| 久久久精品少妇—二区| 极品诱惑一区二区三区| 久久亚洲精品无码va大香大香 | 国产一区二区黑丝美胸| 亚洲一区二区免费日韩| 国产精品欧美成人| 欧美熟妇另类久久久久久不卡|