黃 犚,陳巧珍
(南京郵電大學(xué) 經(jīng)濟(jì)學(xué)院,江蘇 南京 210023)
當(dāng)前,我國(guó)經(jīng)濟(jì)已由高速增長(zhǎng)階段轉(zhuǎn)向高質(zhì)量發(fā)展階段,習(xí)總書記強(qiáng)調(diào),“制造業(yè)是國(guó)家經(jīng)濟(jì)命脈所系”。黨的十九大明確提出到本世紀(jì)中葉建成社會(huì)主義現(xiàn)代化強(qiáng)國(guó),對(duì)制造業(yè)高質(zhì)量發(fā)展提出了新的要求。黨的十九屆五中全會(huì)通過(guò)的《中共中央關(guān)于制定國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和二○三五年遠(yuǎn)景目標(biāo)的建議》指出,“要堅(jiān)定不移建設(shè)制造強(qiáng)國(guó),保持制造業(yè)比重基本穩(wěn)定”。推動(dòng)制造業(yè)高質(zhì)量發(fā)展,就要落實(shí)制造業(yè)的科技創(chuàng)新、產(chǎn)業(yè)融合和企業(yè)的優(yōu)勝劣汰,需要完善金融支持機(jī)制,健全資本市場(chǎng),提高直接融資的比重。
近年來(lái),金融領(lǐng)域推行了一系列改革,設(shè)立科創(chuàng)板并試點(diǎn)注冊(cè)制,完善再融資、并購(gòu)重組等資本市場(chǎng)制度,加大直接融資對(duì)制造業(yè)的支持;出臺(tái)了一系列新規(guī),通過(guò)信貸指標(biāo)、績(jī)效評(píng)價(jià)要求金融行業(yè)將金融資源由地產(chǎn)轉(zhuǎn)而投向制造業(yè)實(shí)體經(jīng)濟(jì),這是邁向“新階段、新理念、新格局”的政策破局之舉。制造業(yè)上市公司通過(guò)資本市場(chǎng)直接融資,給投資者帶來(lái)了收益并促進(jìn)消費(fèi)、進(jìn)一步擴(kuò)大投資,實(shí)現(xiàn)中國(guó)經(jīng)濟(jì)的良性內(nèi)部循環(huán)。
然而,由于IPO市場(chǎng)加速擴(kuò)容,資本市場(chǎng)違規(guī)成本較低,欺詐發(fā)行、財(cái)務(wù)舞弊事件也有所增加,根據(jù)國(guó)泰安數(shù)據(jù)庫(kù)違規(guī)信息顯示,2018—2020年制造業(yè)上市公司財(cái)務(wù)舞弊違規(guī)信息增加了71%。由于上市公司數(shù)量的激增和財(cái)務(wù)舞弊手段的多樣性和隱蔽性,涉及的會(huì)計(jì)科目繁多,產(chǎn)生了大量的高維數(shù)據(jù),對(duì)財(cái)務(wù)舞弊識(shí)別提出了更高的要求。因此,設(shè)計(jì)合適的評(píng)價(jià)指標(biāo),構(gòu)建有效的財(cái)務(wù)舞弊識(shí)別模型,是近年來(lái)學(xué)界研究的熱點(diǎn)。本文采用機(jī)器學(xué)習(xí)的方法來(lái)解決財(cái)務(wù)舞弊識(shí)別問題, 克服大數(shù)據(jù)環(huán)境下人工識(shí)別弊端,從數(shù)據(jù)挖掘的角度,對(duì)不同的指標(biāo)和數(shù)據(jù)進(jìn)行選取,構(gòu)建基于多種降維方法的混合分類模型,并在此基礎(chǔ)上明確財(cái)務(wù)舞弊的重要影響指標(biāo),從而提高財(cái)務(wù)舞弊的識(shí)別效率,有利于資本市場(chǎng)的優(yōu)勝劣汰,維護(hù)資本市場(chǎng)健康有序發(fā)展,實(shí)現(xiàn)資本市場(chǎng)服務(wù)于制造業(yè)和投資者的功能,促進(jìn)制造業(yè)高質(zhì)量發(fā)展。
1.財(cái)務(wù)舞弊的識(shí)別研究
在我國(guó)的會(huì)計(jì)準(zhǔn)則中,財(cái)務(wù)舞弊是指企業(yè)為了獲得高額利益,違反會(huì)計(jì)準(zhǔn)則,故意編制虛假的財(cái)務(wù)報(bào)告,隱瞞真實(shí)的財(cái)務(wù)信息[1]。財(cái)務(wù)舞弊的識(shí)別研究主要包括財(cái)務(wù)舞弊的動(dòng)因研究和影響因素研究?jī)刹糠?。?cái)務(wù)舞弊動(dòng)因理論主要有冰山理論、Gone模型、舞弊三角形理論和舞弊風(fēng)險(xiǎn)因子理論等。對(duì)比中外的財(cái)務(wù)舞弊現(xiàn)象,發(fā)現(xiàn)國(guó)外舞弊主要由壓力因素導(dǎo)致,中國(guó)財(cái)務(wù)舞弊主要來(lái)源于機(jī)會(huì)因素[2],汪建新(2008)[3]提出舞弊的壓力來(lái)自于工作和經(jīng)濟(jì),舞弊的機(jī)會(huì)來(lái)源于公司內(nèi)部控制和外部審計(jì)的缺失。范海敏(2015)[4]通過(guò)實(shí)證研究發(fā)現(xiàn)舞弊人員的人品素質(zhì)、對(duì)權(quán)勢(shì)的欲望和公司的內(nèi)部治理及外部監(jiān)督等多方面因素造成了財(cái)務(wù)舞弊現(xiàn)象。此外,企業(yè)性質(zhì)、CEO權(quán)力強(qiáng)度、高管背景[5-7]等因素也是我國(guó)企業(yè)財(cái)務(wù)舞弊的影響因素。
2.財(cái)務(wù)舞弊指標(biāo)的研究
正確選擇模型的輸入變量以及在眾多指標(biāo)中篩選出關(guān)鍵變量可以提高模型的判別能力。目前,財(cái)務(wù)舞弊研究的指標(biāo)選取分為三個(gè)方向:第一,基于財(cái)務(wù)舞弊概念理論,張?jiān)?2017)[8]從“壓力、機(jī)會(huì)、借口”這三個(gè)方面選取指標(biāo),并將財(cái)務(wù)舞弊的影響因素選為輸入指標(biāo);第二,基于企業(yè)發(fā)布的財(cái)務(wù)報(bào)告信息選擇財(cái)務(wù)舞弊研究指標(biāo),劉志洋和韓麗榮(2018)[9]利用歷史財(cái)務(wù)指標(biāo)的波動(dòng)性作為舞弊模型的輸入變量取得了較好的識(shí)別效果;第三,考慮指標(biāo)應(yīng)具有全面性和代表性,董事會(huì)規(guī)模[10]、獨(dú)立董事比、股權(quán)結(jié)構(gòu)[11]、監(jiān)事會(huì)規(guī)模和企業(yè)內(nèi)部控制等非財(cái)務(wù)指標(biāo)對(duì)于識(shí)別財(cái)務(wù)舞弊有影響[12],熊方軍(2016)認(rèn)為可以從財(cái)務(wù)信息和非財(cái)務(wù)信息兩方面選擇指標(biāo)[13]。由于指標(biāo)變量之間難免會(huì)存在相關(guān)性,因此,在建立模型之前,需要篩選出重要的特征,目前,較為常用的特征選擇方法主要有主成分分析、因子分析、方差膨脹法、Lasso法、Boruta法和Relief法[14-17]等。
3.財(cái)務(wù)舞弊數(shù)據(jù)質(zhì)量的研究
財(cái)務(wù)數(shù)據(jù)真實(shí)、可靠是進(jìn)行分析的重要前提,早期的研究運(yùn)用比較分析法、趨勢(shì)分析法[18]等方法,通過(guò)對(duì)比財(cái)務(wù)數(shù)據(jù)前后的差異來(lái)查找異常數(shù)據(jù)。估計(jì)期望值和估計(jì)數(shù)據(jù)預(yù)期分布[19]方法,根據(jù)財(cái)務(wù)數(shù)據(jù)之前的分布與發(fā)展規(guī)律預(yù)測(cè)其之后的分布,檢驗(yàn)其與實(shí)際值的偏離程度。隨著技術(shù)的發(fā)展,離群數(shù)據(jù)挖掘法[20]等數(shù)據(jù)挖掘技術(shù)被逐漸運(yùn)用,從財(cái)務(wù)數(shù)據(jù)中根據(jù)距離、分布或者深度來(lái)挖掘異常值。一類支持向量機(jī)[21]等機(jī)器學(xué)習(xí)方法可以學(xué)習(xí)大量的財(cái)務(wù)數(shù)據(jù)并識(shí)別數(shù)據(jù)的流通規(guī)律,查找其中偏離正常流向的異常數(shù)據(jù)。目前,較多使用Benford法則檢測(cè)上市企業(yè)財(cái)務(wù)數(shù)據(jù)的質(zhì)量,通過(guò)比較財(cái)務(wù)數(shù)據(jù)中數(shù)字出現(xiàn)的概率與自然情況下數(shù)字的隨機(jī)概率是否一致,得到異常樣本[22]。除了單獨(dú)使用上述方法之外,還可以將不同方法結(jié)合使用,如將Benford法則和logistic模型、廣義線性模型、數(shù)據(jù)挖掘技術(shù)[23-25]等相結(jié)合,提高尋找舞弊樣本點(diǎn)的正確率。
4.財(cái)務(wù)舞弊識(shí)別模型的研究
關(guān)于財(cái)務(wù)舞弊識(shí)別模型主要有兩類,一類是以logistic模型為主的傳統(tǒng)識(shí)別模型,如韓麗榮(2015)[26]等人采用指數(shù)型變量建立logistic回歸模型,對(duì)財(cái)務(wù)舞弊行為進(jìn)行識(shí)別。另一類是以機(jī)器學(xué)習(xí)算法為主的識(shí)別模型,將神經(jīng)網(wǎng)絡(luò)模型[27]、決策樹[28]、文本和電子郵件挖掘[29]、遺傳算法和支持向量機(jī)[30]等算法應(yīng)用于財(cái)務(wù)舞弊識(shí)別,并取得了較好的效果。如金花妍(2014)[31]等人構(gòu)建了支持向量機(jī)模型、夏明(2015)[14]等人建立了RBF-BP神經(jīng)網(wǎng)絡(luò)模型提高了對(duì)財(cái)務(wù)舞弊行為的識(shí)別準(zhǔn)確率。
綜上所述,財(cái)務(wù)舞弊領(lǐng)域的研究成果較為豐富,財(cái)務(wù)舞弊識(shí)別方面的理論已經(jīng)相當(dāng)成熟,但在指標(biāo)選擇方面尚無(wú)公認(rèn)的標(biāo)準(zhǔn),大多數(shù)研究直接將初始指標(biāo)納入模型,而不進(jìn)行指標(biāo)的篩選。由于財(cái)務(wù)指標(biāo)眾多且有多重共線性,指標(biāo)的篩選是影響分類模型的識(shí)別效果的主要因素。本文首先采用局部線性嵌入方法和自適應(yīng)彈性網(wǎng)方法分別對(duì)初始指標(biāo)進(jìn)行篩選與降維,得到兩組指標(biāo)數(shù)據(jù)集,再對(duì)初始指標(biāo)集和兩組降維后指標(biāo)集分別建立AdaBoost分類模型,比較指標(biāo)降維前后分類模型的識(shí)別效果,探尋對(duì)財(cái)務(wù)舞弊識(shí)別具有重要影響的指標(biāo)。
上市公司的財(cái)務(wù)指標(biāo)之間有較高的多重共線性,直接進(jìn)行分析會(huì)高估模型的識(shí)別效果,而局部線性嵌入方法使數(shù)據(jù)降維后保持原有的拓?fù)浣Y(jié)構(gòu),自適應(yīng)彈性網(wǎng)方法可以很好地處理指標(biāo)間的多重共線性問題,所以采用這兩種方法對(duì)指標(biāo)進(jìn)行降維處理。與其他機(jī)器學(xué)習(xí)算法不同,AdaBoost是加法模型,考慮每個(gè)子模型的分類效果,它的核心之處是在迭代時(shí),根據(jù)之前模型的分類效果,對(duì)于分類錯(cuò)誤的樣本會(huì)在下一次訓(xùn)練時(shí)給予較大的權(quán)重,這樣不斷更新樣本權(quán)重,直到達(dá)到設(shè)定的迭代次數(shù),提高模型的識(shí)別效果。
1.局部線性嵌入方法(LLE)
局部線性嵌入方法(LLE)可以使降維后的數(shù)據(jù)保持原來(lái)的結(jié)構(gòu),維持?jǐn)?shù)據(jù)局部線性特征不變。它的核心思想是某個(gè)樣本xi,可以用它領(lǐng)域中的k個(gè)樣本線性表示,如式(1)所示。
(1)
其中,xij表示xi的第j個(gè)緊鄰點(diǎn)(1≤j≤k),wij是權(quán)重系數(shù),假設(shè)樣本D={x1,x2,…,xm},投影后樣本集為d={y1,y2,…,ym},投影時(shí)最小化損失函數(shù)為:
(2)
在降維前后,保證wij不發(fā)生變化或最小變化,降維后的樣本將保持原有的結(jié)構(gòu)。
2.自適應(yīng)彈性網(wǎng)方法(AEnet)
自適應(yīng)彈性網(wǎng)方法(AEnet)是自適應(yīng)Lasso方法和彈性網(wǎng)相結(jié)合的變量篩選方法,AEnet方法是對(duì)L1懲罰部分進(jìn)行了加權(quán)處理,對(duì)不同重要性的系數(shù)施加不同的權(quán)重[32]。自適應(yīng)彈性網(wǎng)懲罰函數(shù)如式(3)所示。
(3)
3.AdaBoost算法
AdaBoost算法是一種集成學(xué)習(xí)方法,它是對(duì)同個(gè)訓(xùn)練集擬合多個(gè)分類模型,再根據(jù)分類模型的分類效果計(jì)算各個(gè)模型的誤差,將多個(gè)分類模型線性組合成一個(gè)最終分類模型。假設(shè)訓(xùn)練集D={(x1,y1),(x2,y2),……,(xN,yN)},初始時(shí)樣本等權(quán)重開始迭代,得到多個(gè)弱分類器hm(x),計(jì)算每個(gè)弱分類器hm(x)的分類誤差率(em)與話語(yǔ)權(quán)(αm),如式(4)、式(5)所示。
(4)
(5)
em越小的弱分類器越好、話語(yǔ)權(quán)越大,即其在最終分類模型中的比重越大,根據(jù)每個(gè)分類模型在最終模型中的比重進(jìn)行線性組合,得到最終模型式(6)。
(6)
1.樣本選擇
CSMAR數(shù)據(jù)庫(kù)(國(guó)泰安)將財(cái)務(wù)舞弊企業(yè)定義為因虛構(gòu)利潤(rùn)、虛列資產(chǎn)和虛假記載(誤導(dǎo)性陳述)行為被處罰的上市企業(yè)。根據(jù)該數(shù)據(jù)庫(kù)公布的違規(guī)信息總表,篩選出舞弊年份在2010—2019年間的制造業(yè)上市企業(yè)為舞弊樣本,刪除因財(cái)務(wù)異常被特別處理的公司。若某公司此期間的不同年份都發(fā)生舞弊行為,則選取最近舞弊的一年作為舞弊年份,根據(jù)此方法篩選出99個(gè)舞弊樣本。在選擇非舞弊樣本時(shí)主要遵循以下幾點(diǎn):(1)行業(yè)相同,不同行業(yè)有不一樣的經(jīng)濟(jì)特征,其可比性不高,所以本文選擇的控制樣本與舞弊樣本的行業(yè)相同;(2)市值相近,控制樣本為在舞弊當(dāng)年與舞弊樣本市值相近的企業(yè);(3)舞弊年度相同,選擇與舞弊公司舞弊年度一樣的樣本,確??刂茦颖驹诖似陂g沒有因財(cái)務(wù)舞弊行為被處罰。為了減少非平衡樣本帶來(lái)的影響,本文將舞弊樣本與非舞弊樣本比例設(shè)定為1:1,由上述信息選取出99個(gè)配對(duì)的非舞弊樣本。由舞弊樣本和配對(duì)的非舞弊樣本,組成99組實(shí)驗(yàn)樣本。
2.初始指標(biāo)集
本文在滿足指標(biāo)體系構(gòu)建的全面性、科學(xué)性和可操作性等原則的條件下,選擇財(cái)務(wù)指標(biāo)和非財(cái)務(wù)指標(biāo)構(gòu)成初始指標(biāo)集。
國(guó)泰安數(shù)據(jù)庫(kù)從償債能力、盈利能力、經(jīng)營(yíng)能力、披露財(cái)務(wù)指標(biāo)、比率結(jié)構(gòu)、現(xiàn)金流分析等多方面定義了200多個(gè)財(cái)務(wù)指標(biāo),全面包含了公司的財(cái)務(wù)信息。剔除數(shù)據(jù)缺失的指標(biāo)和具有明顯共線性的指標(biāo),本文從償債能力、盈利能力、經(jīng)營(yíng)能力、每股指標(biāo)和比率結(jié)構(gòu)這5個(gè)方面選取了28個(gè)財(cái)務(wù)指標(biāo),如表1所示。
表1 財(cái)務(wù)指標(biāo)
企業(yè)償債能力能夠體現(xiàn)一家企業(yè)是否可以長(zhǎng)久健康的發(fā)展下去,盈利能力是指企業(yè)獲得利潤(rùn)的能力,經(jīng)營(yíng)能力體現(xiàn)了企業(yè)對(duì)內(nèi)部條件及其發(fā)展的經(jīng)營(yíng)決策能力;比率結(jié)構(gòu)反映了公司的資產(chǎn)分布。通常償債能力、盈利能力、經(jīng)營(yíng)能力越弱和比率結(jié)構(gòu)不合理的企業(yè)越有可能發(fā)生財(cái)務(wù)舞弊。
根據(jù)舞弊三角理論中機(jī)會(huì)因素可知,舞弊成功是需要機(jī)會(huì)的。公司治理機(jī)制的良好運(yùn)行離不開內(nèi)部控制和外部監(jiān)管的有效結(jié)合,如果治理機(jī)制存在問題,就會(huì)大大增加舞弊行為發(fā)生的可能性,因此,企業(yè)的治理機(jī)制也經(jīng)常被認(rèn)為是判別上市公司是否舞弊的因素之一。本文以此為基礎(chǔ)得到如表2所示的非財(cái)務(wù)指標(biāo)。其中股權(quán)集中度體現(xiàn)了公司股權(quán)集中情況,股權(quán)過(guò)度集中會(huì)增大股東之間的利益矛盾。董事會(huì)是公司治理機(jī)制的核心,獨(dú)立董事的存在會(huì)減少董事會(huì)被高層控制的可能性,而董事長(zhǎng)兼任總經(jīng)理的情況會(huì)增加董事會(huì)被管理層掌控的可能性,這樣可能會(huì)引發(fā)財(cái)務(wù)舞弊行為。監(jiān)事會(huì)體現(xiàn)了企業(yè)的內(nèi)部監(jiān)督能力,缺乏企業(yè)內(nèi)部監(jiān)督會(huì)增加財(cái)務(wù)舞弊的發(fā)生。
表2 非財(cái)務(wù)指標(biāo)
本文的響應(yīng)變量為上市公司是否有財(cái)務(wù)舞弊行為,記為y,當(dāng)企業(yè)有財(cái)務(wù)舞弊行為時(shí),y為-1;當(dāng)企業(yè)沒有舞弊行為時(shí),y為1。數(shù)值型變量的描述性統(tǒng)計(jì)如表3所示。
表3 數(shù)值型變量的描述性統(tǒng)計(jì)分析
3.數(shù)據(jù)來(lái)源與預(yù)處理
篩選出實(shí)驗(yàn)樣本后,基于指標(biāo)體系從CSMAR數(shù)據(jù)庫(kù)獲取2010—2019年的財(cái)務(wù)數(shù)據(jù)和非財(cái)務(wù)數(shù)據(jù),按照指標(biāo)定義處理數(shù)據(jù)。數(shù)據(jù)集的劃分遵循兩個(gè)原則:一是訓(xùn)練集樣本數(shù)不得少于樣本總量的一半,確保訓(xùn)練集與整體數(shù)據(jù)集訓(xùn)練出的模型接近;二是測(cè)試集樣本量不能過(guò)少,確保評(píng)估準(zhǔn)確率。一般會(huì)將2/3~4/5的樣本劃分為訓(xùn)練集,剩下的樣本為測(cè)試集[33]。本文嘗試以8:2、7:3和6:4劃分樣本為訓(xùn)練集和測(cè)試集進(jìn)行試驗(yàn),最終確定最佳比例為7:3,以訓(xùn)練集樣本擬合識(shí)別模型,再用測(cè)試集數(shù)據(jù)驗(yàn)證模型的識(shí)別效果。
4.模型建立
以局部線性嵌入降維方法和自適應(yīng)彈性網(wǎng)降維方法分別和AdaBoost算法結(jié)合建立識(shí)別模型作為實(shí)驗(yàn)組,比較降維方法的優(yōu)劣,并以降維前的初始指標(biāo)建立的AdaBoost模型作為對(duì)照組。本文先用訓(xùn)練集樣本擬合AdaBoost模型、LLE-AdaBoost模型和AEnet -AdaBoost模型,再用測(cè)試集驗(yàn)證以上三個(gè)模型的識(shí)別效果,比較三個(gè)模型的優(yōu)劣。
(1)AdaBoost模型
AdaBoost模型是指不對(duì)初始指標(biāo)集做降維處理,直接使用AdaBoost算法建立的識(shí)別模型。將所有初始指標(biāo)作為模型的輸入特征,對(duì)訓(xùn)練集樣本建立AdaBoost識(shí)別模型,作為降維后模型的對(duì)照組(如表4所示),以檢驗(yàn)降維方法的效果。其訓(xùn)練集中舞弊樣本的預(yù)測(cè)準(zhǔn)確率為72.73%,整體的識(shí)別準(zhǔn)確率為69.57%。
表4 AdaBoost模型訓(xùn)練集效果
變量重要性是指該變量引起的信息增益減少量的歸一化值,可以用來(lái)判斷模型中每個(gè)變量所起作用。圖1由大到小展示了AdaBoost模型中各變量的重要性,如圖1所示,對(duì)AdaBoost模型產(chǎn)生重要影響的變量排名前三的是應(yīng)付賬款周轉(zhuǎn)率、每股未分配利潤(rùn)和每股凈資產(chǎn),而每股凈資產(chǎn)、流動(dòng)資產(chǎn)比率、每股收益、股權(quán)集中度等變量的重要性較為接近,企業(yè)性質(zhì)、獨(dú)立董事比等變量的重要性相對(duì)較小。
圖1 變量的重要性排名
(2)LLE-AdaBoost模型
LLE-AdaBoost模型是將局部線性嵌入方法與AdaBoost算法相結(jié)合的分類模型。不同于線性降維方法,局部線性嵌入不體現(xiàn)新指標(biāo)與原始指標(biāo)之間的聯(lián)系,因此,將新指標(biāo)分別命名為f1、f2、f3、f4、f5、f6,并將樣本在新指標(biāo)上的分布展示出來(lái)。首先對(duì)數(shù)據(jù)進(jìn)行維數(shù)測(cè)定,得到數(shù)據(jù)的本質(zhì)維數(shù)是6維,其次用局部線性嵌入方法將初始指標(biāo)降到6維,分別命名為f1、f2、f3、f4、f5、f6,舞弊樣本和非舞弊樣本在這6個(gè)新指標(biāo)上的表現(xiàn)分別如圖2和圖3所示。如圖2所示,舞弊樣本在指標(biāo)f1、f5特別突出,其次是f2;如圖3所示,非舞弊樣本f3指標(biāo)最為突出,其次是f2、f6指標(biāo)比較突出。這表明舞弊樣本和非舞弊樣本在這6維新指標(biāo)中的表現(xiàn)存在差異性,可以通過(guò)這6個(gè)指標(biāo)識(shí)別財(cái)務(wù)舞弊。
圖2 舞弊樣本的LLE指標(biāo)情況
圖3 非舞弊樣本的LLE指標(biāo)情況
最后用6個(gè)新指標(biāo)對(duì)訓(xùn)練集建立AdaBoost分類模型,該模型記為L(zhǎng)LE-AdaBoost模型,該模型擬合效果如表5所示,其訓(xùn)練集舞弊樣本識(shí)別率為39.39%,整體預(yù)測(cè)準(zhǔn)確率為50%。
表5 LLE-AdaBoost模型訓(xùn)練集效果
(3)AEnet-AdaBoost模型
AEnet-AdaBoost模型是指將自適應(yīng)彈性網(wǎng)方法與AdaBoost算法結(jié)合的分類模型。首先采用自適應(yīng)彈性網(wǎng)方法對(duì)初始指標(biāo)集進(jìn)行降維處理,最終篩選出了7個(gè)重要的指標(biāo)。自適應(yīng)彈性網(wǎng)系數(shù)體現(xiàn)了指標(biāo)的重要性,從該系數(shù)觀察,股權(quán)集中度的系數(shù)最大,說(shuō)明股權(quán)集中度對(duì)模型的影響最大,其次是總資產(chǎn)凈利潤(rùn)率、資產(chǎn)負(fù)債率等指標(biāo)對(duì)模型有著次要的影響,應(yīng)付賬款周轉(zhuǎn)率對(duì)識(shí)別模型的影響相對(duì)最小,篩選出的指標(biāo)及系數(shù)如圖4所示。
圖4 變量的自適應(yīng)彈性網(wǎng)系數(shù)
利用篩選出的指標(biāo)對(duì)訓(xùn)練集建立識(shí)別模型AEnet-AdaBoost,得到的模型效果如表6所示,其舞弊樣本的預(yù)測(cè)準(zhǔn)確率為62.12%,整體預(yù)測(cè)準(zhǔn)確率為65.94%。
表6 AEnet-AdaBoost訓(xùn)練集效果
(4)模型預(yù)測(cè)效果對(duì)比
以上對(duì)訓(xùn)練集擬合了AdaBoost模型、LLE-AdaBoost模型和AEnet -AdaBoost模型,為了比較各個(gè)模型的識(shí)別效果,表7展示了三個(gè)模型在測(cè)試集上的預(yù)測(cè)結(jié)果。如表7所示,在測(cè)試集中,AdaBoost模型舞弊樣本識(shí)別準(zhǔn)確率為63.64%,整體識(shí)別效果為66.67%。使用LLE降維后的指標(biāo)建立的分類模型效果沒有得到提升,其整體識(shí)別效果僅為51.67%。AEnet-AdaBoost模型識(shí)別效果最好,舞弊樣本識(shí)別的準(zhǔn)確率為66.67%,整體的識(shí)別準(zhǔn)確率為75%,較降維前識(shí)別效果提高了8.30%。
表7 測(cè)試集模型預(yù)測(cè)結(jié)果對(duì)比
在模型的變量重要性方面,不同的機(jī)器學(xué)習(xí)方法衡量重要性的標(biāo)準(zhǔn)不同,遵循模型在測(cè)試集上的準(zhǔn)確性即預(yù)測(cè)準(zhǔn)確率才是判定模型好壞的最佳準(zhǔn)則[34],由于AEnet -AdaBoost模型的預(yù)測(cè)準(zhǔn)確率最高,表明自適應(yīng)彈性網(wǎng)方法從初始指標(biāo)中篩選出了更加重要的變量,并賦予變量自適應(yīng)彈性網(wǎng)系數(shù),該系數(shù)越大說(shuō)明變量越重要,因此,通過(guò)自適應(yīng)彈性網(wǎng)方法,研究發(fā)現(xiàn)股權(quán)集中度、總資產(chǎn)凈利潤(rùn)率、速動(dòng)比率、資產(chǎn)負(fù)債率和每股未分配利潤(rùn)等指標(biāo)對(duì)于識(shí)別財(cái)務(wù)舞弊行為具有顯著的作用。
本文在制造業(yè)上市公司中,以2010—2019年期間同一年度發(fā)生財(cái)務(wù)舞弊的公司和非舞弊公司為實(shí)證研究對(duì)象,從償債能力、盈利能力、經(jīng)營(yíng)能力、每股指標(biāo)和比率結(jié)構(gòu)等5個(gè)方面選取了28個(gè)財(cái)務(wù)指標(biāo),從公司治理機(jī)制的角度選取7個(gè)非財(cái)務(wù)指標(biāo),共計(jì)35個(gè)指標(biāo)建立指標(biāo)體系,使用局部線性嵌入方法和自適應(yīng)彈性網(wǎng)方法對(duì)初始指標(biāo)進(jìn)行降維處理,建立了AdaBoost識(shí)別模型,經(jīng)過(guò)實(shí)證分析得到以下結(jié)論。
其一,通過(guò)比較AdaBoost模型、LLE-AdaBoost模型和AEnet -AdaBoost模型,發(fā)現(xiàn)局部線性嵌入方法的降維處理降低了模型的識(shí)別效果,自適應(yīng)彈性網(wǎng)方法降維后的模型整體識(shí)別準(zhǔn)確率為75%,比降維前提高了8.30%,說(shuō)明自適應(yīng)彈性網(wǎng)方法具有較強(qiáng)的變量篩選能力,有助于快速地識(shí)別主要的影響指標(biāo),提高舞弊識(shí)別效果。自適應(yīng)彈性網(wǎng)方法可以通過(guò)篩選出的重要性指標(biāo)提高財(cái)務(wù)舞弊的甄別效率,局部線性嵌入方法的降維處理無(wú)法分辨指標(biāo)對(duì)識(shí)別模型的影響。
其二,通過(guò)自適應(yīng)彈性網(wǎng)方法,發(fā)現(xiàn)非財(cái)務(wù)指標(biāo)中股權(quán)集中度對(duì)于識(shí)別財(cái)務(wù)舞弊的作用最大,說(shuō)明企業(yè)股權(quán)結(jié)構(gòu)對(duì)于研究企業(yè)舞弊行為十分重要。財(cái)務(wù)指標(biāo)中總資產(chǎn)凈利潤(rùn)率、速動(dòng)比率、流動(dòng)比率、資產(chǎn)負(fù)債率、應(yīng)付賬款周轉(zhuǎn)率和每股未分配利潤(rùn)等指標(biāo)對(duì)于分析財(cái)務(wù)舞弊行為有重要的作用。
上述研究結(jié)果也對(duì)保護(hù)投資者權(quán)益、公司治理和有效監(jiān)管有一定的啟示作用。投資者應(yīng)該收集上市公司歷史經(jīng)營(yíng)狀況,分析其財(cái)務(wù)信息和公司管理層架構(gòu)。尤其是速動(dòng)比率、流動(dòng)比率、資產(chǎn)負(fù)債率和每股未分配利潤(rùn)等指標(biāo),若是債務(wù)較多,其資產(chǎn)的流動(dòng)性和變現(xiàn)性較差,說(shuō)明該公司有經(jīng)營(yíng)風(fēng)險(xiǎn),投資者還可以從每股未分配利潤(rùn)指標(biāo)直觀地了解公司的經(jīng)營(yíng)情況,若是該指標(biāo)為負(fù)值,則體現(xiàn)了公司目前尚有虧損,還沒有扭虧為盈,需要謹(jǐn)慎投資。投資者發(fā)現(xiàn)有問題的公司時(shí)應(yīng)積極舉報(bào),充分發(fā)揮外部監(jiān)督人的作用。
上市公司應(yīng)保證合理的股權(quán)結(jié)構(gòu)。研究可知,股權(quán)集中度指標(biāo)對(duì)于識(shí)別財(cái)務(wù)舞弊有著重要作用,股權(quán)過(guò)于集中不利于股東間的監(jiān)督制衡,從而增大財(cái)務(wù)舞弊發(fā)生的概率,因此,企業(yè)一方面要優(yōu)化股權(quán)結(jié)構(gòu),保證各股東意志的正常體現(xiàn);另一方面,要保證監(jiān)督部門的獨(dú)立性,發(fā)揮其應(yīng)有的作用。公司治理要有風(fēng)險(xiǎn)意識(shí),內(nèi)審部門重點(diǎn)關(guān)注償債能力指標(biāo),對(duì)這些指標(biāo)設(shè)定一個(gè)風(fēng)險(xiǎn)閾值,保證企業(yè)正常發(fā)展的同時(shí),資產(chǎn)具有較好的流動(dòng)性和變現(xiàn)性,可以隨時(shí)應(yīng)對(duì)市場(chǎng)風(fēng)險(xiǎn)和突發(fā)意外。
落實(shí)金融支持制造業(yè)高質(zhì)量發(fā)展的目標(biāo)任務(wù),離不開制度環(huán)境的完善。監(jiān)管部門應(yīng)加強(qiáng)證券執(zhí)法和司法工作,從嚴(yán)設(shè)置財(cái)務(wù)舞弊退市量化指標(biāo),加強(qiáng)退市執(zhí)行力度,加強(qiáng)對(duì)審計(jì)人員技能和素養(yǎng)的培訓(xùn),用先進(jìn)的技術(shù)方法定位財(cái)務(wù)報(bào)告中虛假的信息,提高審計(jì)效率。
黑龍江工業(yè)學(xué)院學(xué)報(bào)(綜合版)2021年11期