摘要:及時(shí)了解企業(yè)的財(cái)務(wù)風(fēng)險(xiǎn)情況,可以有效對(duì)財(cái)務(wù)風(fēng)險(xiǎn)進(jìn)行預(yù)警預(yù)測(cè)。選取2019年2580家企業(yè)的財(cái)務(wù)數(shù)據(jù)為樣本數(shù)據(jù),首先利用CRITIC對(duì)樣本數(shù)據(jù)的各項(xiàng)指標(biāo)賦予權(quán)重并用灰色關(guān)聯(lián)分析法進(jìn)行測(cè)度,然后利用K-means聚類方法劃分公司的風(fēng)險(xiǎn)等級(jí),最后利用SGAN模型構(gòu)建財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型。實(shí)驗(yàn)結(jié)果表明:與其他深度學(xué)習(xí)模型相比較,基于SGAN的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的預(yù)測(cè)效果最好,在測(cè)試集上的準(zhǔn)確率可以達(dá)到91.75%,證明了SGAN模型在財(cái)務(wù)風(fēng)險(xiǎn)領(lǐng)域應(yīng)用的可行性。
關(guān)鍵詞:SGAN模型;財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警;深度學(xué)習(xí)
一、前言
隨著經(jīng)濟(jì)的發(fā)展,企業(yè)間的競(jìng)爭(zhēng)因產(chǎn)業(yè)結(jié)構(gòu)的升級(jí)而愈加激烈。一些上市企業(yè)采取激進(jìn)策略導(dǎo)致財(cái)務(wù)風(fēng)險(xiǎn)不斷累積。為規(guī)避風(fēng)險(xiǎn),提出有效準(zhǔn)確的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警方法是十分必要的。生成對(duì)抗網(wǎng)絡(luò)GAN就是一種近年來出現(xiàn)的新興混合型深度學(xué)習(xí)模型,且已經(jīng)廣泛應(yīng)用到各個(gè)領(lǐng)域。但是,GAN作為一個(gè)創(chuàng)新的無監(jiān)督學(xué)習(xí)模型,存在效率低、精確度不高等缺陷。為了使原始GAN具有更強(qiáng)大的學(xué)習(xí)能力,將原先的無監(jiān)督模型變?yōu)榘氡O(jiān)督的網(wǎng)絡(luò)架構(gòu),即半監(jiān)督生成對(duì)抗網(wǎng)絡(luò)(SGAN)模型。本文將結(jié)合CRITIC-灰色關(guān)聯(lián)分析和K-means方法,探索SGAN如何解決財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警問題。
二、文獻(xiàn)回顧
財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警的方法包括單變量模型、多元判別模型、多元邏輯回歸模型和人工智能技術(shù)。李長(zhǎng)山(2018)[1]運(yùn)用logistic回歸建立財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,取得了較好的預(yù)警效果,但由于多元邏輯回歸方法計(jì)算量大且樣本選擇有限,導(dǎo)致該類模型應(yīng)用逐漸減少。隨著神經(jīng)網(wǎng)絡(luò)概念的提出,張春梅(2021)等人[2]研究基于Lasso+SVM的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,取得不錯(cuò)的效果。
半監(jiān)督生成對(duì)抗網(wǎng)絡(luò)(SGAN)模型是通過生成對(duì)抗網(wǎng)絡(luò)(GAN)衍生改變的模型。祝琳(2019)[3]利用半監(jiān)督GAN來研究高光譜的圖像分類,證明SGAN模型可以應(yīng)用到分類問題中。但目前還沒見到過半監(jiān)督生成對(duì)抗網(wǎng)絡(luò)(SGAN)模型在財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警領(lǐng)域的研究應(yīng)用。
三、研究方法
SGAN由一個(gè)生成網(wǎng)絡(luò)G和一個(gè)判別網(wǎng)絡(luò)D組成。該判別器D多分類器能夠?qū)W會(huì)區(qū)分N+1類,其中,N是原始訓(xùn)練數(shù)據(jù)集中的類數(shù),生成器G生成的偽樣本增加了一個(gè)類。生成器G的目的是接收一個(gè)隨機(jī)噪聲z并生成偽樣本,使其生成的偽樣本G’(z)最大限度接近原始數(shù)據(jù)集。判別器D的D接收無標(biāo)簽的真實(shí)樣本x、有標(biāo)簽的真實(shí)樣本(x,y)和生成器G生成的偽樣本G’(z)三種輸入,在判斷輸入樣本為真的情況下將其正確分類或者在判斷輸入樣本為假的情況下將其排除。在實(shí)際過程中,生成器G和一個(gè)判別器D是一體的。SGAN模型的流程圖如圖1所示。
四、數(shù)據(jù)的選取和處理
本文在網(wǎng)易財(cái)經(jīng)網(wǎng)站爬取了2019年1月—12月2580家企業(yè)20個(gè)指標(biāo)的財(cái)務(wù)數(shù)據(jù)作為研究對(duì)象,通過剔除存在空值的樣本數(shù)據(jù)后建立了一套對(duì)應(yīng)的財(cái)務(wù)風(fēng)險(xiǎn)指標(biāo)體系,并對(duì)其進(jìn)行統(tǒng)一的歸一化處理。該體系包括了年度現(xiàn)金流量指標(biāo)、年度運(yùn)營(yíng)能力、年度盈利能力、年度成長(zhǎng)能力和年度償還能力五個(gè)部分,具體指標(biāo)見表1。
五、模擬仿真與結(jié)果討論
(一)CRITIC-灰色關(guān)聯(lián)分析的風(fēng)險(xiǎn)測(cè)度
利用CRITIC法賦予每個(gè)指標(biāo)的權(quán)重,通過MATLAB仿真用CRITIC-灰色關(guān)聯(lián)分析法計(jì)算每個(gè)公司的財(cái)務(wù)風(fēng)險(xiǎn)得分,由于樣本數(shù)據(jù)太多,僅選擇前五和最后五位的得分排序,見表2。
表2數(shù)據(jù)顯示,排名前五的公司在2019年都有非常好的銷售利潤(rùn),其中排名第一的701號(hào)公司在2019年更是達(dá)到了2708億元人民幣的銷售額,同比增長(zhǎng)22.48%。而排名后五的公司,財(cái)務(wù)狀況都不太理想,2556號(hào)公司上半年凈利虧損8810萬元;805號(hào)業(yè)績(jī)虧損3.21億元,較上年同期由盈轉(zhuǎn)虧;1107號(hào)公司凈利1.13億元,下滑51.46%;1850號(hào)公司虧損2.69億元,由盈轉(zhuǎn)虧;775號(hào)公司更是處于連續(xù)五年的虧損狀態(tài)。因此基于CRITIC-灰色關(guān)聯(lián)分析評(píng)價(jià)的風(fēng)險(xiǎn)測(cè)度得到的結(jié)果是合理的。
(二)K-means聚類
對(duì)企業(yè)的樣本數(shù)據(jù)進(jìn)行風(fēng)險(xiǎn)測(cè)度后,通過MATLAB仿真利用K-means聚類將樣本數(shù)據(jù)進(jìn)行風(fēng)險(xiǎn)等級(jí)劃分并打標(biāo)簽,標(biāo)簽一共分為五個(gè)等級(jí),即風(fēng)險(xiǎn)低、風(fēng)險(xiǎn)較低、風(fēng)險(xiǎn)中等、風(fēng)險(xiǎn)較高、風(fēng)險(xiǎn)高。由于使用了正向化處理,因此企業(yè)得分越高,風(fēng)險(xiǎn)等級(jí)越低,得分越低,財(cái)務(wù)風(fēng)險(xiǎn)越高,劃分到每個(gè)類的樣本數(shù)量情況見表3。
(三)SGAN財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警仿真
本文構(gòu)建SGAN模型對(duì)2580條樣本數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),其中訓(xùn)練集1865條數(shù)據(jù),測(cè)試集715條數(shù)據(jù)。在SGAN模型的訓(xùn)練過程中,訓(xùn)練集的準(zhǔn)確率和損失率變化趨勢(shì)如圖2所示。通過圖2可以看出:訓(xùn)練集的準(zhǔn)確率隨著迭代次數(shù)的增加而增加并不斷趨于1,訓(xùn)練集的損失率則隨著迭代次數(shù)的增加而減少并不斷趨于0,兩者都在整個(gè)訓(xùn)練過程中呈現(xiàn)收斂狀態(tài),表示該模型訓(xùn)練過程的學(xué)習(xí)效果良好,可以有效地進(jìn)行測(cè)試和預(yù)測(cè),保證測(cè)試仿真的準(zhǔn)確性。
由于SGAN模型中的噪聲是隨機(jī)的,因此需要為保持其嚴(yán)謹(jǐn)和穩(wěn)定性求出多次訓(xùn)練中的平均準(zhǔn)確率,同時(shí)可以改變迭代次數(shù)來尋找該模型對(duì)其樣本數(shù)據(jù)的最高準(zhǔn)確率,結(jié)果見表4。
表4數(shù)據(jù)顯示,SGAN模型在迭代次數(shù)為3000次的時(shí)候,仿真預(yù)測(cè)效果最好,最高訓(xùn)練集準(zhǔn)確率和測(cè)試集準(zhǔn)確率為100%和91.75%,訓(xùn)練集和測(cè)試集的平均準(zhǔn)確率也都高于其他迭代次數(shù)時(shí)的準(zhǔn)確率,為100%和89.09%。
(四)SGAN模型與其他模型的對(duì)比仿真
將支持向量機(jī)(SVM)模型、簡(jiǎn)單卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型與SGAN模型進(jìn)行比較,結(jié)果見表5。從表中可以看出:SVM模型的準(zhǔn)確率為80.69%,CNN模型的準(zhǔn)確率為87.02%,都不及SGAN模型的預(yù)測(cè)準(zhǔn)確度。說明SGAN模型在財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警方面有很好的預(yù)測(cè)能力,可以很好地應(yīng)用于財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警領(lǐng)域。
六、結(jié)語
本文構(gòu)建了基于半監(jiān)督對(duì)抗神經(jīng)網(wǎng)絡(luò)的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,實(shí)證研究表明:
在SGAN企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的訓(xùn)練過程中,訓(xùn)練集的準(zhǔn)確率隨著迭代次數(shù)的增加而增加并不斷趨于1,訓(xùn)練集的損失率則隨著迭代次數(shù)的增加而減少并不斷趨于0,兩者都在整個(gè)訓(xùn)練過程中呈現(xiàn)收斂狀態(tài),表示該模型訓(xùn)練過程的學(xué)習(xí)效果良好,可以有效地對(duì)財(cái)務(wù)風(fēng)險(xiǎn)數(shù)據(jù)進(jìn)行測(cè)試和預(yù)測(cè),說明模型可以很好地提取財(cái)務(wù)風(fēng)險(xiǎn)數(shù)據(jù)的特征并保證了預(yù)測(cè)的準(zhǔn)確度。
在SGAN企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的仿真過程中,迭代次數(shù)為3000次的時(shí)候,仿真預(yù)測(cè)效果最好,最高訓(xùn)練集準(zhǔn)確率和測(cè)試集準(zhǔn)確率為100%和91.75%,訓(xùn)練集和測(cè)試集的平均準(zhǔn)確率也都高于其他迭代次數(shù)時(shí)的準(zhǔn)確率,為100%和89.09%,驗(yàn)證了SGAN在財(cái)務(wù)數(shù)據(jù)處理領(lǐng)域應(yīng)用的可行性,存在很好的前景發(fā)展。
與SVM和CNN相比較,無論是平均準(zhǔn)確率還是最高準(zhǔn)確率,SGAN模型在企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究中的預(yù)測(cè)效果都比其他兩個(gè)模型要好,SVM模型的準(zhǔn)確率為80.69%,CNN模型的準(zhǔn)確率為87.02%,而SGAN模型的平均準(zhǔn)確率為89.09%、最高準(zhǔn)確率為91.75%,從而也驗(yàn)證了SGAN對(duì)比與其他深度學(xué)習(xí)模型的優(yōu)越性,有更高的預(yù)測(cè)精度。
當(dāng)然,本研究還存在一些不足之處需要改進(jìn),如建立指標(biāo)體系時(shí)還需要考慮宏觀經(jīng)濟(jì)類指標(biāo)。進(jìn)一步設(shè)置更多的對(duì)照組和如何穩(wěn)定SGAN模型中的輸入噪聲從而提高其準(zhǔn)確率,也是未來的研究方向。
參考文獻(xiàn)
[1]李長(zhǎng)山.基于Logistic回歸法的企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型構(gòu)建[J].統(tǒng)計(jì)與決策,2018,34(06):185-188.
[2]張春梅,趙明清,官俊琪.基于Lasso+SVM的制造業(yè)上市公司財(cái)務(wù)風(fēng)險(xiǎn)組合預(yù)警模型[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2021,51(05):1-12.
[3]祝琳.基于生成對(duì)抗網(wǎng)絡(luò)的監(jiān)督/半監(jiān)督高光譜圖像分類方法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2019.