荘芳芳
(昆明市交通技工學(xué)校,財(cái)務(wù)科,云南,昆明 650000)
企業(yè)的財(cái)務(wù)狀態(tài)不僅決定了企業(yè)的發(fā)展,而且還影響著整體經(jīng)濟(jì)走勢[1]?;谄髽I(yè)歷史及當(dāng)期財(cái)務(wù)數(shù)據(jù)預(yù)測財(cái)務(wù)危機(jī)具有十分重要的現(xiàn)實(shí)意義,已經(jīng)成為判定企業(yè)經(jīng)營狀況,調(diào)制投資策略的重要依據(jù)[2-3]。
企業(yè)財(cái)務(wù)危機(jī)的預(yù)測是一個(gè)二分類問題,即將企業(yè)狀態(tài)劃分為正常財(cái)務(wù)或危機(jī)財(cái)務(wù),研究人員已經(jīng)提出多種企業(yè)財(cái)務(wù)危機(jī)預(yù)測方法[4]。文獻(xiàn)[5]在COX模型的基礎(chǔ)上,通過引入懲罰組變量選擇CMCP方法,篩選出了對(duì)企業(yè)財(cái)務(wù)危機(jī)預(yù)測關(guān)鍵財(cái)務(wù)指標(biāo)。文獻(xiàn)[6]提出了一種基于粒子群優(yōu)化算法與核極限學(xué)習(xí)機(jī)的企業(yè)財(cái)務(wù)危機(jī)預(yù)測方法,降低了財(cái)務(wù)預(yù)測過程中參數(shù)優(yōu)化與特征選擇之間的矛盾。文獻(xiàn)[7]提出了基于靜態(tài)財(cái)務(wù)指標(biāo)的動(dòng)態(tài)財(cái)務(wù)指標(biāo),并構(gòu)建了深度神經(jīng)網(wǎng)絡(luò)框架財(cái)務(wù)危機(jī)預(yù)測模型。
本文提出一種集成財(cái)務(wù)危機(jī)預(yù)測模型。該模型首先采用自組織映射(SOM)聚類處理初始財(cái)務(wù)數(shù)據(jù),根據(jù)財(cái)務(wù)數(shù)據(jù)狀態(tài)將企業(yè)劃分為不同的組;然后針對(duì)不同財(cái)務(wù)狀態(tài),基于寬度學(xué)習(xí)系統(tǒng)構(gòu)建基分類器,訓(xùn)練完成后采用逐步向前集成方法搭建集成分類器,預(yù)測企業(yè)財(cái)務(wù)狀態(tài)。實(shí)證分析結(jié)果驗(yàn)證該模型的有效性和準(zhǔn)確性。
圖1給出了SOM映射網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),整個(gè)網(wǎng)絡(luò)包括2部分:輸入層和競爭層(又稱輸出層)[8]。網(wǎng)絡(luò)輸入層由N個(gè)節(jié)點(diǎn)神經(jīng)元組成,負(fù)責(zé)接收輸入數(shù)據(jù);網(wǎng)絡(luò)競爭層由一個(gè)排列成R行C列的神經(jīng)元矩陣構(gòu)成。網(wǎng)絡(luò)運(yùn)行過程中,競爭層中的神經(jīng)元每個(gè)時(shí)刻僅有一個(gè)被激活,在相互競爭中獲得優(yōu)先激活權(quán),被激活的神經(jīng)元表示了對(duì)當(dāng)前輸入數(shù)據(jù)的分類結(jié)果。
圖1 SOM聚類結(jié)構(gòu)
為了更加精準(zhǔn)地獲取財(cái)務(wù)數(shù)據(jù)在短期內(nèi)的波動(dòng)特征,首先將財(cái)務(wù)數(shù)據(jù)轉(zhuǎn)化為時(shí)間序列,即各個(gè)時(shí)刻t對(duì)應(yīng)的財(cái)務(wù)數(shù)據(jù)為x(t)∈RN,其中N表示財(cái)務(wù)危機(jī)預(yù)測中輸入樣本數(shù)據(jù)的特征維數(shù),然后利用SOM聚類處理輸入財(cái)務(wù)數(shù)據(jù)。根據(jù)SOM聚類原理,如果不同時(shí)間段的歷史財(cái)務(wù)數(shù)據(jù)與未來的變動(dòng)趨勢具有較大差異,就會(huì)被劃分至不同的SOM聚類中,后續(xù)將采用不同的預(yù)測模型以更好地匹配其變化趨勢。
針對(duì)財(cái)務(wù)數(shù)據(jù)聚類分析問題,SOM聚類步驟如下。
步驟1:參數(shù)初始化。設(shè)置最大聚類迭代次數(shù)K,并令k=1,隨機(jī)化競爭層中神經(jīng)元之間的權(quán)值向量ωi∈RN。輸入數(shù)據(jù)與權(quán)值向量歸一化,將輸入樣本x∈RN和競爭層權(quán)值向量進(jìn)行歸一化處理。
步驟2:神經(jīng)元競爭。采用歐氏距離比較競爭層中所有神經(jīng)元對(duì)應(yīng)的權(quán)值向量ωi與輸入層的輸入向量x,將與輸入向量距離最近的神經(jīng)元作為競爭獲勝神經(jīng)元,獲勝神經(jīng)元權(quán)值向量權(quán)值向量記為ωc,神經(jīng)元競爭過程可以表示為
(1)
步驟3:調(diào)整競爭層權(quán)值向量。對(duì)獲勝神經(jīng)元的近鄰神經(jīng)元的權(quán)值向量進(jìn)行調(diào)整,目的是使其靠攏輸入向量,調(diào)整過程可以表示為
(2)
(3)
其中,α(k)和σ(k)分別表示網(wǎng)絡(luò)學(xué)習(xí)率和神經(jīng)元的影響半徑,隨著k的增加,這2個(gè)參數(shù)均逐漸減小。
步驟4:更新數(shù)據(jù)向量。將新的數(shù)據(jù)樣本數(shù)據(jù)導(dǎo)入SOM聚類網(wǎng)絡(luò),返回步驟2繼續(xù)調(diào)整競爭層權(quán)值向量,直至所有數(shù)據(jù)樣本均完成聚類訓(xùn)練。
步驟5:算法收斂判定。如果相鄰兩次迭代的權(quán)值向量誤差小于預(yù)設(shè)門限值或者迭代次數(shù)等于K,則聚類過程結(jié)束;否則令k=k+1,并返回步驟2。
上述SOM聚類過程表明,網(wǎng)絡(luò)競爭層中的神經(jīng)元與其鄰近神經(jīng)元互相促進(jìn)學(xué)習(xí),經(jīng)過訓(xùn)練后鄰近神經(jīng)元具有相似的權(quán)值向量,因此輸入特征相似的樣本數(shù)據(jù)將被映射至鄰近神經(jīng)元節(jié)點(diǎn)上。通過SOM對(duì)企業(yè)財(cái)務(wù)數(shù)據(jù)進(jìn)行聚類后,針對(duì)不同類型的財(cái)務(wù)數(shù)據(jù)會(huì)形成各自的基分類器,更好地實(shí)現(xiàn)對(duì)企業(yè)財(cái)務(wù)數(shù)據(jù)的擬合,提高后續(xù)財(cái)務(wù)危機(jī)的預(yù)測精度。
寬度學(xué)習(xí)系統(tǒng)是在隨機(jī)向量函數(shù)鏈接神經(jīng)網(wǎng)絡(luò)(RVFLNN)基礎(chǔ)上得出的一種新的學(xué)習(xí)算法[9]。RVFLNN的學(xué)習(xí)思想將初始數(shù)據(jù)以及初始數(shù)據(jù)的簡單映射結(jié)果共同作為網(wǎng)絡(luò)模型的輸入,然后訓(xùn)練網(wǎng)絡(luò)模型獲取最終輸出。寬度學(xué)習(xí)系統(tǒng)包括3層結(jié)構(gòu),即輸入層、隱藏層和輸出層,其中隱藏層由增強(qiáng)特征節(jié)點(diǎn)層和映射特征節(jié)點(diǎn)層構(gòu)成,系統(tǒng)結(jié)構(gòu)如圖2所示。寬度學(xué)習(xí)系統(tǒng)的學(xué)習(xí)過程主要包括映射節(jié)點(diǎn)組、增強(qiáng)節(jié)點(diǎn)與系統(tǒng)輸出。首先,構(gòu)建映射特征組,構(gòu)建方法是將初始數(shù)據(jù)經(jīng)過線性特征映射函數(shù)變換后,利用稀疏自編碼器生成;然后,生成增強(qiáng)節(jié)點(diǎn)層,即將映射特征組分別進(jìn)行線性映射與非線性激活,得出增強(qiáng)節(jié)點(diǎn);最后,計(jì)算系統(tǒng)輸出,將映射節(jié)點(diǎn)與增強(qiáng)節(jié)點(diǎn)導(dǎo)入到輸出權(quán)值矩陣,經(jīng)過回歸廣義逆計(jì)算得出系統(tǒng)輸出。
圖2 寬度學(xué)習(xí)系統(tǒng)結(jié)構(gòu)
寬度學(xué)習(xí)系統(tǒng)的輸入數(shù)據(jù)可以表示為X∈Ra×b,其中a和b分別表示輸入數(shù)據(jù)的數(shù)量和特征維度;輸出數(shù)據(jù)可以表示為Y∈Ra×c,其中a和b分別表示模型輸出的a個(gè)c維數(shù)據(jù),則系統(tǒng)的第i組映射特征可以表示為
(4)
其中,φi(·)表示網(wǎng)絡(luò)的特征映射函數(shù),Wei和βei分別表示由稀疏編碼器生成的第i個(gè)最佳權(quán)值向量和與該權(quán)值向量對(duì)應(yīng)的偏置向量。由式(4)可知,映射特征組的節(jié)點(diǎn)數(shù)取決于權(quán)值向量Wei的維數(shù)。
將映射特征組導(dǎo)入映射函數(shù)變換后即可生成增強(qiáng)節(jié)點(diǎn)組,則第j個(gè)增強(qiáng)節(jié)點(diǎn)組[10]可以表示為
Hj=ξj(Whj·Zn+βhj),j=1,2,…,n
(5)
其中,ξj表示映射模型的激活函數(shù),通常非線性函數(shù),Whj和βhj分別表示特征特點(diǎn)映射至增強(qiáng)節(jié)點(diǎn)的權(quán)值向量和偏置向量。此時(shí)d個(gè)增強(qiáng)節(jié)點(diǎn)組構(gòu)成的集合可以表示為
Hd=[H1,H2,…,Hd]
(6)
寬度學(xué)習(xí)系統(tǒng)的輸出為映射特征節(jié)點(diǎn)與增強(qiáng)特征節(jié)點(diǎn)共同生成的,可以表示為
Y=[Zn|Hd]W=[Z1,Z2,…,Zn|H1,H2,…,Hd]W
(7)
式中,[Zn|Hd]表示寬度學(xué)習(xí)系統(tǒng)的輸入,W表示從特征節(jié)點(diǎn)到增強(qiáng)節(jié)點(diǎn)再到系統(tǒng)輸出的權(quán)值矩陣,Y表示系統(tǒng)輸出,表示財(cái)務(wù)危機(jī)的預(yù)測值。
訓(xùn)練過程中,模型初始化過程中隨機(jī)生成的權(quán)值向量Wei和Whj、偏置向量βei和βhj將保持不變,因此寬度學(xué)習(xí)系統(tǒng)的訓(xùn)練過程就是搜尋使得線性系統(tǒng)輸出的最小二乘解,即
(8)
根據(jù)寬度學(xué)習(xí)系統(tǒng)訓(xùn)練過程可知,系統(tǒng)無須進(jìn)行權(quán)值向量的梯度下降學(xué)習(xí),因此具有較快的訓(xùn)練速度,且訓(xùn)練過程降低了系統(tǒng)陷入局部最優(yōu)值的概率。對(duì)于企業(yè)財(cái)務(wù)危機(jī)預(yù)測問題,歷史數(shù)據(jù)時(shí)間長,訓(xùn)練數(shù)據(jù)集規(guī)模很大,因此適合于訓(xùn)練效率較高的寬度學(xué)習(xí)系統(tǒng)。并且,每個(gè)時(shí)刻企業(yè)財(cái)務(wù)狀態(tài)數(shù)據(jù)均對(duì)應(yīng)著多種財(cái)務(wù)數(shù)據(jù),數(shù)據(jù)維度非常高,對(duì)應(yīng)需要構(gòu)建高維度的輸入層,因此財(cái)務(wù)危機(jī)預(yù)測模型采用單隱藏層結(jié)構(gòu),能夠在確保財(cái)務(wù)數(shù)據(jù)擬合精度的前提下提升模型的訓(xùn)練效率。
對(duì)于財(cái)務(wù)危機(jī)預(yù)測問題,預(yù)測模型性能不僅體現(xiàn)在財(cái)務(wù)危機(jī)預(yù)測精確性上,還體現(xiàn)在提前預(yù)測能力上。因此,雖然選擇t-1或t-2年度數(shù)據(jù)預(yù)測t年度會(huì)使得預(yù)測精確度有所提升,但預(yù)測超前性不足,預(yù)測結(jié)果不足以為企業(yè)預(yù)留出充足時(shí)間調(diào)整決策。為此,綜合前3個(gè)年度財(cái)務(wù)數(shù)據(jù)構(gòu)建預(yù)測模型,以平衡財(cái)務(wù)危機(jī)預(yù)測精度和超前性的矛盾。
利用寬度學(xué)習(xí)系統(tǒng)扁平化特點(diǎn),構(gòu)造具備多輸出功能的神經(jīng)網(wǎng)絡(luò),預(yù)測企業(yè)當(dāng)前年度的財(cái)務(wù)狀態(tài)。借鑒已有財(cái)務(wù)危機(jī)預(yù)測研究成果,文中從盈利能力、營運(yùn)能力、償債能力、每股比例以及成長能力等5個(gè)方面選取了30個(gè)財(cái)務(wù)指標(biāo)作為樣本特征,具體如表1所示。
表1 財(cái)務(wù)危機(jī)預(yù)測指標(biāo)
構(gòu)建集成財(cái)務(wù)危機(jī)預(yù)測模型,模型框架如圖3所示。
圖3 財(cái)務(wù)危機(jī)預(yù)測框架
首先,利用SOM聚類對(duì)財(cái)務(wù)數(shù)據(jù)進(jìn)行精細(xì)化處理,將特征相似度高的樣本劃分為一類,聚類后的各個(gè)類簇分別代表一類公司的財(cái)務(wù)狀態(tài);然后,采用寬度學(xué)習(xí)系統(tǒng)分別構(gòu)建各個(gè)財(cái)務(wù)狀態(tài)的危機(jī)預(yù)測模型;最后,通過集成分類實(shí)現(xiàn)對(duì)企業(yè)財(cái)務(wù)數(shù)據(jù)的精準(zhǔn)分析。模型預(yù)測過程如下。
假設(shè)SOM模糊聚類將數(shù)據(jù)集劃分為P個(gè)數(shù)據(jù)子集,則每個(gè)數(shù)據(jù)子集均代表了一類公司的財(cái)務(wù)狀態(tài)。P個(gè)數(shù)據(jù)子集有效描述了從健康財(cái)務(wù)狀態(tài)空間到危機(jī)財(cái)務(wù)狀態(tài)空間的全序列描述。利用分類后的財(cái)務(wù)數(shù)據(jù)進(jìn)行寬度學(xué)習(xí)系統(tǒng)訓(xùn)練后,就能夠得出滿足后續(xù)分類器集成層需要的基分類器。
最后是分類器集成,目的是尋找最合適的基分類器,采用預(yù)測性能優(yōu)秀的逐步向前集成方法。該方法的分類器選擇思路是先對(duì)基分類器的預(yù)測性能進(jìn)行排序,然后逐步實(shí)現(xiàn)分類器的選擇與集成。具體的方法為,如果某一個(gè)基分類器加入集成分類器后,集成分類器的分類性能得到提升,則該基分類器被選擇值集成分類器中,直至所有的基分類器均不能使集成分類器性能得到提升,則分類器集成結(jié)束。通過基分類器集成,能夠確保整體財(cái)務(wù)預(yù)測模型的性能最佳。
主要研究內(nèi)容是設(shè)計(jì)了一個(gè)基于SOM聚類和寬度學(xué)習(xí)系統(tǒng)的兩層集成分類器的財(cái)務(wù)危機(jī)預(yù)測模型。為此實(shí)證分析首先需要驗(yàn)證SOM聚類分析引入的不同企業(yè)財(cái)務(wù)狀態(tài)空間對(duì)解決財(cái)務(wù)危機(jī)預(yù)測問題的性能,然后驗(yàn)證寬帶學(xué)習(xí)系統(tǒng)對(duì)預(yù)測財(cái)務(wù)危機(jī)的有效性。選用了2017年至2019年被特殊處理的329個(gè)上市公司財(cái)務(wù)數(shù)據(jù),為均衡樣本,增加了368個(gè)財(cái)務(wù)健康的企業(yè)數(shù)據(jù)作為正樣本。
為驗(yàn)證SOM聚類對(duì)財(cái)務(wù)數(shù)據(jù)集空間劃分的性能,將其與高斯核函數(shù)模糊聚類(GFCM)和支持向量聚類(SVM)進(jìn)行對(duì)比測試。3種聚類模型對(duì)企業(yè)財(cái)務(wù)數(shù)據(jù)狀態(tài)空間的劃分結(jié)果如表2所示,表中給出了資產(chǎn)收益率、資產(chǎn)總增長率和資產(chǎn)負(fù)債率這3個(gè)最能代表企業(yè)盈利能力、成長能力和償債能力的指標(biāo)聚類后各組均值。
表2 3種方法聚類后指標(biāo)均值
實(shí)證結(jié)果表明,財(cái)務(wù)指標(biāo)能夠有效反應(yīng)企業(yè)的財(cái)務(wù)狀態(tài)。對(duì)于SOM聚類結(jié)果,資產(chǎn)收益率和總資產(chǎn)增長率從分組1到分組4均呈現(xiàn)下降趨勢,而資產(chǎn)負(fù)債率從分組1到分組4均呈現(xiàn)上升趨勢。對(duì)于GFCM和SVM,不同分組的財(cái)務(wù)指標(biāo)趨勢相同。經(jīng)過聚類后,分組1中均為具有很強(qiáng)盈利能力的財(cái)務(wù)健康企業(yè)構(gòu)成,而分組4中均為財(cái)務(wù)狀態(tài)欠佳、盈利能力低的企業(yè)構(gòu)成。測試結(jié)果說明,通過對(duì)企業(yè)財(cái)務(wù)數(shù)據(jù)進(jìn)行聚類預(yù)處理,能夠有效識(shí)別出不同財(cái)務(wù)狀態(tài)的企業(yè),為后續(xù)有針對(duì)性地訓(xùn)練基分類器提供數(shù)據(jù)支撐。對(duì)比3種財(cái)務(wù)數(shù)據(jù)聚類方法結(jié)果可知,SOM聚類結(jié)果中不同分組的組內(nèi)相似度和組間差異度性能優(yōu)于GFCM和SVM方法,說明SOM聚類對(duì)企業(yè)財(cái)務(wù)數(shù)據(jù)具有良好的適用性。
寬度學(xué)習(xí)系統(tǒng)(BLS)是采用的基分類器模型,為驗(yàn)證其對(duì)企業(yè)財(cái)務(wù)危機(jī)的預(yù)測能力,將其與核函數(shù)支持向量機(jī)(FSVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)和Logistic回歸分類器進(jìn)行對(duì)比測試,企業(yè)財(cái)務(wù)數(shù)據(jù)聚類分析方法分別采用SOM、GFCM和SVM方法。4種基分類器在測試集上的預(yù)測準(zhǔn)確率如表3所示。
表3 4種基分類器,3種方法聚類后指標(biāo)均值
表3結(jié)果表明,4種基分類器中,寬度學(xué)習(xí)系統(tǒng)和SOM聚類算法的組合預(yù)測模型對(duì)健康企業(yè)、危機(jī)企業(yè)以及全部企業(yè)的財(cái)務(wù)狀態(tài)預(yù)測結(jié)果最佳,分別為91.24%、96.09%和93.29%,預(yù)測結(jié)果最差為人工神經(jīng)網(wǎng)絡(luò)與支持向量聚類組合的預(yù)測模型,分別為59.42%、58.04%和58.98%。對(duì)比在SOM聚類條件下的4種基分類器模型預(yù)測結(jié)果可知,寬度學(xué)習(xí)系統(tǒng)更適合于對(duì)企業(yè)財(cái)務(wù)危機(jī)狀態(tài)進(jìn)行預(yù)測,這是因?yàn)閷挾葘W(xué)習(xí)系統(tǒng)能夠準(zhǔn)確提取輸入財(cái)務(wù)數(shù)據(jù)的特征,并高精度擬合高維財(cái)務(wù)數(shù)據(jù)與財(cái)務(wù)狀態(tài)之間的關(guān)系,因此其預(yù)測性能優(yōu)于其他分類器。
研究了企業(yè)財(cái)務(wù)危機(jī)預(yù)測問題,提出了一種基于SOM聚類和寬度學(xué)習(xí)的集成預(yù)測方法。實(shí)證分析結(jié)果表明,該方法能夠?qū)Σ煌?cái)務(wù)狀態(tài)的企業(yè)進(jìn)行分類,高精度地提取并擬合高維財(cái)務(wù)數(shù)據(jù)與企業(yè)財(cái)務(wù)狀態(tài)之間的關(guān)系,提升了財(cái)務(wù)危機(jī)預(yù)測性能。研究內(nèi)容為預(yù)測企業(yè)財(cái)務(wù)危機(jī)提供了一種新方法。