王娜
摘要:文章提出了將Adaboost算法與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的方式構(gòu)建模型,應(yīng)用于我國上市公司財(cái)務(wù)危機(jī)預(yù)警的研究中,對(duì)60家ST和60家非ST的上市公司的財(cái)務(wù)數(shù)據(jù)進(jìn)行實(shí)證檢驗(yàn)。結(jié)果表明,Adaboost算法的引入,提高了神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度,具有較好的實(shí)際應(yīng)用價(jià)值。
關(guān)鍵詞:財(cái)務(wù)危機(jī)預(yù)警;Adaboost;BP神經(jīng)網(wǎng)絡(luò)
財(cái)務(wù)危機(jī)是企業(yè)喪失償還到期債務(wù)的能力,財(cái)務(wù)危機(jī)預(yù)警系統(tǒng)正是為預(yù)防上市公司財(cái)務(wù)危機(jī)而建立起來的一種機(jī)制,能實(shí)時(shí)對(duì)公司的生產(chǎn)經(jīng)營過程和財(cái)務(wù)狀況進(jìn)行跟蹤監(jiān)控,及時(shí)地進(jìn)行財(cái)務(wù)預(yù)警分析,發(fā)現(xiàn)財(cái)務(wù)狀況異常的征兆并迅速報(bào)警,采取應(yīng)對(duì)措施,從而避免或減少損失。因此,研究財(cái)務(wù)危機(jī)預(yù)警體系的構(gòu)建具有非常重要的應(yīng)用價(jià)值和現(xiàn)實(shí)意義。目前,國內(nèi)外財(cái)務(wù)危機(jī)預(yù)警研究中采用的模型一般有單變量和多變量,而多變量模型危機(jī)預(yù)測(cè)的準(zhǔn)確率更高。多變量模型中采用神經(jīng)網(wǎng)絡(luò)方式預(yù)測(cè)財(cái)務(wù)危機(jī)的準(zhǔn)確率遠(yuǎn)遠(yuǎn)高于邏輯回歸多元線性方式。本文將Adaboost與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合來構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型,從而優(yōu)化神經(jīng)網(wǎng)絡(luò)模型,提高其預(yù)測(cè)精度。
一、理論基礎(chǔ)
(一)BP神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,縮寫為ANN),神經(jīng)網(wǎng)絡(luò)的特點(diǎn)是信息的分布式存儲(chǔ)、大規(guī)模并行處理、自學(xué)習(xí)、自組織和自適應(yīng)性及較強(qiáng)的容錯(cuò)性。該方法是把預(yù)警指標(biāo)作為神經(jīng)網(wǎng)絡(luò)的輸入變量,采用訓(xùn)練樣本集對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行不斷的訓(xùn)練,從而保證輸入值與目標(biāo)值間誤差最小。神經(jīng)網(wǎng)絡(luò)克服了傳統(tǒng)統(tǒng)計(jì)方法對(duì)自變量服從統(tǒng)計(jì)特征,自變量與因變量間存在線性函數(shù)關(guān)系等的限制,因此選擇的樣本更具代表性,構(gòu)建的模型具有更強(qiáng)的泛化能力。
BP(Back Propagation)網(wǎng)絡(luò),是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),BP網(wǎng)絡(luò)能學(xué)習(xí)和存貯大量的輸入-輸出模式映射關(guān)系,而無需事前揭示描述這種映射關(guān)系的數(shù)學(xué)方程。因此,BP神經(jīng)網(wǎng)絡(luò)應(yīng)用到財(cái)務(wù)危機(jī)預(yù)警中時(shí),并不需要明確自變量與因變量之間的關(guān)系。只要對(duì)輸出期望值進(jìn)行定義,輸入訓(xùn)練樣本集數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)會(huì)通過自身的自適應(yīng)能力和學(xué)習(xí)能力進(jìn)行模型的訓(xùn)練,當(dāng)輸出與期望輸出的誤差函數(shù)取得極小值時(shí)就實(shí)現(xiàn)了對(duì)輸入和輸出之間函數(shù)關(guān)系的擬合,預(yù)警模型也由此建立。然后再用測(cè)試樣本集進(jìn)行仿真,得出未來的財(cái)務(wù)狀況優(yōu)劣的二值判斷。
(二)Adaboost與BP神經(jīng)網(wǎng)絡(luò)的結(jié)合
Adaboost是一種迭代算法,其核心思想是針對(duì)同一個(gè)訓(xùn)練集訓(xùn)練不同的分類器(弱分類器),然后把這些弱分類器集合起來,構(gòu)成一個(gè)更強(qiáng)的最終分類器(強(qiáng)分類器)。BP-Adaboost模型,即把BP神經(jīng)網(wǎng)絡(luò)作為弱分類器,反復(fù)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)樣本輸出,通過Adaboost算法得到多個(gè)BP神經(jīng)網(wǎng)絡(luò)弱分類器組成的強(qiáng)分類器,從而提高BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度。
二、BP-Adaboost模型在財(cái)務(wù)危機(jī)預(yù)警中的應(yīng)用
(一)指標(biāo)篩選
選取能夠反映公司特征的預(yù)警指標(biāo)是構(gòu)建科學(xué)有效的財(cái)務(wù)危機(jī)預(yù)警模型的首要條件。為了能夠準(zhǔn)確地對(duì)公司財(cái)務(wù)危機(jī)進(jìn)行預(yù)測(cè),選取的指標(biāo)必須涵蓋公司的各個(gè)方面。本文在借鑒國內(nèi)外學(xué)者研究成果的基礎(chǔ)上,選取企業(yè)償債能力、盈利能力、現(xiàn)金能力、營運(yùn)能力和成長能力等方面的財(cái)務(wù)指標(biāo)。此外,還選擇了審計(jì)報(bào)告類型、獨(dú)立董事比例等方面的非財(cái)務(wù)指標(biāo),共選取25個(gè)指標(biāo)作為研究初始變量來構(gòu)建上市公司財(cái)務(wù)危機(jī)預(yù)警的指標(biāo)體系。所選取的指標(biāo)為X1總資產(chǎn)報(bào)酬率、X2凈資產(chǎn)收益率、X3銷售凈利率、X4凈資產(chǎn)獲現(xiàn)率、X5每股收益、X6每股凈資產(chǎn)、X7銷售現(xiàn)金比率、X8每股經(jīng)營現(xiàn)金凈流量、X9總資產(chǎn)獲現(xiàn)率、X10資產(chǎn)負(fù)債率、X11流動(dòng)比率、X12現(xiàn)金負(fù)債總額比、X13現(xiàn)金流動(dòng)負(fù)債比、X14現(xiàn)金流量利息保障倍數(shù)、X15應(yīng)收賬款周轉(zhuǎn)率、X16存貨周轉(zhuǎn)率、X17總資產(chǎn)周轉(zhuǎn)率、X18主營業(yè)務(wù)收入增長率、X19凈利潤增長率、X20凈資產(chǎn)增長率、X21總資產(chǎn)增長率、X22公司資產(chǎn)規(guī)模、X23審計(jì)報(bào)告類型、X24獨(dú)立董事比重、X25第一大股東持股比例。
在用于公司財(cái)務(wù)預(yù)警預(yù)測(cè)時(shí),如果對(duì)所有指標(biāo)都進(jìn)行評(píng)價(jià)后綜合,模型過于復(fù)雜,并且各指標(biāo)間相關(guān)性較強(qiáng),因此在模型建立前需要進(jìn)行指標(biāo)的篩選。
指標(biāo)篩選分為顯著性和因子分析兩步。顯著性分析通過T檢驗(yàn)方法分析ST和非ST公司,在財(cái)務(wù)指標(biāo)中找出差別較大、能夠明顯區(qū)分兩類公司的財(cái)務(wù)指標(biāo)。利用 SPSS 統(tǒng)計(jì)分析軟件提供的獨(dú)立樣本 T 檢驗(yàn)進(jìn)行指標(biāo)的初次篩選,剔除 T 檢驗(yàn)總體方差值大于等于 0.08 那些顯著性差異不大的指標(biāo)。在顯著性分析的基礎(chǔ)上,用因子分析對(duì)篩選出來的指標(biāo)計(jì)算主成分特征值,從中找出特征值大于1的主成分作為公司危機(jī)預(yù)警方法的最終預(yù)測(cè)指標(biāo)。
用SPSS統(tǒng)計(jì)分析提取了四個(gè)主成分,如表1所示。經(jīng)分析,四個(gè)主成分包含的主要指標(biāo)有X1資產(chǎn)報(bào)酬率、X3銷售凈利率、X5每股收益、X8每股經(jīng)營現(xiàn)金流量、X10資產(chǎn)負(fù)債率、X11流動(dòng)比率、X12現(xiàn)金負(fù)債總額比、X16存貨周轉(zhuǎn)率、X17總資產(chǎn)周轉(zhuǎn)率、X19凈利潤增長率、X21總資產(chǎn)增長率、X23審計(jì)報(bào)告類型,因此,本文把這12個(gè)指標(biāo)作為公司危機(jī)預(yù)警的最終預(yù)測(cè)指標(biāo)。
(二)樣本選擇
根據(jù)財(cái)務(wù)危機(jī)的概念和定義,本文選取首次被特別處理的公司為實(shí)證研究的對(duì)象。特別處理,主要取決于t-1年的財(cái)務(wù)狀況,但是t-1年財(cái)務(wù)數(shù)據(jù)的報(bào)出與上市公司的特別處理幾乎處于同一段時(shí)間。運(yùn)用t-1年的財(cái)務(wù)數(shù)據(jù)建立預(yù)警模型去預(yù)測(cè)t年公司是否會(huì)出現(xiàn)財(cái)務(wù)危機(jī),不具有實(shí)際意義。t-2年的財(cái)務(wù)數(shù)據(jù)對(duì)于判斷上市公司是否會(huì)出現(xiàn)財(cái)務(wù)危機(jī)比較關(guān)鍵?;谝陨显颍疚难芯康腟T樣本選用2014年和2013年首次被特別處理的上市公司,并選取t-2年的年度財(cái)務(wù)數(shù)據(jù)來預(yù)測(cè)第t年是否會(huì)成為ST公司,即以2011年及2012年的財(cái)務(wù)數(shù)據(jù)分別預(yù)測(cè)公司2013年及2014年是否被ST。
本文的研究數(shù)據(jù)來自國泰安csmar數(shù)據(jù)庫,選取2013年和2014年首次被ST的上市公司共60家,包括2013年被ST的21家、2014年被ST的39家,然后選取了60家非ST公司,包括2013年的21家、2014年的39家。研究總樣本分訓(xùn)練樣本組和檢驗(yàn)樣本組,訓(xùn)練樣本組包括38家ST公司和38家非ST公司,檢驗(yàn)樣本組包括22家ST公司和22家非ST公司。訓(xùn)練樣本組的數(shù)據(jù)是用于構(gòu)建預(yù)警模型,檢驗(yàn)樣本用于檢測(cè)模型實(shí)際運(yùn)用的有效性。
(三)模型建立
基于BP-Adaboost 模型的公司財(cái)務(wù)預(yù)警算法流程如圖1所示。
算法步驟如下。
1. 數(shù)據(jù)選擇和網(wǎng)絡(luò)初始化。從樣本空間中隨機(jī)選擇m組訓(xùn)練數(shù)據(jù),初始化測(cè)試數(shù)據(jù)的分布權(quán)值Dt(i)=1/m,根據(jù)樣本輸入輸出維數(shù)確定神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),初始BP神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值。
2. 弱分類器預(yù)測(cè)。訓(xùn)練第t個(gè)弱分類器時(shí),用訓(xùn)練數(shù)據(jù)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)并且預(yù)測(cè)訓(xùn)練數(shù)據(jù)輸出,得到預(yù)測(cè)序列g(shù)(t)的預(yù)測(cè)誤差和et,誤差和et的計(jì)算公式為
et=■Dt(i) i=1,2Λ,m(g(t)≠y)(1)
其中,g(t)為預(yù)測(cè)分類結(jié)果;y為期望分類結(jié)果。
3. 計(jì)算預(yù)測(cè)序列權(quán)重。根據(jù)預(yù)測(cè)序列g(shù)(t)的預(yù)測(cè)誤差et計(jì)算序列的權(quán)重at,a t的計(jì)算公式為
at=■Ln(■)(2)
測(cè)試數(shù)據(jù)權(quán)重調(diào)整。根據(jù)預(yù)測(cè)序列權(quán)重at調(diào)整下一輪訓(xùn)練樣本的權(quán)重,調(diào)整公式為
Dt+1(i)=■*exp[-atytgt(xi)](3)
i=1,2Λ,m
式中,Bt是歸一化因子,目的是在權(quán)重比例不變的情況下使分別權(quán)值和為1。
強(qiáng)分類函數(shù)。訓(xùn)練T輪后得到T組弱分類函數(shù)f(gt,at),由T組弱分類函數(shù)f(gt,at)組合得到了強(qiáng)分類函數(shù)h(x)。
h(x)=sign[■at·f(gt,at)](4)
本文共選取了120個(gè)樣本的財(cái)務(wù)數(shù)據(jù),每組數(shù)據(jù)的輸入為12維,代表上述的12個(gè)指標(biāo),輸出為1維,代表公司財(cái)務(wù)狀況,為1時(shí)表示財(cái)務(wù)狀況良好,為-1時(shí)表示公司財(cái)務(wù)出現(xiàn)危機(jī)。從中隨機(jī)選取76組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),44組數(shù)據(jù)作為測(cè)試數(shù)據(jù)。根據(jù)數(shù)據(jù)維數(shù),采用的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為12-6-1,共訓(xùn)練生成12個(gè)BP神經(jīng)網(wǎng)絡(luò)弱分類器,最后用12個(gè)弱分類器組成強(qiáng)分類器對(duì)公司財(cái)務(wù)狀況進(jìn)行分類。
(四)編程實(shí)現(xiàn)
根據(jù)Adaboost和BP神經(jīng)網(wǎng)絡(luò)原理,運(yùn)用Matlab編程進(jìn)行反復(fù)試驗(yàn),本研究釆用基于最優(yōu)化理論的訓(xùn)練算法,即Levenberg-Marqurad算法,參數(shù)的設(shè)定情況如下:循環(huán)間次數(shù)為5,目標(biāo)誤差0.0004。
三、實(shí)證結(jié)果分析
分析樣本共有120組,共有12個(gè)BP神經(jīng)網(wǎng)絡(luò)弱分類器組成的強(qiáng)分類器預(yù)測(cè)公司財(cái)務(wù)運(yùn)行狀況,預(yù)測(cè)情況如圖2和圖3所示。
由圖2可知,強(qiáng)分類器訓(xùn)練樣本的擬合優(yōu)度為93.89%,檢測(cè)樣本的擬合優(yōu)度為89.5%,綜合擬合優(yōu)度為92.58%,說明BP-Adaboost模型對(duì)樣本觀測(cè)值的擬合程度較高。
由圖3可以看出,強(qiáng)分類器對(duì)檢測(cè)樣本預(yù)測(cè)誤差絕對(duì)值小于弱分類器預(yù)測(cè)誤差絕對(duì)值,從而說明引入Adaboost算法后,分類器的預(yù)測(cè)精度提高。
此外,程序運(yùn)行結(jié)果如表2所示。強(qiáng)分類器第一類分類錯(cuò)誤為0,第二類分類錯(cuò)誤為11,綜合分類錯(cuò)誤率為9.17%,高于弱分類器13.5%的分類錯(cuò)誤率。
四、結(jié)論
本文把Adaboost與BP神經(jīng)網(wǎng)絡(luò)結(jié)合構(gòu)建模型并應(yīng)用到上市公司財(cái)務(wù)預(yù)警的研究中,利用神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)能力和很好的泛化能力,把其作為弱分類器,Adaboost算法通過組合神經(jīng)網(wǎng)絡(luò)弱分類器而得到強(qiáng)分類器,從而提高神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)能力和分類能力,與傳統(tǒng)的單元、多元統(tǒng)計(jì)分析方法以及單一的神經(jīng)網(wǎng)絡(luò)相比,該模型具有較高的預(yù)測(cè)準(zhǔn)確率和實(shí)際應(yīng)用價(jià)值。
參考文獻(xiàn):
[1]E.Altman.Corporte Financial Distress and Bankruptey[J].John Wiley & Logitsons,2000(06).
[2]吳世農(nóng),盧賢義.我國上市公司財(cái)務(wù)危機(jī)的預(yù)測(cè)模型研究[J].經(jīng)濟(jì)研究,2001(06).
[3]吳冬梅.基于支持向量機(jī)的財(cái)務(wù)危機(jī)預(yù)警模型[J].東北大學(xué)學(xué)報(bào),2010(04).
[4]曹瑩.AdaBoost算法研究進(jìn)展與展望[J].自動(dòng)化學(xué)報(bào),2012(09).
[5]周喜,劉勝輝.基于優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型的上市公司財(cái)務(wù)危機(jī)預(yù)警[J].財(cái)會(huì)月刊,2012(03).
*基金項(xiàng)目:國家自然科學(xué)基金(61302156)。
(作者單位:南京大學(xué)金陵學(xué)院商學(xué)院)