蔣盛益 ,汪 珊,蔡余沖
(廣東外語外貿(mào)大學(xué)a.信息學(xué)院,b.財經(jīng)學(xué)院,廣州 510420)
陷入經(jīng)營危機的企業(yè)幾乎毫無例外地都是以出現(xiàn)財務(wù)危機為征兆。財務(wù)危機的出現(xiàn)有一個逐步顯現(xiàn)、不斷惡化的過程,最終會通過財務(wù)指標反映出來。因此,財務(wù)管理作為企業(yè)經(jīng)營管理的一個重要組成部分,自然也要求建立相應(yīng)的財務(wù)預(yù)警系統(tǒng)。構(gòu)建一個有效的財務(wù)危機預(yù)警模型,及早獲得上市公司財務(wù)狀況出現(xiàn)嚴重惡化的預(yù)警信號,滿足利益相關(guān)者日益迫切的需要,具有很重要的研究價值和現(xiàn)實意義。此外,正確預(yù)測企業(yè)財務(wù)風(fēng)險,對于保護投資者和債權(quán)人的利益、經(jīng)營者防范財務(wù)危機,以及政府管理部門監(jiān)管上市公司質(zhì)量和證券市場風(fēng)險,都具有十分重要的現(xiàn)實意義。本文采用多種機器學(xué)習(xí)方法對2005~2007年的非金融企業(yè)上市公司財務(wù)數(shù)據(jù)進行了分析。
本文實驗的原始數(shù)據(jù)來源于CCER中國上市公司非金融企業(yè)財務(wù)數(shù)據(jù)庫中2000~2007年一般上市公司的真實財務(wù)報表數(shù)據(jù),將中國證券市場中上市公司被ST(特別處理)和被*ST(退市預(yù)警)視為公司陷入財務(wù)危機的標志。選取Normal(財務(wù)正常)、ST以及*ST作為目標變量。
基于對樣本個體差異的考慮,一般認為金融行業(yè)的財務(wù)指標和非金融行業(yè)的財務(wù)指標有明顯的差異,因此,本文僅針對非金融上市公司進行研究。并根據(jù)中國上海證券交易所和深圳證券交易所所有非金融行業(yè)A股的年度報告中的財務(wù)數(shù)據(jù),同時刪除不屬于Normal,ST以及*ST的數(shù)據(jù)后分別得到二組測試數(shù)據(jù),第一組將2000~2005年5183條正常公司數(shù)據(jù)和521條非正常公司數(shù)據(jù)(ST為449條,*ST為72條)作為訓(xùn)練集,對應(yīng)2006年1253條正常公司數(shù)據(jù)和55條非正常公司數(shù)據(jù)(ST為26條,*ST為29條)以及2007年1347條正常公司數(shù)據(jù)和116條非正常公司數(shù)據(jù) (ST為57條,*ST為59條)作為測試集;第二組將2000~2006年6436條正常公司數(shù)據(jù)和576條非正常公司數(shù)據(jù)(ST為475條,*ST為101條)作為訓(xùn)練集,對應(yīng)2007年1347條正常公司數(shù)據(jù)和116條非正常公司數(shù)據(jù)(ST為57條,*ST為59條)作為測試集。在訓(xùn)練集上建立預(yù)測模型,在測試集上檢驗?zāi)P偷挠行浴?/p>
企業(yè)陷入財務(wù)困境是一個漸進的過程,其生產(chǎn)經(jīng)營狀況逐步惡化通常會快速地反應(yīng)在企業(yè)的財務(wù)報表上,表現(xiàn)出一些財務(wù)指標數(shù)據(jù)異常。影響企業(yè)財務(wù)狀況的因素很多,但有些指標的數(shù)據(jù)很難取得,需要耗費大量的人力和物力,因此那些取得成本很高的財務(wù)比率不予考慮。根據(jù)可操作性原則,結(jié)合財務(wù)報告中所提供的指標,本文選取綜合反映盈利能力、償債能力、營運能力和現(xiàn)金流量等方面的29個財務(wù)指標用于構(gòu)建財務(wù)預(yù)警模型,其中包含了一般論文中沒有涉及但我們認為對財務(wù)風(fēng)險預(yù)測有較大影響的公司規(guī)模和成長能力方面的4個財務(wù)指標(log(總資產(chǎn)),log(凈資產(chǎn)*股東權(quán)益合計),總資產(chǎn)增長率,營業(yè)收入增長率)。所選指標具體如表1。
我們使用數(shù)據(jù)挖掘軟件Weka提供的貝葉斯網(wǎng)絡(luò)(BayesNet)、決策樹(J48)、基于規(guī)則的分類(JRip)、最近鄰分類(1NN)、 多層感知機 (MultilayerPerceptron)、BP神經(jīng)網(wǎng)絡(luò)(RBFNetwork)、邏輯回歸(Logistic)等7個分類方法建立各類預(yù)警模型并進行分析比較。從兩個方面進行了大量的數(shù)據(jù)分析,首先使用所有財務(wù)指標利用7種分類方法進行風(fēng)險建模分析,然后利用數(shù)據(jù)挖掘方法進行指標選擇,再利用選定的指標進行風(fēng)險建模分析。
這里建模過程基于未經(jīng)屬性選擇的原始數(shù)據(jù)集,針對每種分類算法分別進行兩種模型的建立:2000-2005年度數(shù)據(jù)集和2000-2006年度數(shù)據(jù)集分別作為訓(xùn)練集;2006年度相關(guān)數(shù)據(jù)和2007年度相關(guān)數(shù)據(jù)分別作為測試集。表2給出了不同分類方法在兩組數(shù)據(jù)上的測試結(jié)果。
實驗結(jié)果表明,最近鄰分類、多層感知機、BP神經(jīng)網(wǎng)絡(luò)及邏輯回歸四類方法的性能基本相當,而貝葉斯網(wǎng)絡(luò)、決策樹、基于規(guī)則的分類三類方法的性能差異不大,整體性能明顯低于前四類方法,但對于ST的識別精度(60%左右)明顯高于前四類方法。
表1 財務(wù)危機預(yù)警指標列表
從實驗結(jié)果可以看出,利用2000年到2005年的數(shù)據(jù)作為訓(xùn)練集進行建模,來預(yù)測2006年至2007年的數(shù)據(jù),大部分方法的預(yù)測準確率低于利用2000年到2006年的數(shù)據(jù)預(yù)測2007年的預(yù)測準確率。注意到2006年股市“全面型牛市”以及2007年度 “全民炒股”的真實市場現(xiàn)象,可以理解2006、2007年股市的規(guī)律明顯不同于2000~2005年,因而,模型的預(yù)測精度不夠理想。
對2000~2005年的數(shù)據(jù),通過運用weka中的BestFirst,GreedyStepwise,LinearForwardSelection三種屬性選擇方法進行屬性選擇,綜合得到9項保留屬性,即每股收益(攤薄營業(yè)利潤),債務(wù)資產(chǎn)比率,log(總資產(chǎn)),log(凈資產(chǎn) *股東權(quán)益合計),總資產(chǎn)增長率,現(xiàn)金負債比率,營業(yè)利潤,所有者權(quán)益合計(包括少數(shù)股東權(quán)益),凈資產(chǎn)等。
對于選定的9個指標,針對每種分類算法分別建立兩種模型:2000-2005年度數(shù)據(jù)集和2000~2006年度數(shù)據(jù)集作為訓(xùn)練集;2006年度相關(guān)數(shù)據(jù)和2007年度相關(guān)數(shù)據(jù)作為測試集。表3給出了試驗結(jié)果。
表2 屬性選擇前各種分類算法對兩類不同數(shù)據(jù)集的預(yù)測準確率
表3 屬性選擇后各種分類算法對兩組不同數(shù)據(jù)集的預(yù)測準確率
從表2、表3可見,通過屬性選擇后,各種模型的預(yù)測準確率變化不大,大部分略有提升,但數(shù)據(jù)量相對于屬性選擇前減少近2/3,因此模型的建立時間大大縮短,采用多層感知機算法時,模型的建立時間縮短為屬性選擇前的16.5%,其它分類方法的建模時間也有不同程度的減少,建模時間縮短為屬性選擇前的24.74%至57.57%不等。同時,屬性選擇后模型的表示更為簡潔,檢測新數(shù)據(jù)的時間也相應(yīng)縮短,由此可見屬性選擇后的模型具備更好的適用性。此外,注意到經(jīng)過屬性選擇后,本文所提出的4個創(chuàng)新指標保留了3個(log(總資產(chǎn)),log(凈資產(chǎn) *股東權(quán)益合計),總資產(chǎn)增長率),說明本文所加入創(chuàng)新指標的構(gòu)思是正確的。
通過對2000~2007年非金融企業(yè)上市公司財務(wù)數(shù)據(jù)的分析,引入了log(總資產(chǎn))、log(凈資產(chǎn)*股東權(quán)益合計)、總資產(chǎn)增長率、營業(yè)收入增長率等四個新的指標,總計29個指標用于風(fēng)險分析,并采用7種不同的分類方法來進行財務(wù)風(fēng)險建模,結(jié)果表明最近鄰分類、多層感知機、BP神經(jīng)網(wǎng)絡(luò)及邏輯回歸四類方法的性能基本相當,并可以用9個有代表性的指標來建立風(fēng)險預(yù)警模型,可以較好地實現(xiàn)風(fēng)險預(yù)測。
經(jīng)統(tǒng)計,滬深兩市上市公司中被特別處理的上市公司占上市公司總數(shù)的12%左右,在我們選取的所有數(shù)據(jù)中,被特別處理的股票數(shù)據(jù)占總數(shù)的近10%,因此,總體來說我們處理的數(shù)據(jù)集是不平衡(正常上市公司數(shù)據(jù)占有絕對比例)的,所采用的經(jīng)典機器學(xué)習(xí)方法對不平衡數(shù)據(jù)中少數(shù)類的分類性能不理想。在后續(xù)的研究中我們將研究針對不平衡數(shù)據(jù)集的分類方法并應(yīng)用到上市公司財務(wù)風(fēng)險建模,在基本保持對正常數(shù)據(jù)分類精度的前提下,盡量提高對ST、*ST數(shù)據(jù)的分類精度;同時采用數(shù)據(jù)融合技術(shù),運用多種分類方法以提高模型預(yù)測的準確性;借助數(shù)據(jù)挖掘與財務(wù)知識,進一步分析財務(wù)指標之間的關(guān)系,選擇更有代表性的財務(wù)指標用于建模,以盡可能簡化模型和提高數(shù)據(jù)分析的效率。
[1]William H.Beaver.Financial Rations as Predictors of Failure[J].Journal of Accounting Research,1966,4.
[2]Edward I.Altman.Financial Rations Discriminate Analysis and the Prediction of Corporate Bankruptcy[J].The Journal of Finance,1986,23(4).
[3]Deakin,E.B.A Discriminant Analysis of Predictors of Failure.[J]Journal of Accounting Research,Spring,1972,10(1).
[4]K Skogsvik.Current Cost Accounting Ratios as Predictors of Business Failure:The Swedish Case[J].Journal of Business Finance and Accounting,1990,17(1).
[5]陳靜.上市公司財務(wù)惡化預(yù)測的實證分析[J].會計研究.1999,4.
[6]吳世農(nóng),盧賢義.我國上市公司財務(wù)困境的預(yù)測模型研究[J].經(jīng)濟研究,2001,6.
[7]楊保安,季海,徐晶,溫金祥.BP神經(jīng)網(wǎng)絡(luò)在企業(yè)財務(wù)危機預(yù)警之應(yīng)用[J].預(yù)測.2001,20(2).