唐建榮,譚春暉
(江南大學(xué) 商學(xué)院,江蘇 無錫 214122)
信用風(fēng)險又稱為違約風(fēng)險,是指借款人、證券發(fā)行人或交易對方因種種原因不愿或不履行合同條件而構(gòu)成違約,致使銀行、投資者或交易另一方遭受損失的可能性[1]。國內(nèi)外不少學(xué)者對信用風(fēng)險評估問題進(jìn)行了探索和研究,但由于缺乏足夠的數(shù)據(jù),傳統(tǒng)的分析方法顯得捉襟見肘。本文引入一種基于小樣本學(xué)習(xí)的方法——支持向量機(jī)(SVM),并運(yùn)用其構(gòu)建商業(yè)銀行信用風(fēng)險模型,取得了較好的評估效果[2]。
支持向量機(jī)(SVM)是在高位特征空間使用線性函數(shù)假設(shè)空間的學(xué)習(xí)系統(tǒng),它由一個來自最優(yōu)化理論的學(xué)習(xí)算法訓(xùn)練。此學(xué)習(xí)策略由Vapnik和他的合作者提出,是一個準(zhǔn)則性的并且強(qiáng)有力的方法[3]。
支持向量機(jī)對企業(yè)預(yù)期違約概率的度量主要有以下四個步驟:(1)樣本空間的選擇。一般來說,以企業(yè)資產(chǎn)價值作為標(biāo)準(zhǔn)來選擇違約企業(yè),并注重這些企業(yè)資產(chǎn)價值的均值、標(biāo)準(zhǔn)差和范疇。(2)選取解釋變量。在企業(yè)違約風(fēng)險度量分析中,作為解釋變量的財務(wù)指標(biāo)的設(shè)計和選取關(guān)系到支持向量機(jī)和預(yù)測企業(yè)信用狀況的成敗。上市公司的信用數(shù)據(jù)主要來源于企業(yè)不同時期的財務(wù)報表,如資產(chǎn)負(fù)債表、損益表和現(xiàn)金流量表等,以及企業(yè)資產(chǎn)、債務(wù)等的市場價值或價格。(3)模型分析。運(yùn)用支持向量機(jī)分析選取最優(yōu)的財務(wù)指標(biāo),將其轉(zhuǎn)換為唯一的企業(yè)信用狀況判別值,并在此基礎(chǔ)上度量企業(yè)的預(yù)期違約概率。(4)模型檢驗。利用不同的統(tǒng)計量對模型結(jié)果進(jìn)行驗證,對模型是否準(zhǔn)確預(yù)測企業(yè)違約做出評價[3]。
經(jīng)營失敗企業(yè)的財務(wù)數(shù)據(jù)難以搜集,在很大程度上阻礙了企業(yè)違約風(fēng)險的理論和實證研究。中國證監(jiān)會要求上海證券交易所和深圳證券交易所對企業(yè)經(jīng)營出現(xiàn)異常狀況的上市公司的股票實行特別處理,這些上市公司的財務(wù)數(shù)據(jù)可以替代度量企業(yè)的信用違約風(fēng)險。
本文選取滬深兩市的150多家上市公司的財務(wù)比率數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)來源于金融界網(wǎng)站。其中樣本由經(jīng)營正常組和經(jīng)營失敗組組成,排除掉一些數(shù)據(jù)缺失的企業(yè),最終留下123家有效企業(yè)數(shù)據(jù),其中包括經(jīng)營正常組73家,經(jīng)營失敗組50家,見表1。
表1 樣本分布情況
行業(yè)的劃分是按照中國證券監(jiān)督管理委員會關(guān)于上市公司行業(yè)劃分的最新方法,樣本來自包括農(nóng)業(yè)、各類制造業(yè)、房地產(chǎn)業(yè)、商業(yè)和零售業(yè)、其他各種服務(wù)業(yè)和綜合業(yè)。
論文考慮了各方面的影響要素,依據(jù)指標(biāo)選取原則,參照常用的企業(yè)績效評價指標(biāo)體系和國內(nèi)外文獻(xiàn)的相關(guān)研究,從金融機(jī)網(wǎng)站中選取了反映上市公司財務(wù)狀況的償債能力、每股收益、經(jīng)營效率、盈利能力和財務(wù)結(jié)果等6方面的財務(wù)比率數(shù)據(jù)[8]進(jìn)行分析(見表2)。對這16個財務(wù)比率指標(biāo)進(jìn)行主成分分析,最終得到10個主成分,使其盡可能多的包含原始數(shù)據(jù)的大部分信息并解決了指標(biāo)變量之間的多重共線性問題。
設(shè)模型樣本數(shù)為 n,X=(X1,X2,…,Xp)T是一個 P 為向量,X是模型選取的財務(wù)比率指標(biāo)矩陣。構(gòu)造樣本集(x,y),x維數(shù)為10,y是樣本的類別,設(shè)經(jīng)營正常企業(yè)y=1,經(jīng)營失敗企業(yè)y=-1。支持向量機(jī)中有多種不同的核函數(shù),主要包括徑向基核函數(shù),穩(wěn)態(tài)高斯核函數(shù),多項式核函數(shù),雙曲正切核函數(shù)等。有研究表明,不同的核函數(shù)得到的結(jié)果性能相差不大[7]。本文構(gòu)造的支持向量分類模型的核函數(shù)采用最常見的徑向基核函數(shù):K (xi,xj)=e-|xi-xj|/2σ2。本文使用OSU SVM Classifier Matlab Toolbox3.0工具包進(jìn)行分析。
表2 模型使用的財務(wù)比率指標(biāo)
不同的徑向基核函數(shù)的參數(shù)懲罰系數(shù)C和σ2取值不同,所得到的支持向量個數(shù)、第一類錯誤誤識率,第二類錯誤誤識率、準(zhǔn)確率也不盡相同。通過反復(fù)試算選取最佳的核函數(shù)參數(shù):
當(dāng)σ=1時,無論懲罰因子C取何值,通過Matlab軟件得到的模型的支持向量的個數(shù)為69,對測試樣本進(jìn)行預(yù)測:第一類錯誤,即將違約企業(yè)錯分為正常企業(yè)的概率為25%,第二類錯誤:即將正常企業(yè)錯分為違約企業(yè)的概率都為24.24%,測試樣本的準(zhǔn)確率為75.47%。由此可知,當(dāng)σ=1時,模型對懲罰因子C的變化并不敏感;
當(dāng)σ=5時,隨著懲罰系數(shù)C的不斷變化,模型所得到的支持向量的個數(shù)不斷變化。當(dāng)C=1時所得到的支持向量的個數(shù)為49,隨著C的不斷增加,支持向量的個數(shù)不斷減少。當(dāng)C=50時,模型所得支持向量個數(shù)減少至23,接著又隨C的增加而增加。第一類錯誤誤識率在15~20%,第二類錯誤誤識率隨著C的不斷增加而增加,C=1時達(dá)到最小,為9.09%,測試樣本的準(zhǔn)確率也隨著C的不斷增加而減少,C=1準(zhǔn)確率達(dá)到86.79%;
當(dāng)σ=10時,支持向量的個數(shù)隨C的不斷增加而減少,當(dāng)C=800時支持向量個數(shù)為24,此時達(dá)到最少。第一類錯誤誤識率在10~20%之間,第二類錯誤誤識率隨C的不斷增加而不斷提高,測試結(jié)果的準(zhǔn)確率隨C的不斷增加而降低,當(dāng)C=10和C=30時,準(zhǔn)確率最高,為86.79%。
第一類錯誤為將違約企業(yè)錯分為正常企業(yè),第二類錯誤為將正常企業(yè)錯分為違約企業(yè),兩類錯誤相比較,第一類錯誤較為嚴(yán)重,第二類錯誤的發(fā)生,僅僅是失去可以償還貸款的客戶,損失的只是貸款所得的利息;而第一類錯誤的發(fā)生,將直接導(dǎo)致銀行嚴(yán)重的損失,銀行放貸給違約企業(yè),損失的是本金和利息。因此要嚴(yán)格控制第一類錯誤的發(fā)生。部分模擬結(jié)果(見表 3)顯示:δ=5,C=1;δ=10,C=10;δ=10,C=30 三組核函數(shù)參數(shù)所得到的準(zhǔn)確率相等,都為86.79%,但是第一類錯誤誤識率,第二類錯誤誤識率都不相同。綜合考慮,本文最終選擇σ=10,C=30的模型,此時第一類錯誤誤識率為15%,第二類錯誤誤識率為12.12%,準(zhǔn)確率為86.79%。
本文在實證分析中采用逐步判別分析,并借助SPSS16.0軟件實現(xiàn)。
1.4.1 多元判別分析建模
假設(shè)模型樣本企業(yè)數(shù)為n,X=(X1,X2, …,Xp)T是一個 p 維向量,X是模型選取的企業(yè)財務(wù)比率,i為財務(wù)比率的數(shù)量,bi是判別系數(shù),b0是常數(shù)項。令Zu為企業(yè)u的經(jīng)營狀況判別值,判別方程為:
線性判別分析采用線性判別法則來分類和預(yù)測企業(yè)經(jīng)營失敗與否。將企業(yè)u劃入經(jīng)營失敗組g的原則是u屬于組g的后驗概率大于其屬于經(jīng)營正常組g’的后驗概率,即:
為與支持向量分類機(jī)模擬出來的結(jié)果對比,樣本選取和指標(biāo)的選取都與支持向量機(jī)的樣本一致。本文采用SPSS16.0對樣本進(jìn)行多元判別分析。
1.4.2 結(jié)果分析
通過SPSS逐步判別分析逐步進(jìn)入判別方程式的變量為主因子A1,主因子A8和主因子A7。模型采用系統(tǒng)默認(rèn)的分析方法和判據(jù):進(jìn)入模型的F值為3.84,從模型中剔除變量的F值為2.71。通過判別分析得到判別函數(shù)Z=0.714A1+0.399A7-0.487A8+0.048,非標(biāo)準(zhǔn)化判別函數(shù)系數(shù),即費(fèi)歇爾判別函數(shù)系數(shù)。預(yù)測變量的原始數(shù)據(jù)乘以判別系數(shù)得到判別得分。兩組在判別函數(shù)上的重心不同(-1.179,0.885)。根據(jù)組重心函數(shù)值可以得到 Z0臨界值0.147,當(dāng)Z得分大于-0.147時為組1不違約組,當(dāng)Z得分小于-0.147時為組-1即違約組。
應(yīng)用所得到的模型做判別預(yù)測。本文所使用的測試組樣本與支持向量機(jī)的測試組樣本一致。使用判別方程式計算測試樣本的判別得分,并且根據(jù)所得的臨界值-0.147進(jìn)行判別預(yù)測。
多元判別分析的判別預(yù)測結(jié)果,從表3中可知,對訓(xùn)練樣本的回測準(zhǔn)確率為91.43%,其中第一類錯誤,即將違約企業(yè)的概率判定成正常企業(yè)的概率為20%;第二類錯誤,即將正常企業(yè)判定成違約企業(yè)的概率為0;對預(yù)測樣本進(jìn)行預(yù)測的結(jié)果為準(zhǔn)確率為84.91%,其中第一類錯誤率為25%,第二類錯誤率為9.09%。
表3中僅列出支持向量分類機(jī)核函數(shù)參數(shù)σ取不同值時所得的最優(yōu)判別結(jié)果。
支持向量分類機(jī)對訓(xùn)練樣本重新進(jìn)行回測,準(zhǔn)確率為100%。從預(yù)測結(jié)果中選擇最優(yōu)的預(yù)測結(jié)果,即σ=10,C=30測試樣本分類的準(zhǔn)確率為86.79%,第一類錯誤15%,第二類錯誤12.12%。通過比較可知,支持向量機(jī)無論是訓(xùn)練樣本的回測還是對未知類別測試樣本的預(yù)測準(zhǔn)確率高于多元判別分析,而兩類錯誤發(fā)生的概率也都低于多元判別分析。
支持向量機(jī)能夠較好的解決小樣本、高維數(shù)和局部極小點等實際問題。本文構(gòu)建了一種基于支持向量機(jī)的上市公司信用風(fēng)險評估模型,通過與多元判別分析的比較,發(fā)現(xiàn)支持向量機(jī)具有比較高的準(zhǔn)確率和較低的第一類錯誤率。
研究中也遇到一些未能解決的問題,本文只解決了支持向量機(jī)的兩類分類問題。實際上應(yīng)當(dāng)推廣到更為復(fù)雜的多類信用等級評估研究以更精確的反映上市公司的信用情況,為銀行、投資者提供更有利的輔助工具。論文模型中第二類錯誤率控制的較好,但是引起較大損失的第一類錯誤率較高,本文中第一類錯誤和第二類錯誤的懲罰因子選取相同,如有可能應(yīng)當(dāng)選取不同的懲罰因子。在懲罰因子C和核函數(shù)參數(shù)的選擇上還沒有成熟的理論支持和方法,只能通過不同懲罰因子C和核函數(shù)參數(shù)的不斷試算結(jié)果中,選取結(jié)果最好的一組參數(shù)構(gòu)造模型并且進(jìn)行企業(yè)違約與否的預(yù)測。
表3 模型判別結(jié)果
[1]鄒新月,李漢通.運(yùn)用典型多元判別分析法評估上市公司信用風(fēng)險[J].統(tǒng)計與決策,2007,(7).
[2]美Cristianini,N.著,李國正等譯.支持向量機(jī)導(dǎo)論[M].北京:電子工業(yè)出版社,2004.
[3]梁琪.商業(yè)銀行信貸風(fēng)險度量研究[M].北京:中國金融出版社,2005.
[4]Cortes C’Vapnik V.Support-vector Networks[J].Machine Learning,1995,20(3).
[5]Vapnik V N著,張學(xué)工譯.統(tǒng)計學(xué)習(xí)理論的本質(zhì)[M].北京:清華大學(xué)出版社,1990.
[6]張樹德.MATLAB金融計算與金融數(shù)據(jù)處理[M].北京:北京航空航天大學(xué)出版社,2008.
[7]侯惠芳,劉素華.基于支持向量機(jī)的商業(yè)銀行信用風(fēng)險評估[J].計算機(jī)工程與應(yīng)用,2004,(31).
[8]原始財務(wù)比率數(shù)據(jù)略(來源于金融界網(wǎng)站http://stock.jrj.com.cn/cominfo/AllStock.asp)