李佳,黃之豪
(上海理工大學(xué),上海200093)
銀行信用風(fēng)險(xiǎn)評(píng)估和銀行信用管理方法一直是學(xué)術(shù)研究和商業(yè)銀行管理領(lǐng)域重要的研究話題。由于銀行是整個(gè)金融系統(tǒng)的核心,銀行的主要資產(chǎn)業(yè)務(wù)是銀行對(duì)企業(yè)發(fā)放的貸款,若企業(yè)由于破產(chǎn)或資金流動(dòng)性等原因無(wú)法按期償還貸款甚至造成違約會(huì)給商業(yè)銀行帶來巨大的損失,并且,商業(yè)銀行的不良貸款率不斷提升不僅是導(dǎo)致銀行破產(chǎn)的主要原因,同時(shí)也會(huì)導(dǎo)致整個(gè)金融市場(chǎng)風(fēng)險(xiǎn)提升。因此,商業(yè)銀行能否獲得性能極好又切實(shí)可行的信用風(fēng)險(xiǎn)預(yù)測(cè)模型,對(duì)于銀行金融機(jī)構(gòu)乃至整個(gè)金融市場(chǎng)而言至關(guān)重要。
早期的破產(chǎn)預(yù)測(cè)模型多使用傳統(tǒng)計(jì)量和統(tǒng)計(jì)方法。Sinkey(1975)[1]將統(tǒng)計(jì)預(yù)測(cè)模型運(yùn)用在銀行破產(chǎn)、信用風(fēng)險(xiǎn)領(lǐng)域,使用多元判別分析方法(Multivariate discriminant analysis,簡(jiǎn)記為MDA)來預(yù)測(cè)銀行破產(chǎn)風(fēng)險(xiǎn),Meyer&Pifer(1970)[2]和 Martin(1977)[3]使用 logistic 回歸分析方法來預(yù)測(cè)銀行信用風(fēng)險(xiǎn),Kolari et al.(2002)[4]運(yùn)用 logit回歸分析來預(yù)測(cè)美國(guó)商業(yè)銀行破產(chǎn)風(fēng)險(xiǎn)。
近年來,隨著人工智能的興起、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘在世界范圍內(nèi)的推廣,幫助商業(yè)銀行風(fēng)險(xiǎn)預(yù)測(cè)獲得了新的、更有效的預(yù)測(cè)方法,也或許預(yù)示著在商業(yè)銀行信用風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域,人工智能方法逐漸會(huì)取代傳統(tǒng)統(tǒng)計(jì)方法,成為預(yù)測(cè)商業(yè)銀行信用風(fēng)險(xiǎn)即破產(chǎn)的首選方法。最早使用人工智能方法研究銀行破產(chǎn)的是Tam (1991)[5],他使用人工智能方法BP神經(jīng)網(wǎng)絡(luò) (Back-propagation neural networks)進(jìn)行建模研究,得到了BP神經(jīng)網(wǎng)絡(luò)優(yōu)于多元判別分析方法、logistic回歸分析方法、KNN (K-nearest Neighbor)方法的結(jié)論,在Tam&Kiang(1992)[6]研究中又進(jìn)一步得出BP神經(jīng)網(wǎng)絡(luò)優(yōu)于前向反饋神經(jīng)網(wǎng)絡(luò)(Forward-feed Neural Networks,簡(jiǎn)記 FFNN)的結(jié)論。
支持向量機(jī)(SVM)是人工智能領(lǐng)域的新方法,近些年來支持向量機(jī)在各個(gè)行業(yè)的相關(guān)運(yùn)用發(fā)展迅速,在銀行破產(chǎn)和信用風(fēng)險(xiǎn)領(lǐng)域中,Ravi et al.(2008)[7]基于SVM方法用了54個(gè)變量對(duì)1000家銀行進(jìn)行研究,預(yù)測(cè)準(zhǔn)確度為83.5%。Ekinci&Erdal (2011)[8]對(duì)土耳其的35家私人商業(yè)銀行進(jìn)行分析,比較了SVM方法和神經(jīng)網(wǎng)絡(luò)方法的預(yù)測(cè)精度。國(guó)內(nèi)學(xué)者對(duì)該方法的研究甚少,楊毓和蒙肖蓮(2006)[9]搜集了2000-2002年間某省制造行業(yè)1360家企業(yè)破產(chǎn)案例,用SVM方法構(gòu)建了企業(yè)破產(chǎn)預(yù)測(cè)模型,余晨曦和梁瀟(2008)[10]使用滬深兩市2006-2007年間數(shù)據(jù),進(jìn)行SVM和MDA方法比較,得出SVM方法更優(yōu)的結(jié)論。
然而,上述學(xué)者的研究存在以下不足:第一,沒有做出人工智能方法之間的比較研究。第二,研究數(shù)據(jù)多為調(diào)查數(shù)據(jù),并不公開可得或難以收集,因此缺乏推廣的基礎(chǔ)。第三,研究結(jié)論并未與時(shí)俱進(jìn)。本文針對(duì)這些不足之處加出改進(jìn),選擇近兩年公開可得的數(shù)據(jù)比較研究SVM方法和BP神經(jīng)網(wǎng)絡(luò)方法優(yōu)劣,使人工智能方法能被銀行業(yè)及金融業(yè)廣泛運(yùn)用。
本文余下結(jié)構(gòu)為:第二部分介紹支持向量機(jī)和神經(jīng)網(wǎng)絡(luò);第三部分講述數(shù)據(jù)來源、建模方法和實(shí)證結(jié)果分析;最后是針對(duì)本文實(shí)證分析得到的結(jié)果進(jìn)行總結(jié)并得出一些啟示。
支持向量機(jī)是在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來的一種機(jī)器學(xué)習(xí)方法,1992年由Boser,Guyon和Vapnik提出,在解決小樣本、非線性和高維的回歸和分類問題上有巨大優(yōu)勢(shì),因此自推出以后倍受歡迎,支持向量機(jī)可以看做一類簡(jiǎn)單的最大間隔分類器的擴(kuò)展。
1.最大間隔分類器
在p維空間中,超平面是p-1維的平面仿射子空間。在p維空間中,超平面可以定義為:
β0,β1,…,βp為參數(shù)。 任何滿足公式(1)的點(diǎn) X=(X1,X2,…,Xp)T都落在超平面上。
假設(shè)X為n×p的數(shù)據(jù)矩陣,由p維空間中的n個(gè)訓(xùn)練觀測(cè)組成,x1=(x11,…,x1p)T,…,xn=(xn1,…,xnp)T。 這些觀測(cè)分為兩類,即 y1,…,yn∈{-1,1},其中-1代表一種類別,1代表另一種類別,如果分割超平面存在,就可以用其來制造分類器,如圖1所示。
圖1 超平面分割訓(xùn)練觀測(cè)
而這樣的分割超平面有無(wú)數(shù)個(gè),因此需要找到一個(gè)最大間隔超平面,即離訓(xùn)練觀測(cè)最遠(yuǎn)的那個(gè)分割超平面。一個(gè)分割超平面的例子如圖2所示,可以看到有三個(gè)訓(xùn)練觀測(cè)到最大間隔超平面的距離是一樣的,這三個(gè)訓(xùn)練觀測(cè)就叫做支持向量(Support Vector)。
圖2 分割超平面和支持向量
最大間隔超平面實(shí)則優(yōu)化問題的解:
滿足約束(3)、(4)以保證每個(gè)觀測(cè)都落在超平面正確的一側(cè):
2.支持向量分類器
最大間隔分類器在線性不可分的情況下的推廣叫做支持向量分類器,支持向量分類器允許了小部分訓(xùn)練觀測(cè)誤分以保證分類器對(duì)其余大部分觀測(cè)實(shí)現(xiàn)更好地分類,因此支持向量分類器所選超平面是如下最優(yōu)化的解。
滿足約束條件:
其中,C是損失懲罰調(diào)節(jié)參數(shù),ε1,…,εn是松弛變量,其作用為允許小部分訓(xùn)練觀測(cè)誤分。
3.支持向量機(jī)
支持向量機(jī)是支持向量分類器的一個(gè)擴(kuò)展,支持向量機(jī)使用了核函數(shù)方式來擴(kuò)大特征空間。常見的核函數(shù)有:線性核函數(shù)、多項(xiàng)式核函數(shù)和徑向基核函數(shù),分別是公式(9)、(10)、(11)。
其中,d是多項(xiàng)式函數(shù)的自由度,γ是個(gè)正常數(shù),‖Xi-Xj‖表示觀測(cè)Xi,Xj的歐式距離。
BP神經(jīng)網(wǎng)絡(luò)是一種典型的人工神經(jīng)網(wǎng)絡(luò),反向傳播模型為多層感知機(jī)結(jié)構(gòu),不僅包含輸入和輸出節(jié)點(diǎn),還有一層或多層隱層,又稱為多層感知機(jī)模型(MLP),圖3可以形象表示一個(gè)BP神經(jīng)網(wǎng)絡(luò)。
圖3 BP神經(jīng)網(wǎng)絡(luò)拓?fù)鋱D
BP反向傳播網(wǎng)絡(luò)的重要特點(diǎn)是反向傳播,BP反向傳播網(wǎng)絡(luò)算法分為正向傳播和反向傳播兩階段。正向傳播階段是指樣本信息從輸入層開始由上至下逐層經(jīng)隱節(jié)點(diǎn)計(jì)算處理,最終樣本信息被傳播到輸出層節(jié)點(diǎn),得到預(yù)測(cè)結(jié)果。計(jì)算出預(yù)測(cè)誤差后便進(jìn)入反向傳播階段,將輸出節(jié)點(diǎn)的預(yù)測(cè)誤差反方向逐層傳播到上層隱節(jié)點(diǎn),逐層調(diào)整連接權(quán)重,直到輸入節(jié)點(diǎn)和隱節(jié)點(diǎn)的權(quán)重全部到調(diào)整為止。
總的來說,BP算法的目的是利用梯度下降來更新結(jié)構(gòu)中的參數(shù)以使得損失函數(shù)最小化,給定一個(gè)樣本(x,y),將其輸入到神經(jīng)網(wǎng)絡(luò)模型中,得到網(wǎng)絡(luò)輸出為y?,假定損失函數(shù)為L(zhǎng)(y,y?),要進(jìn)行參數(shù)學(xué)習(xí)就需要計(jì)算損失函數(shù)關(guān)于每個(gè)參數(shù)的導(dǎo)數(shù),對(duì)參數(shù)求偏導(dǎo)時(shí)涉及矩陣微分、鏈?zhǔn)角髮?dǎo)法則等,出于篇幅考慮此處略去。基于誤差反向傳播算法的前饋神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程可以分為以下三步:
(1)前饋計(jì)算每一層的凈輸入 z(l)和激活值 α(1),直到最后一層;
(2)反向傳播計(jì)算每一層的誤差項(xiàng) δ(1);
(3)計(jì)算每一層參數(shù)的偏導(dǎo)數(shù),并更新參數(shù)。
由于企業(yè)是否違約與企業(yè)經(jīng)營(yíng)狀況息息相關(guān)。而現(xiàn)實(shí)中,個(gè)別企業(yè)的貸款違約信息十分難以搜集,且可能涉及到一些商業(yè)機(jī)密,所以本文參照余晨曦和梁瀟的研究并做出研究假設(shè):獲得商業(yè)銀行貸款的企業(yè)可以劃分為兩類,第1類企業(yè)不會(huì)發(fā)生違約現(xiàn)象,第2類企業(yè)會(huì)發(fā)生違約。并且本文做出進(jìn)一步假設(shè):經(jīng)營(yíng)狀況很好的企業(yè)不會(huì)發(fā)生違約,經(jīng)營(yíng)狀況差的公司會(huì)發(fā)生違約。本文選取滬深兩市上市公司作為研究對(duì)象,由于本文著重考察商業(yè)銀行信用風(fēng)險(xiǎn),因此本文認(rèn)為上市公司中ST公司是經(jīng)營(yíng)狀況不佳的公司并會(huì)發(fā)生違約,而上市公司中償債能力指標(biāo)較好的公司為經(jīng)營(yíng)狀況很好的企業(yè)不會(huì)發(fā)生違約。經(jīng)營(yíng)狀況好的企業(yè)記為1,經(jīng)營(yíng)狀況不好的企業(yè)記為-1,支持向量機(jī)預(yù)測(cè)商業(yè)銀行信用風(fēng)險(xiǎn)的方法就是要找到一個(gè)超平面來區(qū)分經(jīng)營(yíng)狀況好的和不好的公司。
本文的研究期間為2015-2016年,本文樣本公司為144家滬深兩市上市公司,其中ST公司有75家,而剔除其中三家數(shù)據(jù)不齊全樣本不具代表性的公司,剩余72家公司,為了使實(shí)驗(yàn)數(shù)據(jù)集由相同數(shù)量的經(jīng)營(yíng)不佳和良好企業(yè)組成,本文通過償債能力指標(biāo)——利息保障倍數(shù)等同時(shí)兼顧各個(gè)行業(yè)來選擇償債能力最好的72家公司與之匹配形成本文樣本公司,這可以避免樣本數(shù)據(jù)集有偏差現(xiàn)象。本文在全部數(shù)據(jù)集中隨機(jī)抽取其中70%的數(shù)據(jù)作為訓(xùn)練集,剩余30%的數(shù)據(jù)作為測(cè)試集。
本文參照張輝和趙秋紅(2013)[11],通過主成分分析方法(Principal Component Analysis,PCA)進(jìn)行降維處理,對(duì)企業(yè)的盈利能力、長(zhǎng)期償債能力、短期償債能力和運(yùn)營(yíng)能力綜合考察,選擇變量:(1)ROA(Return on Assets)—總資產(chǎn)凈利潤(rùn)率;(2)ROS (Return on Sales)—營(yíng)業(yè)凈利率;(3)ICR(Interest Coverage Ratio)—利息保障倍數(shù);(4)DAR (Debt Asset Ratio)—資產(chǎn)負(fù)債率;(5)LLR(Long-term Liability Rate)—長(zhǎng)期資本負(fù)債率;(6)LR(Liquid Ratio)—流動(dòng)比率;(7)QR(Quick Ratio)—速動(dòng)比率;(8)CR(Cash Ratio)—現(xiàn)金比率;(9)AT(Total Assets Turnover)—總資產(chǎn)周轉(zhuǎn)率;(10)WCT(Working Capital Turnover)—營(yíng)運(yùn)資金周轉(zhuǎn)率;(11)LD(Loan Defaults)—企業(yè)貸款違約(經(jīng)營(yíng)狀況好的企業(yè)記為1,經(jīng)營(yíng)狀況不好的企業(yè)記為-1)。其中,ST公司判別來自Wind數(shù)據(jù)庫(kù),上市公司相關(guān)比率數(shù)據(jù)來自CSMAR數(shù)據(jù)庫(kù)。相關(guān)變量選擇及其定義見表1,相關(guān)變量描述性統(tǒng)計(jì)見表2。
表1 變量的選擇
表2 主要代理變量的描述性統(tǒng)計(jì)
如前文所述,本文將樣本數(shù)據(jù)集隨機(jī)抽取其中70%作為訓(xùn)練集,目的是為了建立支持向量機(jī)(SVM)模型,而將剩余30%作為測(cè)試集,目的是為了測(cè)試模型預(yù)測(cè)準(zhǔn)確性以評(píng)價(jià)模型是否準(zhǔn)確。然而,在支持向量機(jī)模型中,損失函數(shù)決定著什么樣的模型是好的模型,因此對(duì)整個(gè)模型的影響十分巨大。本文使用十折交叉檢驗(yàn)來確定支持向量機(jī)模型中的損失懲罰參數(shù)C以及核函數(shù)的參數(shù)。非線性SVM的核函數(shù)通常有多項(xiàng)式核、徑向基核 (Radial Basis Function,簡(jiǎn)記為RBF),本文使用兩種核函數(shù)并對(duì)兩種不同核函數(shù)建立的SVM模型進(jìn)行比較和評(píng)價(jià)。最后,再使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行建模,以比較分析SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型在預(yù)測(cè)銀行信用風(fēng)險(xiǎn)上的優(yōu)劣。本文使用R軟件的e1071包中的SVM函數(shù)進(jìn)行SVM建模,并使用tune.svm函數(shù)自動(dòng)實(shí)現(xiàn)十折交叉檢驗(yàn),得到最佳損失懲罰參數(shù)C=100,核函數(shù)參數(shù)gamma=3,再使用R軟件中的nnet包中的nnet函數(shù)實(shí)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)建模。得到結(jié)果如表3所示。
表3 SVM和BPN分類準(zhǔn)確性比較
從表3中可以看出,一般情況下,預(yù)測(cè)商業(yè)銀行信用風(fēng)險(xiǎn)時(shí),SVM模型和BPN模型的預(yù)測(cè)精度都在可接受范圍內(nèi),使用SVM模型的預(yù)測(cè)準(zhǔn)確度要高于使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)時(shí)的準(zhǔn)確度,而同樣使用SVM模型時(shí),徑向基核比多項(xiàng)式核預(yù)測(cè)結(jié)果更加準(zhǔn)確,并且多項(xiàng)式核函數(shù)SVM在計(jì)算機(jī)領(lǐng)域訓(xùn)練所需時(shí)長(zhǎng)也要多于徑向基核函數(shù)SVM,即相對(duì)于徑向基核函數(shù)SVM,多項(xiàng)式核函數(shù) SVM 性能要差些(Tay&Cao,2001;Huang et al.,2004)[12,13]。
本文與以往銀行信用風(fēng)險(xiǎn)預(yù)測(cè)文章中使用傳統(tǒng)logistic回歸、多元判別分析方法等、單一使用SVM方法不同,使用并比較兩種不同的人工智能的方法:SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型,并結(jié)合使用PCA方法進(jìn)行變量降維處理,通過對(duì)2015-2016年間的我國(guó)144家滬深兩市上市公司進(jìn)行研究預(yù)測(cè),得到了以下結(jié)論:第一,SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型都具有良好的預(yù)測(cè)能力。第二,相比于多項(xiàng)式函數(shù)SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型,徑向基核函數(shù)SVM的預(yù)測(cè)準(zhǔn)確性最佳。由于BPN學(xué)習(xí)模型有其固有的一些限制,并且SVM模型能將復(fù)雜的分類問題轉(zhuǎn)化為簡(jiǎn)單以解決的分類問題,是一個(gè)性能更佳且預(yù)測(cè)能力更強(qiáng)的模型。因此,相信在人工智能時(shí)代背景下,SVM模型這種機(jī)器學(xué)習(xí)方法將會(huì)取代一些傳統(tǒng)的方法或者與傳統(tǒng)分類方法結(jié)合使用來預(yù)測(cè)銀行信用風(fēng)險(xiǎn)。本文研究成果有助于銀行更好地判斷自身的信用風(fēng)險(xiǎn)情況。值得指出的是,本文將SVM模型運(yùn)用于商業(yè)銀行信用風(fēng)險(xiǎn)預(yù)測(cè)上,其實(shí),如企業(yè)破產(chǎn)預(yù)測(cè)、銀行信用評(píng)級(jí)、銀行客戶獲得預(yù)測(cè)等金融領(lǐng)域以及相關(guān)金融風(fēng)險(xiǎn)管理領(lǐng)域也都能使用SVM模型進(jìn)行問題分析與解決。因此,本文研究成果的啟示性意義十分巨大,可被各行各業(yè)所借鑒。
另外,需要指出的是,SVM模型進(jìn)行預(yù)測(cè)時(shí)有其固有的一些不足之處,如在預(yù)測(cè)銀行信用風(fēng)險(xiǎn)或企業(yè)破產(chǎn)預(yù)測(cè)時(shí),只能判斷企業(yè)是否會(huì)破產(chǎn),不能用來估計(jì)相關(guān)的概率,可能需要結(jié)合其他方法進(jìn)行綜合評(píng)估。
上海立信會(huì)計(jì)金融學(xué)院學(xué)報(bào)2018年6期