[摘要]2007年次貸危機之后,信用評級問題引起了包括銀行等金融機構以及企業(yè)本身的高度關注。信用評級簡單理解就是通過一定的方法將貸款客戶進行分類,產(chǎn)生一系列的級別,因此其核心算法可以理解為是經(jīng)典的多分類問題。隨著近20年來機器學習的發(fā)展和興起,越來越多與之相關的技術被運用到信用評級的工作中。
[關鍵詞]機器學習;計算數(shù)學;信用評級;人工神經(jīng)網(wǎng)絡
引言
2007年次貸危機之后,信用評級問題引起了包括銀行等金融機構以及企業(yè)本身的高度關注。根據(jù)評價主體的不同,信用評級可以分為外部信用評級和內(nèi)部信用評級兩種,其中外部信用評級主要是由專門的評級機構作出,并給出相應的信用統(tǒng)計信息[1],而內(nèi)部信用評級則是由企業(yè)內(nèi)部或者銀行等金融機構給出,以用于是否放貸等金融決策。本文研究的對象即為內(nèi)部信用評級。而根據(jù)被評價對象的不同,又可以分為對消費者個人的信用評級和對企業(yè)用戶的信用評級,對于企業(yè)用戶的信用評級需要通過構建其還貸能力(主要通過其相關財務指標進行衡量)、還貸意愿(公司過往的還貸記錄、公司中高層領導素質(zhì)、企業(yè)規(guī)模[3])與公司違約之間的聯(lián)系,通過一定的模型來預測企業(yè)的違約可能性。
1、傳統(tǒng)信用評級方法
信用評級簡單理解就是通過一定的方法將貸款客戶進行分類,產(chǎn)生一系列的級別,因此其核心算法可以理解為是經(jīng)典的多分類問題。企業(yè)信用評級的傳統(tǒng)方法主要是包括專家法、打分法等在內(nèi)的主觀綜合法,在信用評級行為越來越頻繁和普遍的今天,冗繁的評定過程和過強的主觀性使人們開始尋求傳統(tǒng)法之外的信用評級方法。20世紀30年代以來,隨著統(tǒng)計學的發(fā)展,基于統(tǒng)計判別方法的評級方法成為國外信用評級體系的支柱,主流方法包括多元判別分析法(MDA)、加權Logistic回歸分析模型、Probit回歸分析模型等。除此之外,傳統(tǒng)的信用評級常用的方法還包括:模糊綜合評價法FCE(Romaniuk等1992)、層次分析法(趙家敏等2006)等。
隨著近20年來機器學習的發(fā)展和興起,越來越多與之相關的技術被運用到信用評級的工作中,其中應用較為廣泛的包括:人工神經(jīng)網(wǎng)絡(Artificial Neural Network,ANN)、支持向量機(SVM)和投影尋蹤等。而他們也因為對于財務樣本較少的依賴以及良好的預測效果越來越成為信用評級中的熱門研究領域。
3、人工神經(jīng)網(wǎng)絡在信用評級中的應用
人工神經(jīng)網(wǎng)絡(Artifical Neural Networks,ANN)近年來在多個領域迅速興起,在包括會計和金融[7],健康和醫(yī)藥[8,9],工程和制造業(yè)[10,11],營銷[12]等在內(nèi)的多個領域內(nèi)取得了很好的應用。ANN相比于傳統(tǒng)的統(tǒng)計學方法也是一種有效的處理回歸和分類問題的方法[13]。并被證明在信用評級問題上也具有良好的表現(xiàn)[14,15,16]。ANN通過模擬生物神經(jīng)網(wǎng)絡的結構和功能的數(shù)學模型。ANN是一種自適應的非線性的建模方式,常用來針對輸入和輸出之間的復雜關系進行探索。
4、數(shù)據(jù)介紹
對于企業(yè)信用評級而言,目前國際上較為權威的信用評級機構為:穆迪投資者服務(Moody’s Investor Services,MIS)、標準普爾(Standard Poor's rating service,SnP)以及惠譽國際(Fitch Group)。為評級標準和等級的一致性,本次主要選用MIS下的被評級機構作為研究對象。
通過對企業(yè)的履約情況進行評定,MIS將企業(yè)的信用等級分為21級,其中券信譽高,履約風險小,被稱為“投資級”,主要包括:Aaa級(優(yōu)等)、Aa級(高級)、A級(中上級)、Baa級(中級);相比之下,信譽較低,履約風險較大的則被成為“投機級”,主要包括:Ba級(具有投機性質(zhì)的因素)、B級(缺少理想投資的品質(zhì))、Caa級(劣質(zhì)債券)、Ca級(高度投機性)、C級(最低等級評級)
相應的財務數(shù)據(jù)則可以通過分析企業(yè)的財務報告獲得[17]。公司的財務報告包括各項評定企業(yè)業(yè)務表現(xiàn)的財務數(shù)據(jù),其中常被使用的列示于表1。常用的財務比率主要包括以下幾個:
表1 企業(yè)常用財務比率
為避免企業(yè)所處行業(yè)差異對研究帶來的影響,本文中主要選取了38家房地產(chǎn)上市企業(yè)的財報數(shù)據(jù)進行研究,以保證模型評判標準的統(tǒng)一性。
5、方法步驟
(1)選取38家房地產(chǎn)上市企業(yè)財報,根據(jù)表1中公式計算各項財務比率。采用計算而得的財務比率而非直接利用財報中數(shù)字的原因在于,各上市公司因規(guī)模差異,財報中財務指標絕對值相差較大,且因其上市地點不同,財報中所披露的指標數(shù)據(jù)的貨幣單位也不盡相同。但財務指標的絕對值并不能全面的反應一個公司的發(fā)展狀況,采取財務比率作為數(shù)學模型依據(jù),可以消除規(guī)模差異及匯率變化帶來的影響,使結果更具有準確性。
(2)在對數(shù)據(jù)進行初步處理之后,對其進行相關性分析。此環(huán)節(jié)主要包括指標間的相關性比較和指標與評級結果的相關性比較。
表2 各指標相關性
首先,對10個指標進行相關性分析。
相關性主要包括正相關和負相關兩個方面,而相關性的強弱取決于相關系數(shù)取絕對值后的結果。其中,取絕對值后的結果若在0-0.09范圍內(nèi),則一般認為兩者之間沒有相關性,(0.1,0.3)為弱相關,(0.3,0.5)為中等相關,(0.5,1.0)為強相關。而根據(jù)此環(huán)節(jié)的主要目的,我們主要研究各指標之間的正相關性,下文中以相關性簡稱弱相關性。根據(jù)結果,可以看出,大部分財務比率之間不具有明顯的正相關關系。我們主要關注其中的強相關性,即指標1、指標10;指標4、指標5;指標7、指標8這三對數(shù)據(jù)。將這三對數(shù)據(jù)與信用評級結果分別進行相關性比較:通過將這三對指標分別與信用評級結果進行比較,最終選擇指標5、指標8、指標10進入模型的創(chuàng)建。
在經(jīng)過了相關性比較這一環(huán)節(jié)后,最終確定參與模型建立的指標包括7個:指標2、指標3、指標5、指標6、指標8、指標9、指標10。
(3)將38組數(shù)據(jù)分為兩組,一組為訓練集,一組為檢驗集。其中,訓練集中數(shù)據(jù)個數(shù)為20組,檢驗集18組。本文中采用的人工神經(jīng)網(wǎng)絡模型為BP神經(jīng)網(wǎng)絡。
BP神經(jīng)網(wǎng)絡結構通常由一個輸入層、一個輸出層、多個隱層共同組成。輸入層神經(jīng)元的個數(shù)由樣本屬性的維度決定,輸出層神經(jīng)元的個數(shù)由樣本分類個數(shù)決定。每一層包含若干個神經(jīng)元,每個神經(jīng)元包含一個閾值,用來改變神經(jīng)元的活性。網(wǎng)絡中帶箭頭的線表示前一層神經(jīng)元和后一層神經(jīng)元之間的權值。每個神經(jīng)元都有輸入和輸出。輸入層的輸入和輸出都是訓練樣本的屬性值。
對于隱藏層和輸出層的輸入, 其中,是由上一層的單元i到單元j的連接的權;是上一層的單元i的輸出;而是單元j的閾值。
神經(jīng)網(wǎng)絡中神經(jīng)元的輸出是經(jīng)由賦活函數(shù)計算得到的。該函數(shù)用符號表現(xiàn)單元代表的神經(jīng)元活性。賦活函數(shù)一般使用simoid函數(shù)(或者logistic函數(shù))。神經(jīng)元的輸出為:
除此之外,神經(jīng)網(wǎng)絡中有一個學習率(l)的概念,通常在0和1之間取值,并有助于找到全局最小。若學習率太小,學習將進行得很慢。若學習率太大,則有可能出現(xiàn)在不合適的解之間波動。
算法基本流程就是:
1、初始化網(wǎng)絡權值和神經(jīng)元的閾值(一般隨機初始化)。
2、前向傳播:按照公式一層一層的計算隱層神經(jīng)元和輸出層神經(jīng)元的輸入和輸出。
3、后向傳播:根據(jù)公式修正權值和閾值
直到滿足終止條件。
在我們的模型中,我們有7個輸入層(7個指標),以及2個輸出層(2個評級分類)。運用Matlab對評價模型對20組訓練集數(shù)據(jù)進行學習訓練,設迭代次數(shù)為1000次,學習率為0.1,我們用18組檢驗集數(shù)據(jù)進行模擬預測得到了以下結果:
預測的準確率達到了88.89%,能較準確的對企業(yè)進行信用評價,可作為決策者的決策依據(jù)。若用Monte-Carlo模擬方法則可獲得更精確的結果,本文這里不作深入研究。
6、結束語
本文通過建立BP神經(jīng)網(wǎng)絡模型對38個企業(yè)的7個關鍵財務比率進行信用評級分析,取得了較好的模擬結果。然而神經(jīng)網(wǎng)絡模型在信用評級方面的應用仍處于初級研究階段,目前仍需對具體的結構,算法以及參數(shù)進行優(yōu)化和改進,相信在不久的將來神經(jīng)網(wǎng)絡模型分析會成為信用評級中重要的參考依據(jù)。
參考文獻
[1]奚勝田,詹原瑞,韓著釗.因子分析與聚類分析在企業(yè)信用評級中的應用[J].中國農(nóng)機化2009(1):44-47
[3]張鴻,丁以中.基于BP神經(jīng)網(wǎng)絡的企業(yè)信用評級模型[J].上海海事大學學報2007(3):64~68
[4]王春峰,萬海暉,張維.基于神經(jīng)網(wǎng)絡技術的商業(yè)銀行信用風險評估[J].系統(tǒng)工程理論與實踐,1999(9):24-32
[5].Altman EI. Financial ratios, discriminate analysis and the prediction of corporate bankruptcy[J]. Journal of Finance,1968,9(XXⅢ):589-609.
[6].Martin D. Earky warning of bank failure: a logit regression approach[J]. Journal of Banking and Finance,1977:249-276.
[7]N.Chauhan,V.Ravi,D.K.Chandre,Differential evolution trained wavelet neural networks:application to bankruptcy prediction in banks[J],Expert Syst.Appl.36(4)(2009)7659-7665
[8]D.Delen,G.Walker,A.Kadam,Predicting breast cancer survivability:acomparison of three datamining methods[J],Artif.Intell.Med.34(2)(2005)113-128.
[9]M.Behrman,R.Linder,A.H.Assadi,B.R.Stacey,M.M.Backonja,Classification of patients with pain based on neuropathic pain symptoms:comparison of an artificial neural network against an established scoring system[J],Eur.J.Pain11 (4) (2007)370-376.
[10]H.C.Zhang,S.H.Huang,Applications of neural networks in manufacturing:a state-of-the-art survey,Int.J.Prod.Res.33(3)(1995)705-728.
[11]P.C.Pendharkar,Scale economies and production function estimation for object-oriented software component and source code documentation size, Eur.J.Oper.Res.172(3)(2006)1040-1050.
[12] J. Yao,N.Teng,H.-L.Poh,C.L.Tan,F(xiàn)orecasting and analysis of marketing data using neural networks,J.Inf.Sci.Eng.14(4)(1998)843-862.
[13]M.Paliwal,U.A.Kumar,Neural networks and statistical techniques:a review of applications,ExpertSyst.Appl.36(1)(2009)2-17.
[14]P.Hájek,Municipal credit rating modelling by neural networks,Decision Support Syst.51(1)(2011)108-118.
[15]K.Kumar,S.Bhattacharya,Artificial neural network vs linear discriminant analysis in credit ratings forecase:a comparative study of predicti on performances, Rev.AccountingFinance5(3)(2006)216–227.
[16]Z.Huang,H.Chen,C.-J.Hsu,W.-H.Chen,S.Wu,Credit rating analysis with support vector machines and neural networks:a market comparative study, Decision SupportSyst.37(4)(2004)543-558.
作者簡介
于雯(1990—),女,漢族,山東青島人,中國海洋大學數(shù)學科學院研究生,研究方向:計算數(shù)學