鄭路遠(yuǎn)
湖南大學(xué)數(shù)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)院,湖南長(zhǎng)沙410012
基于粗糙集理論的信貸風(fēng)險(xiǎn)評(píng)估模型研究
鄭路遠(yuǎn)
湖南大學(xué)數(shù)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)院,湖南長(zhǎng)沙410012
信貸風(fēng)險(xiǎn)是現(xiàn)代商業(yè)銀行所需面對(duì)的首要風(fēng)險(xiǎn),特別是我國(guó)商業(yè)銀行由于缺乏基礎(chǔ)數(shù)據(jù),無(wú)法采用國(guó)外銀行的先進(jìn)信貸風(fēng)險(xiǎn)評(píng)估模型,長(zhǎng)期以來(lái)一直使用傳統(tǒng)方法進(jìn)行信貸風(fēng)險(xiǎn)評(píng)估,因此急需探索一個(gè)適用于我國(guó)國(guó)情的信貸風(fēng)險(xiǎn)評(píng)估模型。為此,首先建立一套包含財(cái)務(wù)指標(biāo)與非財(cái)務(wù)指標(biāo)的信貸風(fēng)險(xiǎn)評(píng)估指標(biāo)體系,然后根據(jù)粗糙集理論能夠處理不可區(qū)分關(guān)系的特點(diǎn),結(jié)合我國(guó)具體國(guó)情,提出了基于粗糙集理論的信貸風(fēng)險(xiǎn)評(píng)估模型,并給出數(shù)據(jù)預(yù)處理、屬性簡(jiǎn)化、決策規(guī)則集的生成、對(duì)象分類及規(guī)則預(yù)測(cè)精度驗(yàn)證的實(shí)現(xiàn)方法。最后以多家公司的信貸情況為測(cè)試實(shí)例,采用基于粗糙集理論的信貸風(fēng)險(xiǎn)評(píng)估模型進(jìn)行測(cè)試,測(cè)試結(jié)果表明,信貸正常公司的預(yù)測(cè)準(zhǔn)確率達(dá)到83.33%,非正常公司的預(yù)測(cè)準(zhǔn)確率達(dá)到100%,能夠?yàn)殂y行的信貸決策提供有效的參考。
信貸風(fēng)險(xiǎn)評(píng)估;粗糙集理論;模型
近年來(lái)的美國(guó)股市崩盤、拉美債務(wù)危機(jī)以及美國(guó)“次貸危機(jī)”,引起各國(guó)對(duì)金融風(fēng)險(xiǎn)管控的高度重視[1]。目前,歐美發(fā)達(dá)國(guó)家于2007年開(kāi)始執(zhí)行《新巴塞爾資本協(xié)議》,該協(xié)議反映了當(dāng)前銀行領(lǐng)域在金融風(fēng)險(xiǎn)管控方面的最新技術(shù)和方法,能夠有效的對(duì)信貸風(fēng)險(xiǎn)實(shí)現(xiàn)管控。而我國(guó)與歐美發(fā)達(dá)國(guó)家銀行業(yè)的信貸風(fēng)險(xiǎn)管控水平相差較大,因此我國(guó)銀行業(yè)急需進(jìn)行信貸風(fēng)險(xiǎn)管控理論的研究,同時(shí)借鑒國(guó)際銀行業(yè)的優(yōu)秀信貸風(fēng)險(xiǎn)管控經(jīng)驗(yàn),全面提高我國(guó)銀行業(yè)的信貸風(fēng)險(xiǎn)管控能力。
為了可以更好的進(jìn)行信貸風(fēng)險(xiǎn)管控,建立科學(xué)合理的信貸風(fēng)險(xiǎn)評(píng)估指標(biāo)體系,在參考了國(guó)外學(xué)者對(duì)信貸風(fēng)險(xiǎn)評(píng)估指標(biāo)體系研究成果的基礎(chǔ)上[2],結(jié)合我國(guó)具體國(guó)情,選取的指標(biāo)體系分為財(cái)務(wù)指標(biāo)和非財(cái)務(wù)指標(biāo),財(cái)務(wù)指標(biāo)如表1所示,其值為連續(xù)型。從表1中可以看出,財(cái)務(wù)指標(biāo)主要選取了目前企業(yè)通用的財(cái)務(wù)指標(biāo),各財(cái)務(wù)指標(biāo)的計(jì)算值也按照通用公式進(jìn)行計(jì)算。
表1 財(cái)務(wù)指標(biāo)表Table 1 Financial indicators
為了彌補(bǔ)財(cái)務(wù)指標(biāo)對(duì)企業(yè)信貸風(fēng)險(xiǎn)評(píng)估的不足,采用了行業(yè)發(fā)展和企業(yè)情況作為非財(cái)務(wù)指標(biāo),其中行業(yè)景氣指數(shù)以100為分界,大于100說(shuō)明經(jīng)濟(jì)上行,小于100說(shuō)明經(jīng)濟(jì)下行;企業(yè)情況各指標(biāo)的取值如表2所示。
表2 企業(yè)的非金融指標(biāo)Table 2 Non-financial indicators in companies
在不滿足統(tǒng)計(jì)假設(shè)的條件下,采用粗糙集理論產(chǎn)生的決策比較簡(jiǎn)單,為不準(zhǔn)確數(shù)據(jù)的研究分析及挖掘數(shù)據(jù)內(nèi)在聯(lián)系方面提供了較為有效的方法[3-5],因此與傳統(tǒng)評(píng)估方法相比,在信貸風(fēng)險(xiǎn)評(píng)估模型中采用粗糙集理論,能夠較為準(zhǔn)確的進(jìn)行信貸風(fēng)險(xiǎn)評(píng)估。在實(shí)際應(yīng)用中,主要分為數(shù)據(jù)預(yù)處理、屬性簡(jiǎn)化、決策規(guī)則集的生成、對(duì)象分類及規(guī)則預(yù)測(cè)精度驗(yàn)證五個(gè)步驟。
2.1數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理就是對(duì)商業(yè)銀行掌握的信貸主體數(shù)據(jù)進(jìn)行數(shù)據(jù)的正確性及完整性檢查,對(duì)數(shù)據(jù)中的噪聲進(jìn)行處理并對(duì)連續(xù)屬性進(jìn)行離散化,使經(jīng)過(guò)處理的數(shù)據(jù)滿足粗糙集理論的要求,主要分為缺省值的處理和連續(xù)屬性離散化兩步。
缺省值處理:由于商業(yè)銀行掌握的數(shù)據(jù)表一般缺項(xiàng)較少,為了不影響數(shù)據(jù)表中包含的信息,采用Conditioned Mean Completer算法,缺項(xiàng)值由與該缺項(xiàng)數(shù)據(jù)的決策屬性值相同的數(shù)據(jù)項(xiàng)中取均值獲得。
連續(xù)屬性離散化:粗糙集理論要求屬性值必須是離散型數(shù)據(jù),由于本文選擇的財(cái)務(wù)指標(biāo)屬性值分布較均勻,所以使用等頻率算法進(jìn)行屬性值離散。具體為將某一具體屬性值由大到小進(jìn)行排序,然后依據(jù)給定的離散數(shù)k,將m個(gè)屬性值均分為k段,各段都包含有m/k個(gè)屬性值,然后得到斷點(diǎn)集,就完成了連續(xù)屬性的離散化。
2.2屬性簡(jiǎn)化
目前粗糙集屬性簡(jiǎn)化中常用的基于區(qū)分函數(shù)的簡(jiǎn)化算法和基于屬性重要性的簡(jiǎn)化算法,在數(shù)據(jù)較多時(shí),計(jì)算量過(guò)大,所以本文采用遺傳算法來(lái)完成屬性簡(jiǎn)化[6-8]。算法中區(qū)分矩陣的一項(xiàng)由候選約簡(jiǎn)的表示位串來(lái)代表,也就是對(duì)象的分辨屬性集,某位為1時(shí)代表該屬性存在,為0時(shí)代表該屬性不存在,算法的適應(yīng)函數(shù)如式1所示:
式中,v表示某分辨屬性集的位串;n表示條件屬性的數(shù)量,也就是屬性集的長(zhǎng)度;Lv表示位串v中值為1的數(shù)量;Cv表示位串v可以區(qū)分的對(duì)象數(shù)量;m表示訓(xùn)練樣本的數(shù)量。適應(yīng)函數(shù)包含兩部分,第一部分表示希望Lv的取值盡量小,后一部分表示希望可以區(qū)別的對(duì)象盡量多。在進(jìn)行初始種群的設(shè)計(jì)時(shí),可將專家或核等必要的屬性增加進(jìn)種群中,以提高算法收斂的速度。算法的具體執(zhí)行步驟如下:
①計(jì)算條件屬性C對(duì)于決策屬性D的依賴度;
②設(shè)core(C)=Ф,然后逐個(gè)去除屬性c∈C,若γC-c≠γC,就能夠確定core(C)為其中的一個(gè)核;若γcore(C)(D)=γC(D),則說(shuō)明core(C)為最小屬性約簡(jiǎn),如不是則繼續(xù)執(zhí)行步驟3;
③由隨機(jī)生成的長(zhǎng)度為n,數(shù)量為m的二進(jìn)制位串表示的個(gè)體組成初始種群,然后計(jì)算出初始群體中所有個(gè)體的適應(yīng)度;
④依據(jù)賭輪盤的方法進(jìn)行個(gè)體選擇,同時(shí)根據(jù)變異概率Pm和交叉概率Pc生成下一代群體,在變異過(guò)程中應(yīng)保證與核屬性相對(duì)應(yīng)的基因位不發(fā)生變化;
⑤計(jì)算下一代群體中全部個(gè)體的適應(yīng)度;
⑥在獲得下一代個(gè)體后,如果新一代個(gè)體中的某個(gè)個(gè)體的適應(yīng)度小于上一代某個(gè)個(gè)體的適應(yīng)度,則使用上一代最好的個(gè)體替換新一代最差的個(gè)體,以保證算法能夠收斂;
⑦如果連續(xù)t代群體中最高適應(yīng)度個(gè)體的適應(yīng)度不再提高,則停止計(jì)算并將最優(yōu)個(gè)體輸出,也就是說(shuō)此時(shí)的屬性已經(jīng)是最簡(jiǎn)化的。
2.3決策規(guī)則集的生成
根據(jù)屬性簡(jiǎn)化表,決策規(guī)則采用"if…,then…"的表達(dá)形式,即當(dāng)屬性滿足一定的條件要求時(shí),就可以得出相應(yīng)的決策規(guī)則。但為了去掉表達(dá)決策規(guī)則時(shí)的多余屬性值,需要進(jìn)行屬性值約簡(jiǎn),本文采用計(jì)算決策規(guī)則的覆蓋度和可信度進(jìn)行值約簡(jiǎn),覆蓋度和可信度的計(jì)算如式2、式3所示:
式中,βR(D)表示覆蓋度,αR(D)表示可信度。Dk表示第k個(gè)決策規(guī)則的決策屬性類,[xk]R表示對(duì)規(guī)則的全部條件屬性分類。通過(guò)選取覆蓋度和可信度比較高的決策規(guī)則來(lái)完成值約簡(jiǎn)。
2.4對(duì)象分類
完成決策表的屬性約簡(jiǎn)及值約簡(jiǎn)后,得到了最終的全部決策規(guī)則。銀行可以根據(jù)決策規(guī)則對(duì)任意一個(gè)貸款對(duì)象進(jìn)行分類,但依據(jù)決策規(guī)則得到的某一貸款對(duì)象與其信息數(shù)據(jù)的匹配程度可能會(huì)有以下幾種情況:1)新貸款對(duì)象僅匹配某一條規(guī)則;2)新貸款對(duì)象能夠匹配多條規(guī)則,且匹配結(jié)果一致;3)新貸款對(duì)象能夠匹配多條規(guī)則,但匹配結(jié)果不相同;4)新貸款對(duì)象無(wú)法匹配任何一個(gè)規(guī)則。
對(duì)情況1和情況2,根據(jù)規(guī)則集對(duì)貸款對(duì)象的判定結(jié)果僅有一個(gè),所以能夠確定貸款對(duì)象的分類;但對(duì)于情況3和情況4,無(wú)法根據(jù)規(guī)則集對(duì)貸款對(duì)象進(jìn)行分類,本文分別采用投票法和最近相鄰法來(lái)解決情況3和情況4,具體如下:
投票法:決策規(guī)則集用R表示,讓R為對(duì)象的所有可能決策類分配一個(gè)代表其可信度的量值。通常,對(duì)象都被劃分到改值最大的類中。假設(shè)待進(jìn)行分類的對(duì)象為x,投票的具體過(guò)程如下:
①掃描整個(gè)決策規(guī)則集R,激活規(guī)則集R(x)并找出與對(duì)象x匹配的全部規(guī)則;
②各個(gè)規(guī)則α→β?R(X)為其后件的決策類指定一個(gè)量值votes(α→β)作為α→β的票數(shù):votes(α→β)=support(αΛβ),這就是在決策規(guī)則集中同時(shí)滿足規(guī)則α和規(guī)則β的對(duì)象數(shù)目;
③計(jì)算對(duì)象x相對(duì)于各個(gè)決策類的可信度certainty(x,β)如式4所示,投票數(shù)votes(β)和Rβ(x)分別如式5、式6所示。
最近相鄰法:各個(gè)規(guī)則和測(cè)試儀樣本的相似度如式7所示,其中,Фj*表示測(cè)試樣本的第j個(gè)評(píng)價(jià)指標(biāo)的具體值,Фi,j表示規(guī)則庫(kù)中第i個(gè)規(guī)則的第j個(gè)評(píng)價(jià)指標(biāo)具體值,wj表示第j個(gè)評(píng)價(jià)指標(biāo)的權(quán)重大小,本文取所有權(quán)重相同。Simi表示規(guī)則庫(kù)中的第i個(gè)規(guī)則和測(cè)試樣本的相似度,數(shù)值越小表示兩者的相似程度越高。
2.5決策規(guī)則預(yù)測(cè)精度檢驗(yàn)
決策規(guī)則建立后,應(yīng)依據(jù)測(cè)試樣本進(jìn)行規(guī)則檢驗(yàn),以驗(yàn)證所建立的規(guī)則是否科學(xué)。在規(guī)則檢驗(yàn)中,建立的規(guī)則配比準(zhǔn)確率越高、測(cè)試樣本的數(shù)量越大,則說(shuō)明建立的信貸風(fēng)險(xiǎn)評(píng)估模型的可行性越高。
為驗(yàn)證本文提出的基于粗糙集理論的信貸風(fēng)險(xiǎn)評(píng)估模型是否準(zhǔn)確,選取2015年的60家ST公司作為信貸違約樣本,60家信貸正常公司作為信貸正常樣本,然后從中隨機(jī)抽取96家公司(48家信貸違約,48家信貸正常)作為評(píng)估模型的訓(xùn)練樣本,剩下的24家公司作為測(cè)試樣本,用于檢測(cè)評(píng)估模型的準(zhǔn)確性。本文選取的樣本中,缺少部分?jǐn)?shù)據(jù)項(xiàng),具體如表3所示,表中缺陷數(shù)據(jù)采用Rosetta軟件中的Conditioned Mean Completer算法補(bǔ)全。
表3 部分原始數(shù)據(jù)Table 3 Partial original data
對(duì)于信貸風(fēng)險(xiǎn)評(píng)估體表體系中的連續(xù)性指標(biāo),運(yùn)用Rosetta中的Equal Frequency(等頻率算法)進(jìn)行指標(biāo)離散,將每個(gè)指標(biāo)分為4段,分別以1、2、3、4表示各段的離散值,部分指標(biāo)離散后的數(shù)值如表4所示。
表4 離散化后的部分屬性數(shù)據(jù)Table 4 Partial data of the properties after discretization
在選用的信貸風(fēng)險(xiǎn)評(píng)估指標(biāo)體系中,有很多指標(biāo)是多余的,采用Rosetta軟件的遺傳算法對(duì)評(píng)評(píng)估指標(biāo)體系中的屬性進(jìn)行簡(jiǎn)化,最終選取了{C6,C8,C15,C17,C19}五個(gè)屬性作為簡(jiǎn)化后的條件屬性。在簡(jiǎn)化指標(biāo)的基礎(chǔ)上,設(shè)置規(guī)則的覆蓋度大于0.05,可信度大于0.75,最后一共得到了30條決策規(guī)則,部分決策規(guī)則下所示:
①流動(dòng)資產(chǎn)周轉(zhuǎn)率C6(1)AND資產(chǎn)凈利率C8(2)AND現(xiàn)金流動(dòng)負(fù)債比率C15(1)AND主營(yíng)業(yè)務(wù)收入現(xiàn)金含量C17(4)AND行業(yè)景氣指數(shù)C19(3)=>D(0);
②流動(dòng)資產(chǎn)周轉(zhuǎn)率C6(2)AND資產(chǎn)凈利率C8(3)AND現(xiàn)金流動(dòng)負(fù)債比率C15(3)AND主營(yíng)業(yè)務(wù)收入現(xiàn)金含量C17(3)AND行業(yè)景氣指數(shù)C19(2)=>D(0);
③流動(dòng)資產(chǎn)周轉(zhuǎn)率C6(2)AND資產(chǎn)凈利率C8(1)AND現(xiàn)金流動(dòng)負(fù)債比率C15(2)AND主營(yíng)業(yè)務(wù)收入現(xiàn)金含量C17(3)AND行業(yè)景氣指數(shù)C19(4)=>D(1);
④流動(dòng)資產(chǎn)周轉(zhuǎn)率C6(1)AND資產(chǎn)凈利率C8(3)AND現(xiàn)金流動(dòng)負(fù)債比率C15(4)AND主營(yíng)業(yè)務(wù)收入現(xiàn)金含量C17(2)AND行業(yè)景氣指數(shù)C19(2)=>D(1);
獲得決策規(guī)則集后,使用未參與訓(xùn)練的余下24個(gè)樣本公司進(jìn)行測(cè)試,即將這24個(gè)樣本按照決策規(guī)則進(jìn)行分類,然后與該公司的實(shí)際信貸情況進(jìn)行對(duì)比,具體如圖1所示:
圖1 測(cè)試結(jié)果Fig.1 Test results
從圖1中的測(cè)試結(jié)果可以看出:信貸情況正常公司的12個(gè)樣本中,有10個(gè)預(yù)測(cè)正確,2個(gè)樣本錯(cuò)誤的預(yù)測(cè)成了信貸違約,正確率達(dá)到83.33%;信貸情況非正常的12個(gè)公司,信貸情況的預(yù)測(cè)全部正確,正確率達(dá)到了100%;信貸風(fēng)險(xiǎn)判別的綜合正確率達(dá)高達(dá)91.67%。說(shuō)明基于粗糙集理論的信貸風(fēng)險(xiǎn)評(píng)估模型具有良好的預(yù)測(cè)精度。
本文建立的基于粗糙集理論的信貸風(fēng)險(xiǎn)評(píng)估模型具有良好的預(yù)測(cè)精度,但同時(shí)也存在一些問(wèn)題:一是在信貸風(fēng)險(xiǎn)評(píng)估指標(biāo)體系中沒(méi)有能夠反映宏觀經(jīng)濟(jì)情況的指標(biāo),這是因?yàn)樵撝笜?biāo)需要大量樣本數(shù)據(jù),目前建立的模型還難以實(shí)現(xiàn);二是本文僅將信貸風(fēng)險(xiǎn)分為兩級(jí),但實(shí)際銀行是將信貸評(píng)估劃分為五級(jí),如何將粗糙集理論應(yīng)用在五級(jí)信貸評(píng)估中。這些都還需在后續(xù)的工作中繼續(xù)研究。
針對(duì)我國(guó)商業(yè)銀行采用的傳統(tǒng)信貸風(fēng)險(xiǎn)評(píng)估方法的不足,提出了基于粗糙集理論的信貸風(fēng)險(xiǎn)評(píng)估模型。首先建立了一套信貸風(fēng)險(xiǎn)評(píng)估指標(biāo)體系,然后給出了粗糙集理論應(yīng)用在信貸風(fēng)險(xiǎn)評(píng)估模型中的各步驟實(shí)現(xiàn)方法,最后采用24家公司的信貸情況作為測(cè)試樣本,測(cè)試結(jié)果表明信貸風(fēng)險(xiǎn)判別的綜合正確率達(dá)高達(dá)91.67%,可為銀行的信貸決策提供有效的參考。
[1]Douglas RE,John DF.Corporate Financial Management[M].Beijing:Chinese People's University Press,2015
[2]Li RenPu,Zheng Ouwang.Mining Classification Rules Using Rough Sets and Neural Networks[J].European Journal of Operational Research,2014,3(4):443-448
[3]肖厚國(guó),桑琳,宮悅,等.基于遺傳算法的粗糙集屬性約簡(jiǎn)及其應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2015,44(15):228-230
[4]Slowinski R,Zopounidis C,Dimitras AI.Rough Set Predictor of Business Failure[J].Soft Computing in Financial Engineering,2014,5(8):402-424
[5]朱小剛.基于計(jì)算機(jī)粗糙集的數(shù)據(jù)挖掘設(shè)計(jì)與應(yīng)用分析[J].山東農(nóng)業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2015,46(5):765-768
[6]吳山產(chǎn),毛鋒,王文淵.基于粗糙集的兩種離散化算法的研究[J].計(jì)算機(jī)工程與應(yīng)用,2014(26):67-69
[7]薛鋒,柯孔林.粗糙集與神經(jīng)網(wǎng)絡(luò)系統(tǒng)在商業(yè)銀行貸款五級(jí)分類中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2015,3(5):40-45
[8]于達(dá)仁,胡清華,鮑文.融合粗糙集和模糊聚類的連續(xù)數(shù)據(jù)知識(shí)發(fā)現(xiàn)[J].中國(guó)電機(jī)工程學(xué)報(bào),2014,24(6):205-210
Research on Credit Risk Assessment Model Based on Rough Set Theory
ZHENG Lu-yuan
College of Mathematics and Econometrics/Hunan University,Changsha 410012,China
Credit risk is the primary risk for which modern commercial banks are facing,especially in our country due to lack of basic data,so commercial banks can't use the foreign advanced credit risk assessment model to have to use the traditional one so as to explore a suitable for China's national conditions of the credit risk assessment model.Aiming at this problem,first of all,a set of financial indicators and non-financial indicators of credit risk assessment index system should be established and then according to the characteristic,which theory of rough set is able to handle indistinguishable relationship,combining with China's specific national conditions,the credit risk assessment model based on rough set theory is put forward and presents a simplified data preprocessing,attribute and decision rule set the generation rules,object classification and prediction accuracy of the implementation of the method.Finally the multiple companies credit conditions are tested for some cases with the credit risk assessment model based on rough set theory.The results show that the prediction accuracy in credit normal companies reaches 83.33%,it is 100%in abnormal companies.Which could provide an effective reference for bank credit decisions.
Credit risk assessment;rough set theory;model
TN202
A
1000-2324(2016)02-0316-05
2015-01-06
2015-03-10
鄭路遠(yuǎn)(1994-),男,浙江長(zhǎng)興人,本科,主要研究方向:應(yīng)用數(shù)學(xué).E-mail:zheng@163.com