劉翔鵬
商業(yè)銀行信用風(fēng)險(xiǎn)管理一直是全面風(fēng)險(xiǎn)管理( ERM)的重要組成部分,對(duì)于地方法人銀行機(jī)構(gòu)而言,不良貸款預(yù)測分類是信用風(fēng)險(xiǎn)管理的重點(diǎn)和難點(diǎn)。針對(duì)我國中小法人銀行面臨的不良貸款信用風(fēng)險(xiǎn)問題,引入樸素貝葉斯模型對(duì)不良資產(chǎn)信用風(fēng)險(xiǎn)進(jìn)行識(shí)別分類,并選取湖南S農(nóng)商行和B農(nóng)商行2017年末全部信貸數(shù)據(jù)進(jìn)行實(shí)證。
金融是現(xiàn)代經(jīng)濟(jì)的核心,銀行市現(xiàn)代金融的核心,現(xiàn)代商業(yè)銀行在經(jīng)營和發(fā)展過程中,因?yàn)榛I集融通資金,中間環(huán)節(jié)會(huì)積累大量不良資產(chǎn)。由于歷史上和現(xiàn)實(shí)上的原因,我國農(nóng)信系統(tǒng)的地方法人金融機(jī)構(gòu)累積了大量的不良資產(chǎn),雖然經(jīng)過央行票據(jù)置換和農(nóng)商行改革已經(jīng)置換、清收了大量的不良資產(chǎn),但是由于地方法人銀行機(jī)構(gòu)信用風(fēng)險(xiǎn)管理能力較差,人才隊(duì)伍培養(yǎng)滯后,故對(duì)不良資產(chǎn)的事前識(shí)別能力極弱。
目前國內(nèi)銀行業(yè)對(duì)不良資產(chǎn)信用風(fēng)險(xiǎn)評(píng)估方法主要是采用古典分析法和多元統(tǒng)計(jì)法。古典分析法是指銀行經(jīng)營者依賴一批訓(xùn)練有素的專家主觀判斷,對(duì)信貸項(xiàng)目進(jìn)行判斷打分,審貸會(huì)以此決策。多元統(tǒng)計(jì)分析的基本思路是根據(jù)歷史積累的樣本建立統(tǒng)計(jì)模型,對(duì)新樣本發(fā)生的某種事件的可能性進(jìn)行預(yù)測的方法,包括線性概率和判別分析法等。
以上所述方法雖然被廣泛應(yīng)用,但是他們只是針對(duì)某一方面如財(cái)務(wù)進(jìn)行分析和統(tǒng)計(jì),不能充分利用銀行搜集的全面信息,尤其是一些邊緣信息。大量的數(shù)據(jù)挖掘研究結(jié)果表明,很多邊緣信息和側(cè)面指標(biāo)可以很好地補(bǔ)充單一財(cái)務(wù)指標(biāo)的缺陷,使借款項(xiàng)目的特征更加鮮明,故本文引入樸素貝葉斯模型,試圖用新辦法解決信用風(fēng)險(xiǎn)識(shí)別、評(píng)估的舊問題。
一、模型設(shè)計(jì)
樸素貝葉斯分類的基礎(chǔ)是對(duì)于給出的待分類項(xiàng),求解在此項(xiàng)出現(xiàn)條件下各個(gè)類別出現(xiàn)的概率,哪個(gè)概率最大,就認(rèn)為此待分類項(xiàng)屬于哪個(gè)類別。該模型以簡單的結(jié)構(gòu)和良好的性能受到人們的關(guān)注,模型建立在類條件獨(dú)立性假設(shè)的基礎(chǔ)上:給定類結(jié)點(diǎn)后,個(gè)屬性結(jié)點(diǎn)之間相互獨(dú)立。根據(jù)樸素貝葉斯的類條件獨(dú)立假設(shè)則有:P=(X|Ci)= (P(XKCi)
條件概率P(X1|Ci),P(X2Ci),…P(XKCi)可以從訓(xùn)練數(shù)據(jù)集中求得。根據(jù)此方法,對(duì)一個(gè)未知類別的樣本X,可以先分別計(jì)算出X屬于每一個(gè)類別Ci 概率P(X|Ci)P(Ci),然后選擇其中概率最大的類別作為其類別。
樸素貝葉斯的正確步驟如下:
(1)設(shè)x={a1,a2,…,am)為一個(gè)待分類項(xiàng),而a為該待分類項(xiàng)的每一個(gè)特征值。
(2)有類別集合C={y1,y2,…,ym}。
(3)計(jì)算P(y1|x.)P(y1x.)…,P(yn|x)。
(4)如果P(yK|x)=max{P(y1|x.)P(y2|x)…,P(yn|x},則x∈yk。
那么,現(xiàn)在的關(guān)鍵就是如何計(jì)算第三步驟的各個(gè)條件概率,可以按如下步驟計(jì)算:
(1)找到一個(gè)已知分類的待分類項(xiàng)集合,這個(gè)集合叫做訓(xùn)練樣本集。
(2)統(tǒng)計(jì)得到各個(gè)類別下各個(gè)特征屬性的條件概率估計(jì),即P(a1|y1),P(a2|y1),…,P(am|y1);P(a1|y2),P(a2|y2),…P(am|y2)…
(3)如果得到在各個(gè)特征屬性是條件獨(dú)立的,則根據(jù)貝葉斯定理有如下推導(dǎo)。
P(yi|x)=P(x|yi)P(yi)/P(x)
分母對(duì)于所有類別為常數(shù),因此只要將分子最大化即可,因?yàn)楦魈卣鲗傩允菞l件獨(dú)立的,所以有:P(am|yi)P(yi)=P(yi)mΠj=1P(aj|yi)
二、實(shí)證分析
本文選取湖南永州境內(nèi)S農(nóng)商行和B農(nóng)商行全部信貸數(shù)據(jù)作為實(shí)證樣本。首先對(duì)數(shù)據(jù)進(jìn)行處理,對(duì)缺損數(shù)據(jù)和重復(fù)數(shù)據(jù)進(jìn)行了清洗,選取12450個(gè)樣本,13個(gè)特征值作為有效數(shù)據(jù)。將數(shù)據(jù)庫的英文字符和中文字符全部轉(zhuǎn)化為雙精度浮點(diǎn)型數(shù)據(jù),然后利用虛擬變量函數(shù)對(duì)雙精度浮點(diǎn)型數(shù)據(jù)全部進(jìn)行編碼,樣本屬性標(biāo)簽正常貸款和不良貸款分別用0和1表示。
在實(shí)證環(huán)節(jié),隨機(jī)選取40%的樣本作為測試樣本,共進(jìn)行40次交叉驗(yàn)證。40次交叉驗(yàn)證預(yù)測標(biāo)簽為1的不良貸款結(jié)果如下表1:
全部40次隨機(jī)交叉驗(yàn)證的準(zhǔn)確率均值為0.777,標(biāo)準(zhǔn)誤差為0.069。由模型結(jié)果可以看出樸素貝葉斯分類器是健壯的,因?yàn)樵趶臄?shù)據(jù)中估計(jì)條件概率時(shí),這些點(diǎn)被平均。另外樸素貝葉斯模型可以處理屬性值的遺漏問題,面對(duì)無關(guān)屬性,該分類器依然是簡單的,因?yàn)槿绻鸛i是無關(guān)屬性,那么P(Xi|Y)幾乎要變成均勻分布,Xi的類條件概率不會(huì)對(duì)總的后驗(yàn)概率計(jì)算產(chǎn)生影響。屬性如果相關(guān)可能會(huì)降低樸素貝葉斯分類器的性能,因?yàn)閷?duì)這些屬性,條件獨(dú)立的假設(shè)已經(jīng)不成立。
三、結(jié)論和建議
樸素貝葉斯模型的準(zhǔn)確率很高,穩(wěn)定性很強(qiáng),在多次交叉驗(yàn)證后,得到較為穩(wěn)定的準(zhǔn)確率和較小的標(biāo)準(zhǔn)誤差,故模型實(shí)用價(jià)值很高。但法人銀行機(jī)構(gòu)的關(guān)聯(lián)交易和流動(dòng)性狀況是該模型不能識(shí)別的,股東的高額關(guān)聯(lián)貸款給法人銀行帶來的信用風(fēng)險(xiǎn)是極大的,極端情況的流動(dòng)性短缺會(huì)讓法人銀行機(jī)構(gòu)經(jīng)營困難,結(jié)合聲譽(yù)風(fēng)險(xiǎn),可能會(huì)被處置當(dāng)局警告、早糾甚至接管。