周戰(zhàn)超
[摘 要] 本文通過對小企業(yè)的貸款數(shù)據(jù)進(jìn)行實證分析,建立基于K-均值聚類的工業(yè)小企業(yè)信用風(fēng)險評價模型,通過信用等級越高、違約損失率越低的標(biāo)準(zhǔn)劃分信用等級。本文的特色是建立基于K-均值聚類的信用風(fēng)險評價模型,以聚類分析擬合信用風(fēng)險指標(biāo)的實際分布。通過K-均值聚類分析信用風(fēng)險評價指標(biāo)體系,根據(jù)需要劃分的等級個數(shù)直接進(jìn)行等級劃分,確定各等級聚類中心,依據(jù)樣本與各聚類中心聚類遠(yuǎn)近確定其所屬信用風(fēng)險等級。
[關(guān)鍵詞] 工業(yè)小企業(yè);信用風(fēng)險;信用等級;K-均值聚類
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 13. 012
[中圖分類號] F276.3 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1673 - 0194(2018)13- 0026- 02
1 前 言
信用風(fēng)險評價的本質(zhì)是對企業(yè)違約風(fēng)險評價,衡量客戶或一筆貸款違約的可能性。信用風(fēng)險評價基于信用等級越高、違約損失率越低的標(biāo)準(zhǔn)。近年來,我國小企業(yè)迅速發(fā)展,已經(jīng)成為社會主義市場經(jīng)濟(jì)的重要組成部分。目前,制約小企業(yè)發(fā)展的主要因素是融資難,即缺乏行之有效的信用風(fēng)險評價模型。
國內(nèi)外對信用風(fēng)險評價模型的研究已取得一定進(jìn)展,大致可分為三大類。
1.1 基于統(tǒng)計方法的信用風(fēng)險評價模型
張玲等(2004)建立基于Z值的多元判別模型對我國上市公司進(jìn)行信用評級,并研究發(fā)現(xiàn)我國上市公司資信品質(zhì)的一些特點(diǎn)[1]。Malik等(2010)使用馬爾科夫轉(zhuǎn)移矩陣建立信用評價模型[2]。Cipollini等(2012)基于面板Probit回歸方法建立信用風(fēng)險評價模型[3]。
1.2 基于神經(jīng)網(wǎng)絡(luò)的信用評價模型。
Abdou(2012)使用神經(jīng)網(wǎng)絡(luò)方法對信用風(fēng)險進(jìn)行測算。Chen(2003)等應(yīng)用神經(jīng)網(wǎng)絡(luò)對信用風(fēng)險進(jìn)行評價。Tsai等(2008)利用神經(jīng)網(wǎng)絡(luò)對復(fù)合分類器和多元復(fù)合分類器在信用風(fēng)險評估的應(yīng)用進(jìn)行了實證研究。
1.3 基于遺傳規(guī)劃的信用評級模型
Huang等(2006)建立基于兩階段遺傳規(guī)劃的信用評價模型。Chi等(2012)使用智能遺傳算法建立信用風(fēng)險測算模型??驴琢值龋?008)建立基于粗糙集和遺傳算法的企業(yè)貸款違約判別模型,提出的該模型較多元判別分析、logistic、BP神經(jīng)網(wǎng)絡(luò)等違約判別模型更為有效和實用。
2 K-均值聚類劃分級別原理
K-均值聚類算法的核心思想是把數(shù)據(jù)集劃分成使目標(biāo)函數(shù)達(dá)到最小值的K個類。首先利用隨機(jī)抽樣法從數(shù)據(jù)集樣本中抽取K個對象作為初始聚類中心;其次計算剩余數(shù)據(jù)對象與各個聚類中心的歐幾里得距離,按照距離最小原則來劃分類別;第一輪聚類結(jié)束;最后計算每一類的平均值,用第二次的K個平均值作為新的K個聚類中心,循環(huán)上述步驟重復(fù)迭代,直到目標(biāo)函數(shù)最小化,即其變化相對上一次的改變量小于閾值ξ,即滿足式(3),迭代停止,此時的聚類中心即為所求。
設(shè)X={X1,X2,…,Xn}為已知樣本數(shù)據(jù)集, X1,X2,…,Xn是n個樣本數(shù)據(jù)對象,n是樣本個數(shù),每個數(shù)據(jù)對象都是N維的,即Xi={xi1,xi2,…,xiN},N是信用風(fēng)險評價指標(biāo)的個數(shù)。K均值聚類算法就是找到K個聚類中心C={C1,C2,…,Ck}={{c11,c12,…,c1N},{c21,c22,…,c2N},…,{ck1,ck2,…,ckN}},使目標(biāo)函數(shù)J最小化。
3 基于K-均值聚類的工業(yè)小企業(yè)信用風(fēng)險評級體系的建立
3.1 樣本選取
中國某區(qū)域性商業(yè)銀行在全國28個城市分支行的工業(yè)行業(yè)小企業(yè)貸款數(shù)據(jù),數(shù)據(jù)時間跨度是1994年5月至2012年9月,共有1 814筆借據(jù),其中違約樣本15筆,非違約樣本1 799筆。
3.2 工業(yè)小企業(yè)信用風(fēng)險評價指標(biāo)體系的建立
本文從企業(yè)內(nèi)部財務(wù)因素、企業(yè)外部宏觀環(huán)境、抵質(zhì)押擔(dān)保等七個準(zhǔn)則層海選小企業(yè)信用風(fēng)險評價指標(biāo),根據(jù)指標(biāo)能否顯著區(qū)分違約與非違約狀態(tài)進(jìn)行似然比檢驗第一次篩選指標(biāo),保證遴選出的指標(biāo)都能對企業(yè)是否違約進(jìn)行顯著區(qū)分;根據(jù)準(zhǔn)則內(nèi)相關(guān)分析進(jìn)行第二次篩選,避免遴選出的指標(biāo)反映信息重復(fù),建立基于資產(chǎn)負(fù)債率、行業(yè)景氣指數(shù)等的26個指標(biāo)的工業(yè)小企業(yè)信用風(fēng)險評價指標(biāo)體系。如表1第3列所示。
3.3 K-均值聚類
根據(jù)《中國人民銀行信用評級管理指導(dǎo)意見》中對企業(yè)信用等級的劃分,設(shè)9個信用等級,則本研究聚類中心數(shù)目K=9,樣本數(shù)n=1 814,指標(biāo)數(shù)N=26,閾值ξ=10-10,聚類結(jié)果可以看出,樣本13次迭代后,達(dá)到了聚類目標(biāo)要求穩(wěn)定狀態(tài)。并且九個聚類中心間距離較遠(yuǎn),說明該方法能夠較好地對小企業(yè)信用風(fēng)險進(jìn)行分類。
3.4 工業(yè)小企業(yè)信用風(fēng)險評價
本文根據(jù)《中國人民銀行信用評級管理指導(dǎo)意見(銀發(fā)[2006]95號)》,把企業(yè)信用等級劃分為9個信用等級,即:AAA、AA、A、BBB、BB、B、CCC、CC、C。依據(jù)上文中隸屬于9個聚類中違約樣本的比率,即違約比率,違約比率越低,信用等級越高進(jìn)行工業(yè)小企業(yè)信用風(fēng)險等級劃分。
由表2可知,違約比率越大,違約風(fēng)險排序越大,AAA、AA、A違約可能性很小,樣本中違約比率0%,根據(jù)相對非違約樣本比例排序,非違約樣本越多,信用風(fēng)險越低,信用等級越高。建立聚類類別與信用等級的對應(yīng)關(guān)系,即有:類4-AAA、類8-AA、類9-A、類1-BBB、類6-BB、類7-B、類3-CCC、類2-CC、類5-C。
4 結(jié) 語
(1)建立基于K-均值聚類的信用風(fēng)險評價模型,以聚類分析擬合信用風(fēng)險指標(biāo)的實際分布,K-均值聚類不要求樣本數(shù)據(jù)服從具體分布,避免主觀確定指標(biāo)分布的弊端。尤其對于大樣本信用風(fēng)險分析,K-均值算法避免了對于分布的假設(shè)分析的大量工作,具有高效的性能。
(2)通過K-均值聚類分析信用風(fēng)險評價指標(biāo)體系,根據(jù)需要劃分的等級個數(shù)直接進(jìn)行等級劃分,確定各等級聚類中心,依據(jù)樣本與各聚類中心聚類遠(yuǎn)近確定其所屬信用風(fēng)險等級,進(jìn)行信用風(fēng)險評價。避免主觀確定賦權(quán)方法及等級劃分標(biāo)準(zhǔn)的弊端。
主要參考文獻(xiàn)
[1]張玲,曾維火. 基于Z值模型的上市公司信用等級轉(zhuǎn)移矩陣實證研究[J].中國管理科學(xué),2004,12(z1):242-247.
[2]Malik M, Thomas L C. Transition matrix models of consumer credit ratings[J]. International Journal of Forecasting,2010,28(1):261-272.
[3]Cipollini A, Fiordelisi F. Economic value, competition and financial distress in the European banking system[J]. Journal of Banking & Finance,2012,36(11):3101-3109.