黃嘉斌
(中國(guó)建設(shè)銀行股份有限公司義烏分行,浙江 金華 322000)
當(dāng)前,我國(guó)很多銀行小型網(wǎng)點(diǎn)受到硬件設(shè)施、數(shù)據(jù)處理技術(shù)的等方面限制,無(wú)法有效的把握貸款相關(guān)信息,進(jìn)而無(wú)法準(zhǔn)確、有效地評(píng)估信貸風(fēng)險(xiǎn),容易出現(xiàn)決策失誤現(xiàn)象,因此對(duì)銀行信貸風(fēng)險(xiǎn)管理期間數(shù)據(jù)挖掘技術(shù)的應(yīng)用開(kāi)展深入研究,對(duì)于降低信貸風(fēng)險(xiǎn)、維護(hù)金融市場(chǎng)穩(wěn)定有著重要的指導(dǎo)意義。
數(shù)據(jù)挖掘是指在海量數(shù)據(jù)中將一些隱藏,卻又具有價(jià)值的數(shù)據(jù)進(jìn)行發(fā)現(xiàn)、提取的方法,具體是指將一些不為人知的、具有未知性、規(guī)律性、隱蔽性的信息進(jìn)行發(fā)現(xiàn),提取的整個(gè)過(guò)程。
信貸風(fēng)險(xiǎn)可以劃分為市場(chǎng)性風(fēng)險(xiǎn)、非市場(chǎng)性風(fēng)險(xiǎn),其中市場(chǎng)性風(fēng)險(xiǎn)多數(shù)來(lái)自于借款企業(yè)、借款人的生產(chǎn)以及銷(xiāo)售風(fēng)險(xiǎn),主要是指借款放在生產(chǎn)、銷(xiāo)售自身產(chǎn)品期間,由于市場(chǎng)條件、生產(chǎn)技術(shù)的變動(dòng)的所引起的風(fēng)險(xiǎn)。非市場(chǎng)風(fēng)險(xiǎn)包括社會(huì)風(fēng)險(xiǎn)、自然風(fēng)險(xiǎn),自然風(fēng)險(xiǎn)是指因自然因素造成借款人的經(jīng)濟(jì)遭受損失,無(wú)法償還信貸本息風(fēng)險(xiǎn);社會(huì)風(fēng)險(xiǎn)表示由組織、個(gè)人在社會(huì)上的某些行為所引起的風(fēng)險(xiǎn)。
利用數(shù)據(jù)挖掘,可利用不同類(lèi)別貸款特征建立貸款管理模型,一旦有新貸款申請(qǐng),當(dāng)即利用模型來(lái)判斷貸款類(lèi)別,銀行可依據(jù)模型的類(lèi)別,對(duì)貸款申請(qǐng)采取針對(duì)性措施,同時(shí),在應(yīng)用數(shù)據(jù)挖掘期間,會(huì)每隔一段時(shí)間,就對(duì)每一筆貸款開(kāi)展重新分類(lèi),進(jìn)而有效提高信貸風(fēng)險(xiǎn)管理力度。
1.銀行信貸原始數(shù)據(jù)描述。我國(guó)一些銀行網(wǎng)點(diǎn)設(shè)立于縣級(jí),乃至是縣級(jí)以下的地域,這些小型銀行所開(kāi)展的貸款業(yè)務(wù)主要面對(duì)來(lái)自于農(nóng)村地區(qū)的客戶(hù),例如某商業(yè)銀行開(kāi)展的小額貸款業(yè)務(wù),分為農(nóng)戶(hù)、商戶(hù)兩種,本次研究以商戶(hù)小額貸款為研究對(duì)象。商戶(hù)小額度貸款可分為商戶(hù)聯(lián)保貸款、商戶(hù)保證貸款,在對(duì)此類(lèi)小型某商業(yè)銀行的商業(yè)信貸風(fēng)險(xiǎn)管理開(kāi)展數(shù)據(jù)挖掘期間,為了不會(huì)侵犯到貸款客戶(hù)的隱私,避免客戶(hù)信息的泄露,在數(shù)據(jù)提取階段,將商戶(hù)的姓名、居住地址、店鋪位置、企業(yè)名稱(chēng)、聯(lián)系方式、營(yíng)業(yè)執(zhí)照編號(hào)等數(shù)據(jù)信息進(jìn)行過(guò)濾,經(jīng)過(guò)對(duì)海量客戶(hù)相關(guān)數(shù)據(jù)分析之后,將數(shù)據(jù)提取確認(rèn)為如下字段:(1)客戶(hù)代碼;(2)婚姻狀況;(3)教育程度;(4)主營(yíng)業(yè)務(wù);(5)經(jīng)營(yíng)年限;(6)年齡;(7)貸款種類(lèi);(8)貸款額度;(9)貸款期限;(10)客戶(hù)流動(dòng)總資產(chǎn);(11)固定總資產(chǎn);(12)客戶(hù)負(fù)載;(13)客戶(hù)還款方式;(14)客戶(hù)月凈收入;(15)客戶(hù)月投入;(16)客戶(hù)信用信息[1]。
2.數(shù)據(jù)預(yù)處理。數(shù)據(jù)采集的第二步,就是對(duì)錯(cuò)誤、空值數(shù)據(jù)進(jìn)行預(yù)處理,數(shù)據(jù)預(yù)處理的過(guò)程為數(shù)據(jù)收集——數(shù)據(jù)選擇——數(shù)據(jù)清理——數(shù)據(jù)轉(zhuǎn)換,在上一部分,針對(duì)某某商業(yè)銀行信貸管理業(yè)務(wù),進(jìn)行了17個(gè)屬性字段的數(shù)據(jù)收集,隨后,以隨機(jī)的方式在數(shù)據(jù)庫(kù)中對(duì)100條貸款用戶(hù)信息記錄進(jìn)行收集、整理,整理過(guò)后經(jīng)過(guò)處理,去除無(wú)參考價(jià)值的數(shù)據(jù),對(duì)剩余的屬性字段進(jìn)行概化,如表1:
表1 屬性字段概化結(jié)果表
在本次開(kāi)展分類(lèi)抽取整理的客戶(hù)資料當(dāng)中,有52個(gè)為已經(jīng)分類(lèi)的案例,其中關(guān)注類(lèi)9例,次級(jí)類(lèi)6例,可疑類(lèi)5例、損失類(lèi)2例、正常類(lèi)30例,此外,一般損失類(lèi)借款人的相關(guān)財(cái)務(wù)資料都難以獲取,因此只有其他4類(lèi)參與,即:正常類(lèi)=30,關(guān)注類(lèi)=9;次級(jí)類(lèi)=6,可疑類(lèi)=5,損失類(lèi)=2。
3.構(gòu)造決策樹(shù)。將上表中過(guò)濾后的數(shù)據(jù),轉(zhuǎn)換成CSC Data Files格式時(shí)WEKA可以讀取,隨后使用WEKA建造模型,選擇建立決策樹(shù)方法建立決策樹(shù),采用準(zhǔn)確率最高的J48分類(lèi)器。
4.評(píng)估模型。以分類(lèi)模型和樣本數(shù)據(jù)作為依據(jù),利用測(cè)試樣本的百分比來(lái)表示模型預(yù)測(cè)的準(zhǔn)確率,假設(shè)正確率可接受,那么就可以用于指導(dǎo)對(duì)客戶(hù)群的分流,J48分類(lèi)器通過(guò)默認(rèn)粉分層10折較差驗(yàn)證,準(zhǔn)確率高達(dá)82%,為可以接受范圍,此刻,當(dāng)銀行收到新的貸款申請(qǐng),就可以利用模型得出估計(jì)的類(lèi)別,進(jìn)而對(duì)不同的類(lèi)別采取針對(duì)性的措施,如果貸款類(lèi)型為正常范圍,直接審批通過(guò),弱勢(shì)關(guān)注范圍,就需要對(duì)其加強(qiáng)審查、加強(qiáng)貸后檢查或是對(duì)其進(jìn)行拒絕,進(jìn)一步提高信貸資產(chǎn)安全性,有效控制銀行信貸風(fēng)險(xiǎn)[2]。
本次研究,針對(duì)銀行信貸風(fēng)險(xiǎn)管理中數(shù)據(jù)挖掘的應(yīng)用進(jìn)行了深入研究,在分析數(shù)據(jù)挖掘、銀行信貸風(fēng)險(xiǎn)的基礎(chǔ)上,分別對(duì)數(shù)據(jù)挖掘中的原始數(shù)據(jù)描述,、數(shù)據(jù)預(yù)處理、決策樹(shù)構(gòu)造、評(píng)估模型開(kāi)展深入的研究,通過(guò)本次研究,可以明確數(shù)據(jù)挖掘的每個(gè)步驟經(jīng)過(guò),相關(guān)行業(yè)可以借鑒本次研究,將數(shù)據(jù)挖掘應(yīng)用到銀行的信貸風(fēng)險(xiǎn)管理中,以確保信貸資產(chǎn)的安全性,降低信貸風(fēng)險(xiǎn)。