楊帆
摘要:信用的存在與踐行是市場(chǎng)交易的基礎(chǔ),現(xiàn)代征信行業(yè)中,以數(shù)據(jù)挖掘與數(shù)據(jù)分析為基礎(chǔ)的信用評(píng)分技術(shù)在市場(chǎng)的確定與開(kāi)拓中起著不可估量的作用。
關(guān)鍵詞:Logistic;回歸;信用評(píng)分;SPSS
中圖分類(lèi)號(hào):F830.479 文獻(xiàn)識(shí)別碼:A 文章編號(hào):1001-828X(2018)018-0011-01
引言
當(dāng)下互聯(lián)網(wǎng)金融已蓬勃興起,呈現(xiàn)出多種多樣的業(yè)務(wù)模式和運(yùn)行機(jī)制。金融機(jī)構(gòu)能夠突破時(shí)間和地域的約束,在互聯(lián)網(wǎng)上為有融資需求的客戶(hù)提供更快捷的金融服務(wù)。通過(guò)互聯(lián)網(wǎng)技術(shù),加快業(yè)務(wù)處理速度,帶給用戶(hù)更好的服務(wù)體驗(yàn)。但同時(shí)存在著信用風(fēng)險(xiǎn)和用戶(hù)欺詐等問(wèn)題,急需通過(guò)信用評(píng)分模型提高風(fēng)險(xiǎn)控制水平。
一、材料與方法
(一)建模思路
根據(jù)我們所整理的文獻(xiàn)資料以及從FICO與芝麻信用處所了解到的打分標(biāo)準(zhǔn),總結(jié)影響個(gè)人履約能力的有以下主要幾個(gè)要素,包括:
1.違約歷史,包括個(gè)人破產(chǎn),斷供房產(chǎn)被拍賣(mài),罰款等情況。
2.債務(wù)負(fù)擔(dān),即個(gè)人杠桿率,包括信用卡信用額度利用率等。
3.信用種類(lèi),客戶(hù)所用過(guò)的信用種類(lèi)越多,說(shuō)明其金融知識(shí)越豐富,受信方越容易對(duì)其信用歷史與信用情況做出總結(jié)。
根據(jù)上述評(píng)分標(biāo)準(zhǔn),綜合比較個(gè)人信用評(píng)分的主要模型,結(jié)合所獲數(shù)據(jù)特點(diǎn),我們首先利用R語(yǔ)言原始數(shù)據(jù)進(jìn)行清洗,基于處理后的數(shù)據(jù)確定指標(biāo)變量,選取logistic模型進(jìn)行建模,再根據(jù)logistic回歸模型的特點(diǎn),探索一種將履約能力量化的方法,并將此作為最終的信用分?jǐn)?shù),并據(jù)此進(jìn)行信用評(píng)分規(guī)則的制定。
(二)數(shù)據(jù)處理及指標(biāo)變量確定
1.數(shù)據(jù)處理
由于原始數(shù)據(jù)相對(duì)混亂且數(shù)量巨大,同時(shí)存在大量缺失值,我們首先利用R語(yǔ)言對(duì)原始數(shù)據(jù)進(jìn)行清洗,并將所有表根據(jù)整理后的變量合為一張表,確認(rèn)每位用戶(hù)的相關(guān)的指標(biāo)情況。
2.指標(biāo)變量確定
經(jīng)過(guò)整理指標(biāo)變量,總結(jié)了個(gè)人特征變量?jī)蓚€(gè),包括婚姻狀況MARRY以及教育程度EDU;經(jīng)濟(jì)特征變量七個(gè),包括貸款金額LA、未結(jié)清貸款金額ULA、未銷(xiāo)戶(hù)貸記卡合同金額DCA、未銷(xiāo)戶(hù)準(zhǔn)貸記卡合同金額PDCA、貸款逾期筆數(shù)ONLA、貸記卡逾期賬戶(hù)數(shù)ONDC以及準(zhǔn)貸記卡逾期賬戶(hù)數(shù)ONPDC。并對(duì)指標(biāo)變量進(jìn)行量化處理。
虛擬變量對(duì)應(yīng)的屬性為“真”時(shí)選擇“1”,為“假”時(shí)選擇“0”。以“教育程度”為例,當(dāng)樣本數(shù)據(jù)中“教育程度”指標(biāo)為初等教育時(shí),虛擬變量“教育0”取1,其他虛擬變量取0;“教育程度”指標(biāo)為中等教育時(shí),虛擬變量“教育1”取1,其他虛擬變量取0“教育程度”指標(biāo)為高等教育時(shí),虛擬變量“教育0”,“教育1”都取0。
我們以用戶(hù)“183728'為例(變量對(duì)應(yīng)的屬性為“真”時(shí)選擇“1”,為“假”時(shí)選擇“0”),該用戶(hù)已婚,接受過(guò)中等教育,有30萬(wàn)N50萬(wàn)的貸款金額,目前還有不到5萬(wàn)的貸款金額未結(jié)清,有不到5萬(wàn)的未銷(xiāo)戶(hù)貸記卡合同金額,同時(shí)還有1到3筆貸款逾期筆數(shù)。
二、結(jié)果與分析
(一)信用評(píng)分模型的構(gòu)建
1.模型選擇
回歸分析中,因變量Y有兩種情形,即定量變量和定性變量,而logistic回歸模型是在于研究因變量非連續(xù)變量情況下的分析模型。logistic回歸模型作為經(jīng)典的信用評(píng)分模型,將實(shí)數(shù)域上的輸出映射到[0,1]上,且具有較強(qiáng)的可解釋性。
2.Logistic回歸模型的構(gòu)建與求解
logistic回歸的結(jié)果可以看出,教育程度EDU、貸款金額LA、未銷(xiāo)戶(hù)貸記卡合同金額DCA、貸記卡逾期賬戶(hù)數(shù)ONDC和準(zhǔn)貸記卡逾期賬戶(hù)數(shù)ONPDC這五個(gè)變量的p值均小于0.05,可以認(rèn)為教育程度、貸款金額、未銷(xiāo)戶(hù)貸記卡合同金額、貸記卡逾期賬戶(hù)數(shù)和準(zhǔn)貸記卡逾期賬戶(hù)數(shù)與因變量之間的線(xiàn)性關(guān)系在統(tǒng)計(jì)上是顯著的,保留五個(gè)變量在模型中。
最終采用前進(jìn)法,將顯著的指標(biāo)變量未銷(xiāo)戶(hù)貸記卡合同金額DCA、貸款金額LA、貸記卡逾期賬戶(hù)數(shù)ONDC、教育程度EDU、準(zhǔn)貸記卡逾期賬戶(hù)數(shù)ONPDC納入回歸方程。
(二)信用評(píng)分規(guī)則的制定
1.指標(biāo)變量得分計(jì)算
根據(jù)評(píng)分模型所求得測(cè)試集的信用分?jǐn)?shù)最小值為243,而最大值為321,將客戶(hù)的信用得分情況與其原有資料相對(duì)比,信用得分在300分以上的客戶(hù),基本為履約客戶(hù),很少出現(xiàn)履約或逾期不還現(xiàn)象;而得分在280分以下的銀行客戶(hù),其在銀行信用記錄上多次出現(xiàn)準(zhǔn)貸記卡逾期賬戶(hù)或貸記卡逾期賬戶(hù),屬于所界定的違約客戶(hù)。
2.信用評(píng)分規(guī)則的制定
根據(jù)評(píng)分公式計(jì)算客戶(hù)信用得分,得分區(qū)間為[240,328],隨著所得分?jǐn)?shù)的上升,客戶(hù)的信用隨之提升,違約概率相應(yīng)減小,反之,信用分?jǐn)?shù)越低,客戶(hù)違約概率越大。結(jié)合訓(xùn)練集數(shù)據(jù)信息,信用得分在300分以上的客戶(hù),信用評(píng)估較好,基本為履約客戶(hù);而得分在280分以下的銀行客戶(hù),其違約概率較大,此時(shí)銀行應(yīng)謹(jǐn)慎考慮是否繼續(xù)放貸。
三、討論
(一)結(jié)論
為了有效控制和防范信貸風(fēng)險(xiǎn),銀行必須充分利用已經(jīng)掌握的數(shù)據(jù),對(duì)借款人利用信用評(píng)分模型進(jìn)行準(zhǔn)確的風(fēng)險(xiǎn)評(píng)估。信用評(píng)分模型,選擇了五個(gè)虛擬變量,制定評(píng)分規(guī)則,計(jì)算信用得分,銀行可以根據(jù)得分高低,評(píng)估借款人的信用風(fēng)險(xiǎn),進(jìn)而選擇是否放貸,從而有效降低風(fēng)險(xiǎn),實(shí)現(xiàn)效益最大化。但是,信用評(píng)分模型也存在缺陷。
(二)建議
為使得銀行降低個(gè)人信貸風(fēng)險(xiǎn),保持經(jīng)濟(jì)健康穩(wěn)定發(fā)展,一方面,銀行應(yīng)當(dāng)建立全面而精準(zhǔn)的風(fēng)險(xiǎn)管理體系,不斷完善客戶(hù)信用檔案,提高信用評(píng)估模型的準(zhǔn)確性、穩(wěn)定性以及解釋性;另一方面,在使用信用評(píng)分模型時(shí),要關(guān)注其時(shí)效性,及時(shí)更新模型,在具體使用過(guò)程中,可以憑借審批經(jīng)驗(yàn),對(duì)信用等級(jí)的分?jǐn)?shù)劃分進(jìn)行及時(shí)調(diào)整,謹(jǐn)慎評(píng)估后做出是否放貸的決定,如此才能在最大程度上保證授信方與受信方的利益,并且開(kāi)拓更加廣泛的市場(chǎng)。