許園園 中央軍委機關(guān)事務(wù)管理總局財務(wù)結(jié)算中心
隨著住房成本不斷攀升占用了年輕人較多資金,越來越多的人會選擇使用貸款去購買一些大型的家用品。在業(yè)務(wù)辦理初期,做好信用審核,把好準入關(guān)尤為重要?;诖髷?shù)據(jù)分析,企業(yè)可以得知其客戶的結(jié)構(gòu)、喜好、購物習慣、風險偏好等一大批結(jié)果,甚至可以發(fā)現(xiàn)一些表面看起來無關(guān)聯(lián),但是又存在的內(nèi)在聯(lián)系,從而更了解自己的客戶。根據(jù)這些結(jié)果,企業(yè)制定更精準的營銷方案或者是控制風險,從而快速提升企業(yè)發(fā)展。本文研究的主題是充分利用銀行做掌握的大數(shù)據(jù),建立一個數(shù)據(jù)評分模型,在降低信用卡逾期風險的同時,提高信用卡審批效率。
本文參照信用卡業(yè)務(wù)常見填寫選項:性別、年齡、參加工作時間、職級、信用卡額度、年收入、住房情況、婚姻狀況等八項因素,結(jié)合搜集的5200筆分期業(yè)務(wù)(其中131筆發(fā)生違約),對每項因素做出簡要分析。
表1 性別在總樣本和違約樣本中的分布
從表中可見,男性對信用卡分期業(yè)務(wù)接納度更高一些,比女性高出了7%,但是從發(fā)生分期違約人數(shù)看,男性的違約人數(shù)占比比女性高出10%,初步認為性別對信用卡是否產(chǎn)生違約有影響。
表2 工作時間在總樣本和違約樣本中的分布
從表中可見,工作年限1-5年的客戶對信用卡分期業(yè)務(wù)接納度更高一些,占比53.6%,但是從發(fā)生分期違約人數(shù)看,工作年限1-5年的客戶占比更高,高達62.6%,而工作10年以上的客戶占比對比處于下降趨勢,初步認為工作年限對信用卡分期業(yè)務(wù)是否產(chǎn)生違約有影響。
表3 額度在總樣本和違約樣本中的分布
從表中可見,信用卡額度各個統(tǒng)計段對分期業(yè)務(wù)接納程度差別不是很明顯,但是從發(fā)生分期違約人數(shù)看,信用額度2萬以上的人數(shù)占比明顯下降,初步判定信用卡額度對信用卡分期業(yè)務(wù)是否產(chǎn)生違約有影響。
表4 年齡在總樣本和違約樣本中的分布
從表中可見,45歲以下對信用卡分期業(yè)務(wù)接納度更高一些,尤其是34歲以下,達到了各年齡段的最高點25.15%。從發(fā)生分期違約人數(shù)看,34歲以下違約人數(shù)占比更高,而45歲以上違約人數(shù)占比開始下降,初步認為性別對信用卡分期業(yè)務(wù)是否產(chǎn)生違約有影響。
表5 婚姻狀況在總樣本和違約樣本中的分布
從表中可見,已婚客戶對信用卡分期業(yè)務(wù)接納度更高一些,占比74.17%,但是從發(fā)生分期違約人數(shù)看,已婚占比較少,只有58.78%,而未婚和婚姻狀況為其他的違約人數(shù)占比均高于業(yè)務(wù)接納人數(shù)占比,初步認為婚姻狀況對信用卡分期業(yè)務(wù)是否產(chǎn)生違約有影響。
表6 年收入在總樣本和違約樣本中的分布
從表中可見,個人年收入統(tǒng)計段的分期業(yè)務(wù)接納度和違約人數(shù)占比集中度大體一致。
表7 職級在總樣本和違約樣本中的分布
科級/部門經(jīng)理 18.00% 19.08%縣處級/總經(jīng)理 8.52% 9.16%局級/董事 7.02% 7.63%
從表中可見,個人職務(wù)統(tǒng)計段的分期業(yè)務(wù)接納度和違約人數(shù)占比集中度大體一致。
表8 住房情況在總樣本和違約樣本中的分布
從表中可見,個人住房情況統(tǒng)計段的分期業(yè)務(wù)接納度和違約人數(shù)占比集中度大體一致。
比較于傳統(tǒng)的多元回歸分析,Logistics回歸分析不需要數(shù)據(jù)滿足正態(tài)分布的假設(shè),這是其由于普通多元回歸分析的最主要的特點,而且Logistics回歸在擬合度和預(yù)測精度上,往往優(yōu)于普通多元回歸分析。
同理,本文引入Logistics回歸分析,將因變量定為是否違約,而自變量主要由造成違約的幾種因素組成。
1.性別。本文中用sex代表性別變量,取0代表男性,1代表女性。
2.工作年限。本文用workyear代表工作年限變量,取值為各個統(tǒng)計段的中位數(shù)。
3.信用卡額度。本文用limit代表信用卡額度變量(以萬元為單位),取值為各個統(tǒng)計段的中位數(shù)。
4.年齡。本文用age代表年齡變量,取值為各個統(tǒng)計段的中位數(shù)。
5.婚姻狀況。本文用marry代表婚姻變量,取0代表已婚,1代表未婚及其他。
6.年收入。本文用income代表年收入變量(以萬元為單位),取值為各個統(tǒng)計段的中位數(shù)。
7.職級。本文用class代表職級變量,取值0-4分別代表無固定職業(yè)、科員/職員級、科級/部門經(jīng)理、縣處級/總經(jīng)理、局級/董事。
8.住房情況。本文用house代表住房情況變量,取值0代表自有住房,1代表租房及貸款買房。
我們用default代表違約這個因變量,則可以通過Logit變換建立logistics回歸分析如下:
通過計量學數(shù)據(jù)軟件EViews將搜集的數(shù)據(jù)進行處理,結(jié)果如下表:
變量指標 系數(shù) 標準誤 顯著性Sex -0.381617 0.194568 0.0498 Workyear -0.067624 0.29361 0.0213 Limit -0.476347 0.061401 0.0000
Age -0.191911 0.34021 0.0000 Marry 1.180618 0.240143 0.0000 Income 0.180611 0.023917 0.0000 Class 1.053083 0.182052 0.0000 House 0.830914 0.338914 0.0142 C(β0)1.725246 1.046204
從表中可見,各項變量的顯著性Prob均小于0.05,因此可以認為各項變量對違約的影響都是顯著的。
1.性別。通過計算結(jié)果可見,性別對違約概率影響為負相關(guān),即隨著性別變量取值增大,違約概率減少,也就是男性違約概率更大,女性對風險厭惡程度更高。
2.工作年限。通過計算結(jié)果可見,工作年限對違約概率影響為負相關(guān),即隨著工作年限變量取值增大,違約概率減少??梢?,隨著工作年限增加,人們資本積累更豐厚,風險意識更強,考慮更加周全,違約概率降低。
3.信用卡額度。通過計算結(jié)果可見,信用卡額度對違約概率影響為負相關(guān),即信用卡額度越高的客戶,越不容易出現(xiàn)違約行為。其原因可能是,能信用卡額度是跟客戶用卡頻率、刷卡金額和工作收入相關(guān)的,額度越高的客戶工作收入越高,刷卡金額越高,用卡時間越長,已經(jīng)養(yǎng)成了良好的信用習慣,并且珍惜已經(jīng)擁有的額度,所以違約概率比較低。
4.年齡。同樣,年齡與違約概率影響為負相關(guān),即年齡越大的客戶,違約概率越低。年齡大的客戶工作時間長,有一定的儲蓄,并且有一定的人脈,也更懂得信用在生活和工作中的重要性,所以他們在出現(xiàn)資金短缺的時候,更傾向選擇別的方式來解決融資問題,而不是去消耗自己的未來信用。
5.婚姻狀況?;橐鰻顩r與違約概率呈正相關(guān),即已婚客戶更不容易出現(xiàn)違約行為。原因可能是已婚客戶家庭收入來源比較穩(wěn)定,即使一方收入出現(xiàn)問題,另一方的收入仍能夠保證生活的正常進行。而未婚或者離異的客戶,因為自己還款能力完全取決于自己的收入和積蓄,所以一旦此類客戶經(jīng)濟出現(xiàn)問題,備選的解決方案較少,更容易出現(xiàn)違約。
6.收入。結(jié)果顯示,收入與違約概率呈正向相關(guān),即收入越高,違約概率越高。這個結(jié)果與平新喬等實證發(fā)現(xiàn)相一致5。原因可能是,隨著收入的增加,客戶對自己的還款能力出現(xiàn)預(yù)判偏差,從而消費超過自己還款能力的物品,導致違約。
7.職位。職位與違約概率呈現(xiàn)正相關(guān),也就是說,職位越高的人,違約概率越大。表面上看,職位越高的人收入越高,償還能力越高,所以違約概率越低。但是數(shù)據(jù)結(jié)果顯示,職位越高的人,違約概率越大。通過表7,我們可以看出,職位高的違約概率相對高于總樣本的比例。筆者認為,職位高的人群中,更多的是公司董事或者總經(jīng)理,他們收入相對較高,但是資金需求也相對高,他們在公司出現(xiàn)資金問題的時候,更多的是通過信用卡分期這種融資成本較低的方式,來解決問題,所以職位越高的人,違約概率越大。
8.住房情況。通過結(jié)果發(fā)現(xiàn),貸款買房的客戶違約概率比較低。原因可能為,雖然貸款買房的客戶需要償還貸款,每月的經(jīng)濟壓力較大,但是信用卡違約會對其房貸產(chǎn)生不良影響,導致后期房貸利率無形升高。所以此類客戶更愿意保持良好的信用記錄。
本文通過量化信用卡表上填寫項,利用大數(shù)據(jù)分析這些因素與違約概率之間的關(guān)系。通過Logistics回歸,我們發(fā)現(xiàn)八個自變量都與違約有顯著的關(guān)系。通過這個結(jié)論,有助于后期信用卡發(fā)卡審核階段,對此類客戶準入的風險把控。本文的創(chuàng)新點在于將這些填寫項量化,得出這些項目在違約概率中所占的比重,通過帶入數(shù)據(jù)計算,能夠得出此客戶的違約概率,從而更好地衡量客戶準入標準。
目前本方法可以針對每一個客戶計算出違約概率,商業(yè)銀行可以根據(jù)自己的風控水平,劃定違約概率線,超過此概率的客戶,則不予批準分期業(yè)務(wù)。例如,風控較嚴格的商業(yè)銀行可以將違約線定在1%,按此標準實行一段時期,如果實際違約率仍超標,可繼續(xù)下調(diào)違約概率的數(shù)值,加強風控。如果實際違約概率低于期望風控水平,則可以適當提升違約概率線,從而加大分期業(yè)務(wù)核準量,增加商業(yè)銀行收入。最優(yōu)的違約概率需要商業(yè)銀行結(jié)合自身情況,不斷調(diào)整,最后達到屬于自己的最有選擇。