[摘 要] 申請(qǐng)?jiān)u分模型是為了評(píng)估申請(qǐng)者是否有能力如期償還貸款的模型,是信用評(píng)分模型的一大分支,應(yīng)用于信用卡征信審核階段。本文從產(chǎn)生原因入手,詳細(xì)分析了申請(qǐng)?jiān)u分中的一類特殊問題——拒絕推斷,并采用實(shí)證分析的方式說明了擴(kuò)張法是解決拒絕推斷問題較好的方法。
[關(guān)鍵詞] 信用卡 申請(qǐng)?jiān)u分 拒絕推斷 擴(kuò)張法 Logistic回歸
一、拒絕推斷問題的研究背景
申請(qǐng)信用評(píng)分是為了評(píng)估申請(qǐng)者的信用狀況,是否有能力如期償還貸款的模型。它應(yīng)用于信用卡征信審核階段,通過申請(qǐng)人填寫的個(gè)人信息及征信局信息,可有效、快速地辨別和劃分客戶質(zhì)量,根據(jù)評(píng)估結(jié)果決定對(duì)于哪些人授信,授信多少。相對(duì)于行為評(píng)分的事中信用風(fēng)險(xiǎn)控制和催收評(píng)分的事后信用風(fēng)險(xiǎn)控制,申請(qǐng)?jiān)u分為銀行信用卡業(yè)務(wù)提供事前信用風(fēng)險(xiǎn)控制。所以模型的目標(biāo)是預(yù)測(cè)申請(qǐng)者違約的概率,通過與閾值的比較,確定是否應(yīng)該批準(zhǔn)其申請(qǐng)。
但是實(shí)際上在建模過程中,我們使用的僅僅是部分申請(qǐng)者的記錄——已經(jīng)被批準(zhǔn)的申請(qǐng)者作為樣本開發(fā)模型,因?yàn)槲覀兡軌蛴^察到這部分客戶的后續(xù)行為。但是我們無法獲取那些被拒絕的申請(qǐng)者的未來行為,也就無法準(zhǔn)確判斷他們究竟是好客戶還是壞客戶。對(duì)比而言,模型的應(yīng)用對(duì)象將是包括拒絕和批準(zhǔn)的全部客戶。這就導(dǎo)致了使用部分?jǐn)?shù)據(jù),但是為估計(jì)總體而建立的信用評(píng)分模型存在參數(shù)估計(jì)的偏誤,相關(guān)的研究也表明了這一點(diǎn)。
拒絕推斷(Reject Inference),即對(duì)于建模總體中被拒絕的客戶樣本如何處理,是建立申請(qǐng)?jiān)u分模型時(shí)特有的問題。如果我們能夠順利運(yùn)用某些方法成功地推斷出被拒絕的客戶的信用表現(xiàn)(即是好客戶還是壞客戶),那么我們就得到一個(gè)較完整的建??傮w和建模樣本。
二、拒絕推斷的方法
拒絕推斷并不能解決所有樣本偏差的問題。在經(jīng)常改變授信政策的情況下,總會(huì)發(fā)生樣本偏差的問題,只有通過積累數(shù)據(jù)來調(diào)整模型。在一致的授信政策下,如果模型總是被應(yīng)用在固定的政策拒絕之后,開發(fā)模型的樣本與使用模型的樣本是一致的,這時(shí)無需進(jìn)行拒絕推斷;或者在高批核率或低壞賬率時(shí),被拒客戶可以認(rèn)定為壞客戶,并且由于其樣本量小,可忽略其對(duì)樣本偏差的影響,無需考慮拒絕推斷。在征信局?jǐn)?shù)據(jù)完備的情況下,可以利用征信局?jǐn)?shù)據(jù)或者通過其他途徑補(bǔ)充被拒絕客戶表現(xiàn)數(shù)據(jù),如購(gòu)買其他銀行數(shù)據(jù),也可以不考慮拒絕推斷。
如果以上情形均不滿足,模型開發(fā)中必須要考慮拒絕推斷問題。
1.接受部分壞客戶
解決樣本選擇偏差的最直接有效的方法就是隨機(jī)抽取未被授信的客戶,對(duì)其進(jìn)行授信,觀察未來表現(xiàn)。對(duì)于這部分客戶加以一定的權(quán)重與那些原本被授信的客戶合起來作為模型開發(fā)的樣本。
但是這種方法在現(xiàn)實(shí)中很難被銀行的風(fēng)險(xiǎn)管理部門所接受,因?yàn)槲幢皇谛诺目蛻粢话惚徽J(rèn)為存在拖欠行為的可能性較大,對(duì)這部分客戶進(jìn)行授信,風(fēng)險(xiǎn)也往往較高,易帶來?yè)p失。
2.擴(kuò)張法
擴(kuò)張法(Augmentation)又稱加權(quán)法(Re-Weighting),假設(shè)被拒絕的申請(qǐng)者行為模式與被授信的申請(qǐng)者行為模式相似,其基本思想是加權(quán)被授信的申請(qǐng)者,使得被授信的申請(qǐng)者能夠代表被拒絕的申請(qǐng)者的行為。
該方法分為兩個(gè)階段。第一階段,建立一個(gè)拒絕/批準(zhǔn)模型,然后假設(shè)相近拒絕/批準(zhǔn)概率的客戶具有近似的風(fēng)險(xiǎn)特征, 因此考慮將拒絕/批準(zhǔn)概率分成若干段,每段的好壞賬戶能代表該段內(nèi)的被拒客戶的特征,因此利用這些好壞賬戶可以推測(cè)被拒帳戶中的好壞。第二階段,建立有權(quán)重修正因子的違約預(yù)測(cè)模型。
具體操作如下:
對(duì)所有樣本賬戶先構(gòu)建一個(gè)粗略的拒絕/批準(zhǔn)模型,其中批準(zhǔn)賬戶包括“好賬戶”、“壞賬戶”,據(jù)此得到對(duì)所有賬戶的預(yù)測(cè)的拒絕概率。該拒絕/接受模型僅用于加權(quán)調(diào)整,采用的變量可以放寬。
將預(yù)測(cè)的拒絕概率分成0—0.1, 0.1—0.2,……,0.9—1.0共10段,計(jì)算每段的好壞賬戶、拒絕賬戶的個(gè)數(shù),計(jì)算每段的權(quán)重修正因子:(好賬戶數(shù)+壞賬戶數(shù)+被拒賬戶數(shù))/(好賬戶數(shù)+壞賬戶數(shù))。
將每段的帳戶的原有權(quán)重和該段的權(quán)重修正因子相乘,得到新的權(quán)重變量,這個(gè)新的權(quán)重變量用于模型擬合與調(diào)整。
在這里我們采用國(guó)內(nèi)某商業(yè)銀行信用卡申請(qǐng)數(shù)據(jù)對(duì)于擴(kuò)張法進(jìn)行實(shí)證檢驗(yàn)。模型的目標(biāo)為:預(yù)測(cè)新申請(qǐng)賬戶在未來15個(gè)月內(nèi)變成壞帳的可能性。 目標(biāo)變量定義為:好帳戶——表現(xiàn)期最壞狀態(tài)<=M1;壞帳戶——表現(xiàn)期最壞狀態(tài)為M3+。
刪除某些缺失嚴(yán)重的記錄,以及將某些缺失變量用合適的值進(jìn)行彌補(bǔ)后,共計(jì)150345條申請(qǐng)記錄。這其中包括109005條有15個(gè)月表現(xiàn)期的批準(zhǔn)賬戶信息及41340條拒絕賬戶信息。
在模型構(gòu)建的過程中,為了檢驗(yàn)?zāi)P驮跇颖就獾男Ч?,需要將模型開發(fā)數(shù)據(jù)集按照6:4隨機(jī)分成兩部分:開發(fā)集與測(cè)試集。
下面進(jìn)行模型的初步擬合——拒絕/批準(zhǔn)模型。
拒絕/批準(zhǔn)模型的目標(biāo)變量定義為是否批準(zhǔn)申請(qǐng)的二元變量,對(duì)開發(fā)集中的所有記錄采用逐步Logistic 回歸方法,根據(jù)回歸的結(jié)果,對(duì)所有開發(fā)集帳戶進(jìn)行評(píng)估,按照評(píng)分值大小排序分成10組,組內(nèi)每個(gè)帳戶的權(quán)重設(shè)為該組所有帳戶數(shù)與組內(nèi)所有被授信申請(qǐng)者數(shù)的比值,獲得加權(quán)權(quán)重表如下:
利用權(quán)重修正因子,對(duì)所有被授信申請(qǐng)者采用有加權(quán)的逐步Logistic 回歸方法,經(jīng)過顯著性檢驗(yàn)、方向性檢驗(yàn)、共線性檢驗(yàn) 、穩(wěn)定性檢驗(yàn)等步驟,獲得最終的評(píng)分模型。
最后對(duì)于使用與未使用拒絕推斷的評(píng)分模型效果進(jìn)行比較,可用下面的拒絕推斷圖來進(jìn)行考察。針對(duì)授信賬戶與(實(shí)線)拒絕賬戶(虛線)分別作圖,其中橫座標(biāo)為拒絕概率分組,縱座標(biāo)有加權(quán)調(diào)整前的評(píng)分PGB和加權(quán)調(diào)整后的評(píng)分PGB(REWGT)。從圖形上可以看出加權(quán)與否,對(duì)評(píng)分的影響。隨著被拒絕概率的增加,采用拒絕推斷的模型違約概率增長(zhǎng)速度高于原始模型,尤其是對(duì)于拒絕賬戶這一效果更為明顯。這說明了對(duì)于可能被拒絕的這部分客戶,拒絕推斷能夠得到一個(gè)較高的違約概率,模型的預(yù)測(cè)能力明顯高于不采用拒絕推斷。
三、結(jié)論
隨著我國(guó)信用卡業(yè)的高速發(fā)展,如何有效地對(duì)申請(qǐng)客戶進(jìn)行信用評(píng)分,防范信用不良客戶申辦信用卡,在發(fā)卡環(huán)節(jié)增強(qiáng)銀行預(yù)防和抵抗風(fēng)險(xiǎn)的能力,提高發(fā)卡質(zhì)量,是所有銀行迫切需要解決的問題。作為信用評(píng)分的一類,申請(qǐng)?jiān)u分具有其特殊性。與成熟市場(chǎng)相比,目前國(guó)內(nèi)的征信局?jǐn)?shù)據(jù)嚴(yán)重缺乏,利用征信局?jǐn)?shù)據(jù)進(jìn)行拒絕推斷的核實(shí)方法受到限制。采用接受部分壞客戶的方式會(huì)給銀行帶來潛在的損失,成本高,在操作上存在難度。而擴(kuò)張法的應(yīng)用基于統(tǒng)計(jì)假設(shè),實(shí)踐也證明了其修正樣本選擇偏差的效果,可以有效地提高申請(qǐng)?jiān)u分模型的預(yù)測(cè)能力。
參考文獻(xiàn):
[1]Banasik, J. B., Crook, J. N., Thomas, L. C., 2001. Sample selection bias in credit scoring models, Working Paper 01/5, Credit Research Centre, University of Edinburgh
[2]Crook, J N and Banasik, J L, (forthcoming). Does reject inference really improve the performance of application scoring models, Journal of Banking and Finance