Joseph Milana PhD
如果沒(méi)有信用風(fēng)險(xiǎn)建模的話我們就沒(méi)有辦法做借貸了。我們看美國(guó)過(guò)去的十五年借貸情況,最大的一塊就是抵押貸款。另外,信用卡的份額已經(jīng)達(dá)到了一萬(wàn)億美金,這是有史以來(lái)的第一次。
信用風(fēng)險(xiǎn)已經(jīng)回到了2009年大蕭條之前的水平,尤其是在美國(guó)發(fā)生的大蕭條。那個(gè)時(shí)候的逾期貸款比例非常高,當(dāng)然我們并沒(méi)有風(fēng)險(xiǎn)建模,那個(gè)時(shí)候有很多風(fēng)險(xiǎn)評(píng)估原則都被大家放棄了,因此當(dāng)時(shí)有大量的不良貸款產(chǎn)生,這就是我們說(shuō)的逆向選擇,這里面有一些固有原因。關(guān)于金融架構(gòu)有很多書(shū),比如說(shuō)《大空頭》,講了大蕭條背后的很多原因,幸運(yùn)的是我們之后有了好的風(fēng)險(xiǎn)評(píng)估機(jī)制,不良貸款又回到了可以被管理的水平。
FICO信用風(fēng)險(xiǎn)建模簡(jiǎn)史
講到美國(guó)的信用風(fēng)險(xiǎn)以及其他國(guó)家的信用風(fēng)險(xiǎn),我們要介紹一下FICO公司的歷史。FICO在1956年的時(shí)候創(chuàng)立的時(shí)候只是一個(gè)咨詢公司,那個(gè)時(shí)候?qū)iT做運(yùn)營(yíng)研究,創(chuàng)始人之前在SRI工作。在1958年,F(xiàn)ICO發(fā)明了信用評(píng)分。在七十年代,美國(guó)國(guó)會(huì)推出了公平信用評(píng)分法案,法規(guī)要求進(jìn)行貸款評(píng)估的時(shí)候必須確保信息是準(zhǔn)確的,還有另外一個(gè)特點(diǎn)就是如果做出拒絕的決策,這個(gè)決策必須是可被解釋的。1974年的時(shí)候推出了平等信用機(jī)會(huì)法案,必須要公平,給予信貸的時(shí)候必須要根據(jù)能力評(píng)估,不能根據(jù)性別或者說(shuō)種族來(lái)評(píng)估。FICO在1975年的時(shí)候開(kāi)發(fā)了第一個(gè)系統(tǒng)來(lái)預(yù)測(cè)現(xiàn)有客戶的信用風(fēng)險(xiǎn)?;谒麄儸F(xiàn)在的行為,比如說(shuō)使用信用卡的行為習(xí)慣,對(duì)人的信用風(fēng)險(xiǎn)做出評(píng)估。1987年FICO公司上市。他們想創(chuàng)建一種商業(yè)解決方案,利用神經(jīng)網(wǎng)絡(luò)或者說(shuō)大腦的工作機(jī)制來(lái)幫助解決問(wèn)題。在1989年的時(shí)候FICO推出了自己的FICO信用評(píng)分機(jī)制,一個(gè)通用型的信用評(píng)估機(jī)制的首次亮相?,F(xiàn)在這個(gè)機(jī)制已經(jīng)成為美國(guó)通用的為消費(fèi)者提供貸款的評(píng)分機(jī)制。
再來(lái)說(shuō)說(shuō)跟FICO有密切關(guān)系的HNC。1992年的時(shí)候HNC推出了自己的“獵鷹”軟件,用來(lái)探測(cè)信用卡的違約可能,會(huì)評(píng)估每個(gè)交易,每個(gè)信用卡的行為或者說(shuō)信用卡用戶的行為,然后評(píng)估信用卡是否是被偷的信用卡,或者說(shuō)有問(wèn)題的信用卡。解決方案推廣的很快,很快就在行業(yè)當(dāng)中普遍使用。HNC1995年上市,并在1997年推出“PMAX”軟件,使用交易觸發(fā)機(jī)制來(lái)對(duì)每個(gè)信用卡賬戶進(jìn)行信用評(píng)估。在這之前FICO的解決方案基本上提供了一種月度監(jiān)控機(jī)制,在1997年的解決方案里,在每個(gè)交易點(diǎn)上,每次和客戶接觸的時(shí)候都會(huì)對(duì)客戶進(jìn)行信用風(fēng)險(xiǎn)評(píng)估。2001年,myFico.com網(wǎng)站上線。這是一個(gè)面向消費(fèi)者的網(wǎng)站,讓每個(gè)用戶了解自己的FICO分?jǐn)?shù)是多少,提供了信用分?jǐn)?shù)的透明性,幫助消費(fèi)者很好地管理自己的信用分?jǐn)?shù)。
2002年,F(xiàn)ICO收購(gòu)了HNC。2003年FACTA法案通過(guò),強(qiáng)制讓消費(fèi)者可以了解信用部門提供的信用分?jǐn)?shù),有了更強(qiáng)的信用透明性,讓消費(fèi)者可以看到自己的信用評(píng)分。2009年,F(xiàn)ICO改成了現(xiàn)在的名字。目前,全球有25億信用卡受到了FICO評(píng)級(jí)的保護(hù)。
MyFico可以讓消費(fèi)者很好地了解模型里面講的是什么,輸入的是什么,信用分?jǐn)?shù)是基于什么的,比如說(shuō)基于信用歷史。這里提供一個(gè)個(gè)性化的分?jǐn)?shù),會(huì)考量個(gè)人自己的信用分?jǐn)?shù),讓你有機(jī)會(huì)想一下如何調(diào)整自己的行為,從而提高自己的分?jǐn)?shù),消費(fèi)者就可以更好地評(píng)估風(fēng)險(xiǎn)。
透明性能夠讓消費(fèi)者了解信用提供方是怎么樣做決策的,上面講到的政府法規(guī),極大地影響了使用模型的類型。比如說(shuō)七十年代通過(guò)的法案,不管什么時(shí)候想要做拒絕的決定,必須要做出解釋才行。對(duì)于FCRA法案來(lái)說(shuō),建立了一個(gè)線性模型,可以用自己的算法,通過(guò)這種線性模式解釋為什么做出這樣一個(gè)負(fù)面信用的決策。還有一個(gè)法案叫做ECOA法案,不能使用某些信息,比如說(shuō)剛才說(shuō)的性別、種族以及宗教信息等等。這些因素不能植入到模型里面,這些信息必須全部刨除出去,但是可以使用郵局郵編信息,可以去將其他維度加入模型。這里面不要求做欺詐檢測(cè),可以用一個(gè)非線性的模型,而通過(guò)FCRA必須解釋負(fù)面的批貸決策,這里面涉及到一些非常相關(guān)的因素。還有一些額外的法律要求,比如說(shuō)評(píng)分必須要根據(jù)年齡的變化進(jìn)行變化,也就是說(shuō)信貸申請(qǐng)人隨著年齡的變化必須要及時(shí)更新評(píng)分,這里面我們也提供了一些解決方案,比如保序回歸。
下面很快講一下剛才所說(shuō)的怎么樣解釋這些負(fù)面的評(píng)分決策,或者說(shuō)我們打了不好的分,怎么進(jìn)行解釋。
人們比較關(guān)注模型是怎么樣來(lái)解釋的。FICO剛開(kāi)始設(shè)立了一個(gè)非常清楚的方法,解釋之前說(shuō)的線性模型,里面有輸入的變量,還有相關(guān)的一些概率值。所以必須要把這個(gè)函數(shù)和概率鏈接起來(lái)。你去建模的時(shí)候必須考慮到邏輯回歸跟概率的關(guān)系。為什么一個(gè)人會(huì)得到不太好的分?jǐn)?shù),必須要看在這里面變量是如何產(chǎn)生的,什么樣的變量或者說(shuō)因素會(huì)貢獻(xiàn)負(fù)的變量,或者說(shuō)得分比較低的變量。
首先要去掉這個(gè)尺度,因?yàn)檫@是一個(gè)線性的模型,在這里不太很必要去掉尺度,但是對(duì)于要求解的神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō)還是非常重要的。然后減去平均值,然后重新來(lái)評(píng)估你的評(píng)分。分析哪個(gè)變量給線性模型貢獻(xiàn)的變量是最大的,這里面有可能兩個(gè)變量是有相互關(guān)系的,比如說(shuō)有收入和成本兩個(gè)變量,你就知道你的利潤(rùn)等于收入減成本,如果只看收入或者只看成本的話,評(píng)估結(jié)果可能就是非常不全面的,所以解決方案就是你把所有有意義的可以解釋的變量都放入子集里面,根據(jù)子集的總量對(duì)總模型貢獻(xiàn)來(lái)進(jìn)行排序。要構(gòu)建一個(gè)比較有意義的或者是可解釋的子集。這是一個(gè)關(guān)于線性模式的解釋。
用模型評(píng)估風(fēng)險(xiǎn),無(wú)處不在
對(duì)于前面說(shuō)的非線性的模型,神經(jīng)網(wǎng)絡(luò)怎么做的,方法就和線性模型不太一樣,神經(jīng)網(wǎng)絡(luò)并非依賴于線性的模型,也不是說(shuō)隱藏節(jié)點(diǎn)有很多層,可以是單層的。在這里面輸出模型,必須要決定輸入量是什么,有兩種方法來(lái)決定:第一種就是把每個(gè)子集的變量全部設(shè)置為平均值,如果所有都是平均值的話,新的量要怎么處理,要把新的變量和平均值進(jìn)行比較,這樣的子集會(huì)對(duì)總分產(chǎn)生一個(gè)非常大的變化,可以根據(jù)總分變化來(lái)排名,這是我們今天用得比較多的模型;或者也可以用單獨(dú)的模型,每次可以一次刪除一個(gè)子集,之后構(gòu)建一個(gè)單獨(dú)的模型,然后再根據(jù)單獨(dú)的模型進(jìn)行評(píng)分,然后再來(lái)看在子集里面,哪個(gè)變量會(huì)產(chǎn)生最大的對(duì)于模型變化量的最大的貢獻(xiàn),然后對(duì)此進(jìn)行分析。
我們之前講了信用風(fēng)險(xiǎn),除此之外還有其他領(lǐng)域的風(fēng)險(xiǎn)應(yīng)用,最早是在保險(xiǎn)方面用得最多。在七八十年代分析客戶風(fēng)險(xiǎn),你可以知道保險(xiǎn)公司在這里面有非常多的應(yīng)用,有一個(gè)人寫了一本書(shū)《醉漢走路如何影響我們的生活》非常好地描述了風(fēng)險(xiǎn)應(yīng)用。再比如說(shuō)電信網(wǎng)絡(luò)方面,怎么樣減少風(fēng)險(xiǎn)、評(píng)估風(fēng)險(xiǎn),電信網(wǎng)絡(luò)會(huì)不會(huì)有一些故障等等,根據(jù)一些標(biāo)簽很少的數(shù)據(jù)集,我們用無(wú)監(jiān)督的學(xué)習(xí)方法來(lái)評(píng)估里面的風(fēng)險(xiǎn),所以說(shuō)在這里面必須要構(gòu)建一個(gè)比較好的模型。我們現(xiàn)在也用人工智能去解決,比如說(shuō)網(wǎng)絡(luò)安全等等方面的問(wèn)題,比如說(shuō)黑客攻擊等等,必須要做一些滲透測(cè)試以及怎么從網(wǎng)絡(luò)當(dāng)中提取信息,這些都是我們做風(fēng)險(xiǎn)建模的時(shí)候可以做非常多貢獻(xiàn)的地方。技術(shù)問(wèn)題非常有意思,有的時(shí)候數(shù)據(jù)沒(méi)有做標(biāo)簽,你不知道網(wǎng)絡(luò)是否被入侵了,我們要做平衡,有標(biāo)簽和無(wú)標(biāo)簽,有監(jiān)督和無(wú)監(jiān)督必須要有一個(gè)平衡。我們一直講深度學(xué)習(xí),有一個(gè)朋友領(lǐng)導(dǎo)了一個(gè)團(tuán)隊(duì),他們?cè)谏缃幻襟w上很有名,他們的很多視頻、音頻或者說(shuō)圖像,有的時(shí)候一些內(nèi)容不太健康,黃色內(nèi)容或者說(shuō)暴力內(nèi)容,他們的挑戰(zhàn)在于說(shuō)要用人工智能來(lái)識(shí)別這些視頻,一旦視頻上線的話,這會(huì)影響到他們的聲望,因此他們用深度學(xué)習(xí)機(jī)制來(lái)識(shí)別這些視頻圖像。他們建立了這樣一個(gè)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)里面都是不健康的上傳內(nèi)容,利用數(shù)據(jù)庫(kù)來(lái)對(duì)人工智能進(jìn)行訓(xùn)練。
* 作者系美國(guó)費(fèi)埃哲(FICO)原首席科學(xué)家;大數(shù)據(jù)進(jìn)行風(fēng)險(xiǎn)決策領(lǐng)域的世界級(jí)領(lǐng)軍人物。擁有超過(guò)20年的分析,模型,數(shù)據(jù)挖掘,機(jī)器學(xué)習(xí)的經(jīng)驗(yàn)。早年作為核心建模成員,開(kāi)發(fā)了美國(guó)費(fèi)埃哲(FICO)的Falcon反欺詐系統(tǒng)(目前在北美市場(chǎng)有接近100%占有率)。擁有美國(guó)費(fèi)埃哲12年履職經(jīng)歷,曾歷任研發(fā)中心高級(jí)副總裁(領(lǐng)導(dǎo)了年銷量超過(guò)1億美元的反欺詐類產(chǎn)品線的研發(fā)和產(chǎn)品化);首席科學(xué)家(領(lǐng)導(dǎo)費(fèi)埃哲研發(fā)部,推動(dòng)新興領(lǐng)域基于數(shù)據(jù)模型進(jìn)行決策管理的創(chuàng)新,建立了費(fèi)埃哲的核心知識(shí)產(chǎn)權(quán)庫(kù))等核心職位。并在信用風(fēng)險(xiǎn),反欺詐,營(yíng)銷,數(shù)據(jù)傳輸?shù)阮I(lǐng)域擁有超過(guò)20項(xiàng)核心技術(shù)專利。Milana擁有康奈爾大學(xué)(Cornell University)的本科,以及紐約州立大學(xué)石溪分校(Stony Brook University)的博士學(xué)位。
● 本文由智慧金融研究院、拍拍貸授權(quán);原題方向?yàn)椤帮L(fēng)險(xiǎn)信用模型的歷史和展望”,為最大程度保障文本精華、原意,以及閱讀需要,本刊僅做題目及內(nèi)容分層進(jìn)行編輯。