西南財經(jīng)大學(xué)法學(xué)院 鄧春生
自2007年拍拍貸在上海成立以來,P2P網(wǎng)絡(luò)借貸在我國取得了迅猛發(fā)展。與此同時,P2P平臺在信用風(fēng)險、技術(shù)風(fēng)險、政策風(fēng)險等因素的作用下,給P2P行業(yè)乃至整個金融行業(yè)的健康穩(wěn)定發(fā)展帶來了巨大的壓力。為此,政府部門密集出臺了一系列P2P行業(yè)相關(guān)的監(jiān)管制度,意圖讓P2P行業(yè)的發(fā)展回歸理性和健康。密集的監(jiān)管制度出臺必然會給行業(yè)發(fā)展帶來一些波動,例如2018年全年我國P2P網(wǎng)貸行業(yè)的成交量達(dá)到17948.01億元,相比2017年下降36.01%。
目前,國內(nèi)外眾多學(xué)者對P2P網(wǎng)絡(luò)借貸借款人的信用風(fēng)險度量進(jìn)行了廣泛且深入的研究。針對P2P網(wǎng)絡(luò)借貸借款人信用風(fēng)險度量模型,主要分為以下兩種:(1)統(tǒng)計回歸模型。Lin &Li et al(2016)應(yīng)用二元邏輯斯回歸方法建立了一個綜合的信用風(fēng)險評估模型,以便量化每筆貸款的違約風(fēng)險。Serrano-Cinca &Gutiérrez-Nieto(2016)以預(yù)期盈利能力為著眼點,使用多元回歸建立利潤評分系統(tǒng),進(jìn)而選擇最優(yōu)的借款人。Lee &Lee(2012)首先分析了影響信用風(fēng)險的相關(guān)變量,然后利用多項式邏輯市場份額模型對信用風(fēng)險進(jìn)行評估。(2)機(jī)器學(xué)習(xí)模型。涂艷等(2018)基于拍拍貸的交易數(shù)據(jù),基于機(jī)器學(xué)習(xí)建立的借款人信用風(fēng)險度量模型,其準(zhǔn)確率要高于傳統(tǒng)回歸模型。Xia,Liu &Liu(2017)通過結(jié)合成本敏感學(xué)習(xí)和極端梯度增強(qiáng)方法,提出了一種新的成本敏感提升樹模型,用以提高區(qū)分潛在違約借款人的能力。Ma&Sha et al(2018)針對Lending Club的數(shù)據(jù),應(yīng)用現(xiàn)代機(jī)器學(xué)習(xí)算法LightGBM和XGboost進(jìn)行了信用風(fēng)險度量風(fēng)險。Ma,Zhao &Zhou(2018)針對信息不對稱前提下的P2P平臺貸款決策問題,通過借款人的手機(jī)/電話通訊數(shù)據(jù),利用自適應(yīng)增強(qiáng)算法(AdaBoost)建立了違約風(fēng)險預(yù)測模型。Kim &Cho(2019)針對Lending Club中的無標(biāo)簽數(shù)據(jù),結(jié)合Dempster-Shafer理論和轉(zhuǎn)導(dǎo)支持向量機(jī)(TSVM)方法對違約風(fēng)險進(jìn)行了準(zhǔn)確預(yù)測。Wang &Jiang et al(2017) 針對發(fā)生率分量,應(yīng)用隨機(jī)森林來預(yù)測是否違約;針對延時風(fēng)量,應(yīng)用隨機(jī)生存林來預(yù)測何時違約。Malekipirbazari &Aksakalli(2015)針對Lending Club數(shù)據(jù),提出了一種基于隨機(jī)森林的分類方法用于預(yù)測借款人的信用風(fēng)險狀 態(tài)。
眾多的學(xué)者已經(jīng)利用各式各樣的方法對P2P網(wǎng)絡(luò)借貸的風(fēng)險進(jìn)行了度量分析。但是,沒有免費的午餐定理指出,不存在某一個方法或模型在所有性能上都是最優(yōu)的。在眾多的信用評分模型中,不可能存在某一個模型在所有信用風(fēng)險相關(guān)數(shù)據(jù)集上都適用,那么對決策者來說就存在最優(yōu)決策問題。因此,如何選穩(wěn)健的評價和選擇魯棒的分類方法就是一個非常重要的問題。為此,本文針對Prosper和拍拍貸兩個數(shù)據(jù)集,應(yīng)用了11種分類算法進(jìn)行對比研究,以期得到對P2P網(wǎng)絡(luò)借貸信用風(fēng)險度量問題最合適的方法類型,也為以后開發(fā)綜合性能更優(yōu)以及對P2P網(wǎng)貸行業(yè)符合度更高的度量方法奠定研究基礎(chǔ)。
信用風(fēng)險的評分模式主要是一些分類方法。分類,是有監(jiān)督學(xué)習(xí)中的一種,以待分析的目標(biāo)問題為背景,采用一部分樣本數(shù)據(jù)建立一個關(guān)于類別屬性劃分的分類方法,并利用該方法對同類問題中類別標(biāo)記未知的樣本進(jìn)行學(xué)習(xí)和判斷的過程?,F(xiàn)在,讓我們對一些主流的分類算法進(jìn)行簡單介紹。
決策樹類算法是一種逼近離散函數(shù)值的典型分類方法。決策樹算法通過構(gòu)造決策樹來發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)涵的分類規(guī)則。(1)C4.5算法:由于C4.5算法生成的決策樹能夠被用于分類,所以C4.5模型通常被用于統(tǒng)計分類。2011年,Witten &Frank (2011)將C4.5模型描述為“一個具有里程碑意義的決策樹算法,可能是迄今為止在實踐中最廣泛使用的機(jī)器學(xué)習(xí)方法”。(2)CART算法:CART(Classif cation and regression trees)算法是一種十分有效的非參數(shù)分類和回歸方法。CART選擇具有最小GINI系數(shù)值的屬性作為分裂屬性,并按照節(jié)點的分裂屬性,采用二元遞歸分割的方式把每個內(nèi)部節(jié)點分割成兩個子節(jié)點,遞歸形成一棵結(jié)構(gòu)簡潔的二叉樹。
(1)RBF(徑向基)神經(jīng)網(wǎng)絡(luò)模型:RBF神經(jīng)網(wǎng)絡(luò)是使用徑向基函數(shù)作為激活函數(shù)的人工神經(jīng)網(wǎng)絡(luò),其中徑向基函數(shù)表示其取值僅僅依賴于離原點距離,即滿足特性的函數(shù)。RBF神經(jīng)網(wǎng)絡(luò)通常由三層組成:第一,輸入層;第二,具有非線性RBF激活函數(shù)的隱藏層;第三,線性輸出層。(2)MLP(多層感知)神經(jīng)絡(luò)模型:MLP是一類的前饋人工神經(jīng)網(wǎng)絡(luò),可用于通過回歸分析創(chuàng)建數(shù)學(xué)模型。由于分類是響應(yīng)變量是分類時回歸的特定情況,因此MLP也是良好的分類器算法。(3)SVM(支持向量機(jī))算法:SVM(support vector machines)是一種二分類模型,它的目的是尋找一個超平面來對樣本進(jìn)行分割,分割的原則是間隔最大化,最終轉(zhuǎn)化為一個凸二次規(guī)劃問題來求解。
(1)NBC(樸素貝葉斯分類)算法:NBC(Native Bayes Classif er)是一種簡單但是非常強(qiáng)大的線性分類器,而且它所需估計的參數(shù)很少,對缺失數(shù)據(jù)不太敏感,方法也比較簡單。(2)BN(貝葉斯網(wǎng)絡(luò))算法:BN(Bayesian Network)也叫貝葉斯信念網(wǎng)絡(luò),借助有向環(huán)圖來刻畫屬性之間的依賴關(guān)系,并使用條件概率表來描述屬性的聯(lián)合概率分布。(3) NBT(樸素貝葉斯決策樹)算法:該算法主要有兩個優(yōu)點:第一,算法過程非常清晰、直觀、可理解性很強(qiáng);第二,在計算復(fù)雜度不高的前提下能保持較高的分類正確率,有利于在大型數(shù)據(jù)集中的利用。
K鄰近分類算法的基本思想是:輸入沒有標(biāo)簽(標(biāo)注數(shù)據(jù)的類別),即沒有經(jīng)過分類的新數(shù)據(jù);首先,提取新數(shù)據(jù)的特征并與測試集中的每一個數(shù)據(jù)特征進(jìn)行比較;其次,從測試集中提取K個最鄰近(最相似)的數(shù)據(jù)特征標(biāo)簽,統(tǒng)計這K個最鄰近數(shù)據(jù)中出現(xiàn)次數(shù)最多的分類,將其作為新的數(shù)據(jù)類別;類似于生活中的“物以類聚,人以群分”。
(1)CBA(基于關(guān)聯(lián)規(guī)則的分類)算法:CBA(Classification base of A ssociation)算法,即基于關(guān)聯(lián)規(guī)則進(jìn)行分類的算法,利用了Apriori挖掘出的關(guān)聯(lián)規(guī)則,然后做分類判斷。在某種程度上說,CBA算法也可以說是一種集成挖掘算法。(2)CPAR(基于預(yù)測關(guān)聯(lián)規(guī)則的分類)算法:CPAR(Classification Based on Predictive Association Rules)模型整合了關(guān)聯(lián)規(guī)則分類算法和傳統(tǒng)的基于規(guī)則分類算法的優(yōu)點。CPAR算法為避免過度擬合,采用貪心算法生成規(guī)則,這一策略比產(chǎn)生所有候選項集的效率要高。
信用風(fēng)險度量模型的評價實質(zhì)上就是對分類模型的評價。為方便說明,引入如下混淆矩陣(confusion matrix),如表1所示。
考慮到對分類方法評估的科學(xué)性、全面性和客觀性,我們選用了八個經(jīng)典的評價指標(biāo),定義如下。
(1)正確率(ACC):正確率是指測試集中被正確分類的百分率,是最廣泛使用的分類評估指標(biāo)之一,即:
通常來說,ACC越高,分類器越好。
(2)真正率(TPR):指被正確劃分的預(yù)測正樣本數(shù)的百分率,即:
TPR也稱為靈敏度指標(biāo),用于衡量分類器對正樣本的識別能力。
(3)真負(fù)率(TNR):指被正確劃分的預(yù)測負(fù)樣本數(shù)的百分率,即:
表1 混淆矩陣示意圖
表2 針對Prosper數(shù)據(jù)集的信用風(fēng)險度量模型的評價結(jié)果
TNR也稱為特異性指標(biāo),用于衡量分類器對負(fù)樣本的識別能力。
(4)精度(Presision):指預(yù)測正樣本中實際為正樣本的百分率,是精確性的度量,即:
(5)F 1-measure(MFM,平均F測量)值:一個綜合評價指標(biāo),指當(dāng)精度與真正率矛盾時,對精度與真正率的綜合考慮,即:
(6)AUC(Area under curve):是機(jī)器學(xué)習(xí)常用的二分類評測手段,直接含義是ROC曲線下的面積。曲線下面積越大,分類器就越好。
(7)平均絕對誤差(MAE):指分類器的預(yù)測值和實際值之間的偏離程度,即:
式中,ture(i)和predicted(i)分別表示第i個樣本的真實值和預(yù)測值。
(8)Kappa 統(tǒng)計指標(biāo)(KapS):一種用于衡量分類精度的統(tǒng)計指標(biāo),其計算基于混淆矩陣,即:
針對Prosp er數(shù)據(jù)集和拍拍貸數(shù)據(jù)集的11個信用評分模型在8個評價指標(biāo)下的評價結(jié)果分別列在表2和3中。注意,粗體數(shù)字表示在某一指標(biāo)下最優(yōu)的評價值。
觀察表2和表3,我們有如下結(jié)論:(1)在不同的評價指標(biāo)下,不同的信用評分模型有不同的評價值,且沒有一種信用評分模型在所有的評價指標(biāo)下都是最優(yōu)的。主要原因是:不同的評價指標(biāo),其評價側(cè)重點也不一樣。另外,信用風(fēng)險的度量主要是一個典型的分類學(xué)習(xí)問題,那么不同的分類模型其學(xué)習(xí)的側(cè)重點也不一樣,所以不可能存在某一分類模型在所有評價指標(biāo)上都是最優(yōu)的。
(2)針對Prosper數(shù)據(jù)集,以SVM方法構(gòu)建的信用風(fēng)險度量模型在ACC、MFM、MAE和KapS這四個指標(biāo)下是最優(yōu)的。針對拍拍貸數(shù)據(jù)集,SVM方法在ACC、Precision、MFM、MAE和KapS這5個指標(biāo)下表現(xiàn)最優(yōu)。由此可見,SVM方法具有很強(qiáng)的穩(wěn)健性。
為了全面、綜合的評價這位11個信用風(fēng)險度量模型,我們引入排序均值的概念,并以排序均值的大小來對這11個模型綜合排序。表4展示了Prosper數(shù)據(jù)集和拍拍貸數(shù)據(jù)集上的排序均值和綜合排序。
從表4中可以得出:(1)性能優(yōu)越的信用風(fēng)險度量模型主要是SVM方法、CBA方法和CPAR方法。(2)信用風(fēng)險度量模型性能次優(yōu)的模型主要是CART方法、MLP方法、NBT方法和KNN方法。(3)信用評分性能出現(xiàn)較大差異的方法是RBF網(wǎng)絡(luò),該方法的波動較大;在Prosper數(shù)據(jù)集中,RBF網(wǎng)絡(luò)在指標(biāo)TPR下表現(xiàn)為最優(yōu),但是其綜合排序卻是第10名。
表3 針對拍拍貸數(shù)據(jù)集的信用評分模型的評價結(jié)果
(1)不同的信用度量模型在同一個數(shù)據(jù)集中有不同的表現(xiàn),同一個信用度量模型在不同的數(shù)據(jù)集中性能表現(xiàn)也不盡相同。為了讓同一個信用度量模型對不同的數(shù)據(jù)集都能有一致的評級性能,需要讓數(shù)據(jù)集足夠的大,讓信用度量模型有充足的訓(xùn)練數(shù)據(jù)來學(xué)習(xí)出最優(yōu)的參數(shù)。為此,我們應(yīng)建立P2P網(wǎng)絡(luò)借貸行業(yè)統(tǒng)一的個人/企業(yè)信用信息共享系統(tǒng),以便建立P2P網(wǎng)絡(luò)借貸行業(yè)統(tǒng)一的信用信息數(shù)據(jù)集,為建立客觀有效的信用度量模型奠定數(shù)據(jù)基礎(chǔ),克服單一平臺進(jìn)行信用評級存在的數(shù)據(jù)不全、評價不準(zhǔn)等問題。
表4 信用風(fēng)險度量模型綜合評價
(2)根據(jù)我們的綜合評估來說,針對所選擇的數(shù)據(jù)集,在穩(wěn)健性和魯棒性上表現(xiàn)最優(yōu)的三個信用度量模型分別是SVM方法、CBA方法和CPAR方法。另外,依據(jù)CART方法、MLP方法、NBT方法和KNN方法構(gòu)建的信用評分模型也有不俗的表現(xiàn)。最后,出現(xiàn)波動比較大的方法是RBF網(wǎng)絡(luò)方法。針對該結(jié)論,我們應(yīng)建立P2P網(wǎng)絡(luò)借貸行業(yè)統(tǒng)一的個人/企業(yè)信用評級系統(tǒng),克服不同的平臺使用不同的度量模型,對同一個借款人得出不同信用等級的問題。