劉暢 徐卓婷
[摘 要]P2P網(wǎng)絡(luò)信貸作為一種信貸業(yè)務(wù),但其風(fēng)險管理能力遠低于傳統(tǒng)商業(yè)銀行,所面臨的最大風(fēng)險就是信用風(fēng)險。本文則對P2P網(wǎng)貸風(fēng)險產(chǎn)生的原因進行分析,并且用全球最大P2P公司Lending Club的貸款數(shù)據(jù)建立風(fēng)險預(yù)測模型并給出了預(yù)測精度,以期為國內(nèi)P2P公司提供可借鑒的信用風(fēng)險管理方法。
[關(guān)鍵詞] P2P;網(wǎng)絡(luò)貸款;信用;風(fēng)險
[中圖分類號]F832.4 [文獻標識碼]A
1 引言
中國的金融改革正值互聯(lián)網(wǎng)金融潮流興起,在傳統(tǒng)金融部門和互聯(lián)網(wǎng)金融的推動下,中國的金融效率、交易結(jié)構(gòu)將發(fā)生深刻變革。P2P因其較高的收益成為廣大投資者的新型理財工具,是對現(xiàn)有銀行體系的巨大補充,提高了整個社會的資金使用效率,同時滿足借款人的資金需求。
P2P作為金融行業(yè)的重要組成部分,控制其信用風(fēng)險對金融行業(yè)乃至整個國民經(jīng)濟發(fā)展具有重要意義。而目前大多數(shù)P2P網(wǎng)絡(luò)平臺尚未建立自己的信用風(fēng)險評估模型。于是本文將利用Logistic回歸模型以Lending Club平臺數(shù)據(jù)為例對P2P網(wǎng)貸風(fēng)險做出分析與預(yù)測。
2 文獻綜述
白金瑞(2012)提出,將神經(jīng)網(wǎng)絡(luò)和Logistic回歸相結(jié)合,在P2P信貸領(lǐng)域有著較好的應(yīng)用效果。袁羽(2014)基于個人財務(wù)指標,利用Logistic模型對Prosper信貸平臺進行了建模分析,證明了該方法具有較顯著的準確性。張晴(2014)利用了支持向量機模型對銀行的個人信貸數(shù)據(jù)進行了分析,為P2P項目風(fēng)險審核及建??刂铺峁┝藚⒖?。傅彥銘等(2015)研究發(fā)現(xiàn),支持向量機這類的非線性模型在信用預(yù)測中存在著實際的可能。在他的研究中,利用主成分分析來篩選變量,取得了85.7%準確率的預(yù)測效果。蔣云彬(2015)主要在信用違約方面做了研究,利用logistic信用模型在計算中小企業(yè)違約概率和VAR風(fēng)險模型在控制抵押物風(fēng)險方面取得了良好的效果。
3 理論
3.1 主成分分析法
主成分分析是一種對原始指標變量進行降維的處理方法,它通過將具有一定相關(guān)性的原始變量進行重新組合,得到包含數(shù)量較少且相互之間不存在相關(guān)性的綜合性指標。而這些新得到的綜合指標不僅含有原始變量的大部分信息,能夠較好地代表原始變量,而且它們之間不相關(guān)的特點有利于對經(jīng)濟內(nèi)涵釋義,使所研究的問題簡單化。
3.2 Logistic回歸模型
Logistic回歸模型是一種非線性概率回歸模型,該模型在使用時不要求數(shù)據(jù)變量服從正態(tài)分布或變量之間具有同方差,也不限制變量的類型。它是主要用于對分類變量進行回歸分析,在各領(lǐng)域具體的實際應(yīng)用中,以多元二分類因變量Logistic回歸模型使用最為廣泛。
4 P2P信用風(fēng)險預(yù)測實證分析
P2P行業(yè)自身發(fā)展不夠成熟,借款人信用風(fēng)險產(chǎn)生的原因是多種多樣的。目前,幾個主流平臺還在采用線性預(yù)測模型來對借款人未來違約與否進行預(yù)測。國內(nèi)外學(xué)者已經(jīng)發(fā)現(xiàn),信貸這類的信用數(shù)據(jù)普遍具有非線性的特點,因此,利用非線性模型來進行違約預(yù)測具有重要的現(xiàn)實意義。本節(jié)將以Lending Club平臺網(wǎng)站為數(shù)據(jù)來源,建立邏輯回歸模型并給出預(yù)測精度,得出借款人信用風(fēng)險評估方法,為平臺預(yù)測借款人違約概率提供借鑒。
4.1 數(shù)據(jù)采集與處理
本文選取的是Lending Club2012年到2016年這五年最新的貸款數(shù)據(jù)。其中去除掉當前貸款狀態(tài)loan-status字段中為Current目前還在還款狀態(tài)的項目,篩選出已經(jīng)結(jié)束貸款的項目共517607條記錄,每個記錄即為一個貸款項目,數(shù)據(jù)集每條記錄以用戶ID和貸款I(lǐng)D 作為標識,共有87個變量。
由于樣本數(shù)據(jù)豐富,我們需要對數(shù)據(jù)繼續(xù)進行處理,其中有56565條記錄變量數(shù)據(jù)嚴重缺失,采取刪除的處理辦法。最后剩余461042條記錄構(gòu)成最終的研究數(shù)據(jù)。
4.2 變量篩選
針對高維變量的數(shù)據(jù),我們需要進行變量篩選,通過觀察數(shù)據(jù),可以首先刪除一些空白變量、無效變量(指每條記錄該變量數(shù)值均相等,無分析意義)、文本類不相關(guān)變量(包括借款記錄頁面網(wǎng)址、借款人自己填寫的貸款標題、借款人名字、自我描述等),最后得到一個含有32個變量的數(shù)據(jù)集。
4.3 主成分分析
在使用主成分分析之前,先對所選取的32個初始變量進行標準化處理。
4.3.1 相關(guān)性檢驗中,KMO檢驗的結(jié)果為0.641>0.6,適合做因子分析,Bartlett球形檢驗的sig.的P值為0.000,表示拒絕原假設(shè),即這些變量之間存在相關(guān)性,適合做因子分析。
4.3.2 提取主成分因子。本文利用主成分分析方法提取主成分因子,在此我們提取特征值大于1的主成分,有16個指標的特征值大于1,分別為:8.064、3.792、2.753、2.355、1.908、1.790、1.606、1.450、1.430、1.202、1.035、1.028、1.015、1.010、1.007、1.006;前16個指標特征值的方差貢獻率分別為:16.415、8.958、6.069、5.342、5.327、4.791、4.710、4.069、3.657、2.840、2.822、2.503、2.477、2.447、2.426、2.409,累計貢獻率為77.261%,即前16個指標涵蓋了原始變量數(shù)據(jù)77.261%的信息量,能夠比較好地解釋原始變量的變異,所以本文提取了16個因子做主成分分析。
4.4 Logistic回歸模型的構(gòu)建
根據(jù)上文得到的主成分因子,將其作為建模的指標變量,在SPSS軟件中進行回歸分析。經(jīng)過軟件處理,最終得到16個因子的參數(shù)估計值分別為:-0.064、-0.195、0.994、5.393、45.032、0.984、1.602、-0.433、-0.223、0.144、0.045、0.920、-0.107、0.275、-0.146、-0.051;顯著性水平均低于0.05,因此,可以得到該模型擬合效果較好。
在模型的檢驗結(jié)果中,該回歸方程對信用風(fēng)險發(fā)生與否判斷的準確度為98.3%。總體來說,本文所建立的信用風(fēng)險預(yù)測模型對違約預(yù)測的準確度比較高。
5 政策建議
P2P網(wǎng)貸平臺作為金融行業(yè)的重要補充,其健康活躍發(fā)展對我國經(jīng)濟發(fā)展有著重要作用。根據(jù)以上的分析,可以給出以下幾點建議來改善P2P行業(yè)的信用風(fēng)險情況:
行業(yè)內(nèi)建立統(tǒng)一的征信系統(tǒng)。P2P平臺之間可以實現(xiàn)信用信息的共享、建立信用黑名單、完善違約風(fēng)險通報制度。每個平臺都有義務(wù)跟其他平臺合作,通力實現(xiàn)信用風(fēng)險的有效控制,而眾多平臺也將是信用信息的受益者。征信系統(tǒng)的完善關(guān)系著投資者的切身利益以及整個P2P行業(yè)的未來。
完善平臺風(fēng)險預(yù)測系統(tǒng)。能夠?qū)`約與否進行較準確的分析是控制平臺風(fēng)險的關(guān)鍵和核心。平臺應(yīng)當善于利用歷史數(shù)據(jù)對預(yù)測模型進行不斷優(yōu)化。把模型分析結(jié)果作為審核時的參考指標,有助于提高平臺貸款審核的準確率,減少平臺違約項目,從而提高平臺利潤率。
完善P2P行業(yè)違約懲處機制。我國P2P行業(yè)不斷出現(xiàn)的跑路、違約事件,不僅是因為平臺本身的運營和風(fēng)險控制系統(tǒng)出了問題,還因為缺乏一個強有力的懲罰機制。由于懲罰機制的缺失,平臺違約行為得不到遏制,進而更加猖獗,這無疑會阻礙P2P行業(yè)的穩(wěn)步健康發(fā)展,建立強有力的違約懲處機制對行業(yè)的發(fā)展具有重要意義。
[參考文獻]
[1] 白金瑞.基于Logistic回歸的神經(jīng)網(wǎng)絡(luò)模型在個人信用評估中的應(yīng)用[D].內(nèi)蒙古大學(xué),2012.
[2] 袁羽.基于Logistic回歸的P2P網(wǎng)絡(luò)貸款信用風(fēng)險度量[D].上海社會科學(xué)院,2014.
[3] 張晴.基于支持向量機的商業(yè)銀行信用風(fēng)險研究[D].浙江大學(xué),2014.
[4] 傅彥銘,臧敦剛,戚名鈺.P2P網(wǎng)絡(luò)貸款信用的風(fēng)險評估[J].統(tǒng)計與決策,2014(21).
[5] 蔣云彬.國內(nèi)P2P平臺融資風(fēng)險分析研究[D].云南大學(xué),2015.