張穎+黃潔婷+賀正楚
摘要:針對P2P網貸平臺現金流較大、利潤率較低和財務數據獲取困難的特點,構建基于平臺交易真實數據的危機預警評價指標體系和組合預測模型。將傳統的財務評價指標轉換成網貸平臺交易數據指標,運用鄰域粗糙集屬性約簡的方法對采集的數據指標進行降噪和約減處理,再基于機器學習理論引入神經網絡、支持向量機和Logit回歸等模型對數據進行訓練。通過分組進行單模型和組合模擬預測,提高了新的破產指標下各模型預測的準確率。
關鍵詞: P2P網貸;危機預警;組合模型;神經網絡;支持向量機
中圖分類號:F832;F424文獻標識碼:A文章編號:10037217(2017)06002306
一、導論
P2P網貸平臺作為一個新興的個人對個人的投資借貸平臺正處在一個快速成長階段,現有監(jiān)管大多為事后監(jiān)管,對于事前預測特別是基于網貸平臺外部數據的科學預測理論和應用準備不足\[1\]。網貸平臺具有擠兌風險,貸款逾期發(fā)生時,P2P網貸平臺會出現暫時的流動性不足,一旦放款人之間協調失敗就會導致平臺出現擠兌風險[2,3]。P2P網貸平臺陷入經營困境的整個過程是動態(tài)發(fā)生的,若能在P2P平臺陷入經營困境早期就發(fā)現征兆,并能預測生存狀況惡化的一系列動態(tài)過程,這對于平臺的經營者、投資者和行業(yè)監(jiān)管者,都將有著非凡的意義。
現有文獻當中,潘莊晨等梳理債權產品和產權產品的信用風險評價模型,認為互聯網金融企業(yè)更加適合偏重定價功能的產權產品風險評價模型\[4\];周少甫對2 193家網貸平臺使用Logit模型進行研究,認為網貸平臺能夠提供良好的資金保障、具備健全的資金托管制度和流動性較高的債權轉讓方式,可有效降低平臺出現重大經營問題\[5\]。常用的風險預警模型主要有多元判別分析、Logistic回歸模型、神經網絡、FR模型、STV截面回歸模型和KLR信號分析模型等。由于Logistic回歸模型對變量的分布、變量之間的協方差沒有過多的假設要求,因此被廣泛用在信用風險預警,且國外的許多研究都表明Logistic回歸模型比較有效\[6,7\]。龐素林等利用Logistic回歸模型構建風險預警模型,并以實證研究證明模型的高效性\[8-10\]。
現有文獻對P2P平臺經營困境的預警研究較少,具有一定的研究價值。本文主要研究通過使用最新的前沿信息技術,構建科學的評價體系和危機預警模型,識別問題網貸平臺,預測P2P網貸平臺的危機風險。
二、P2P網貸平臺危機預警指標選擇與約簡
本文針對P2P網貸平臺的特點,提出基于真實交易數據的評價思路,以交易數據代替財務數據保證數據真實性。一方面,從理論基礎、國內外文獻及國內主管部門監(jiān)管指導意見選擇能反映P2P網貸平臺運營和風險的相關指標;另一方面,根據P2P網貸平臺所具有的互聯網大數據特性,通過業(yè)內門戶網站、網貸之家、網貸天眼收集。同時,將數據指標進行科學處理,并對結果進行檢驗,從而盡可能的保證風險評價指標的科學性、可信性。力求用最少的可觀測指標,盡量多的反映平臺運營風險信息。
(一)危機預警原始評價指標選擇
本文將能夠觀測到的P2P網貸平臺微觀指標納入評價范圍,盡量確保評價指標的完整性。使用的各項指標數據來源于P2P網貸平臺第三方統計
網站,所有數據都能夠做到逐月更新,其中大多數數據能夠做到逐日更新,保證了經過建模處理過的風險值能夠每月(每日)連續(xù)輸出。在數據采集過程中,抓取的信息包括:平臺每日成交量、平均利率、投資人數、平均貸款期限、借款人數、累計待還金額等指標作為破產預測的客觀抓取指標,如表1所示。
(二)單個預測及組合模型預測
1.Logit回歸預測。
根據上文的模型介紹,應用IBM SPSS Statistics V21.0中的二元Logistic回歸預測進行分析,將80個選定的模擬樣本錄入SPSS工作表格中,10個指標屬性值為協變量,問題情況(即前文提及的決策屬性,問題取值為1,正常取值為0)作為因變量。用EXCEL編輯函數來計算概率P,并最終計算得出Logit模型預測結果的準確率,如表5所示。
由表5可以看出,經過測試樣本的檢驗,所建立的Logit回歸模型總體預測準確率僅為56.98%,這個水平屬于偏低的預測正確率,這個正確率還有很大的水平可以提高,因此,此Logit模型不是一個理想的預測模型。
2.神經網絡預測。
運用SPSS 軟件中的BP神經網絡的多層感知器預測方法來實現P2P平臺問題與否的預測工作。選用樣本的原則與上文一致,即選擇80個樣本為模擬樣本,86個樣本為測試樣本,共166個樣本。模型訓練完成后,生成的神經網絡模型對測試樣本數據測試后與實際比較的結果正確率如表6所示。
從H表中可以看出對于P2P實際出現問題的正確率為73.2%,而P2P實際運行正常的正確率為64.4%,綜合正確率為68.6%,預測結果較Logit回歸預測準確率高,但仍然有很大的提高空間。
3.支持向量機預測。
已有研究表明,高斯核函數支持向量機模型的預測準確率最高,而核函數的選擇是構建支持向量機模型的關鍵[14],因此高斯核函數被本文采用。通過對數據結果的比較,當高斯核函數的閾值δ2=0.7時,支持向量機程序的準確率最高。利用libsvm工具箱在MATLAB2014a中運行得出檢測樣本的實際預測結果如表7所示。
由表7可以看出,經過測試樣本的檢驗,支持向量機總體預測準確率為68.6%,介于Logit回歸分析預測的準確率和BP神經網絡預測的準確率之間,同樣不是很理想。
(三)基于貝葉斯算法的投票式組合預測
通過上面的分析,根據上述三種模型的預測結果,結合上文中的方法,應用EXCEL得到基于貝葉斯算法的投票式組合endprint
由表8可知,基于貝葉斯算法的投票式組合預測中只有13個預測錯誤,其中 P2P問題平臺只有5個預測錯誤,而且問題平臺與正常平臺的預測之間并沒有顯示出明顯的差異。
上文所述的三種預測模型各有其優(yōu)缺點,其預測結果準確率也有較大差異,Logit模型預測為傳統統計模型,而神經網絡和支持向量機應用人工智能和機器學習等新興的學習方法進行預測分析,對比各模型準確率,如表9所示。
由表9可以看出,傳統統計模型Logit模型的預測準確率最低,其次為支持向量機預測方法,而預測準確率最高的為BP神經網絡,從這一結果可以看出人工智能領域預測方法的優(yōu)勢之處,傳統的統計模型因其多個弊端無法準確預測數據的正確率。而結合三種預測方法的投票式組合預測方法在本文的應用過程中發(fā)揮其優(yōu)勢,綜合了三種預測模型的利弊,得出相對較好的準確率,且穩(wěn)定性良好。
五、結論
本文針對當前P2P網貸平臺內部財務信息不透明的現狀及政府、投資者對網貸平臺風險評估預測的現實需要之間的矛盾,創(chuàng)新性地提出基于網貸平臺公開交易數據的危機預警新方法,通過運用數據采集、去噪技術,結合支持向量機、神經網絡等機器學習方法進行數據訓練,得到了較好的預測結果。通過研究,得到以下結論:
1.構建了基于網貸平臺公開交易數據的危機預警指標體系。論文在直接抓取的數據中選取平臺每日成交量、平均利率、投資人數、平均貸款期限、借款人數、累計待還金額等指標作為危機預警的指標,通過領域粗糙集進行指標約簡后得到相應指標體系;
2.結合機器學習技術,對選擇的P2P網貸平臺變量和數據進行約簡、建模、預測。本文選取了三個準確率較高的模型:Logit回歸,神經網絡和支持向量機模型。采用分別建立相應的模型,并將采集的數據在預處理后分別代入各單一個模型,以檢測各模型的效果,最后將三個模型的實際輸出結果作為輸入,結合貝葉斯算法構建投票式組合預測模型,使各模型之間可以相互補充,提高預測的精度和穩(wěn)定性。
3.對166家主流P2P網貸平臺進行實證研究。通過跟蹤采集“網貸之家”等P2P監(jiān)測網站交易數據組成模擬樣本進行模擬和測試,驗證本文提出的P2P網貸平臺危機預警新方法的準確性。從預測結果來看,采用本文提出的P2P網貸平臺危機預警新指標體系,結合組合式預測模型,能得到較好的預測效果。
參考文獻:
[1]肖萍.互聯網金融與中小企業(yè)融資困境的化解途徑\[J\].河南師范大學學報(哲學社會科學版),2015(4):77-80.
\[2\]蔣玉.互聯網金融的特殊風險和法律規(guī)制\[J\].廣西財經學院學報,2015(4):41-46.
\[3\]朱寶.普惠金融體系下互聯網金融風險溢出效應研究\[J\].廣西財經學院學報,2017(1):78-85.
\[4\]潘莊晨,邢博,范小云.信用風險評價模型綜述及對我國P2P網絡借貸平臺的借鑒\[J\].現代管理科學,2015(1):33-36.
\[5\]周少甫,李逸翔,裴逸杰.P2P網貸平臺資信因素對正常經營影響的實證分析\[J\].武漢金融,2016(1):34-36.
\[6\]Vijayakumar P, Naresh R,Deborah L J,et al.An efficient group key agreement protocol for secure P2P communication\[J\].Security and Communication Networks,2016(9):3952-3965.
\[7\]Khan U,SchmidtThieme L,Nanopoulos A.Collaborative SVM classification in scalefree peertopeer networks\[J\].Expert Systems with Applications,2017(1):74-86.
\[8\]龐素琳.Logistic回歸模型在信用風險分析中的應用\[J\].數學的實踐與認識,2006,36(9):129-137.
\[9\]盧永艷.基于面板數據的上市公司財務困境預測\[D\].大連:東北財經大學,2012.
\[10\]陳曉蘭,任萍.基于Logistic混合模型的企業(yè)信用風險評價研究\[J\].山東財政學院學報,2011(2):90-93.
\[11\]王錦虹.互聯網金融對商業(yè)銀行盈利影響測度研究——基于測度指標體系的構建與分析\[J\].財經理論與實踐,2015,36(1):7-12.
\[12\]Rogers Chris,Clarke Chris. Mainstreamingsocialfinance:the regulation of the peertopeer lending marketplace in the United Kingdom\[J\].British Journal of Poliltics & International Relations,2016(18):930-945.
\[13\]Pokorna Martina, Sponer Miroslav. Social lending and its risks\[J\].19th International Conference Enterprise and Competitive Environment,2016(20):330-337.
\[14\]Khan U,SchmidtThieme L,Nanopoulos A. Collaborative SVM classification in scalefree peertopeer networks\[J\].Expert Systems with Applications,2017(1):74-86.
\[15\]王效俐,劉瀟,蘇強.鄰域粗糙集融合貝葉斯神經網絡在醫(yī)療決策中的應用研究\[J\].工業(yè)工程與管理,2016(5):141-147.
(責任編輯:鐘瑤)
Abstract: Based on the characteristics of assetlight, large cash flow, low profit and difficulty in financial data acquisition, evaluation index system and the combination prediction model for crisis prediction based on the real data of platform transaction were constructed. The traditional bankruptcy financial evaluation index was transformed into the net loan transaction data index and the collected data was reduced by the method of neighborhood rough set. On this basis, the data was trained with the machine learning theory which introduced neural network and support vector, logit regression machine model and so on. Finally, the data was divided into single group and combination group for predictive simulation and the accuracy of each model under the new bankruptcy index was obtained.
Key words:P2P; crisis prediction; combination prediction model; neural network; SVMendprint