亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于風(fēng)險和剩余價值的在線P2P借貸投資推薦方法

        2016-12-22 04:15:05朱夢瑩鄭小林王朝暉
        計算機(jī)研究與發(fā)展 2016年12期
        關(guān)鍵詞:標(biāo)的

        朱夢瑩 鄭小林 王朝暉

        (浙江大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 杭州 310027)(mengyingzhu@zju.edu.cn)

        ?

        基于風(fēng)險和剩余價值的在線P2P借貸投資推薦方法

        朱夢瑩 鄭小林 王朝暉

        (浙江大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 杭州 310027)(mengyingzhu@zju.edu.cn)

        在線P2P(peer-to-pear)借貸是一種新興的在線個人財富分配和管理系統(tǒng),它允許投資人直接對借款人創(chuàng)建的借款標(biāo)的進(jìn)行競標(biāo)和投資.在P2P借貸平臺中,存在一個重要的問題即如何合理分配投資人的投資金額給合適的借款人.針對該問題,提出了一種基于風(fēng)險和剩余價值最大化的投資推薦框架RTSM(risk total surplus maximize).RTSM首先對借款標(biāo)的進(jìn)行風(fēng)險評估,然后基于經(jīng)濟(jì)學(xué)中的剩余價值理論,使用投資人和借款人在有風(fēng)險情況下的剩余價值假設(shè),將風(fēng)險評估與投資推薦結(jié)合在一起,為投資人推薦高收益低風(fēng)險的投資決策.實驗在風(fēng)險評估和投資推薦2個階段對美國和中國知名的P2P借貸平臺(Prosper、拍拍貸)的真實數(shù)據(jù)進(jìn)行分析和驗證.從實驗結(jié)果可以看出:RTSM可以更好地降低風(fēng)險和提高投資人與借款人的整體利益.

        在線P2P借貸;風(fēng)險評估;最大化剩余價值;推薦系統(tǒng);投資推薦P2P(peer-to-pear)借貸是指無擔(dān)保借款,借貸雙方通過沒有金融機(jī)構(gòu)中介的網(wǎng)絡(luò)平臺進(jìn)行競標(biāo)和借貸行為[1].P2P借貸作為互聯(lián)網(wǎng)技術(shù)在金融領(lǐng)域的新應(yīng)用[2-3],能有效地促進(jìn)信息發(fā)布和搜索,并提供必要的功能來完成交易[4].

        2005年第1個借貸平臺Zopa成立于歐洲(英國),2006年2月美國第1個借貸平臺(Prosper.com)成立.2005年以來,在線P2P借貸在許多國家,包括美國、加拿大、英國、日本、意大利和中國,以不同的形式經(jīng)歷了快速增長時期.最成功的在線P2P平臺是英國的Zopa(Zopa.com)、美國的Prosper(Prosper.com)、Kiva(Kiva.org)、Lending Club(lendingclub.com).例如Prosper在2009年成功完成1.7億美元的借款.到2016年7月為止,總部設(shè)在舊金山的非盈利組織Kiva通過其平臺獲得的借款總額已經(jīng)達(dá)到8.82億美元*http://www.kiva.org/about..

        盡管起步較晚,在線P2P借貸在中國也有相當(dāng)大的發(fā)展,產(chǎn)生了拍拍貸(PPDai.com)、宜人貸(yirendai.com)、人人貸(We.com)等具有一定影響力的平臺.國內(nèi)最大的P2P借貸平臺拍拍貸成立于2007年,在一年半的時間里就積累了超過8萬名用戶,使得這種金融投資新式迅速在國內(nèi)發(fā)展.而宜人貸作為中國第1家在美國納斯達(dá)克上市的P2P平臺,成為中國互聯(lián)網(wǎng)金融在海外上市的首家公司.截止2015年年底,中國一共擁有3 858家P2P借貸平臺*http://shuju.wdzj.com/industry-list.html..

        P2P借貸在蓬勃發(fā)展的同時,也相應(yīng)地產(chǎn)生了許多問題,例如借貸資金的安全仍會存在隱患,借款人的信息可信度如何保證,一筆借款產(chǎn)生后缺乏行之有效的對于還款的監(jiān)管手段等.這其中,如何評估P2P借貸過程中借貸風(fēng)險,建立一個安全有效的P2P借貸投資推薦體系也是急需解決的問題之一.

        P2P借貸平臺中,一部分平臺直接連接借款人和投資人,而其他平臺則通過第三方機(jī)構(gòu)(通常是銀行或其他支付機(jī)構(gòu))連接,如圖1所示:

        Fig. 1 The framework of P2P lending platform.圖1 P2P借貸平臺架構(gòu)圖

        作為借款人和投資人的信息發(fā)布媒介,P2P借貸平臺可以篩選出優(yōu)質(zhì)的借款標(biāo)的,為投資人推薦高收益低風(fēng)險的投資決策.可是,現(xiàn)如今P2P借貸平臺往往只對借款標(biāo)的進(jìn)行簡單的排序,推薦給投資人較高收益的借款標(biāo)的.

        盡管現(xiàn)在的P2P借貸平臺都表明自己擁有專業(yè)的風(fēng)險評估團(tuán)隊,可以對所有借款標(biāo)的進(jìn)行風(fēng)險評估,但由于P2P借貸的風(fēng)險評估環(huán)節(jié)不如銀行嚴(yán)謹(jǐn),違約風(fēng)險成了P2P借貸系統(tǒng)中最嚴(yán)重的問題.

        如圖2所示,我們分析了拍拍貸和Prosper兩個平臺上借款標(biāo)的期望投資收益和違約風(fēng)險的關(guān)系.從圖2中可以看出,違約風(fēng)險隨著期望投資收益的增加而增加,所以,僅僅考慮投資收益進(jìn)行投資推薦是不夠的.

        Fig. 2 The framework of P2P lending platform.圖2 收益與違約風(fēng)險關(guān)系

        本文將基于經(jīng)濟(jì)學(xué)中的剩余價值理論,結(jié)合風(fēng)險評估與投資推薦解決P2P借貸過程中投資人的投資金額分配問題,為投資人推薦高收益低風(fēng)險的投資決策.

        1 風(fēng)險評估和投資推薦相關(guān)工作

        1.1 P2P借貸中的風(fēng)險評估

        近年來,有2類工作大量出現(xiàn)在關(guān)于P2P借貸的風(fēng)險研究中,分別是P2P借貸風(fēng)險的關(guān)鍵因素研究和P2P借貸的風(fēng)險評估方法研究.

        研究者們致力于研究P2P平臺中影響違約風(fēng)險的共有的因素.在P2P借貸的環(huán)境下,投資人很難對借款人獲得全面的信息,導(dǎo)致信息不對稱的問題十分嚴(yán)重[5].在P2P借貸中,借款人的個人信息和借款標(biāo)的信息被認(rèn)為是評估借款人是否違約的重要信號,可以用來評估借款人的違約風(fēng)險和設(shè)置投資利率[6-7].通過分析從Prosper收集的數(shù)據(jù),Lin[7]發(fā)現(xiàn)信用評級較低的借款請求不太可能被資助,并且這樣的借款請求更有可能違約或以很高的利率結(jié)束.Emekter等人[8]則分析了另一家美國知名P2P平臺Lending Club,得出擁有更高的FICO分?jǐn)?shù)和高收入的借款人在該平臺違約率更低,平臺需要想辦法去吸引這樣的借款人.在中國,Chen等人[9]表明,對拍拍貸平臺的數(shù)據(jù)分析,信用分?jǐn)?shù)對獲得借款的概率產(chǎn)生了部分影響,但利率是決定因素.然而,違約率較高的借款人信用水平要低得多.小額信貸理論表明,社交網(wǎng)絡(luò)可以幫助減少借款過程中的信息不對稱,并且可以激勵借款人償還借款[10].Freedman和Jin[11]發(fā)現(xiàn)有借款推薦人或是bid是由借款人的朋友提交的,很少會拖欠還款,并且有更高的回報率.他們的結(jié)論是,借款人的朋友能更好地識別風(fēng)險和擁有可信賴性,因為他們擁有更多的額外信息,而且他們認(rèn)為社交網(wǎng)絡(luò)的監(jiān)控為還款提供了更強(qiáng)大的動力.

        另一類工作則是致力于降低信息不對稱情況下的借貸違約風(fēng)險.研究表明,機(jī)器學(xué)習(xí)算法和大數(shù)據(jù)分析可以很好地應(yīng)用在不同的商業(yè)應(yīng)用中.Bahrammirazee[12]通過對比3種人工智能技術(shù):人工神經(jīng)網(wǎng)絡(luò)、專家系統(tǒng)、混合智能系統(tǒng)和傳統(tǒng)方法在金融問題上的表現(xiàn),得出人工智能技術(shù)比傳統(tǒng)方法表現(xiàn)更好.Zhao等人[13]利用了Logiest Regression預(yù)測出借款標(biāo)的的違約風(fēng)險,并將風(fēng)險利用在個性化推薦中.Baesens等人[14]使用神經(jīng)網(wǎng)絡(luò)技術(shù)分析了3個信用違約的數(shù)據(jù)集,構(gòu)建了智能且可解釋的風(fēng)險評估系統(tǒng).Byanjankar等人[15]也使用了神經(jīng)網(wǎng)絡(luò)方法預(yù)測P2P借貸中的風(fēng)險,并且認(rèn)為基于信用分?jǐn)?shù)的神經(jīng)網(wǎng)絡(luò)在篩選違約標(biāo)的時有非常有效的表現(xiàn).李斌等人[16]使用了屬性歸納和聚類方法對業(yè)務(wù)過程中的風(fēng)險因素進(jìn)行分析,并且采用Markov模型構(gòu)建可傳導(dǎo)的風(fēng)險評估模型.

        然而,這些研究工作大部分都只是致力于研究違約風(fēng)險,卻很少有將違約風(fēng)險應(yīng)用到其他應(yīng)用場景或數(shù)據(jù)分析中,例如Zhao等人[13]利用違約風(fēng)險完成投資組合的個性化推薦以及利用對貸款loan的多視角風(fēng)險分析結(jié)果制訂投資組合策略[17].

        1.2 投資推薦

        推薦系統(tǒng)根據(jù)用戶的興趣特點和購買行為,向用戶推薦用戶偏愛的信息和商品.推薦系統(tǒng)一般包括基于內(nèi)容的推薦系統(tǒng)[18]和協(xié)同過濾[19].基于內(nèi)容的推薦主要通過對用戶交互的目標(biāo)項目信息進(jìn)行挖掘,為用戶推薦相似度較高的目標(biāo)項目;協(xié)同過濾方法則是基于相似用戶對目標(biāo)項目的歷史交互行為來估計當(dāng)前用戶對目標(biāo)項目的喜好程度,這種交互行為可以是點擊、瀏覽、購買、評分.傳統(tǒng)的推薦系統(tǒng)的改進(jìn)是針對用戶進(jìn)行個性化的物品推薦,并且追求推薦準(zhǔn)確度的提高.但是,在P2P借貸或者其他的金融領(lǐng)域,高準(zhǔn)確度并不像在其他傳統(tǒng)推薦領(lǐng)域那樣重要,例如電子商務(wù)領(lǐng)域[20]、廣告領(lǐng)域[21]、電影傳媒領(lǐng)域[22].

        在P2P借貸中,我們希望投資人可以投資高收益的借款標(biāo)的,而低違約風(fēng)險的借款人可以獲得借款.在文獻(xiàn)[23]中,作者提出可以引入經(jīng)濟(jì)學(xué)中的剩余價值,平衡生產(chǎn)者和消費者雙方的利益,使得整個市場更有效率.

        同時,我們認(rèn)為風(fēng)險在P2P借貸的推薦中也是非常重要的衡量因素.我們希望能推薦給投資人高收益低風(fēng)險的借款標(biāo)的.在文獻(xiàn)[13]中,作者將P2P借貸的風(fēng)險評估和協(xié)同過濾相結(jié)合,為投資人提供個性化的借款標(biāo)的投資組合推薦.

        2 經(jīng)濟(jì)剩余價值

        在本節(jié)中,我們將介紹一些關(guān)鍵的概念和經(jīng)濟(jì)學(xué)中的定義,這些將會成為第3節(jié)中描述的推薦框架的理論基礎(chǔ).

        2.1 經(jīng)濟(jì)剩余

        經(jīng)濟(jì)剩余是經(jīng)濟(jì)學(xué)中的概念,用來衡量買賣商品或服務(wù)時的市場收益[24].通常,經(jīng)濟(jì)剩余可分為消費者剩余、生產(chǎn)者剩余.

        消費者剩余(consumer surplus)是指購買者的支付意愿減去購買者的實際支付量.消費者剩余衡量了購買者自己感覺到所獲得的額外利益.例如在P2P借貸場景中,我們將借款人發(fā)布的標(biāo)的作為一項產(chǎn)品,消費者指的就是投資人.那么投資人希望無風(fēng)險獲得的收益即他的支付意愿,而借款標(biāo)的實際的借款利息則是他實際支付的量.如果尊重買者的偏好,消費者剩余不失為經(jīng)濟(jì)福利的一種好的衡量標(biāo)準(zhǔn).

        生產(chǎn)者剩余(producer surplus)是指賣者出售一種物品或服務(wù)得到的價格減去賣者的成本.同樣在P2P借貸系統(tǒng)中,生產(chǎn)者是借款人.那么借款標(biāo)的實際借款利息為借款人出售這一服務(wù)的價格,借款人發(fā)布的最大愿意支付的借款利息為借款人出售借款標(biāo)的來緩解經(jīng)濟(jì)負(fù)擔(dān)的成本.生產(chǎn)者剩余衡量生產(chǎn)者參與市場所得到的額外利益.

        總剩余(total surplus)是指消費者剩余和生產(chǎn)者剩余的總和.總剩余可以衡量社會的經(jīng)濟(jì)福利.消費者剩余是買者從參與市場活動中得到的利益,而生產(chǎn)者剩余是賣者得到的利益.因此,常把總剩余作為社會經(jīng)濟(jì)福利的衡量指標(biāo).

        2.2 市場效率與總剩余價值

        在微觀經(jīng)濟(jì)學(xué)理論中,福利經(jīng)濟(jì)學(xué)研究資源配置如何影響經(jīng)濟(jì)福利.福利經(jīng)濟(jì)學(xué)分析市場的買者(消費者)和賣者(生產(chǎn)者)參與市場中得到的利益,并且考慮如何使這種利益盡可能達(dá)到最大.

        假設(shè)存在一個消費者和生產(chǎn)者的分配矩陣Q,則生產(chǎn)者剩余為PS(Q),消費者剩余為CS(Q).那么,我們可以根據(jù)總剩余的定義得到總剩余價值TS:

        TS(Q)=CS(Q)+PS(Q).

        (1)

        那么要使得市場的分配達(dá)到最有效率(efficiency),我們需要使得總剩余最大化,即:

        (2)

        其中,M=[M1,M2,…,Mn],Mj是商品j可以被提供的總數(shù)量,在P2P借貸系統(tǒng)中指借款標(biāo)的j的總借款金額.

        然而,在這樣的市場中還存在一個問題,根據(jù)理性人假設(shè)[25]的描述,要滿足充分有效的市場,每個參與經(jīng)濟(jì)決策的主體必須是充滿理智的,他們的唯一目標(biāo)就是追求自身經(jīng)濟(jì)利益的最大化.例如消費者追求滿足程度最大化,生產(chǎn)者追求利潤最大化.可是,在任何經(jīng)濟(jì)活動中,這樣的完全“合乎理性的人”是不可能存在.尤其是在互聯(lián)網(wǎng)金融的經(jīng)濟(jì)活動中,由于存在類似自動投標(biāo)的機(jī)制,機(jī)器經(jīng)濟(jì)人[26]也參與了這一經(jīng)濟(jì)活動.Zhang等人[23]在他們的文章中引入了概率,認(rèn)為消費者可能以更大概率選擇最佳的分配決策,但他們也可能以一個較小的概率選擇一個非理性的決策,他們定義分配矩陣Q中的每一個Qij是一個滿足一定概率分布的隨機(jī)變量.在這種情況下,最大化總剩余將被定義為

        (3)

        其中,p(Qij)是每一筆金額Qij的概率密度函數(shù),p(Q)=[p(Qij)]m×n,Θ(Q)是所有Qij的參數(shù)集.

        3 基于風(fēng)險與剩余價值的投資推薦

        在本節(jié)中,我們首先介紹了風(fēng)險評估,然后描述了P2P借貸中投資人和借款人的剩余價值,最后提出了基于風(fēng)險與剩余價值的投資推薦框架.

        3.1 風(fēng)險評估

        在這里,我們總結(jié)了3種類型的特征:標(biāo)的特征(features of listing, FOL)、借款者的用戶特征(features of borrower, FOB)、借款者的社交特征(features of social, FOS),具體的特征如表1所示:

        Table 1 The Feature and Properties of PPDai and Prosper

        表1中標(biāo)的特征指標(biāo)的本身財務(wù)特征包括標(biāo)的利率、募集的資金數(shù)量、借款期限、借款類型(房貸、車貸、商業(yè)貸等)、還款方式等.

        借款者的用戶特征分為4個部分:

        1) 借款者的身份證明特征,由于P2P借貸是互聯(lián)網(wǎng)借貸,借款者和投資人并不直接見面,所以一些驗證借款者身份的必要措施被廣泛使用在P2P借貸平臺的流程中,例如身份證驗證、照片驗證、視頻驗證、學(xué)歷證明驗證等,這里我們根據(jù)Prosper和拍拍貸2個平臺的特點,選取了符合它們各自平臺流程的一些身份屬性.在Prosper數(shù)據(jù)集中我們選取了是否有頭像圖片這一屬性;在拍拍貸數(shù)據(jù)集中我們選擇了是否有身份證驗證、視頻驗證、學(xué)歷驗證、婚姻驗證4個屬性.

        2) 借款者的財務(wù)特征,主要用于證明借款者的還款能力,在Prosper中我們選取借款者是否有房屋,借款者的收入負(fù)債比;但拍拍貸中并沒有提供這方面的特征屬性.

        3) 借款者的人口學(xué)特征,在拍拍貸中,我們選取借款者的性別、年齡、學(xué)歷、婚姻狀態(tài)等;但在Prosper中我們并沒有找到相關(guān)的特征.

        4) 借款者的信用特征,在Prosper平臺上,我們選擇使用FICO給出的Credit Grade和平臺自身給用戶的信用分Prosper Score作為該平臺的信用特征;在拍拍貸平臺上,拍拍貸自己建立了信用分?jǐn)?shù)評價體系,我們使用拍拍貸的用戶信用分和信用評級作為該平臺的信用特征.

        借款者的社交特征是P2P借貸平臺特有的一種特征類型.大多數(shù)P2P平臺愿意在P2P借貸服務(wù)以外構(gòu)建線上社區(qū),用戶在社區(qū)中存在“朋友”、“群組”等社交關(guān)系.近幾年,有不少研究者研究了社交關(guān)系對P2P借貸信用體系和風(fēng)險體系的影響.在這其中,我們選擇Prosper的群組和朋友屬性與拍拍貸的朋友屬性作為借款者的社交特征.

        使用歷史借貸數(shù)據(jù),我們可以根據(jù)以上這些特征,估計每個標(biāo)的pj的投資風(fēng)險riskj.在這里我們并不打算提出某一個具體的模型算法,而是選擇提出一種風(fēng)險評估的框架,不同的平臺、不同的標(biāo)的特征都可以選擇不同的模型算法來評估投資風(fēng)險,例如使用邏輯回歸(logistic regression, LR)[13]、GBDT(gradient boosting decision tree)[17]、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)[15].

        3.2 P2P借貸中的剩余價值

        在P2P借貸系統(tǒng)中,我們認(rèn)為借款人是一筆借款請求的生產(chǎn)者,而借款請求被視作是一個金融產(chǎn)品;投資人則作為這個金融產(chǎn)品的消費者,他們購買這一筆借款中的一部分或全部來獲得投資收益.

        在這一問題中,我們主要需要解決的是投資人怎么樣將自己的資金分配到每個金融產(chǎn)品,即每個借款請求中去,使得整個市場達(dá)到最有效率的配置,即滿足最大化總剩余價值.

        3.2.1 投資人剩余價值

        Fig. 3 The borrowing process of P2P lending.圖3 P2P借貸平臺借款流程

        (4)

        3.2.2 借款者剩余價值

        同樣地,在文獻(xiàn)[23]中,借款者剩余價值可以定義為

        (5)

        因此,總剩余價值為

        TSij(Qij)=CSij(Qij)+PSij(Qij)=

        (6)

        3.3 基于風(fēng)險與剩余價值的投資推薦

        在本節(jié)中,我們將風(fēng)險評估的結(jié)果引入P2P借貸的剩余價值中,提出RTSM框架.

        3.3.1 風(fēng)險與投資人剩余價值

        本文在考慮剩余價值時,考慮引入違約風(fēng)險來平衡市場的效率與風(fēng)險.

        在不違約的情況下,即riskj=0的情況下,投資人的剩余價值如式(4)所示;而在違約的情況下,投資人的剩余價值是損失的本金減去無風(fēng)險收益,所以我們認(rèn)為投資人在riskj違約風(fēng)險下的剩余價值為

        (7)

        3.3.2 風(fēng)險與借款者剩余價值

        同理在不違約的情況下,借款者的剩余價值如式(5);但在違約的情況下,我們認(rèn)為借款者愿意支付的收益是0,即他發(fā)布的最大愿意支付的利率是一種為了騙取投資人本金的“欺詐”數(shù)據(jù).在這種情況下,我們認(rèn)為違約風(fēng)險為riskj時,借款者的剩余價值為

        (1-riskj)ratej+riskj)Qij.

        (8)

        因此,在存在違約風(fēng)險的情況下,總剩余價值為

        TSij(Qij)=CSij(Qij)+PSij(Qij)=

        (9)

        3.3.3 基于風(fēng)險和最大化總剩余的推薦算法RTSM

        我們假設(shè)分配矩陣Q滿足高斯分布Qij~N(μij,σij),我們將TSij(Qij)帶入式(3)中,可以得到最大化總剩余價值:

        (10)

        其中,U=[μij]m×n,Σ=[σij]m×n.

        式(10)可以被化簡為

        (11)

        我們的RTSM推薦算法表述如下:

        算法1. RTSM算法.

        輸入: P2P數(shù)據(jù)P(feature,ratemax,rate,M);

        輸出: 投資人推薦金額分配矩陣Q.

        步驟1. P2P借貸數(shù)據(jù)預(yù)處理.對P2P借貸數(shù)據(jù)的特征集進(jìn)行歸一化和標(biāo)準(zhǔn)化處理;

        步驟3. 假設(shè)分配矩陣滿足高斯分布Q~N(μ,σ),計算在總剩余價值最大化時的分配矩陣:

        (12)

        其中,U=[μij]m×n;我們使用linear programming可以得到U的最優(yōu)解;

        步驟4. 我們將推薦金額分配矩陣Q的期望值作為分配矩陣Q中的值,投資人推薦金額分配矩陣的期望值為

        (13)

        4 實驗結(jié)果與分析

        4.1 數(shù)據(jù)集介紹

        4.1.1 Prosper數(shù)據(jù)集

        Prosper數(shù)據(jù)主要分為5種表:Listings,Loans,Bids,Groups,Members.

        1) Listings.借款人創(chuàng)建借款標(biāo)的來募集貸方提供的資金.Listings表中會說明借款人的情況以及募集資金的原因.當(dāng)足夠多的資金被募集,Listing就會變成一筆借貸.

        2) Loans.當(dāng)借款標(biāo)的募集到足夠的資金后,借款標(biāo)的將會轉(zhuǎn)變成Loan.Loans表中說明了借款人的還款情況.

        3) Bids.當(dāng)借款人發(fā)布借款標(biāo)的后,投資人可以對借款標(biāo)的進(jìn)行競標(biāo),所有競標(biāo)的標(biāo)的利率信息和金額信息都存在Bids表中.

        4) Groups.群組是由一些擁有相同興趣或類似好友關(guān)系的用戶組建的.每個群組都有一個組長,管理群組里的人員,介紹給組員一些借款標(biāo)的.群組的分?jǐn)?shù)代表了群組的可信程度.

        5) Members.Members表記錄了在Prosper網(wǎng)站上注冊的用戶信息.用戶可能擁有一個或多個身份,并且可能擁有一個或多個朋友.

        Prosper數(shù)據(jù)集包含了從2005-11—2012-02的所有交易記錄和用戶信息.

        為了分析完成借貸流程的P2P借貸數(shù)據(jù),本文剔除了標(biāo)的狀態(tài)為流標(biāo)的全部數(shù)據(jù)和部分不相關(guān)的特征變量,數(shù)值化了非數(shù)值的特征變量.有關(guān)時間、地理信息、個人描述等特征在本文中被忽略.而信用等級(AA-HR)被轉(zhuǎn)換成數(shù)值(7~0),同樣地,Group Rating(0~5 Stars)、是否擁有房產(chǎn)(No,Yes)被轉(zhuǎn)換成數(shù)值(0,1)、Prosper Rating等特征也被轉(zhuǎn)換成了相應(yīng)的數(shù)值.

        最終,經(jīng)過數(shù)據(jù)預(yù)處理的PROSPER數(shù)據(jù)集的結(jié)構(gòu)如表2描述.表3是Prosper數(shù)據(jù)集的指標(biāo)性數(shù)據(jù).

        Table 2 Prosper Dataset Feature Description

        Table 3 Statistics of the Selected Prosper Dataset

        4.1.2 拍拍貸數(shù)據(jù)集

        拍拍貸數(shù)據(jù)主要分為4張表:List Info,User Info,Bid Info,Friend Info.

        1) List Info.借方創(chuàng)建借款標(biāo)的來募集貸方提供的資金.借款標(biāo)的中會說明借方的情況和募集資金的原因.當(dāng)足夠多的資金被募集,借款標(biāo)的就會變成一筆借貸,進(jìn)入還款程序,在拍拍貸數(shù)據(jù)中還款情況也記入List Info表中.

        2) User Info.記錄在拍拍貸網(wǎng)站上注冊的用戶信息.用戶可能擁有一個或多個身份,并且可能擁有一個或多個朋友.

        3) Bid Info.當(dāng)借款人發(fā)布借款標(biāo)的后,投資人可以對借款標(biāo)的進(jìn)行競標(biāo),所有競標(biāo)的標(biāo)的利率信息和金額信息都存在Bid Info表中.

        4) Friend Info.在拍拍貸網(wǎng)站上用戶可以互加好友,這張表中包含用戶和他的朋友ID、創(chuàng)建時間等.

        拍拍貸數(shù)據(jù)集包含了從2007-06—2011-06的所有交易記錄和用戶信息.

        同樣為了分析P2P借貸數(shù)據(jù)中已經(jīng)完成借款流程的部分,本文剔除了標(biāo)的狀態(tài)為流標(biāo)的全部數(shù)據(jù)和部分不相關(guān)的特征變量,數(shù)值化了非數(shù)值的特征變量.有關(guān)時間、地理信息、個人描述等特征在本文中被忽略.其中,借款類型被我們處理成一個8 b的二元組,其他變量也都被歸一化.

        最終,經(jīng)過預(yù)處理的拍拍貸數(shù)據(jù)集的特征如表4描述,表5是拍拍貸數(shù)據(jù)集上的指標(biāo)性數(shù)據(jù).

        Table 5 Statistics of the Selected PPDai Dataset

        4.2 風(fēng)險評估實驗結(jié)果與分析

        首先,我們將已經(jīng)經(jīng)過數(shù)據(jù)預(yù)處理的數(shù)據(jù)集分為訓(xùn)練樣本和測試樣本,這里訓(xùn)練樣本隨機(jī)取整個數(shù)據(jù)集的80%,而20%為測試樣本.接著我們分別使用了KNN(k-nearest neighbor),DT(Decision Tree),NB (Naive Bayesian),LR,ANN,RF(Random Forests),GBDT等方法對訓(xùn)練樣本進(jìn)行學(xué)習(xí)訓(xùn)練,并對測試樣本進(jìn)行預(yù)測.

        其中,我們將采用AUC值和Accuracy值作為風(fēng)險評估實驗的評價指標(biāo),具體計算方式如式(14)和式(15).

        (14)

        (15)

        其中,M為正類樣本的數(shù)目,N為負(fù)類樣本的數(shù)目.

        當(dāng)我們得到所有模型的最優(yōu)參數(shù)后,我們可以比較每一個模型的預(yù)測表現(xiàn).圖4和圖5顯示了在Prosper數(shù)據(jù)集和拍拍貸數(shù)據(jù)集上各個模型的Accuracy,AUC值.這其中,GBDT算法無論從Accuracy還是AUC來看,在2個數(shù)據(jù)集上都是最優(yōu)的.

        Fig. 4 The prediction performance of assessment Prosper dataset.圖4 在Prosper數(shù)據(jù)集上各模型的預(yù)測表現(xiàn)

        Fig. 5 The prediction performance of assessment on PPDai dataset.圖5 拍拍貸數(shù)據(jù)集上各模型的預(yù)測表現(xiàn)

        DatasetEvaluationProsperPPDaiAccuracy∕%AUCAccuracy∕%AUCNB69.450.7669.640.82KNN71.790.7879.330.83ANN74.890.8379.660.85LR74.960.8380.960.87DT74.830.8383.410.88RF72.160.7985.040.89GBDT75.970.8485.950.92

        如表6所示,對于Prosper數(shù)據(jù)集,GBDT算法是表現(xiàn)最好的.在Accuracy方面,比其他模型算法提升1.3%~9.4%;在AUC方面,比其他算法提高了1.2%~10%.對于拍拍貸數(shù)據(jù)集,GBDT算法同樣是表現(xiàn)最好的,在Accuracy方面,比其他提升了1.1%~23.4%;在AUC方面,GBDT算法比其他算法提高了3.3%~12.2%.

        4.3 投資組合推薦實驗結(jié)果

        我們分別使用了來自中國和美國最知名的P2P借貸平臺拍拍貸和Prosper的2個數(shù)據(jù)集來評價我們的推薦框架的表現(xiàn).

        在這里,我們使用總剩余價值來衡量市場效率.我們選取了真實的金額分配(Actual)作為基準(zhǔn).分別計算了RSTM算法和TSM算法[23]的結(jié)果,并且對它們進(jìn)行了比較和分析.

        (16)

        經(jīng)過計算,Actual,TSM,RTSM的市場表現(xiàn)(總剩余價值)的結(jié)果如表8所示.

        表8的結(jié)果可以看出我們的RTSM框架在Prosper數(shù)據(jù)集中,總剩余價值和每一筆每一單位金額的剩余價值都比實際值提升了28.46%.每一單位金額可以獲得的剩余價值從US$0.043 4提升到US$0.055 8,這表明我們提升了資金的效率.在拍拍貸數(shù)據(jù)集中,總剩余價值和每一筆每一單位金額的剩余價值都比實際值提升了9.44%.每一單位金額可以獲得的剩余價值從CNY0.101 9提升到CNY0.111 6,同樣也提升了資金的效率.而與不帶風(fēng)險評估的TSM框架相比,我們的RTSM顯然可以更好的適應(yīng)有風(fēng)險時的市場,并且?guī)砀咝У氖袌雠渲?

        Table 7 Risk Free Interest Rate in China and US

        Table 8 Results on Total Surplus with RTSM, TSM and Without Framework

        同樣,我們還分析了使用RTSM推薦框架配置資產(chǎn)以后,市場的風(fēng)險的情況.我們計算了在TSM和RTSM框架配置下借款標(biāo)的違約率.在Prosper中,實際違約率為56.7%,TSM的違約率為56.5%,而RTSM的違約率只有45.3%,比實際的違約率降低了11.4%;而在拍拍貸中,實際違約率為32.7%,TSM的違約率為32.5%,而RTSM的違約率只有25.3%,降低了7.4%,說明RTSM有效地降低了市場中的風(fēng)險.

        5 結(jié)束語

        大部分現(xiàn)有的推薦系統(tǒng)想辦法引入新的算法來提升評分矩陣的預(yù)測準(zhǔn)確性,例如RMSE,MAE等,但是很少有論文聚焦在什么才是最好的目標(biāo)矩陣,使得目標(biāo)矩陣更符合市場經(jīng)濟(jì),并且更有可解釋性.

        本文基于風(fēng)險控制和微觀經(jīng)濟(jì)學(xué)原理構(gòu)建了一個新的推薦系統(tǒng)框架.在RTSM框架中,我們充分考慮了P2P借貸市場的特殊性,利用了金融市場最重要的2個特點——風(fēng)險與收益.我們認(rèn)為只是追求不考慮風(fēng)險的情況下,收益最大化還不足以滿足真實的市場經(jīng)濟(jì)的規(guī)則,所以引入了風(fēng)險評估.不同于傳統(tǒng)的風(fēng)險評估使用專家經(jīng)驗和簡單的統(tǒng)計結(jié)論,我們采用機(jī)器學(xué)習(xí)的思想來完成風(fēng)險評估,通過實驗可以看出,GBDT模型可以很好地提高風(fēng)險評估的結(jié)果.在引入風(fēng)險的情況下,我們首次定義了投資人剩余價值和借款人剩余價值,并且基于這一定義得出了總剩余價值.在真實的數(shù)據(jù)集上,我們也驗證了考慮風(fēng)險的情況下,引入風(fēng)險評估對整個市場的有效配置有所提升.

        P2P借貸系統(tǒng)作為近年來興起的全新的投資借貸模式,它存在很多不同于傳統(tǒng)的線下借貸的優(yōu)勢和特點.但由于P2P借貸平臺本身的風(fēng)險控制不夠嚴(yán)謹(jǐn)和投資人獲得的信息不對稱,P2P借貸產(chǎn)生了不少問題和爭議.我們認(rèn)為3個方向值得我們進(jìn)一步研究:

        1) 基于大數(shù)據(jù)分析的P2P借貸金融風(fēng)險控制

        P2P借貸中的風(fēng)險不僅僅單指借款人的違約風(fēng)險,它是一個多層次復(fù)雜的風(fēng)險,包括信用風(fēng)險、平臺風(fēng)險、技術(shù)風(fēng)險等.基于大數(shù)據(jù)分析構(gòu)建符合P2P借貸模式的風(fēng)險控制,將會是提升P2P借貸平臺資產(chǎn)質(zhì)量的重要手段.

        2) 基于行為金融學(xué)的P2P借貸投資推薦

        羊群行為一直是行為金融學(xué)中的重要話題,在信息不對稱的P2P借貸領(lǐng)域,這一現(xiàn)象尤為典型.通過對P2P借貸中信息傳遞與羊群行為的分析,可以構(gòu)建投資推薦模型.這一方向可以對投資人非理性投資做出很好的解釋和修正.

        3) P2P借貸投資組合推薦

        投資組合可以很好地分散投資人的風(fēng)險,經(jīng)常被應(yīng)用在證券資產(chǎn)中.但在有著較高風(fēng)險的P2P借貸投資中,投資組合也許會有助于幫助投資人做出高收益低風(fēng)險的投資推薦.所以,投資組合推薦將會是投資推薦中一個重要的研究方向.

        [1]Bachmann A, Becker A, Buerckner D, et al. Online peer-to-peer lending—A literature review[J]. Journal of Internet Banking & Commerce, 2011, 16(2): 1-18

        [2]Collier B C, Hampshire R. Sending mixed signals: Multilevel reputation effects in peer-to-peer lending markets[C] //Proc of the 2010 ACM Conf on Computer Supported Cooperative Work (CSCW 2010). New York: ACM, 2010: 197-206

        [3]Lin Mingfeng, Prabhala N R, Viswanathan S, et al. Social networks as signaling mechanisms: Evidence from online peer-to-peer lending[R/OL]. Washington: Smith School of Business, University of Mayland, 2009. [2016-08-01]. http://people.stern.nyu.edu/bakos/wise/papers/wise2009-p09_paper.pdf

        [4]Iyer R, Khwaja A I, Luttmer E F P, et al. Screening in new credit markets: Can individual lenders infer borrower creditworthiness in peer-to-peer lending?, 15242[R]. Rochester, NY: SSRN’s eLibrary, 2009

        [5]Lin Mingfeng, Prabhala R, Viswanathan S. Judging borrowers by the company they keep 1: Social networks and adverse selection in online peer-to-peer lending[J]. SSRN Elibrary, 2009, 59(1): 17-35

        [6]Herzenstein M, Andrews R L. The democratization of personal consumer loans? Determinants of success in online peer-to-peer loan auctions[J]. Bulletin of the University of Delaware, 2008, 15(3): 274-281

        [7]Lin Mingfeng. Peer-to-Peer lending: An empirical study[C] //Proc of the AMCIS 2009. Atlanta, GA: AIS, 2009: 17-25

        [8]Emekter R, Tu Yanbin, Jirasakuldech B, et al. Evaluating credit risk and loan performance in online peer-to-peer (P2P) lending[J]. Applied Economics, 2015, 47(1): 54-70

        [9]Chen Dongyu, Hu Huiling, Lou Hao, et al. Herding behavior in online microloan markets: Evidence from China[C/OL] //Proc of the WHICEB 2015 Proceedings. Atlanta, GA: AIS, 2015: 1-14 [2016-08-01]. http://aisel.aisnet.org/whiceb2015/84/

        [10]Krumme K A, Herrero S. Lending behavior and community structure in an online peer-to-peer economic network[C] //Proc of the 4th Int Conf on Computational Science and Engineering. Los Alamitos, CA: IEEE Computer Society, 2009: 613-618

        [11]Freedman S, Jin G Z. The information value of online social networks: Lessons from peer-to-peer lending, 19820[R]. Cambridge, MA: National Bureau of Economic Research, 2014

        [12]Bahrammirzaee A. A comparative survey of artificial intelligence applications in finance: Artificial neural networks, expert system and hybrid intelligent systems[J]. Neural Computing & Applications, 2010, 19(8): 1165-1195

        [13]Zhao Hongke, Wu Le, Liu Qi, et al. Investment recommendation in P2P lending: A portfolio perspective with risk management[C] //Proc of the IEEE Int Conf on Data Mining. Los Alamitos, CA: IEEE Computer Society, 2014: 1109-1114

        [14]Baesens B, Setiono R, Mues C, et al. Using neural network rule extraction and decision tables for credit-risk evaluation[J]. Management Science, 2003, 49(3): 312-329

        [15]Byanjankar A, Heikkila M, Mezei J. Predicting credit risk in peer-to-peer lending: A neural network approach[C] //Proc of 2015 IEEE Symp Series on Computational Intelligence. Los Alamitos, CA: IEEE Computer Society, 2015: 719-725

        [16]Li Bin, Xie Feng, Chen Zhong. A business oriented risk assessment model[J]. Journal of Computer Research and Development, 2011, 48(9): 1634-1642 (in Chinese)(李斌, 謝豐, 陳鐘. 一種面向業(yè)務(wù)的風(fēng)險評估模型[J]. 計算機(jī)研究與發(fā)展, 2011, 48(9): 1634-1642)

        [17]Zhao Hongke, Liu Qi, Wang Guifeng, et al. Portfolio selections in P2P lending: A multi-objective perspective[C] //Proc of the 20th ACM SIGKDD Conf on Knowledge Discovery and Data Mining. New York: ACM, 2016: 2075-2084

        [18]Pazzani M J, Billsus D. Content-Based Recommendation Systems[M]. Berlin: Springer, 2007

        [19]Su Xiaoyuan, Khoshgoftaar T M. A survey of collaborative filtering techniques[J/OL]. Advances in Artificial Intelligence, 2009, 2009(4): 1-19 [2016-08-01]. https://www.hindawi.com/journals/aai/2009/421425

        [20]Musat C C, Faltings B. Personalizing product rankings using collaborative filtering on opinion-derived topic profiles[C] //Proc of the 29th Int Conf on Artificial Intelligence. Menlo Park, CA: AAAI, 2015: 830-836

        [21]Theocharous G, Thomas P S, Ghavamzadeh M. Ad recommendation systems for life-time value optimization[C] //Proc of the 24th Int Conf on World Wide Web. New York: ACM, 2015: 1305-1310

        [22]Wang Ruiqin, Jiang Yunliang, Li Yixiao, et al. A collaborative filtering recommendation algorithm based on multiple social trusts[J]. Journal of Computer Research and Development, 2016, 53(6): 1389-1399 (in Chinese)(王瑞琴, 蔣云良, 李一嘯, 等. 一種基于多元社交信任的協(xié)同過濾推薦算法[J]. 計算機(jī)研究與發(fā)展, 2016, 53(6): 1389-1399)

        [23]Zhang Yongfeng, Zhao Qi, Zhang Yi, et al. Economic recommendation with surplus maximization[C] //Proc of the 25th Int Conf on World Wide Web. New York: ACM, 2016: 73-83

        [24]Baran P. Economic progress and economic surplus[J]. Economic Review, 1954, 17(4): 289-317

        [25]Coleman J S, Fararo T J. Rational choice theory: Advocacy and critique[J]. Contemporary Sociology, 1994, 23(4): 617-618

        [26]Parkes D C, Wellman M P. Economic reasoning and artificial intelligence[J]. Science, 2015, 349(6245): 267-272

        [27]Luo Chunyu, Xiong Hui, Zhou Wenjun, et al. Enhancing investment decisions in P2P lending: An investor composition perspective[C] //Proc of the 17th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2011: 292-300

        [28]Garman S R, Hampshire R C, Krishnan R, et al. Person-to-person lending: The pursuit of (more) competitive credit markets[C/OL] //Proc of the 29th Int Conf on Information Systems. Atlanta, GA: AIS, 2008: 1-16 [2016-08-01]. http://aisel.aisnet.org/icis2008/160/

        Zhu Mengying, born in 1992. PhD candidate. Student member of China Computer Federation. Her research interests include artificial intelligence, data mining, recom-mendation system, and Internet finance.

        Zheng Xiaolin, born in 1977. PhD. Associate professor, PhD supervisor, deputy director of Institute of Artificial Intelligence, Zhejiang University. Senior member of IEEE and China Computer Federation, committee member in Service Computing of China Computer Federation. His main research interests include data mining, recommend-ation system and Internet finance.

        Wang Chaohui, born in 1993. Master candidate. His main research interests include data mining, recommendation system and Internet finance (zjuwch@zju.edu.cn).

        Investment Recommendation Based on Risk and Surplus in P2P Lending

        Zhu Mengying, Zheng Xiaolin, and Wang Chaohui

        (College of Computer Science & Technology, Zhejiang University, Hangzhou 310027)

        Online peer-to-peer (P2P) lending, which is a newly personal wealth distribution and management system, has become a new type of financing mode for Internet users. P2P lending platform allows borrowers to create borrow listing and investors to bid and invest borrowers’ listing directly. In the P2P lending, there is a significant issue that is how to reasonably match borrowers and investors and then allocate the amount of investors, so as to recommend low risk and high rate investment decisions to the investors. This paper proposes a recommendation framework risk based total surplus risk total surplus maximize (RTSM), which can solve the problem of allocating the investment amount into borrowers’ listings. Specifically, we first propose to adapt various methods of regression to evaluate default risk. Then, we give the hypothesis the surplus of investors and borrowers under default risk which is based on the theory of surplus in economics. And based on this hypothesis, we combine the risk assessment and investment recommendation to maximize the total surplus under default risk. We apply the recommendation framework RTSM into two real-world datasets (Prosper and PPDai). Finally, experiments and analysis indicate that RTSM can reduce risk and improve the overall benefits of both investors and borrowers.

        online P2P lending; risk assessment; total surplus maximize; recommendation system; investment recommendation

        2016-08-15;

        2016-10-27

        國家自然科學(xué)基金項目(61379034,U1509221);國家科技支撐計劃基金項目(2014BAH28F05,2015BAH07F01) This work was supported by the National Natural Science Foundation of China (61379034,U1509221) and the National Key Technology R&D Program of China (2014BAH28F05,2015BAH07F01).

        鄭小林(xlzheng@zju.edu.cn)

        猜你喜歡
        標(biāo)的
        具有兩個P’維非線性不可約特征標(biāo)的非可解群
        激光打標(biāo)的失效分析及改進(jìn)措施
        紅周刊績優(yōu)指數(shù)100只標(biāo)的股一覽
        紅周刊績優(yōu)指數(shù)100只標(biāo)的股一覽
        紅周刊績優(yōu)指數(shù)100只標(biāo)的股一覽
        紅周刊績優(yōu)指數(shù)100只標(biāo)的股一覽
        紅周刊績優(yōu)指數(shù)100只標(biāo)的股一覽
        紅周刊績優(yōu)指數(shù)100只標(biāo)的股一覽
        紅周刊績優(yōu)指數(shù)100只標(biāo)的股一覽
        紅周刊績優(yōu)指數(shù)100只標(biāo)的股一覽
        亚洲精品宾馆在线精品酒店| 青青草99久久精品国产综合| 亚洲av性色精品国产| 日本最新一区二区三区在线视频| 国产福利视频在线观看| 欧美日本日韩aⅴ在线视频| 白白视频在线免费观看| 蜜桃视频第一区免费观看| 蜜臀av无码人妻精品| 996久久国产精品线观看| 中国人妻沙发上喷白将av| 沐浴偷拍一区二区视频| 国产精品人妻一区二区三区四 | 一亚洲一区二区中文字幕| 国产激情一区二区三区在线| 日本入室强伦姧bd在线观看| 99视频在线国产| 在线一区二区三区免费视频观看| 日本一区二区在线免费视频| 婷婷亚洲久悠悠色悠在线播放| 国产精品亚洲一区二区杨幂| 色佬易精品视频免费在线观看| 在线麻豆精东9制片厂av影现网| 欧洲一卡2卡三卡4卡免费网站| 国产成人精品日本亚洲专区6| 国产在线视频一区二区三| 中国少妇×xxxx性裸交| 欲妇荡岳丰满少妇岳 | 呦系列视频一区二区三区| 欧美综合自拍亚洲综合图片区| 娇妻粗大高潮白浆| 美女免费视频观看网址| 大肉大捧一进一出好爽视频| 久精品国产欧美亚洲色aⅴ大片 | 九九在线精品视频xxx| 青青草视频在线观看绿色| 狠狠精品久久久无码中文字幕| 四虎影视国产在线观看精品| 国产精品高清一区二区三区人妖| 中国女人内谢69xxxxxa片| 最新亚洲人成无码网www电影|