亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于群決策的P2P借貸信用風(fēng)險(xiǎn)評(píng)估①

        2019-07-26 03:17:10姜雪瑩
        關(guān)鍵詞:模型

        姜雪瑩,秦 進(jìn)

        (中國(guó)科學(xué)技術(shù)大學(xué) 管理學(xué)院,合肥 230026)

        1 引言

        P2P借貸是指?jìng)€(gè)人用戶之間借助專(zhuān)業(yè)的互聯(lián)網(wǎng)借貸平臺(tái)進(jìn)行的小額借貸交易.近年來(lái),P2P借貸行業(yè)在中國(guó)發(fā)展迅猛,網(wǎng)貸之家的數(shù)據(jù)顯示,2017年國(guó)內(nèi)P2P借貸交易額達(dá)2.8 萬(wàn)億元,較2016年增長(zhǎng)超過(guò)40%,活躍投資人數(shù)達(dá)440 萬(wàn)人.為維持行業(yè)健康發(fā)展,需進(jìn)行有效的風(fēng)險(xiǎn)控制.

        借款人信用風(fēng)險(xiǎn)是指借款人未在約定期限內(nèi)還本付息的風(fēng)險(xiǎn),即違約風(fēng)險(xiǎn),由于P2P借貸不經(jīng)由傳統(tǒng)金融機(jī)構(gòu),個(gè)體投資者在面臨信息不對(duì)稱(chēng)問(wèn)題的同時(shí)缺乏規(guī)避風(fēng)險(xiǎn)的專(zhuān)業(yè)能力,因此,如何合理評(píng)估借款人信用風(fēng)險(xiǎn)是一個(gè)重要的研究問(wèn)題[1].信用風(fēng)險(xiǎn)評(píng)估問(wèn)題旨在預(yù)測(cè)借款項(xiàng)目的違約概率.對(duì)于已到達(dá)還款期限的項(xiàng)目,稱(chēng)未按時(shí)還本付息的項(xiàng)目為違約項(xiàng)目,違約概率記為1,按時(shí)還本付息的項(xiàng)目為不違約項(xiàng)目,違約概率記為0.將項(xiàng)目違約概率作為被解釋變量,從到達(dá)還款期限的項(xiàng)目數(shù)據(jù)中訓(xùn)練得到回歸模型,可預(yù)測(cè)新發(fā)布的借款項(xiàng)目的違約概率,從而為平臺(tái)管理與投資者投資提供參考.

        為解決P2P借貸的信用風(fēng)險(xiǎn)評(píng)估問(wèn)題,諸多機(jī)器學(xué)習(xí)算法被用于預(yù)測(cè)借款項(xiàng)目的違約概率,研究表明隨機(jī)森林(Random Forest)[2],神經(jīng)網(wǎng)絡(luò)(Neural Network)[3]、梯度提升樹(shù)(GBDT)[4]等算法具有較高的預(yù)測(cè)準(zhǔn)確度.由于P2P借貸信用風(fēng)險(xiǎn)評(píng)估問(wèn)題涉及的借款項(xiàng)目特征復(fù)雜,且呈非線性關(guān)系,在不同的數(shù)據(jù)環(huán)境下,運(yùn)用單一算法會(huì)受到不同數(shù)據(jù)特征的干擾[5].而多種算法之間分析數(shù)據(jù)特征的角度存在差異,通過(guò)將多種算法進(jìn)行集成,能夠達(dá)成互補(bǔ),使集成效果優(yōu)于單一算法[6].Xia 等提出,將優(yōu)質(zhì)算法引入集成模型中,有助于提升模型預(yù)測(cè)的準(zhǔn)確度[5].因此,考慮對(duì)多種優(yōu)質(zhì)信用風(fēng)險(xiǎn)評(píng)估模型進(jìn)行集成.群決策是使群體中個(gè)體觀點(diǎn)達(dá)成一致的決策過(guò)程[7],在諸多領(lǐng)域中得到廣泛應(yīng)用[8,9].本文基于群決策思想,選取在P2P借貸信用風(fēng)險(xiǎn)評(píng)估問(wèn)題中表現(xiàn)優(yōu)異的隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)、梯度提升樹(shù)算法,分別構(gòu)建信用風(fēng)險(xiǎn)評(píng)估模型,并運(yùn)用群決策方法對(duì)以上三個(gè)模型進(jìn)行集成,通過(guò)各模型間的優(yōu)勢(shì)互補(bǔ),為P2P借貸信用風(fēng)險(xiǎn)評(píng)估提供更為準(zhǔn)確的方法.為驗(yàn)證模型效果,選取人人貸、拍拍貸數(shù)據(jù)進(jìn)行實(shí)證研究.

        2 基于群決策的P2P借貸信用風(fēng)險(xiǎn)評(píng)估算法及模型構(gòu)建

        一個(gè)群體中,每個(gè)個(gè)體對(duì)于特定事件均有自己的主觀觀點(diǎn),使群體中個(gè)體觀點(diǎn)達(dá)成一致的決策過(guò)程,稱(chēng)為群決策.在群決策過(guò)程中,每個(gè)個(gè)體在其他個(gè)體觀點(diǎn)的基礎(chǔ)上對(duì)自身觀點(diǎn)進(jìn)行修正,在一系列迭代修正后,群體中所有個(gè)體觀點(diǎn)趨于一致且不再變動(dòng),從而形成群體的觀點(diǎn).運(yùn)用群決策方法構(gòu)建P2P借貸信用風(fēng)險(xiǎn)評(píng)估模型,具有以下特性:第一,交互性,群體中所有個(gè)體間通過(guò)觀點(diǎn)的交互影響,實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ);第二,動(dòng)態(tài)性,群決策過(guò)程針對(duì)不同樣本獨(dú)立進(jìn)行,從而對(duì)不同情況形成更有針對(duì)性的結(jié)論;第三,異質(zhì)性,運(yùn)用群決策方法,能夠?qū)崿F(xiàn)不同種類(lèi)算法間的集成.

        2.1 基于群決策的P2P借貸信用風(fēng)險(xiǎn)評(píng)估集成算法

        在群決策過(guò)程中,個(gè)體的主觀觀點(diǎn)會(huì)受到其他個(gè)體的影響而發(fā)生改變,從而令群體中所有個(gè)體的觀點(diǎn)達(dá)成一致[10].假設(shè)現(xiàn)有N個(gè)信用風(fēng)險(xiǎn)評(píng)估模型M1,M2,···,MN,分別運(yùn)用不同的機(jī)器學(xué)習(xí)算法從訓(xùn)練數(shù)據(jù)中產(chǎn)生,稱(chēng)為個(gè)體學(xué)習(xí)器.第i個(gè)個(gè)體學(xué)習(xí)器Mi對(duì)測(cè)試集中借款項(xiàng)目違約概率的預(yù)測(cè)值為Pi.構(gòu)建基于群決策的集成模型,關(guān)鍵在于衡量個(gè)體學(xué)習(xí)器Mi的預(yù)測(cè)值Pi受到其余個(gè)體學(xué)習(xí)器預(yù)測(cè)值的影響.

        其中,wi j表示個(gè)體學(xué)習(xí)器Mj對(duì)個(gè)體學(xué)習(xí)器Mi的影響權(quán)重,.設(shè)W為N?N大小的矩陣,矩陣中的元素為wij(i=1,···,N,j=1,···,N),P?=(,···,)′,P=(P1,···,PN)′,則:

        為使所有個(gè)體學(xué)習(xí)器的修正預(yù)測(cè)值達(dá)成一致,需迭代進(jìn)行式(2)所示修正過(guò)程,直至所有個(gè)體學(xué)習(xí)器的修正預(yù)測(cè)值保持一致且不再變動(dòng).由于W是N?N的轉(zhuǎn)移矩陣,可將其視為馬爾科夫鏈的一步轉(zhuǎn)移概率矩陣.因此,所有個(gè)體學(xué)習(xí)器的修正預(yù)測(cè)值達(dá)成一致,當(dāng)且僅當(dāng)存在向量π=(π1,···,πN),滿足:

        解出向量π的值,最終得到所有個(gè)體學(xué)習(xí)器的集成結(jié)果R:

        集成結(jié)果R即為集成模型對(duì)借款項(xiàng)目違約概率的預(yù)測(cè)值.

        上述過(guò)程中,一個(gè)重要的問(wèn)題是如何獲取個(gè)體學(xué)習(xí)器Mj對(duì)個(gè)體學(xué)習(xí)器Mi的影響權(quán)重wij.參考Basir 等[11]的研究,設(shè)置個(gè)體學(xué)習(xí)器的不確定度,將不確定度分為兩種類(lèi)型:局部不確定度和全局不確定度.其中,局部不確定度衡量的是個(gè)體學(xué)習(xí)器自身決策不確定的程度,全局不確定度衡量的是個(gè)體學(xué)習(xí)器在受到另一個(gè)個(gè)體學(xué)習(xí)器的影響時(shí)決策的不確定程度.

        個(gè)體學(xué)習(xí)器Mi的違約概率預(yù)測(cè)值為Pi,則不違約概率預(yù)測(cè)值為1-Pi.記個(gè)體學(xué)習(xí)器Mi的局部不確定度為Ui|i,Ui|i滿足:

        當(dāng)Pi趨向0 或1時(shí),個(gè)體學(xué)習(xí)器Mi對(duì)借款項(xiàng)目違約與否的判定清晰,此時(shí)不確定度Ui|i趨向于0.當(dāng)Pi趨向0.5時(shí),個(gè)體學(xué)習(xí)器Mi對(duì)借款項(xiàng)目違約與否的判定近似隨機(jī),此時(shí)不確定度Ui|i趨向于1.因此,局部不確定度Ui|i能夠反映個(gè)體學(xué)習(xí)器自身決策不確定的程度.

        記已知個(gè)體學(xué)習(xí)器Mj的違約概率預(yù)測(cè)值的情況下,個(gè)體學(xué)習(xí)器Mi的違約概率預(yù)測(cè)值為Pi|j,則不違約概率預(yù)測(cè)值為1-Pi|j.記個(gè)體學(xué)習(xí)器Mi的全局不確定度為Ui|j,Ui|j滿足:

        與局部不確定度類(lèi)似,全局不確定度Ui|j能夠反映個(gè)體學(xué)習(xí)器在受到另一個(gè)個(gè)體學(xué)習(xí)器的影響時(shí)決策的不確定程度.

        Pi|j表示的是個(gè)體學(xué)習(xí)器Mi在個(gè)體學(xué)習(xí)器Mj影響下的違約概率預(yù)測(cè)值,取Pi|j為Pi與Pj的線性組合,即:

        取Ii|j為sigmoid 函數(shù),即:

        其中,Acci為個(gè)體學(xué)習(xí)器Mi的預(yù)測(cè)準(zhǔn)確率.

        求得局部不確定度與全局不確定度后,希望給不確定度低的個(gè)體學(xué)習(xí)器分配較高的權(quán)重,給不確定度高的個(gè)體學(xué)習(xí)器分配較低的權(quán)重.因此,設(shè)置規(guī)劃問(wèn)題,

        其中,wi j是個(gè)體學(xué)習(xí)器Mj對(duì)個(gè)體學(xué)習(xí)器Mi的影響權(quán)重.采用拉格朗日乘子法,令:

        求Li對(duì)wi j的偏導(dǎo)并令結(jié)果等于0,結(jié)合,得到wi j的 表達(dá)式:

        由此獲取個(gè)體學(xué)習(xí)器Mj對(duì)個(gè)體學(xué)習(xí)器Mi的影響權(quán)重wi j,隨后根據(jù)式(3)、(4),即可得到所有個(gè)體學(xué)習(xí)器的集成結(jié)果R.

        2.2 基于群決策的P2P借貸信用風(fēng)險(xiǎn)評(píng)估模型構(gòu)建過(guò)程

        假設(shè)現(xiàn)有N種機(jī)器學(xué)習(xí)算法,基于群決策的P2P借貸信用風(fēng)險(xiǎn)評(píng)估模型的構(gòu)建過(guò)程,描述如下:

        (1)分別運(yùn)用N種機(jī)器學(xué)習(xí)算法,在訓(xùn)練數(shù)據(jù)中訓(xùn)練出個(gè)體學(xué)習(xí)器M1,M2,···,MN,并得到個(gè)體學(xué)習(xí)器的預(yù)測(cè)準(zhǔn)確率Acc1,···,AccN.

        (2)應(yīng)用個(gè)體學(xué)習(xí)器M1,M2,···,MN,對(duì)測(cè)試集中借款項(xiàng)目的違約概率進(jìn)行預(yù)測(cè),預(yù)測(cè)值為P1,…,PN.

        (3)運(yùn)用式(5)求得個(gè)體學(xué)習(xí)器的局部不確定度,運(yùn)用式(6)-(8)求得個(gè)體學(xué)習(xí)器的全局不確定度.

        (4)運(yùn)用式(11)求得權(quán)重wi j(i=1,···,N,j=1,···,N).

        (5)將wi j代入式(3),解得向量π的值.

        (6)運(yùn)用式(4),最終得到所有個(gè)體學(xué)習(xí)器的集成結(jié)果R.

        集成結(jié)果R表示集成模型對(duì)借款項(xiàng)目違約概率的預(yù)測(cè),若R>0.5,預(yù)測(cè)借款項(xiàng)目違約,若R≤0.5,預(yù)測(cè)借款項(xiàng)目不違約.

        2.3 個(gè)體學(xué)習(xí)器描述

        選取隨機(jī)森林(Random Forest)、神經(jīng)網(wǎng)絡(luò)(Neural Network)、梯度提升樹(shù)(GBDT)三種機(jī)器學(xué)習(xí)算法,分別構(gòu)建回歸模型,作為群決策集成模型的個(gè)體學(xué)習(xí)器.在P2P借貸信用風(fēng)險(xiǎn)評(píng)估問(wèn)題中,以P2P借貸借款項(xiàng)目數(shù)據(jù)集作為個(gè)體學(xué)習(xí)器的訓(xùn)練數(shù)據(jù)集,選取借款項(xiàng)目及借款人的信息作為回歸模型的解釋變量,借款項(xiàng)目違約概率作為回歸模型的被解釋變量,由此構(gòu)建的回歸模型,能夠用于新發(fā)布的借款項(xiàng)目的違約概率預(yù)測(cè).以下是對(duì)隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)、梯度提升樹(shù)三種算法的簡(jiǎn)要介紹.

        2.3.1 隨機(jī)森林

        隨機(jī)森林(Random Forest)是解決回歸問(wèn)題常用的算法,它以一系列未剪枝的決策樹(shù)作為基學(xué)習(xí)器,在構(gòu)建bagging 集成的基礎(chǔ)上,于決策樹(shù)的訓(xùn)練過(guò)程中引入變量的隨機(jī)選擇思想[12].決策樹(shù)的訓(xùn)練過(guò)程是特征空間的遞歸分區(qū)過(guò)程,在每個(gè)非葉節(jié)點(diǎn),決策樹(shù)從當(dāng)前節(jié)點(diǎn)的變量集合中選取最優(yōu)變量對(duì)數(shù)據(jù)集進(jìn)行劃分.而在隨機(jī)森林中,決策樹(shù)每個(gè)節(jié)點(diǎn)的最優(yōu)變量是從變量集合的一個(gè)隨機(jī)子集中選取的.隨機(jī)森林中的決策樹(shù),建立在用bootstrap 采樣法從訓(xùn)練集中選取的樣本集合上.在基于不同采樣集構(gòu)建一系列決策樹(shù)后,隨機(jī)森林采用平均法對(duì)決策樹(shù)輸出的結(jié)果進(jìn)行整合.隨機(jī)森林能夠快速并行地處理高維度的數(shù)據(jù),在P2P借貸信用風(fēng)險(xiǎn)評(píng)估中,借款項(xiàng)目及借款人的特征數(shù)量較多,運(yùn)用隨機(jī)森林能夠減輕特征選擇的負(fù)擔(dān),對(duì)特征進(jìn)行綜合分析.同時(shí),隨機(jī)森林對(duì)于缺失數(shù)據(jù)具有較強(qiáng)的抗干擾能力,在P2P借貸中,存在借款人信息不全的情況,而隨機(jī)森林能夠在數(shù)據(jù)缺失的環(huán)境下得出較為準(zhǔn)確的結(jié)果.

        2.3.2 神經(jīng)網(wǎng)絡(luò)

        神經(jīng)網(wǎng)絡(luò)(Neural Network)是模擬生物神經(jīng)網(wǎng)絡(luò)構(gòu)建的并行交互系統(tǒng),它具有多種學(xué)習(xí)算法,其中使用誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的單隱層前饋神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱(chēng)BP神經(jīng)網(wǎng)絡(luò)),是最具有代表性的神經(jīng)網(wǎng)絡(luò)算法之一.BP神經(jīng)網(wǎng)絡(luò)分為三層:輸入層、隱層、輸出層,每一層由若干神經(jīng)元構(gòu)成,且每層神經(jīng)元與下一層所有神經(jīng)元相互連接.輸入層神經(jīng)元接收外界輸入,并將信號(hào)傳遞至隱層.隱層神經(jīng)元接收到上層神經(jīng)元輸出值的加權(quán)平均,將其與閾值相比較,并通過(guò)激活函數(shù)產(chǎn)生神經(jīng)元輸出,傳遞至輸出層.輸出層同樣進(jìn)行信號(hào)加工,并生成最終的輸出值.神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過(guò)程,就是確定神經(jīng)元間連接權(quán)重以及神經(jīng)元閾值的過(guò)程.根據(jù)神經(jīng)網(wǎng)絡(luò)輸出值的誤差,基于梯度下降策略,可以對(duì)參數(shù)進(jìn)行調(diào)整,并重新進(jìn)行加權(quán)平均,如此進(jìn)行迭代學(xué)習(xí),直至誤差處于允許范圍之內(nèi),即可得到最終的神經(jīng)網(wǎng)絡(luò)模型[13].神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性映射能力,能夠擬合P2P借貸中借款項(xiàng)目及借款人的信息與借款項(xiàng)目違約概率間的非線性關(guān)系.同時(shí),神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)與自適應(yīng)的能力,在P2P借貸借款項(xiàng)目信息多樣化的情況下,神經(jīng)網(wǎng)絡(luò)對(duì)新產(chǎn)生的借款項(xiàng)目具有較好的解釋能力.

        2.3.3 梯度提升樹(shù)

        梯度提升樹(shù)(GBDT)是一種重要的boosting 算法,以分類(lèi)回歸樹(shù)(CART)作為弱學(xué)習(xí)器,通過(guò)迭代將若干弱學(xué)習(xí)器集成為一個(gè)強(qiáng)學(xué)習(xí)器.GBDT 采用了前向分布算法,其核心思想是,每一輪迭代中構(gòu)建的弱學(xué)習(xí)器,建立在前一輪迭代集成的強(qiáng)學(xué)習(xí)器的損失函數(shù)的梯度下降方向.構(gòu)建GBDT模型,首先要根據(jù)初始訓(xùn)練集訓(xùn)練一個(gè)基學(xué)習(xí)器f1(x),隨后進(jìn)行以下迭代過(guò)程.假設(shè)前一輪迭代得到的強(qiáng)學(xué)習(xí)器為ft-1(x),損失函數(shù)為L(zhǎng)(y,ft-1(x)),本輪迭代的目標(biāo)是尋找弱學(xué)習(xí)器ht(x),使得 本輪迭代得到的強(qiáng)學(xué)習(xí)器ft(x)=ft-1(x)+ht(x)滿足損失函數(shù)L(y,ft(x))最小化.由于損失函數(shù)的負(fù)梯度可作為損失的近似值,因此通過(guò)構(gòu)造決策樹(shù)對(duì)損失函數(shù)的負(fù)梯度進(jìn)行擬合即可得到弱學(xué)習(xí)器ht(x).GBDT 可以靈活處理多種類(lèi)型的數(shù)據(jù),對(duì)于異常值的魯棒性較強(qiáng),在P2P借貸較為復(fù)雜的數(shù)據(jù)環(huán)境下,GBDT 具有較高的預(yù)測(cè)準(zhǔn)確率.

        3 實(shí)驗(yàn)分析

        3.1 實(shí)驗(yàn)數(shù)據(jù)及變量描述

        選取中國(guó)具有代表性的兩家P2P 平臺(tái)人人貸與拍拍貸的數(shù)據(jù),對(duì)基于群決策的P2P借貸信用風(fēng)險(xiǎn)評(píng)估模型的效果進(jìn)行實(shí)驗(yàn)驗(yàn)證.其中,從人人貸選取2012年1月至2015年12月間發(fā)布的借款項(xiàng)目15 912個(gè),從拍拍貸選取2015年1月到2017年1月間發(fā)布的借款項(xiàng)目50 167個(gè).將借款項(xiàng)目的違約概率作為被解釋變量,兩個(gè)平臺(tái)借款項(xiàng)目的違約狀況分布如表1所示.

        表1 人人貸、拍拍貸借款項(xiàng)目違約狀況分布

        從平臺(tái)提供的信息中選取解釋變量,解釋變量分為三類(lèi):借款項(xiàng)目信息、借款人身份信息、借款人歷史借款信息.表2 展示了從人人貸與拍拍貸提供的信息中篩選出的解釋變量.

        表2 人人貸、拍拍貸解釋變量匯總

        3.2 實(shí)驗(yàn)結(jié)果

        構(gòu)建群決策集成模型,首先需要運(yùn)用隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)及梯度提升樹(shù)算法,分別構(gòu)建三個(gè)信用風(fēng)險(xiǎn)評(píng)估個(gè)體學(xué)習(xí)器.在個(gè)體學(xué)習(xí)器構(gòu)建過(guò)程中,一些重要參數(shù)的設(shè)置對(duì)于個(gè)體學(xué)習(xí)器的預(yù)測(cè)準(zhǔn)確性存在一定影響,需要設(shè)置的參數(shù)包括隨機(jī)森林模型中決策樹(shù)的數(shù)量n,隨機(jī)森林中決策樹(shù)節(jié)點(diǎn)隨機(jī)選擇特征的數(shù)量m,神經(jīng)網(wǎng)絡(luò)隱層中神經(jīng)元的數(shù)量s,神經(jīng)網(wǎng)絡(luò)的最大迭代次數(shù)d,梯度提升樹(shù)中決策樹(shù)的數(shù)量t.通過(guò)實(shí)驗(yàn),對(duì)比設(shè)置參數(shù)值不同的情況下模型的預(yù)測(cè)準(zhǔn)確性,可確定參數(shù)值.根據(jù)實(shí)驗(yàn)結(jié)果,取n=500,m=4,s=8,d=200,t=5000.

        在構(gòu)建個(gè)體學(xué)習(xí)器后,依據(jù)2.2 節(jié)中基于群決策的P2P借貸信用風(fēng)險(xiǎn)評(píng)估模型構(gòu)建過(guò)程,可以對(duì)個(gè)體學(xué)習(xí)器進(jìn)行集成.將三種個(gè)體學(xué)習(xí)器的結(jié)果與集成結(jié)果進(jìn)行比較,同時(shí)運(yùn)用信用風(fēng)險(xiǎn)評(píng)估的傳統(tǒng)方法邏輯回歸算法構(gòu)建模型作為比較的基準(zhǔn),驗(yàn)證基于群決策的P2P借貸信用風(fēng)險(xiǎn)評(píng)估模型的效果.

        為評(píng)判信用風(fēng)險(xiǎn)評(píng)估模型的預(yù)測(cè)效果,若模型預(yù)測(cè)的借款項(xiàng)目違約概率大于0.5,預(yù)測(cè)借款項(xiàng)目為違約項(xiàng)目,若模型預(yù)測(cè)的借款項(xiàng)目違約概率小于等于0.5,預(yù)測(cè)借款項(xiàng)目為不違約項(xiàng)目.選取五個(gè)指標(biāo)評(píng)判模型的預(yù)測(cè)效果:準(zhǔn)確率、AUC、召回率、精確率、F1 值.準(zhǔn)確率指模型正確預(yù)測(cè)的樣本數(shù)占總樣本數(shù)的比例.AUC 指隨機(jī)挑選一個(gè)違約項(xiàng)目和一個(gè)不違約項(xiàng)目,違約項(xiàng)目預(yù)測(cè)值高于不違約項(xiàng)目預(yù)測(cè)值的概率.召回率指實(shí)際不違約的項(xiàng)目中被正確預(yù)測(cè)為不違約的比例.精確率指被預(yù)測(cè)為不違約的項(xiàng)目中預(yù)測(cè)正確的比例.F1 值是召回率和精確率的調(diào)和平均值,用于綜合召回率和精確率對(duì)模型進(jìn)行評(píng)價(jià).

        表3 采用人人貸數(shù)據(jù)構(gòu)建信用風(fēng)險(xiǎn)評(píng)估模型結(jié)果

        由于拍拍貸平臺(tái)的數(shù)據(jù)存在嚴(yán)重的類(lèi)別不平衡問(wèn)題,即不違約項(xiàng)目的數(shù)據(jù)量遠(yuǎn)大于違約項(xiàng)目的數(shù)據(jù)量.運(yùn)用類(lèi)別不平衡數(shù)據(jù)構(gòu)建模型對(duì)項(xiàng)目違約狀況進(jìn)行預(yù)測(cè),會(huì)導(dǎo)致大部分違約項(xiàng)目被錯(cuò)誤預(yù)測(cè)為不違約項(xiàng)目,且模型評(píng)判指標(biāo)虛高.因此,在采用拍拍貸數(shù)據(jù)構(gòu)建信用風(fēng)險(xiǎn)評(píng)估模型前,運(yùn)用隨機(jī)欠采樣方法,使得訓(xùn)練集中違約項(xiàng)目與不違約項(xiàng)目的比例為1:1,據(jù)此可驗(yàn)證模型在類(lèi)別平衡數(shù)據(jù)下的效果.表4 展示了采用拍拍貸數(shù)據(jù)構(gòu)建信用風(fēng)險(xiǎn)評(píng)估模型的結(jié)果.根據(jù)表4 數(shù)據(jù),群決策集成模型的準(zhǔn)確率、AUC、召回率均高于其余模型,精確率在相比較的模型中也處于較高位置.且綜合精確率與召回率,群決策集成模型的F1 值較其他模型更高.

        表4 采用拍拍貸數(shù)據(jù)構(gòu)建信用風(fēng)險(xiǎn)評(píng)估模型結(jié)果

        4 結(jié)語(yǔ)

        基于群決策方法,對(duì)隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)、梯度提升樹(shù)三種算法進(jìn)行集成,用于評(píng)估P2P借貸中借款項(xiàng)目的信用風(fēng)險(xiǎn).運(yùn)用群決策方法進(jìn)行集成,能夠通過(guò)不同算法評(píng)估結(jié)果間的相互影響,實(shí)現(xiàn)算法間的優(yōu)勢(shì)互補(bǔ),從而提升評(píng)估效果.選取人人貸、拍拍貸平臺(tái)的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證.考慮到拍拍貸的數(shù)據(jù)存在嚴(yán)重的類(lèi)別不平衡問(wèn)題,對(duì)拍拍貸數(shù)據(jù)的訓(xùn)練集進(jìn)行隨機(jī)欠采樣,使得訓(xùn)練集達(dá)到類(lèi)別平衡.數(shù)據(jù)研究結(jié)果顯示,集成算法的信用風(fēng)險(xiǎn)評(píng)估效果相比于單一算法有所提升,且優(yōu)于傳統(tǒng)的邏輯回歸算法.因此,基于群決策的P2P借貸信用風(fēng)險(xiǎn)評(píng)估算法,有助于平臺(tái)及投資者更好的識(shí)別風(fēng)險(xiǎn)項(xiàng)目,以便進(jìn)一步提升風(fēng)險(xiǎn)控制能力.

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        色欲aⅴ亚洲情无码av| 亚洲av高清在线一区二区三区| 蜜臀人妻精品一区二区免费| 成人无码一区二区三区| 永久免费看啪啪网址入口| 亚洲日韩精品欧美一区二区三区不卡| 国产成人久久综合第一区| 亚洲精品中文字幕一区二区| 国产精品无码一区二区在线看| 五月天欧美精品在线观看| 人妻熟女中文字幕在线视频 | 2022AV一区在线| 免费一区二区三区女优视频| 大屁股人妻女教师撅着屁股 | 精品无码成人片一区二区| 国产高清在线精品一区二区三区| 亚洲熟妇色自偷自拍另类| 日韩人妻精品无码一区二区三区| 亚洲中字幕永久在线观看| 亚洲第一页视频在线观看| 国产精品特级毛片一区二区三区| 日本一区二区三区高清千人斩 | 午夜tv视频免费国产区4| 亚洲中文字幕第一第二页| 亚洲国产精品18久久久久久| 亚洲精品综合一区二区| 无码av一区在线观看| 一本色道久久88加勒比综合| 午夜男女很黄的视频| 国产成人精品电影在线观看18 | 久久精品无码一区二区2020| 国产av精品一区二区三区视频| 色多多性虎精品无码av| 抽搐一进一出试看60秒体验区| 日本第一区二区三区视频| 国产三级视频不卡在线观看| 97在线观看| 欧美破处在线观看| 一本久久精品久久综合| 久久久www免费人成精品| 91人妻无码成人精品一区91|