亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于大數(shù)據(jù)的P2P網(wǎng)絡(luò)借貸平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)

        2020-05-07 14:30:50崔炎炎劉立新
        統(tǒng)計(jì)與信息論壇 2020年4期
        關(guān)鍵詞:網(wǎng)貸均值樣本

        崔炎炎,劉立新

        (對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué) 統(tǒng)計(jì)學(xué)院,北京 100029)

        一、引言

        世界上第一家P2P網(wǎng)絡(luò)借貸平臺(tái)(后文簡(jiǎn)稱P2P平臺(tái))Zopa于2005年3月在英國(guó)成立,P2P,即“Peer to Peer Lending”的縮寫,是指具有資金需求的借款人和有資金供貸出來進(jìn)行投資的貸款人以互聯(lián)網(wǎng)為渠道進(jìn)行雙方交易的網(wǎng)絡(luò)借貸模式。最先在國(guó)外發(fā)展起來的Zopa、Kiva、Prosper等具有各自特點(diǎn)的P2P平臺(tái)為全球不同地區(qū)的資金供需雙方提供了很多便利,也為全世界P2P平臺(tái)的發(fā)展構(gòu)建了基礎(chǔ)[1]。

        中國(guó)第一家P2P平臺(tái)“拍拍貸”于2007年6月在上海成立,開創(chuàng)了中國(guó)P2P行業(yè)的新紀(jì)元。隨著這種借貸模式逐漸被廣大民眾接受,中國(guó)P2P平臺(tái)的數(shù)量開始大量增加,很快便具有一定的規(guī)模。人們?cè)谶m應(yīng)新的借貸模式帶來的快捷與便利的同時(shí)增加了P2P借貸的需求,既給該行業(yè)帶來了商機(jī),也使各P2P平臺(tái)間產(chǎn)生了激烈的競(jìng)爭(zhēng),良莠不齊的P2P平臺(tái)在一定程度上增加了該行業(yè)的風(fēng)險(xiǎn),給投資者帶來其在發(fā)展中的諸多問題[2-3]。2015年開始,銀監(jiān)會(huì)等部委對(duì)P2P行業(yè)重點(diǎn)關(guān)注,出臺(tái)了一系列整治方案,2018年3月互聯(lián)網(wǎng)金融整治辦下發(fā)的《關(guān)于加大通過互聯(lián)網(wǎng)開展資金管理整治力度及其驗(yàn)收工作的通知》加速了P2P行業(yè)的監(jiān)管和轉(zhuǎn)型。政策的及時(shí)跟進(jìn)對(duì)很多P2P平臺(tái)起到了規(guī)范作用,在很大程度上改善了P2P行業(yè)的問題,但一直到今天,伴隨經(jīng)濟(jì)下行的壓力,P2P第三方資訊網(wǎng)站的行業(yè)報(bào)告仍顯示P2P平臺(tái)的停業(yè)及其他情況屢有發(fā)生。2019年3月,P2P平臺(tái)團(tuán)貸網(wǎng)暴雷,因涉嫌非法吸收公眾存款被東莞市公安局立案?jìng)刹?,給行業(yè)帶來重大的影響[4],嚴(yán)重打擊了投資者的信心。

        在目前國(guó)內(nèi)P2P平臺(tái)問題頻發(fā)、P2P行業(yè)陷入信任危機(jī)之際,有必要對(duì)P2P平臺(tái)的風(fēng)險(xiǎn)評(píng)價(jià)進(jìn)行更加深入的研究。只有掌握了良好的P2P平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)體系,才能更全面、科學(xué)地判斷各P2P平臺(tái)的風(fēng)險(xiǎn)。一方面,有益于投資者更加理性地對(duì)P2P平臺(tái)進(jìn)行選擇;另一方面,有助于各平臺(tái)向更加健康可持續(xù)的方向發(fā)展,從而促進(jìn)中國(guó)互聯(lián)網(wǎng)金融體系的穩(wěn)定。鑒于此,本文搜集整理了中國(guó)692家P2P平臺(tái)和15萬余條網(wǎng)絡(luò)輿情的大數(shù)據(jù)資料來分析P2P平臺(tái)的風(fēng)險(xiǎn)情況,希望基于大數(shù)據(jù)資料的全面性獲得更加準(zhǔn)確科學(xué)的結(jié)論。

        本文的主要?jiǎng)?chuàng)新和特點(diǎn)在于:首先,綜合運(yùn)用了平臺(tái)本身、網(wǎng)絡(luò)輿情和P2P第三方資訊網(wǎng)站的評(píng)價(jià)信息對(duì)P2P平臺(tái)的風(fēng)險(xiǎn)情況進(jìn)行判斷,在考慮數(shù)據(jù)的可獲得性和變量重要性的基礎(chǔ)上,涵蓋了較為全面的P2P平臺(tái)風(fēng)險(xiǎn)影響因素,使得P2P風(fēng)險(xiǎn)評(píng)價(jià)體系的構(gòu)建更加科學(xué);其次,對(duì)樣本P2P平臺(tái)所應(yīng)用的風(fēng)險(xiǎn)判別方法既包括傳統(tǒng)的統(tǒng)計(jì)模型還涵蓋了新興的機(jī)器學(xué)習(xí)模型,能夠顯示不同判別方法的評(píng)價(jià)效果,為進(jìn)一步探究判別P2P平臺(tái)風(fēng)險(xiǎn)方法的適用性提供依據(jù)。

        二、文獻(xiàn)回顧

        P2P行業(yè)在中國(guó)已經(jīng)發(fā)展了十余年,以“網(wǎng)貸之家”“網(wǎng)貸天眼”為首的一些業(yè)內(nèi)P2P平臺(tái)第三方資訊網(wǎng)站為P2P網(wǎng)貸投資者提供了客觀真實(shí)的平臺(tái)數(shù)據(jù)以供投資參考,也讓很多關(guān)注P2P平臺(tái)風(fēng)險(xiǎn)的研究人員擁有易獲取的數(shù)據(jù)資料。王飛等采集了網(wǎng)貸之家的月度發(fā)展指數(shù)作為研究樣本,選擇其中的部分指標(biāo)作為面板固定效應(yīng)模型中的核變量,對(duì)P2P平臺(tái)信任危機(jī)下品牌信任重建效果的問題進(jìn)行研究[5]。葉青等采集了網(wǎng)貸之家、網(wǎng)貸天眼的變量信息,嘗試對(duì)P2P問題平臺(tái)的初步特征進(jìn)行概括,并從平臺(tái)實(shí)力、標(biāo)的特征、風(fēng)控能力、治理水平等方面構(gòu)建模型,以提煉能夠甄別P2P問題平臺(tái)的風(fēng)險(xiǎn)因素[6]。孫寶文等在網(wǎng)貸之家搜集到861家樣本平臺(tái),并從平臺(tái)運(yùn)營(yíng)基礎(chǔ)、平臺(tái)高管背景、資金實(shí)力、平臺(tái)收益和管理費(fèi)用、風(fēng)險(xiǎn)控制能力、網(wǎng)民輿情6個(gè)維度整合出14個(gè)平臺(tái)經(jīng)營(yíng)特征指標(biāo),采用二元變量回歸模型分析陷入提現(xiàn)困境的P2P平臺(tái)區(qū)別于正常平臺(tái)的整體風(fēng)險(xiǎn)特征[7]。姜琪利用網(wǎng)貸之家、網(wǎng)貸天眼網(wǎng)站2014年1月至2017年11月地區(qū)、類型及代表性平臺(tái)的面板數(shù)據(jù)實(shí)證檢驗(yàn)了影響中國(guó)P2P平臺(tái)成交量的因素,并運(yùn)用雙重差分法來測(cè)度銀行存管對(duì)成交量的政策沖擊效應(yīng)[8]。王偉等在網(wǎng)貸之家采集了54家P2P樣本平臺(tái)信息,使用改進(jìn)的CRITIC法進(jìn)行評(píng)價(jià),發(fā)現(xiàn)2015年5月至2016年8月樣本平臺(tái)風(fēng)險(xiǎn)得分和風(fēng)險(xiǎn)評(píng)級(jí)均處于嚴(yán)峻的低水平狀態(tài),從而進(jìn)一步歸納P2P平臺(tái)相關(guān)特征[9]。張文等利用網(wǎng)貸之家的數(shù)據(jù)實(shí)證分析了針對(duì)真實(shí)P2P平臺(tái)數(shù)據(jù)的類別分布非均衡性的問題,提出了一種基于K-Means聚類和支持向量機(jī)的非均衡分類方法[10]。朱清香等利用網(wǎng)貸之家的數(shù)據(jù)以LAPP法的4個(gè)維度為基礎(chǔ)、民營(yíng)系P2P平臺(tái)風(fēng)險(xiǎn)的特點(diǎn)為立足點(diǎn),選取了20個(gè)指標(biāo)進(jìn)行實(shí)證分析[11]。

        上述研究都運(yùn)用了網(wǎng)貸之家或網(wǎng)貸天眼網(wǎng)站公布的數(shù)據(jù)資料,主要思路是從兩家網(wǎng)站公布的網(wǎng)貸平臺(tái)評(píng)級(jí)體系中選取部分變量,結(jié)合作者的評(píng)價(jià)思路進(jìn)行再加工,從而進(jìn)行網(wǎng)貸平臺(tái)的風(fēng)險(xiǎn)評(píng)價(jià)。P2P平臺(tái)第三方資訊網(wǎng)站提供的數(shù)據(jù)資料能夠代表網(wǎng)貸行業(yè)的部分信息,為構(gòu)建P2P平臺(tái)的風(fēng)險(xiǎn)評(píng)價(jià)體系提供了變量基礎(chǔ)。但也有文章沒有用到P2P平臺(tái)第三方資訊網(wǎng)站的數(shù)據(jù)資料。范超等運(yùn)用國(guó)泰安數(shù)據(jù)庫(kù)在中國(guó)444家P2P平臺(tái)基本信息與交易信息基礎(chǔ)上,綜合使用了11種統(tǒng)計(jì)模型評(píng)估變量的重要性并討論其經(jīng)濟(jì)意義[12]。范超等使用的指標(biāo)信息更加原始,沒有經(jīng)過P2P平臺(tái)第三方資訊網(wǎng)站的加工處理,結(jié)合評(píng)價(jià)思路進(jìn)行整合,更加直觀,但在一定程度上,會(huì)有涵蓋影響P2P平臺(tái)風(fēng)險(xiǎn)因素不全面的問題。

        三、P2P平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系的構(gòu)建

        (一)指標(biāo)體系的理論分析

        從已有文獻(xiàn)研究中發(fā)現(xiàn),直接從P2P平臺(tái)第三方資訊網(wǎng)站選取一部分風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)的方法具有較強(qiáng)的主觀性,且這些直接被提取的指標(biāo)含義往往比較綜合且復(fù)雜[注]具體可見P2P平臺(tái)第三方資訊網(wǎng)站網(wǎng)貸之家的評(píng)級(jí)指標(biāo)體系的指標(biāo)說明。,使得評(píng)價(jià)體系內(nèi)部指標(biāo)的涵蓋關(guān)系難以確定;另外,P2P平臺(tái)第三方資訊網(wǎng)站的樣本數(shù)量確定有一定難度,有些指標(biāo)變量的公開數(shù)據(jù)樣本較少[注]P2P平臺(tái)第三方資訊網(wǎng)站網(wǎng)貸之家目前只公布評(píng)級(jí)排名前100家的P2P平臺(tái)定量數(shù)據(jù)資料?;蛘邥r(shí)期較短,導(dǎo)致數(shù)據(jù)缺失較多,給研究造成了困擾。但是,上述缺陷不能否認(rèn)P2P平臺(tái)第三方資訊網(wǎng)站信息的可靠性和其具有的參考意義,相對(duì)于定量數(shù)據(jù)的復(fù)雜性和不可獲得性,可以適當(dāng)參考一些P2P平臺(tái)第三方資訊網(wǎng)站的定性以及非結(jié)構(gòu)性數(shù)據(jù)資料。于是本文構(gòu)建的P2P平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)體系中,定量指標(biāo)部分主要來自國(guó)泰安CSMAR金融經(jīng)濟(jì)數(shù)據(jù)庫(kù),定性指標(biāo)和網(wǎng)絡(luò)輿情部分資料則利用手動(dòng)收集或網(wǎng)絡(luò)爬蟲技術(shù)爬取于P2P平臺(tái)第三方資訊網(wǎng)站。本文借鑒相關(guān)研究并結(jié)合指標(biāo)變量數(shù)據(jù)的完整性,從平臺(tái)的內(nèi)部信息和外部信息兩個(gè)維度,考慮P2P平臺(tái)的基礎(chǔ)信息、交易信息、資金信息、產(chǎn)品信息、風(fēng)險(xiǎn)防控信息和評(píng)論信息六個(gè)方面構(gòu)建了P2P平臺(tái)的風(fēng)險(xiǎn)評(píng)價(jià)體系。具體包括以下部分。

        1.基礎(chǔ)信息。判斷一家平臺(tái)的好壞,離不開對(duì)平臺(tái)自身基礎(chǔ)情況的考察。在平臺(tái)的基礎(chǔ)信息部分本文選取了4個(gè)指標(biāo)變量,分別是平臺(tái)背景、注冊(cè)資本、所處地域和運(yùn)營(yíng)時(shí)間。平臺(tái)背景是平臺(tái)的信用背書,反映平臺(tái)的信譽(yù)程度,在所采集的平臺(tái)樣本中有國(guó)資系、民營(yíng)系、上市公司系、銀行系和風(fēng)投系五類平臺(tái)背景,為了數(shù)據(jù)處理方便,將這五類平臺(tái)背景分別用1,2,3,4,5表示;所處地域是指平臺(tái)所屬的省級(jí)行政劃分區(qū)域,根據(jù)劃分標(biāo)準(zhǔn)[注]由全國(guó)人大六屆四次會(huì)議通過的“七五”計(jì)劃和1997年、2000年的政策變動(dòng)可知,中國(guó)東部地區(qū)包括11個(gè)省級(jí)行政區(qū),分別是北京、天津、河北、遼寧、上海、江蘇、浙江、福建、山東、廣東和海南;中部地區(qū)有8個(gè)省級(jí)行政區(qū),分別是山西、吉林、黑龍江、安徽、江西、河南、湖北、湖南;西部地區(qū)包括的省級(jí)行政區(qū)共12個(gè),分別是四川、重慶、貴州、云南、西藏、陜西、甘肅、青海、寧夏、新疆、廣西、內(nèi)蒙古。(臺(tái)灣、香港和澳門除外)。將中國(guó)省份劃分成東部地區(qū)、中部地區(qū)和西部地區(qū),并用1,2,3表示;運(yùn)營(yíng)時(shí)間指的是平臺(tái)正常運(yùn)營(yíng)時(shí)間(單位:天)。非問題平臺(tái)的運(yùn)營(yíng)時(shí)間是平臺(tái)從創(chuàng)立開始到本文數(shù)據(jù)采集時(shí)間截止的運(yùn)營(yíng)天數(shù),問題平臺(tái)的運(yùn)營(yíng)時(shí)間是平臺(tái)從創(chuàng)立開始到問題發(fā)生時(shí)間截止的運(yùn)營(yíng)天數(shù)。

        2.交易信息。交易信息能夠反映一家平臺(tái)的過往交易狀況,對(duì)選擇平臺(tái)投資的投資者來說具有重要意義。在平臺(tái)交易信息部分,本文采集了2015年9月27日至2019年2月26日以天為頻率的數(shù)據(jù)共1 182天,由于每家平臺(tái)成立時(shí)間不同,數(shù)據(jù)時(shí)間序列不一致,因此對(duì)數(shù)據(jù)進(jìn)行了均值處理,得到了平均成交量(萬元)、平均投資人數(shù)(人)、平均借款期限(月)、平均借款人數(shù)(人)和平均借款集中度5個(gè)指標(biāo)變量。其中,平均借款集中度屬于加工指標(biāo),即借款人數(shù)與出借人數(shù)比值的均值,該數(shù)值越高說明平臺(tái)投資越分散,平臺(tái)風(fēng)險(xiǎn)越低。

        3.資金信息。這里的平臺(tái)資金信息,指的是平臺(tái)在業(yè)務(wù)經(jīng)營(yíng)上的資金信息,能夠看到平臺(tái)的業(yè)務(wù)經(jīng)營(yíng)狀態(tài),包括3個(gè)指標(biāo)變量[注]平均未來60日待還金額、平均累計(jì)待還金額和平均近30日資金凈流入的數(shù)據(jù)區(qū)間以及數(shù)據(jù)處理方法同平臺(tái)交易信息部分的均值處理指標(biāo)。。一是平均未來60日待還金額(萬元),該指標(biāo)越高反映平臺(tái)的兌付壓力越大;二是平均累計(jì)待還金額(萬元),平均累計(jì)待還金額是指平臺(tái)未還款項(xiàng)目的資金總額均值,與平均未來60日待還金額指標(biāo)不同的是,平均累計(jì)待還金額指標(biāo)沒有還款期限的迫切要求,更多的是反映一家平臺(tái)被使用的廣泛程度;三是平均近30日資金凈流入(萬元),平均近30日資金凈流入是指30日內(nèi)所有投標(biāo)金額減去所有還款金額(按本金計(jì)算)的均值,對(duì)于分析平臺(tái)人氣和規(guī)模變化情況有一定的作用。

        4.產(chǎn)品信息。產(chǎn)品是平臺(tái)的核心競(jìng)爭(zhēng)力,平臺(tái)產(chǎn)品信息能夠反映平臺(tái)的產(chǎn)品標(biāo)的狀況,對(duì)于判斷平臺(tái)質(zhì)量有重要作用。本文用以下4個(gè)指標(biāo)變量進(jìn)行表征。首先是平臺(tái)產(chǎn)品的平均利率[注]平均利率的數(shù)據(jù)區(qū)間及數(shù)據(jù)處理方法同交易信息部分的均值處理指標(biāo)。,是數(shù)據(jù)采集區(qū)間內(nèi)平均值處理后的結(jié)果。一般認(rèn)為,借款人違約風(fēng)險(xiǎn)越高,利率水平越高,平臺(tái)就越有風(fēng)險(xiǎn)[13];其次是業(yè)務(wù)類型數(shù)目,業(yè)務(wù)類型數(shù)目是指平臺(tái)所開展的借貸業(yè)務(wù)種類的數(shù)目,一般認(rèn)為平臺(tái)所擁有的業(yè)務(wù)種類越多說明平臺(tái)風(fēng)險(xiǎn)越低[6];第三是自動(dòng)投標(biāo),自動(dòng)投標(biāo)是指平臺(tái)是否允許選擇自動(dòng)投標(biāo),屬于分類變量,包括不支持、支持和無公開信息三類,分別用1,2,3表示;最后是債權(quán)轉(zhuǎn)讓,債權(quán)轉(zhuǎn)讓是指?jìng)鶛?quán)人通過訂立債權(quán)轉(zhuǎn)讓合同將債權(quán)的全部或部分轉(zhuǎn)移給第三人,這里的債權(quán)轉(zhuǎn)讓指標(biāo)是債權(quán)轉(zhuǎn)讓的時(shí)間描述,包括不可轉(zhuǎn)讓、有期限限制(幾個(gè)月不等)、隨時(shí)以及無公開信息四類,分別用1,2,3,4表示。

        5.風(fēng)險(xiǎn)防控信息。風(fēng)險(xiǎn)防控信息是指平臺(tái)為保障投資者資金安全和平臺(tái)自我整頓所采取的主要措施,良好的風(fēng)險(xiǎn)防控能有效提高平臺(tái)應(yīng)對(duì)風(fēng)險(xiǎn)的能力[14],對(duì)識(shí)別問題平臺(tái)具有重要作用,共選取7個(gè)指標(biāo)變量進(jìn)行表征。

        具體而言,資金存管是指平臺(tái)選擇通過銀行或第三方機(jī)構(gòu)管理投資者的資金,做到資金和交易分開從而避免資金被挪用的風(fēng)險(xiǎn)防控措施。風(fēng)險(xiǎn)準(zhǔn)備金就P2P行業(yè)而言,是指P2P平臺(tái)在借款成交時(shí)提取一定比例資金存入所建立的獨(dú)立賬戶,當(dāng)該項(xiàng)目逾期時(shí)啟動(dòng)賬戶資金先行賠付投資人本息的風(fēng)險(xiǎn)防控方式。資金存管、風(fēng)險(xiǎn)準(zhǔn)備金和投資門檻指標(biāo)在樣本平臺(tái)中都包括有和無兩類,都分別用1和0表示。

        資金保障模式是指P2P平臺(tái)承諾的保障平臺(tái)資金安全的方法。所采集的樣本中共包括自擔(dān)保模式、第三方擔(dān)保模式、混合擔(dān)保模式、無擔(dān)保模式、其他擔(dān)保模式以及無公開信息六種類型,分別用1~6進(jìn)行表示;業(yè)務(wù)投標(biāo)保障指的是對(duì)平臺(tái)的業(yè)務(wù)進(jìn)行擔(dān)保,包括實(shí)物抵押擔(dān)保、第三方機(jī)構(gòu)擔(dān)保、風(fēng)險(xiǎn)準(zhǔn)備金擔(dān)保、混合模式擔(dān)保、VIP擔(dān)保、其他方式擔(dān)保、無擔(dān)保和無公開信息八種類型,分別用1~8進(jìn)行表示。

        擔(dān)保機(jī)構(gòu)是指為P2P平臺(tái)提供擔(dān)保服務(wù)的機(jī)構(gòu)。為了吸引投資者,有的P2P平臺(tái)聲稱有擔(dān)保方式卻不公布擔(dān)保機(jī)構(gòu),因?yàn)橐恍?dān)保公司根本就沒有能力對(duì)債務(wù)進(jìn)行擔(dān)保,因此對(duì)于合作擔(dān)保機(jī)構(gòu)的信息披露也應(yīng)涵蓋在考察范圍內(nèi)[15]。擔(dān)保機(jī)構(gòu)指標(biāo)在樣本平臺(tái)中包括有擔(dān)保機(jī)構(gòu)披露和沒有擔(dān)保機(jī)構(gòu)披露兩類,分別用1和0表示;平臺(tái)信息公開程度是指所能獲得的平臺(tái)公開信息的程度,具體包括公開的自動(dòng)投標(biāo)、債權(quán)轉(zhuǎn)讓、風(fēng)險(xiǎn)準(zhǔn)備金、保障模式、投標(biāo)保障和擔(dān)保機(jī)構(gòu)定性信息的個(gè)數(shù),數(shù)目越多說明信息公開程度越大。

        6.評(píng)論信息。平臺(tái)的評(píng)論信息包括兩部分,一是簡(jiǎn)單的打分信息,直接從網(wǎng)貸之家網(wǎng)站爬取計(jì)算可得,共涵蓋六個(gè)指標(biāo)變量;二是文本信息,需要進(jìn)行文本挖掘得到情感得分信息。

        打分信息部分。平臺(tái)的打分信息包括六個(gè)指標(biāo)變量,分別是提現(xiàn)得分、體驗(yàn)得分、站崗得分、服務(wù)得分、被關(guān)注程度和用戶推薦程度。其中,在P2P行業(yè)中的資金站崗?fù)ǔ4嬖趦煞N可能,一是投資人信任平臺(tái),將資金經(jīng)第三方支付工具充值給了平臺(tái)賬戶,但平臺(tái)沒有及時(shí)將資金投出從而造成資金閑置的情況。二是投資人投資平臺(tái)某借款標(biāo)的,但標(biāo)的遲遲不能滿標(biāo),資金在不能滿標(biāo)的借款標(biāo)的中空置的情況。本文打分信息部分的站崗得分就是針對(duì)上述兩種情況對(duì)平臺(tái)的打分,判斷上述兩種情況發(fā)生的狀況;被關(guān)注程度由網(wǎng)貸之家網(wǎng)站的平臺(tái)評(píng)論數(shù)目做代理變量,認(rèn)為評(píng)論數(shù)目越多,平臺(tái)就越受關(guān)注;用戶推薦程度是由網(wǎng)貸之家網(wǎng)站平臺(tái)的網(wǎng)友推薦數(shù)目與評(píng)論數(shù)目的比值,比值越大說明用戶推薦程度越高。

        文本信息部分。應(yīng)用Python軟件爬取了P2P第三方資訊網(wǎng)站網(wǎng)貸之家中樣本平臺(tái)的所有評(píng)論內(nèi)容(共計(jì)151 376條評(píng)論數(shù)據(jù)),并對(duì)樣本平臺(tái)的所有評(píng)論進(jìn)行了情感分析[注]本文文本挖掘應(yīng)用python工具包snownlp完成,詳情可查詢工具包介紹。,得到每家平臺(tái)的用戶評(píng)論情感得分指標(biāo)。

        (二)風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系

        根據(jù)指標(biāo)體系的理論分析,本文構(gòu)建了包括P2P平臺(tái)內(nèi)部信息和外部信息2個(gè)一級(jí)指標(biāo)、6個(gè)二級(jí)指標(biāo)、30個(gè)三級(jí)指標(biāo)的P2P平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)體系,以判別不同P2P平臺(tái)的風(fēng)險(xiǎn)情況。為了使評(píng)價(jià)體系具有可參考性,評(píng)價(jià)體系中指標(biāo)的數(shù)據(jù)資料均是在P2P平臺(tái)公開信息中提取而來,能夠在長(zhǎng)期進(jìn)行數(shù)據(jù)跟蹤;另外,指標(biāo)體系同時(shí)兼顧了定量指標(biāo)和定性指標(biāo),還結(jié)合研究對(duì)象的特點(diǎn),引入了網(wǎng)絡(luò)輿情的評(píng)論信息指標(biāo),以求對(duì)判別P2P平臺(tái)的風(fēng)險(xiǎn)情況進(jìn)行更加全面的分析。具體如表1所示。

        表1 P2P平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)體系

        四、風(fēng)險(xiǎn)評(píng)價(jià)實(shí)證分析

        (一)基于大數(shù)據(jù)背景下風(fēng)險(xiǎn)評(píng)價(jià)方法的選擇

        基于構(gòu)建的P2P平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)體系對(duì)P2P平臺(tái)的風(fēng)險(xiǎn)判別模型進(jìn)行實(shí)證分析。文獻(xiàn)資料顯示現(xiàn)有的風(fēng)險(xiǎn)評(píng)價(jià)方法可以分為兩類,一類是較為傳統(tǒng)的統(tǒng)計(jì)模型,另一類則是新興的機(jī)器學(xué)習(xí)模型。借鑒范超等選取的模型,本文選擇Logistic回歸和樸素貝葉斯模型作為傳統(tǒng)模型的代表,而支持向量機(jī)(SVM)和隨機(jī)森林模型作為機(jī)器學(xué)習(xí)模型的代表[12]。下面對(duì)這四種模型的優(yōu)缺點(diǎn)進(jìn)行介紹。

        1.Logistic回歸模型

        Logistic回歸模型是常用的二分類模型之一,對(duì)解決現(xiàn)實(shí)生活中因變量是離散的兩類決策問題具有優(yōu)勢(shì)性。就本文來看,因變量的選擇有“問題平臺(tái)”和“正常平臺(tái)”兩類。在模型變量方面,該模型對(duì)變量服從的分布沒有要求,適用性較強(qiáng)。另外,該模型能很好地解決非線性問題,被認(rèn)為是分析被解釋變量是離散變量時(shí)某事件發(fā)生概率與解釋變量之間關(guān)系的主流分析方法[16]。模型經(jīng)過logit變換后的基本形式為:

        (1)

        其中,x1,x2,…,xn為解釋變量。實(shí)際操作中通常需要對(duì)進(jìn)入該模型的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后將這些標(biāo)準(zhǔn)化后的數(shù)據(jù)轉(zhuǎn)化成相對(duì)應(yīng)的結(jié)構(gòu)化后的數(shù)值,加以簡(jiǎn)單的回歸計(jì)算后進(jìn)而判斷所屬的類別。logistic回歸模型的計(jì)算方式簡(jiǎn)單易理解,但是對(duì)自變量之間的多重共線性比較敏感,而且模型容易出現(xiàn)欠擬合情況,所以在分類精度方面可能不理想。

        2.樸素貝葉斯模型

        樸素貝葉斯是一種有監(jiān)督的學(xué)習(xí)算法,也常被用于解決實(shí)際問題中的分類問題,在模型實(shí)證之前一般需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理。

        在思想上,樸素貝葉斯模型源于貝葉斯理論,該理論選擇對(duì)數(shù)據(jù)點(diǎn)計(jì)算后的結(jié)果中具有最高概率的進(jìn)行判斷決策,即假如用p1(x,y)表示數(shù)據(jù)點(diǎn)(x,y)屬于類別1的概率,用p2(x,y)表示數(shù)據(jù)點(diǎn)(x,y)屬于類別2的概率,那么對(duì)于新的數(shù)據(jù)點(diǎn)(x,y)來說,如果p1(x,y)>p2(x,y),那么新的數(shù)據(jù)點(diǎn)(x,y)就被判斷為屬于類別1;反之,如果p1(x,y)

        樸素貝葉斯模型,簡(jiǎn)而言之,就是通過事件的先驗(yàn)概率由貝葉斯理論計(jì)算出后驗(yàn)概率,從而對(duì)最大的后驗(yàn)概率進(jìn)行所屬類別的判斷。該模型對(duì)條件概率分布做出條件獨(dú)立性的假設(shè),簡(jiǎn)化了計(jì)算過程,因此被稱為“樸素”貝葉斯。具體判斷過程如下:假設(shè)分類結(jié)果包括c1,c2,…,cn共計(jì)n類,而ck(1≤k≤n)表示其中具體的某一類,每個(gè)樣本的屬性由一個(gè)n維特征向量X={x1,x2,…xn}表示,則計(jì)算屬性條件下的后驗(yàn)概率公式為:

        (2)

        其中,p(X)由于不依賴于分類可以被當(dāng)作是常數(shù),那么求解上式的最大值問題就變成求解p(X|ck)·p(ck)的最大值問題,對(duì)于每一個(gè)分類c1,c2,…,cn都經(jīng)過同樣計(jì)算后,未知樣本被判斷為ci類的條件是當(dāng)且僅當(dāng):

        p(X|ci)·p(ci)>p(X|ck)·p(ck)

        1≤i,k≤n;i≠k

        (3)

        經(jīng)過上述過程可以看到,樸素貝葉斯模型的算法邏輯簡(jiǎn)單易懂,能夠?yàn)楹芏喾诸悊栴}提供較為清晰的解釋性。且該模型對(duì)樣本數(shù)量的要求不嚴(yán)苛,方法的學(xué)習(xí)效率較高,具有較為廣泛的適用性。但是該模型的缺點(diǎn)也很明顯,即其對(duì)條件概率分布中條件相互獨(dú)立性的假設(shè),這在實(shí)際數(shù)據(jù)中往往會(huì)有無法滿足該假設(shè)的情況,從而會(huì)對(duì)分類結(jié)果的準(zhǔn)確性造成一定程度的影響[17]。

        3.支持向量機(jī)(SVM)模型

        支持向量機(jī)(SVM)模型是近些年常被討論的分類算法模型之一,優(yōu)秀的泛化能力使其在非線性識(shí)別問題中表現(xiàn)出較強(qiáng)的優(yōu)勢(shì)。其目標(biāo)函數(shù)和約束條件如下:

        (4)

        s.t.yi(ωTφ(xi)+b)≥1-εi

        其中,i=1,2,…,l;εi(εi≥0)為松弛變量,C(C>0)為懲罰系數(shù),φ(x)為非線性映射函數(shù),b為偏移,ω為權(quán)重向量,yi為研究問題所對(duì)應(yīng)的分類類別。在非線性問題中還會(huì)進(jìn)一步由拉格朗日函數(shù)對(duì)偶化上式,將核函數(shù)進(jìn)行引入從而得到最終的決策函數(shù)如下:

        (5)

        其中,αi為樣本對(duì)應(yīng)的拉格朗日乘子,K(xi,xj)為模型所選擇的核函數(shù)。

        實(shí)際操作中需要在眾多核函數(shù)中對(duì)所研究問題適用的核函數(shù)進(jìn)行選擇,并結(jié)合超參數(shù)的調(diào)優(yōu)找到適用于所研究問題的具體參數(shù)結(jié)構(gòu)。在模型結(jié)果判斷過程中,所應(yīng)用的SVM模型分類器是一個(gè)超平面f(x)=ωx-b=0,若f(x)>0則該點(diǎn)屬于類1,若f(x)<0則該點(diǎn)屬于類-1,而SVM模型的最優(yōu)分割使得這兩類中的點(diǎn)到超平面的距離最大化[18]。

        SVM模型對(duì)高維數(shù)據(jù)和低維數(shù)據(jù)都能進(jìn)行良好的學(xué)習(xí),因此被廣泛應(yīng)用于解決實(shí)際問題分類的研究中。但是該模型對(duì)解決多分類問題和大規(guī)模數(shù)據(jù)樣本問題存在一定的困難,需要進(jìn)一步改進(jìn)。本文在實(shí)證部分應(yīng)用Python軟件sklearn包中的SVC函數(shù)對(duì)P2P平臺(tái)進(jìn)行風(fēng)險(xiǎn)判別,在分析之前對(duì)數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化處理。

        4.隨機(jī)森林模型

        隨機(jī)森林模型也是一種有監(jiān)督的算法模型,該模型由眾多分類樹組成,其結(jié)果由眾多分類樹預(yù)測(cè)結(jié)果匯總進(jìn)而投票的方式而來。具體而言,該模型首先利用Bootstrap方法有放回地隨機(jī)抽取n個(gè)樣本,然后建立單棵樹的具有最佳分類特征作為節(jié)點(diǎn)的決策樹模型。重復(fù)上述過程k次,則形成了由k棵決策樹組成的隨機(jī)森林模型,對(duì)于每棵決策樹而言都有其對(duì)研究對(duì)象所屬類別的判斷結(jié)果,最終隨機(jī)森林會(huì)將多數(shù)決策樹的判定結(jié)果作為隨機(jī)森林模型的結(jié)果進(jìn)行匯報(bào)。

        隨機(jī)森林模型集合了眾多決策樹的結(jié)果,屬于一種集成算法。相較于傳統(tǒng)單棵樹的決策,該模型讓多棵樹參與決策,并選出支持率最高的分類結(jié)果,使得模型在運(yùn)算量沒有顯著增加的前提下提高了預(yù)測(cè)精度[19],且隨機(jī)森林模型實(shí)現(xiàn)簡(jiǎn)單、抗過擬合能力強(qiáng),因此被廣泛應(yīng)用于分類問題的研究。但是隨機(jī)森林模型的解釋性不太強(qiáng),當(dāng)模型中的單棵決策樹過多時(shí)還會(huì)使訓(xùn)練時(shí)間過長(zhǎng),需要斟酌單棵決策樹的個(gè)數(shù)。應(yīng)用此模型時(shí),本文利用Python軟件sklearn包中的RandomForestRegressor函數(shù)進(jìn)行風(fēng)險(xiǎn)判別,并對(duì)隨機(jī)森林模型中單棵決策樹的數(shù)量、單棵決策樹的深度等超參數(shù)進(jìn)行了調(diào)優(yōu)。

        下面具體應(yīng)用上述四種模型進(jìn)行實(shí)證,并對(duì)所研究問題的不同評(píng)價(jià)結(jié)果進(jìn)行對(duì)比分析。

        (二)數(shù)據(jù)來源及說明

        數(shù)據(jù)資料來源于國(guó)泰安CSMAR金融經(jīng)濟(jì)數(shù)據(jù)庫(kù)和P2P平臺(tái)第三方資訊網(wǎng)站:網(wǎng)貸之家和網(wǎng)貸天眼。限于數(shù)據(jù)可得性,本文從國(guó)泰安數(shù)據(jù)庫(kù)整理得到1 027家P2P平臺(tái)2015年9月27日至2019年2月26日共1 182天完整的511 568條成交數(shù)據(jù)、25 080條平臺(tái)信息數(shù)據(jù)和70 356條平臺(tái)產(chǎn)品信息數(shù)據(jù)。經(jīng)過與網(wǎng)貸之家網(wǎng)站、網(wǎng)貸天眼網(wǎng)站公開的P2P平臺(tái)數(shù)據(jù)進(jìn)行匹配,發(fā)現(xiàn)共有692家相同的P2P平臺(tái)信息可供采集。于是本文手動(dòng)收集了網(wǎng)貸之家網(wǎng)站692家各P2P網(wǎng)貸平臺(tái)的資金存管、風(fēng)險(xiǎn)準(zhǔn)備金、保障模式、投標(biāo)保障、擔(dān)保機(jī)構(gòu)信息以及網(wǎng)貸天眼網(wǎng)站問題平臺(tái)問題事件發(fā)生時(shí)間的數(shù)據(jù)。最后使用python軟件利用網(wǎng)絡(luò)爬蟲技術(shù)從網(wǎng)貸之家網(wǎng)站獲取了692家各P2P平臺(tái)打分信息、評(píng)論信息的網(wǎng)絡(luò)輿情資料。

        根據(jù)國(guó)泰安數(shù)據(jù)庫(kù)和網(wǎng)貸之家網(wǎng)站的平臺(tái)信息,將數(shù)據(jù)資料中顯示的出現(xiàn)跑路、停業(yè)、提現(xiàn)困難、經(jīng)偵介入、延期兌付、暫停發(fā)標(biāo)、網(wǎng)站關(guān)閉、爭(zhēng)議的平臺(tái)標(biāo)記為問題平臺(tái),具有高風(fēng)險(xiǎn)。而其他平臺(tái)則認(rèn)為截止到數(shù)據(jù)采集結(jié)束的2019年2月26日期間是沒有出現(xiàn)問題的,屬于正常平臺(tái),具有低風(fēng)險(xiǎn)。在實(shí)證分析部分利用構(gòu)建的風(fēng)險(xiǎn)評(píng)價(jià)體系對(duì)這兩類風(fēng)險(xiǎn)平臺(tái)進(jìn)行分類判別,屬于二分類的判別問題。經(jīng)過計(jì)算,在樣本的692家平臺(tái)中,共有343家問題平臺(tái)和349家正常平臺(tái),樣本的問題平臺(tái)數(shù)量和正常平臺(tái)數(shù)量比例良好。

        (三)模型實(shí)證

        在每次實(shí)證分析時(shí),對(duì)所應(yīng)用的模型隨機(jī)分配訓(xùn)練集和測(cè)試集[注]每次實(shí)證隨機(jī)抽取75%的數(shù)據(jù)樣本為訓(xùn)練集,25%的數(shù)據(jù)樣本為測(cè)試集。的數(shù)據(jù)樣本,并通過10折交叉驗(yàn)證和網(wǎng)格搜索的方法對(duì)模型中的超參數(shù)進(jìn)行調(diào)優(yōu)。在對(duì)比不同模型的分類效果時(shí),通常應(yīng)更關(guān)注模型在測(cè)試集上的表現(xiàn),因此對(duì)測(cè)試集上的最終結(jié)果進(jìn)行10次驗(yàn)證,得到了平均準(zhǔn)確率、精確率、召回率和F1-score[注]精確率、召回率和F1-score是模型準(zhǔn)確率之外對(duì)模型進(jìn)行評(píng)判的指標(biāo)。其中,精確率表示預(yù)測(cè)結(jié)果為問題平臺(tái)中真實(shí)為問題平臺(tái)的比例,召回率表示真實(shí)為問題平臺(tái)中預(yù)測(cè)結(jié)果為問題平臺(tái)的比例。F1-score則是精確率和召回率的調(diào)和平均,最大值是1,最小值是0。四項(xiàng)對(duì)模型分類效果進(jìn)行判斷的評(píng)價(jià)指標(biāo)。在進(jìn)行模型實(shí)證之前,對(duì)指標(biāo)體系中的逆指標(biāo)進(jìn)行了取倒數(shù)的正向化處理,并針對(duì)不同的模型要求進(jìn)行了指標(biāo)數(shù)據(jù)的歸一化、標(biāo)準(zhǔn)化處理。且所應(yīng)用的四種模型訓(xùn)練集效果均優(yōu)于測(cè)試集,因此不存在過擬合問題。具體的測(cè)試集結(jié)果如表2所示。

        表2 模型測(cè)試集結(jié)果比較

        通過機(jī)器學(xué)習(xí)模型調(diào)參的過程,可以知道P2P平臺(tái)的風(fēng)險(xiǎn)預(yù)測(cè)分類問題屬于復(fù)雜的非線性判別問題。從上表的四個(gè)模型結(jié)果可以看到,在問題平臺(tái)精確率指標(biāo)上SVM模型和樸素貝葉斯模型效果更好,能在結(jié)果中更精確的判別問題平臺(tái);而在其他三個(gè)指標(biāo)上SVM和隨機(jī)森林模型的測(cè)試集結(jié)果更好。因此,綜合來看,SVM模型對(duì)本文所研究的問題具有更強(qiáng)的分類判別能力。

        接著,利用10次驗(yàn)證取平均的方式得到隨機(jī)森林模型中指標(biāo)變量的重要性排序如表3所示。

        表3 隨機(jī)森林模型三級(jí)指標(biāo)變量重要性排名

        表3列出了隨機(jī)森林模型指標(biāo)變量重要性排序得到的排名前10的指標(biāo),其中資金存管是最重要的判斷指標(biāo)。運(yùn)營(yíng)時(shí)間則是排名第二的重要指標(biāo)變量,而平均利率指標(biāo)的重要性位列第三。

        從評(píng)價(jià)體系二級(jí)指標(biāo)的六個(gè)方面來看,把各三級(jí)指標(biāo)排序的結(jié)果得分加總,得到這六個(gè)方面二級(jí)指標(biāo)得分加總后的總得分,結(jié)果如表4。

        表4 評(píng)價(jià)體系二級(jí)指標(biāo)重要性排名

        從表4可知,在評(píng)價(jià)體系的二級(jí)指標(biāo)重要性排序中,風(fēng)險(xiǎn)防控信息排名第一,其次是評(píng)論信息,第三是交易信息,產(chǎn)品信息排名最后。在排名第一的風(fēng)險(xiǎn)防控信息中資金存管指標(biāo)更是位列所有30個(gè)三級(jí)指標(biāo)重要性的第一位,貼合評(píng)價(jià)體系目標(biāo),符合實(shí)際;評(píng)論信息排名第二則說明了外部信息的重要性,眾所周知,P2P平臺(tái)是依托互聯(lián)網(wǎng)為渠道進(jìn)行雙方交易的方式,很多網(wǎng)絡(luò)輿情信息被廣大投資者關(guān)注、交流,能夠在主觀上反映投資者的心態(tài),客觀上披露P2P平臺(tái)的狀態(tài),值得重點(diǎn)關(guān)注;排名第三的交易信息則能夠反映P2P平臺(tái)的歷史交易記錄,從這些定量數(shù)據(jù)中可以看到資金的流動(dòng)、變化情況,也具有一定的參考性;對(duì)于排名靠后的基礎(chǔ)信息,本文認(rèn)為基礎(chǔ)信息雖然能夠反映平臺(tái)本身的狀況,但所涵蓋的指標(biāo)更多地在平臺(tái)建立之初就已經(jīng)決定,變化可能性較小,對(duì)頻繁進(jìn)行交易的P2P平臺(tái)而言作用不大,唯一常常產(chǎn)生變化的就是運(yùn)營(yíng)時(shí)間指標(biāo),也可以在表3中看到它在三級(jí)指標(biāo)中的重要性很大,因此可以在基礎(chǔ)信息方面多留意P2P平臺(tái)的運(yùn)營(yíng)時(shí)間指標(biāo);資金信息和產(chǎn)品信息分別位列重要性排名的第五、第六位,這兩部分二級(jí)指標(biāo)中能夠?qū)^(qū)分問題平臺(tái)和正常平臺(tái)具有較強(qiáng)解釋能力的三級(jí)指標(biāo)是表3中的平均未來60日待還金額指標(biāo)和平均利率指標(biāo),介于現(xiàn)在P2P平臺(tái)已經(jīng)在中國(guó)發(fā)展了十余年,它的產(chǎn)品同質(zhì)性已經(jīng)較大,所以本文認(rèn)為產(chǎn)品信息并不如其他方面信息更具判斷性是合理的。另外對(duì)于資金信息,雖然都是定量數(shù)據(jù),但其中的三級(jí)指標(biāo)平均累計(jì)待還金額和平均近30日資金凈流入都屬于期限較長(zhǎng)跨度的指標(biāo),平均之后差別就不一定有其他指標(biāo)差距明顯,所以對(duì)判別P2P平臺(tái)風(fēng)險(xiǎn)的重要性就不具有鮮明的貢獻(xiàn),也是合理的。

        (四)重要指標(biāo)的樣本差異性分析

        通過表3可以看到風(fēng)險(xiǎn)評(píng)價(jià)體系中重要性排名前10的指標(biāo),這些指標(biāo)對(duì)判別問題平臺(tái)和正常平臺(tái)具有重要作用,那么這些指標(biāo)在樣本的兩類平臺(tái)(問題平臺(tái)和正常平臺(tái))之間均值的情況及差異性是怎樣的呢?是否具有顯著的差異性能夠區(qū)分兩類平臺(tái)?為了進(jìn)一步探究P2P平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)重要性排名前10指標(biāo)的樣本均值差異性問題,本文運(yùn)用方差分析F檢驗(yàn),得到表5的均值差異性檢驗(yàn)結(jié)果。為了進(jìn)一步分析,本文整理了描述性統(tǒng)計(jì)結(jié)果得到表6的定量指標(biāo)均值信息、表7的定性指標(biāo)數(shù)據(jù)信息。

        表5 重要性排名前10指標(biāo)的均值差異性檢驗(yàn)結(jié)果

        注:***表示在1%的水平上顯著,下文的表8同理。

        表6 重要性排名前10定量指標(biāo)的均值數(shù)據(jù)信息

        表7 重要性排名前10定性指標(biāo)的數(shù)據(jù)信息

        由表5可知,樣本數(shù)據(jù)中資金存管在正常平臺(tái)和問題平臺(tái)中存在顯著均值差異,且通過表7計(jì)算樣本平臺(tái)基本數(shù)據(jù)信息可知正常平臺(tái)樣本中僅有14%的平臺(tái)不具備資金存管,而問題平臺(tái)中則有65%的平臺(tái)都不具備資金存管,再次證明了資金存管的重要性。結(jié)合表5和表6可知,樣本數(shù)據(jù)中正常平臺(tái)運(yùn)營(yíng)時(shí)間指標(biāo)的均值顯著大于問題平臺(tái),而正常平臺(tái)的平均利率均值則顯著小于問題平臺(tái)。

        指標(biāo)變量重要性第四至第10位的指標(biāo)也均在樣本數(shù)據(jù)中的兩類平臺(tái)間存在顯著的均值差異。其中,重要性排名第四的平均未來60日待還金額指標(biāo)在正常平臺(tái)的均值顯著小于問題平臺(tái),可見正常平臺(tái)的待還壓力較小,資金流動(dòng)性較強(qiáng)。由評(píng)論信息文本挖掘得到的重要性排名第五的情感得分指標(biāo)在樣本數(shù)據(jù)的正常平臺(tái)中均值為0.651,顯著大于問題平臺(tái)的0.542,從側(cè)面顯示評(píng)論中挖掘的情感信息能較為客觀的反映平臺(tái)的狀態(tài)。由表6知,樣本數(shù)據(jù)中正常平臺(tái)的被關(guān)注程度均值為295.358,顯著大于問題平臺(tái)的141.761,而正常平臺(tái)的用戶推薦程度均值0.659與問題平臺(tái)的0.485也存在顯著差別。另外,正常平臺(tái)平均借款人數(shù)、平均借款期限和服務(wù)得分均值都顯著大于問題平臺(tái)。

        綜上,隨機(jī)森林模型指標(biāo)重要性排序前10的指標(biāo)均值都在樣本數(shù)據(jù)中顯著區(qū)別了兩類平臺(tái),這些指標(biāo)既具有重要性又具有樣本差異性,對(duì)判別P2P正常平臺(tái)和問題平臺(tái)具有重要作用。

        由表5可知,在重要性排名前10的指標(biāo)中,共有情感得分、用戶推薦程度、被關(guān)注程度和服務(wù)得分4個(gè)三級(jí)指標(biāo)都屬于二級(jí)指標(biāo)評(píng)論信息,可見評(píng)論信息指標(biāo)的重要性。因此,進(jìn)一步對(duì)評(píng)論信息二級(jí)指標(biāo)下的所有三級(jí)指標(biāo)進(jìn)行了樣本的均值差異性檢驗(yàn),整理后得到表8的檢驗(yàn)結(jié)果以及表9的均值信息。結(jié)果表明正常平臺(tái)的所有評(píng)論信息下的三級(jí)指標(biāo)均值都顯著大于問題平臺(tái),更加說明了評(píng)論信息能夠較為客觀的反映平臺(tái)狀態(tài),可見評(píng)論信息的內(nèi)容具有一定的參考性,值得投資者進(jìn)行關(guān)注。

        表8 評(píng)論信息三級(jí)指標(biāo)的均值差異性檢驗(yàn)結(jié)果

        表9 評(píng)論信息三級(jí)指標(biāo)的均值數(shù)據(jù)信息

        五、結(jié)論與建議

        本文綜合運(yùn)用了平臺(tái)本身、網(wǎng)絡(luò)輿情和P2P第三方資訊網(wǎng)站的評(píng)價(jià)信息構(gòu)建了定性定量相結(jié)合的P2P平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)體系,共涵蓋2個(gè)一級(jí)指標(biāo),6個(gè)二級(jí)指標(biāo)和30個(gè)三級(jí)指標(biāo)。選擇Logistic回歸模型、樸素貝葉斯模型、隨機(jī)森林模型以及SVM模型對(duì)P2P平臺(tái)的風(fēng)險(xiǎn)進(jìn)行判別。從4個(gè)模型的實(shí)證判別結(jié)果可以看到,在問題平臺(tái)精確率指標(biāo)上SVM模型和樸素貝葉斯模型的效果更好,而在模型準(zhǔn)確率、召回率和F1-score指標(biāo)上SVM和隨機(jī)森林模型的測(cè)試集結(jié)果更好。因此,在本文所研究的P2P平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)問題中,總體而言能夠更好地區(qū)分問題平臺(tái)和正常平臺(tái)的是SVM模型,建議在對(duì)新的P2P平臺(tái)進(jìn)行風(fēng)險(xiǎn)判別中應(yīng)用SVM模型進(jìn)行判斷。另外,由隨機(jī)森林模型得到的P2P平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)變量指標(biāo)重要性排序結(jié)果顯示,在本文評(píng)價(jià)體系的三級(jí)指標(biāo)中,資金存管是最重要的判別P2P平臺(tái)風(fēng)險(xiǎn)的指標(biāo),其次是運(yùn)營(yíng)時(shí)間,平均利率指標(biāo)則位列第三。在評(píng)價(jià)體系二級(jí)指標(biāo)中,風(fēng)險(xiǎn)防控信息排名第一,其次是評(píng)論信息,排名第三的為交易信息。

        通過上述研究,建議P2P平臺(tái)向資金存管方向發(fā)展。資金存管指標(biāo)作為三級(jí)指標(biāo)是最重要的判別P2P平臺(tái)風(fēng)險(xiǎn)的指標(biāo),且在樣本平臺(tái)中正常平臺(tái)資金存管的數(shù)量顯著大于問題平臺(tái),說明正常平臺(tái)更傾向于進(jìn)行資金存管。而資金存管所在的二級(jí)指標(biāo)風(fēng)險(xiǎn)防控信息指標(biāo)也是最重要的二級(jí)指標(biāo),資金存管又在其中的貢獻(xiàn)最大。進(jìn)一步說明了加強(qiáng)風(fēng)險(xiǎn)防控、向資金存管方向轉(zhuǎn)變的重要性。因此,監(jiān)管方應(yīng)及時(shí)督促未進(jìn)行資金存管的平臺(tái)加快資金存管步伐,將資金存管納入P2P行業(yè)標(biāo)準(zhǔn),使開展借貸業(yè)務(wù)的P2P平臺(tái)都有合規(guī)的、嚴(yán)格的資金存管渠道,而對(duì)一些未進(jìn)行資金存管或資金存管不規(guī)范的P2P平臺(tái)進(jìn)行限期整改。其次,運(yùn)營(yíng)時(shí)間作為判別P2P平臺(tái)風(fēng)險(xiǎn)三級(jí)指標(biāo)中重要性排名第二的指標(biāo)也應(yīng)給予關(guān)注,建議投資者慎重選擇新上線的、運(yùn)營(yíng)時(shí)間較短的平臺(tái),這些新平臺(tái)可能為了吸引廣大用戶而采取一些大幅度的優(yōu)惠措施欺騙投資者,使投資者遭受經(jīng)濟(jì)損失。通過樣本平臺(tái)運(yùn)營(yíng)時(shí)間指標(biāo)的均值差異性分析可以看到,正常平臺(tái)的運(yùn)營(yíng)時(shí)間均值都是顯著大于問題平臺(tái)的。因此,監(jiān)管方應(yīng)督促投資者優(yōu)先選擇運(yùn)營(yíng)時(shí)間長(zhǎng)的平臺(tái)進(jìn)行投資,不盲目追求一些新平臺(tái)提供的一時(shí)的利益。另外,三級(jí)指標(biāo)平均利率作為判別P2P平臺(tái)風(fēng)險(xiǎn)重要性排名第三的指標(biāo)也需要進(jìn)行關(guān)注,高利率因其代表的高收益而廣受投資者青睞,但高利率是把雙刃劍,利率高的產(chǎn)品也可能成為問題平臺(tái)吸引投資者的噱頭,在樣本平臺(tái)中,問題平臺(tái)的平均利率指標(biāo)均值就顯著大于正常平臺(tái)。因此,投資者需要謹(jǐn)慎選擇高利率產(chǎn)品,注意產(chǎn)品條款中的標(biāo)的內(nèi)容要求,不單一追求高利率產(chǎn)品。監(jiān)管方則應(yīng)完善行業(yè)產(chǎn)品規(guī)范,管理P2P產(chǎn)品屬性,對(duì)高利率的P2P產(chǎn)品重點(diǎn)監(jiān)督,進(jìn)行跟蹤調(diào)查。

        評(píng)論信息在P2P平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)二級(jí)指標(biāo)重要性中排名第二,且樣本數(shù)據(jù)顯示評(píng)論信息中的所有三級(jí)指標(biāo)在正常平臺(tái)中的均值都顯著大于在問題平臺(tái)中的結(jié)果,說明評(píng)論信息能夠較為客觀的反映平臺(tái)的狀態(tài),鑒于這些資料也較易獲得,建議投資者多關(guān)注意向平臺(tái)網(wǎng)友的評(píng)論內(nèi)容和網(wǎng)絡(luò)輿情資料,觀察后再選擇是否進(jìn)行投資,監(jiān)管方則要維護(hù)評(píng)論等輿情資料的透明以供投資者參考,嚴(yán)防平臺(tái)刷好評(píng)、控制評(píng)論等行為的發(fā)生。

        通過對(duì)隨機(jī)森林結(jié)果中重要性排名前10的指標(biāo)進(jìn)行均值差異性分析,可以得到正常平臺(tái)的平均借款人數(shù)、平均借款期限均值都顯著大于問題平臺(tái),而平均未來60日待還金額均值小于問題平臺(tái)。這說明正常平臺(tái)人氣更高、資金流動(dòng)性更強(qiáng),且都偏向于提供期限長(zhǎng)一些的借款標(biāo)的。因此,建議投資者關(guān)注這些特征對(duì)平臺(tái)進(jìn)行選擇,在平臺(tái)人氣方面,建議監(jiān)管方要求P2P平臺(tái)如實(shí)公布平臺(tái)活躍用戶數(shù)量,為廣大投資者選擇平臺(tái)提供參考,避免一些平臺(tái)造假用戶群體意圖形成用戶眾多的假象;在資金流動(dòng)性方面,建議監(jiān)管方設(shè)定行業(yè)最低可流動(dòng)性資金要求,一方面為不同投資者的資金需求提供一定的便利,另一方面對(duì)平臺(tái)的資金要求提供一定標(biāo)準(zhǔn),把一些無法保證基本資金要求的平臺(tái)禁止在行業(yè)之外以防范風(fēng)險(xiǎn);在借款期限上則建議投資者選擇更有把握的期限長(zhǎng)度,如有可能可以選擇借款期限稍長(zhǎng)的標(biāo)的,不要貪圖短期借款標(biāo)的誘惑,以防范風(fēng)險(xiǎn)。監(jiān)管方也應(yīng)對(duì)P2P平臺(tái)上線產(chǎn)品的借款期限加以把控,制定出一定的行業(yè)標(biāo)準(zhǔn)進(jìn)行嚴(yán)格監(jiān)督。

        猜你喜歡
        網(wǎng)貸均值樣本
        用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
        P2P網(wǎng)貸中的消費(fèi)者權(quán)益保護(hù)
        推動(dòng)醫(yī)改的“直銷樣本”
        網(wǎng)貸平臺(tái)未來亟需轉(zhuǎn)型
        商周刊(2017年17期)2017-09-08 13:08:58
        網(wǎng)貸十年:迎來“去偽存真” 時(shí)代
        商周刊(2017年17期)2017-09-08 13:08:58
        隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
        均值不等式失效時(shí)的解決方法
        均值與方差在生活中的應(yīng)用
        村企共贏的樣本
        中國(guó)網(wǎng)貸地圖
        中文字幕人妻饥渴浪妇| 妺妺窝人体色www聚色窝| 天堂a版一区二区av| 国产情侣自拍在线视频| 国产69精品久久久久久久| 欧美成人形色生活片| 日韩av无码午夜福利电影| 国产在线精品成人一区二区三区| 亚洲sm另类一区二区三区| 美女大量吞精在线观看456| 无码精品人妻一区二区三区98| 日本不卡视频一区二区三区| 久久婷婷五月综合97色一本一本| 无码视频一区二区三区在线观看| 成人免费丝袜美腿视频| 日本乱码一区二区三区在线观看| 中文字幕人妻熟在线影院 | 国产精品视频免费一区二区三区 | 免费a级毛片无码a∨蜜芽试看| 欧美巨大巨粗黑人性aaaaaa| 手机色在线| 尤物精品国产亚洲亚洲av麻豆| 亚洲日韩精品一区二区三区| 狠狠色狠狠色综合久久第一次 | 无码人妻丰满熟妇区五十路| 亚洲在AV极品无码天堂手机版| 中文字幕成人精品久久不卡| 日韩在线观看入口一二三四| 夜夜未满十八勿进的爽爽影院| 精品熟女少妇免费久久| 日韩中文字幕熟女人妻| 久久久www成人免费毛片| 国内精品久久久影院| 成人全视频在线观看免费播放| 亚洲国产精品久久精品 | 日本一区不卡在线| 免费av网址一区二区| 国产 一二三四五六| 欧美熟妇精品一区二区三区| 久久久亚洲精品一区二区| 精品亚洲麻豆1区2区3区|