吳楠
摘?要?借助網(wǎng)絡(luò)爬蟲技術(shù)手段獲取“人人貸”平臺上借款人的各項(xiàng)信息,提取兩個(gè)樣本:分為全國隨機(jī)樣本和湖南省隨機(jī)樣本,構(gòu)建二元Logit回歸模型,分析其中對違約率有顯著影響的變量.研究表明,負(fù)債收入比、借款期限、學(xué)歷、房產(chǎn)、房貸、描述指數(shù)對違約行為有負(fù)向影響,而借款利率、車產(chǎn)、認(rèn)證個(gè)數(shù)對借款者違約行為有正向影響.同時(shí),通過對兩個(gè)樣本最終回歸模型的比較,發(fā)現(xiàn)湖南省違約人特征與全國隨機(jī)樣本中體現(xiàn)的違約人特征基本一致,但其中較為特殊的是,在湖南擁有房產(chǎn)和車產(chǎn)不能作為網(wǎng)絡(luò)借款人履約能力提升的標(biāo)志.
關(guān)鍵詞?P2P網(wǎng)絡(luò)借貸平臺;地域特點(diǎn);違約人特征
中圖分類號?F832.4文獻(xiàn)標(biāo)識碼?A
Abstract?This paper obtains the information of the borrowers on the "renrendai"net loan platform with the help of the web crawler technology, and extracts two samples: the random samples of the whole country and the random samples of Hunan province. A binary Logit regression model is built to analyze the variables which have significant influence on the default rate. The study shows that the debt-to-income ratio, the maturity of the loan, the educational background, the property, the mortgage and the description index have a negative impact on the default behavior, while the interest rate of the loan, owning cars and the number of certification have a positive impact on the default behavior of the borrowers.At the same time, through the comparison of the final regression model of two samples, it is found that the characteristics of the defaulters in Hunan province is basically consistent with the random samples of the whole country, but especially, the ownership of real estate and car can not help to improve the performance of network borrowers in Hunan.
Key words?P2P net loan platform;regional characteristics;characteristics of defaulter
1?引?言
P2P網(wǎng)貸平臺在短短十幾年內(nèi)從萌芽到興盛至較穩(wěn)定的發(fā)展獲得了金融界內(nèi)外足夠的關(guān)注度.尤其在中國,從2013年至今,P2P平臺由最高峰時(shí)期的六千多家,此間經(jīng)歷的起伏既是行業(yè)發(fā)展的全景圖,也是新金融不斷演進(jìn)的一個(gè)側(cè)面反映.針對P2P的研究在最近幾年可謂多角度、多層次、全方位展開,課題組從2015年開始專門針對湖南省內(nèi)的網(wǎng)貸平臺進(jìn)行研究,取得了一些成果,而隨著研究的深入,和更多機(jī)構(gòu)人員的參與,網(wǎng)貸違約人的特點(diǎn)開始逐漸進(jìn)入課題組視野.
相較于正規(guī)金融的高門檻、嚴(yán)監(jiān)管,P2P網(wǎng)貸平臺因其審核簡單,授信要求低成為許多被正規(guī)金融拒絕的借款人首選,因此網(wǎng)貸平臺違約率偏高也是在意料之中.而平臺投資人由于只能看到借款人發(fā)布的信息,缺乏其他手段判斷對方的實(shí)際信用,很難規(guī)避因真實(shí)信息不對稱帶來的逆向選擇和道德風(fēng)險(xiǎn).而我國目前P2P行業(yè)內(nèi)征信體系不完善,也不能接入正規(guī)金融的征信系統(tǒng)當(dāng)中,加之整體征信環(huán)境尚待成熟,在這種缺乏完善違約風(fēng)險(xiǎn)管控技術(shù)的背景中,用技術(shù)手段對借款者表現(xiàn)特征進(jìn)行分析進(jìn)而判斷違約概率是很有必要的.因此,課題組吸取了多個(gè)研究文獻(xiàn)和研究團(tuán)隊(duì)的經(jīng)驗(yàn),結(jié)合湖南省實(shí)際,選取對違約率有可能有影響的借款信息要素,構(gòu)建二元Logit回歸模型,分析了其中有顯著影響的違約人特征信息,并通過省域樣本和全國樣本的結(jié)果比照,得出湖南省網(wǎng)貸違約人區(qū)別于全國樣本的特點(diǎn),對區(qū)域內(nèi)網(wǎng)貸使用人信用評價(jià)有一定的啟示作用.
2?文獻(xiàn)綜述
國外學(xué)者對網(wǎng)貸違約人問題研究起步比較早,幾乎伴隨lending club和prosper兩大P2P平臺上線就開始關(guān)注這一群體特征.Kumar(2007)指出借款額度與借款者違約率正相關(guān),而信用級別和認(rèn)證信息與借款者違約率負(fù)相關(guān)[1].Herzenstein等(2011)以Prosper上的借款申請為樣本,歸納了“可靠”、“成功”、“經(jīng)濟(jì)困難”、“宗教信仰”、“品德高尚”、“勤奮”等6個(gè)語言維度,發(fā)現(xiàn)信用級別低的借款人會傾向于用更多的描述性信息,而實(shí)際中確實(shí)描述性信息越多越容易借款成功,但結(jié)果確是違約率更高[2].Pope等(2011)通過對違約人年齡分布發(fā)現(xiàn)35~60歲之間的人違約概率相比其他年齡段更低[3].Duarte 等 (2012)全面分析了容貌對 P2P 網(wǎng)絡(luò)借貸交易的影響.通過對網(wǎng)貸平臺上上傳借款者照片的信息進(jìn)行研究,他們發(fā)現(xiàn)從照片上看起來比較可靠的人具有更高的借款成功率.進(jìn)一步發(fā)現(xiàn),長相可靠的人信用評級比較高,違約的可能性也比較低[4].Nowak等(2015)等通過實(shí)證分析指出收入越高的人,違約概率也越低[5].
國內(nèi)研究者對P2P平臺的研究早期側(cè)重在平臺模式、平臺風(fēng)險(xiǎn)以及投資人選擇模式等角度,從2013年開始有較多學(xué)者開始關(guān)注網(wǎng)貸違約人特征.陳霄等(2013)在對 P2P 網(wǎng)絡(luò)借貸參與者逾期行為理論分析的基礎(chǔ)上,采用 Logit回歸分析得出結(jié)果:借款方信用等級、個(gè)人收入、居住地區(qū)、生活狀況、成功借款次數(shù)和按時(shí)還款次數(shù)對借款方逾期率具有顯著的負(fù)向作用;受教育年限、逾期還款次數(shù)、借款利率、借款時(shí)間等對借款人逾期率具有顯著的正向作用.繆蓮英和陳金龍(2014)以推薦信任與小組關(guān)系、朋友關(guān)系作為社會資本的代理變量分析其對借款者違約風(fēng)險(xiǎn)的制約機(jī)制[6],以 Prosper 網(wǎng)絡(luò)借貸平臺的數(shù)據(jù)進(jìn)行實(shí)證檢驗(yàn),研究發(fā)現(xiàn)在 P2P 網(wǎng)絡(luò)借貸中,社會資本能夠降低借款人違約風(fēng)險(xiǎn).王會娟和廖理(2014)以53653個(gè)“人人貸”的網(wǎng)站數(shù)據(jù),研究 P2P 網(wǎng)絡(luò)借貸平臺的信用認(rèn)證機(jī)制對借貸行為的影響,結(jié)果表明,較高信用評級會提高借款成功率[7].文章也詳細(xì)分析了認(rèn)證指標(biāo)和認(rèn)證方式對 P2P 借貸行為的影響.他們指出,工作認(rèn)證 、收入認(rèn)證、視頻認(rèn)證和車產(chǎn)、房產(chǎn)認(rèn)證等認(rèn)證指標(biāo)對 P2P 借貸行為的影響較為顯著.不僅如此,實(shí)證結(jié)果表明“人人貸”的信用認(rèn)證可以起到提示信用風(fēng)險(xiǎn)的作用,進(jìn)而降低了借貸雙方信息不對稱程度.文章也指出評級指標(biāo)過于單一,這使得其風(fēng)險(xiǎn)提示作用有限.廖理等(2014)運(yùn)用 6453 個(gè)來源于人人貸的有效訂單驗(yàn)證實(shí)了我國互聯(lián)網(wǎng)金融存在地區(qū)偏好性歧視現(xiàn)象,即地區(qū)差異對訂單成功率有影響,對違約率沒有影響,并指出這是一種非理性的歧視[8].顧慧瑩等(2015)對WDW車貸平臺的數(shù)據(jù)做研究,找到了借款人違約的關(guān)鍵因素,指出軟信息更能體現(xiàn)借款動機(jī)和償還意愿,平臺信用評級和違約率存在顯著負(fù)相關(guān)[9].王重潤等(2016)以“紅嶺創(chuàng)投”的交易數(shù)據(jù)中選取了借款人相關(guān)的9個(gè)特征因素,用Logit分析表明,借款利率、期限、用途、提前還款次數(shù)和逾期還款次數(shù)對借款者違約行為有顯著正向影響,而借款金額、信用積分、戶口所在地和正常還款次數(shù)對違約行為有顯著負(fù)向影響[10].于軍(2017)從語言信息含量和內(nèi)容兩個(gè)角度研究描述性信息和違約之間的關(guān)系,實(shí)證分析表明描述性信息信息量越大,借款人越不容易違約[11].
綜合而言,國內(nèi)外學(xué)者針對違約人行為展開了多層次的研究,涉及人際關(guān)系、借款人“硬”“軟”信息呈現(xiàn)、地域歧視等.但針對某一區(qū)域違約人是否存在明顯的區(qū)域特征還未有研究呈現(xiàn).因此,課題組針對湖南省網(wǎng)貸違約人特征展開了進(jìn)一步研究.
3?研究設(shè)計(jì)
3.1?數(shù)據(jù)來源和樣本選取
“人人貸”平臺成立于2010年,是較早一批平臺中公信力及各項(xiàng)指標(biāo)都保持平穩(wěn)的典型平臺,在網(wǎng)貸之家、網(wǎng)貸天眼等第三方評級網(wǎng)站中排名一直較為靠前(前10名內(nèi)).因此,本文選取“人人貸”平臺上的數(shù)據(jù)作為研究對象,應(yīng)該能較好地反映網(wǎng)貸人群的真實(shí)特點(diǎn).課題組利用網(wǎng)絡(luò)爬蟲這一技術(shù)手段爬取了2015年
選擇2015年數(shù)據(jù)的原因?yàn)椋捍_認(rèn)為壞賬的時(shí)間.因?yàn)榫W(wǎng)貸期限大部分分布在1個(gè)月到36個(gè)月之間.如選擇2017年數(shù)據(jù),則無壞賬呈現(xiàn). “人人貸”平臺上的借款數(shù)據(jù)信息,建立了兩個(gè)樣本庫,一個(gè)為全國隨機(jī)樣本(簡稱為Sample1),共有數(shù)據(jù)1326條,另一為湖南省隨機(jī)樣本(簡稱為Sample2),共有數(shù)據(jù)442條.將通過對兩個(gè)樣本的實(shí)證研究來驗(yàn)證違約人特征是否具有區(qū)域性特點(diǎn).
3.2理論假設(shè)和變量選擇
本課題的基本前提假設(shè)即:借款人的某些信息與借款違約行為是有概率聯(lián)系的.理論上來看,借款人違約的影響因素應(yīng)包括項(xiàng)目本身的基本要素,如借款目的、金額、利率、期限等,還有與借款人本身相關(guān)的各類因素,如借款人經(jīng)濟(jì)狀況、信用狀況等.Iyer等(2009)將借款人信息分為“硬”和“軟”兩類,“硬”信息指能夠被客觀證實(shí)的內(nèi)容[12],如借款人身份信息、借款項(xiàng)目信息;而“軟”信息則是指不能被直接證實(shí)的內(nèi)容,如借款人對借款目的的文字描述等.Greiner&Wang(2010)則把借款人信息分為經(jīng)濟(jì)信息和社會信息,經(jīng)濟(jì)信息用以衡量借款人的還款能力,社會信息衡量借款人的借款能力并以借款人是否參與聯(lián)合借款作為判斷標(biāo)準(zhǔn)[13].本課題組除參考以上分類方式外,還借鑒了顧慧瑩、王重潤等研究者的信息分類方法,將獲得的數(shù)據(jù)分為四類,分別是借款人自身特征信息、借款人經(jīng)濟(jì)信息、借款標(biāo)的信息和平臺信息.詳細(xì)分類說明和假設(shè)為:
借款人的自身特征信息,包括性別、年齡、婚姻狀況、教育水平.
此類信息能夠反映借款人的社會分類屬性和某些個(gè)體特點(diǎn),較多文獻(xiàn)都通過定性和定量分析傾向于認(rèn)為女性比男性更可能按時(shí)償還借款(Dinh & Kleimeier,2007;Roslan & Karim,2009)[14-15].課題組在此處假設(shè):
H1?相較于女性借款人,男性借款人更傾向于違約.
一般認(rèn)知中會認(rèn)為年齡大的借款人會比年齡小的借款人更具有風(fēng)險(xiǎn)規(guī)避性,傾向于完成承諾,按時(shí)還款.Arminger等(1997)等通過實(shí)證分析也確認(rèn)了這一點(diǎn),即年輕借款人的不夠成熟和缺乏耐心,更傾向于違約[16].所以課題組假設(shè):
H2?借款人年齡和違約率負(fù)相關(guān).
婚姻狀況在我國文化認(rèn)知中是一個(gè)人趨于穩(wěn)定的象征,一般會認(rèn)為已婚人士因?yàn)橛屑彝ヘ?zé)任而更傾向于履約.但在Dinh&Kleimeier(2007)的研究中卻發(fā)現(xiàn)已婚人群的還款性更低,解釋為已婚借款人由于家庭負(fù)擔(dān),經(jīng)濟(jì)壓力更大,因此更容易違約.課題組經(jīng)過探討,認(rèn)為在我國婚姻仍舊是一個(gè)人走向成熟穩(wěn)定的標(biāo)志,婚姻中如兩人都有工作則家庭整體償債能力上升,而單身、離異或喪偶的借款人相較于核心家庭償債能力會弱一些.故而課題組仍舊假設(shè):
H3?處于婚姻狀態(tài)中的借款人相較于不處于婚姻狀態(tài)中的借款人(未婚、離異、喪偶)違約率更低,即已婚狀態(tài)與網(wǎng)貸違約率負(fù)相關(guān).
教育水平在學(xué)者的研究中都是與違約率負(fù)相關(guān),即借款人所受教育年限越長,學(xué)歷越高,借款違約率越低(廖理,2015).這也符合一般認(rèn)知,課題組假設(shè):
H4?高學(xué)歷借款人違約風(fēng)險(xiǎn)較低,即學(xué)歷和網(wǎng)貸違約率負(fù)相關(guān).
借款人經(jīng)濟(jì)信息:債務(wù)收入比,有無房產(chǎn),有無車產(chǎn),有無房貸,有無車貸.
此類信息是衡量借款人償債能力的重要指標(biāo),基本都是直接與償還能力相關(guān).其中最直接的就是債務(wù)收入比,Lin等(2013)認(rèn)為經(jīng)濟(jì)強(qiáng)度最重要的指標(biāo)就是債務(wù)收入比,比值越高,說明借款人償債能力強(qiáng)[17].課題組經(jīng)過對數(shù)據(jù)的考量,將債務(wù)收入比與Lin等的比法剛好做一個(gè)倒數(shù)處理,即Lin用的是年收入/借款金額,而本課題中用的是借款金額/月收入,這是由于平臺提供原始數(shù)據(jù)的不同而做的相應(yīng)處理,實(shí)際衡量結(jié)果的表征意義不會改變,只是正負(fù)相關(guān)解釋剛好相反,且數(shù)據(jù)都變成了非小數(shù),利于數(shù)據(jù)衡量的穩(wěn)定性.
H5?借款人的債務(wù)收入比與網(wǎng)貸違約率正相關(guān).
借款人的房屋產(chǎn)權(quán)對借款違約率也會產(chǎn)生影響,Greiner&Wang(2009)分析檢驗(yàn)了有房產(chǎn)的借款人生活相對穩(wěn)定,還款能力強(qiáng).中國人的傳統(tǒng)觀念里也普遍認(rèn)可,有恒產(chǎn)者有恒心.所以課題組假設(shè):
H6?借款人是否擁有房屋與借款違約率負(fù)相關(guān).
借款人擁有車產(chǎn)的衡量意義較少納入國外學(xué)者的研究范疇中,因?yàn)樵趪猓ㄌ貏e是歐洲、美國)車只是作為一種代步交通工具,納入個(gè)人財(cái)產(chǎn)考量意義不大.但課題組經(jīng)過探討認(rèn)為,在國內(nèi)車產(chǎn)目前仍舊可以作為一個(gè)財(cái)產(chǎn)衡量標(biāo)志,是否擁有車輛在中國人的認(rèn)知范疇內(nèi)是一個(gè)家庭或者個(gè)人經(jīng)濟(jì)實(shí)力或社會勞動能力的體現(xiàn)
在這里主要是指某人或某個(gè)家庭是否需要一輛車來完成家庭收入的需要,如跑運(yùn)輸?shù)?,或業(yè)務(wù)活動量大的工作等..因此假設(shè):
H7?擁有車產(chǎn)說明家庭經(jīng)濟(jì)實(shí)力較強(qiáng)或勞動能力強(qiáng),所以與網(wǎng)貸違約率負(fù)相關(guān).
在具體的個(gè)人經(jīng)濟(jì)信息中分類,擁有房產(chǎn)和車產(chǎn)償債能力則被認(rèn)可為更強(qiáng),但從另一方面看,現(xiàn)代社會對金融工具的應(yīng)用使得個(gè)人加杠桿情況增加,因此在個(gè)人在有房有車的情況下,可能還有房貸和車貸,房貸與車貸一般都是按月償還,對個(gè)人收入穩(wěn)定性要求比較高,自然會擠壓借款人的資金空間,因此課題組假設(shè):
H8?有房貸需要償還與網(wǎng)貸違約率正相關(guān).
H9?有車貸需要償還與網(wǎng)貸違約率正相關(guān).
借款標(biāo)的信息:借款金額、利率、期限、用途.
借款標(biāo)的信息是直接反映借款需求并影響投資者決策的最主要信息,其中借款金額因?yàn)榉讲钶^大,所以在變量選擇時(shí)將其與收入結(jié)合,形成債務(wù)收入比,在借款人經(jīng)濟(jì)信息中已經(jīng)納含,故此處不再重復(fù)使用.大部分的研究中借款利率都被認(rèn)為與違約率正相關(guān)(王重潤,2016),因?yàn)榻杩罾矢哒f明借款人必須用高利率來吸引投資者,一方面說明借款人質(zhì)量低,同時(shí)也反映到借款人的融資成本高,償還更加困難.故而課題組假設(shè):
H10?借款利率越高,借款人質(zhì)量越低,與網(wǎng)貸違約率正相關(guān).
借款期限在平臺上一般為1~36個(gè)月,王重潤(2015)通過實(shí)證分析證明借款期限對違約行為有正向影響,符合一般認(rèn)知,因?yàn)榻杩钇谙揲L,說明可能借款者的財(cái)務(wù)狀況不確定更大,違約行為可能性也越大.故而假設(shè):
H11?借款期限與網(wǎng)貸違約率正相關(guān).
借款用途是不太好權(quán)衡的一個(gè)變量,課題組經(jīng)過探討認(rèn)為個(gè)人消費(fèi)的貸款違約率應(yīng)該小于投資經(jīng)營和短期周轉(zhuǎn),因?yàn)楹髢烧邔儆谏a(chǎn)經(jīng)營范疇,面臨的各類風(fēng)險(xiǎn)大,而消費(fèi)貸款的還款來源一般是個(gè)人和家庭收入,相對穩(wěn)定和可預(yù)期.因此假設(shè):
H12?偏消費(fèi)的借款類型與網(wǎng)貸違約率負(fù)相關(guān).
平臺信息:平臺認(rèn)證個(gè)數(shù),描述指數(shù).
平臺信息主要反映P2P網(wǎng)貸平臺作為信息中介對借款人信用的第三方測度.“人人貸”平臺上有專屬的平臺信用打分,但因?yàn)槭呛笙虼蚍?,即分?jǐn)?shù)會根據(jù)借款人的行為調(diào)整,所以不取這一分?jǐn)?shù).而取用的是平臺認(rèn)證個(gè)數(shù)和描述指數(shù).其中平臺認(rèn)證個(gè)數(shù)是借款人在發(fā)布借款信息前后愿意提交的各類個(gè)人信息認(rèn)證,如身份證、電話、短信、頭銜、工作地點(diǎn)等等,總數(shù)目多達(dá)24個(gè),課題組認(rèn)為認(rèn)證的個(gè)數(shù)越多,該借款人的違約率越低.描述指數(shù)是人人貸平臺根據(jù)借款人在平臺上填寫的各類信息以及借款說明等給出的一個(gè)平臺打分.一般而言,描述指數(shù)越高的會靠前推薦給投資人,所以課題組傾向于認(rèn)可描述指數(shù)越高,違約率越低.給出假設(shè)如下:
H13?平臺認(rèn)證個(gè)數(shù)與網(wǎng)貸違約率負(fù)相關(guān).
H14?平臺描述指數(shù)與網(wǎng)貸違約率負(fù)相關(guān).
3.3?實(shí)證模型設(shè)計(jì)
4?實(shí)證分析
4.1?模型檢驗(yàn)
4.1.1?模型整體性顯著性檢驗(yàn)
對模型整體顯著性檢驗(yàn)在Logit分析中有一步模型系數(shù)綜合檢驗(yàn)(Omnibus Tests of Model Coefficients),檢驗(yàn)似然比(LR)統(tǒng)計(jì)量,可以測定模型是否整體顯著.Sample1和Sample2輸出結(jié)果見表2和表3.
可見Sig.值都小于0.05,可以拒絕原假設(shè),而且在此檢驗(yàn)中,兩個(gè)樣本的Sig.值都小于0.01,說明差異極顯著,模型整體顯著性較好.
4.1.2?變量顯著性檢驗(yàn)
本文設(shè)計(jì)模型中功有14個(gè)解釋變量,數(shù)目較多,因此需要對更有解釋力的變量進(jìn)行篩選.二元Logit模型中有篩選方法可供選擇,分為前進(jìn)篩選法和后退篩選法.其中前進(jìn)篩選法是將變量逐個(gè)引入模型進(jìn)行篩選,后退篩選法則是先將所有解釋變量放入模型,再逐個(gè)剔除不顯著的變量.針對本文中的模型,更適合采用后退篩選法.Sample1和Sample2的檢驗(yàn)結(jié)果見表4和表5.
經(jīng)過二元Logit模型后向篩選,Sample1中剩余9個(gè)解釋變量,Sample2中剩余4個(gè)解釋變量.Sample2中剩余的解釋變量全部包含與Sample1中,一方面說明全國隨機(jī)樣本解釋力較強(qiáng),另一方面也說明需要探尋為何有些變量在Sample2中被剔除的原因.為了更好的展示解釋變量在Sample1和Sample2中的關(guān)系,用圖1表示為:
4.2?實(shí)證結(jié)果分析
4.2.1?總體分析
從表4和表5中可以看出,Sample1和Sample2中最后的解釋變量Sig.值都小于0.05,說明留下的變量都在5%的顯著性水平上對模型有顯著影響.由于Logit模型中的變量系數(shù)不能被解釋為對因變量的邊際影響,故系數(shù)大小沒有特定的經(jīng)濟(jì)解釋意義,但系數(shù)符號能充分說明自變量對因變量的正負(fù)相關(guān)關(guān)系.若解釋變量系數(shù)為正,則表明解釋變量對因變量有正向影響,則因變量取值為1的概率越大,在本模型中,即違約概率越大.啞變量的正負(fù)系數(shù)可參照啞變量設(shè)定時(shí)的解釋意義分析,如房產(chǎn)這一啞變量,設(shè)定有為0,無為1,回歸模型中系數(shù)為負(fù)值,與假設(shè)H6一致,接受原假設(shè),即借款人是否擁有房屋與借款違約率負(fù)相關(guān).課題組發(fā)現(xiàn)所有Sample1和Sample2共有的解釋變量正負(fù)號一致,即相關(guān)性一致(見表6).
這里有三點(diǎn)值得說明,第一,兩個(gè)樣本的解釋變量具有特征一致性,且符合包含邏輯,大樣本包含小樣本中所有解釋變量特征.第二,說明全國隨機(jī)樣本的解釋范疇更寬.第三,兩個(gè)樣本之間沒有出現(xiàn)異常解釋變量——即Sample2中出現(xiàn)Sample1中被剔除的變量,說明兩個(gè)樣本符合隨機(jī)邏輯,模型對比擬合度比較好.
4.2.2?對Sample1的實(shí)證結(jié)果分析
經(jīng)過二元Logit向后回歸篩選6次,Sample1中共留下9個(gè)變量.變量列表和假設(shè)對比檢驗(yàn)見表7.
被篩選出局的5個(gè)變量分別是性別(sex)、年齡(age)、婚姻狀況(marriage)、車貸(carloan)、借款用途(borrow-type).其中前3個(gè)來自于借款人自身特征信息,剩下2個(gè)分別來自借款人經(jīng)濟(jì)信息和借款標(biāo)的信息.也即言,大部分關(guān)于借款人自身身份特征的信息與是否違約相關(guān)度不大,更加重要的是借款人的經(jīng)濟(jì)信息和標(biāo)的信息和平臺信息.其中車貸信息被篩選掉比較容易理解,因?yàn)樵撝笜?biāo)在兩個(gè)樣本中取值為1的(即有車貸的)均占比不到10%,難有明確解釋意義呈現(xiàn).而借款用途被篩選掉與王重潤(2016)研究結(jié)果不一致,課題組認(rèn)為這可能與平臺信息呈現(xiàn)方式不同有關(guān).剩下的9個(gè)變量中,4個(gè)相關(guān)性符合原假設(shè)設(shè)定,5個(gè)不符合原假設(shè),不符合假設(shè)的值得進(jìn)一步研究.
債務(wù)收入比與違約率呈現(xiàn)負(fù)相關(guān)是非常值得注意的拒絕原假設(shè)實(shí)證結(jié)果.單獨(dú)分析結(jié)果表面意義解讀,即從收入角度看,償還能力越?。ń杩罱痤~/月收入),違約率越低.這不符合理解邏輯,同時(shí)與顧慧瑩(2015)的研究結(jié)果不一致.課題組為了解釋這個(gè)問題,對數(shù)據(jù)再次進(jìn)行處理,將借款收入比還原為兩個(gè)變量:借款金額和收入,再次納入模型回歸,結(jié)果見表8.
在變量還原分析中結(jié)果也都是與理論推測相反,一般認(rèn)為借款金額越大,違約率越高,而實(shí)證分析說明,借款金額越大違約率越低.但結(jié)合平臺授信分析就能推測出:這是因?yàn)槟茉谄脚_上獲取較大額度貸款的一般是作為企業(yè)投資經(jīng)營需要,平臺會自行進(jìn)行盡責(zé)的線下調(diào)查;而較小額度的貸款一般是無抵押靠信用擔(dān)保,違約風(fēng)險(xiǎn)也會高發(fā).同時(shí)這一實(shí)證結(jié)果與王重潤(2016)研究成果一致.另一個(gè)變量收入與違約率正相關(guān),也不符合理論預(yù)測,一般會認(rèn)為收入越高的人償債能力也越強(qiáng).于是課題組對收入這一變量做具體描述分析,結(jié)果見表9和圖2.
從數(shù)據(jù)分布的偏度和豐度指標(biāo)來看都在可接受范圍內(nèi),但從直方圖可以評估該分布不符合正態(tài)分布,呈現(xiàn)尖峰頂右偏狀態(tài).可以判斷的是,變量數(shù)據(jù)的分布形態(tài)與平臺數(shù)據(jù)呈現(xiàn)有關(guān),因?yàn)椤叭巳速J”平臺在讓借款人輸入收入數(shù)據(jù)是給定數(shù)據(jù)范圍,如收入是小于2000,2000~5000之間,5000~10000之間……,課題組對數(shù)據(jù)做了平均化處理,因此可以判斷該數(shù)據(jù)在真實(shí)意義上不能很好反映借款者的真實(shí)收入水平.另外,數(shù)據(jù)呈現(xiàn)右偏狀態(tài)也能夠判斷人們在借款時(shí)傾向于高報(bào)自己的真實(shí)收入,故而就比較好解釋實(shí)證分析中的正相關(guān)狀態(tài)了,即人們在為取得貸款時(shí)傾向于虛報(bào)收入,所以導(dǎo)致數(shù)據(jù)呈現(xiàn)上的收入越高和違約率也越高.
實(shí)證結(jié)果表明借款期限與網(wǎng)貸違約率負(fù)相關(guān),拒絕原假設(shè).課題組經(jīng)過探討認(rèn)為,原假設(shè)忽略了期限是一個(gè)主觀選擇量,即在網(wǎng)貸平臺和傳統(tǒng)信用中介不同,是由借款者主動選擇借款期限.理性借款人會合理分配自己的資金流,選擇更長期限的借款人應(yīng)該是合理規(guī)劃了每個(gè)月的資金流,給出的理性借款時(shí)間.而更短的借款期限可能是用于短期周轉(zhuǎn),本身存在更高風(fēng)險(xiǎn),或者借款人本身給出較短期限就是為了能快速拿到貸款,而沒有合理規(guī)劃自身資金流,更容易導(dǎo)致違約情況的發(fā)生.
房貸(mortgage)這一解釋變量與網(wǎng)貸違約率負(fù)相關(guān),即有房貸者更傾向于履約,和原理論假設(shè)不符.經(jīng)過探討課題組認(rèn)為,其實(shí)將情景放于真實(shí)借款場景中就比較好理解了:首先,有房貸者說明其有購房能力,是經(jīng)濟(jì)實(shí)力的一方面體現(xiàn);其次,有無房貸平臺和投資者都不會去確認(rèn),但給出有房貸在身的借款者傾向于更加誠實(shí),也就是說將實(shí)際不利于自身借款的信息公開給投資人,此類人群在履約方面也更加盡職.
車產(chǎn)(car)這一解釋變量與網(wǎng)貸違約率正相關(guān),同屬于財(cái)產(chǎn)性質(zhì)的物品,與房產(chǎn)出現(xiàn)了相反的結(jié)論,即有車產(chǎn)者更違約率上升,拒絕原假設(shè)的負(fù)相關(guān)設(shè)定.課題組深入挖掘原因時(shí)發(fā)現(xiàn)“網(wǎng)貸之家”對違約人數(shù)據(jù)分析后有同樣的結(jié)論:“雖然車能一定程度上象征財(cái)力,但卻對降低違約率沒有幫助”
網(wǎng)貸之家《揭秘網(wǎng)貸圈老賴真實(shí)畫像,有車產(chǎn)并不能降低違約率》2018-03-06,https://www.wdzj.com/hjzs/ptsj/20180306/588267-1.html.這一方面說明模型驗(yàn)證度較好,另一方面也可反映房產(chǎn)和車產(chǎn)在實(shí)際財(cái)產(chǎn)效應(yīng)中的不同表現(xiàn).
平臺認(rèn)證個(gè)數(shù)與網(wǎng)貸違約率正相關(guān),不符合理論預(yù)期,拒絕原假設(shè).通過仔細(xì)分析認(rèn)證類型,課題組認(rèn)為,本來平臺認(rèn)證信息應(yīng)該對違約率相關(guān)性方向是一致的,但實(shí)際上選取的兩種平臺認(rèn)證其認(rèn)證方式并不一致.其中拒絕原假設(shè)的認(rèn)證數(shù)目變量絕大部分是借款人主動給出,而描述指數(shù)則是平臺根據(jù)借款人給出的信息,結(jié)合后臺算法客觀打出的一個(gè)分析分?jǐn)?shù).也即言,前者偏主觀,后者偏客觀.因此平臺認(rèn)證個(gè)數(shù)會與違約率正相關(guān)就好解釋了:對于真正具有良好信用的借款人來說,他并不需要通過更多的認(rèn)證來證明其信用;相反是急需貸款或本身信用有缺失的人群,才會主動通過更多認(rèn)證來證明自己有還款能力.而且在認(rèn)證設(shè)置上本研究只取了數(shù)目,但實(shí)際中不同類認(rèn)證對于借款人信用衡量是權(quán)重不一的,如手機(jī)、短信、相片認(rèn)證相對容易,而房產(chǎn)、職位、住所等認(rèn)證則難度更大.
4.2.3?對Sample2的實(shí)證結(jié)果分析
Sample2的分析過程與Sample1一致,部分結(jié)果在前文總體分析中已經(jīng)給出,此處不在贅述.對比兩個(gè)樣本,實(shí)際值得注意的是:有5個(gè)變量在Sample1中顯著,但在Sample2的實(shí)證結(jié)果中被剔除了.為何會被剔除?這是值得研究的問題.
首先,課題組從數(shù)據(jù)分布角度入手研究,即產(chǎn)生變量剔除的原因是否因?yàn)镾ample1和Sample2在某變量分布上有較大不一致性.其中是否擁有房產(chǎn)這一變量在頻數(shù)分析中凸顯出來,見圖3和圖4.觀察數(shù)據(jù)可以發(fā)現(xiàn)在Sample1中house這一變量分布是符合假設(shè)的,即擁有房產(chǎn)者有更強(qiáng)的履約能力,而違約人中持有房產(chǎn)者占比偏少;但在Sample2中數(shù)據(jù)呈現(xiàn)的是違約人中持有房產(chǎn)者占比更多.從數(shù)據(jù)表現(xiàn)意義上來看,房產(chǎn)擁有在湖南樣本中不能作為借款人的履約能力的經(jīng)濟(jì)實(shí)力證明.
在數(shù)據(jù)分布中,認(rèn)證個(gè)數(shù)變量雖然不像房產(chǎn)變量出現(xiàn)了顯著性差別,但也可以發(fā)現(xiàn)Sample1和Sample2的不同,見圖5和圖6.顯然全國隨機(jī)樣本中的分布更符合一般邏輯,而湖南樣本數(shù)據(jù)頻數(shù)變化較大.課題組認(rèn)為這可能與樣本數(shù)量相關(guān),如果能擴(kuò)大Sample2中數(shù)據(jù)數(shù)量,應(yīng)該能消除這一問題.
其次,課題組再次考察在Sample2歷次回歸篩選中被剔除的納含在Sample1變量中,其中是否擁有車產(chǎn)(變量car)在第三次篩選中被剔除,變量house,mortgage,renzheng-num和degree分別在8,9,10和11次篩選中被剔除.也即言,較早剔除的變量只有car,而其他幾個(gè)變量都是在最后幾步篩選中剔除.另外值得關(guān)注的是,在Sample1中,解釋變量car與違約率是一個(gè)正相關(guān)關(guān)系,見表7;而在Sample2中,雖然較早被剔除,但它在模型中呈現(xiàn)的關(guān)系是負(fù)相關(guān),且Sig.值大于0.05,不能證明其顯著性,見表10.也即言,在Sample1中得到顯著性檢驗(yàn)的變量car,在Sample2中無法通過顯著性檢驗(yàn).同房產(chǎn)一樣,車產(chǎn)在湖南樣本中也無法作為履約能力提升的體現(xiàn).
變量house和mortgage分別在第8步和第9步被篩選剔除,前文頻數(shù)分析中已經(jīng)解析了house被剔除原因,此處不再贅文.但容易理解的是,house變量被剔除后,mortgage變量自然會隨之被剔除.因?yàn)閮烧叽嬖诎P(guān)系,且一致性在實(shí)證分析拒絕假設(shè)8(H8)時(shí)也得到了驗(yàn)證.學(xué)歷變量degree在最后一步被剔除,說明該變量雖然沒有達(dá)到5%的顯著性標(biāo)準(zhǔn),但和其他已被剔除的變量相比,對因變量影響更大一些,課題組認(rèn)為如果Sample2數(shù)據(jù)量可以擴(kuò)大,學(xué)歷這一解釋變量有可能最后保留在模型中.
5?結(jié)論與建議
5.1?結(jié)?論
本文以“人人貸”上的借款人數(shù)據(jù)為研究對象,建立二元Logit模型,用兩個(gè)樣本研究了對借款人違約行為產(chǎn)生較顯著影響的因素,其中全國隨機(jī)樣本實(shí)證結(jié)果顯示,負(fù)債收入比、借款期限、學(xué)歷、房產(chǎn)、房貸、描述指數(shù)對違約行為有負(fù)向影響,而借款利率、車產(chǎn)、認(rèn)證個(gè)數(shù)對借款者違約行為有正向影響.Sample1中保留的9個(gè)解釋變量,拒絕了5個(gè)原假設(shè),這說明僅通過邏輯分析是無法說明解釋變量對因變量的影響方向的,實(shí)證分析結(jié)果能更好地發(fā)掘人們對解釋變量的認(rèn)識深度.Sample2中保留了4個(gè)解釋變量,保留的解釋變量影響方向和Sample1一致,而剔除的5個(gè)變量中,其中3個(gè)(house、mortgage、car)有其地域特征原因,另外2個(gè)(renzheng-num和degree)應(yīng)該與樣本數(shù)量相關(guān).此外,在Sample1中,對違約率影響特別明顯的解釋變量有利率、房產(chǎn)、車產(chǎn),Sample2中對違約率影響顯著的是利率,這從實(shí)證角度再次說明,利率與違約率的強(qiáng)正相關(guān)關(guān)系(本例中的實(shí)證結(jié)果顯示,Sample1中,利率每提高1個(gè)點(diǎn),違約概率上升6個(gè)點(diǎn);Sample2中,利率每提高1個(gè)點(diǎn),違約概率上升7個(gè)點(diǎn).看表4和表5中Exp(B)值).
5.2?建?議
P2P網(wǎng)貸平臺一方面的確為長期被正規(guī)金融所排斥的借款者提供了資金來源渠道,也為投資人提供了收益較高的資金貸放方式,另一方面由于當(dāng)前平臺建設(shè)還不夠完善,面臨較嚴(yán)重的信息不對稱、逆向選擇等問題,也集聚了大量違約風(fēng)險(xiǎn).本課題組將研究重點(diǎn)指向湖南省的網(wǎng)貸違約人特征,是目前該領(lǐng)域研究中尚未涉及的范疇,通過對數(shù)據(jù)搜集、整理、分析,取得了一定突破.現(xiàn)就研究成果對湖南省在網(wǎng)貸領(lǐng)域信用評價(jià)體系建設(shè)建議如下:
第一,大方向上與全國普遍使用的信用評價(jià)要素保持一致即可.從實(shí)證結(jié)果可知,對湖南省網(wǎng)貸借款人有顯著影響的因子并未超出全國樣本的范圍,兩者一致性較強(qiáng).不需要抽出某些特定要素作為湖南省內(nèi)個(gè)人信用評價(jià)體系的特色來使用.
第二,湖南省地方特色個(gè)人信用評價(jià)體系中對財(cái)產(chǎn)的擁有(特指房產(chǎn)與車產(chǎn))不需要賦予高權(quán)重.一般財(cái)產(chǎn)的擁有是個(gè)人經(jīng)濟(jì)實(shí)力的象征,但從實(shí)證分析可知,湖南樣本中房產(chǎn)和車產(chǎn)的擁有都不能夠作為其信用提升的佐證.這也是與全國隨機(jī)樣本的最大差異所在.但要注意的是,本研究不是說房產(chǎn)和車產(chǎn)作為財(cái)產(chǎn)證明不重要,而是指其重要程度及對信用的影響關(guān)系需要進(jìn)一步考量.
參考文獻(xiàn)
[1]?KUMAR S. Bank of one:empirical analysis of peer-to-peer financial marketplaces[C]// Reaching New Heights. Americas Conference on Information Systems, Keystone, Colorado, USA, 2007:305.
[2] HERZENSTEIN M, SONENSHEIN S, DHOLAKIA U M.Tell me a good story and I may lend you money:the role of narratives in peer-to-peer lending decisions[J]. Journal of Marketing Research, 2011, 48(SPL):138.
[3] POPE D G, SYDNOR J R. Whats in a ?picture? Evidence of discrimination from Prosper.com[J]. Journal of Human Resources, 2011, 46(1):53-92.
[4] DUARTE J, SIEGEL S, YOUNG L. Trust and credit: the role of appearance in peer-to-peer lending[J]. Review of Financial Studies, 2012, 25(8):2455-2484.
[5] NOWAK A, ROSS A, YENCHA C. Small business borrowing and peer-to-peer lending: evidence from lending Club[J].Contemporary Economic Policy,2018,36(2):318-336.
[6] 繆蓮英, 陳金龍. P2P 網(wǎng)絡(luò)借貸中社會資本對借款者違約風(fēng)險(xiǎn)的影響——以 Prosper 為例[J]. 金融論壇, 2014,19(3): 9-15.
[7] 王會娟,廖理.中國P2P網(wǎng)絡(luò)借貸平臺信用認(rèn)證機(jī)制研究——來自“人人貸”的經(jīng)驗(yàn)證據(jù)[J].中國工業(yè)經(jīng)濟(jì),2014(4):136-147.
[8] 廖理,李夢然,王正位.中國互聯(lián)網(wǎng)金融的地域歧視研究[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2014,31(5):54-70.
[9] 顧慧瑩,姚錚.P2P網(wǎng)絡(luò)借貸平臺中借款人違約風(fēng)險(xiǎn)影響因素研究——以WDW為例[J].上海經(jīng)濟(jì)研究,2015(11):37-46.
[10]王重潤,孔兵.P2P網(wǎng)絡(luò)借貸違約行為影響因素實(shí)證研究——以“紅嶺創(chuàng)投”為例[J].農(nóng)村金融研究,2016(2):28-33.
[11]于軍.描述性信息與違約行為的關(guān)系研究——基于P2P平臺的分析[J].當(dāng)代經(jīng)濟(jì)管理,2017,39(5):86-92.
[12]IYER R,KHWAJA ?A I, LUTTER, E F P,et al. Screening in new credit markets: Can individual lenders infer borrower creditworthiness in peer-to-peer lending? [R]. Combridge, MA:National Bureau of Economic Research,Working Paper 15242,2009.
[13]GREINER M E, WANG H. Building consumer-to-consumer trust in e-finance marketplaces[C]// Reaching New Heights. Americas Conference on Information Systems, Keystone, Colorado, USA, 2007:211.
[14]DINH T H T, KLEIMEIER S. Credit scoring for vietnams retail banking market: implementation and implications for transactional versus relationship lending[D].Financial Economics,Limburg Institute of Maastricht University,2006.
[15]ROSLAN A, KARIM M. Determinants of microcredit repayment in malaysia: the case of agrobank[J]. Pertanika Journal of Social Science & Humanities, 2009, 4(1):45-52.
[16]ARMINGER G, ENACHE D, BONNE T. Analyzing credit risk data: a comparison of logistic discrimination, classification tree analysis, and feedforward networks[J]. Social Science Electronic Publishing, 1997, 12(2):293-310.
[17]LIN M. PRABHALA N R, VISWANATHAN S. Judging borrowers by the company they keep:friendship networks and information asymmetry in online peer-to-peer lending[J].Management Science,2013,59(1):17-35.