樊子琦 楊青青
【摘要】互聯(lián)網(wǎng)時代背景下,P2P網(wǎng)貸、消費金融、共享經(jīng)濟等業(yè)務在我國蓬勃發(fā)展,個人征信業(yè)務需求快速增長,對以中國人民銀行為代表的公共征信機構提出了挑戰(zhàn),依托大數(shù)據(jù)技術的民營征信機構應運而生。但目前我國的民營征信機構信用評估模式在數(shù)據(jù)采集、建模分析和產(chǎn)品應用上還存在問題,文章通過借鑒美國信用評估公司ZestFinance的成功經(jīng)驗,對我國征信機構如何有效利用大數(shù)據(jù)技術改進個人征信信用評估模式提出建議。
【關鍵詞】大數(shù)據(jù) 個人征信 民營征信機構
根據(jù)中國人民銀行征信中心2015年發(fā)布的《征信系統(tǒng)建設運行報告》中顯示,截至2014年央行征信體系還是以商業(yè)銀行的金融信貸信息為主,占比達到70%以上,對于網(wǎng)絡數(shù)據(jù)挖掘不足,新興互聯(lián)網(wǎng)金融機構如P2P網(wǎng)絡平臺以及大部分消費金融機構則尚未接入央行征信系統(tǒng)。隨著互聯(lián)網(wǎng)金融平臺的活躍,更多的非傳統(tǒng)信用數(shù)據(jù)需要納入征信體系,為了促進互聯(lián)網(wǎng)金融穩(wěn)定發(fā)展,對個人征信業(yè)務提出了更高的要求。
2015年,人民銀行批準了芝麻信用、騰訊征信、深圳前海征信、鵬元征信、中誠信征信、中智誠征信、考拉征信、北京華道征信8家民營征信機構進入個人征信行業(yè)。這些新興征信機構通過收集分析客戶的線上線下信貸數(shù)據(jù)和網(wǎng)絡行為軌跡數(shù)據(jù),引入數(shù)據(jù)挖掘技術和數(shù)學模型實行多維度信用等級評估,節(jié)約傳統(tǒng)征信的人力成本、時間成本,兼顧長尾市場,為個人征信市場注入了新活力。但同時民營征信機構的發(fā)展面臨著來自各種挑戰(zhàn)。
一、我國民營征信機構現(xiàn)狀
(一)征信數(shù)據(jù)來源割裂,信用評級片面化
目前我國征信數(shù)據(jù)主要來自線下的金融征信體系、行政管理征信體系和商業(yè)征信體系以及線上的互聯(lián)網(wǎng)金融、社交體系。其中線下數(shù)據(jù)主要是以央行征信系統(tǒng)的信貸數(shù)據(jù)、工商、司法以及行業(yè)協(xié)會數(shù)據(jù)為主,線上則是基于電子支付、P2P網(wǎng)貸、社交網(wǎng)絡等互聯(lián)網(wǎng)平臺的大量非結構化數(shù)據(jù),兩者之間存在較強的割裂,傳統(tǒng)金融機構的信貸數(shù)據(jù)難以與民營征信機構共享。
以芝麻信用和騰訊信用為例,從下表中可以看出芝麻信用數(shù)據(jù)來源主要來自阿里巴巴旗下電商的網(wǎng)絡金融數(shù)據(jù),其中來自淘寶和支付寶的數(shù)據(jù)占比高達40%;而騰訊信用則借助自身強大的社交網(wǎng)絡優(yōu)勢,數(shù)據(jù)主要來自旗下微信、QQ等社交平臺。首先雙方的數(shù)據(jù)少有重合,多是依托自身平臺,忽略其他互聯(lián)網(wǎng)公司的用戶數(shù)據(jù),使評級結果缺乏普適性;其次,雙方對于履約能力即用戶信用狀況的數(shù)據(jù)僅依賴于與自身建立合作關系的公共機構,這就意味著這些民營征信機構在進行信用評估時究竟能夠獲得多少線下信貸數(shù)據(jù),還是個未知數(shù)。以上兩點決定了目前我國民營征信機構在信用評級上仍然存在片面性。
(二)征信模型不成熟,信用評估缺乏可靠性
征信模型算法是大數(shù)據(jù)征信中的核心環(huán)節(jié),我國民營征信機構發(fā)展尚未成熟,較美國等成熟征信體系相比還存在一定的差距。芝麻信用所采用的評估模型與美國個人消費信用評估公司開發(fā)的FICO信用評級法大致相同,但通過對比我們可以看出相比于FICO主要還是依賴于傳統(tǒng)信貸數(shù)據(jù),而芝麻信用引入了大量與用戶信用狀況關系較弱的社交、行為偏好數(shù)據(jù)。引入多維度評估固然可以更精確地刻畫用戶信用狀況,但如何通過這些弱相關性的海量互聯(lián)網(wǎng)數(shù)據(jù)挖掘出有價值的消費者信用信息,對征信模型的設計提出了挑戰(zhàn)。
同時我們注意到,我國民營征信機構大多將個人的資產(chǎn)信息(如騰訊信用考察資產(chǎn)構成)和好友信用狀況(如芝麻信用考察支付寶好友信息)納入評估范疇,而FICO評分則主要關注用戶信貸狀況,不包含資產(chǎn)情況等個人敏感信息。國內(nèi)做法難免加劇貧富人群信用差異,違背了互聯(lián)網(wǎng)征信服務長尾用戶的初衷,使結果產(chǎn)生偏差。綜上看來,征信模型的不成熟會使評分結果缺乏可靠性。
(三)依托互聯(lián)網(wǎng)金融集團,征信產(chǎn)品缺乏獨立性
目前我國批準進入個人征信行業(yè)試點的八家征信機構大都屬于阿里巴巴、騰訊等大型金融集團,而這些集團同時控股小額貸款公司、民營銀行等金融機構,與征信機構存在高度關聯(lián)性,征信產(chǎn)品能否對市場上所有金融產(chǎn)品采用相同標準成為評價民營征信機構獨立性的重要因素。大多數(shù)征信產(chǎn)品主要依托集團所屬平臺數(shù)據(jù)進行評估,評估出的結果又服務于集團內(nèi)各子公司的業(yè)務,這就使得民營征信機構的信用評級缺乏第三方獨立性,要想真正應用到全市場金融業(yè)務上,還需要對公司主體獨立性、關聯(lián)交易管控、數(shù)據(jù)獨立性等方面進行管控。
二、借鑒Zestfinance的成功模式
ZestFinance是美國一家新興的互聯(lián)網(wǎng)金融公司,提出了“Machine learning is the future of finance”的理念,ZestFinance的核心競爭力在于數(shù)據(jù)挖掘能力和模型開發(fā)能力。其大數(shù)據(jù)征信理念已被世界多家互聯(lián)網(wǎng)金融公司認可,也與百度、京東等國內(nèi)互聯(lián)網(wǎng)金融公司建立合作,共同開拓國內(nèi)征信市場。
(一)數(shù)據(jù)來源豐富,以信貸信息為主要數(shù)據(jù)源
ZestFinance的數(shù)據(jù)來源主要為第三方數(shù)據(jù)、用戶提交的數(shù)據(jù)以及互聯(lián)網(wǎng)數(shù)據(jù)。其中用戶信貸信息、信用卡信息等結構化數(shù)據(jù)主要來自所購買或交換的第三方如銀行、工商部門等公共機構,同時ZestFinance鼓勵用戶上傳電話賬單等來證明自己信用水平,有效彌補公共信息不足?;ヂ?lián)網(wǎng)則提供了社交數(shù)據(jù)、網(wǎng)絡行為、IP地址等非結構化數(shù)據(jù)。
值得注意的是ZestFinance在引入大量非結構化數(shù)據(jù)深度挖掘用戶信用的同時,其進行信用評估依然以傳統(tǒng)信貸信息為主要數(shù)據(jù)源,占比達到30%。因為首先互聯(lián)網(wǎng)數(shù)據(jù)中尤其是社交數(shù)據(jù)多為文本和圖像類數(shù)據(jù),類型復雜,處理起來難度較大;其次,例如IP地址、社交網(wǎng)絡行為等數(shù)據(jù)與用戶信用相關性較弱,對模型的擬合程度要求也更大,過多依賴互聯(lián)網(wǎng)數(shù)據(jù)可能會使信用評級的可靠性降低。
(二)強大的機器學習模型,不斷優(yōu)化調(diào)整模型
傳統(tǒng)征信主要采用邏輯回歸和決策樹方法,但這兩種方法各自存在不足。邏輯回歸法變量數(shù)量有限,只能處理10-15個變量,要求所有變量必須存在且正確,而決策樹方法則需要將所有申請人清晰劃分為不同類別,操作難度較大。而新興的機器學習技術能夠克服傳統(tǒng)回歸方法的弊端,結合預測算法,不斷優(yōu)化調(diào)整模型,構建信用評估體系,這也是ZestFinance的核心競爭力所在。
ZestFinance開發(fā)了專門用于信用評估的ZAML平臺,ZAML平臺提供了可解釋的機器學習模型,處理變量可以多達幾千個。能夠在10秒之內(nèi)處理海量數(shù)據(jù)并提供信用評級,該平臺主要由數(shù)據(jù)同化(data assimilation)、模型工具(modeling tools)和模型可解釋性(model explainability)三部分組成。借助機器學習,把人類思考歸納經(jīng)驗的過程轉化為計算機對數(shù)據(jù)的處理計算得出模型,ZestFinance的評分模型得以快速更新,由最初的信貸審批評分模型已經(jīng)發(fā)展出八類不同的信用評估模型,覆蓋教育、法律、消費等各個方面。
(三)征信產(chǎn)品應用渠道廣泛,評級結果有效獨立
ZestFinance通過大數(shù)據(jù)分析,突破傳統(tǒng)征信限制,自2009年起,已為超過300,000,000人提供了信用評級服務,其中多為傳統(tǒng)信用評級所沒有覆蓋的人群,填補了傳統(tǒng)征信的空白。ZestFinance 提供的信用評級不僅可以應用于自身旗下的ZestCash貸款平臺,為用戶發(fā)放貸款,也逐漸被一些傳統(tǒng)金融機構認可,使這些機構可以參考ZestFinance評分系統(tǒng)為用戶提供金融服務。ZestFinance非但沒有因為服務“高風險”客戶而遭受風險損失,反而通過大數(shù)據(jù)技術的精準評估在實踐中實現(xiàn)了33%的信貸損失的下降。
三、我國民營征信機構信用評估體系改進措施
針對我國現(xiàn)試點的八家民營征信機構所存在的問題,通過借鑒美國大數(shù)據(jù)征信機構ZestFinance成功的經(jīng)驗,現(xiàn)提出以下三點改進的建議
(一)促進各大平臺信息共享,整合數(shù)據(jù)源
首先,對于結構化數(shù)據(jù),各大民營征信機構要加強金融信用信息基礎數(shù)據(jù)庫建設,在保證信息安全的前提下,與傳統(tǒng)征信機構如人民銀行征信系統(tǒng)實現(xiàn)信息共享,盡可能獲取用戶信用高度相關的信貸數(shù)據(jù);其次,對于社交信息、網(wǎng)絡行為非結構化數(shù)據(jù),各大民營征信機構不僅要依托自身互聯(lián)網(wǎng)平臺資源,也要與其他平臺開展合作進行信息采集,獲取更全面更客觀的數(shù)據(jù)。通過整合線上線下的數(shù)據(jù)源,兼顧頭部和長尾數(shù)據(jù),提升信用產(chǎn)品的質量。
2018年2月,中國人民銀行批準百行征信有限公司成為首家獲得個人征信業(yè)務牌照的機構,由8家民營征信公司分別持股。百行征信集合國內(nèi)互聯(lián)網(wǎng)企業(yè)巨頭如阿里、騰訊的網(wǎng)絡平臺的數(shù)據(jù),同時立足于央行征信系統(tǒng)的用戶信貸數(shù)據(jù),實現(xiàn)了數(shù)據(jù)源的整合,具有巨大的發(fā)展?jié)摿Α?/p>
(二)加強國際合作,改進信用評估模型
中國應用大數(shù)據(jù)征信尚處于起步階段,國內(nèi)目前缺乏相關專業(yè)人才,其數(shù)據(jù)挖掘能力、機器學習技術以及在模型的設計方面與歐美發(fā)達國家相比具有一定的差距。而同時互聯(lián)網(wǎng)金融在中國的飛速發(fā)展,又帶來了豐富的網(wǎng)絡數(shù)據(jù)資源,因此中國的民營征信機構可以利用自身豐富的數(shù)據(jù)優(yōu)勢,與國外大數(shù)據(jù)征信企業(yè)開展合作,依托其先進的機器學習征信技術,不斷改進信用評估模型,提高評分可靠性。
目前,京東、百度均已與美國互聯(lián)網(wǎng)金融公司ZestFinance建立合作關系。百度作為中國最大的搜索引擎,而京東擁有以京東金融為代表的消費金融體系,二者均掌握豐富的中國客戶互聯(lián)網(wǎng)數(shù)據(jù),與ZestFinance強強聯(lián)手,對其以后開展個人征信業(yè)務,降低信用風險具有重要意義。
(三)企業(yè)內(nèi)部加強監(jiān)管,保證第三方征信獨立性
目前我國民營征信機構缺乏獨立性主要表現(xiàn)在與母公司旗下其他信貸類業(yè)務存在利益沖突,同時擔任裁判和運動員的角色難以保證評級結果的公正性。因此要求開展個人征信服務的互聯(lián)網(wǎng)企業(yè)加強內(nèi)部監(jiān)管,從公司治理角度規(guī)范公司運營,使征信機構與其他業(yè)務機構獨立開來,避免征信產(chǎn)品與其他如小額借貸、消費金融等業(yè)務掛鉤??梢砸氇毩⒍卤O(jiān)督公司運營,多方面保證第三方征信的獨立性。
參考文獻
[1]王希軍,李士濤.互聯(lián)網(wǎng)金融推動征信業(yè)發(fā)展[A].互聯(lián)網(wǎng)金融發(fā)展與監(jiān)管,2013.
[2]劉新海,丁偉.大數(shù)據(jù)征信應用與啟示—以美國互聯(lián)網(wǎng)金融公司ZestFinance為例[J].清華金融評論,2014.
[3]李辰.我國大數(shù)據(jù)征信發(fā)展的現(xiàn)狀、困境和經(jīng)驗借鑒[J].征信,2016.
[4]劉新海,丁偉.美國ZestFinance公司大數(shù)據(jù)征信實踐[J].征信,2015.
[5]吳晶妹.未來中國征信:三大數(shù)據(jù)體系[J]征信2013.
[6]Jay Budzik.Explainable machine learning in credit.
[7]ZestFinance Seeks Growth in ‘Huge Chinese Market auto fianance news.