重慶市第八中學 張李遙
大數(shù)據(jù)風控在互聯(lián)網(wǎng)金融領(lǐng)域的應(yīng)用
重慶市第八中學 張李遙
大數(shù)據(jù)時代下互聯(lián)網(wǎng)技術(shù)的發(fā)展,使得大數(shù)據(jù)風險控制在金融行業(yè)得到了較為廣泛的應(yīng)用。目前,許多金融機構(gòu)都在各自的風險控制體系中加入大數(shù)據(jù)處理技術(shù),以提高風險控制系統(tǒng)的準確度和性能。本文首先介紹了大數(shù)據(jù)風控的基本概念和特點;然后,分析了大數(shù)據(jù)風控在互聯(lián)網(wǎng)金融領(lǐng)域的應(yīng)用;在此基礎(chǔ)上,引出互聯(lián)網(wǎng)征信和互聯(lián)網(wǎng)借貸案例,詳細分析大數(shù)據(jù)技術(shù)在金融風險控制中的具體應(yīng)用,最后對本次研究做出總結(jié)。
風險控制;大數(shù)據(jù);互聯(lián)網(wǎng)金融
互聯(lián)網(wǎng)金融是指依托大數(shù)據(jù)、云計算等互聯(lián)網(wǎng)技術(shù),實現(xiàn)金融業(yè)務(wù)的一種新興金融?;ヂ?lián)網(wǎng)金融是大數(shù)據(jù)時代的新產(chǎn)物,它不是互聯(lián)網(wǎng)技術(shù)和金融的簡單結(jié)合,而是將互聯(lián)網(wǎng)思維融入到具體的金融業(yè)務(wù)中,深度融合了傳統(tǒng)金融和互聯(lián)網(wǎng)精神的新型金融。
大數(shù)據(jù)環(huán)境下,互聯(lián)網(wǎng)金融市場的競爭轉(zhuǎn)變?yōu)槠脚_、數(shù)據(jù)、金融相互滲透、影響的格局。隨著數(shù)據(jù)資源化這一趨勢,金融領(lǐng)域海量數(shù)據(jù)的收集和處理顯得十分關(guān)鍵。那么,將大數(shù)據(jù)技術(shù)應(yīng)用到金融風險控制中,就尤為必要。
大數(shù)據(jù)風險控制(簡稱“大數(shù)據(jù)風控”)是基于大數(shù)據(jù)技術(shù)的風險控制和風險提示。風控的核心方法在于通過對相似群體的相關(guān)數(shù)據(jù)的分析,用機器學習建模的方法來評估用戶違約率。大數(shù)據(jù)風險控制具有三個特點:
(1)數(shù)據(jù)維度大:采用的數(shù)據(jù)全面,涵蓋社會行為、人際關(guān)系等各個方面。
(2)數(shù)據(jù)實時有效:實時有效的數(shù)據(jù)對于風險評估結(jié)果影響很大,所以大數(shù)據(jù)信用評估體系重視用戶的最新信息。
(3)結(jié)果精準:大數(shù)據(jù)風控模型由海量數(shù)據(jù)訓練得出,分析角度多樣,評分結(jié)果更加準確。
互聯(lián)網(wǎng)金融領(lǐng)域中大數(shù)據(jù)風控的基本過程是:從數(shù)據(jù)源出發(fā),首先對數(shù)據(jù)進行預(yù)處理操作;然后,進行特征提?。蛔詈?,研究和比較多個先進的算法,訓練得出最優(yōu)的風控模型。由此得出準確性、穩(wěn)定性和普適性都相對較高的信用評級體系,最后將其應(yīng)用到互聯(lián)網(wǎng)金融產(chǎn)品中。下面將針對幾個關(guān)鍵點進行詳細介紹。
數(shù)據(jù)源主要分為三大類:
(1)互聯(lián)網(wǎng)數(shù)據(jù),例如IP位置、網(wǎng)絡(luò)行為數(shù)據(jù)等。除此之外,借貸機構(gòu)較看重各類黑名單數(shù)據(jù)。
(2)用戶授權(quán)數(shù)據(jù),例如運營商數(shù)據(jù)、電商數(shù)據(jù)、信用卡數(shù)據(jù)等。
(3)第三方數(shù)據(jù),例如傳統(tǒng)信貸數(shù)據(jù)、合作機構(gòu)數(shù)據(jù)等。
互聯(lián)網(wǎng)金融企業(yè)的風控模式主要分為兩種,一種是利用已有的大量數(shù)據(jù)獨立建立風控模型和信用評級體系,這種模式一般出現(xiàn)于阿里巴巴、京東商城等擁有海量用戶數(shù)據(jù)的大型平臺;另一種是通過第三方平臺共享數(shù)據(jù)來獲得信用評級和風險控制服務(wù),這種模式多應(yīng)用于中小金融機構(gòu)。
相比于傳統(tǒng)金融風控,大數(shù)據(jù)風控具有適用性更廣、數(shù)據(jù)更全面、建模方法更科學、變量更豐富、運行效率更高效等特點,這使大數(shù)據(jù)風控在金融領(lǐng)域中的地位逐步提高。
大數(shù)據(jù)風控在互聯(lián)網(wǎng)金融領(lǐng)域的應(yīng)用范圍較廣,本次研究著重選擇互聯(lián)網(wǎng)征信和互聯(lián)網(wǎng)借貸中的大數(shù)據(jù)風控展開論述。本節(jié)將舉例介紹芝麻信用(征信領(lǐng)域)和拍拍貸(網(wǎng)絡(luò)借貸領(lǐng)域)的現(xiàn)狀、存在的問題和解決方法。
3.1.1 數(shù)據(jù)來源和數(shù)據(jù)類型
芝麻信用的主要數(shù)據(jù)來自阿里巴巴的互聯(lián)網(wǎng)產(chǎn)品,數(shù)據(jù)類型分為基本信息、注冊類型、興趣愛好、支付和資金、人脈關(guān)系、黑名單和外部應(yīng)用等。
3.1.2 芝麻分計算模型
信用評分有三個目標:準確性、普適性和可解釋性。其中,準確性是信用評級體系的基本要求。由于黑箱模型缺乏可解釋性,芝麻信用評分體系選擇了透明模型和分群評分卡機制。分群評分卡可以在模型訓練中將企業(yè)自身的理解與專業(yè)經(jīng)驗結(jié)合,使之更具有普適性。分群的準確合理是分群評分卡的關(guān)鍵,芝麻信用為了模型的適用,應(yīng)用多種方法得出了最優(yōu)的分群方案。
3.1.3 靈芝系統(tǒng)
靈芝系統(tǒng)是芝麻信用為小微企業(yè)定制的信用評分系統(tǒng)。它的數(shù)據(jù)源更為豐富,數(shù)據(jù)形式更加多樣,信用評估的計算采用更大規(guī)模的機器學習算法。同時,它的信用評估和風險預(yù)測因人而異。靈芝系統(tǒng)通過信用評分和指數(shù)、風險監(jiān)控預(yù)警、關(guān)注名單、風險云圖和信用報告五方面測評得出不同的風險策略。
3.1.4 存在問題與解決方法
目前,互聯(lián)網(wǎng)征信中依舊存在很多問題。其中,數(shù)據(jù)的質(zhì)量問題和電商平臺的刷單問題最為嚴重,這導致了征信公司的信息數(shù)據(jù)嚴重失真。除此之外,身份欺詐、冒用等問題更是給金融領(lǐng)域的風險控制體系帶來了巨大的挑戰(zhàn)。
針對這些問題,阿里巴巴在不斷完善數(shù)據(jù)類型,提高數(shù)據(jù)質(zhì)量。一方面,菜鳥裹裹、螞蟻金服能通過一些常規(guī)數(shù)據(jù)來確認信息真實性。另一方面,面部識別、指紋識別等高科技手段也逐漸開始應(yīng)用于互聯(lián)網(wǎng)金融行業(yè)。除此之外,還有一些手段可以被展望。
第一,打破數(shù)據(jù)孤島。大數(shù)據(jù)資源的透明化程度對征信系統(tǒng)有著重要作用。目前,我國互聯(lián)網(wǎng)金融公司各自為營,將信息數(shù)據(jù)隱私化,各公司的風險控制系統(tǒng)僅僅局限于分析自己獨有的數(shù)據(jù),導致征信體系難以完善。因此,打破數(shù)據(jù)孤島,各公司團結(jié)協(xié)作,讓更多的信息數(shù)據(jù)共享于企業(yè)間,可以極大地完善征信系統(tǒng)。
第二,推動物聯(lián)網(wǎng)+。在物聯(lián)網(wǎng)的全面覆蓋下,生產(chǎn)交易過程的數(shù)據(jù)都可以被獲取,從而提高數(shù)據(jù)的真實性。因此,金融企業(yè)想要獲取更全面的數(shù)據(jù)信息,積極布局“物聯(lián)網(wǎng)+”是必不可少的。
2015年3月24日,由拍拍貸歷時八年研發(fā)而成的基于大數(shù)據(jù)的風控模型“魔鏡風控系統(tǒng)”問世。該系統(tǒng)擁有600萬在線用戶和近40億條數(shù)據(jù),被行業(yè)內(nèi)認為是首個大數(shù)據(jù)風險控制系統(tǒng)。
3.2.1 魔鏡系統(tǒng)的風控流程
魔鏡風控系統(tǒng)采用2000多個數(shù)據(jù)維度,評判材料全面。該系統(tǒng)繼往開來,新收納了海量互聯(lián)網(wǎng)行為數(shù)據(jù)。這些豐富多樣的數(shù)據(jù)信息大大降低了風險。
在風險控制階段,拍拍貸構(gòu)建了反欺詐系統(tǒng)、魔鏡評級系統(tǒng)和風險定價系統(tǒng)來綜合全面地分析數(shù)據(jù)。其中,反欺詐系統(tǒng)決定是否放貸,魔鏡評級系統(tǒng)決定放貸額度,風險定價系統(tǒng)決定放貸利率。最終,根據(jù)以上三個風險控制系統(tǒng)準確匹配出借貸人的借貸方案,有效避免違約風險。
3.2.2 存在的問題和解決方案
大量非活躍用戶以占便宜為目的,投資新平臺拿到獎勵后便撤資離開,這就是“羊毛黨”現(xiàn)象。他們的出現(xiàn)大大增加了新平臺的負擔,擾亂了平臺的運營秩序。針對上述問題,提出如下解決方案。一方面,適當提高投資門檻,使“羊毛黨”因害怕風險而拒絕投資,減少“羊毛黨”數(shù)量;另一方面,完善實名認證制度,保證用戶質(zhì)量。
大數(shù)據(jù)風險控制打破了傳統(tǒng)的風控思維,通過多維度分析海量用戶數(shù)據(jù),得出更為高效、準確的風控體系。隨著大數(shù)據(jù)技術(shù)的日臻成熟,大數(shù)據(jù)風險控制在互聯(lián)網(wǎng)金融領(lǐng)域的應(yīng)用越來越多,應(yīng)用范圍也越來越廣泛。雖然大數(shù)據(jù)風控尚存在用戶線上線下狀態(tài)迥異、互聯(lián)網(wǎng)社會行為數(shù)據(jù)真實性低等問題,但是業(yè)界也逐漸在利用技術(shù)手段,從經(jīng)濟學、金融學、社會學等多個角度改善風控體系,并取得了較好的成效。
[1]巴曙松,侯暢,唐時達.大數(shù)據(jù)風控的現(xiàn)狀、問題及優(yōu)化路徑[J].金融理論與實踐,2016,(02):23-26.
[2]俞楓,苑博,葉小同,馮必成,侯秦.大數(shù)據(jù)技術(shù)在金融行業(yè)風險控制中的應(yīng)用探討[J].新經(jīng)濟,2016,(36):52-53.
[3]葉文輝.大數(shù)據(jù)征信機構(gòu)的運作模式及監(jiān)管對策——以阿里巴巴芝麻信用為例[J].新金融,2015,(07):60-63.
[4]唐時達,李智華,李曉宏.供應(yīng)鏈金融新趨勢[J].中國金融,2015,(10):40-41.
[5]倪海鷺.P2P網(wǎng)絡(luò)借貸平臺征信需求與管理研究[J].征信,2014,32(05):46-49.
[6]梁偉利.P2P網(wǎng)絡(luò)借貸平臺風險管理研究[D].西南財經(jīng)大學,2016.
[7]曹亞廷.P2P網(wǎng)貸與征信系統(tǒng)關(guān)系研究[J].征信,2014,32(11):15-18.
[8]董明,劉娜娜,王允保.構(gòu)建大數(shù)據(jù)風控平臺 嚴控互聯(lián)網(wǎng)金融風險[J].金融電子化,2016,(11):28-30.
張李遙(2000—),男,重慶人,重慶市第八中學高三學生,研究方向:計算機科學與技術(shù)。