姜疆
金融行業(yè)應(yīng)用系統(tǒng)積累了非常多的客戶交易數(shù)據(jù),同時,借助大數(shù)據(jù)技術(shù)將分散在金融企業(yè)服務(wù)網(wǎng)絡(luò)與IT系統(tǒng)中的海量信息與基于業(yè)務(wù)驅(qū)動的外部數(shù)據(jù)源融合,金融機構(gòu)能夠在金融企業(yè)內(nèi)部的客戶管理、信用評級、風(fēng)險控制等諸多方面得到有效提升。
大數(shù)據(jù)技術(shù)和數(shù)據(jù)挖掘技術(shù)在金融業(yè)中的主要運用有:數(shù)據(jù)分析和設(shè)計構(gòu)造的數(shù)據(jù)倉庫;特征數(shù)據(jù)變量選擇、關(guān)聯(lián)屬性相關(guān)數(shù)據(jù)用于預(yù)測客戶信用狀況;聚類、分類分析識別目標(biāo)客戶和市場;數(shù)據(jù)可視化過程及歸并、聚類分析甄別洗錢等金融犯罪行為。
在當(dāng)前“以客戶為中心、以市場為導(dǎo)向”的激烈競爭時代,在各大金融機構(gòu)準備“二次轉(zhuǎn)型”的改革進程中,要想提高核心競爭能力、防范業(yè)務(wù)風(fēng)險、提高業(yè)務(wù)分析數(shù)據(jù)的時效性及準確性,就必須懂得如何利用現(xiàn)代管理信息系統(tǒng)進行綜合分析挖掘客戶潛在價值,借助有價值的信息改進服務(wù)手段,運用數(shù)據(jù)挖掘技術(shù)實現(xiàn)職能化的決策支持功能管理。
了解客戶行為
據(jù)廣發(fā)銀行信用卡相關(guān)人士介紹,2016年,廣發(fā)信用卡在4800萬客戶體量之下,客戶服務(wù)滿意度始終保持在99%以上,其“秘訣”就在于近年來廣發(fā)卡客服中心成功地將大數(shù)據(jù)運用于日常業(yè)務(wù),基于客戶歷史行為數(shù)據(jù)的分析和預(yù)測實現(xiàn)與客戶的雙向互動。
近年來,廣發(fā)卡客服中心積極推進服務(wù)創(chuàng)新,充分挖掘海量客戶數(shù)據(jù)的價值,在開發(fā)銀行大數(shù)據(jù)平臺的基礎(chǔ)上,創(chuàng)新推出“客戶Face Time--大數(shù)據(jù)時代客戶標(biāo)簽畫像”。該業(yè)務(wù)能根據(jù)客戶的歷史行為對客戶畫像進行描畫,細化分群,建立客戶服務(wù)專屬標(biāo)簽群。
隨后將基于客戶特征集合形成的客戶標(biāo)簽以行業(yè)首創(chuàng)的“九宮格”界面的形式傳輸?shù)娇蛻舴?wù)系統(tǒng)前端,確保客服代表可以通過可視化、友好化的界面即時全面掌握客戶畫像及代表的用戶特征和潛在需求,有的放矢地完成精準服務(wù)和差異化服務(wù)。
大數(shù)據(jù)時代,信用卡行業(yè)可以利用先進的互聯(lián)網(wǎng)、云計算等新興技術(shù),對消費者的刷卡行為進行數(shù)據(jù)化的分類、統(tǒng)計,通過整理獲取消費者的消費習(xí)慣、消費能力、消費偏好等非常重要的數(shù)據(jù)信息,進行深入的數(shù)據(jù)挖掘。
中國光大銀行信用卡中心總經(jīng)理戴兵表示,信用卡行業(yè)已經(jīng)進入了精耕細作的時代,各行在數(shù)據(jù)挖掘方面已不是新手,利用數(shù)據(jù)挖掘與客戶關(guān)系管理相結(jié)合,深入挖掘客戶信息,對客戶進行細分,針對不同客戶提供差異化服務(wù),滿足客戶不同需求。
通過捕捉客戶的行為變化等事件信息,及時發(fā)現(xiàn)客戶潛在需求,針對性地為客戶提供個性化的活動或產(chǎn)品,從而達到對客戶需求的精準認知與匹配,在合適的時機對客戶進行營銷和服務(wù),最終促成交易。
浦發(fā)銀行卡中心大數(shù)據(jù)團隊已經(jīng)于2014年建設(shè)了Hadoop大數(shù)據(jù)平臺,實現(xiàn)了批量計算的應(yīng)用;2015年對平臺進行升級,引入流式計算,并自主設(shè)計了事件式營銷系統(tǒng),內(nèi)部代號“游隼”(Falcon)。該系統(tǒng)使用Storm和Kafka等大數(shù)據(jù)技術(shù)處理數(shù)據(jù)流,使用HBase和Redis等NoSql數(shù)據(jù)庫技術(shù)進行數(shù)據(jù)存儲和處理。
客戶一旦進行交易,平臺就會捕捉到交易事件并結(jié)合用戶特征與平臺預(yù)定義的活動進行對比計算,如果該客戶的刷卡行為與特征能夠滿足活動規(guī)則,則通過短信、微信、APP等渠道推送預(yù)定義好的營銷信息,進行實時營銷。
著眼于零售商業(yè)銀行客戶行為中的預(yù)測變化,可以使用一種“可伸縮的時間掃描算法”來檢測高度多維的銀行交易,從而檢測客戶消費行為中的一些變化。
前提是根據(jù)一系列標(biāo)準,對相關(guān)數(shù)據(jù)進行分類,如:年齡段、性別、教育程度、家境,等等。而算法是,通過將個人客戶的行為及其歷史記錄,與同類別群體的當(dāng)前及歷史行為作為比較,從而檢測出行為中的時間變化點。
該算法會考慮至少230種不同類型的變化點,他們是根據(jù)上文提及的多種分類標(biāo)準和消費行為轉(zhuǎn)變的多種時間尺度而得到的。那些檢測到的、不能用數(shù)據(jù)的隨機波動來解釋的變化,被認為是未來行為的可能,如單日信用卡消費熱潮。
可以使用機器學(xué)習(xí)來自動檢測那些經(jīng)實證檢驗后最有用的備選指標(biāo)集。研究大數(shù)據(jù)的學(xué)者Artur Dubrawski曾撰文介紹了一個大數(shù)據(jù)模型,能夠精確地提前三天預(yù)測某天的消費熱潮。
當(dāng)然,與以往運用的數(shù)據(jù)挖掘技術(shù)不同,大數(shù)據(jù)需要更龐大的數(shù)據(jù)倉庫、新興技術(shù)來存儲與支撐,這也是信用卡行業(yè)需要進一步去提高的。當(dāng)然,信用卡行業(yè)也很期待大數(shù)據(jù)的來臨,利用新興技術(shù),結(jié)合豐富的數(shù)據(jù),深入挖掘有效信息,通過細分客群,為客戶提供更好的服務(wù)。
信用評級
傳統(tǒng)金融機構(gòu)的征信信息來源主要是央行征信,但央行征信僅有3億多人有信貸記錄,信貸記錄又主要來源于商業(yè)銀行和農(nóng)村信用社等金融機構(gòu)。隨著互聯(lián)網(wǎng)不斷滲入人們生活,互聯(lián)網(wǎng)行為數(shù)據(jù)是央行征信的有效補充,可以不斷強化征信數(shù)據(jù)的時效性、全面性和層次性,從無形中記錄用戶的行為,去偽存真,還原真實的客戶,從而大大提升信息的利用率和有效性。
傳統(tǒng)上,金融機構(gòu)的授信審批決策主要依賴于信貸人員的主觀經(jīng)驗和判斷,缺乏統(tǒng)一的標(biāo)準,不利于金融機構(gòu)整體風(fēng)險政策的執(zhí)行。
隨著大數(shù)據(jù)時代的到來,銀行可以通過移動互聯(lián)網(wǎng)等渠道,取得越來越完善的貸款人信息:同時,強大的底層技術(shù)也可以完成復(fù)雜模型所帶來的巨大計算量。這兩點同時為信用評分模型注入了新活力,信用評分模型的進步帶來的是銀行壞賬率的下降。
對于銀行來說,貸出的款額、利息的高低、還款的時間以及方式等是可以控制的因素,而銀行所不能控制的因素有借款人的收入水平、婚姻狀況、消費水平,等等。這兩方面的因素都會影響借款人還款能力的高低。為了更全面地評價借款人的還款能力,銀行有必要同時采集這兩方面的信息。
銀行的信用評分模型最主要的作用是評定那些特征不大明顯的借款者是否能還貸。正常情況下,銀行是絕不會借錢給那些明顯不能還款的客戶的,而顯然會還款的客戶有總是各個銀行爭奪的對象。
當(dāng)然,信用評分系統(tǒng)不僅可以用于申請貸款業(yè)務(wù),也可以用于信用卡開通業(yè)務(wù)、汽車行業(yè)分期付款業(yè)務(wù)、房地產(chǎn)分期付款業(yè)務(wù),還可以用于開展保險業(yè)務(wù)評分、欺詐風(fēng)險評分等諸多評分業(yè)務(wù),等等。
信用評分模型涉及深厚的理論基礎(chǔ)以及先進的算法思想。盡管構(gòu)建信用評分模型的算法有所不同,但構(gòu)建信用評分模型的原理和步驟是基本一致的,所有的信用評分模型在構(gòu)建時,都需要三個步驟。
首先,根據(jù)經(jīng)驗或相關(guān)性分析,找出和借款人的信用風(fēng)險相關(guān)的經(jīng)濟或財務(wù)因素,并選定算法,確定模型將要使用的函數(shù)形式;其次,根據(jù)以往的數(shù)據(jù)確定相關(guān)因素的重要性大小,并代入算法進行試驗,尋找最優(yōu)參數(shù);最后,將待分類借款人的相關(guān)數(shù)據(jù)代入信用評分函數(shù)計算信用數(shù)值,根據(jù)數(shù)值的大小確定是否借款給待分類借款人。
借款人以往的還債記錄、公共記錄、年齡、職業(yè)、經(jīng)濟狀況、消費水平、消費偏好、持有的銀行卡數(shù)目、銀行卡余額,等等,都是銀行需要收集的數(shù)據(jù)。這些數(shù)據(jù)可以詳細地勾畫出一個消費者的形象,從而幫助銀行判斷借款人是否能償還貸款。
構(gòu)建信用評分模型常用的算法有:邏輯回歸模型、共性過濾分析、支持向量機、判別分析、神經(jīng)網(wǎng)絡(luò)模型、決策樹模型、多元回歸模型、基因算法、RFM分析、存貨分析、時間序列分析,等等。
在信用評分模型構(gòu)建過程中,從不同的側(cè)面看待同一個問題時,可以設(shè)計出不同的解決方案。
對于有大數(shù)據(jù)量支持的大型銀行,可以使用決策樹來構(gòu)建信用評分模型;對于沒有過多數(shù)據(jù)的小型借貸公司,神經(jīng)網(wǎng)絡(luò)將克服數(shù)據(jù)量過少的不便;判別分析適用于針對某一明確問題構(gòu)建模型,而在探索性數(shù)據(jù)分析中作用不大;支持向量機則可以精確地區(qū)分可能會還款的客戶和不太可能會還款的客戶。
不同算法所使用的變量并不相同,對于這個算法來說很重要的變量可能并不能在其他算法中發(fā)揮作用,而不同的算法所適合的問題也不盡相同。在使用這些算法解決問題時,應(yīng)注意每種算法的長處與短處,從而揚長避短,找到解決問題的最佳方案。
隨著大數(shù)據(jù)模型開發(fā)技術(shù)與內(nèi)部評級體系建設(shè)的深度融合,金融機構(gòu)將更加廣泛和全面地將評分/評級結(jié)果應(yīng)用于授信審批,為貸款決策提供參考和支持。同時,大數(shù)據(jù)模型的應(yīng)用,可以不斷提高金融機構(gòu)風(fēng)險識別、計量能力。從而不斷完善征信信息體系架構(gòu),為精細化風(fēng)險定價提供必要的基礎(chǔ)和土壤。
風(fēng)險控制
風(fēng)險監(jiān)控與預(yù)警是指借助各類信息來源或渠道,通過對數(shù)據(jù)與信息進行整合與分析,運用定量和定性分析相結(jié)合的方法來發(fā)現(xiàn)授信客戶及業(yè)務(wù)的早期風(fēng)險征兆,準確識別風(fēng)險的類別、程度、原因及其發(fā)展變化趨勢,并按規(guī)定的權(quán)限和程序?qū)栴}授信采取針對性處理措施,以及時防范、控制和化解授信風(fēng)險的一系列管理過程。
大數(shù)據(jù)風(fēng)險模型可以快速識別貸后風(fēng)險,為不同的用戶設(shè)定不同的監(jiān)控頻率、自動篩選高風(fēng)險客戶,制定有針對性的貸后管理措施、貸后管理工作等。
目前我國商業(yè)銀行缺乏細分客戶的計量工具,催收時通常根據(jù)逾期時間長短來區(qū)分客戶,導(dǎo)致精細化管理程度不高,無法早期區(qū)分出將要變?yōu)椴涣伎蛻舻母唢L(fēng)險客戶和可以主動還款的低風(fēng)險客戶。對前者因沒有采取有效的催收手段,而使之轉(zhuǎn)變?yōu)椴涣伎蛻?,對后者過度催收,增加了無謂的催收成本。
一個實施風(fēng)險管控的例子是新加坡的UOB銀行。它基于大數(shù)據(jù)成功測試了風(fēng)險系統(tǒng),在內(nèi)存技術(shù)(數(shù)據(jù)儲存在內(nèi)存中)和將銀行風(fēng)險總計算時間從18小時降為幾分鐘(風(fēng)險價值法)的支持下,使得“大數(shù)據(jù)”成為可能。這有助于在未來實現(xiàn)實時壓力測試,更快應(yīng)對新風(fēng)險。另一個大數(shù)據(jù)技術(shù)在現(xiàn)存商業(yè)模式中的成功案例是Morgan Stanley。該銀行開發(fā)其大數(shù)據(jù)處理能力,從而優(yōu)化了規(guī)模和結(jié)果質(zhì)量方面的組合分析。據(jù)預(yù)計,由于自動化模式識別和可理解性增強,這些過程將會導(dǎo)致金融風(fēng)險管控的顯著提升。
金融企業(yè)運用大數(shù)據(jù)和機器學(xué)習(xí)算法,對欠款客戶進行人群聚類并根據(jù)聚類的結(jié)果識別騙貸、惡意欠款、惡意透支、盜刷盜用、對交易有疑問拒絕還款、經(jīng)濟狀況惡化無力還貸、遺忘還貸等多種欠款類型;從而準確預(yù)測客戶的還款概率和金額,從而進行催收策略評估,最大限度降低催收成本。
中國建設(shè)銀行資產(chǎn)總行風(fēng)險管理部/資產(chǎn)保全部副總經(jīng)理譚興民曾詳盡分析大數(shù)據(jù)何以幫助銀行提高征信水平和風(fēng)險管控能力:
首先,一站式征信平臺可以進行貸前客戶甄別。目前,銀行查詢客戶的情況既費時、費力,又增加銀行費用,而利用企業(yè)的一站式征信平臺,則可以最大限度地節(jié)省銀行的人力、物力及時間,并確保數(shù)據(jù)有效、及時、準確。
其次,風(fēng)險量化平臺可以助力貸后風(fēng)險管控。平臺基于企業(yè)日常經(jīng)營數(shù)據(jù),結(jié)合平臺數(shù)據(jù)模型,采用動態(tài)、實時的云端數(shù)據(jù)抓取技術(shù),對企業(yè)的發(fā)展進行分析和評測,給出風(fēng)險量化分數(shù),并第一時間發(fā)現(xiàn)企業(yè)的生產(chǎn)經(jīng)營異動,在風(fēng)險觸發(fā)前3到6個月預(yù)警,使銀行等金融機構(gòu)能夠及時采取相應(yīng)措施,防止和減少損失發(fā)生。
同時,利用“企業(yè)族譜”查詢,對不良貸款進行監(jiān)控。如一些企業(yè)通過關(guān)聯(lián)交易轉(zhuǎn)移利潤、制造虧損的假象,為不償還銀行貸款尋找理由;或者通過關(guān)聯(lián)交易制造虛假業(yè)績,為繼續(xù)獲得銀行貸款提供依據(jù),這些假象通過關(guān)聯(lián)交易查詢,都可以很快發(fā)現(xiàn)蛛絲馬跡,讓企業(yè)造假暴露原形,可防止銀行上當(dāng)受騙。
大數(shù)據(jù)風(fēng)控相對于傳統(tǒng)風(fēng)控來說,建模方式和原理其實是一樣的,其核心是側(cè)重在利用更多維的數(shù)據(jù),更多互聯(lián)網(wǎng)的足跡,更多傳統(tǒng)金融沒有觸及到的數(shù)據(jù)。比如電商的網(wǎng)頁瀏覽、客戶在app的行為軌跡、甚至GPS的位置信息等,這些信息看似和一個客戶是否可能違約沒有直接關(guān)系,但實則通過大量的數(shù)據(jù)累積,能夠產(chǎn)生出非常有效的識別客戶的能力。
在運行邏輯上,大數(shù)據(jù)風(fēng)控不強調(diào)較強的因果關(guān)系,看重統(tǒng)計學(xué)上的相關(guān)性是大數(shù)據(jù)風(fēng)控區(qū)別于傳統(tǒng)金融風(fēng)控的典型特征。傳統(tǒng)金融機構(gòu)強調(diào)因果,講究兩個變量之間必須存在邏輯上能夠講通因果。
在數(shù)據(jù)維度這個層級,傳統(tǒng)金融風(fēng)控和大數(shù)據(jù)風(fēng)控還有一個顯著的區(qū)別在于傳統(tǒng)金融數(shù)據(jù)和非傳統(tǒng)金融數(shù)據(jù)的應(yīng)用。傳統(tǒng)的金融數(shù)據(jù)包括上文中提及的個人社會特征、收入、借貸情況等等。而互金公司的大數(shù)據(jù)風(fēng)控,采納了大量的非傳統(tǒng)金融數(shù)據(jù)。
相對于傳統(tǒng)金融機構(gòu),互金公司擴大了非傳統(tǒng)數(shù)據(jù)獲取的途徑,對于新客戶群體的風(fēng)險定價,是一種風(fēng)險數(shù)據(jù)的補充。當(dāng)然,這些數(shù)據(jù)的金融屬性有多強,仍然有待驗證。
巨頭優(yōu)勢明顯,并不代表創(chuàng)業(yè)公司的路已被堵死。大公司不可能面面俱到,布局各種場景。在互聯(lián)網(wǎng)巨頭尚未涉及的領(lǐng)域,小步快跑,比巨頭更早的搶下賽道,拿到數(shù)據(jù),并且優(yōu)化自己的數(shù)據(jù)應(yīng)用能力,成為創(chuàng)業(yè)公司殺出重圍的一條路徑。