凌小山 鐘元癸
[摘要]數(shù)據(jù)貼近了人們的工作生活,已經(jīng)漸漸的作為大家工作生活中的一項(xiàng)型的生產(chǎn)工具。在如今這個(gè)信息技術(shù)快速發(fā)展的時(shí)代,大數(shù)據(jù)不僅僅是成為了一個(gè)熱詞,同時(shí)與人們的生活產(chǎn)生了密切的關(guān)系,在文中主要就大數(shù)據(jù)時(shí)代的風(fēng)控進(jìn)行探討。
[關(guān)鍵詞]大數(shù)據(jù) 風(fēng)控 消費(fèi)
在大數(shù)據(jù)成為熱詞的那段時(shí)間,大數(shù)據(jù)風(fēng)控似乎往往作為互聯(lián)網(wǎng)金融企業(yè)代言詞。就拿“E租寶”這樣的龐氏騙局企業(yè),在宣傳中也號(hào)稱“引領(lǐng)大數(shù)據(jù)在行業(yè)信用管理和風(fēng)控防范之中的應(yīng)用趨勢(shì)”。
當(dāng)然,我首先檢討一下,自認(rèn)為我們塔塔數(shù)據(jù)是行業(yè)的引領(lǐng)者,這段時(shí)間看到了一家銀行已經(jīng)有“稅E融”也看到了他們組建了大數(shù)據(jù)工作站,開展了大數(shù)據(jù)風(fēng)控的各項(xiàng)探索。已經(jīng)運(yùn)用大數(shù)據(jù)DT引進(jìn)大量外部數(shù)據(jù),在工商族譜、社交數(shù)據(jù)上做欺詐分析,利用邏輯回歸,支持向量機(jī)(SVM),決策樹等模型補(bǔ)充或替代傳統(tǒng)的打分卡,在更廣泛的數(shù)據(jù)源上開始進(jìn)行建模分析等。在這種背景下我迫切的感受到了壓力,作為數(shù)據(jù)供應(yīng)商與方案解決商我們不能夜郎自大了。
一、行業(yè)內(nèi)對(duì)于如何落地大數(shù)據(jù)風(fēng)控存在的疑問
第一,不同的消費(fèi)場(chǎng)景下,客戶客群的特征是不一樣的,收集到的客戶信息差異可能很大,這些大數(shù)據(jù)方法的客觀性無法保證。就如針對(duì)熱愛社交的年輕群體,能夠爬取到有價(jià)值的社交數(shù)據(jù),知識(shí)圖譜就能發(fā)揮出一些價(jià)值。但針對(duì)貸款主流群體來說,這些人的數(shù)據(jù)就很難獲取了。
第二,目前的信用體系中,貸款審批的衡量、反欺詐能力、額度評(píng)估能力與催收手段等等,共同決定了風(fēng)險(xiǎn)決策。大數(shù)據(jù)與風(fēng)險(xiǎn)決策落地探索依舊是困難重重。也許在不同的場(chǎng)景下,有些可能是反欺詐的決定性更強(qiáng)些,有些可能是額度的評(píng)定更強(qiáng)些,有些可能是催收的手段來的更直接。拋開具體的貸款場(chǎng)景來運(yùn)用大數(shù)據(jù)風(fēng)控依舊不是很成熟。
第三,算法模型具有一定的適用性和局限性的,還需要通過不斷地實(shí)踐創(chuàng)新內(nèi)測(cè)來完善。
第四,傳統(tǒng)的金融產(chǎn)品的風(fēng)控決策也是以數(shù)據(jù)作支持的。人工的風(fēng)控決策是信審人員長(zhǎng)期與調(diào)查借款人信息與經(jīng)驗(yàn)的判斷,風(fēng)險(xiǎn)控制在大數(shù)據(jù)與DT應(yīng)用初期與信貸專員的經(jīng)驗(yàn)還需要有機(jī)結(jié)合,因?yàn)閾p失性的貸款成本是無法的估量的。
第五,大數(shù)據(jù)風(fēng)控成本。從基礎(chǔ)的設(shè)施投入、系統(tǒng)研發(fā),大量的外部數(shù)據(jù)成本、再到到昂貴的大數(shù)據(jù)人才聘用,以及不初期出現(xiàn)的損失貸款,這些投入也是無法想象的。
第六,大數(shù)據(jù)風(fēng)控若是沒有高瞻遠(yuǎn)矚可持續(xù)經(jīng)營(yíng)的理念牽頭人,沒有一幫擁有激情的的人才團(tuán)隊(duì),是沒有最終的勝利,大數(shù)據(jù)的產(chǎn)出都存在很大的未知數(shù)。這些未知數(shù)讓很多望而止步。
二、讓大數(shù)據(jù)風(fēng)控落地產(chǎn)生價(jià)值
如何能讓大數(shù)據(jù)風(fēng)控落地,繼而產(chǎn)生可觀的價(jià)值,路漫漫其修遠(yuǎn)兮,我們既然跨出了一大步,我更希望大家永不止步。基于目前首先該建立效果評(píng)估體系,循序漸進(jìn)開展大數(shù)據(jù)風(fēng)控各項(xiàng)工作:
第一,在產(chǎn)品上線的階段,有放貸限額,小范圍測(cè)試;而業(yè)務(wù)成熟階段,則會(huì)追求更高的批過率和更低的壞賬率,并尋求兩者之間最佳平衡。
第二,用量化指標(biāo)進(jìn)行衡量。也就是說,大數(shù)據(jù)風(fēng)控作為風(fēng)控的方法,應(yīng)該用清晰的指標(biāo)來衡量取得的成果。
第三,指標(biāo)的物理含義是一般人都能理解的。只有讓為投入買單的老板們理解了大數(shù)據(jù)風(fēng)控的衡量指標(biāo),他們才能作出決策以開展持續(xù)的技術(shù)投入。
第四,完備的指標(biāo)。比如,實(shí)施了一種大數(shù)據(jù)風(fēng)控技術(shù),可能帶來壞賬率的下降,但同時(shí)也可能帶來批過率的下降。雖然壞賬少了,但業(yè)務(wù)量也降低了。但從“得”的指標(biāo)上衡量,是沒有意義的。要“得”與“失”結(jié)合起來,根據(jù)企業(yè)不同的發(fā)展階段,選擇不同的技術(shù)。
在該評(píng)估體系下,決策者將能清晰地衡量具體的風(fēng)控技術(shù)來帶的ROI,然后決策該采用什么樣的技術(shù)手段。在有清晰的產(chǎn)出預(yù)期下,大數(shù)據(jù)風(fēng)控的投入就可以循序漸進(jìn)的執(zhí)行。人們將不再困惑于各種難以理解的模型算法,而是把它們當(dāng)成工具,然后選擇最優(yōu)的算法即可。
三、大數(shù)據(jù)風(fēng)控系統(tǒng)評(píng)估
基于大數(shù)據(jù)的思想,人們提出了很多模型來做風(fēng)控系統(tǒng)。同一種模型用不同的模型參數(shù)又可以橫向衍生出很多新的模型。那么在眾多的數(shù)學(xué)模型中,怎樣知道應(yīng)該使用哪一種模型呢?模型評(píng)估體系的建設(shè)就顯得尤為重要。通常評(píng)估一個(gè)模型的好壞應(yīng)該從模型的三個(gè)屬性去評(píng)估:
第一,精確性:在預(yù)測(cè)狀態(tài)變量時(shí),模型必須有一定的精確性。
第二,穩(wěn)健性:模型應(yīng)該對(duì)于目標(biāo)總體中的所有樣本都有效,而不僅僅是對(duì)開發(fā)測(cè)試樣本有效。
第三,合理性:模型表現(xiàn)出來的趨勢(shì)對(duì)于觀測(cè)到的行為必須有意義。
在這里我們主要講模型的精確性。KS值、EVA、洛倫茲曲線(ROC)是被廣泛使用的模型精確性評(píng)估指標(biāo)。在統(tǒng)計(jì)學(xué)中,KS值是用來衡量模型的區(qū)分能力。通俗來講就是模型區(qū)分好客戶與壞客戶的能力。好客戶是指守約客戶,壞客戶是指違約客戶。KS值越大,模型的識(shí)別能力就越強(qiáng),反之,就越弱。ROC曲線的作用是衡量信貸模型的目標(biāo)累積強(qiáng)度。這里的目標(biāo)是指違約客戶,通俗來講ROC曲線的凸度大小反應(yīng)了模型識(shí)別壞客戶的能力。凸度越大說明模型越優(yōu)秀,如:在20%的總體人群中就能夠辨別出60%的所有違約人群。ROC曲線凸度大小和KS值大小是正相關(guān)關(guān)系。ROC曲線的凸度越大,相對(duì)應(yīng)模型的KS值就越大。這些指標(biāo)有助于多個(gè)模型甄別,模型參數(shù)優(yōu)化的情況。即便對(duì)于當(dāng)前來看不錯(cuò)的模型,我們也應(yīng)該定期檢驗(yàn)?zāi)P偷闹匾u(píng)估指標(biāo)。評(píng)估體系的建立固然重要但同時(shí)也要充分認(rèn)識(shí)模型的局限性。在利用模型制定信貸策略時(shí),我們應(yīng)該信奉“實(shí)踐是檢驗(yàn)真理的唯一標(biāo)準(zhǔn)”。
目前芝麻征信關(guān)于企業(yè)征信的產(chǎn)品已經(jīng)在做內(nèi)測(cè),其他已經(jīng)取得或者已經(jīng)備案的企業(yè)征信大數(shù)據(jù)公司和我們塔塔數(shù)據(jù)致力于向消費(fèi)金融公司和各大商業(yè)銀行普及大數(shù)據(jù)技術(shù),提供標(biāo)準(zhǔn)化、模塊化、的大數(shù)據(jù)風(fēng)控系統(tǒng),以降低消費(fèi)金融企業(yè)客戶使用大數(shù)據(jù)技術(shù)的資金成本和技術(shù)門檻。但是作為數(shù)據(jù)業(yè)類人來說我覺得更多的來自于技術(shù)本身對(duì)既有業(yè)務(wù)管理體系和決策層知識(shí)結(jié)構(gòu)的挑戰(zhàn),它的應(yīng)用也是雙面的,可能會(huì)對(duì)企業(yè)與銀行的業(yè)務(wù)帶來混亂和災(zāi)難。明確的效果評(píng)估體系,能給大數(shù)據(jù)風(fēng)控技術(shù)落地帶來有效的指導(dǎo)和管控,把業(yè)務(wù)的開展統(tǒng)一到一個(gè)目標(biāo)體系上來。
綜上基于在大數(shù)據(jù)不夠大,數(shù)據(jù)來源的客觀性、信息傳播的擊鼓傳花特性以及傳統(tǒng)的風(fēng)險(xiǎn)模型都需要大量的模型實(shí)踐積累的高昂的損失貸款成本、時(shí)間成本和數(shù)據(jù)引入成本。
因此在大數(shù)據(jù)時(shí)代初期階段,我們?cè)陲L(fēng)控應(yīng)用上應(yīng)做好有長(zhǎng)期的積累與探索的思想準(zhǔn)備,在信息不對(duì)稱性與共享的信息經(jīng)濟(jì)中,DT更多的是作為新型的生產(chǎn)工具,在各大銀行消費(fèi)型貸款業(yè)務(wù)、P2P互聯(lián)網(wǎng)金融業(yè)務(wù)中都應(yīng)需要與征信服務(wù)公司和塔塔數(shù)據(jù)提供商進(jìn)行多方位戰(zhàn)略合作從而提升在數(shù)據(jù)積累和建模等多方面的能力以面對(duì)新經(jīng)濟(jì)形勢(shì)帶來的機(jī)遇與挑戰(zhàn)。