劉德彬
我們的定位就是幫助政府、金融機構、企業(yè)進行風險評估。我認為我們的核心能力應當分為三塊。第一,數(shù)據(jù)收集能力。在我們創(chuàng)業(yè)之初,我們認為大量分布式爬蟲技術,可在互聯(lián)網(wǎng)中收集各種各樣的數(shù)據(jù),我們通過與電信、銀聯(lián)、航天等機構進行合作,逐漸擴大了數(shù)據(jù)來源,并拓展了我們的數(shù)據(jù)能力。
第二,數(shù)據(jù)清洗。我們?yōu)榻鹑跈C構提供大數(shù)據(jù)服務時,會在文本中遇到大量的數(shù)據(jù),所以我們就需要把多源異構的數(shù)據(jù)進行融合,這就會涉及數(shù)據(jù)清洗。
第三,數(shù)據(jù)挖掘。在我們得到清洗后的數(shù)據(jù)后,應當如何運用?對我們而言,我們幫助政府、金融等機構進行數(shù)據(jù)處理時,需要將挖掘出來的數(shù)據(jù)進行預測,幫助企業(yè)解決未來可能發(fā)生的信用風險。所以我們開發(fā)了很多新型模式,而這些模式是基于時間序列的風險預測模型以及知識圖譜的企業(yè)風險評估模型建立的。有了這三個能力后,我們將重點放在兩個方面的創(chuàng)新。一個是對規(guī)模型企業(yè)的智能評級。在市場中有很多評級公司,他們的評級方式是依靠專家。我們的評級業(yè)務是針對中國的上市公司和發(fā)展型公司,所以我們需要結合公司的財務報表、行業(yè)的數(shù)據(jù)行為和數(shù)據(jù)基本信息,對這些企業(yè)的債券進行風險評級,這種評級具有動態(tài)性和實時性,可以幫我們做出預警。
一個智能動態(tài)評級系統(tǒng),需要用到財務報表。但是在中國,除了上市公司和發(fā)債公司有手機動態(tài)財務報表之外,中小企業(yè)的財務報表卻很難獲得,所以我們對幾千萬的中小企業(yè),通過關聯(lián)關系、歷史行為數(shù)據(jù)來構造行為模型和異常檢測。我們的目標非常簡單,通過算法模型來尋找異常行為。通過異常檢測,從海量數(shù)據(jù)中尋找異常行為。
我們的具體做法是,把找到的600多萬家中國企業(yè)所面臨的風險和異常情況全部挑選出來,利用機器學習技術進行數(shù)據(jù)挖掘,最后整理出企業(yè)的行為模式。從中我們便可以得知企業(yè)發(fā)生某項事件的百分比。
我們在發(fā)展大數(shù)據(jù)業(yè)務方面,主要從事三個業(yè)務板塊:一是標準化服務金融機構,二是政府項目:三是數(shù)據(jù)金融業(yè)務。我們在生態(tài)中有哪些應用?第一,國內(nèi)各級部門對自己所管轄區(qū)域內(nèi)的企業(yè),都有風險監(jiān)控和風險監(jiān)管的需求,所以我們就幫助政府部門進行風險監(jiān)管處理,我們有整套的風險評估、分發(fā)、風險處置的流程和方法,并實現(xiàn)閉環(huán)的管理。
第二,我們在數(shù)據(jù)金融領域進行創(chuàng)新。在五年前通過個人姓名、身份證號、手機號來獲得貸款的方式非常新穎,在三年前手機貸款和現(xiàn)金貸層出不窮,在未來金融行業(yè)所呈現(xiàn)的是依靠大數(shù)據(jù)來加快審批的速度,更好地解決中小企業(yè)所面臨的問題。所以我們認為,金融大數(shù)據(jù)的發(fā)展需要的是場景。比如中標貸和酒店貸等領域,我們可以通過該領域的核心場景中,來獲取數(shù)據(jù)同時定制模型,這一做法可幫助金融機構創(chuàng)造新型的金融產(chǎn)品,幫助中小企業(yè)解決他們在場景中所面臨的問題。
酒店貸是我們今年重點推出的產(chǎn)品,該產(chǎn)品已經(jīng)在我國西南地區(qū)落地應用。在2017年,我們發(fā)現(xiàn)國內(nèi)的中小酒店存在融資難問題,因為大部分酒店與物業(yè)是租賃關系,酒店無法給銀行提供擔保,所以酒店就無法從銀行獲得貸款。我們通過與合作伙伴的合作,以酒店的入住、開票和個人數(shù)據(jù)為基礎,同時結合我們自身擁有的企業(yè)數(shù)據(jù)構造了三套模型。一是獲客模型,二是風險定價模型,三是貸后監(jiān)控預警模型。我們可以通過獲客模型,從兩萬家酒店中選取信用良好的酒店,并把他們標記成可放貸對象。然后我們通過從酒店收集到的個人數(shù)據(jù)、經(jīng)營數(shù)據(jù)、行業(yè)數(shù)據(jù)、企業(yè)數(shù)據(jù)、關聯(lián)方數(shù)據(jù)對酒店進行風險定價。資金方可以依靠此項依據(jù)對酒店進行放貸,最后我們的監(jiān)控預警系統(tǒng),可以對本次的金融行為進行監(jiān)測。
中標貸也是我們的產(chǎn)品,我們利用中標貸系統(tǒng)對重慶幾十家招投標網(wǎng)站進行監(jiān)控,該系統(tǒng)一旦發(fā)現(xiàn)中標信息,就可以自動分析招標單位數(shù)據(jù),同時預測中標公司存在哪些風險,最后將評估出來的結果推送給資金方。通過這一個項目,放貸量已增長到40億元。
一直以來我們都在進行基于SaaS的服務幫助金融機構做好中小微企業(yè)風控,而我們的重點是開發(fā)群體性智能預警,通過以點帶面的方式,進行多維度的數(shù)據(jù)采集。此外,通過數(shù)據(jù)挖掘、算法模型等技術,從海量信息中挖掘蛛絲馬跡進行風險比較。
我們發(fā)現(xiàn)中國上市公司所開放的年報90%以上是正向的,從年報中很少能發(fā)現(xiàn)哪些公司存在不足。所以我們只能對這些公司進行全網(wǎng)監(jiān)測,而監(jiān)測后得出的數(shù)據(jù)可以告訴我們所關注領域的風險信號。我們對中國3000多家上市公司的數(shù)據(jù)進行梳理,當我們?nèi)サ舨恢匾年P聯(lián)關系時發(fā)現(xiàn),近兩三百萬家企業(yè)和這些上市公司關系密切。我們通過對兩三百萬家企業(yè)進行實時監(jiān)控,利用我們的模型進行分析,發(fā)現(xiàn)這些企業(yè)確實和很多上市公司的風險有所關聯(lián),比如上市公司市值管理風險、退市風險等,都可以通過大數(shù)據(jù)建模分析,給我們提供一些情報線索。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)