數(shù)據(jù)智能時(shí)代是大數(shù)據(jù)與人工智能有機(jī)結(jié)合的新時(shí)代。人工智能與大數(shù)據(jù)的關(guān)系就像蒸汽與蒸汽機(jī)。大數(shù)據(jù)就像蒸汽,人工智能就像蒸汽機(jī),把蒸汽轉(zhuǎn)化為先進(jìn)生產(chǎn)力。
—金電聯(lián)行(北京)信息技術(shù)有限公司董事長(zhǎng)范曉忻
數(shù)據(jù)智能曾被看做是各個(gè)行業(yè)的催化劑,不屬于基礎(chǔ)建設(shè)領(lǐng)域。但現(xiàn)在,數(shù)據(jù)智能領(lǐng)域已經(jīng)成為了一個(gè)重要的基礎(chǔ)建設(shè)領(lǐng)域。我們對(duì)大數(shù)據(jù)的理解最初來源于4個(gè)“V”,即真實(shí)性(Veracity)、大量化(Volume)、速度化(Velocity)、多樣化(Variety)。現(xiàn)在大家對(duì)4個(gè)“V”這個(gè)概念的理解已經(jīng)不盡相同。我們把真實(shí)性換成了價(jià)值密度(Value density)這種特性,因?yàn)槲覀冋J(rèn)為只有價(jià)值密度低的數(shù)據(jù)才是大數(shù)據(jù)。如果價(jià)值密度較高,數(shù)據(jù)就不能被稱作是大數(shù)據(jù),而應(yīng)該被叫做結(jié)果數(shù)據(jù),因?yàn)檫@些數(shù)據(jù)無法進(jìn)行進(jìn)一步地多維分析。只有對(duì)價(jià)值密度非常低的數(shù)據(jù)進(jìn)行多維分析,才有可能產(chǎn)生有影響力的結(jié)果。
下面我們談一談數(shù)據(jù)約束力,數(shù)據(jù)約束力改變了合同履約率低的現(xiàn)狀,如在交通方面,強(qiáng)大的攝像頭形成了數(shù)據(jù)的約束力。國(guó)家相繼出臺(tái)的政策旨在通過打通各個(gè)委辦局的數(shù)據(jù),形成事實(shí)上的數(shù)據(jù)約束,提升整個(gè)社會(huì)和經(jīng)濟(jì)活動(dòng)的效率,其中包括金融活動(dòng)的信用水平。
我們建立了五層架構(gòu)來支撐信用建設(shè)實(shí)現(xiàn)飛躍式進(jìn)展,這五層架構(gòu)包括:其一,大數(shù)據(jù)基礎(chǔ)平臺(tái)和大數(shù)據(jù)IO控制器。以計(jì)算機(jī)為例,大數(shù)據(jù)基礎(chǔ)平臺(tái)類似于主板,IO控制器類似于南橋。其二,大數(shù)據(jù)管理器,即數(shù)據(jù)關(guān)系管理平臺(tái),類似于北橋。其三,大數(shù)據(jù)中央處理器類似于CPU。其四,大數(shù)據(jù)的建模平臺(tái)幾乎應(yīng)用在所有的模型生產(chǎn)、調(diào)整、投產(chǎn)領(lǐng)域。其五,數(shù)據(jù)應(yīng)用AI處理器,包括我們的方法論、知識(shí)圖譜等,相當(dāng)于計(jì)算機(jī)的可編程控制器。這五層架構(gòu)實(shí)現(xiàn)了數(shù)據(jù)從接入到管控、數(shù)據(jù)的標(biāo)準(zhǔn)化、數(shù)據(jù)之間關(guān)系的標(biāo)準(zhǔn)化、原數(shù)據(jù)管理,再到數(shù)據(jù)在整個(gè)體系內(nèi)的生產(chǎn)調(diào)動(dòng)、模型的生產(chǎn)調(diào)度,構(gòu)成了數(shù)據(jù)生產(chǎn)的閉環(huán)。
我們的平臺(tái)需要有自主可控能力、產(chǎn)品封裝能力,在數(shù)據(jù)生產(chǎn)、處理、交付的過程中要盡量排除人的影響。人工智能平臺(tái)需要有實(shí)時(shí)計(jì)算的能力,只有在不需要人力的情況下,我們才能實(shí)現(xiàn)從數(shù)據(jù)處理到應(yīng)用的全流程自動(dòng)化和人工智能的普適化。
我們的核心技術(shù)是“星簇”和“方舟”,“星簇”可以理解為大數(shù)據(jù)時(shí)代的CPU。如果我們把大數(shù)據(jù)與汽車生產(chǎn)車間進(jìn)行比較,“星簇”就類似于整條生產(chǎn)線,其中包括設(shè)計(jì)、施工、交付、運(yùn)行、監(jiān)控和粗加工等環(huán)節(jié)。每一個(gè)汽車廠都有零部件加工的系統(tǒng),一些大的零部件加工環(huán)節(jié)也可以在“星簇”平臺(tái)里體現(xiàn)。如今,“星簇”平臺(tái)已經(jīng)擁有2500多個(gè)組件,可以支持用戶對(duì)數(shù)據(jù)的實(shí)時(shí)處理。
“方舟”平臺(tái)可以理解為大數(shù)據(jù)時(shí)代的GPU,它與市場(chǎng)上比較流行的建模平臺(tái)有一些區(qū)別。建模平臺(tái)的作用是將人從模型的建構(gòu)中解脫出來,通過將經(jīng)驗(yàn)與模型的構(gòu)建相結(jié)合尋找合適的模型,本質(zhì)上是通過算法尋找算法,而不是人為地尋找算法?!胺街邸焙推渌F脚_(tái)的區(qū)別在于“方舟”能夠基于因果推論進(jìn)行機(jī)器學(xué)習(xí)。我們的人工智能算力不足,只有算力足夠,人工智能才有機(jī)會(huì)接近人的思維模式,但很多規(guī)律我們已經(jīng)獲得了經(jīng)驗(yàn),這些經(jīng)驗(yàn)在社會(huì)經(jīng)濟(jì)生活中已經(jīng)有所體現(xiàn)。因此,我們結(jié)合經(jīng)驗(yàn)和算法進(jìn)行了深入的研究,并開發(fā)了基于因果推論的機(jī)器學(xué)習(xí)模式。機(jī)器學(xué)習(xí)的過程包括三個(gè)階段:使用案例找原算法、使用原算法找算法、使用算法找模型。
下面我來談?wù)剶?shù)據(jù)遷移。數(shù)據(jù)遷移作為一個(gè)新概念,引起了非常大的關(guān)注,原因有以下三點(diǎn):第一,分布式計(jì)算已經(jīng)成為現(xiàn)今相對(duì)熱門的體系,同時(shí)也是未來的主流體系。在這種情況下,傳統(tǒng)的架構(gòu)面臨巨大的挑戰(zhàn)。第二,隨著互聯(lián)網(wǎng)金融的發(fā)展放緩,大量的數(shù)據(jù)轉(zhuǎn)入傳統(tǒng)金融機(jī)構(gòu)。在這種情況下,傳統(tǒng)的數(shù)據(jù)倉庫難以承載來自移動(dòng)端的壓力,金融機(jī)構(gòu)要從傳統(tǒng)的數(shù)據(jù)倉庫向新的架構(gòu)轉(zhuǎn)移。第三,從源頭到流通端再到應(yīng)用端,隱私數(shù)據(jù)作為結(jié)果數(shù)據(jù)受到了重重保護(hù),這些數(shù)據(jù)的使用受到了極大的限制,企業(yè)對(duì)大數(shù)據(jù)的需求變得非常迫切。
為了支持實(shí)體經(jīng)濟(jì),破解中小企業(yè)融資難的困境,我們提出了兩個(gè)模式:嘉定模式和蕪湖模式。嘉定模式是一個(gè)比較成熟的,適合在相對(duì)發(fā)達(dá)的、優(yōu)質(zhì)中小企業(yè)相對(duì)集中的地區(qū)發(fā)展的模式。嘉定模式通過征信機(jī)構(gòu)和政府的合作,把合適的金融產(chǎn)品推送給企業(yè),再將合適的企業(yè)推送給金融機(jī)構(gòu),以此來做到精準(zhǔn)匹配。而蕪湖模式是一個(gè)四方參與、四方受益,最終實(shí)現(xiàn)最大杠桿效率的模式。這個(gè)模式是由政府主導(dǎo)建立產(chǎn)融平臺(tái)或融資平臺(tái),在這個(gè)平臺(tái)上促成金融機(jī)構(gòu)和企業(yè)的合作。蕪湖模式與嘉定模式最大的區(qū)別在于政府為蕪湖模式提供后備資金或風(fēng)險(xiǎn)準(zhǔn)備金等,政府可以將小微企業(yè)推送給金融機(jī)構(gòu),政府的后備資金還可以為金融機(jī)構(gòu)提供保障。征信機(jī)構(gòu)在這里面起到非常關(guān)鍵的作用,征信機(jī)構(gòu)通過測(cè)算數(shù)據(jù),并與政府溝通,確定支持企業(yè)融資的比例和要擴(kuò)大多大的規(guī)模才能使雙方的信息對(duì)稱。因此在風(fēng)險(xiǎn)可以得到有效控制的情況下,金融機(jī)構(gòu)幫助優(yōu)質(zhì)企業(yè)融資的速度將大大提升。
數(shù)據(jù)智能、人工智能和大數(shù)據(jù)之間互為因果,沒有數(shù)據(jù)支撐的模型也不可能獲得成功,因此,數(shù)據(jù)智能是未來極為重要的發(fā)展方向。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)