本刊記者 劉 佳
第四范式:AI世界的“先知”
本刊記者 劉 佳
公司介紹:
第四范式是國際領(lǐng)先的人工智能技術(shù)與服務(wù)提供商。具備國際頂尖的機(jī)器學(xué)習(xí)技術(shù),能夠?qū)?shù)據(jù)進(jìn)行精準(zhǔn)挖掘與預(yù)測(cè),幫助企業(yè)實(shí)現(xiàn)智能變革、提升運(yùn)營績效、創(chuàng)造商業(yè)價(jià)值。團(tuán)隊(duì)已為金融、電信、互聯(lián)網(wǎng)等100多個(gè)企業(yè)成功打造人工智能解決方案,是人工智能工業(yè)應(yīng)用的引領(lǐng)者與踐行者。創(chuàng)始人戴文淵兼任CEO,聯(lián)合創(chuàng)始人楊強(qiáng)為首席科學(xué)家。
團(tuán)隊(duì)會(huì)議
“要想戰(zhàn)勝AlphaGo,必須控制好自己的‘心魔’?!?/p>
兩年間,人工智能系統(tǒng)AlphaGo騰空出世,先以4:1狂虐韓國九段高手李世石,次年又將排名世界第一的中國棋手柯潔直落三局挑落馬下,一時(shí)間名聲大噪。面對(duì)人工智能的咄咄逼人,有人贊嘆,有人擔(dān)憂??聺嵣踔猎谫惡篦鋈粶I下,直言AlphaGo就像神一般的存在,貌似無懈可擊。
然而,在人工智能領(lǐng)域已經(jīng)浸染十余年的戴文淵卻并不這么認(rèn)為?!癆lphaGo所基于的人工智能技術(shù),強(qiáng)項(xiàng)不在于推演,而是借鑒過去的棋譜。所以,如果要擊敗AlphaGo,需要盡可能把局面導(dǎo)向歷史上沒人下過的棋?!贝魑臏Y所說的“棋譜”,對(duì)于人工智能而言,就是“大數(shù)據(jù)”。正如人類會(huì)經(jīng)歷很多的事情,得出一些知識(shí)和經(jīng)驗(yàn),幫助未來做的更好。人工智能就是從數(shù)據(jù)中總結(jié)出有價(jià)值的信息,以預(yù)測(cè)未來發(fā)生的事情。
同時(shí)戴文淵還提到了人與人工智能的另一個(gè)區(qū)別——情緒。人在進(jìn)退得失之間便會(huì)生出各種情緒,或焦慮、或緊張、或自滿,而人工智能卻完全不具有人類的情緒弱點(diǎn)。戴文淵曾經(jīng)在網(wǎng)上撰文表示:“要想戰(zhàn)勝AlphaGo,必須控制好自己的‘心魔’?!?/p>
在A I領(lǐng)域已經(jīng)是頂尖專家的戴文淵,其實(shí)在3年前創(chuàng)建第四范式并擔(dān)任公司CEO的時(shí)候也只有30歲出頭。在外人眼中,這不過是一個(gè)戴黑邊框眼鏡,愛鉆研算法和編程的標(biāo)準(zhǔn)理工男創(chuàng)業(yè)的故事罷了,但是當(dāng)他坐在記者面前彬彬有禮地講述人工智能的發(fā)展和未來時(shí),你會(huì)發(fā)現(xiàn)事實(shí)上遠(yuǎn)沒那么簡單——你完全跟不上戴文淵的思路。這是一個(gè)邏輯縝密、判斷力強(qiáng)并且不按套路出牌的年輕科學(xué)家。
第四范式創(chuàng)始人與李開復(fù)(左2)、沈南鵬(左3)合影。
“先判斷趨勢(shì),建立目標(biāo),然后以終為始,將目標(biāo)拆解成一層層的任務(wù),逐步實(shí)現(xiàn),所以我覺得一切都是順理成章的?!?/p>
戴文淵曾就讀于上海交通大學(xué)計(jì)算機(jī)系的一個(gè)實(shí)驗(yàn)班。在2005年,他獲得了由美國計(jì)算機(jī)協(xié)會(huì)(ACM)主辦的ACM國際大學(xué)生程序設(shè)計(jì)競(jìng)賽世界冠軍,這個(gè)被譽(yù)為“計(jì)算機(jī)界奧林匹克”的比賽云集了全球智商最高的人,戴文淵是為數(shù)不多的華人冠軍。
頭頂世界冠軍頭銜的戴文淵,在研究生階段卻毅然選擇了當(dāng)時(shí)被世人冷落的人工智能方向?!?0多年前,正是人工智能發(fā)展的低潮期,幾乎沒有畢業(yè)生主動(dòng)選擇這個(gè)方向。如果那時(shí)候你跟誰說AI能做起來,一定會(huì)被質(zhì)疑的?!贝魑臏Y回憶起最初選擇時(shí)的情景,“但根據(jù)我的判斷,人工智能一定會(huì)大有作為?!?/p>
戴文淵的不按常理出牌還體現(xiàn)在學(xué)術(shù)前程將一片光明的他,主動(dòng)放棄了讀博的機(jī)會(huì),而是選擇去了百度。當(dāng)時(shí)百度還沒現(xiàn)在這么火,只是一家發(fā)展中的公司,很多人難以理解他的選擇。對(duì)此,戴文淵解釋道:“我在人工智能的研究路上,必須要通過海量的數(shù)據(jù)不斷驗(yàn)證自己的算法是否正確,當(dāng)時(shí)在國內(nèi),只有百度能夠滿足我的需求。”
戴文淵將百度視為一座開放的大實(shí)驗(yàn)室,繼續(xù)著他在人工智能方面的深入鉆研。他與當(dāng)時(shí)同在百度,現(xiàn)第四范式聯(lián)合創(chuàng)始人、首席研究科學(xué)家陳雨強(qiáng)一起,成功搭建了世界上首個(gè)商用深度學(xué)習(xí)系統(tǒng),也就是百度的“鳳巢”廣告系統(tǒng)——同時(shí),這也是世界上最大的商用深度學(xué)習(xí)系統(tǒng)?!傍P巢”系統(tǒng)的成功驗(yàn)證了在超大規(guī)模數(shù)據(jù)中人工智能確實(shí)能給業(yè)務(wù)帶來正向效果,百度的變現(xiàn)能力也一下子4年提升了8倍。這讓戴文淵的團(tuán)隊(duì)獲得了百萬美金的“百度最高獎(jiǎng)”,同時(shí)他也成為了百度歷史上最年輕的高級(jí)科學(xué)家(T10級(jí))。
就當(dāng)人們?cè)谕茰y(cè)戴文淵升入百度更高一級(jí)的管理層只是時(shí)間問題時(shí),他卻再一次出人意料地跳槽去了華為,擔(dān)任起諾亞方舟實(shí)驗(yàn)室的主任科學(xué)家。對(duì)此,他的解釋是:“在百度,我實(shí)現(xiàn)了作為一名科學(xué)家的夢(mèng)想,就是看到AI能夠在產(chǎn)業(yè)界落地。去華為,則是為了驗(yàn)證這種技術(shù)能給一家公司創(chuàng)造價(jià)值后,能否給更多公司創(chuàng)造價(jià)值?!?/p>
戴文淵在華為嘗試用企業(yè)服務(wù)的方式做AI,為客戶提供AI解決方案,讓AI幫助不同企業(yè)獲得效益和效率的提升。當(dāng)他在百度和華為都獲得成功之后,戴文淵不再滿足于讓AI服務(wù)僅僅局限于為一家或幾家企業(yè),他認(rèn)為AI應(yīng)該遍地開花,造福全社會(huì),希望找到一家能夠服務(wù)各行各業(yè)的公司。然而,當(dāng)時(shí)創(chuàng)業(yè)的風(fēng)口以及投資的熱點(diǎn)都在做O2O上,人工智能的概念還沒有被普遍接受,所以戴文淵并沒有找到理想中的公司。于是,他決定自己創(chuàng)業(yè),成立“第四范式”,致力于降低AI的應(yīng)用門檻,讓人工智能變得觸手可及。
在各大互聯(lián)網(wǎng)的論壇和群里,戴文淵被年輕的IT學(xué)子們稱呼為“戴神”,因?yàn)榇魑臏Y總能做出令人意料不到,但事后證明非常正確的選擇。從十幾年前選擇了不被看好的人工智能方向,到率先走進(jìn)AI商業(yè)落地實(shí)踐,再到獨(dú)立創(chuàng)業(yè)、立志要讓AI觸手可及,他的每一步都走在了時(shí)代的前面。
對(duì)此,戴文淵很淡然:“我是一個(gè)偏目標(biāo)導(dǎo)向的人,先判斷趨勢(shì),建立目標(biāo),然后以終為始,將目標(biāo)拆解成一層層的任務(wù),逐步實(shí)現(xiàn),所以我覺得一切都是順理成章的?!鼻兄泻诵模靼鬃约阂裁?,之后全力以赴,用簡單的方法化解復(fù)雜的問題,戴文淵深得“重劍無鋒,大巧不工”的精髓。
一路以來,戴文淵身邊還有一位同樣頗具傳奇色彩的人物,那就是他的導(dǎo)師——首位華人國際人工智能聯(lián)合會(huì)議(IJCAI)理事會(huì)主席,國際人工智能協(xié)會(huì)(AAAI)唯一的華人Councilor楊強(qiáng)教授。楊強(qiáng)學(xué)習(xí)天文出身,曾在美國馬里蘭大學(xué)學(xué)習(xí)天體物理,后來轉(zhuǎn)行進(jìn)入人工智能領(lǐng)域,很多人無法理解他這么大的轉(zhuǎn)變,認(rèn)為完全是兩個(gè)不同的世界。然而在楊強(qiáng)看來,兩者卻有著相通的地方,那就是都需要建模型,從給宇宙建模,轉(zhuǎn)向給機(jī)器建模,“想通過編程的手段實(shí)現(xiàn)機(jī)器的智能”,這個(gè)理想一堅(jiān)持就是30年。
楊強(qiáng)與戴文淵相識(shí)于人工智能式微之時(shí),戴文淵作為訪問學(xué)者來到香港科技大學(xué),成為楊強(qiáng)教授的門下弟子。那是2006年的秋天,當(dāng)時(shí)人們談?wù)揂I的時(shí)候都很小心翼翼,擔(dān)心被誤認(rèn)為是忽悠人的騙子。在這種背景下,這兩個(gè)堅(jiān)信人工智能必將騰飛的人就更加“惺惺相惜”。在沒有經(jīng)費(fèi)支持的情況下,楊強(qiáng)帶著戴文淵投入其中,潛心鉆研,做了很多開創(chuàng)性的工作,一直堅(jiān)持到人工智能的破曉時(shí)分,直到今天的天光大亮。
“有時(shí)候也會(huì)迷茫、會(huì)動(dòng)搖,或者爭(zhēng)強(qiáng)好勝,想把步子邁得再大一點(diǎn)。但是身旁有楊老師時(shí)刻在指導(dǎo)著、督促著、寬慰著,我就能夠冷靜下來處理各種困局。”戴文淵坦言,楊強(qiáng)不僅是自己學(xué)業(yè)上的導(dǎo)師,更是精神上的燈塔,“這一路走來,只要抬頭看到那束光,心里就特別踏實(shí)?!?/p>
“我們的目標(biāo)就是讓一個(gè)完全不懂技術(shù)的‘小白’經(jīng)過大概2周到1個(gè)月的時(shí)間,可以成為一名合格的AI應(yīng)用專家?!?/p>
2015年,戴文淵與導(dǎo)師楊強(qiáng),以及一批志同道合的行業(yè)深耕者們創(chuàng)立了一家人工智能技術(shù)與服務(wù)提供商,取名“第四范式”。這個(gè)名字的由來,是取自圖靈獎(jiǎng)得主、關(guān)系數(shù)據(jù)庫的鼻祖Jim Gray生前的最后一次演講。他將人類科學(xué)的發(fā)展定義成為四個(gè)“范式”,其中“第四范式”是指通過收集大量的數(shù)據(jù),讓計(jì)算機(jī)去總結(jié)規(guī)律,即人工智能階段。從這個(gè)頗為新穎但寓意深遠(yuǎn)的名字中,也能體現(xiàn)戴文淵和范式創(chuàng)業(yè)者們身上追求卓越的極客精神。
兩年前,戴文淵將公司從深圳福田的公寓樓搬到了有“中國硅谷”之稱的北京上地,員工人數(shù)也從最初不到十人壯大到數(shù)百人,公司發(fā)展態(tài)勢(shì)迅猛,但始終沒變的是戴文淵創(chuàng)業(yè)的初衷,即要降低AI工業(yè)落地的門檻。
2017年7月5日,在“百度AI開發(fā)者大會(huì)”上,百度宣布將開放60項(xiàng)AI核心能力,為每一位開發(fā)者消除障礙,創(chuàng)造共贏機(jī)會(huì)。對(duì)于這個(gè)舉措,楊強(qiáng)教授表示贊賞,但同時(shí)覺得還遠(yuǎn)遠(yuǎn)不夠:“百度的做法是為程序員降低門檻,而第四范式要做的,是為所有領(lǐng)域的企業(yè)降低門檻。”
在戴文淵看來,雖然人工智能已經(jīng)引燃了全球科技圈,但目前仍是一項(xiàng)應(yīng)用難度頗高的技術(shù),很多企業(yè)都在門外徘徊,因?yàn)槌杀竞腿瞬诺拈T檻高昂,很難順利完成自有AI系統(tǒng)的構(gòu)建。第四范式希望每個(gè)企業(yè)都能用上人工智能,擁有自己的人工智能策略,真正實(shí)現(xiàn)AI for everyone,并一直在為此努力。2017年12月3日,在舉世矚目的第四屆世界互聯(lián)網(wǎng)大會(huì)上,第四范式正式發(fā)布了“第四范式·先知”3.0版“企業(yè)人工智能核心系統(tǒng)”,助力企業(yè)快速構(gòu)建以AI為中心的組織架構(gòu),通過智變贏得AI時(shí)代。戴文淵在發(fā)布現(xiàn)場(chǎng)談到,“企業(yè)人工智能核心系統(tǒng)”將大大降低人工智能的應(yīng)用創(chuàng)新門檻。該系統(tǒng)包含數(shù)據(jù)核心、算法核心和生產(chǎn)核心三大模塊,覆蓋了機(jī)器學(xué)習(xí)工業(yè)落地全流程。數(shù)據(jù)核心通過對(duì)數(shù)據(jù)規(guī)范及標(biāo)準(zhǔn)化,讓業(yè)務(wù)之間的數(shù)據(jù)在系統(tǒng)內(nèi)互相受益、互相貢獻(xiàn);算法核心通過封裝前沿算法,降低模型建立門檻,快速訓(xùn)練出高維、閉環(huán)、實(shí)時(shí)的AI模型;生產(chǎn)核心簡化了AI模型從線下訓(xùn)練到線上生成的流程,將數(shù)據(jù)價(jià)值轉(zhuǎn)變?yōu)锳I的預(yù)判能力。未來,企業(yè)可根據(jù)業(yè)務(wù)需要,自主選擇相應(yīng)組件或模塊進(jìn)行配置,依托系統(tǒng)的自動(dòng)整合能力,靈活設(shè)計(jì)出AI解決方案。與此同時(shí),隨著創(chuàng)新模式的簡化升級(jí),企業(yè)生產(chǎn)經(jīng)營重心還將從“跑馬圈地的鋪量競(jìng)爭(zhēng)”進(jìn)入“技術(shù)驅(qū)動(dòng)的精細(xì)化競(jìng)爭(zhēng)”,人工智能的策略價(jià)值凸顯。未來,在“企業(yè)人工智能核心系統(tǒng)”中,大多數(shù)的一線決策行為會(huì)由效率更高的人工智能來完成,企業(yè)可以在投入最少人力、財(cái)力的成本下,獲得強(qiáng)大生產(chǎn)力。
吳文俊獎(jiǎng)?lì)I(lǐng)獎(jiǎng)現(xiàn)場(chǎng)
其實(shí),早在一年前,第四范式發(fā)布的“第四范式·先知”1.0版,就是當(dāng)時(shí)全球首個(gè)面向開發(fā)者的商用AI全流程平臺(tái),通過自動(dòng)化機(jī)器學(xué)習(xí)程序,首次歷史性地降低了機(jī)器學(xué)習(xí)建模過程中的人工參與程度,解決了怎樣讓更多開發(fā)者參與到AI研發(fā)的問題。第四范式憑借“先知”平臺(tái),在“第六屆吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)”的評(píng)選中榮獲一等獎(jiǎng)。這是中國智能科技領(lǐng)域的最高獎(jiǎng),歷年來只授予高校、實(shí)驗(yàn)室和科研機(jī)構(gòu),這次授予企業(yè),實(shí)屬首例。
“為什么人工智能的問題只有少數(shù)專家能解決?就是因?yàn)樘珡?fù)雜了,要調(diào)各種參數(shù),要做各種設(shè)置。我們要做的就是將AI難度最高的部分封裝成自動(dòng)化程序,使其更易用,讓更多人邁進(jìn)門來?!睏顝?qiáng)做了一個(gè)形象的比喻,“以前玩攝影拍照片,使用的是單反相機(jī),很專業(yè)。你需要明白什么叫光圈、快門、ISO,不是內(nèi)行的人根本拍不出理想的照片。而你看現(xiàn)在,一部智能手機(jī)就解決了,你根本不用懂成像原理,參數(shù)設(shè)置什么的也不用你去管,只需要你把想要的畫面收入框內(nèi),點(diǎn)一下按鍵就行了,這就是門檻降低了,‘先知’平臺(tái)要做的就是這個(gè)事情?!?/p>
“從企業(yè)客戶的角度看,使用‘企業(yè)人工智能核心系統(tǒng)’完成企業(yè)智能升級(jí)僅需三步。第一步,明確業(yè)務(wù)目標(biāo);第二步,收集在完成這個(gè)目標(biāo)過程中的數(shù)據(jù);第三步,‘企業(yè)人工智能核心系統(tǒng)’自動(dòng)化解決機(jī)器學(xué)習(xí)問題,并推動(dòng)企業(yè)優(yōu)化業(yè)務(wù)模式,提高生產(chǎn)運(yùn)營效率?!贝魑臏Y解釋著,第四范式的目標(biāo)就是要把一個(gè)專業(yè)級(jí)人士才能做到的事情變成一個(gè)類似傻瓜相機(jī)式的核心系統(tǒng)。
2016年的年底,第四范式內(nèi)部進(jìn)行了一場(chǎng)“特殊”的競(jìng)賽——全世界首個(gè)面向非專業(yè)人士的建模大賽。公司里面的AI專家們這次成了觀眾,參加比賽的都是做銷售、公關(guān)、行政、人力等非專業(yè)出身的AI“小白”。比賽結(jié)果令人振奮,這些非專業(yè)人士基于“先知”平臺(tái),有超過70%的參賽組合AUC成績跨過0.8大關(guān)(AUC是衡量模型效果的專業(yè)指標(biāo),取值在0到1之間)。要知道,在實(shí)際業(yè)務(wù)中,凡是AUC高于0.8的模型就已經(jīng)達(dá)到工業(yè)水準(zhǔn)。而在整個(gè)行業(yè)中,只有極少數(shù)深耕機(jī)器學(xué)習(xí)多年、擁有豐富大規(guī)模數(shù)據(jù)處理經(jīng)驗(yàn)的數(shù)據(jù)“大神們”才能搭建出A U C0.8以上的模型。對(duì)于這個(gè)比賽結(jié)果,戴文淵談到,“我們的目標(biāo)就是讓一個(gè)完全不懂技術(shù)的‘小白’經(jīng)過大概2周到1個(gè)月的時(shí)間,可以成為一名合格的AI應(yīng)用專家?,F(xiàn)在,我們離目標(biāo)又近了一步?!?/p>
商業(yè)化階段,降低了門檻的人工智能技術(shù)會(huì)滲透到每一個(gè)場(chǎng)景、每一種服務(wù)中。目前第四范式主要聚焦在金融和互聯(lián)網(wǎng)領(lǐng)域,幫助這些行業(yè)充分挖掘蘊(yùn)藏在數(shù)據(jù)背后的潛在價(jià)值?!巴ㄋc(diǎn)講,我們其實(shí)在做一件事,讓機(jī)器看業(yè)務(wù)數(shù)據(jù),然后寫業(yè)務(wù)規(guī)則,從而替代原來由業(yè)務(wù)專家主導(dǎo)的總結(jié)規(guī)律、寫業(yè)務(wù)規(guī)則的過程,比如,讓機(jī)器看金融欺詐的數(shù)據(jù),總結(jié)反欺詐的規(guī)則;看醫(yī)療的數(shù)據(jù),總結(jié)診斷的規(guī)則;看廣告轉(zhuǎn)化率的數(shù)據(jù),總結(jié)廣告投放的規(guī)則等。最終通過人工智能幫助這個(gè)行業(yè)的企業(yè)提升運(yùn)營效益。”
以金融領(lǐng)域?yàn)槔?,在與某股份制銀行合作反欺詐解決方案中,第四范式就利用超高維AI技術(shù),僅基于一年的交易數(shù)據(jù),就幫助該銀行寫出25億條反欺詐規(guī)則,不僅包含傳統(tǒng)專家規(guī)則無法覆蓋的“非典型區(qū)域”的“非典型特征”,而且對(duì)于不斷更新中的欺詐方式也都一網(wǎng)打盡。最終,第四范式反欺詐系統(tǒng)的實(shí)際上線效果較傳統(tǒng)專家規(guī)則提升數(shù)倍,同時(shí)大幅降低銀行的人力成本和運(yùn)營成本。
據(jù)了解,第四范式的高維度的機(jī)器學(xué)習(xí)技術(shù),已經(jīng)完整覆蓋了精準(zhǔn)識(shí)別客戶貸前、貸中、貸后的需求及風(fēng)險(xiǎn),提供包括精準(zhǔn)獲客、個(gè)性化推薦、申請(qǐng)?jiān)u分卡、申請(qǐng)反欺詐、交易反欺詐、逾期/流失預(yù)警、流動(dòng)性管理、智能催收、不良資產(chǎn)處置等一體化整體解決方案。
目前第四范式已與數(shù)十家大中型銀行展開深度合作,幫助合作伙伴快速構(gòu)建人工智能的數(shù)據(jù)智能核心系統(tǒng),完成從數(shù)據(jù)到價(jià)值的升級(jí)轉(zhuǎn)化。在其他領(lǐng)域,第四范式技術(shù)還涵蓋了更多的行業(yè)應(yīng)用場(chǎng)景,例如醫(yī)療、制造、零售等。
戴文淵總結(jié)說,這就是“有境無界”,即在適應(yīng)行業(yè)規(guī)則的環(huán)境下,創(chuàng)造出沒有邊界的使用價(jià)值。
“華人一定要發(fā)展、創(chuàng)新和引領(lǐng)一些前沿的理論,不能光跟著別人走。我們要做別人跟著我們走的東西,比如遷移學(xué)習(xí)就是?!?/p>
毋容置疑,人工智能技術(shù)的影響程度將是一次跨時(shí)代的科技革命,甚至未來整個(gè)社會(huì)形態(tài)都會(huì)發(fā)生根本性變革。但就在人工智能的高光時(shí)刻,戴文淵和楊強(qiáng)卻保持著足夠的冷靜,他們深知目前的人工智能并不是無所不能,其中最大的弱點(diǎn)之一就是缺少遷移學(xué)習(xí)的能力。
遷移學(xué)習(xí)是人類智慧的一種特質(zhì),我們可以利用一個(gè)環(huán)境中學(xué)到的知識(shí),舉一反三、觸類旁通地來完成新環(huán)境中的學(xué)習(xí)任務(wù),這對(duì)人類來說是非常自然的,但是人工智能還做不到。
AlphaGo在戰(zhàn)勝李世石的3個(gè)月后,它的幕后主腦Deepmind的創(chuàng)始人在接受采訪時(shí)稱,他們已經(jīng)在開始探尋一種更新更強(qiáng)的技術(shù),這種技術(shù)能讓強(qiáng)化學(xué)習(xí)系統(tǒng)把基礎(chǔ)建立在已習(xí)得的知識(shí)上,而不用每一次都從頭學(xué)起。他們說的便是“遷移學(xué)習(xí)”(transfer learning)。
這一次,第四范式又一次成為AI前沿領(lǐng)域的先行者。戴文淵和楊強(qiáng)早在10年前,就把關(guān)注的目光投向了遷移學(xué)習(xí)。楊強(qiáng)早就指出:“深度學(xué)習(xí)是過去,強(qiáng)化學(xué)習(xí)是現(xiàn)在,而遷移學(xué)習(xí)是未來!”
戴文淵介紹,遷移學(xué)習(xí)可以解決目前機(jī)器學(xué)習(xí)中必須要依賴海量數(shù)據(jù)的困局。雖然互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)催生數(shù)據(jù)爆炸式增長,但在很多傳統(tǒng)企業(yè)和非互聯(lián)網(wǎng)領(lǐng)域仍然存在數(shù)據(jù)量小的問題,小數(shù)據(jù)上如何能夠?qū)崿F(xiàn)人工智能,這就需要遷移學(xué)習(xí)。醫(yī)療領(lǐng)域就是一個(gè)典型,有一些發(fā)病率較低的疾病樣本數(shù)量很少,但會(huì)存在與它相關(guān)聯(lián)的疾病和治療方法,我們就可以通過已有的模型進(jìn)行遷移,從而對(duì)疑難雜癥進(jìn)行數(shù)據(jù)分析從而得出有效的診療方案。
第四范式公司一景(照片來源于《人物》)
“華人一定要發(fā)展、創(chuàng)新和引領(lǐng)一些前沿的理論,不能光跟著別人走。別人做深度學(xué)習(xí),我們也做深度學(xué)習(xí)。別人做強(qiáng)化學(xué)習(xí),我也跟著做強(qiáng)化學(xué)習(xí)。我們要做別人跟著我們走的東西,比如遷移學(xué)習(xí)就是?!睏顝?qiáng)如是說。
如今,在遷移學(xué)習(xí)領(lǐng)域,戴文淵憑借10年前發(fā)表的一篇論文(Boosting for Transfer Learning),單篇論文引用至今排名世界第三。排在第一的,正是他的導(dǎo)師楊強(qiáng)。同時(shí),第四范式已經(jīng)在金融領(lǐng)域成功驗(yàn)證了遷移學(xué)習(xí)的工業(yè)可行性與積極作用。為了解決銀行大額貸款業(yè)務(wù)數(shù)據(jù)量不足,無法滿足人工智能應(yīng)用的難題,第四范式利用基于遷移學(xué)習(xí)技術(shù)的“先知”平臺(tái),將小額貸款的模型遷移到上億級(jí)的大額貸款業(yè)務(wù)中,準(zhǔn)確預(yù)判出了客戶的辦理需求,最終實(shí)現(xiàn)客戶營銷響應(yīng)率提升200%。
第四范式已經(jīng)走在了人工智能的國際前列,作為掌門人的戴文淵考慮的問題也越來越多。盡管人工智能現(xiàn)在“熱得發(fā)燙”,但在戴文淵眼中,現(xiàn)在的AI距離多領(lǐng)域、多場(chǎng)景的廣泛爆發(fā)和便捷的商業(yè)化落地還有一段漫長的路要走?!霸俸玫募夹g(shù),如果不能形成產(chǎn)業(yè)化,不能為國民服務(wù),也只是一個(gè)看上去很漂亮的泡泡而已。”戴文淵從不否認(rèn)這個(gè)行業(yè)里存在著泡沫。AI也是江湖,里面有實(shí)打?qū)嵉捻敿飧呤?,也不乏渾水摸魚的投機(jī)者。勢(shì)必要經(jīng)過一場(chǎng)華山論劍之后,依然能夠屹立不倒的方顯英雄本色。
當(dāng)記者追問第四范式能否在AI領(lǐng)域“笑傲江湖”的時(shí)候,戴文淵答道:“人工智能這個(gè)市場(chǎng)足夠大,大到能夠出現(xiàn)下一個(gè)IBM和BAT的市場(chǎng),但我只想不忘初心,不忘我們的理想,去做一家偉大的公司?!?/p>