丁海驁
“我始終認(rèn)為:雖然我們是以公司的形式存在,但是叫機構(gòu)更合適些?!睆?020年1月VMware完成對Pivotal的收購算起,兩年多不見的馮雷再次回歸到大眾視野,身份已經(jīng)不再是Pivotal中國公司常務(wù)董事、研發(fā)中心總經(jīng)理,而是一家中國本土科創(chuàng)公司——拓數(shù)派「又稱“OpenPie”」——的創(chuàng)始人和首席執(zhí)行官。
2022年6月,拓數(shù)派對外宣布完成新一輪數(shù)億元戰(zhàn)略融資,而在此之前,2021年7月正式成立之初,拓數(shù)派就已經(jīng)獲得了頭部產(chǎn)業(yè)基金超過兩千萬美元的天使投資?!艾F(xiàn)在拓數(shù)派儲備了足夠多的現(xiàn)金,足夠我們可以真正安安靜靜坐下來,把產(chǎn)品做好,做一個可以對標(biāo)美國同時代產(chǎn)品的產(chǎn)品。”對于一家初創(chuàng)公司而言,馮雷的話多少有些“凡爾賽”,但拓數(shù)派剛剛成立即可實現(xiàn)人均年研發(fā)費用15萬美元的融資規(guī)模,在很大程度上,與馮雷選定的技術(shù)賽道、拓數(shù)派自身技術(shù)團隊的實力,以及當(dāng)前中國科創(chuàng)領(lǐng)域的空前活躍,都有非常大的關(guān)系。
之所以馮雷認(rèn)為應(yīng)該把拓數(shù)派稱為機構(gòu)而非公司,很大的一個原因,是其創(chuàng)立拓數(shù)派,并選擇“云原生、分析型分布式數(shù)據(jù)庫”賽道,并非完全處于單純的商業(yè)考量,更像是一次基于數(shù)學(xué)科學(xué)的學(xué)術(shù)驗證和應(yīng)用實踐。
馮雷最廣為業(yè)界所知的,是其曾經(jīng)提出的“數(shù)字化三部曲”——他甚至因此出版了三本圖書。在他看來,今天所有企業(yè)的數(shù)字化轉(zhuǎn)型過程,都將沿著從軟件公司到數(shù)據(jù)公司,再到數(shù)學(xué)公司的過程演進,其中,當(dāng)然會涉及到包括云計算、大數(shù)據(jù)和AI在內(nèi)的新興IT技術(shù)的加入,但是真正影響數(shù)字化進程、決定數(shù)字化方向和結(jié)果的,永遠都是數(shù)學(xué)原理。
“我大學(xué)本科是北大物理系的,所以我考慮問題常常是往起源的方向看,就是說我一直關(guān)心:人類智能的起源,我們智慧是怎么來的?”馮雷當(dāng)年是以浙江省隊物理奧賽銀牌進入北京大學(xué)并獲得了物理學(xué)和經(jīng)濟學(xué)的雙學(xué)士學(xué)位。而那段經(jīng)歷對于他來說,更重要的影響,是讓他認(rèn)識到數(shù)學(xué)的美妙,也讓他已經(jīng)開始考慮如何讓數(shù)學(xué)這樣一個基礎(chǔ)學(xué)科能夠真正影響和改變?nèi)祟惿鐣!澳阒?,到今天為止,我們在IT領(lǐng)域的所有進展,都還是基于歷史上一些偉大的數(shù)學(xué)發(fā)現(xiàn)和理論。”幾年前,還在擔(dān)任Pivotal中國常務(wù)董事兼總經(jīng)理的馮雷就曾經(jīng)這樣對筆者說。
在馮雷看來,結(jié)合數(shù)學(xué)發(fā)展史和IT進階史,有幾個歷史事件至關(guān)重要。
首先是公元前600年到公元前500年,由古希臘哲學(xué)家畢達哥拉斯及其信徒組成的畢達哥拉斯學(xué)派,他們提出萬物本源是“數(shù)”,認(rèn)為“萬物皆數(shù)”,而研究數(shù)學(xué)的目的并不在于使用,而是為了探索自然的奧秘——這與今天我們?nèi)祟惿鐣谶M行的“數(shù)字化”轉(zhuǎn)型似乎有些內(nèi)在的關(guān)聯(lián)。
其次,人類真正用數(shù)學(xué)方法研究世界從牛頓年代開始?!芭nD力學(xué)的偉大之處,不僅僅因為三定律和萬有引力定律,更在于牛頓用數(shù)學(xué)的方法來定義自然哲學(xué),并寫了一篇論文《自然哲學(xué)的數(shù)學(xué)原理》來告訴我們:自然科學(xué)是可以數(shù)學(xué)化的?!瘪T雷說:“進而,又有人用數(shù)學(xué)的方法來研究經(jīng)濟學(xué),并取得了不小的進展。那么社會科會呢?”
將數(shù)學(xué)方法引入到社會科學(xué)——即讓數(shù)學(xué)方法和數(shù)字化工程成為人類改變自身的工具,進而全面實踐數(shù)字化時代,馮雷認(rèn)為有兩件具有劃時代意義的事件。
第一件,是20世紀(jì)上半葉,德國哥廷根大學(xué)在希爾伯特(David Hilbert)的倡導(dǎo)下提出了形式化數(shù)學(xué),從而啟發(fā)了圖靈構(gòu)造計算機的概念模型和馮諾依曼構(gòu)造存儲計算機。“這實際上是奠定了我們今天數(shù)字化基礎(chǔ):如果說古典物理時代的模型方法,主要建立自然科學(xué)規(guī)律的數(shù)學(xué)定理;那么,近代我們數(shù)學(xué)化人類社會和智能,則主要采用計算模型的方法,來仿真人類社會和個體智能——這個時代的數(shù)學(xué)化也同時引入了數(shù)字化?!瘪T雷曾經(jīng)在自己的文章中如是說。
另外一件事,則是發(fā)生在馮雷的母校:20世紀(jì)下半葉,卡內(nèi)基梅隆大學(xué)的司馬賀(Herbert Simon)利用符號計算來模擬人類智能,創(chuàng)建了世界聞名的CMU計算機學(xué)院并將之建設(shè)成為人工智能的先驅(qū)。“CMU作為人工智能兩大誕生地之一,把數(shù)字輸入看作符號,用計算模型作為智能仿真大腦操作符號的過程,奠基了符號學(xué)派人工智能的第一個AI程序邏輯學(xué)家。”馮雷說。
“用少量符號和計算模型來建模人類社會和個體智能,奠定了早期的AI,取得了巨大的成績。但是更多的紅利卻依賴于更多的數(shù)據(jù)量和更高計算能力。一般說來,任何一個模型,只要處理得當(dāng),使用更多的數(shù)據(jù)和計算,就能產(chǎn)生更好的預(yù)測準(zhǔn)確率。這樣一個簡單卻有效的洞察把人類社會帶入了大數(shù)據(jù)時代……當(dāng)我們不能構(gòu)造類似神經(jīng)網(wǎng)絡(luò)等開天辟地的新模型的時候,我們可以尋找更多的數(shù)據(jù)集、運用更強大算力來提高模型的準(zhǔn)確率,以數(shù)據(jù)計算能力來換模型能力——既然數(shù)據(jù)計算,能夠讓我們找到新發(fā)現(xiàn),那么我們就應(yīng)該不遺余力地去驅(qū)動數(shù)據(jù)計算平臺的創(chuàng)新?!瘪T雷在自己后來發(fā)表的文章中寫到,他和拓數(shù)派要做的事情,就是在所有前人的基礎(chǔ)上,將人類用數(shù)學(xué)定義和研究人類社會的能力,向更深入的地方推進。
“云計算的出現(xiàn),實際上讓我們應(yīng)用數(shù)學(xué)的空間得到了極大的延展:并不是前人不夠聰明,而是因為他們當(dāng)時沒有那么多算力,他們基于PC機構(gòu)的計算機已經(jīng)找到了最好的數(shù)學(xué)邏輯和方法,接下來,就是我們需要基于云計算提供的有無限增長的計算和無限增長的存儲,不再基于簡單的符號,而是采用大量的數(shù)據(jù)——把符號系統(tǒng)升級到數(shù)據(jù)系統(tǒng),用數(shù)據(jù)來訓(xùn)練程序,讓程序自己給自己編程?!?/p>
討論至此,馮雷非常興奮,他反復(fù)強調(diào),“數(shù)據(jù)計算、只為新發(fā)現(xiàn)(Data Computing for New D iscoveries)”就是他和拓數(shù)派團隊要做的事:“人類這么多年來,智商并沒有太多變化。但是我覺得因為云計算提供的機會,可能讓我們可以把符號學(xué)派的人工智能,推廣到數(shù)據(jù)計算學(xué)派,這是我們成立拓數(shù)派的原因?!?h3>實踐:云原生、分析型分布式數(shù)據(jù)庫
選擇將人工智能從符號學(xué)派深入到數(shù)據(jù)計算學(xué)派,并不是馮雷突如其來的一個“神來之筆”。事實上,從10年前,馮雷結(jié)束在甲骨文從事云計算產(chǎn)品研發(fā)的工作,接受Pivotal邀請,從硅谷回到上海,作為是Pivotal中國公司常務(wù)董事(Managing Director)和研發(fā)體系總經(jīng)理(GM)),就已經(jīng)開始。
“接受Greenplum中國和后續(xù)Pivotal中國的使命,除了因為Greenplum創(chuàng)始人和Pivotal董事長在業(yè)內(nèi)的影響力之外,很大一部分原因,是Greenplum的大數(shù)據(jù)使命和Pivotal的云原生使命,都處于一個令人興奮的數(shù)字未來的十字路口。此刻在我眼里,數(shù)字化的核心也是數(shù)學(xué)化?!瘪T雷在后來自己撰寫的文章中這樣寫道。
彼時,在建立中國北京和上海兩個研發(fā)團隊的過程中,在Pivotal公司的兩個產(chǎn)品體系中,馮雷選擇了Greenplum作為中國研發(fā)中心的關(guān)注重點?!霸赑C機時代,因為摩爾定律,計算資源開始豐富,PC機通過組群可以取代大型機,而極大地降低了計算的門檻。Oracle,TeraData和Greenplum等產(chǎn)品就誕生在這一時期。Greenplum作為一個分析型數(shù)據(jù)庫,整理和存儲了大量結(jié)構(gòu)化數(shù)據(jù),幫助數(shù)據(jù)計算在各行各業(yè)產(chǎn)生智能:銀行通過風(fēng)控計算降低貸款壞賬率,零售行業(yè)通過計算提高用戶的復(fù)購率,醫(yī)藥公司通過計算可以提升新藥的有效性。”在馮雷看來,Greenplum作為一款分析型數(shù)據(jù)庫,實際上就是在將“數(shù)據(jù)計算”——這樣一個后來拓數(shù)派所堅持的技術(shù)應(yīng)用理念,進行初步實踐的起點,并且在在2015年,經(jīng)過馮雷的堅持,Greenplum最終以開源的方式,從一個數(shù)據(jù)倉庫軟件變成了一個云時代的大數(shù)據(jù)和機器學(xué)習(xí)平臺。
應(yīng)該說,2020年初Pivotal整體出售給VMware,是拓數(shù)派成立的一個客觀理由。
“經(jīng)過多年對Greenplum的技術(shù)研發(fā)和用戶服務(wù),實際上我們已經(jīng)看到了分析型數(shù)據(jù)庫對于用戶的價值,并且在中國建立了一個非常專業(yè)的研發(fā)團隊。當(dāng)時我們都感覺:這的確是一個未來數(shù)據(jù)應(yīng)用的趨勢,只是我們還沒有來得及把它真的部署到云端。于是,我們最終決定要把這個技術(shù)繼續(xù)往前走下去。”在馮雷的認(rèn)識中,計算技術(shù)目前經(jīng)歷的三代平臺分別是大型機、PC機和云計算平臺,而其與其研發(fā)團隊最大的遺憾,是沒有將部署在PC機的Greenplum遷移到云計算平臺,因此他們決定基于云計算平臺的云原生、分析型分布式數(shù)據(jù)庫。
馮雷認(rèn)為:數(shù)據(jù)計算以PC機為單位的切割方法,是數(shù)字未來的最大掣肘。“如果說云上有無限伸展的計算資源和存儲資源,并且這兩個資源的伸展,意味著數(shù)據(jù)計算能產(chǎn)生更好的結(jié)果,那么我們應(yīng)該突破PC時代計算平臺的限制,大膽地想象在云上計算平臺的新可能。”馮雷撰文強調(diào):拓數(shù)派的第一款產(chǎn)品πCloudDB,就是建立在數(shù)據(jù)計算這樣的一個底層基礎(chǔ)計算技術(shù)上,利用云計算的計算技術(shù)的變革,重新打造的一個云原生的、以分析型分布式數(shù)據(jù)庫為內(nèi)核的全新數(shù)據(jù)計算平臺,從而實踐自己“真正交付在PC機時代未能交付的大數(shù)據(jù)承諾”。
“原理可能比代碼更重要,所以這次我們繼承以往的產(chǎn)品技術(shù)邏輯,但是因為部署的環(huán)境完全是基于云計算環(huán)境,所以我們重新了軟件代碼——這就好像您寫了一個文章的word文檔,但是突然斷電了,沒保存。不過如果重寫一次,你就會發(fā)現(xiàn),其實可以寫得更快,遣詞造句會更精準(zhǔn),邏輯也會更清晰。”馮雷介紹說。
在拓數(shù)派發(fā)布的相關(guān)產(chǎn)品介紹不難發(fā)現(xiàn),πCloudDB在以往PC版分析型數(shù)據(jù)庫所采用的 MPP(Massive Parellel Processing,大規(guī)模并行計算)基礎(chǔ)上,提出了eMPP(elasticMassive Parallel Processing,彈性大規(guī)模并行計算)的概念?!盎谠朴嬎慵軜?gòu)的πCloudDB的彈性并行計算,完美地解決基于PC傳統(tǒng)MPP的缺陷:在πCloudDB,存儲和計算各自作為兩個獨立變量,各自在云端彈性伸縮,用戶可以在云端傳輸海量數(shù)據(jù)量,云中的存儲也會隨之自動增加,這個伸展過程對于用戶來說是完全透明不可見的;如果用戶需要更大的算力,只需開啟更多的虛擬機或者容器,πCloudDB會瞬間擴容。在用戶完成脈沖計算以后,可以關(guān)閉和縮小計算的集群,從而節(jié)約在云中的計算費用。 ”馮雷撰文稱。
而在馮雷看來,πCloudDB這樣一款云原生、分析型分布式數(shù)據(jù)庫,在很大程度上,將成為更多行業(yè)用戶的商業(yè)場景數(shù)據(jù)分析引擎:“企業(yè)未來勢必會從軟件公司到數(shù)字公司,最終到數(shù)學(xué)公司,那是因為企業(yè)會越來越以來數(shù)據(jù)的智能分析和驅(qū)動,實現(xiàn)業(yè)務(wù)的持續(xù)增長,在此過程中,數(shù)據(jù)庫產(chǎn)品需要能夠幫助用戶針對不同場景,做更有效的數(shù)據(jù)分析,例如金融行業(yè)的征信反欺詐、互聯(lián)網(wǎng)行業(yè)持續(xù)的流量獲取、零售行業(yè)的用戶推薦、制造業(yè)的事故回溯……”馮雷強調(diào),作為一個分析型數(shù)據(jù),πCloudDB的目標(biāo),是通過數(shù)據(jù)計算,幫助企業(yè)用戶將業(yè)務(wù)場景分析做到極致。
“在整個現(xiàn)代科技發(fā)展史上,一些海外的機構(gòu)、大學(xué)、科學(xué)家甚至投資人都發(fā)揮著很大的作用。我常常想:作為一個強調(diào)科創(chuàng)的大國,現(xiàn)在中國也需要一個具有標(biāo)志性的、彰顯中國大國標(biāo)志性意義的科研機構(gòu)。這在以前可能挺難,但是現(xiàn)在中國的經(jīng)濟地位,以及科創(chuàng)發(fā)展到現(xiàn)階段,建立這樣一個機構(gòu)是大勢所趨——這已經(jīng)得到了一批有識之士和投資機構(gòu)非常大的認(rèn)同感?!瘪T雷說。
這一點,實際上從拓數(shù)派的合伙人平臺取名就可以充分體會:拓數(shù)派的合伙人平臺叫“畢達哥拉斯派”和“哥廷根”(取哥廷根大學(xué)之意),“我們希望能在中國創(chuàng)立一個立足于中國,但又在世界范圍內(nèi)領(lǐng)先的一個機構(gòu),從而在研發(fā)產(chǎn)品的同時,平行升級自己的組織,使其成為立身中國并躋身世界前沿的數(shù)據(jù)計算機構(gòu)。”
這也是馮雷更愿意將拓數(shù)派稱為機構(gòu),而非單純公司的另外一個重要原因。
相對于在技術(shù)和學(xué)術(shù)上堪稱虔誠得近乎浪漫主義的做法,馮雷和拓數(shù)派在商業(yè)上的考慮,可以用佛系來形容。這一點,Pivotal公司創(chuàng)始人Paul Maritz給馮雷極大的影響。
“To give more than what you take,奉獻大于索取,這是Paul Maritz當(dāng)時說的一句話,也是我們的一個行為準(zhǔn)則?!瘪T雷提到當(dāng)時Pivotal在開拓中國市場時,采取的方式是將Cloud Foundry云操作系統(tǒng)和Greenplum進行開源處理。這一方面當(dāng)然是為了更快速地建立起自己的用戶群,讓更多的用戶認(rèn)識Pivotal的產(chǎn)品;但是另一方面,馮雷認(rèn)為,技術(shù)最終一定要以某種方式反饋給社會,商業(yè)只是其中的一種。
馮雷強調(diào),成立拓數(shù)派并不是“要把市場上所有的錢全部拿回來”?!皬某闪⒌牡谝惶炱?,這就不是我和拓數(shù)派的目標(biāo)。”馮雷說:“當(dāng)然,我們一定會給投資人一個合理的回報。但是就像當(dāng)時Pivotal一樣,我們開源了那么多年,有些客戶用了但是并沒給錢,我也ok:因為我們考慮到小企業(yè)沒多少預(yù)算在這上面。所以我說:人家有錢,自然會付;預(yù)算不夠了,就算了?!?/p>
為了讓拓數(shù)派用技術(shù)回饋社會的宗旨得到確認(rèn),在2021年2月成立杭州拓數(shù)派科技發(fā)展有限公司一年前,馮雷成立了一個“1024數(shù)字產(chǎn)業(yè)基金會”——1024是2的十次方,是二進制計數(shù)的基本計量單位之一,也是一個所有程序員都能心照不宣、會心一笑的梗。“我們成立1024數(shù)字產(chǎn)業(yè)基金會的目的,是使其與拓數(shù)派并行運行,目標(biāo)是以一種非盈利的方式,讓技術(shù)能夠惠及更多的用戶?!?/p>
“成立基金會有兩個目的:首先是構(gòu)造一個生態(tài),我們的技術(shù)推廣出來以后會托管給基金會,這樣的話,就可以用更公正的方式允許更多的人參與進來;第二個目的,是通過基金會的方式,承擔(dān)更多ESG(環(huán)境、社會和質(zhì)量)責(zé)任,例如人才培訓(xùn)、與學(xué)校合作等?!瘪T雷看待這個問題的視角非常獨到:他認(rèn)為企業(yè)在用數(shù)字化技術(shù)顛覆傳統(tǒng)行業(yè)的過程中,也要擔(dān)當(dāng)釋放出來的勞動力在數(shù)字行業(yè)的再就業(yè)和高質(zhì)量就業(yè)的社會公益責(zé)任,而基金會在這方面將有更多的工作空間。
你可以說馮雷是一個“萬物皆數(shù)”理論的狂熱擁躉,也可以說馮雷是一個對技術(shù)應(yīng)用具有判斷能力的IT工程師,甚至可以說是對技術(shù)商業(yè)化實踐的理想主義者,但是不能否認(rèn)的是:雖然馮雷和他的拓數(shù)派看起來沒有那么具有侵略性,但是這種隱藏在浪漫主義和理想主義背后的,是基于科學(xué)發(fā)展規(guī)律對事物發(fā)展趨勢的一種判斷,以及基于這種判斷所表現(xiàn)出來的自信。
在曾經(jīng)經(jīng)歷了“快魚吃慢魚”、996高頻迭代的科創(chuàng)領(lǐng)域,這種自信和淡定,以及帶有某種理想主義的信念,讓人看到了中國科創(chuàng)領(lǐng)域能夠真正持續(xù)前進的可能性。
也許,一個屬于中國本土科創(chuàng)企業(yè)的時代真的就要來了,一個屬于中國本土的標(biāo)志性企業(yè),就要出現(xiàn)了。
“我們?yōu)槭裁唇型財?shù)派,OpenPie?是因為我們更希望自己是科創(chuàng)領(lǐng)域里一支特殊的、具有數(shù)學(xué)屬性的開放的流派,還因為作為一個神奇的數(shù)學(xué)符號,π是一個可以一直算下去的,而且中國人曾經(jīng)精確計算了小數(shù)點后面的最多位數(shù)?!瘪T雷說。