很多年以后,當(dāng)人們回想2025的蛇年春節(jié),會(huì)想起很多人都在談?wù)摶蚴褂靡粋€(gè)叫DeepSeek的AI應(yīng)用。它性能高、開(kāi)源、成本低,實(shí)現(xiàn)了對(duì)行業(yè)霸主OpenAI的逆襲,被美國(guó)科技圈稱為“來(lái)自東方的神秘力量”。短短幾周時(shí)間,A I界“滿城盡帶DeepSeek”,國(guó)內(nèi)企業(yè)、高校、政府機(jī)構(gòu)等紛紛宣布接入DeepSeek。
DeepSeek背后的創(chuàng)業(yè)者梁文鋒浮出水面。從一位普通的湛江少年,到震撼硅谷的A I創(chuàng)新者,他的故事,是一段關(guān)于技術(shù)、勇氣和堅(jiān)持的傳奇。
“我父親是一名小鎮(zhèn)數(shù)學(xué)老師,但他從不問(wèn)我考試排名,只會(huì)問(wèn)我今天解決了什么問(wèn)題。”梁文鋒說(shuō)。他出生在廣東湛江的一個(gè)普通家庭,自幼便展現(xiàn)出對(duì)數(shù)學(xué)和科學(xué)的天賦,還特別能拆東西,拆器械、拆電子設(shè)備……據(jù)說(shuō),DeepSeek總部至今還留著一臺(tái)他小時(shí)候拆過(guò)37次的收音機(jī),旁邊寫(xiě)著:所有偉大的創(chuàng)新,都始于對(duì)現(xiàn)狀的“不合理”拆解。
上初中以后,梁文鋒提前“解鎖”了大學(xué)數(shù)學(xué)的高階知識(shí),據(jù)說(shuō)為了攻克一道幾何難題,他自創(chuàng)了“坐標(biāo)系窮舉法”,每天花幾小時(shí),把所有可能的輔助線都試一遍。17歲,他以優(yōu)異的成績(jī)考入浙江大學(xué)電子信息工程專業(yè)。其間,他積極參加各種數(shù)學(xué)建模競(jìng)賽,逐漸在學(xué)術(shù)圈小有名氣。升入碩士后,梁文鋒的研究方向從電子信息轉(zhuǎn)向了更具前沿性的機(jī)器視覺(jué)。
2008年,全球金融危機(jī)爆發(fā),梁文鋒敏銳地抓住了機(jī)遇,他和幾個(gè)同學(xué)嘗試著用各種算法模型來(lái)預(yù)測(cè)股市走勢(shì)。2015年,30歲的梁文鋒與同伴徐進(jìn)創(chuàng)辦幻方量化私募基金,一舉占據(jù)行業(yè)領(lǐng)先地位?!盎梅健比∽灾袊?guó)古代洛書(shū)九宮圖,是一種特殊的矩陣,是科學(xué)的結(jié)晶與吉祥的象征。
此時(shí)的梁文鋒,手握天量私募基金,還親自寫(xiě)代碼,但他隱身在幕后,很少露臉。他的朋友圈,一年幾乎只發(fā)一條信息。值得一提的是,幻方量化向慈善機(jī)構(gòu)捐款超過(guò)2.21億元,其中,“一只平凡的小豬”個(gè)人捐款超過(guò)1.38億元,后來(lái)大家才知道,這個(gè)人就是梁文鋒。
從不顯山露水,完全符合他的人設(shè)。2023年,38歲的梁文鋒再次選擇站在技術(shù)浪潮的最前沿。他創(chuàng)辦了深度求索(DeepSeek)公司,成立僅一年后,梁文鋒就帶領(lǐng)團(tuán)隊(duì)發(fā)布了新一代大模型DeepSeek-V3,還公開(kāi)了團(tuán)隊(duì)論文。
這款模型不僅在數(shù)學(xué)運(yùn)算、代碼生成和中文問(wèn)答等方面表現(xiàn)出色,更令人震驚的是,訓(xùn)練成本不到OpenAI的十分之一。OpenAI的創(chuàng)始成員安德烈·卡爾帕蒂評(píng)價(jià)說(shuō):“DeepSeek在有限資源下展現(xiàn)了驚人的工程能力,它可能重新定義大模型研發(fā)的規(guī)則?!?/p>
“創(chuàng)新需要擺脫慣性,經(jīng)驗(yàn)有時(shí)會(huì)成為包袱。”梁文鋒組建了一支完全由本土年輕程序員組成的團(tuán)隊(duì),不依賴海歸或高級(jí)技術(shù)專家,不設(shè)KPI,鼓勵(lì)員工自由發(fā)揮。這也是DeepSeek成功的因素之一。
“我們只是不小心成了一條鲇魚(yú)?!比缃窳何匿h的鲇魚(yú)效應(yīng)還在持續(xù),期待未來(lái)的他為中國(guó)科技書(shū)寫(xiě)更多震撼全球的故事。(輯/小A,資料來(lái)源:36氪、中國(guó)企業(yè)家、紫蘇生活派微信公眾號(hào))