2025年春天,全球科技界的目光聚焦在梁文鋒身上。在其帶領(lǐng)下,國產(chǎn)人工智能大模型DeepSeek震驚世界,用低成本的芯片實現(xiàn)與OpenAI等頂尖公司花費巨大成本打造的旗艦?zāi)P彤a(chǎn)品同樣的性能。游戲科學(xué)創(chuàng)始人、《黑神話:悟空》制作人馮驥, 更是將DeepSeek譽(yù)為“ 國運級別科技成果”。人們開始好奇,梁文鋒是誰?
梁文鋒1985年出生于廣東湛江的一個小村莊。從小,他就展現(xiàn)出對數(shù)學(xué)和科學(xué)的天賦。
他喜歡把家里的收音機(jī)拆了又裝,裝了又拆。這種對事物的好奇心和探索欲,不僅鍛煉了他的動手能力,更培養(yǎng)了他的數(shù)理思維,為他后來的創(chuàng)新之路奠定了基礎(chǔ)。
讀小學(xué)六年級時,梁文鋒憑借出色的成績考入?yún)谴ㄒ恢?。他自學(xué)高中數(shù)學(xué),甚至提前“解鎖”了大學(xué)數(shù)學(xué)的高階知識。他對數(shù)字與邏輯的敏感性遠(yuǎn)超同齡人。據(jù)說,讀中學(xué)時,他為了攻克一道幾何難題,自創(chuàng)了“坐標(biāo)系窮舉法”,每天花3 個小時,把所有可能的輔助線都試一遍。后來,這種方法成了他開發(fā)AI 模型時的關(guān)鍵算法。
2002年,梁文鋒考入浙江大學(xué)王牌學(xué)科——電子信息工程專業(yè),逐漸在學(xué)術(shù)圈小有名氣,并在研究生導(dǎo)師項志宇教授帶領(lǐng)下,進(jìn)一步接觸到人工智能的前沿領(lǐng)域。
其間,梁文鋒對金融市場產(chǎn)生了濃厚的興趣,嘗試用機(jī)器學(xué)習(xí)的方法分析金融市場數(shù)據(jù),用數(shù)學(xué)建模的方法研究價格波動規(guī)律,并開始編寫人工智能算法來選股,嘗試進(jìn)行全自動量化交易。這些“超前”的嘗試,為他日后的創(chuàng)業(yè)埋下了伏筆。
梁文鋒的目標(biāo)從來不局限于做一名普通工程師,他在學(xué)術(shù)研究之余,開始關(guān)注更大的產(chǎn)業(yè)變革方向,尤其是人工智能在實際場景中的應(yīng)用。他堅信,科技將成為未來社會的核心驅(qū)動力,而自己必須抓住這個時代機(jī)遇。
有趣的是,大疆創(chuàng)始人汪滔曾邀請梁文鋒共同創(chuàng)業(yè),但梁文鋒堅信人工智能AI 將改變世界,最終決定自己創(chuàng)業(yè)。
2015年, 梁文鋒與浙大同學(xué)共同創(chuàng)立了自己的量化私募基金——幻方量化投資。量化投資是一個融合金融、數(shù)學(xué)和計算機(jī)科學(xué)的交叉領(lǐng)域,需要具備深厚的專業(yè)知識和強(qiáng)大的技術(shù)能力。從2019年起,梁文鋒累計投資超10億元建設(shè)“螢火一號”和“螢火二號”AI算力集群,成為國內(nèi)少數(shù)具備超強(qiáng)算力的非互聯(lián)網(wǎng)企業(yè)。
到2021年,梁文鋒已躋身千億量化私募“四大天王”之列。然而投資市場風(fēng)云變幻,到2024年,幻方量化管理的資金規(guī)模縮減到幾百億元。就在很多人嘲笑幻方量化從“ 神壇” 跌落時,2024 年DeepSeek 橫空出世,再次驗證了梁文鋒對技術(shù)的敏感度。
其實,早在2022 年,隨著ChatGPT 爆火,梁文鋒就看到了人工智能領(lǐng)域的巨大潛力。2023年7月, 他成立了深度求索(DeepSeek) 公司,全力進(jìn)軍AI 大模型研究開發(fā)領(lǐng)域。很多人難以理解,甚至有人覺得他瘋了。因為當(dāng)時普遍認(rèn)為搞大模型不僅燒錢還需要尖端芯片,只有美國才能做出來。然而,誰也沒想到,梁文鋒會造就國產(chǎn)AI 的一段傳奇。
當(dāng)時,梁文鋒的團(tuán)隊僅100多人,多為本土高校的畢業(yè)生和實習(xí)生。而OpenAI公司卻有1200多名研究員,還有幾萬塊最先進(jìn)的GPU,以及10億美元資金。梁文鋒認(rèn)為,盡管缺乏實際工作經(jīng)驗,但其團(tuán)隊對研究充滿了熱情和好奇心,擁有扎實的專業(yè)知識和強(qiáng)大的學(xué)習(xí)能力。他做了兩個當(dāng)時看起來“愚蠢”的決定。一個是在組建團(tuán)隊時,沒有像其他公司那樣,執(zhí)著于聘請具有豐富AI 技術(shù)經(jīng)驗的老將,而是將目光投向充滿朝氣的年輕人。他覺得如果追求短期目標(biāo),找現(xiàn)成有經(jīng)驗的人是對的,但如果從長遠(yuǎn)來看,經(jīng)驗就沒那么重要,基礎(chǔ)能力、創(chuàng)造性、熱愛等更重要。
另一個“愚蠢”的決定是開源,在AI 先行者不斷封閉、深挖護(hù)城河的時候,他決定尊重科學(xué)的精神——開放、包容。他認(rèn)為,在顛覆性的技術(shù)面前,閉源形成的護(hù)城河是短暫的。而開源不僅能加速技術(shù)的迭代,也能讓更多人參與到技術(shù)創(chuàng)新中,從而形成良性競爭和合作。
2024年5月, 梁文鋒發(fā)布高效、強(qiáng)大的專家混合語言模型DeepSeek-V2,以超高的性價比震驚市場。DeepSeek 在圈內(nèi)爆紅,成為AI 領(lǐng)域一顆耀眼的新星。
隨后,DeepSeek 不斷經(jīng)歷技術(shù)迭代,并開始自己的“破圈之旅”。
2025年1月27日,DeepSeek發(fā)布新的開源模型DeepSeek-R1, 不僅性能比肩全球最頂尖的OpenAIo1完整版,而且僅用550萬美元的后期訓(xùn)練成本,做到了硅谷投入上億美元的效果。
短短幾天,這個新的開源模型就引起世界級的轟動,以顛覆性的姿態(tài)沖擊著美國AI界。美國總統(tǒng)特朗普感嘆:“ 中國公司發(fā)布的DeepSeek應(yīng)該為我們的行業(yè)敲響警鐘?!盨cale AI創(chuàng)始人評價說,過去,美國一直在人工智能領(lǐng)域領(lǐng)先中國,但DeepSeek 可能會“改變一切”。
游戲科學(xué)創(chuàng)始人、《黑神話:悟空》制作人馮驥第一時間表示“這可能是國運級別的科技成果”,并發(fā)布長文,列舉了DeepSeek 的六大驚人突破——推理能力比肩OpenAIo1;參數(shù)規(guī)模更小,經(jīng)濟(jì)門檻大幅下降;細(xì)節(jié)全部公開,技術(shù)透明度高;用戶無需付費即可體驗到世界頂尖的AI模型能力;暫時唯一支持聯(lián)網(wǎng)搜索的推理模型;開發(fā)團(tuán)隊由年輕的中國工程師組成,印證本土科技力量的崛起。
正如Linux操作系統(tǒng)的開源催生了無數(shù)基于它的軟件和應(yīng)用,推動了整個計算機(jī)行業(yè)的發(fā)展,DeepSeek的模型開源,也迅速吸引了全球開發(fā)者的關(guān)注和參與。他們在DeepSeek模型的基礎(chǔ)上,開發(fā)出各種各樣的應(yīng)用,從智能客服到智能寫作,從圖像識別到數(shù)據(jù)分析,涵蓋各個領(lǐng)域。這些應(yīng)用不僅豐富了AI的應(yīng)用場景,也讓更多人體驗到AI 的魅力。難怪有人說,梁文鋒不僅顛覆了AI 市場的游戲規(guī)則,更送給全世界一份大禮!
過去很多年,許多中國公司習(xí)慣了別人做技術(shù)創(chuàng)新,自己做應(yīng)用變現(xiàn)。以至于很多人刻板地認(rèn)為,美國擅長0—1的創(chuàng)新,中國只能做1—10的應(yīng)用創(chuàng)新。而DeepSeek讓人們看到,中國也可以引領(lǐng)0—1的創(chuàng)新。這正如梁文鋒所說:“我們不只是追趕,更要在核心技術(shù)上實現(xiàn)真正的超越……走到技術(shù)的前沿,去推動整個生態(tài)發(fā)展。中國要逐步成為貢獻(xiàn)者,而不是一直搭便車?!?/p>
(資料來源:《新京報》、新浪財經(jīng)等)