自中國(guó)人工智能大語(yǔ)言模型深度求索(DeepSeek)“橫空出世”以來,關(guān)于中國(guó)人工智能技術(shù)的發(fā)展引發(fā)了國(guó)際社會(huì)的關(guān)注。美國(guó)《科學(xué)》雜志最近以《中國(guó)公司推出更快、更便宜的人工智能語(yǔ)言模型引發(fā)轟動(dòng)》報(bào)道了中國(guó)人工智能發(fā)展情況,現(xiàn)編譯該文如下。
對(duì)一家中國(guó)初創(chuàng)企業(yè)而言,美國(guó)禁止向中國(guó)實(shí)體出售最先進(jìn)的人工智能(AI)芯片反而成為了創(chuàng)新的催化劑。由前AI學(xué)者轉(zhuǎn)型對(duì)沖基金經(jīng)理于2023年5月創(chuàng)立的深度求索(DeepSeek)公司表示,他們找到了用二線圖形處理器(GPU)以極低成本實(shí)現(xiàn)與美國(guó)競(jìng)爭(zhēng)對(duì)手相當(dāng)AI性能的方法。
此前,深度求索已憑借一系列高效的大型語(yǔ)言模型(LLM)引發(fā)關(guān)注——這些模型雖性能不及OpenAI的ChatGPT,但同樣雄心勃勃。與ChatGPT及多數(shù)西方競(jìng)品不同,深度求索的LLM為開源模型,用戶可查看并修改源代碼以優(yōu)化或定制功能。2024年12月27日的技術(shù)報(bào)告中,該公司宣布其最新模型V3實(shí)現(xiàn)重大突破,“性能超越其他開源模型,達(dá)到與主流閉源模型相當(dāng)?shù)乃健薄?/p>
AI領(lǐng)域觀察者對(duì)此予以重視。研究新興技術(shù)的喬治·華盛頓大學(xué)政治學(xué)者杰弗里·?。ㄒ簦┲赋觯疃惹笏鳌翱s小了與世界頂尖LLM的差距”,部分基準(zhǔn)測(cè)試甚至超越OpenAI的最新模型GPT-4o。OpenAI聯(lián)合創(chuàng)始人、前研究員安德烈·卡帕西在社交平臺(tái)發(fā)文稱,若V3通過后續(xù)獨(dú)立驗(yàn)證,“這將是資源受限條件下科研與工程能力的非凡展示”。
華盛頓特區(qū)中美經(jīng)濟(jì)競(jìng)爭(zhēng)分析師王雷(音)表示,中國(guó)難以獲取先進(jìn)AI芯片的現(xiàn)狀“正迫使中國(guó)AI科學(xué)家在現(xiàn)有硬件條件下創(chuàng)新”。深度求索稱其采用改進(jìn)版“混合專家”架構(gòu),既降低模型訓(xùn)練算力需求,又提升查詢響應(yīng)效率。該架構(gòu)僅針對(duì)特定任務(wù)訓(xùn)練模型內(nèi)的部分專家網(wǎng)絡(luò),再由門控網(wǎng)絡(luò)將查詢分配至最適配的專家網(wǎng)絡(luò)。
悉尼科技大學(xué)中國(guó)創(chuàng)新研究專家瑪麗娜·張(音)評(píng)價(jià)道:“深度求索證明,巧思能有效緩解先進(jìn)硬件獲取受限的制約?!鄙疃惹笏鞴颈硎荆侍嵘@著降低成本——估算顯示V3訓(xùn)練僅耗資560萬(wàn)美元,遠(yuǎn)低于OpenAI訓(xùn)練ChatGPT-4o的預(yù)估7800萬(wàn)美元。杰弗里·丁指出,用戶運(yùn)行該模型的成本“遠(yuǎn)低于同等性能的其他模型”。據(jù)稱V3的數(shù)據(jù)分析、模式識(shí)別與預(yù)測(cè)建模能力可應(yīng)用于氣候影響預(yù)測(cè)、疾病生物標(biāo)志物識(shí)別、宇宙學(xué)理論驗(yàn)證等科研領(lǐng)域。
與多數(shù)主要競(jìng)爭(zhēng)對(duì)手不同,深度求索未獲中國(guó)科技巨頭注資。王雷強(qiáng)調(diào)“深度求索公司核心聚焦創(chuàng)新與中國(guó)高性能LLM研發(fā)”。
深度求索未回應(yīng)《科學(xué)》雜志的郵件問詢。但創(chuàng)始人兼CEO梁文峰去年向新媒體“暗涌Waves”表示,公司優(yōu)先事項(xiàng)是“研究技術(shù)創(chuàng)新”而非商業(yè)機(jī)會(huì)。他透露終極目標(biāo)是實(shí)現(xiàn)人工通用智能(AGI)——這一AI目標(biāo)要求模型具備人類認(rèn)知能力,該崇高愿景幫助公司吸引了志存高遠(yuǎn)的研究者?!绊敿馊瞬抛羁粗氐臒o(wú)疑是解決世界級(jí)難題的機(jī)會(huì)?!?/p>
梁文峰曾就讀浙江大學(xué),2015年參與創(chuàng)立依賴AI策略的對(duì)沖基金幻方量化,據(jù)傳其現(xiàn)管理80億美元資產(chǎn)?;梅椒趸疃惹笏鞑WLM研發(fā),據(jù)悉梁文峰親力親為參與多篇公司科研論文撰寫。
盡管取得重大進(jìn)展,觀察人士指出深度求索仍面臨挑戰(zhàn)。杰弗里·丁認(rèn)為開源模式意味著“競(jìng)爭(zhēng)對(duì)手可改良其方法”。戰(zhàn)略與國(guó)際研究中心AI政策專家格雷戈里·艾倫斷言“若無(wú)法持續(xù)獲取更多AI芯片,未來必將舉步維艱”;瑪麗娜·張則指出中國(guó)企業(yè)必須“持續(xù)突破軟件與系統(tǒng)創(chuàng)新邊界以保持競(jìng)爭(zhēng)力”。