近日,埃隆·馬斯克旗下人工智能公司xAI正式發(fā)布新一代AI模型Grok3。馬斯克在直播中稱其為“聰明得可怕”,并宣布其能力比前代Grok2“高出一個數(shù)量級”,在多項基準測試中超越了OpenAI的GPT-4o和中國DeepSeek的R1模型。
Grok3的開發(fā)得益于xAI打造的“巨人”(Colossus)超級計算機,該系統(tǒng)搭載10萬塊英偉達H100GPU,提供2億GPU小時的訓練時長,算力達到Grok2的10倍。據(jù)了解,xAI采用三大創(chuàng)新訓練方法:
合成數(shù)據(jù)集——通過模擬場景生成多樣化數(shù)據(jù),解決隱私問題;
自我糾正機制——模型可識別并修正自身錯誤;
強化學習——通過獎懲機制優(yōu)化決策能力。
在AIME(美國數(shù)學邀請賽)和GPQA(一個極其困難的知識數(shù)據(jù)集,其中問題由生物學、物理學、化學等領(lǐng)域的博士水平的專家設(shè)計)等基準測試中,Grok3表現(xiàn)優(yōu)異,其推理Beta版在復(fù)雜科學問題上的準確率顯著領(lǐng)先。
據(jù)了解,Grok3并非單一模型,而是一個系列,包括Grok3旗艦版、迷你版、快速版等。其中,旗艦版擅長金融、醫(yī)療、法律等專業(yè)領(lǐng)域,迷你版即輕量版,響應(yīng)更快但精度略低;高速版則適合實時任務(wù)的快速響應(yīng)。
功能創(chuàng)新方面,Grok3引入深度檢索(DeepSearch)功能,可快速檢索網(wǎng)絡(luò)和社交平臺內(nèi)容,生成詳細研究報告。例如,在一次演示中,它整合了15條社交平臺X的帖子和32個網(wǎng)站信息來回答問題。此外,其“大頭腦”(BigBrain)模式通過延長思考時間提升回答深度,但目前僅限付費用戶使用。
據(jù)悉,Grok3已應(yīng)用于客服、醫(yī)療診斷、金融風控等領(lǐng)域。例如,在醫(yī)療中可分析病歷和影像數(shù)據(jù)輔助診斷;在金融中能實時監(jiān)測欺詐交易。
面對OpenAI的GPT-5和中國DeepSeek的競爭,馬斯克強調(diào)Grok3“優(yōu)先追求真相”。不過,分析指出,DeepSeek等低成本高效模型正促使全球AI公司重新評估技術(shù)路線。
xAI計劃在未來幾個月開源Grok2,并推出Grok3的語音模式和API服務(wù)。隨著技術(shù)迭代,Grok3或?qū)⒊蔀锳I領(lǐng)域的重要競爭者,但其能否持續(xù)領(lǐng)先仍需觀察。