埃隆·馬斯克的xAI公司近日正式推出新一代旗艦人工智能模型Grok3,同時發(fā)布精簡版Grok3mini。該公司還推出了被稱為“下一代搜索引擎”的全新工具深度檢索(DeepSearch)。xAI為Grok3的網(wǎng)頁端和移動端應(yīng)用新增多項功能,并推出名為SuperGrok的專屬訂閱服務(wù)。
“我們非常激動地推出Grok3,其能力相較Grok2在短期內(nèi)實現(xiàn)了數(shù)量級提升?!瘪R斯克在社交平臺X的直播活動中表示。Grok3動用了20萬塊英偉達H100GPU進行訓(xùn)練,規(guī)模是Grok2的兩倍。團隊透露,為完成訓(xùn)練任務(wù),其位于美國孟菲斯的“巨人”超級計算機進行了為期92天的擴容。
馬斯克在發(fā)布會上宣稱Grok3的計算能力達到Grok2的15倍(此前他在X平臺發(fā)文稱是10倍)。該模型的訓(xùn)練數(shù)據(jù)涵蓋從X平臺用戶發(fā)帖到法庭文書等多元信息。
Grok3將直面來自O(shè)penAI、谷歌和Anthropic的激烈競爭——這些公司都已在2025年發(fā)布或計劃推出新AI模型。谷歌Gemini2.0于2月初新增實用功能,OpenAI計劃在2025年下半年推出GPT-5時整合所有AI模型,而Anthropic的新模型預(yù)計數(shù)周內(nèi)面世。
自2月18日起,Grok3將率先向XPremiumPlus會員開放(含DeepSearch使用權(quán))。這對于XPremiumPlus會員算是個小安慰,因為該服務(wù)月費已從16美元漲至22美元。后續(xù)xAI將推出專為Grok3設(shè)計的SuperGrok訂閱服務(wù),包含DeepSearch、更高頻次的圖像生成權(quán)限及Think等Grok3mini功能,具體定價未公布。
除Grok3外,xAI團隊還推出了首代Grok3智能體DeepSearch。這款被稱作“下一代搜索引擎”的工具能展示AI從思考問題、檢索到生成答案的全過程。在團隊演示中,這個搜索工具耗時約1分鐘,參考了15條X推文和32個網(wǎng)頁來回答問題。
DeepSearch的獨特之處在于可查看AI的推理鏈條。例如在回答關(guān)于“瘋狂三月”籃球賽的問題時,Grok3會顯示:“我應(yīng)該查看球隊排名、常規(guī)賽表現(xiàn)、球員傷情,以及他們在錦標(biāo)賽中的歷史數(shù)據(jù)?!?/p>
這種展示推理過程的設(shè)計與中國AI公司深度求索(DeepSeek)在2025年1月發(fā)布的平臺理念相似。
“Grok3具備極強的推理能力?!瘪R斯克在2月13日接受CNBC采訪時表示,“在我們目前的測試中,它的表現(xiàn)超越了所有已知的已發(fā)布模型。有時候我覺得Grok3聰明得有點可怕。”不過團隊也坦言,Grok可能會輸出其認(rèn)為正確的答案,但未說明其產(chǎn)生幻覺的頻率是否優(yōu)于Grok2。
行業(yè)分析師保羅·謝爾指出:“雖然基準(zhǔn)測試成績亮眼,但這更多反映的是行業(yè)向具備推理能力的智能體AI發(fā)展的趨勢,而非單個模型的競爭力??紤]到整體市場策略和合作伙伴生態(tài),Anthropic和OpenAI目前仍領(lǐng)先Grok。”
謝爾特別提到,Grok3的DeepSearch能實時獲取網(wǎng)絡(luò)信息,這點優(yōu)于OpenAI的深度研究產(chǎn)品。但他也指出OpenAI的產(chǎn)品“檢索深度更勝一籌”,完成某些任務(wù)可能需要30分鐘。