吳洋洋
生成式AI到底能不能創(chuàng)造價值?英偉達的財報高聲叫喊著:“能!”
8月接近尾聲的時候,英偉達以同比101%的營收增長率為技術(shù)公司的財報季收了個漂亮的尾。報告顯示,截至7月底的第二財季,英偉達收入為135.1億美元,同比增長101%,環(huán)比增長88%。同時,英偉達凈利潤達到61.88億美元,同比暴增843%。
這是英偉達首次在季度收入上超過英特爾,后者一個月前公布的第二季度收入為129億美元。兩家公司的差距將在下個季度繼續(xù)拉大:英特爾預(yù)計第三季度營收與第二季度差不多,為129億至139億美元;而英偉達預(yù)計,其截至今年10月底的第三財季,銷售額將繼續(xù)環(huán)比上漲27%,達到160 億美元,超出英特爾15%至24%。財報發(fā)布后,英偉達股價上漲6.6%,市值達到1.16萬億美元。今年以來,英偉達的股價已累計上漲222%。
把英偉達送上芯片設(shè)計頭牌寶座的正是生成式AI。包括ChatGPT在內(nèi)的所有生成式AI,都需要使用英偉達的A100(采用7nm工藝)和H100(采用4nm工藝)人工智能芯片訓(xùn)練和計算。投資銀行R ay mond Ja mes稱,英偉達制造H10 0的成本為3320美元,而官方售價2.5萬至3萬美元,毛利率高達6 5 0 %至800%。
英偉達的財富神話很容易讓人想到特斯拉。自從特斯拉的股價增長奇跡,整個新能源汽車領(lǐng)域,尤其是中國新能源汽車品牌自2020年起全行業(yè)崛起,使中國超過德國,一躍成為僅次于日本的全球第二大汽車出口國。
生成式AI的故事不會與新能源汽車完全相同,而是會更大—有更多的參與者、更激烈的競爭、更快變化的底層技術(shù)、更多不確定性以及更多可能性。
ChatGPT發(fā)布后的第9個月,也就是剛剛過去的8月,生成式AI領(lǐng)域不僅沒有熄火,反而更加活躍。7月底8月初,硅谷技術(shù)公司密集發(fā)布了第二季度財報,雖然業(yè)績表現(xiàn)沒有英偉達那么驚艷,但幾乎所有公司的營收都漲了,而幾乎每家公司都在財報及財報會中強調(diào)了對生成式AI的投入,并提出要將自己的AI助手(Google的Assistant、亞馬遜的Alexa)背后模型盡快換成生成式的。暫時落后的亞馬遜已將生成式AI設(shè)為“一把手工程”,CEO杰西直接對投資者承諾:“亞馬遜的每個業(yè)務(wù)都有多個生成式AI項目在進行”。
Meta在8月幾乎是跑步前進。月初,Meta提出要在9月推出一系列不同性格的聊天機器人,與只有一種性格的ChatGP T競爭。月中,Meta又表示即將推出一款幫助開發(fā)人員自動生成代碼的開源模型—Code Llama,該代碼生成模型基于其開源大語言模型Llama 2。下旬,一款叫“SeamlessM4T”的“多模態(tài)”翻譯器也從Meta的生成式AI流水線下線了,與一般AI翻譯只能從文本到文本不同,Meta的這款翻譯器據(jù)稱還能夠“從語音到文本”或者反過來“從文本到語音”地直接完成翻譯,不需要經(jīng)過中間文本轉(zhuǎn)換。同樣的,這款翻譯器也將開源。
閉源模型只能調(diào)用,數(shù)據(jù)需要上傳到模型所有者那里,且每調(diào)用一次模型就要為此付一次費;而開源模型可以被部署在本地,數(shù)據(jù)自然也留在本地,并且使用模型是免費的。在閉源模型沒有不可逾越的技術(shù)優(yōu)勢時,開源模型正因安全性而被越來越多開發(fā)者部署在他們自己的內(nèi)部服務(wù)器上。
Meta的開源模型大幅改變了生成式A I的全球生態(tài)。8月,全球迅速出現(xiàn)了一大批基于其L lama 2精調(diào)形成的大模型,比如Stability 8月13日推出的類ChatGPT產(chǎn)品—Stable Chat,它所基于的大語言模型Stable Beluga是Stability AI在兩代Llama的基礎(chǔ)上精調(diào)出來的。所謂精調(diào)(finetune),就是在原有模型基礎(chǔ)上,加入一些自己擁有、認為有價值的數(shù)據(jù)再訓(xùn)練幾輪,從而讓模型更優(yōu)秀。Stability AI最為人熟知的能力是文生圖,目前業(yè)界主流的文生圖模型Stable Diffusion就是這家公司開發(fā)和開源的。Stability AI已將其精調(diào)后的Stable Beluga系列大語言模型上架到Hugging Face社區(qū)并開源,目前,僅Stable Beluga 2在該社區(qū)的下載量就超過55萬。在中國,阿里巴巴、百度、騰訊等公司的云計算平臺也都已在過去一個月內(nèi)宣布了Llama 2的入駐。
一位投資人對《第一財經(jīng)》雜志新皮層稱,國內(nèi)多家已經(jīng)發(fā)布大模型的公司,其模型都并非從0到1的自研,而是基于已有開源模型的精調(diào)。而Llama 2發(fā)布后,一些曾經(jīng)從0到1自研的大模型公司的API調(diào)用生意就做不下去了。比如北京智譜,過去客戶使用這家公司的模型需要支付上千萬元的費用,現(xiàn)在他們選擇把Llama 2部署到自己的服務(wù)器上隨取隨用。
Meta的開源戰(zhàn)略影響的當(dāng)然不只是北京智譜這樣的模型公司,它也加快了一些將生成式AI與其他先進技術(shù)組合起來創(chuàng)新的速度。8月18日,以參加“華為天才少年計劃”出名的稚暉君(彭志輝)代表上海智元發(fā)布了一款人形機器人“遠征 A1”,如果不是基于開源的大語言模型,這款機器人不可能在稚暉君從華為離職僅8個月后就推出,而且在推出時就具備一些理解任務(wù)、編排動作的能力。
Meta以一己之力加速了生成式AI的行業(yè)進程,使技術(shù)公司的生存游戲從模型本身迅速進階到了智能體(agent)—我們已經(jīng)多次提到這一概念,它與我們常說的生成式AI、大模型最大的不同,就是其拆解復(fù)雜問題的能力,即能夠?qū)?fù)雜任務(wù)拆解成多個小任務(wù),然后調(diào)用相應(yīng)軟件、數(shù)據(jù)或者其他AI模型的API接口,逐一完成這些小任務(wù),從而整體上完成一個復(fù)雜任務(wù)。目前,即便是最強大的GPT,無論在拆解復(fù)雜任務(wù),還是將為小任務(wù)生成代碼去調(diào)用其他程序的能力上,仍然準(zhǔn)確性不足。
如何訓(xùn)練這種比GPT更強大的AI?OpenAI給出的答案是讓GPT們玩游戲。8月16日,OpenAI宣布收購一家叫Global Illumination的初創(chuàng)公司,這家公司很小,只有8個人,但其產(chǎn)品—沙盒游戲(Sandbox?Game)對OpenAI具有戰(zhàn)略意義。這種電子游戲類似于《我的世界》,為玩家提供高開放、高自由度的游戲環(huán)境。這種環(huán)境比斯坦福大學(xué)和Google研究部門聯(lián)合設(shè)計的AI“小鎮(zhèn)”(Smallville)復(fù)雜得多,后者放置了25個AI智能體,每個智能體都由ChatGPT支持,擁有各自不同人格、工作、愿望。這25個智能體的小鎮(zhèn)生活已經(jīng)讓外界有一種“創(chuàng)世紀(jì)”之感,未來沙盒游戲中的智能體將如何博弈和成長應(yīng)該是OpenAI期待的。剛好,斯坦福大學(xué)的AI小鎮(zhèn)項目也在8月開源了,你若感興趣可以去玩玩看。
智能體可能是個抽象概念,一個更具體、更容易理解的對象是機器人。因為至少一半的業(yè)界人士認為,生成式AI要想超越GPT-4,變得更聰明,就需要一個身體,在與世界的空間交互中學(xué)習(xí)。
7月底,Google也發(fā)布了新款機器人RT-2,相較于上一代純粹基于深度強化學(xué)習(xí)的機器人,RT-2可以完成未經(jīng)訓(xùn)練的任務(wù),因為其模型中接入了生成式大語言模型。這使它具備了部分推理能力,比如研究者讓它“抓取已滅絕動物”,它就伸出手臂,抓住了恐龍。
不過請注意,并不是所有的機器人都可以成為智能體,就像不是所有大模型、生成式AI都能被叫作智能體。相較于形態(tài),它更是一個技術(shù)目標(biāo)。
圖片/Google DeepMind
雖然在開源生態(tài)、組合創(chuàng)新和智能體布局等方面取得了進步,然而大環(huán)境層面,生成式AI也在8月迎頭撞上了一些墻。8月15日,中國第一份有關(guān)生成式AI的管理辦法開始實施,在此之前,一批生成式AI應(yīng)用在蘋果應(yīng)用商店中國區(qū)下架。其中一些應(yīng)用比如訊飛星火在整改后重新上架,但一些應(yīng)用再也沒有上架,比如一些基于GPT、Midjourney等境外模型開發(fā)的面向國內(nèi)用戶的應(yīng)用。
全球各國政府都對生成式AI嚴(yán)陣以待,不過中國開發(fā)者面對的挑戰(zhàn)可能更大。除了應(yīng)對國內(nèi)監(jiān)管,他們還面臨融資上的壓力。8月10日,美國總統(tǒng)拜登簽署了一項行政命令,禁止美國資本對3項中國“敏感技術(shù)”投資,人工智能就是其中之一。包括紀(jì)源資本、金沙江創(chuàng)投、華登國際、高通創(chuàng)投等在內(nèi)的VC投資機構(gòu)都受到了美國國會中一個叫“美國與中國共產(chǎn)黨戰(zhàn)略競爭特設(shè)委員會”組織的的調(diào)查。紅杉資本暫時不在調(diào)查名單里,但它已被點名為下一個調(diào)查對象。
中國并不缺乏資金,但國內(nèi)資金普遍喜歡投資B輪(含)之后的項目,而不喜歡在A輪就出手。說白了,A輪的失敗風(fēng)險更大,過去也主要是美元基金的主場。沒有了美國風(fēng)險投資者為中國生成式AI創(chuàng)業(yè)者的夢想下注、背書,中國在生成式AI 時代的獨角獸數(shù)量遠遠落后于美國。截至8月底,美國生成式AI公司中估值達到40億美元的公司就有三四個,而估值超過10億元人民幣的中國公司幾乎看不到。
附:以下是2023年8月人工智能領(lǐng)域在模型及應(yīng)用、智能體與政策方面值得關(guān)注的進展。
據(jù)數(shù)據(jù)分析公司Similarweb披露,今年6月和7月,ChatGPT的流量連續(xù)兩個月下跌,6月環(huán)比下降9.7%,7月又下降9.6%。不過,Similarweb推測,流量連續(xù)下跌可能與暑假有關(guān)。之前教育服務(wù)公司Chegg承認,使用其作業(yè)輔助系統(tǒng)的學(xué)生正在流失,轉(zhuǎn)而使用ChatGPT完成作業(yè)。隨著夏季學(xué)期結(jié)束,學(xué)生用戶短期內(nèi)會有明顯流失。6月,Chegg的流量同比下降28.3%,幅度遠超ChatGPT的環(huán)比降幅(9.7%)。根據(jù)Similarweb的統(tǒng)計模型,ChatGPT 28.6%的用戶是18歲至24歲之間的青年人,僅次于占比33.6%的25歲至34歲年齡段。
據(jù)《華爾街日報》8 月1 8 日報道,分析公司StatCounter和Similarweb最新報告顯示,7月,微軟旗下的搜索引擎Bing占據(jù)搜索市場的份額僅為3%,且月度用戶量僅為Google的1%,這與1月搭載ChatGPT的Bing AI推出前情況基本一致。生成式AI對微軟搜索引擎的市場份額提升看起來沒有太多幫助。微軟對分析公司的數(shù)據(jù)提出異議,稱第三方研究人員沒有統(tǒng)計對Bing聊天的所有訪問。今年2月,微軟在推出Bing AI時,公司高管在與分析師的電話會議上表示,“搜索廣告市場的份額每增加1個百分點,我們的廣告業(yè)務(wù)就有望增加20億美元的收入?!?h4>03.“妙鴨相機”在微信朋友圈走紅
8月初,一款叫“妙鴨相機”的AI人像生成應(yīng)用在微信朋友圈走紅。當(dāng)你上傳21張符合標(biāo)準(zhǔn)的個人照片并支付9.9元后,這款應(yīng)用便會為你生成一個“數(shù)字分身”—其實就是一張你的二維頭像;接下來,像在影樓一樣,你可以選擇各種風(fēng)格的裝扮,正裝、校園、古風(fēng)等等,程序會自動將你的頭像與裝扮結(jié)合起來,生出一張張數(shù)字影樓照。這款應(yīng)用由阿里巴巴旗下的優(yōu)酷團隊開發(fā),7月30日上線蘋果應(yīng)用商店。
7月24日,短視頻應(yīng)用TikTok上線新功能,允許用戶以文本形式在應(yīng)用上發(fā)表內(nèi)容,平臺會根據(jù)用戶設(shè)置將文本轉(zhuǎn)化為帶音樂、表情、背景的視頻。同一天,小紅書也上線了名為“此刻”的類似功能,用戶發(fā)帖時,輸入文字后應(yīng)用會自動根據(jù)內(nèi)容生成一張圖片作為配圖。隨著Meta旗下社交平臺Threads入局,短文本內(nèi)容平臺的競爭趨于激烈,大家都想從流量日益下降的Twitter手中分一杯羹。此前Meta旗下照片應(yīng)用Instagram已有一個名為“Instagram Stories”的功能,允許用戶輸入文本然后生成圖片。TikTok這次推出的功能與它很像,面向所有用戶開放,瀏覽文本生成內(nèi)容時的界面和普通短視頻相似,最長支持輸入1000字。小紅書本身就自帶文本發(fā)表功能,這次推出的“此刻”是把生成式AI植入用戶操作流程。用戶按正常流程輸入文本,小紅書App會自動將文本轉(zhuǎn)化為圖片。
《紐約時報》報道,亞馬遜網(wǎng)站上有大量搜索結(jié)果排名前列的圖書實際可能是AI生成的,涉及旅游指南、烹飪、編程、園藝、商業(yè)、手工藝、醫(yī)學(xué)、宗教、數(shù)學(xué)以及小說等類別?!都~約時報》使用人工智能檢測器Originality.ai對抽樣的65本旅游指南檢測,疑似AI生成的圖書中大部分段落得分都得到了滿分100分——得分越高,越可能是AI生成的;相比之下Rick Steves、Fodors、Frommers以及Lonely Planet等真人或出版方寫作的旅游指南得分幾乎都在10分以下。在ChatGPT吸引市場目光后,很快就有人利用ChatGPT寫書。路透社在今年2月報道,亞馬遜Kindle商店中已有200多本電子書將ChatGPT列為作者或合著者。亞馬遜甚至開辟了新的子類型,“關(guān)于如何使用ChatGPT的書籍”,這些書完全由ChatGPT編寫。
據(jù)《衛(wèi)報》7月31日報道,澳大利亞新聞集團正在使用生成式AI寫新聞,每周生成的新聞稿數(shù)量大約達到3000篇。澳大利亞新聞集團內(nèi)部成立了一個名為“Data Local”的部門,共有4名員工,由數(shù)據(jù)新聞編輯Peter Judd領(lǐng)導(dǎo)。該團隊主要用生成式AI產(chǎn)出天氣、燃油價格和交通狀況等話題的新聞,并提供相關(guān)問題的回答,例如“在澳大利亞城市彭里斯哪里可以找到最便宜的燃油”。AI生成內(nèi)容后,記者會進一步核查。目前,澳大利亞新聞集團正在招聘“生成式AI數(shù)據(jù)記者”,要求會使用AI自動創(chuàng)建新聞內(nèi)容。
作為BAT中唯一一家尚未推出類GPT模型和類ChatGPT對話產(chǎn)品的公司,騰訊終于在生成式AI方面有了進展。8月,騰訊自研的“混元”大模型已進入應(yīng)用內(nèi)測階段,員工已收到內(nèi)部郵件邀請,可以通過網(wǎng)頁或者小程序體驗大模型,內(nèi)部多個業(yè)務(wù)也已接入該大模型開始測試。今年2月,騰訊成立“混元助手”(HunyuanAide)項目組,計劃推出類ChatGPT的對話產(chǎn)品。
8月18日,字節(jié)跳動大模型對話產(chǎn)品“豆包”開放測試,用戶可通過網(wǎng)頁或者下載App體驗?!岸拱笔亲止?jié)跳動研發(fā)的大模型對話產(chǎn)品,具備自然語言處理、知識回答、語言翻譯、文本摘要、情感分析等功能。除聊天機器人“豆包”外,同一測試頁面還出現(xiàn)了其他各種AI助手,包括“英語學(xué)習(xí)助手”“全能寫作助手”“超愛聊天的小寧”等。其中“全能寫作助手”主要負責(zé)生成電影評價、視頻腳本、詩歌或歌詞;而“小寧”更側(cè)重聊天。
7月28日,Google DeepMind團隊推出新款機器人Robotic Transformer 2(RT-2)。相較于過去為特定任務(wù)編寫指令的機器人,新模型能夠讓操作者通過自然語言指示RT-2機器人完成任務(wù),哪怕是它未接受過訓(xùn)練的任務(wù),比如當(dāng)DeepMind研究人員給出“抓取已滅絕動物”的指令后,RT-2伸出手臂,抓住了恐龍。2022年12月底,Google曾推出第一代Transformer機器人RT-1。RT-1是個在純粹物理環(huán)境中訓(xùn)練的機器人,Google曾將13個這樣的機器人放置到辦公室工坊環(huán)境中訓(xùn)練了17個月。由此獲得的數(shù)據(jù)被加載到了基于大語言模型的“視覺-語言模型”(visual-language model,VLM,)上,于是形成了“視覺-語言-動作模型”(visual-language-action,VLA),即RT-2。相較于RT-1,RT-2在從未接受過訓(xùn)練的任務(wù)上有更好的表現(xiàn)。Google的測試數(shù)據(jù)表明,對于訓(xùn)練數(shù)據(jù)中已有的訓(xùn)練任務(wù),RT-2的表現(xiàn)與RT-1相同,但在未錄入訓(xùn)練數(shù)據(jù)的訓(xùn)練任務(wù)中,RT-2的成功率達到了62%,而RT-1的成功率只有32%。
8月11日,由斯坦福大學(xué)和Google研究部門聯(lián)合開發(fā)的AI項目—小鎮(zhèn)(Smallville)宣布開源。該項目創(chuàng)造了一個完全由AI居民組成的小鎮(zhèn),可以視為一個微型AI元宇宙。這個小鎮(zhèn)由25個AI智能體(agent)組成,這些AI是由ChatGPT支持的擁有各自不同人格、工作、愿望的單獨個體。開發(fā)者為這些AI設(shè)計了小鎮(zhèn)的物理模板,包括街道、住宅、家具陳設(shè)、公共區(qū)域,它們會根據(jù)各自的邏輯在小鎮(zhèn)中生活,比如當(dāng)它們看到早餐在燃燒時,會關(guān)掉爐子;浴室有人時,它們會在外面等待;與其他智能體交談時,還會停下來聊天?!八固垢I小鎮(zhèn)”看上去有點像游戲《模擬人生》的簡化版,但其實很不一樣。電子游戲中虛擬角色(NPC)的對話腳本基本都在事先就已寫定,它們幾乎沒有后天自由發(fā)揮的空間。而斯坦福的“小鎮(zhèn)”中的角色對話由大語言模型(Large Language Models, LLMs)生成,不需要事先確定。這些AI角色在擁有自主性的同時還能彼此互動,一起完成任務(wù)。
8月16日,OpenAI宣布收購初創(chuàng)公司Global Illumination,目前該公司整個團隊已加入OpenAI,參與包括ChatGPT在內(nèi)的核心產(chǎn)品的開發(fā)。Global Illumination成立于2021年,主要產(chǎn)品是一種叫沙盒游戲(Sandbox Game)的電子游戲,游戲提供了開放式的、自由度高的世界,讓玩家可以在其中自由探索、創(chuàng)造和互動,而不受嚴(yán)格的預(yù)設(shè)目標(biāo)限制。這是OpenAI首次公開收購,收購目的可能意在智能體(agent)的研發(fā)。微軟此前也在積極收購游戲公司動視暴雪。
8月18日,稚暉君的創(chuàng)業(yè)公司發(fā)布了第一款產(chǎn)品人形機器人“遠征 A1”。稚暉君本名彭志輝,畢業(yè)于電子科技大學(xué),他2020年加入“華為天才少年計劃”,負責(zé)華為昇騰計算產(chǎn)品線的全棧研發(fā)。去年12月27日,彭志輝發(fā)帖表示將離開華為,投身機器人創(chuàng)業(yè)項目,之后于今年2月27日參與創(chuàng)立上海智元新創(chuàng)技術(shù)有限公司?!斑h征A1”是該公司開發(fā)的一款人形機器人,身高175cm,重53kg,最高步速可以達到7km/h。它可以承重80kg,單臂最大負載5kg,相當(dāng)于可以用一只手臂舉起一袋常規(guī)體積的面粉。這款機器人基于的模型被稱為“WorkGPT”,是一個集合了多個模型的智能體模型,包括一個類似ChatGPT的語言模型、一個視覺控制模型,以及其他用于本體控制、感知等的模型。
8月1日凌晨,包括訊飛星火在內(nèi)的多個生成式AI(AIGC)相關(guān)App在蘋果應(yīng)用商店中國區(qū)下架。下架主因是“在數(shù)據(jù)采集和使用等環(huán)節(jié)不夠規(guī)范”。7月13日,國家網(wǎng)信辦等七部門聯(lián)合發(fā)布《生成式人工智能服務(wù)管理暫行辦法》(以下簡稱《暫行辦法》),首次對生成式AI產(chǎn)品的訓(xùn)練數(shù)據(jù)采集處理、用戶隱私保護、防沉迷機制、違規(guī)內(nèi)容處理、備案與許可要求等作出明確規(guī)定。該《暫行辦法》于8月15日開始實施。開發(fā)者只要在限期內(nèi)按照規(guī)定完成整改,產(chǎn)品有望重新上架。而提供具有輿論屬性或者社會動員能力的AIGC服務(wù)的,還需要依法履行“算法備案”手續(xù)。這些規(guī)定意味著,包括GPT、Midjourney等在內(nèi)的境外AI模型如果沒有在中國網(wǎng)信辦等部門備案并獲得上市許可,其下游應(yīng)用就難以在中國市場上市。我們是一個誕生于GPT浪潮、由《第一財經(jīng)》YiMagazine孵化的全新內(nèi)容IP。和每一位關(guān)心技術(shù)、關(guān)注人類命運的讀者一樣,我們希望在這個充滿不確定性的時代,更好地理解快速變化的科技世界,也更好地理解生而為“高級智能”的我們自己。在這個目標(biāo)下,我們計劃從學(xué)術(shù)、商業(yè)、倫理、監(jiān)管等多個角度報道和討論與“智能”相關(guān)的議題。請注意,我們說的智能,不只是 AI。
北京時間8月10日凌晨,美國總統(tǒng)拜登簽署了一項行政命令,“禁止”美國資本對3項中國“敏感技術(shù)”——半導(dǎo)體和微電子、量子信息技術(shù)、某些人工智能領(lǐng)域——的新投資,并要求美國資本在投資中國“其他技術(shù)領(lǐng)域”時須獲得“政府許可”。這項行政命令針對的是私募股權(quán)、風(fēng)險投資、合資公司和綠地投資(greenfield investment,指從頭開始建造新生產(chǎn)設(shè)施的投資,對應(yīng)“棕地投資”brownfieldinvestment,后者指對已有投資項目的擴建)。這一行政命令意味著,美國的對中“技術(shù)戰(zhàn)”將不僅限于半導(dǎo)體,即芯片,也將擴展至人工智能、量子計算等多元領(lǐng)域,且手段從限制下游的商品進出口擴大到了限制上游的投資領(lǐng)域。這項行政命令還需要進一步征求公眾意見,才能最終成為財政部的新法規(guī),頒布時間大約在2024年——美國總統(tǒng)選舉年。