馬冬
“我是誰?”“從哪里來?”“要到哪里去?”哲學(xué)史上,柏拉圖提出的靈魂三問,是人們深刻、簡(jiǎn)明把握事物發(fā)展方向的思考路徑。
當(dāng)下,AI大模型熱度比酷暑的熱浪還高。在AIGC、ChatGPT的帶動(dòng)下,大模型概念開始被廣泛討論。2023年還未過半,就已經(jīng)有包括百度、阿里、騰訊、商湯、京東、科大訊飛等多家互聯(lián)網(wǎng)、AI公司陸續(xù)宣布對(duì)大模型展開探索。
但在眾多大模型里,開一場(chǎng)發(fā)布會(huì),講清楚“我是誰”的居多,關(guān)于AI大模型“從哪里來,到哪里去”,或者說“做什么,為誰做”的進(jìn)一步思考,卻很少見得到。
如果把大模型的全球比拼,看成一場(chǎng)賽馬,這場(chǎng)比賽早就從小型的速度賽,變成了大型的耐力賽。現(xiàn)在的重要問題已經(jīng)變成,要培育自己的粉絲,種植一片自己的草原。
在AIGC和ChatGPT等熱詞帶動(dòng)下,大模型概念逐漸被關(guān)注。不過,大模型到底是什么,又能做什么,對(duì)很多人來說,這個(gè)問題的答案似乎很模糊。
一位中國(guó)傳媒大學(xué)計(jì)算機(jī)技術(shù)碩士,在知乎上這樣描述了大模型:如果說模型是一個(gè)盒子,那么普通模型就是一個(gè)小盒子,因?yàn)槿萘坑邢?,所以其處理和存?chǔ)的數(shù)據(jù)、信息也有限。因此,普通模型可以完成分類、預(yù)測(cè)、生成等簡(jiǎn)單任務(wù)。相較之下,大模型就是一個(gè)超級(jí)大倉(cāng)庫,往往需要數(shù)十億,甚至上百億個(gè)參數(shù)組成,可以完成更高級(jí)的思考和決策。比如,自然語言理解、語音識(shí)別、圖像識(shí)別等。
而這個(gè)大模型,到底有多“大”?
舉例來說,GPT-4使用了1 750億規(guī)模的參數(shù),微軟推出的Turing-NLG有1 000億參數(shù),谷歌則推出號(hào)稱有1.6萬億模型參數(shù)的Switch transformer。而作為對(duì)照,我們?nèi)粘J褂玫闹悄苷Z音通常只有幾個(gè)億的參數(shù)。
從數(shù)據(jù)上看,大模型的底層建設(shè),就不是一般企業(yè)可以勝任的。
率先推出文心一言的百度有100億參數(shù)、華為盤古大模型使用1 000億參數(shù)。不過,過去的幾個(gè)月,陸續(xù)加速布局大模型的國(guó)內(nèi)公司卻如雨后春筍,其中包括阿里的通義大模型、騰訊的混元大模型、科大訊飛的訊飛星火、京東的ChatJD等。
他們都通過自己平臺(tái)沉淀的數(shù)據(jù),來完成自家大模型的第一次迭代。
像是以搜索引擎為所長(zhǎng)的百度,推出了類似GPT-3這樣具備搜索屬性的文心一言。
華為的盤古大模型則更加專注于自己比較有優(yōu)勢(shì)的TO B業(yè)務(wù)。在發(fā)布會(huì)上,華為也表示,在過去的2022年,華為盤古大模型主要是AI for Industry(AI賦能產(chǎn)業(yè)),為煤礦、水泥、電力、金融、農(nóng)業(yè)等行業(yè)創(chuàng)造了更多產(chǎn)業(yè)價(jià)值,其中CV大模型早就有了許多用武之地。
比如在與能源公司合作的盤古礦山大模型案例中,礦井現(xiàn)場(chǎng)是一個(gè)40米長(zhǎng)的采掘機(jī),寬度僅2米左右,傳統(tǒng)相機(jī)很難一下子捕捉到全部畫面,只能用圖中的九宮格視頻畫面。而通過“5G+AI”全景視頻拼接綜采畫面卷,傳輸?shù)降孛?,地面工作人員將來可以實(shí)現(xiàn)地面控制機(jī)器進(jìn)行采礦,實(shí)現(xiàn)礦下無人、少人的安全作業(yè)。
但從目前國(guó)內(nèi)推出的幾款大模型產(chǎn)品來看,我們似乎仍在等待和尋找自己的“iPhone時(shí)刻”。即,無論是百度的文心一言、華為的盤古大模型,還是科大訊飛的訊飛星火,似乎仍停留在從自己原本的優(yōu)勢(shì)入手的“集大成者”,相對(duì)缺少更多的創(chuàng)新,也缺少對(duì)整個(gè)行業(yè)的顛覆性產(chǎn)品。這就導(dǎo)致,大模型的應(yīng)用,始終停留在“術(shù)”的層面而不能帶來整個(gè)技術(shù)生態(tài)的變革。
行業(yè)媒體在報(bào)告《ChatGPT浪潮下,看中國(guó)大語言模型產(chǎn)業(yè)發(fā)展》中討論過中外大模型研發(fā)的差距,其中,對(duì)百度等國(guó)內(nèi)大廠而言,在數(shù)據(jù)、算力、工程化能力等關(guān)鍵要素上存在短板,短期內(nèi)難以對(duì)國(guó)外領(lǐng)先大模型實(shí)現(xiàn)趕超,為跟隨者角色,長(zhǎng)期更需要國(guó)內(nèi)AI全產(chǎn)業(yè)鏈整體進(jìn)化。
要補(bǔ)充短板,一個(gè)重要的因素,就是人才。因此,大廠也都紛紛行動(dòng)起來。
BOSS直聘上,百度、騰訊、阿里、螞蟻集團(tuán)等紛紛發(fā)布了相關(guān)崗位的招聘信息。其中,百度以25~40k/月招聘AI大模型算法工程師、20~40k/月招聘模型構(gòu)架工程師;螞蟻集團(tuán)以45~75k/月招聘深度學(xué)習(xí)大模型GPT工程師;阿里以40~70k/月招聘大模型訓(xùn)練及算法工程師;騰訊則以30~60k/月招聘大模型預(yù)訓(xùn)練方向的工程師……
值得注意的是,這些崗位幾乎都在一日內(nèi)被回復(fù)了超過10次,負(fù)責(zé)招聘的聯(lián)絡(luò)人也幾乎都是“正在活躍”的狀態(tài)。由此可見,求職者對(duì)于大模型相關(guān)崗位充滿信心,且招聘者也正在如火如荼地爭(zhēng)奪人才。
而從脈脈發(fā)布的《趨勢(shì)報(bào)告》中可以看出,自O(shè)pen AI推出的2021年以來,對(duì)于AIGC相關(guān)的人才爭(zhēng)奪就已經(jīng)開始了。2021年1-2月,AIGC相關(guān)崗位招聘同比上升281.88%。
誠(chéng)然,人才的爭(zhēng)奪只是第一步。對(duì)不少大廠來說,積極投入研發(fā)的最終意義是賺錢。而大模型目前的商業(yè)化分成了C端與B端兩個(gè)路徑方向——對(duì)于C端來說,以GPT為例,通過開源方式將用戶和數(shù)據(jù)引進(jìn)來,再逐漸轉(zhuǎn)化成訂閱制;而就B端而言,比如Open AI與微軟Azure的合作,間接實(shí)現(xiàn)“模型即服務(wù)”,小B開發(fā)者可以調(diào)用其大模型API。
商業(yè)模式上,ChatGPT已經(jīng)明確指向API、訂閱制和戰(zhàn)略合作(嵌入微軟Bing、Office等軟件)3種營(yíng)收方式,且已在用戶數(shù)據(jù)積累、產(chǎn)品布局和生態(tài)建設(shè)層面充分領(lǐng)先;Google雖有意追趕,但由于聊天機(jī)器人這樣的產(chǎn)品形態(tài)對(duì)于其主營(yíng)的搜索引擎業(yè)務(wù)的助益有限,因此在與搜索引擎結(jié)合方面較為審慎,更希望借助大模型能力開展“模型即服務(wù)”范式,開拓其當(dāng)前市占率較低的云服務(wù)業(yè)務(wù)的市場(chǎng)空間。
國(guó)內(nèi)大廠也幾乎是在這兩條路上摸索。比如百度文心一言更傾向于C端市場(chǎng)的探索,而“文心千帆”產(chǎn)品則劍指B端市場(chǎng),意圖進(jìn)一步帶動(dòng)云服務(wù)營(yíng)收。
不過無論是靠哪一條“腿”走路,想要實(shí)現(xiàn)商業(yè)化,大模型產(chǎn)品仍需要解決幾個(gè)緊迫的問題。
比如,信息準(zhǔn)確性和版權(quán)。在目前大模型較多應(yīng)用的文字和圖形創(chuàng)作上,如何保證原創(chuàng)性也成了一個(gè)關(guān)鍵問題,這可能會(huì)牽扯原創(chuàng)的道德問題,以及更實(shí)際的,涉及版權(quán)的問題。
最重要的是,大模型是一個(gè)實(shí)打?qū)嵉模瑳]有終點(diǎn)的“吞金獸”。由于所需要的數(shù)據(jù)規(guī)模巨大,因此對(duì)算法、算力、數(shù)據(jù)存儲(chǔ)空間都有極大的要求,需要大量的資金。
當(dāng)大語言模型出現(xiàn)以后,云端就開始被開發(fā)出來,云端的競(jìng)爭(zhēng)將成為下一場(chǎng)互聯(lián)網(wǎng)競(jìng)爭(zhēng)的窗戶。
據(jù)網(wǎng)絡(luò)數(shù)據(jù)顯示,去年中國(guó)云計(jì)算市場(chǎng)同比增長(zhǎng)10%,前四大云計(jì)算廠商阿里云、華為云、騰訊云和百度智能云,合計(jì)增長(zhǎng)9%,占云服務(wù)客戶支出總額的79%。
對(duì)于應(yīng)用而言,“對(duì)話即平臺(tái)”成為現(xiàn)實(shí),對(duì)話可以解決多模態(tài)的問題。例如,把ChatGPT的API接上以后,大模型就可以畫圖、做平面設(shè)計(jì)、寫文案等等。
“算力是競(jìng)爭(zhēng)的基礎(chǔ)”,一個(gè)典型的例子是,作為算力基礎(chǔ)GPU的供應(yīng)商英偉達(dá),市值一度突破萬億美元。據(jù)估算,GPT-3的單次訓(xùn)練成本就高達(dá)140萬美元,對(duì)于一些更大的LLM(大型語言模型),訓(xùn)練成本介于200萬美元至1 200萬美元之間。在其中,大部分費(fèi)用是電費(fèi),計(jì)算機(jī)專家吳軍曾提到,“大概是3 000輛特斯拉的電動(dòng)汽車,每輛跑到20萬英里(約32.19萬公里),把它跑‘死’,這么大的耗電量,才夠ChatGPT訓(xùn)練一次”。
在如此高昂成本之下,各互聯(lián)網(wǎng)大廠也爭(zhēng)相入場(chǎng)。不可否認(rèn)的是,未來的互聯(lián)網(wǎng)競(jìng)爭(zhēng),幾乎都要建立在大模型基礎(chǔ)上。
很多人將現(xiàn)在比喻為大模型的戰(zhàn)國(guó)時(shí)代。
首先,各大廠商都在運(yùn)用自己的數(shù)據(jù)資產(chǎn)跑馬圈地。
比如騰訊提出不做非聊天式應(yīng)用,而是面向企業(yè)的行業(yè)大模型。實(shí)際上,在騰訊云公布行業(yè)大模型解決方案之前,各垂直領(lǐng)域的行業(yè)大模型早已被多家企業(yè)先后推出。騰訊不做通用的、聊天式的大模型,也是揚(yáng)長(zhǎng)避短。不過,從騰訊的企業(yè)特點(diǎn)上去推測(cè),或許很多人會(huì)覺得其做通用聊天更具優(yōu)勢(shì)。反而在行業(yè)大模型上,更多創(chuàng)業(yè)企業(yè)遠(yuǎn)比騰訊更處于細(xì)分行業(yè)一線,如推出自動(dòng)駕駛、醫(yī)療、地產(chǎn)、安全、智能物聯(lián)等行業(yè)大模型的諸多背后企業(yè)。
而美圖集中于視覺創(chuàng)作、商業(yè)攝影、專業(yè)視頻編輯、商業(yè)設(shè)計(jì)等領(lǐng)域,試圖將美圖需求從C端生活場(chǎng)景向B端生產(chǎn)力場(chǎng)景進(jìn)階,將AI與影像生產(chǎn)力工具緊密結(jié)合。
360也認(rèn)為GPT等通用大模型無法覆蓋世界上太多的領(lǐng)域,這也正是行業(yè)大模型的機(jī)遇所在,“百模大戰(zhàn)”最終比拼的將是各家應(yīng)用場(chǎng)景落地能力。
其次,大模型還在成長(zhǎng)初期,跑得快不代表跑得贏。
從目前來看,大模型從概念到落地的幾年中,各個(gè)層面不斷有突破。但大模型最終會(huì)成長(zhǎng)為什么樣子,至今沒有公論。在這個(gè)前提下,各大廠商都在自己的領(lǐng)域不斷探索,處在大模型的摸索和試錯(cuò)階段。這個(gè)階段的主要特質(zhì)就是,跑得快、跑得早的,不一定跑得到最后或者跑得贏。就如ChatGPT出來之前,大家印象中最深的還是數(shù)年之前的阿爾法狗一樣。而ChatGPT也并非大廠出來的產(chǎn)品。
某種意義上說,大模型的未來,需要喬布斯一樣的人,來給這個(gè)行業(yè)帶來顛覆性的改變。
在這點(diǎn)上,任何人都有機(jī)會(huì)。
大模型的應(yīng)用未來里面,提出問題比解決問題更體現(xiàn)人的能力。這也是科技引發(fā)的新一輪革命的前提。
發(fā)生在歐洲的第一次工業(yè)革命,助力英國(guó)工業(yè)制造及商業(yè)運(yùn)輸?shù)妊杆籴绕穑韲?guó)運(yùn)逆襲。發(fā)生在美國(guó)等國(guó)家的第二次工業(yè)革命浪潮,則誕生了通用電氣、福特汽車、AT&T等大批知名企業(yè)。
可見,時(shí)代浪潮越大,對(duì)企業(yè)、產(chǎn)業(yè)乃至國(guó)家實(shí)力躍遷的紅利也會(huì)更大。
無論是大模型在辦公場(chǎng)景的落地,還是此前掀起熱潮的ChatGPT形態(tài)的聊天機(jī)器人,這些都只是剛剛開始。比爾·蓋茨在《人工智能時(shí)代已經(jīng)開啟》中表示,自1980年首次看到圖形用戶界面以來,OpenAI的GPT人工智能模型是他所見過的最具革命性的技術(shù)進(jìn)步。王小川在用完ChatGPT之后,斷言“通用人工智能時(shí)代已經(jīng)到了”。這些稍顯激進(jìn)的判斷,都在極大地?cái)U(kuò)充大模型應(yīng)用的想象空間。
相關(guān)從業(yè)者表示,大模型將作為基礎(chǔ)平臺(tái)支持無數(shù)智能應(yīng)用。浪潮將催生三類機(jī)會(huì):一是原有產(chǎn)品因AI的加入變得能力更強(qiáng),好比電商因?yàn)榧尤胪扑]引擎而獲得突破;二是因新技術(shù)的產(chǎn)生,很多產(chǎn)品有機(jī)會(huì)重做一遍,類似于從PC到移動(dòng)互聯(lián)網(wǎng)的變化;三是更好的模型和更低的成本解鎖了全新場(chǎng)景,催生此前未曾想過的應(yīng)用。
目前,海外的應(yīng)用切入點(diǎn)主要分為幾類:以New Bing代表的下一代搜索,以Midjourney、Stability.AI為代表的AI繪畫,Runway所代表的視頻生成產(chǎn)品,Jasper.ai代表的行業(yè)工具。此外,代碼生成、個(gè)人助手、社交社區(qū)也是目前較受關(guān)注的應(yīng)用方向。
相比之下,國(guó)內(nèi)雖有各種嘗試,但標(biāo)志性的大模型應(yīng)用還在醞釀中。
現(xiàn)在是通用人工智能的奇點(diǎn)時(shí)刻,也是商業(yè)化應(yīng)用的前夜。AI大模型還沒有經(jīng)過大量的商業(yè)包裝和訓(xùn)練,需要從業(yè)者像園藝師一樣去修剪,形成符合行業(yè)規(guī)律的商業(yè)化產(chǎn)品。
大模型承載了很多期待。以困擾許多廠商的“標(biāo)準(zhǔn)化-定制化”平衡難題為例,在阿里云的設(shè)想中,預(yù)訓(xùn)練大模型帶來的新可能表現(xiàn)為,企業(yè)只需將數(shù)據(jù)放在專屬數(shù)據(jù)空間,用于大模型自動(dòng)學(xué)習(xí),然后就能生成企業(yè)專屬的大模型。
相比原本“什么都要從頭做”的業(yè)務(wù)模式,大模型提供了效率更高的選擇。
但這些變化目前還處于展望階段,依然有很多問題等待解答——應(yīng)用本身給客戶、用戶帶來的是顛覆性的體驗(yàn)升級(jí),還是只是疊加優(yōu)化?大模型成本高,在習(xí)慣了免費(fèi)或低價(jià)的競(jìng)爭(zhēng)環(huán)境里,To B應(yīng)用如何建立健康可持續(xù)的收入模式?要先“有”再“優(yōu)”,廠商自己乃至整個(gè)大模型生態(tài),需要進(jìn)一步突破的是什么?
種種問題,都需要一個(gè)成功的落地應(yīng)用來給出答案。