楊智杰
李笛。圖/受訪者提供
2023年,AI大模型無疑是國內(nèi)外科技領(lǐng)域最受關(guān)注的話題之一。ChatGPT大火,人們似乎看到通用人工智能的曙光。科技巨頭、創(chuàng)業(yè)者乃至各個(gè)行業(yè)紛紛推出自研大模型。據(jù)北京市科委等統(tǒng)計(jì),截至2023年10月,國內(nèi)大模型廠商及高校院所共計(jì)254家,上演“百模大戰(zhàn)”。
大模型熱潮中,小冰公司CEO李笛是一個(gè)特別的存在。小冰公司的前身是微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能小冰團(tuán)隊(duì),公司曾發(fā)布過AI聊天機(jī)器人“小冰”。因此,當(dāng)ChatGPT爆火時(shí),小冰很容易被當(dāng)作對比的對象。去年,接受《中國新聞周刊》在內(nèi)的媒體采訪時(shí),李笛都提到,他承認(rèn)大模型的進(jìn)步,但并非大模型的“門徒”。他認(rèn)為模型不用一味求大,更愿意談技術(shù)如何商業(yè)化應(yīng)用。
當(dāng)時(shí),李笛被看作是個(gè)“異類”。用他的話講,大模型最熱的時(shí)候,行業(yè)里不用“信仰”這個(gè)詞就落伍了。到了2024年,經(jīng)歷了卷百億甚至千億參數(shù)的競賽后,國內(nèi)大模型廠商逐漸務(wù)實(shí),落地應(yīng)用成為行業(yè)關(guān)注的焦點(diǎn)。日前,《中國新聞周刊》專訪小冰公司CEO李笛,他談起過去一年對大模型熱的感悟?,F(xiàn)在的他語氣輕松,李笛坦言,2023年他曾面臨極大壓力,甚至曾動(dòng)搖不“卷”大模型的想法。
創(chuàng)新和保守天然對立,科技行業(yè)的人非常害怕被認(rèn)為是保守的。但另一面,李笛從2013年加入小冰團(tuán)隊(duì),見證了人工智能領(lǐng)域發(fā)展的幾次浪潮,很多公司在風(fēng)口中迷失。對李笛的專訪,不只是在探討大模型,更是探討一個(gè)人面對巨大誘惑和時(shí)代焦慮時(shí),如何堅(jiān)持做自己。以下是李笛的自述。
我們是國內(nèi)較早接觸GPT大模型的一批人。2020年,小冰從微軟獨(dú)立出來前,我是微軟Bing搜索引擎亞洲區(qū)總經(jīng)理,微軟將ChatGPT放在搜索引擎中,推出New Bing,我們都較早地看過了。當(dāng)我們的興奮勁已經(jīng)過去時(shí),國內(nèi)才開始興奮。
因此,我們也更早意識(shí)到,大模型有一些問題。比如,目前從技術(shù)上判斷,要實(shí)現(xiàn)人工智能能力更大程度的飛躍,需要在GPT-4的基礎(chǔ)上,把參數(shù)規(guī)模再提升三個(gè)數(shù)量級(jí),但人們在短期內(nèi)無法解決算力的挑戰(zhàn)。此外,一味追求參數(shù)規(guī)模越來越大,并不會(huì)有新能力涌現(xiàn)。最近,行業(yè)里也有一些公司開始推出小模型。去年2月,我還判斷過,如何商業(yè)落地是大模型的核心問題。過了近一年,業(yè)內(nèi)越來越多開始討論大模型該如何應(yīng)用。
去年,我觀察到,國內(nèi)很多企業(yè)開始圍繞大模型進(jìn)行競賽,背后主要有三種考量。第一種是,GPT-4推出后,大模型沒有新能力的涌現(xiàn),像是卡在了紅綠燈路口,但很多人還要沖刺,因?yàn)樗麄兿胭€當(dāng)自己沖到紅綠燈路口時(shí),紅燈變綠,自己取得突破,領(lǐng)先行業(yè)。這一判斷確實(shí)存在一定概率,但大部分情況下,技術(shù)創(chuàng)新迭代并非一飛沖天,而是發(fā)展一波后被卡住,一段時(shí)間后再迎來一波創(chuàng)新。這才是科技史的常態(tài)。
其次,國內(nèi)現(xiàn)在有200多家大模型公司,其中很多并非傳統(tǒng)意義的人工智能公司,而是各個(gè)垂直領(lǐng)域的企業(yè),比如能源企業(yè)等。他們相信在掌握大模型技術(shù)后,能有機(jī)會(huì)打破該領(lǐng)域原有的競爭格局。這是因?yàn)榇竽P偷幕咎卣魇谴罅Τ銎孥E,準(zhǔn)入門檻低,可以很快看到一個(gè)結(jié)果,給了不同行業(yè)的人一個(gè)幻想。但深入后人們會(huì)發(fā)現(xiàn),結(jié)果不如想象中那么美好。
最后一種是,他們只是把大模型當(dāng)作一個(gè)概念,來獲得一個(gè)新的賣點(diǎn),就像是當(dāng)年的元宇宙。
我們觀察到了這些現(xiàn)象,所以,我不愿意說“信仰大模型”,大模型只是我們眾多技術(shù)迭代的一部分。去年年初,你說大模型的技術(shù)好,還是比較客觀的,但后來逐漸演變成,如果你不用“信仰”這個(gè)詞就落伍了。我記得當(dāng)時(shí)參加行業(yè)會(huì)議,在我前后演講的人講到大模型,都會(huì)提到“工業(yè)革命”。當(dāng)一個(gè)行業(yè)只有用這么夸張的表達(dá)才能證明不保守時(shí),就一定是個(gè)非常大的泡沫。我不想神話大模型,它是個(gè)有用的工具,解決了很多過去的問題,但它不是靈丹妙藥。
我現(xiàn)在說的時(shí)候放松多了,因?yàn)樾袠I(yè)現(xiàn)在開始有了這樣的共識(shí)。在人工智能領(lǐng)域,一直沒有產(chǎn)生真正成功的面向企業(yè)和消費(fèi)者的產(chǎn)品。2020年前,小冰還在微軟時(shí),不太受外界影響。但2020年,小冰從微軟分拆為獨(dú)立公司運(yùn)營,作為創(chuàng)業(yè)公司,我們還沒有能力決定自己的生存時(shí),如果跟行業(yè)主流有很大不同,會(huì)有很多人不認(rèn)同你。去年2月,就有投資人問我,你是不是反對大模型?有投資人甚至跟我說,小冰也要做超大規(guī)模的、超大參數(shù)的大模型,我也差點(diǎn)沒扛住。
外界對我們的誤解是,我們不做大模型。我們很早就在關(guān)注,而且一直深入其中。但我們不拼大參數(shù),更關(guān)注的是中等參數(shù)規(guī)模和小參數(shù)規(guī)模大模型的可用性。很早Google就發(fā)過論文稱,650億參數(shù)以下的模型,沒有產(chǎn)生明顯的思維鏈能力。我們當(dāng)時(shí)不這么認(rèn)為,現(xiàn)在回頭看,我們賭對了,參數(shù)在幾百億,甚至幾十億的大模型,也有這個(gè)能力。
AI少女小冰。圖/受訪者提供
和其他行業(yè)相比,科技行業(yè)有一個(gè)突出現(xiàn)象:科技行業(yè)的人非常害怕被認(rèn)為是保守的。在公開場合,當(dāng)我們對一個(gè)新技術(shù)、特別是像大模型這么亮眼的新技術(shù)發(fā)表評(píng)論時(shí),哪怕只是客觀評(píng)價(jià)說“大模型是好的,但它不是全部,它沒有把過去很多東西顛覆掉”,就已經(jīng)算是保守了。
我們在2013年組建小冰團(tuán)隊(duì),十年中,我們送走一波又一波風(fēng)口追逐者。從玩家角度,這一次國內(nèi)大模型的熱潮,活躍的多是近兩年成立人工智能企業(yè),因?yàn)楹芏喙径荚谶^去一波波風(fēng)口中迷失了。面對這種短期的熱潮,我們看似保守,但我們是目前為止存活最長的人工智能企業(yè)之一。從這一角度來看,我們被一些聲音質(zhì)疑為“AI舊世代”,也是一種“榮幸”。
在科技行業(yè)想要堅(jiān)持做一件事情,是非常奢侈的。因?yàn)橹袊目萍脊?,本質(zhì)上是由一級(jí)市場、二級(jí)市場“擊鼓傳花”來完成企業(yè)的基本輸血。很多公司及其投資人會(huì)把上市定義為最主要的目標(biāo)。如果公司不追風(fēng)口,就不能拿到下一筆融資,上一筆融資的投資人就沒辦法獲得更高的企業(yè)估值,也就沒有辦法跟LP(有限合伙人)交代。這也是人之常情,但這使得很多創(chuàng)業(yè)公司的戰(zhàn)略不得不走樣了。
前段時(shí)間,有消息稱,一個(gè)剛畢業(yè)的自然語言處理專業(yè)的博士生,年薪就有300萬元,這是不合理的,也會(huì)影響博士生的自我職業(yè)認(rèn)知。創(chuàng)業(yè)公司愿意給出這么高的薪酬,并不是因?yàn)樗麄兘o公司創(chuàng)造了價(jià)值,而是當(dāng)公司去拉投資時(shí),用以回復(fù)投資人關(guān)注的指標(biāo),比如公司有多少博士,或者有多少從Open AI出來的人。有些博士生在創(chuàng)業(yè)公司待了三個(gè)月,又被另一家公司以更高的薪酬挖走。博士生肯定是開心的,但他們在創(chuàng)業(yè)公司間不斷流轉(zhuǎn)時(shí),除了薪酬提升,沒有機(jī)會(huì)真正做有意義的研究。
你很難說這是投資人的問題,因?yàn)橥顿Y人要對LP負(fù)責(zé)。也很難說是LP的問題,因?yàn)樗麄兲湾X就是為了獲得回報(bào)。這似乎是一個(gè)沒有人錯(cuò)的事情,也是中國科技領(lǐng)域很難誕生原始創(chuàng)新的原因之一。
我們?nèi)ツ暌苍媾R很大的壓力。投資界在經(jīng)歷2022年巨大的失落情緒后迎來人工智能的浪潮,投資人看到了春天。去年,在人工智能行業(yè)里,固然有對大模型抱有熱情的人,他們往往是科研工作者。除此之外,更多科技公司表現(xiàn)出的是一種焦慮。就像應(yīng)試教育下的心態(tài),不能輸在起跑線上,盡管不知道它是什么,但總覺得錯(cuò)過一定會(huì)后悔。這種焦慮在行業(yè)內(nèi)傳遞,但創(chuàng)新很難在焦慮中產(chǎn)生。
我個(gè)人也特別希望出現(xiàn)一個(gè)大模型,和小冰的對話框連接后,所有對話的問題都能解決,這是我做夢都會(huì)笑醒的事情。但這很難實(shí)現(xiàn),背后還需要很多服務(wù)。這就像是個(gè)人電腦,不是說有一個(gè)CPU就得到了一切,還要有主板,CPU本身也是一個(gè)超級(jí)大規(guī)模的集成電路,需要各種模塊組合。
人工智能領(lǐng)域從來不缺很酷的東西。當(dāng)年,微軟利用人臉識(shí)別技術(shù)做了個(gè)應(yīng)用叫“How Old”,上傳一張照片,就能識(shí)別年齡,一時(shí)間風(fēng)靡。前一陣,機(jī)器人跳“科目三”也很酷。但真正缺的、值得我們重視的是商業(yè)模式的探索,究竟如何讓人們真正認(rèn)同人工智能的價(jià)值,并為之買單。
我有一個(gè)印象深刻的體會(huì),產(chǎn)品價(jià)值和技術(shù)不一定是息息相關(guān)的。比如有的機(jī)器人會(huì)跳舞,但人們玩膩了,就會(huì)把它忘掉。但你發(fā)現(xiàn),很多女生從小買的布娃娃,毫無科技含量,但她們對它傾注了巨大的情感,有人甚至在長大后會(huì)花1萬塊錢去修復(fù)兒時(shí)的“伙伴”。技術(shù)在其中不一定需要扮演什么角色。
今天,大家用大模型進(jìn)行很多輪對話。很多人都認(rèn)為,大模型要更智能、更聰明,像愛因斯坦一樣。但生活中,我們不總是因?yàn)橐粋€(gè)人足夠聰明,才會(huì)和對方交朋友。有的人可能笨笨的,但很善良,你就不把對方當(dāng)朋友嗎?人不是這樣的。那為什么我們在做科技產(chǎn)品時(shí),就一定認(rèn)為更先進(jìn)的技術(shù)會(huì)更好?不一定,關(guān)鍵是如何把它用在更合適的地方。
2024年,我預(yù)測人工智能行業(yè)發(fā)展會(huì)退熱,現(xiàn)在的大模型同質(zhì)化嚴(yán)重,市面上用不了這么多大模型。而且,用戶的付費(fèi)意愿又不是很容易建立。一些去年融到錢的企業(yè)也可能會(huì)引發(fā)新的內(nèi)卷,其實(shí)這些內(nèi)卷的行為已經(jīng)在發(fā)生了,只是在 2024 年可能會(huì)更明顯一些。