張嵐舒
2023年3月16日,OpenAI首席執(zhí)行官山姆·阿爾特曼在其個人社交平臺上發(fā)布GPT4多模態(tài)模型片段。
2022年11月30日,一款名為ChatGPT的應用程序橫空出世,上市五天后用戶即破百萬,僅用了兩個月時間便在全球收獲1億月度活躍用戶,取代TikTok(抖音國際版)成為史上增長最快的消費者應用程序,每天有超3000 萬人使用。與之對話的新奇體驗及其帶來的行業(yè)變革潛力更是持續(xù)引發(fā)熱議。ChatGPT何以成為現象級應用,又正在全世界刮起怎樣的風暴呢?
ChatGPT是由總部位于舊金山的初創(chuàng)公司 OpenAI 開發(fā)的一款聊天機器人,原理是基于“自回歸語言模型”(Auto-Regressive Language Model),即一種基于深度學習的自然語言處理(NLP)工具,用于生成自然語言文本。從語義上看,chat在英語里是“聊天”之意,GPT則是“Generative Pre-trained Transformer”(生成型預訓練變換模型)的縮寫,屬于一種基于互聯網可用數據訓練的文本生成深度學習模型。
ChatGPT是OpenAI開發(fā)的GPT系列模型中的GPT-3.5版本。這是一種參數上億的大模型,采用了RLHF(Reinforcement Learning from Human Feedback,人類反饋強化學習)技術用于模型訓練,加入了更多人工監(jiān)督對模型生成的結果進行大量微調。簡單來說,ChatGPT的誕生過程就像不斷在教一個基于深度神經網絡的機器大腦理解人類世界的知識和語言,并根據模型中已有的海量知識儲備生成合理內容,實現內容輸出與人互動的功能,又通過不斷對這些內容進行人工反饋校準,不斷提高內容呈現的質量和水準。4.0版本的ChatGPT支持圖像和文本輸入,能生成文本結果。ChatGPT就像一個能協(xié)助人類完成各種文本任務的“助手”,可以實現自動文本生成、自動問答、自動摘要,甚至具備編寫和調試計算機程序的能力。
ChatGPT表現出優(yōu)越的技術能力。在ChatGPT開放注冊前,市面上已有許多具備聊天回復功能的機器人工具,這類工具往往作為智能手機、電腦等智能設備的智能模塊,可以實現使用者與智能設備功能相匹配的指令需求。在設備本身的功能框架下,這類程序在需求識別方面具有比較大的局限性,比如車載設備往往只能實現駕駛情境下的各種應答需求,且應答較為程式化。而ChatGPT沒有設備框架限制,僅作為一個“幾乎裝載了整個世界的知識量”的大模型存在。
市面上的大模型動輒具有數百億、千億甚至萬億級的參數體量,ChatGPT的模型參數也超過了1750億。OpenAI使用了45TB的數據、近1萬億個單詞、10萬輪以上的人類反饋來訓練該模型。進入市面后,ChatGPT還通過搶先公測,收集了大量用戶的使用數據來不斷改進模型效果。最終,ChatGPT在驚人知識量、大量時間堆砌訓練、大量人力反饋修正以及優(yōu)越算法共同加持下,能準確識別用戶的廣域問題,為用戶提供十分人性化的答案,看上去比以往出現的各種問答程序都更加“聰明博學”,極大提升了用戶與人工智能互動的體驗感。ChatGPT甚至可以通過谷歌L3軟件工程師的入職面試,并在美國執(zhí)業(yè)醫(yī)師資格考試取得“合格”或“接近合格”的成績。因此,《紐約時報》稱其為“有史以來向公眾發(fā)布的最好的人工智能聊天機器人”。
ChatGPT擁有可觀的商業(yè)化前景。ChatGPT自推出以來就受到資本市場追捧。截至2023年2月8日,A股市場ChatGPT概念板塊在一周時間內上漲超過20%。這得益于其三類重要的商業(yè)化特質。一是輕量級。ChatGPT打破了以往“嵌入式”人工智能的框架感,直接回答、執(zhí)行文本任務的運行模式相對“單純”,從“付費享有回答”到“定制應答服務”,均沒有脫離輕量型的人工智能生成內容商業(yè)模式基礎。二是快傳播。ChatGPT一經推出即商業(yè)化,其新奇而豐富的使用感直接掀起以用戶為主體的體驗型宣傳分享熱潮,加之媒體持續(xù)關注和挖掘亮點,使其快速積累大規(guī)模用戶,變現前景越發(fā)可觀。三是易融合。ChatGPT對既有產品體現出很強的融合性和增益性。例如,可與聯網汽車、智能電視等智能設備結合,發(fā)揮更“聰明”和“人性化”的能力,滿足用戶更為多元的內容需求。ChatGPT既自成一派,又具備廣闊的融合賦能場景。以上三類屬性很好地迎合了“快商業(yè)化”的資本與市場需求。
科技行業(yè)已經歷了20多年的高速增長期,尤其是疫情以來,以Meta等為代表的大型科技公司紛紛擴展線上業(yè)務,布局具有新業(yè)態(tài)構想性特點的賽道。如今,隨著新冠疫情對線上業(yè)務限制的消退,以及通脹和經濟衰退預期的多重影響,科技行業(yè)正處于“回歸基礎型服務、剪裁概念型服務”和重視降本增效提升盈利的調整期。ChatGPT的技術鏈短,獲取直接收益快,其走紅凸顯人工智能領域基礎服務型產品的巨大價值和發(fā)展?jié)摿?,促使科技行業(yè)爭相布局類ChatGPT“實用”賽道。
本刊與百度“ 文心一言”的對話截屏。
在行業(yè)調整需求和現實成功案例的刺激下,科技巨頭紛紛加大對人工智能領域的投資,并呈現出三種傾向:第一類公司以微軟為代表,將類ChatGPT型產品應用作為原有產品賦能和“彎道超車”的抓手。ChatGPT已獲得微軟100億美元的投資,微軟已著手在其“必應”(BING)搜索引擎中加入聊天機器人的組件,內部版本正在測試。第二類公司以谷歌為代表,與微軟的“攻城”思路相反,其傳統(tǒng)搜索引擎優(yōu)勢業(yè)務面臨ChatGPT這種“代為搜索整合答案”的業(yè)務模式挑戰(zhàn)。為此,谷歌斥巨資應對,宣布將發(fā)布20種新的人工智能產品,同時正在測試一個名為“巴德”(Bard)的聊天機器人,以同ChatGPT一爭高下。第三類公司以Meta為代表,其在元宇宙業(yè)務受挫而ChatGPT應用走紅后,宣布2023年額外投入40億~50億美元,全部用于人工智能。此類企業(yè)試圖在現有業(yè)務增長與盈利雙重“鈍化”情況下,布局短平快技術賽道以為自身業(yè)務注入活力。
除美科技巨頭外,中國的百度、阿里、網易有道、360和韓國的互聯網巨頭“領航員”等也紛紛啟動類ChatGPT的產品開發(fā),加入“實用”賽道布局競爭。2023年3月16日,百度正式發(fā)布包括文學創(chuàng)作、商業(yè)文案創(chuàng)作、數理邏輯推算、中文理解、多模態(tài)生成等五大功能的“文心一言”(ERNIE Bot)。
從社會層面看,ChatGPT應用趨勢存在多種問題與風險。就技術本身的局限性而言,ChatGPT目前以一定時間點之前的知識集合作為訓練物料,仍存在知識滯后的時間差,還面臨訓練數據來源合規(guī)性、知識盲區(qū)等諸多問題,這些問題必然會使ChatGPT生成的內容存在偏差,提供的答案看似正確,實則經不起考證,使用者的現實工作可能會因此引入錯誤,甚至助力虛假信息傳播。
ChatGPT已經引發(fā)對于知識產權、學術剽竊的擔憂。ChatGPT生成的內容如被用于學術創(chuàng)作,可能會侵犯他人的著作權。同時,即便所引內容并非剽竊,人工智能生成內容被個人使用也存在知識產權爭議。為此,全球多家知名學術期刊發(fā)布規(guī)定,任何大型語言模型工具都不會被接受為署名作者。
從社會倫理的角度看,人們正在探討類ChatGPT應用的不斷進化是否會跳脫其生產工具屬性,占據人類的勞動價值空間。教師、記者、作家、法務、市場分析師、程序員、美工設計等數十種職業(yè)崗位被視為人工智能技術取代風險最高的工作類型。
從國家安全角度看,類ChatGPT應用可“以指定傾向為標準選擇訓練物料”等方式塑造輸出內容,因此有可能被用作意識形態(tài)和輿論宣傳工具。此類應用也被質疑存在收集用戶信息和隱私泄露的風險,給數據監(jiān)管帶來挑戰(zhàn)。
ChatGPT的爆火將加劇各國在革命性科技領域的競爭。一方面,ChatGPT的底層技術并不新,但組合效果驚人,反映了其背后算法或技術組合方式的優(yōu)越性。這實際是一種“技術+”的數字競爭路線,此類技術對更廣泛數字領域的賦能作用,將引領更多創(chuàng)新,成為驅動數字經濟新業(yè)態(tài)發(fā)展的動力。各國在看到ChatGPT迅速創(chuàng)造的技術效應和經濟前景后,必然加大在該領域的投入和布局。
另一方面,ChatGPT背后反映了一整套數據資源獲取、創(chuàng)造和應用的高效模式,在“數據即戰(zhàn)略資源”的今天,ChatGPT等現象級技術應用的發(fā)展差異也必將從數據實力起始,向著行業(yè)變革驅動力、價值觀傳播力、規(guī)則標準引領力、治理模式推廣力等諸多層面?zhèn)鲗?,對中美等國?zhàn)略博弈的走向產生影響。