陳徐毅
在優(yōu)勢與挑戰(zhàn)并存的同時,未來強人工智能技術(shù)走向?qū)⒏吤骼剩嘈鸥郃I產(chǎn)品將在新的消費級領(lǐng)域涌現(xiàn)。
2022年11月,人工智能對話機器人程序ChatGPT面世引起了外界廣泛關(guān)注,因其遠高于比過去同品程序的文本反饋能力以及在理解人類提問上的優(yōu)異表現(xiàn),業(yè)界將之視為當前強人工智能的代表作。不到兩個月里,ChatGPT用戶數(shù)激增過億,成為史上增長速度最快的消費級應用程序。這也是繼AlphaGo問世之后出現(xiàn)的第二次強人工智能熱潮。
ChatGPT的亮眼表現(xiàn)也牽動了行業(yè)科技巨頭紛紛入局,并引發(fā)新一輪的AI備戰(zhàn)升級。由于谷歌搜索業(yè)務被認為受ChatGPT影響最深,谷歌公司迫于壓力倉促推出其競品Bard(一款基于LaMDA語言模型的AI對話程序),卻因其首秀意外“翻車”而導致股價大跌。與ChatGPT研發(fā)機構(gòu)OpenAI早有投資關(guān)系的微軟則繼續(xù)跟進擴大投資,并高調(diào)宣布旗下搜索Bing引入ChatGPT。而國內(nèi)的百度、阿里也傳出正在研發(fā)類ChatGPT的項目,網(wǎng)易、科大訊飛、360等也在相關(guān)領(lǐng)域布局涉足類ChatGPT業(yè)務。
ChatGPT的由來
ChatGPT是由人工智能實驗室OpenAI開發(fā)的一款人工智能對話工具,作為深度學習的產(chǎn)物,該程序基于GPT-3架構(gòu)的自回歸語言模型進行強化巨量的文本學習訓練。由于是聊天機器人的產(chǎn)品形態(tài),ChatGPT仍以文本交互方式與終端使用者進行自然對話,但其功能遠比此前的一般聊天智能助理強大,能夠生成自動文本,應對復雜的文字工作,自動問答、生成和調(diào)試編程語言等等,應用廣泛。
人工智能實驗室OpenAI成立于2015年,是一個目前由非營利向盈利過渡的商業(yè)組織,其創(chuàng)始人埃隆·馬斯克和山姆·阿爾特曼創(chuàng)辦動機是出于對強人工智能潛在風險的擔憂。2016年OpenAI發(fā)布了機器學習公測平臺,此后每年花費高昂資金用于訓練,直至ChatGPT發(fā)布。
發(fā)布之初,ChatGPT的表現(xiàn)雖然亮眼但并非臻于完美,經(jīng)使用者大量測試發(fā)現(xiàn),一些專業(yè)領(lǐng)域知識給出的反饋仍存在事實準確性參差不齊的缺陷,其模型訓練結(jié)果被認為需要進一步校正。
強人工智能應用興起與現(xiàn)狀
這些年,人工智能領(lǐng)域的分支以人工神經(jīng)網(wǎng)絡(luò)為架構(gòu)的深度學習發(fā)展迅速,這主要得益于全球云計算市場膨脹、基礎(chǔ)設(shè)施數(shù)量逐年擴大帶來的算力資源總量的快速上升。深度學習有賴于并行分布式計算,而并行計算的技術(shù)路線是人工智能領(lǐng)域近十年來得以突破瓶頸和超越以往技術(shù)形態(tài)的業(yè)界共識。
在此共識之下的成果,ChatGPT這類文本應用只是其中之一,這兩年還有AI繪畫、AI音樂,甚至AI 3D建模的出現(xiàn),無不意味著有著推理和解決問題能力的強人工智能技術(shù)形態(tài)初現(xiàn)端倪。
比如2022年8月發(fā)布的文本生成圖像模型Stable Diffusion,它根據(jù)用戶給出的文字描述生成相應的圖像,也可以用于繪制和修補圖像。Stable Diffusion在一個公開的數(shù)據(jù)集LAION-5B上訓練模型,而LAION-5B至少包含了50億個圖像—文本數(shù)據(jù)對。除此之外,還有Disco Diffusion、Midjourney等AI繪畫工具也與之類似。
再比如可以從文本描述中生成高保真音樂的模型MusicLM。例如用戶輸入“一段吉他即興演奏搭配平靜的小提琴旋律”,MusicLM會將文本描述條件按過程和層次建立序列并建模任務,最終生成可長達幾分鐘的24kHz音頻文件。還有同樣出彩的AI 3D建模方面,但因過程復雜目前暫未出現(xiàn)以文字生成樣本的產(chǎn)品。
這些強人工智能工具由于訓練所用模型依賴海量互聯(lián)網(wǎng)已有數(shù)據(jù),也面臨著著作權(quán)爭議和道德倫理方面的負面影響。由AI侵權(quán)引發(fā)的版權(quán)訴訟案件正在逐年增加,不久前代碼自動生成工具Copilot侵權(quán)案尚未落定,ChatGPT在教育界又引起論文作弊與學術(shù)道德的爭議。
強人工智能產(chǎn)品市場格局和未來走向
業(yè)界在經(jīng)歷疫情蕭條期和元宇宙概念虛火之后,這種新形態(tài)的強人工智能產(chǎn)品落地確實給了市場一針強心,特別是2023年以來,人工智能概念板塊普遍景氣揚升。新的AI項目研發(fā)落地吸引著科技巨頭們紛紛入場布局,由于強人工智能項目研發(fā)所需投入的模型訓練經(jīng)費高昂,它們也急需盡快獲得大型科技公司的融資和算力資源的支持。比如2017年OpenAI僅在云計算資源上就花費790萬美元,占其總支出的四分之一;而AI繪圖Stable Diffusion在亞馬遜云計算平臺上訓練共15萬個GPU小時,花費成本60萬美元。
由于新的AI產(chǎn)品落地時間不長,強人工智能市場仍在初期形成當中,這一波由Copilot和ChatGPT兩種新的AI產(chǎn)品形態(tài)帶起的風口,在當前市場格局中走在最前面的仍然是微軟。微軟于2019年7月率先投資OpenAI 10億美元,為之提供Azure云的計算訓練資源,后續(xù)取得該技術(shù)的獨家授權(quán)。2023年初微軟跟進投資第二筆據(jù)報道為100億美元資金,隨后旋即宣布旗下Bing搜索引入ChatGPT,強調(diào)集成了AI的瀏覽器Edge+搜索Bing的全新產(chǎn)品矩陣,旨在對谷歌互聯(lián)網(wǎng)業(yè)務的彎道超車。
由此可見,當前強人工智能技術(shù)初級形態(tài)以及其所代表的種種落地產(chǎn)品,與上一代人工智能技術(shù)相較確實令該領(lǐng)域的發(fā)展耳目一新,但也存在明顯需要校正的算法缺陷,以及在涉及訓練源的版權(quán)、學術(shù)道德、網(wǎng)絡(luò)安全等方面的批評與風險。在優(yōu)勢與挑戰(zhàn)并存的同時,未來強人工智能技術(shù)走向?qū)⒏吤骼?,相信更多AI產(chǎn)品將在新的消費級領(lǐng)域涌現(xiàn)。