張明惠
如今作詩(shī)AI的祖先是打卡機(jī)、緩慢行動(dòng)的機(jī)器人和神一般的游戲引擎。
1958年冬天,30歲的心理學(xué)家弗蘭克 · 羅森布拉特(Frank Rosenblatt)正從康奈爾大學(xué)前往華盛頓特區(qū)海軍研究辦公室,途中他與一位記者喝了杯咖啡。在計(jì)算機(jī)剛剛興起的年代,羅森布拉特宣布了一項(xiàng)了不起的發(fā)明,引起了不小的轟動(dòng)。他宣稱,這是“第一臺(tái)能夠產(chǎn)生自己想法的機(jī)器”。
羅森布拉特的智慧結(jié)晶叫作“感知器”(Perceptron)。感知器是一個(gè)受人類神經(jīng)元啟發(fā)的程序,運(yùn)行在一臺(tái)最先進(jìn)的計(jì)算機(jī)上,而這臺(tái)計(jì)算機(jī)是一個(gè)5噸重的IBM大型機(jī),大小相當(dāng)于一面墻。給感知器插入一堆穿孔卡片,它就能學(xué)會(huì)區(qū)分左邊和右邊的卡片。拋開(kāi)任務(wù)的簡(jiǎn)單性不談,至少這臺(tái)機(jī)器能夠?qū)W習(xí)。
羅森布拉特認(rèn)為這是一道新時(shí)代的曙光,《紐約客》雜志顯然也同意這一點(diǎn)。該雜志的記者寫(xiě)道:“它是人類大腦第一個(gè)真正的對(duì)手?!倍?dāng)被問(wèn)及感知器不能做什么時(shí),羅森布拉特提到了愛(ài)、希望和絕望。他說(shuō):“簡(jiǎn)而言之,就是人性。如果我們都不了解人類的性欲,為什么還要指望機(jī)器去了解呢?”
感知器是第一個(gè)神經(jīng)網(wǎng)絡(luò),是現(xiàn)代人工智能(AI)背后更為復(fù)雜的“深度”神經(jīng)網(wǎng)絡(luò)的初級(jí)版本。但近70年過(guò)去了,人類大腦仍然沒(méi)有真正的對(duì)手。倫敦阿蘭 · 圖靈研究所首席科學(xué)家馬克 · 吉羅拉米(Mark Girolami)教授說(shuō):“我們?nèi)缃瘾@得的是‘人工鸚鵡,這本身就是一個(gè)了不起的進(jìn)步,它將為我們提供造福人類的偉大工具,但我們不用妄自菲薄?!?/p>
至少今天看來(lái),在人工智能的歷史上并不缺少鼻祖,歷史上許多人都有同樣的發(fā)現(xiàn)。例如有人稱羅森布拉特被稱為“深度學(xué)習(xí)之父”,而這一稱號(hào)同屬其他三人。阿蘭 · 圖靈是布萊切利公園的戰(zhàn)時(shí)密碼破譯員和計(jì)算機(jī)科學(xué)的創(chuàng)始人,人們稱他為人工智能之父。同時(shí),對(duì)于計(jì)算機(jī)能夠思考這一觀點(diǎn),他也是第一個(gè)認(rèn)真對(duì)待的人。
在1948年的報(bào)告《智能機(jī)器》中,圖靈研究了機(jī)器如何模仿智能行為。他認(rèn)為,要想讓機(jī)器會(huì)思考,有個(gè)方法是用機(jī)械取代人的各個(gè)部分:用攝像頭代替眼睛,用麥克風(fēng)代替耳朵,以及嵌入“電子腦”。圖靈調(diào)侃道,為了讓機(jī)器自己發(fā)現(xiàn)問(wèn)題,應(yīng)該讓它在鄉(xiāng)間漫游,但他又指出這種想法將對(duì)普通公民造成嚴(yán)重影響,因此實(shí)踐起來(lái)進(jìn)程緩慢,不切實(shí)際。
但圖靈的許多想法卻一直延續(xù)至今。他說(shuō),機(jī)器可以像小孩子一樣,在獎(jiǎng)懲機(jī)制的幫助下學(xué)習(xí)。有些機(jī)器可以通過(guò)重寫(xiě)自己的代碼來(lái)修正自己。如今,機(jī)器學(xué)習(xí)、獎(jiǎng)勵(lì)和修改已成為人工智能的基本概念。
圖靈提出了“模仿游戲”,俗稱“圖靈測(cè)試”,是衡量機(jī)器思維進(jìn)展的一種方法,這取決于人類能否分辨出書(shū)面交流是來(lái)自人類還是機(jī)器。
這是一項(xiàng)巧妙的測(cè)試,但為了通過(guò)這個(gè)測(cè)試所做出的努力卻造成了巨大的混亂。在最近的一次測(cè)試中,研究人員稱一個(gè)聊天機(jī)器人通過(guò)了測(cè)試。這個(gè)聊天機(jī)器人自稱是一個(gè)13歲的烏克蘭人,養(yǎng)了一只會(huì)唱貝多芬《歡樂(lè)頌》的寵物豚鼠。
吉羅拉米說(shuō),圖靈對(duì)人工智能的另一項(xiàng)重大貢獻(xiàn)往往被忽視。在布萊切利公園工作時(shí)期,圖靈的一篇解密論文揭示了他是如何利用一種名為貝葉斯統(tǒng)計(jì)的方法來(lái)解碼加密信息的。他和他的團(tuán)隊(duì)逐字逐句地使用統(tǒng)計(jì)方法來(lái)回答以下的問(wèn)題。例如,這個(gè)德語(yǔ)單詞產(chǎn)生這組加密字母的概率是多少。
現(xiàn)在,類似貝葉斯的方法為生成式人工智能程序提供了動(dòng)力,使其能夠生成從未存在過(guò)的文章、藝術(shù)作品和人物形象。吉羅拉米說(shuō):“在過(guò)去的70年里,貝葉斯統(tǒng)計(jì)一直在平行宇宙中進(jìn)行,這使得我們?nèi)缃窨吹降纳墒饺斯ぶ悄芡耆蔀榭赡埽覀兛梢詫⑵湟恢弊匪莸綀D靈的加密工作?!?/p>
“人工智能”一詞直到1955年才出現(xiàn)。新罕布什爾州達(dá)特茅斯學(xué)院的計(jì)算機(jī)科學(xué)家約翰 · 麥卡錫(John McCarthy)在一份暑期學(xué)校的提案中使用了這個(gè)詞,而且對(duì)其發(fā)展的前景極為樂(lè)觀。
他寫(xiě)道:“我們認(rèn)為,如果精心挑選一組科學(xué)家,讓他們用一個(gè)暑假的時(shí)間共同研究,人工智能就能取得重大發(fā)展?!?/p>
劍橋大學(xué)人工智能倫理學(xué)副教授喬尼 · 潘(Jonnie Penn)博士說(shuō):“如今正處戰(zhàn)后時(shí)期,而美國(guó)政府認(rèn)為核武器贏得了戰(zhàn)爭(zhēng),因此,科學(xué)和技術(shù)不可能更上一層樓?!?/p>
不幸的是,這些研究取得的進(jìn)步微乎其微,但研究人員仍然選擇投身于構(gòu)建程序和傳感器的黃金時(shí)代。這些程序和傳感器使計(jì)算機(jī)能夠感知環(huán)境并做出反應(yīng),解決問(wèn)題,規(guī)劃任務(wù),而且能使用人類語(yǔ)言。
在笨重的顯像管顯示器上,計(jì)算機(jī)化的機(jī)器人執(zhí)行著用平白的英語(yǔ)描述的命令,而實(shí)驗(yàn)室里展示的機(jī)器人則只能拖著疲憊的身軀撞擊辦公桌和文件柜。1970年,麻省理工學(xué)院的馬文 · 明斯基(Marvin Minsky)在接受《生活》雜志采訪時(shí)說(shuō),3到8年后,世界上將會(huì)出現(xiàn)一臺(tái)具有普通人一般智力的機(jī)器。它將能夠閱讀莎士比亞作品、給汽車加油、講笑話、玩辦公室政治游戲,甚至還能打架。通過(guò)自學(xué),幾個(gè)月后它的能力不可估量。
然而,幻想在20世紀(jì)70年代就破滅了。英國(guó)著名數(shù)學(xué)家詹姆斯 · 萊特希爾爵士(Sir James Lighthill)撰寫(xiě)了一份尖刻的報(bào)告,指出人工智能發(fā)展進(jìn)程甚微,并要求立即削減研發(fā)資金。
但科學(xué)家將知識(shí)視為突破發(fā)展瓶頸的方法,因此人工智能又隨之迎來(lái)了復(fù)興。他們旨在將人類的專業(yè)知識(shí)直接編碼到計(jì)算機(jī)中。最為雄心勃勃的是Cyc項(xiàng)目,它旨在掌握受過(guò)教育的人在日常生活中使用的所有知識(shí)。這意味著需要大量地編碼,但要讓專家解釋他們?nèi)绾巫龀鰶Q定,并將信息編碼到計(jì)算機(jī)中。結(jié)果,這種做法比科學(xué)家想象的要難得多。
發(fā)展到20世紀(jì),人工智能確實(shí)取得了顯著的成就。1997年,IBM的“深藍(lán)”擊敗了國(guó)際象棋大師加里 · 卡斯帕羅夫(Garry Kasparov)。這場(chǎng)比賽成為全球頭條新聞,《新聞周刊》雜志稱其為“人類大腦的最后一搏”。
在一場(chǎng)比賽中,“深藍(lán)”每秒能掃描2億個(gè)位置,并提前預(yù)判近80個(gè)落子動(dòng)作??ㄋ古亮_夫在回憶比賽時(shí)說(shuō),這臺(tái)機(jī)器“落子如有神”。
馬修 · 瓊斯(Matthew Jones)是普林斯頓大學(xué)的歷史學(xué)教授,同時(shí)也是《2023年數(shù)據(jù)是如何產(chǎn)生的》一書(shū)的合著者。他認(rèn)為,從某種意義上說(shuō),這是更傳統(tǒng)的人工智能模式的最后一搏。
現(xiàn)實(shí)世界中的情況更加混亂,因?yàn)橐?guī)則不明確,信息缺失。會(huì)下棋的人工智能無(wú)法將其任務(wù)轉(zhuǎn)換為規(guī)劃你的一天、打掃房間或駕駛汽車。謝菲爾德大學(xué)機(jī)器學(xué)習(xí)負(fù)責(zé)人埃萊尼 · 瓦西拉基(Eleni Vasilaki)教授說(shuō):“國(guó)際象棋并不是人工智能的最佳準(zhǔn)入門(mén)檻?!?/p>
自“深藍(lán)”以來(lái),人工智能領(lǐng)域最引人注目的飛躍來(lái)自一種完全不同的方法,這種方法可以追溯到羅森布拉特和他的卡片分類感知器?;诟兄鞯暮?jiǎn)單單層神經(jīng)網(wǎng)絡(luò)并沒(méi)有太大作用,它們所能實(shí)現(xiàn)的功能存在根本上的限制。研究人員知道,多層神經(jīng)網(wǎng)絡(luò)將更加有效。但由于計(jì)算機(jī)能力不足,研究人員也不知道如何對(duì)其進(jìn)行訓(xùn)練,多層神經(jīng)網(wǎng)絡(luò)便無(wú)從談起。
1986年,卡內(nèi)基梅隆大學(xué)的杰弗里 · 辛頓(Geoffrey Hinton)等研究人員開(kāi)發(fā)出“反向傳播”技術(shù)。該技術(shù)作為網(wǎng)絡(luò)教學(xué)的一種方法,使得人工智能取得了突破性進(jìn)步。如今,不再是單個(gè)“神經(jīng)元”與相鄰的“神經(jīng)元”進(jìn)行交流,而是整個(gè)神經(jīng)層之間可以相互交流。
假設(shè)你建立了一個(gè)神經(jīng)網(wǎng)絡(luò),可以將小貓和小狗的圖像進(jìn)行分類。這些圖像由網(wǎng)絡(luò)的不同層輸入和處理,再由每一層檢視不同的特征。這些特征可能是邊緣和輪廓,也可能是毛發(fā)和臉部,然后將輸出結(jié)果發(fā)送給下一層。在最后一層,神經(jīng)網(wǎng)絡(luò)計(jì)算出圖像是貓或狗的概率。但假設(shè)神經(jīng)網(wǎng)絡(luò)弄錯(cuò)了:羅孚絕不會(huì)在脖子上掛一個(gè)鈴鐺!你可以計(jì)算出誤差的大小,然后通過(guò)網(wǎng)絡(luò)倒推,調(diào)整神經(jīng)元的權(quán)重值(基本上就是網(wǎng)絡(luò)連接的強(qiáng)度)來(lái)減少誤差。這個(gè)過(guò)程不斷重復(fù),而這也就是神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方式。
這一突破使神經(jīng)網(wǎng)絡(luò)再次成為人們關(guān)注的焦點(diǎn),但研究人員卻再次因缺乏計(jì)算能力和數(shù)據(jù)而受挫。在千禧年代,這種情況發(fā)生了轉(zhuǎn)變,因?yàn)楦鼜?qiáng)大的處理器出現(xiàn)了,特別是用于視頻游戲的圖形處理器,以及充斥著文字、圖像和音頻的互聯(lián)網(wǎng)所帶來(lái)的海量數(shù)據(jù)。2012年,科學(xué)家證明了構(gòu)建“深度”神經(jīng)網(wǎng)絡(luò)(具有大量層級(jí)的網(wǎng)絡(luò))的巨大威力。ImageNet挑戰(zhàn)賽是一項(xiàng)讓人工智能挑戰(zhàn)從數(shù)百萬(wàn)數(shù)據(jù)庫(kù)中識(shí)別圖像的國(guó)際競(jìng)賽。在該挑戰(zhàn)賽上,AlexNet擊敗了對(duì)手。
愛(ài)丁堡大學(xué)自然語(yǔ)言處理專家米瑞拉 · 拉帕塔(Mirella Lapata)教授說(shuō):“AlexNet給大家上了一課,讓人們知道規(guī)模真的很重要?!比藗?cè)?jīng)認(rèn)為,如果我們能把我們所知道的關(guān)于某項(xiàng)任務(wù)的知識(shí)輸入計(jì)算機(jī),那么計(jì)算機(jī)就能完成這項(xiàng)任務(wù)。但現(xiàn)在的想法已經(jīng)發(fā)生了轉(zhuǎn)變,因?yàn)橛?jì)算和尺度比人類知識(shí)重要得多?!?/p>
在AlexNet之后,人工智能領(lǐng)域的發(fā)展迅速。谷歌的DeepMind公司成立于2010年,以解決智能問(wèn)題為己任。該公司推出了一種從頭開(kāi)始玩雅達(dá)利經(jīng)典游戲的算法。“突圍”游戲要求玩家砸穿通道一側(cè)的墻壁,然后把球送入后方的空間。Deepmind公司通過(guò)反復(fù)試驗(yàn),發(fā)現(xiàn)了如何在該游戲中取得勝利。DeepMind的另一個(gè)算法AlphaGo在圍棋比賽中擊敗了世界冠軍李世石。此后,該公司又發(fā)布了AlphaFold。在了解了蛋白質(zhì)形狀與其化學(xué)構(gòu)成的關(guān)系后,AlphaFold又預(yù)測(cè)了2億種蛋白質(zhì)的三維結(jié)構(gòu),幾乎涵蓋了科學(xué)界已知的所有蛋白質(zhì)。如今,這些三維結(jié)構(gòu)正在推動(dòng)醫(yī)學(xué)科學(xué)的新浪潮。
深度學(xué)習(xí)革命制造了大量的頭條新聞,但這些新聞現(xiàn)在看起來(lái)就像生成式人工智能掀起浪潮前的小小漣漪。以2022年發(fā)布的OpenAI的ChatGPT為例,這些功能強(qiáng)大的新工具因其生成能力而得名,它可以生成論文、詩(shī)歌、求職信、藝術(shù)作品、電影和古典音樂(lè)等。
生成式人工智能的核心引擎被稱為轉(zhuǎn)換器,它由谷歌研究人員開(kāi)發(fā),最初是為了改進(jìn)翻譯。在2017年的一篇論文中,人們對(duì)其進(jìn)行了描述,論文標(biāo)題“只需關(guān)注”(Attention Is All You Need)借用了披頭士的名曲。即使是它的作者似乎也低估了它將產(chǎn)生的影響。
利昂 · 瓊斯(Llion Jones)是該論文的合著者之一,也是論文標(biāo)題的撰寫(xiě)者。他已經(jīng)離開(kāi)谷歌,與他人共同創(chuàng)辦了一家新公司——薩卡納人工智能公司。在東京的辦公室里,他正在進(jìn)行一項(xiàng)新的轉(zhuǎn)換器實(shí)驗(yàn),對(duì)論文的受歡迎程度進(jìn)行了反思。他說(shuō):“我們確實(shí)認(rèn)為自己創(chuàng)造的是一種非常通用的東西,它并不是專門(mén)用來(lái)做翻譯的。但我們不曾想過(guò)它會(huì)如此普遍,能夠接管一切?,F(xiàn)在幾乎所有都在轉(zhuǎn)換器上運(yùn)行?!?/p>
在轉(zhuǎn)換器出現(xiàn)之前,人工智能驅(qū)動(dòng)的翻譯通常是通過(guò)逐個(gè)單詞處理句子來(lái)學(xué)習(xí)語(yǔ)言。這種方法有其缺點(diǎn),因?yàn)橐来翁幚韱卧~的速度很慢,而且對(duì)長(zhǎng)句的處理效果也不好。當(dāng)處理到最后一個(gè)單詞時(shí),前面的單詞已經(jīng)被遺忘了。轉(zhuǎn)換器通過(guò)一種名為“注意”的過(guò)程來(lái)解決這些問(wèn)題。它允許網(wǎng)絡(luò)同時(shí)處理句子中的所有單詞,并根據(jù)單詞的語(yǔ)境理解每個(gè)單詞。
OpenAI的生成式預(yù)訓(xùn)練轉(zhuǎn)換器GPT和類似的大型語(yǔ)言模型盡管并不總是完全可靠,但卻可以生成長(zhǎng)篇流暢的文本段落。通過(guò)對(duì)海量數(shù)據(jù)(包括互聯(lián)網(wǎng)上的大部分文本)的訓(xùn)練,它們可以學(xué)習(xí)到以前的算法無(wú)法識(shí)別的語(yǔ)言特征。
也許最引人注目也最令人興奮的是,轉(zhuǎn)換器可以勝任各種任務(wù)。一旦它掌握了所輸入數(shù)據(jù)(音樂(lè)、視頻、圖像和語(yǔ)音)的特征,這些特征就能促使它創(chuàng)造出更多的數(shù)據(jù)。無(wú)需通過(guò)不同的神經(jīng)網(wǎng)絡(luò),轉(zhuǎn)換器就可以處理所有不同的媒體。
邁克爾 · 沃爾德里奇(Michael Wooldridge)是牛津大學(xué)計(jì)算機(jī)科學(xué)教授,同時(shí)著有《通往有意識(shí)機(jī)器之路》(The Road to Conscious Machines)一書(shū)。他說(shuō):“這是一個(gè)進(jìn)步,是一個(gè)真正的技術(shù)分水嶺。顯然,谷歌沒(méi)有發(fā)現(xiàn)這一潛力。如果他們知道這將是迄今最具影響力的人工智能發(fā)展,我很難相信他們會(huì)發(fā)表這篇論文?!?/p>
沃爾德里奇認(rèn)為,轉(zhuǎn)換器網(wǎng)絡(luò)可應(yīng)用于閉路電視,在犯罪行為發(fā)生時(shí)記錄下來(lái)。他說(shuō):“我們將進(jìn)入一個(gè)生成式人工智能的世界,貓王和巴迪 · 霍利(Buddy Holly)將死而復(fù)生。如果你是原版《星際迷航》系列的粉絲,生成式人工智能會(huì)根據(jù)你的喜好創(chuàng)造出無(wú)限劇集,而且對(duì)白聽(tīng)起來(lái)就像威廉 · 夏特納(William Shatner)和倫納德 · 尼莫伊(Leonard Nimoy)的原聲,根本分辨不出其中的差別?!?/p>
但革命是有代價(jià)的。訓(xùn)練像ChatGPT這樣的模型需要巨大的計(jì)算能力,而且碳排放量也很高。佩恩說(shuō):“生成式人工智能讓我們與氣候危機(jī)相碰撞。與其過(guò)度設(shè)計(jì)我們的社會(huì),讓它時(shí)時(shí)刻刻都運(yùn)行在人工智能上,不如把它應(yīng)用在有用的領(lǐng)域,不要把時(shí)間浪費(fèi)在沒(méi)用的地方?!?/p>