當(dāng)前人工智能的一個(gè)困境是處理“部分與整體”之間的關(guān)系。一個(gè)人工智能系統(tǒng)的創(chuàng)建需要依賴有效的算法,但往往只有將系統(tǒng)建立好之后,我們才能知道具體需要哪些核心算法。為了解決這個(gè)“雞和蛋”的問題,必須同時(shí)研究?jī)烧摺T谶@個(gè)過程大量探索可能不會(huì)有結(jié)果,但這又是不可避免的。
近日,人工智能公司開設(shè)的首個(gè)非英國(guó)研究實(shí)驗(yàn)室,發(fā)表了一篇題為《為了AI研究的阿爾伯塔計(jì)劃》的文章,并提交在arXiv上。該篇文章的三位作者里奇·薩頓、邁克爾·鮑林和帕特里克·皮拉爾斯基,是Deep Mind Alberta的領(lǐng)導(dǎo)者,并都在加拿大阿爾伯塔大學(xué)擔(dān)任教授職位。
本次DeepMind Alberta將其人工智能研究方法,稱為阿爾伯塔計(jì)劃。
它主要針對(duì)未來5年~10年計(jì)算智能的基本理解問題,旨在填補(bǔ)目前研究的空白領(lǐng)域,并不關(guān)注現(xiàn)有方法的立即應(yīng)用。
文章主要對(duì)該機(jī)構(gòu)的人工智能愿景和這些愿景可能實(shí)現(xiàn)的方向,以及將探索的研究問題和項(xiàng)目進(jìn)行了說明。雖然這些愿景還有著不確定性,但研究人員盡可能具體地描繪了未來的道路。
按照阿爾伯塔計(jì)劃,研究人員試圖理解和創(chuàng)造一個(gè)富有生命力的計(jì)算代理。該文章還提到,代理的初始設(shè)計(jì)往往盡可能簡(jiǎn)單,且具有通用性和可擴(kuò)展能力。但它們?cè)诓粩嗯c外界交互過程中,逐漸變得復(fù)雜。
從左至右分別為里奇·薩頓、邁克爾·鮑林和帕特里克·皮拉爾斯基
為了適應(yīng)世界的變化,它們必須持續(xù)學(xué)習(xí),用一個(gè)“博學(xué)”的模式來做理解和規(guī)劃。文章中還提到:“智能是一段時(shí)間內(nèi)的信號(hào)處理?!?/p>
該研究愿景的第一個(gè)特點(diǎn)是強(qiáng)調(diào)普通經(jīng)驗(yàn),而不是特殊培訓(xùn)集或人力干預(yù)。盡管有許多方法可以使用人為輸入和領(lǐng)域知識(shí)來提高人工智能的性能,但這些方法通常不能適應(yīng)計(jì)算資源,因此并不是本次研究的優(yōu)先事項(xiàng)。
第二個(gè)顯著特征可以概括為時(shí)間一致性。這意味著關(guān)于在代理上運(yùn)行算法的所有時(shí)間都是相同的。時(shí)間統(tǒng)一問題涉及非平穩(wěn)、持續(xù)的環(huán)境與學(xué)習(xí)算法。
保持所有東西在時(shí)間上的統(tǒng)一可以減少自由度,并縮小代理設(shè)計(jì)空間。不過,文章也提到,在某些情況下,最好是背離絕對(duì)的時(shí)間一致性。但當(dāng)這樣做的時(shí)候,可能會(huì)脫離原來的研究領(lǐng)域。
研究愿景的第三個(gè)顯著特征體現(xiàn)在它對(duì)計(jì)算因素的考慮。
目前,計(jì)算機(jī)的能力雖然仍呈指數(shù)級(jí)增長(zhǎng),但并不會(huì)永遠(yuǎn)持續(xù)下去。計(jì)算能力越強(qiáng),有效地使用它越就顯得重要。因?yàn)檫@是決定代理績(jī)效的重要因素。
此外,計(jì)算方面的考慮還體現(xiàn)在智能代理設(shè)計(jì)的各個(gè)方面。例如,通常一個(gè)智能代理能夠?qū)ζ溆^察結(jié)果的變化做出快速反應(yīng)是很重要的。但是,考慮到計(jì)算的限制,反應(yīng)時(shí)間和決策質(zhì)量之間總是存在權(quán)衡。
研究愿景的第四個(gè)顯著特點(diǎn)是,它包括一個(gè)聚焦環(huán)境中含有其他智能代理的特殊情況。
在這種情況下,主要代理可以學(xué)會(huì)與環(huán)境溝通、合作和競(jìng)爭(zhēng),并能認(rèn)識(shí)到環(huán)境可能對(duì)其行為做出不同的反應(yīng)。這個(gè)案例被研究為人機(jī)交互的一個(gè)子領(lǐng)域智能放大。
阿爾伯塔計(jì)劃將人工智能問題描述為通過持續(xù)地感知和行動(dòng)、有限的計(jì)算,在其他代理存在的情況下,在線最大化獎(jiǎng)勵(lì)。這種描述可能看起來很合理,但它與當(dāng)前的實(shí)踐相反。
現(xiàn)實(shí)中,通常集中于離線學(xué)習(xí)、準(zhǔn)備好的訓(xùn)練集、人工輔助和無限計(jì)算。所以以上研究愿景既是經(jīng)典的,也是逆向的,甚至是激進(jìn)的。
本次提到的研究計(jì)劃更多是為了就現(xiàn)有的工作達(dá)成共識(shí),從而能進(jìn)行更有效地溝通和合作。
值得一提的是,研究團(tuán)隊(duì)主要圍繞基礎(chǔ)代理進(jìn)行設(shè)計(jì),其本身是基于“智能代理的通用模型”,該模型也被認(rèn)為是人工智能、神經(jīng)科學(xué)等多領(lǐng)域的共同模型。如上圖所示。
基本代理有4個(gè)主要的內(nèi)部組件,分別是“感知、反應(yīng)性策略、過渡模型和價(jià)值函數(shù)”。它們也由感知組件構(gòu)造的狀態(tài)信號(hào)相互連接。所有四個(gè)組件都是通過在前臺(tái)運(yùn)行的學(xué)習(xí)過程來做更新。
最后,文章中還描述了人工智能原型的路線圖,總共涉及12個(gè)步驟。從開發(fā)核心能力(表示、預(yù)測(cè)、規(guī)劃和控制)的新算法,到將這些算法結(jié)合起來,為連續(xù)的、基于模型的人工智能生成完整的原型系統(tǒng)。
對(duì)計(jì)算智能的理解,或會(huì)影響到社會(huì)每一個(gè)角落,包括每個(gè)人的生活。盡管它有被濫用的可能性,但其存在總體上將對(duì)世界有利。
研究團(tuán)隊(duì)還在文章中表示,阿爾伯塔計(jì)劃具有臨時(shí)、草稿性質(zhì),未來或會(huì)繼續(xù)完善編輯它們。特別是最后的步驟還不夠具體,隨著不斷地研究,該部分會(huì)取得更多進(jìn)展。同時(shí),他們也正在考慮關(guān)于智能放大和機(jī)器人技術(shù)的研究。