編譯 俞曉晴
經(jīng)過幾十年的蹣跚學(xué)步,機(jī)器人終于開始學(xué)習(xí)如何優(yōu)雅地行走、敏捷地奔跑和抓取物體了。這一最新進(jìn)展拉開了具有物理靈活性的人工智能時(shí)代的序幕。
小動(dòng)物們?cè)谝巴獗寂?,爬樹,即使摔倒了,也能從容地站起?lái)。和我們的靈長(zhǎng)類表親一樣,人類可以利用手指操控精細(xì)動(dòng)作,完成各種任務(wù),比如剝橘子或在漆黑的過道里摸鑰匙。雖然行走和抓取對(duì)許多生物來(lái)說都不是什么難事,但眾所周知,機(jī)器人在這方面的表現(xiàn)一直不盡如人意,包括步態(tài)運(yùn)動(dòng)和手的靈巧度,但現(xiàn)在一切都不同了。
近期,黃明博(Jemin Hwangbo)等人在《科學(xué)·機(jī)器人學(xué)》(Science Robotics)上發(fā)表論文給出了非常有意思的新證據(jù),證明運(yùn)用數(shù)據(jù)驅(qū)動(dòng)法設(shè)計(jì)的機(jī)器人軟件有望解決機(jī)器人和人工智能研究長(zhǎng)期面臨的一大挑戰(zhàn)——仿真-現(xiàn)實(shí)差距。幾十年來(lái),機(jī)器人專家一直通過基于預(yù)測(cè)性數(shù)學(xué)模型(也就是經(jīng)典控制論)的軟件引導(dǎo)機(jī)器人的肢體活動(dòng)。然而,這個(gè)方法在引導(dǎo)機(jī)器人行走、攀爬和抓取不同形狀的物體這類看似簡(jiǎn)單的任務(wù)時(shí),已被證明無(wú)效。
一個(gè)機(jī)器人的生命總是先從仿真開始。如果機(jī)器人的引導(dǎo)軟件在虛擬世界中表現(xiàn)良好,這個(gè)軟件就會(huì)被置入機(jī)器人體內(nèi),之后被應(yīng)用于物理世界。在物理世界中,機(jī)器人會(huì)不可避免地遇到無(wú)數(shù)難以預(yù)測(cè)的不規(guī)則內(nèi)容,包括表面摩擦力、結(jié)構(gòu)柔性、振動(dòng)、傳感器延遲和致動(dòng)器時(shí)控不佳(致動(dòng)器是將能源轉(zhuǎn)化為運(yùn)動(dòng)的設(shè)備)。不幸的是,這一連串棘手問題無(wú)法提前利用數(shù)學(xué)模型一一描述出來(lái)。因此,即使是在仿真環(huán)境中應(yīng)對(duì)自如的機(jī)器人,一旦在真實(shí)世界中遇到幾次看似很小的物理障礙后,也會(huì)開始跌跌撞撞起來(lái)。
黃明博等人演示了一種可以消除這種仿真-現(xiàn)實(shí)差距的方法——將經(jīng)典控制論與機(jī)器學(xué)習(xí)技術(shù)相結(jié)合。該團(tuán)隊(duì)首先設(shè)計(jì)了一個(gè)中型犬大小的四足機(jī)器人的傳統(tǒng)數(shù)學(xué)模型,這個(gè)機(jī)器人名為ANYmal。接下來(lái),他們從引導(dǎo)機(jī)器人肢體運(yùn)動(dòng)的致動(dòng)器中收集數(shù)據(jù),再將所得數(shù)據(jù)輸入多個(gè)名為神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)系統(tǒng),從而建立第二個(gè)模型。這個(gè)新模型可以自動(dòng)預(yù)測(cè)AMYmal機(jī)器人肢體的特殊運(yùn)動(dòng)。最后,團(tuán)隊(duì)將經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)插入第一個(gè)模型中,并在一臺(tái)標(biāo)準(zhǔn)臺(tái)式電腦上仿真運(yùn)行這個(gè)混合模型。
這種混合仿真器比基于分析模型的仿真器速度更快,也更準(zhǔn)確。更重要的是,先將一種運(yùn)動(dòng)策略在混合仿真器中加以優(yōu)化,再轉(zhuǎn)入機(jī)器人體內(nèi)到現(xiàn)實(shí)世界中測(cè)試,最后機(jī)器人的表現(xiàn)和與仿真表現(xiàn)一樣成功。這項(xiàng)姍姍來(lái)遲的重要突破預(yù)示著看似不可逾越的仿真-現(xiàn)實(shí)差距是時(shí)候畫上句號(hào)了。
黃明博等人使用的方法提示了機(jī)器人領(lǐng)域的新一輪重大變革,而混合模型正是這場(chǎng)變革的第一步。下一步則是要讓所有分析模型都下崗,代之以通過機(jī)器人在現(xiàn)實(shí)環(huán)境中收集到的數(shù)據(jù)進(jìn)行訓(xùn)練的機(jī)器學(xué)習(xí)模型。這類純數(shù)據(jù)方法也被稱為端到端訓(xùn)練(end-to-end training)越來(lái)越被青睞,創(chuàng)新應(yīng)用也是層出不窮,如關(guān)節(jié)式機(jī)械臂、多指機(jī)械手、無(wú)人機(jī),甚至是無(wú)人駕駛汽車。
就目前來(lái)說,機(jī)器人專家仍在努力抓住計(jì)算速度加快、傳感器數(shù)據(jù)增多、機(jī)器學(xué)習(xí)算法質(zhì)量提高所釋放的巨大潛能。對(duì)于大學(xué)是否應(yīng)該停止教授經(jīng)典控制論,現(xiàn)在還不好說。但這一天遲早會(huì)來(lái):將來(lái)的機(jī)器人專家無(wú)需告訴機(jī)器人如何學(xué)走路,而是讓機(jī)器人利用自身收集得來(lái)的數(shù)據(jù)進(jìn)行自我學(xué)習(xí)。
當(dāng)然,還有許多挑戰(zhàn)有待解決,首要的一個(gè)就是可擴(kuò)展性。目前,端到端訓(xùn)練已被應(yīng)用于致動(dòng)器數(shù)量較少的實(shí)體機(jī)器人。致動(dòng)器越少,描述機(jī)器人運(yùn)動(dòng)所需參數(shù)就越少,模型也就越簡(jiǎn)單。此外,在通往可擴(kuò)展性的路上,可能還要使用層次更為分明的模塊化機(jī)器學(xué)習(xí)架構(gòu)。還需開展進(jìn)一步的研究,以確定端到端控制是否可以擴(kuò)展用于引導(dǎo)擁有幾十個(gè)致動(dòng)器的復(fù)雜機(jī)器,如類人機(jī)器人,或是制造工廠和智能城市這類大型系統(tǒng),智能城市特指利用數(shù)字技術(shù)提高市民生活質(zhì)量的城市地區(qū)。
另一個(gè)挑戰(zhàn)技術(shù)含量略低,但因人而異。對(duì)于一些研究人員來(lái)說,從相對(duì)簡(jiǎn)單的數(shù)學(xué)模型向“黑箱”機(jī)器學(xué)習(xí)系統(tǒng)轉(zhuǎn)變,無(wú)異于朝著內(nèi)部工作方式未知的方向前進(jìn),這不僅意味著失去內(nèi)部洞察,還會(huì)讓他們感到喪失了掌控力。不過,對(duì)一般人來(lái)說,看著機(jī)器人像孩子一樣學(xué)步是一件很有滿足感的事。
黃明博團(tuán)隊(duì)帶來(lái)的認(rèn)知突破還可以放在人類思想這個(gè)神秘的概念之下審視一番。迄今為止,意識(shí)仍是洞悉人類本質(zhì)征程上的一大未解之謎。根據(jù)經(jīng)驗(yàn),人類自己對(duì)自我意識(shí)的定義太過含糊,對(duì)機(jī)器人軟件的開發(fā)幾乎不具有任何實(shí)際價(jià)值。也許我們應(yīng)該反其道而行之,在機(jī)器人軟件的研究中汲取靈感,破解有關(guān)人類思想的古老問題。
我們可以推測(cè),自我意識(shí)以及更廣泛意義上的知覺,其本質(zhì)就是自我抽象思考能力的一個(gè)象征,這種能力也是一種自模擬能力。筆者認(rèn)為,一個(gè)人能預(yù)見的未來(lái)越遠(yuǎn)、他們腦中對(duì)未來(lái)行動(dòng)的圖像越清晰,這個(gè)人的自我意識(shí)能力也就越高。如今,機(jī)器人已經(jīng)可以學(xué)習(xí)自模擬了。這次的突破不僅是一次具有實(shí)際意義的進(jìn)步,讓一些工程性勞動(dòng)得以解放,它還標(biāo)志著機(jī)器人自主時(shí)代的開啟。