邱強
近年來,隨著科學技術(shù)的發(fā)展,各種人工智能和機器人的消息開始霸占各類媒體的頭條:AlphaGo以60∶0的成績戰(zhàn)勝人類頂尖圍棋選手,波士頓動力發(fā)布最新機器人Handle,百度機器人在《最強大腦》中連勝人類選手……
我們不禁開始擔心,機器人是否會忽然覺醒并反抗人類?就連著名物理學家霍金也曾多次發(fā)出警告:人工智能在發(fā)展到一定程度之后,很可能會通過核戰(zhàn)爭或是生物戰(zhàn)爭摧毀人類。說到人工智能消滅人類的話題,我們不得不提《終結(jié)者》系列電影。導演詹姆斯·卡梅隆用兩部經(jīng)典科幻電影為我們描述了人工智能“天網(wǎng)”覺醒并統(tǒng)治人類的末日圖景。那么,現(xiàn)實中我們離曾經(jīng)的經(jīng)典影片幻想又有多遠呢?
誕生與覺醒
在首部《終結(jié)者》電影中,全球高級計算機控制系統(tǒng)“天網(wǎng)”于公元1997年7月3日獲得了武器的控制權(quán)限,并產(chǎn)生了自我意識?!疤炀W(wǎng)”將人類視為威脅自己生存的敵人,于是它發(fā)起了核戰(zhàn)爭,殺死了數(shù)十億人。剩下的人類在約翰·康納的領(lǐng)導下,與“天網(wǎng)”制造的終結(jié)者T-600機器人作戰(zhàn),并逐步扭轉(zhuǎn)戰(zhàn)局。為了挽回敗局,“天網(wǎng)”制造出時間機器,將終結(jié)者T-800機器人送回到1984年,讓其在約翰出生前殺死約翰的母親莎拉·康納。同時,約翰也派出人類戰(zhàn)士凱爾回到過去阻止T-800。最終,莎拉用液壓機消滅了T-800,她與凱爾的孩子——約翰·康納——也順利出生。
受限于當時的特效技術(shù),第一部《終結(jié)者》只能采用逐幀拍攝的方法展現(xiàn)T-800機器人,卡梅隆所設(shè)想的液體機器人也沒能在首部電影中出場。但是,T-800受傷后露出的金屬骨骼與電子眼睛已經(jīng)成了不少人的童年陰影(誒?可我覺得很酷?。?。
從液態(tài)金屬到最強機器人
在《終結(jié)者2:審判日》中,“天網(wǎng)”繼續(xù)派出更高級的液態(tài)機器人T-1000回到1995年,去刺殺只有10歲的小約翰。T-1000采用液態(tài)金屬制造,可以自由變換形體,能抵抗絕大部分物理攻擊。為了阻止T-1000,人類將一臺捕獲的T-800重新編程,并送回過去。在經(jīng)歷了與T-1000危險緊張的追殺之后,約翰與莎拉終于相信T-800不再是11年前那個狠辣無情的魔鬼終結(jié)者。為了改變?nèi)祟惖拿\,約翰、莎拉和T-800找到了“天網(wǎng)”系統(tǒng)的開發(fā)者——塞伯公司的技術(shù)總監(jiān)莫爾斯戴森,讓其銷毀了一切有關(guān)“天網(wǎng)”的資料,并將T-1000終結(jié)在煉鋼廠的高溫鐵水中。為了徹底銷毀來自未來的資料,以防人類重新造出“天網(wǎng)”,T-800做出了犧牲自己的選擇,自沉鋼水之中毀滅。
《終結(jié)者2:審判日》在繼承首部《終結(jié)者》的經(jīng)典立意的同時,也增添了更加華麗的特效,即使是現(xiàn)在看來,《終結(jié)者2:審判日》中液態(tài)機器人T-1000的特效也一點不過時。而影片中T-800與小約翰的互動也為其增添了不少人情味,讓T-800在約翰心中樹立了一個類似父親的形象。影片最后,T-800的一句“我現(xiàn)在知道你們?yōu)槭裁磿蘖?,但那是我永遠做不到的事”也戳中了無數(shù)觀眾的淚點。
而之后的幾部終結(jié)者影片雖然沒能超越《終結(jié)者2》,但也算是不錯的商業(yè)電影。尤其是第三部中的T-X女性終結(jié)者,具有直接操控其他機器的能力,更是成了最強“終結(jié)者”。
勝負難分的現(xiàn)實PK
雖然電影中的“審判之日”(1997年)早已過去,但近年來不斷霸占熱門頭條的人工智能機器人新聞,讓我們不得不時刻擔心《終結(jié)者》所描述的場景是否真的會發(fā)生?在這個科技大爆炸的時代,我們離電影中的人形機器人還有多遠?
硬件材料
首先是機器人硬件,這主要涉及制造機器人所用的材料、機器人的結(jié)構(gòu)等。我們先來看看終結(jié)者們的情況:第一部開頭出現(xiàn)的T-600具有跟人類完全相同的自由度配置,骨架為超合金,外表是裸露的金屬或者覆蓋以容易被人識別的塑料皮膚;T-800則采用活性皮膚組織,具有跟人類完全相同的外表,同時配備可以連續(xù)工作120年的核反應(yīng)燃料電池;T-1000和T-X則采用液態(tài)金屬,能夠隨意變換外形。
現(xiàn)實中的機器人呢?波士頓動力制造的Atlas具有與人類相似的自由度配置;日本東京大學的Kenshiro機器人則模仿人類采用人工肌肉作為驅(qū)動方式;日本產(chǎn)綜研的HRP-4C則采用硅膠皮膚,擁有與人類相似的外表。但是,在能源方面,現(xiàn)實機器人跟終結(jié)者們的差距就很大了,如波士頓動力的Handle機器人充滿電后,只能行駛約24km。而在液態(tài)金屬方面,雖然清華大學一課題組發(fā)明了可以控制變形的“液態(tài)金屬軟體機器”,但這只是進行簡單的定向形變,離做成機器人還有非常遠的距離,更別說在其中放入控制電路了。
因此從硬件角度上看,我們現(xiàn)實中的機器人技術(shù)大約相當于T-600。
感知能力
其次,讓我們對比一下機器人的感知能力。感知是指機器人了解環(huán)境與自身狀態(tài)的過程,包括用于獲取信號的傳感器與從信號中獲取信息的信息處理算法。
當然,這里我們并不清楚終結(jié)者們到底安裝了哪些傳感器,所以簡單進行一個猜測:聽覺傳感器(可以聽到聲音)、多光譜高分辨率相機(能夠夜視、放大等)、關(guān)節(jié)力矩傳感器(可以感受到別人觸碰自己)。由于現(xiàn)在的機器人實驗室基本不差錢,所以,在安裝傳感器方面,現(xiàn)實中的機器人并不比終結(jié)者們差:佩戴的麥克風可以聽取聲音,各種高精度相機、紅外相機、深度相機、激光雷達可以作為機器人的眼睛,部分機器人也安裝了高精度的力矩傳感器。
但是,在信號處理方面,現(xiàn)實中的機器人就遠遠比不上終結(jié)者們了——
物體識別:雖然現(xiàn)在的深度學習算法大大提高了機器人識別物體的能力,但依舊做不到像T-800那樣在酒吧中迅速找到和定位莎拉·康納;
語義理解:終結(jié)者們可以跟人類無障礙交流,而我們現(xiàn)在最強的聊天機器人才剛剛通過圖靈測試;
環(huán)境理解:終結(jié)者們可以在從未見過的1984年街道上四處奔走,而我們現(xiàn)在的機器人只能在某些特定條件下,利用前期建立的地圖進行定位導航。
因此,在感知方面,現(xiàn)在的機器人還未達到終結(jié)者們的水平,但是,隨著深度學習理論的發(fā)展與應(yīng)用,這個領(lǐng)域有望在十年內(nèi)出現(xiàn)可以使用的技術(shù)。
規(guī)劃算法
再來看看規(guī)劃算法,規(guī)劃是指根據(jù)給定的任務(wù)和機器人當前狀態(tài),計算出完成這個任務(wù)的方法。包括且不限于任務(wù)規(guī)劃、運動規(guī)劃和路徑規(guī)劃。
任務(wù)規(guī)劃是指機器人將任務(wù)劃分為幾個可以具體操作的子任務(wù)。舉個“栗子”,我們想讓機器人送瓶飲料,那么機器人會將這個大任務(wù)分解成幾個子任務(wù):“運動到冰箱前→打開冰箱→找到飲料→取出飲料→關(guān)上冰箱→送到人面前”。
當然,可以有更復雜的任務(wù)。目前,一般是采用馬爾科夫決策過程來描述問題,然后用各種規(guī)劃算法求解??傮w上說,現(xiàn)在的任務(wù)規(guī)劃強烈依賴于任務(wù)描述方式,而且在應(yīng)對大規(guī)模、不完全可觀等復雜問題時,還沒有可靠的方法。與之對應(yīng),“天網(wǎng)”只需給T-800下達“殺死莎拉·康納”的任務(wù),他就能自動將其分解成“尋找電話簿→找到名字為莎拉·康納的人→到這個人家→殺死她→確認任務(wù)是否完成”,如果發(fā)現(xiàn)殺錯了人,會立即重新計算出完成任務(wù)的方法。
運動規(guī)劃是指要完成某個子任務(wù),機器人每個關(guān)節(jié)的具體運動方式。舉個“栗子”,機器人面前有一杯水,讓機器人將手運動到杯子面前,同時不能碰到桌子等障礙物。是的,現(xiàn)在就連讓機器人拿起面前的杯子這樣的問題也還沒有完全解決。簡而言之,我們一般是采用基于隨機采樣的算法進行運動規(guī)劃的,隨機采樣的意思就是:每次規(guī)劃的結(jié)果可能不同,更無法保證規(guī)劃出的路徑是最優(yōu)的。而在終結(jié)者上就完全沒有這個問題,施瓦辛格飾演的T-800在給槍上膛時,動作干脆,沒有任何多余動作!
路徑規(guī)劃其實跟運動規(guī)劃類似,不過傾向于為移動機器人規(guī)劃行駛軌跡。Google的無人駕駛汽車已經(jīng)在城市道路和高速路上行駛超過200公里,但是我們現(xiàn)在無人車路徑規(guī)劃還必須依賴于事先建立的地圖。而終結(jié)者則可以在任何環(huán)境中快速移動,直到將獵物終結(jié)為止。
在規(guī)劃方面,現(xiàn)實中的機器人可以說是剛剛起步,機器人沒法脫離人類的指導完成任務(wù),所以,在機器人的規(guī)劃算法達到終結(jié)者的水平之前,我們完全不必擔心太多。
模仿人類的超強控制
當然,要想執(zhí)行規(guī)劃的動作,就涉及機器人控制領(lǐng)域了,從底層的電機控制到上層的機器人全身控制都屬于這個范疇。我們不清楚T-800的控制是怎么做的,但看他可以到處跑、跳,基本可以確定現(xiàn)在的機器人控制技術(shù)還沒有達到這個水平 ——
機械臂控制:大約10年前,德國宇航局的Sami Haddadin已經(jīng)可以讓機械臂拿著一把小刀刺向自己而不會造成傷害。這是因為他對機械臂進行了精確地建模與控制,讓小刀在剛接觸到人體的時候終止運動。
機械手操作:機械手的抓取操作問題就沒這么簡單了,因為其中涉及實際物理環(huán)境的建模問題,由于摩擦力和碰撞模型不精確,所以完全基于模型的方法很難解決這一問題。目前工業(yè)應(yīng)用基本還是采用平行夾持器的方式。只有一些研究機構(gòu)在進行靈巧手抓取方面的研究。
足式機器人控制:機械臂至少得有個相對固定的基座,但足式機器人的基座則會隨著接觸發(fā)生變化。雖然很難,但波士頓動力這個逆天的公司還是做出了不錯的足式機器人。可以說波士頓動力以一己之力將人類的足式機器人控制水平拉高了一個層次。
其余能力,艱難成長
再來看看機器人的容錯能力。在《終結(jié)者》系列電影中,T-800全身浸入煉鋼爐后,依舊能豎起大拇指與小約翰告別;T-1000受液氮冷卻發(fā)生故障后,還能碾壓T-800;T-X只剩下一半身子還能爬行著追殺約翰。可見,終結(jié)者系列機器人在機體發(fā)生大規(guī)模破損的情況下還可以繼續(xù)工作,具有強大的容錯能力。
與此相反,現(xiàn)實中的機器人就脆弱多了,即使巴黎索邦大學的研究者們仿造動物發(fā)明了一種自適應(yīng)控制算法,也只能應(yīng)對機器人非關(guān)鍵部位損壞的情況。也就是說,以目前機器人技術(shù)水平而言,我們用普通的手槍即可讓大部分機器人失去行動能力。
最后,來看看學習能力。我們知道,機器學習分為監(jiān)督學習、無監(jiān)督學習和強化學習三類,深度學習主要在監(jiān)督學習方面得到了很好的應(yīng)用;此外,對于強化學習,也逐漸以深度學習的形式出現(xiàn);但無監(jiān)督學習并沒有什么太好的方法。與之相反,T-800在電影中能學習微笑,正得益于其超強的學習能力。而他能根據(jù)數(shù)據(jù)庫中的人體解剖信息,習得如何高效獵殺,說明他已經(jīng)具有了較強的無監(jiān)督學習能力。
結(jié)語
強大的學習能力讓我們能夠面對不斷變化的環(huán)境,機器人如果不能掌握學習的能力,也很難在未來的環(huán)境變化中存活下去。總體上看,現(xiàn)實世界中的機器人還遠未達到能夠統(tǒng)治人類的水平。當然,我們也應(yīng)該從《終結(jié)者》中吸取經(jīng)驗,將機器人的應(yīng)用更加嚴格地限制在提高人類社會生產(chǎn)力的用途上。