機(jī)器人作為AI的伴生品得到了飛速的發(fā)展,短短幾年,智能機(jī)器人從蹣跚學(xué)步到勝任工作,成為社會(huì)的一分子。近日,在2018雷克大會(huì)上,英特爾中國研究院機(jī)器人交互實(shí)驗(yàn)室研發(fā)總監(jiān)任海兵表示,目前的人工智能技術(shù)對(duì)于服務(wù)機(jī)器人仍然遠(yuǎn)遠(yuǎn)不夠。人工智能技術(shù)與智能交互算法相結(jié)合才是突破技術(shù)問題的解決方案。人工智能不確定、不認(rèn)識(shí)、缺乏知識(shí)的問題,通過智能交互的提問、移動(dòng)和操作幫助它進(jìn)行學(xué)習(xí)并改正問題,從而真正達(dá)到進(jìn)入家庭的標(biāo)準(zhǔn)。
當(dāng)前的人工智能技術(shù)無法滿足
服務(wù)機(jī)器人的落地應(yīng)用
如果想要多功能服務(wù)機(jī)器人能夠在5到10年內(nèi)廣泛進(jìn)入人們的生活,服務(wù)機(jī)器人必須能夠滿足以下幾點(diǎn)要素:1.低成本;2.為人們提供多種有用的服務(wù),幫助人們解決實(shí)際生活中需要和重要的事情;3.有良好、易用的機(jī)器人交互(Human Robot Interaction), 并且由于機(jī)器人在實(shí)際生活中總會(huì)面對(duì)新的情況,需要有自適應(yīng)學(xué)習(xí)的能力進(jìn)行自我完善;4.安全性。
在生活中,機(jī)器人擁有眾多應(yīng)用的可能性。比如,它們可以幫助人們接待客人,提醒人們重要的事情,幫助人們拍照片、選視角,聊天,做教練,陪孩子一起學(xué)習(xí)、下棋……其中一個(gè)很重要的應(yīng)用是對(duì)老人的看護(hù),對(duì)老人進(jìn)行情感關(guān)懷、日常聊天、緊急情況監(jiān)控等。
然而,經(jīng)過對(duì)以上應(yīng)用的分析可以發(fā)現(xiàn),目前的人工智能算法距離這些應(yīng)用還有一定的差距。這些應(yīng)用要求我們的算法能夠達(dá)到基本上百分之百的正確率。目前深度學(xué)習(xí)算法的神經(jīng)網(wǎng)絡(luò)已經(jīng)達(dá)到一千多層,但仍然存在不確定性。更糟糕的是,有的時(shí)候算法出錯(cuò)了但不知道自己出錯(cuò)了。此外,家庭中常會(huì)出現(xiàn)新的物體、新的任務(wù)。由于目前深度學(xué)習(xí)模型參數(shù)都是基于大數(shù)據(jù)學(xué)習(xí)出來的,而新的物品只有很少量的數(shù)據(jù),如何利用很少量的數(shù)據(jù)來訓(xùn)練深度學(xué)習(xí)模型參數(shù)是具有挑戰(zhàn)性的研究課題。同時(shí),因?yàn)樗惴ǘ际怯蓴?shù)據(jù)驅(qū)動(dòng)的,是從大數(shù)據(jù)中學(xué)習(xí)的,所以它缺乏常識(shí)性、個(gè)人個(gè)性化的知識(shí)。因此,我們認(rèn)為,目前的人工智能技術(shù)對(duì)于服務(wù)機(jī)器人仍然是遠(yuǎn)遠(yuǎn)不夠的,這也是服務(wù)機(jī)器人尚不能進(jìn)入家庭的重要原因。
自適應(yīng)機(jī)器人交互是服務(wù)機(jī)器人
需要突破的關(guān)鍵技術(shù)
人工智能技術(shù)與智能交互算法相結(jié)合是英特爾中國突破上述技術(shù)問題的解決方案。人工智能不確定、不認(rèn)識(shí)、缺乏知識(shí)的問題,通過智能交互進(jìn)行自主學(xué)習(xí),并改正問題,從而真正達(dá)到進(jìn)入家庭的標(biāo)準(zhǔn)。
英特爾中國正在做三個(gè)方面自適應(yīng)機(jī)器人交互方面的研究:第一,自適應(yīng)對(duì)人的理解。其中包括自適應(yīng)對(duì)人的身份的驗(yàn)證、自適應(yīng)對(duì)人的情感的學(xué)習(xí)以及對(duì)人的意圖的理解。第二,對(duì)環(huán)境的理解。其中包括對(duì)新的物品的檢測(cè)、分割以及對(duì)整個(gè)場(chǎng)景的理解。第三,知識(shí)圖譜。包括個(gè)性化的知識(shí)和常識(shí)性的知識(shí)。我們還會(huì)把機(jī)器人感知到的所有知識(shí)全部輸入到知識(shí)圖譜里?;谶@些知識(shí)機(jī)器人可以做出更高層次的推理,解決上述的不確定性問題。
我們利用機(jī)器人進(jìn)行觀察和交互更新它的模型,從而不斷提高算法的魯棒性。為了達(dá)到這個(gè)目的,英特爾提出了一個(gè)“置信度估計(jì)”的概念。通過置信度估計(jì),機(jī)器人能夠知道算法輸出的結(jié)果是否可靠。如果可靠,即可正式采用這個(gè)結(jié)果。如果不可靠,則需要主動(dòng)交互來進(jìn)行確認(rèn)。而對(duì)于新的物體,則要利用小數(shù)據(jù)的學(xué)習(xí),即少量樣本的學(xué)習(xí),從而優(yōu)化模型,認(rèn)識(shí)物體。然后在后續(xù)的過程中,采取一些算法來收集高質(zhì)量的樣本,從而進(jìn)一步提高算法的魯棒性。對(duì)于知識(shí)圖譜,是通過利用知識(shí)圖譜自動(dòng)更新,比如增加個(gè)人知識(shí)圖譜,將符號(hào)方法和統(tǒng)計(jì)方法結(jié)合,從而解決知識(shí)不足的問題。
自適應(yīng)機(jī)器人交互能力一:自適應(yīng)特定人識(shí)別
對(duì)于自適應(yīng)機(jī)器人的特定人物識(shí)別,首先可以利用多模態(tài)融合,將聲紋、人臉、人體信息等進(jìn)行融合。基于深度學(xué)習(xí)和傳統(tǒng)學(xué)習(xí)方法,通過對(duì)人的持續(xù)觀察來更新模型。然后對(duì)于每一個(gè)模態(tài)都估計(jì)它的置信度。在做多模態(tài)融合時(shí),與一般的固定融合不同,英特爾采用的融合會(huì)根據(jù)當(dāng)前的狀態(tài)和置信度自適應(yīng)地完成。而模態(tài)準(zhǔn)確度的提高則需要一些正確、高質(zhì)量的樣本,利用英特爾中國研究院提出智能算法來評(píng)估樣本質(zhì)量,自動(dòng)收集這些高質(zhì)量樣本,自適應(yīng)優(yōu)化模型參數(shù),使它的準(zhǔn)確度越來越高。
自適應(yīng)機(jī)器人交互能力二:知識(shí)圖譜及其自動(dòng)更新
知識(shí)圖譜包括常識(shí)知識(shí)圖譜和個(gè)人知識(shí)譜圖。機(jī)器人在和人的日常交互過程中可以通過直接語音交互以及對(duì)人和環(huán)境的視覺觀察進(jìn)行信息收集和更新。這些信息不僅包含物體的時(shí)空信息,還包含物體之間的相互關(guān)系。此外,機(jī)器人很重要的一個(gè)功能就是知識(shí)校驗(yàn)。通過知識(shí)校驗(yàn),機(jī)器人可以判斷其收集到的信息是否正確,以處理知識(shí)沖突問題,例如個(gè)人知識(shí)圖譜與常識(shí)的沖突。
自適應(yīng)機(jī)器人交互能力三:自適應(yīng)物體識(shí)別
自適應(yīng)的物體識(shí)別包含通用物體識(shí)別和個(gè)性化物體定制識(shí)別。通常的物體檢測(cè)和識(shí)別分類器都是利用大數(shù)據(jù)來訓(xùn)練模型參數(shù)。但是現(xiàn)在新物體層出不窮,而且物體的外觀形狀也日新月異,在家庭環(huán)境中這些物體只有很少量的樣本,無法進(jìn)行通用的模型參數(shù)訓(xùn)練。那么最佳的解決方法就是通過少量的樣本,甚至一個(gè)樣本,就能夠進(jìn)行在線學(xué)習(xí)。此外,可以學(xué)習(xí)新的物體類別或?qū)嵗?,通過對(duì)物體的持續(xù)觀察來更新模型。對(duì)物體的屬性進(jìn)行估計(jì),比如物體的形狀、材質(zhì)、剛性或是可折疊、顏色,這對(duì)于后續(xù)過程中對(duì)這個(gè)估計(jì)物體檢測(cè)結(jié)果的置信度有很重要的作用。
英特爾中國有一個(gè)很重要的工作就是自適應(yīng)的情緒、意圖識(shí)別。這與目前很多人在做的表情識(shí)別存在一定的不同,英特爾希望不僅能知道人的表情,也能把人的表情和一些事件結(jié)合起來,知道某一些事件或某一個(gè)物體對(duì)人的喜怒哀樂是有著怎樣的影響。這對(duì)于看護(hù)老人的情感關(guān)懷方面等可以起到重要的作用。比如,當(dāng)老人情緒低落時(shí),機(jī)器人可以主動(dòng)與他們談起一些會(huì)令他高興、激動(dòng)的事情。而對(duì)人的自適應(yīng)的意圖的識(shí)別,通過對(duì)環(huán)境的理解和對(duì)人的歷史運(yùn)動(dòng)的建模,就可以知道老人是去廚房拿東西了或者老人出門去買菜了。如果機(jī)器人能夠?qū)ξ磥碜鞒龉烙?jì),就可以提前對(duì)老人發(fā)起交互,主動(dòng)提供幫助。
機(jī)器人開放平臺(tái)
英特爾中國研究院一直在做開放平臺(tái)研究,目前已經(jīng)推出了一個(gè)HERO機(jī)器人開放研究平臺(tái)。它具有高度靈活性, 適合于服務(wù)機(jī)器人和入門級(jí)自動(dòng)駕駛研究;具有高性能功耗比;具有由FPGA等提供的靈活的I/O處理;還有著對(duì)實(shí)時(shí)系統(tǒng)至關(guān)重要的低延遲和固定延遲。此外,很重要的一點(diǎn)是HERO的安全框架。HERO的安全框架包括兩個(gè)部分:第一,對(duì)于機(jī)器人自身CPU的安全保護(hù),防止黑客攻擊和代碼的惡意修改;第二,它也對(duì)用戶起到保護(hù)作用,利用其感知設(shè)備去感知外部的障礙物,防止機(jī)器人對(duì)人造成傷害。
近期,英特爾還推出了Open VINO軟件開發(fā)包。它支持在邊緣設(shè)備上部署CNN深度網(wǎng)絡(luò)模型,是一個(gè)統(tǒng)一的應(yīng)用編程接口,程序員可以統(tǒng)一進(jìn)行調(diào)用。它也是深度學(xué)習(xí)部署工具包、模型優(yōu)化器和推理引擎。
(本文根據(jù)“2018雷克大會(huì)”現(xiàn)場(chǎng)速記整理而成,經(jīng)本人審閱刊發(fā)。)