戴華東 易曉東 王彥臻 王之元 楊學(xué)軍
(軍事科學(xué)院國防科技創(chuàng)新研究院人工智能研究中心 北京 100071)
人類正在經(jīng)歷第三次工業(yè)革命,機(jī)器人即將重復(fù)個(gè)人電腦崛起的道路,走進(jìn)千家萬戶[1].作為機(jī)器人平臺最重要的基礎(chǔ)軟件,機(jī)器人操作系統(tǒng)是推動這一發(fā)展的核心和關(guān)鍵.機(jī)器人操作系統(tǒng)是“機(jī)器人革命”的引擎,具有重大的經(jīng)濟(jì)價(jià)值和軍事價(jià)值.機(jī)器人操作系統(tǒng)正朝著空間分布性、功能異構(gòu)性、任務(wù)并行性以及更強(qiáng)的智能性和容錯(cuò)性方向發(fā)展,致力于在更廣泛的應(yīng)用場景中自主或人機(jī)協(xié)同完成更為復(fù)雜的任務(wù).特別地,機(jī)器人群體可以形成數(shù)量規(guī)模優(yōu)勢,降低全系統(tǒng)的研用成本.當(dāng)前,人工智能正由手工知識/統(tǒng)計(jì)學(xué)習(xí)向適應(yīng)環(huán)境發(fā)展,適應(yīng)實(shí)際環(huán)境的學(xué)習(xí)理念為拓展機(jī)器人操作系統(tǒng)的實(shí)用性提供了有益借鑒.
本文在群體智能機(jī)器人操作系統(tǒng)micROS[2]的基礎(chǔ)上,提出了面向機(jī)器人群體的可持續(xù)自主學(xué)習(xí)的平行學(xué)習(xí)架構(gòu),通過“虛實(shí)結(jié)合、同步演進(jìn)”的技術(shù)途徑實(shí)現(xiàn)機(jī)器學(xué)習(xí)器的學(xué)習(xí)訓(xùn)練,加速智能機(jī)器人的自學(xué)習(xí)和自演進(jìn),支持適應(yīng)環(huán)境的人工智能在機(jī)器人和無人系統(tǒng)上的實(shí)現(xiàn).本文的主要研究包括4個(gè)方面:
1) 拓展了機(jī)器人操作系統(tǒng)的體系架構(gòu),以支撐機(jī)器人系統(tǒng)的可持續(xù)自主學(xué)習(xí)為目標(biāo),提出了“虛實(shí)結(jié)合、同步演進(jìn)”的平行學(xué)習(xí)架構(gòu);
2) 設(shè)計(jì)并實(shí)現(xiàn)了機(jī)器人操作系統(tǒng)的核心概念,針對機(jī)器人資源管理和行為管理的特點(diǎn),提出了基于“角色”的控制抽象和基于“語義情境圖”的數(shù)據(jù)抽象;
3) 突破了群體智能行為操控、自組織無線網(wǎng)絡(luò)等需解決的關(guān)鍵技術(shù)問題;
4) 開展了機(jī)器人操作系統(tǒng)的應(yīng)用驗(yàn)證,以無人農(nóng)機(jī)、無人物流、協(xié)同搜索、通信中繼等實(shí)際應(yīng)用需求作為牽引,采用虛實(shí)結(jié)合方式對micROS的能力進(jìn)行驗(yàn)證.
與micROS相關(guān)的研究方向包括群體機(jī)器人、機(jī)器人操作系統(tǒng)及類似軟件框架,以及近年來提出的適應(yīng)環(huán)境的人工智能.
單體機(jī)器人的研究相對成熟.在單體機(jī)器人研究的基礎(chǔ)上,許多國家都啟動了群體機(jī)器人研究計(jì)劃.日本早在1989年就由Asama等人提出了Actress系統(tǒng)[3]和CEBOT系統(tǒng)[4].Actress系統(tǒng)是通過設(shè)計(jì)底層的通信結(jié)構(gòu)而把機(jī)器人、周邊設(shè)備和計(jì)算機(jī)等連接起來的自治多機(jī)器人智能系統(tǒng),這個(gè)系統(tǒng)的主要特點(diǎn)是系統(tǒng)的單個(gè)動作和合作動作的并存.CEBOT系統(tǒng)假設(shè)每個(gè)機(jī)器人可以自主地運(yùn)動,沒有全局的世界模型,整個(gè)系統(tǒng)沒有集中控制,可以根據(jù)任務(wù)和環(huán)境動態(tài)重構(gòu),對具有學(xué)習(xí)和適應(yīng)能力的群體智能,采用分布式的體系結(jié)構(gòu).美國學(xué)者Jin和Beni等人研究了SWARM[5]系統(tǒng),該系統(tǒng)認(rèn)為單個(gè)機(jī)器人無智能,但它們在組成系統(tǒng)后將表現(xiàn)出群體的智能.2014年,哈佛科學(xué)家Nagpal設(shè)計(jì)了名為Kilobot的集群機(jī)器[6],它包含1 024個(gè)建造成本低廉的微型機(jī)器人,以產(chǎn)生去中心化、無領(lǐng)導(dǎo)的、點(diǎn)對點(diǎn)的、網(wǎng)絡(luò)特征的(大規(guī)模)合作.歐盟MARTHA[7]項(xiàng)目針對多自主機(jī)器人協(xié)同搬運(yùn)問題,對多機(jī)器人中進(jìn)行了系統(tǒng)研究.其他類似項(xiàng)目還包括歐盟的Swarmnoid[8],Swarm-Bots[9],REPLICATOR[10]項(xiàng)目,瑞士聯(lián)邦理工大學(xué)的SMAVNET[11],Nissan公司的EPORO項(xiàng)目[12]等.
在機(jī)器人操作系統(tǒng)的概念提出之前,實(shí)現(xiàn)類似功能的基礎(chǔ)軟件被稱為機(jī)器人中間件、機(jī)器人軟件框架或者機(jī)器人開發(fā)環(huán)境等.2000年機(jī)器人中間件的概念開始興起,出現(xiàn)了Miro[13],Orca[14],RT-Middleware[15],Player/Stage[16],RSCA[17]、Orocos[18]等典型項(xiàng)目和系統(tǒng).2006年,微軟也推出了機(jī)器人開發(fā)平臺RDS.近年來,機(jī)器人操作系統(tǒng)的概念也逐漸被學(xué)術(shù)界和產(chǎn)業(yè)界認(rèn)可和接受,越來越多的實(shí)驗(yàn)性和商業(yè)機(jī)器人系統(tǒng)都全部或部分基于機(jī)器人操作系統(tǒng)進(jìn)行開發(fā)實(shí)現(xiàn),其中甚至包括機(jī)組成員工作座艙內(nèi)自動化系統(tǒng)(ALIAS)和宇航機(jī)器人Robonaut 2等對系統(tǒng)可靠性和實(shí)時(shí)性要求苛刻的項(xiàng)目.
各國競相展開了機(jī)器人操作系統(tǒng)的研究,如美國的Player/Stage、歐洲的Orocos和YARP[19]等.特別值得關(guān)注的是,一套用“機(jī)器人操作系統(tǒng)”命名的機(jī)器人軟件——ROS[20](robot operating system)從2007年開始發(fā)展,進(jìn)展迅猛,得到了國內(nèi)外學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注.《麻省理工技術(shù)評論》[21]指出,“ROS正在逐步成為機(jī)器人研發(fā)領(lǐng)域的事實(shí)標(biāo)準(zhǔn)”.最近,微軟也發(fā)布了可在Windows 10上運(yùn)行的ROS版本,并將對其進(jìn)行持續(xù)開發(fā)維護(hù).近幾年來,ROS的應(yīng)用日益廣泛,無論是無人機(jī)/無人車等機(jī)器人本體的研究[22-23]、機(jī)器人平臺控制器的研究[24-25],還是機(jī)器人導(dǎo)航定位等方面的應(yīng)用研究[26-27],都大量基于ROS開展,為ROS的進(jìn)一步改進(jìn)和完善提供了廣闊的舞臺,但國內(nèi)外的科研機(jī)構(gòu)在ROS內(nèi)核方面投入研究力量并不充分,ROS1.0及當(dāng)前的2.0版本主要還是由開源社區(qū)維護(hù)和主導(dǎo).
美國軍方早在無人機(jī)平臺上成功地研發(fā)了通用操作系統(tǒng)——COS,并投入實(shí)戰(zhàn).COS的設(shè)計(jì)目的是將所有無人機(jī)平臺的武器、傳感器和通信等進(jìn)行整合,對X-45,X-47以及未來10年內(nèi)新開發(fā)的飛機(jī)進(jìn)行統(tǒng)一操控.基于機(jī)器人操作系統(tǒng),美國DARPA更加注重體系集成,推出SoSITE[28]等體系集成項(xiàng)目,重點(diǎn)是尋求有人平臺和無人平臺統(tǒng)一的體系架構(gòu)以及支撐工具,這為機(jī)器人操作系統(tǒng)及其軟件體系的研究和設(shè)計(jì)打開了一條新思路.
美國DARPA按照信息處理系統(tǒng)的4種能力——感知、學(xué)習(xí)、抽象和推理,將人工智能發(fā)展分為3個(gè)階段,即手工知識型、統(tǒng)計(jì)學(xué)習(xí)型和適應(yīng)環(huán)境型.手工知識型人工智能可針對限定問題進(jìn)行推理,因不具備學(xué)習(xí)能力而不能處理非確定性問題.我們正在經(jīng)歷統(tǒng)計(jì)學(xué)習(xí)型人工智能發(fā)展階段,以深度學(xué)習(xí)為代表的統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法可從大數(shù)據(jù)中學(xué)習(xí)數(shù)據(jù)的表征,可有效處理分類和預(yù)測等非確定性問題.然而,當(dāng)前人工智能系統(tǒng)的抽象和推理能力較弱,不能有效適應(yīng)動態(tài)變化的任務(wù)環(huán)境.未來,人工智能將在向適應(yīng)性環(huán)境型發(fā)展,系統(tǒng)將具備較強(qiáng)的感知、學(xué)習(xí)、抽象和推理能力,可適應(yīng)樣本類別、數(shù)據(jù)分布、樣本屬性等因素不斷變化的“開放動態(tài)環(huán)境”.
美國已經(jīng)對第3次人工智能浪潮展開布局,DARPA宣布投資20億,分10個(gè)項(xiàng)目利用5年時(shí)間開發(fā)適應(yīng)環(huán)境型人工智能技術(shù).2018年正式發(fā)布“利用更少標(biāo)記樣本學(xué)習(xí)”(LwLL)項(xiàng)目,試圖利用3年時(shí)間將面向特定問題的深度學(xué)習(xí)模型訓(xùn)練所需的標(biāo)記樣本量降低100萬倍;正式發(fā)布“內(nèi)嵌物理知識的人工智能”(PAI)項(xiàng)目,試圖在機(jī)器學(xué)習(xí)算法中嵌入因果推理、確定性方程等物理知識,以提升人工智能系統(tǒng)在開放環(huán)境中的學(xué)習(xí)能力.
在micROS的可擴(kuò)展多態(tài)分布架構(gòu)基礎(chǔ)之上,為了揭示群體機(jī)器智能的橫向——深向協(xié)同機(jī)理,借鑒平行控制思想,本文提出了機(jī)器人操作系統(tǒng)的平行學(xué)習(xí)架構(gòu),研究虛實(shí)聯(lián)動的平行學(xué)習(xí)智能體系.為支撐適應(yīng)環(huán)境的群體機(jī)器智能,從深向設(shè)計(jì)了虛實(shí)聯(lián)動的平行學(xué)習(xí)架構(gòu),如圖1所示,其原理是:基于情境圖和語義構(gòu)建可解釋的內(nèi)部世界模型,設(shè)計(jì)對環(huán)境的感知和持續(xù)更新的學(xué)習(xí)算法,并將經(jīng)驗(yàn)知識和學(xué)習(xí)知識不斷用于抽象和推理.
Fig. 1 Parallel learning architecture of micROS圖1 機(jī)器人操作系統(tǒng)的平行學(xué)習(xí)架構(gòu)
針對動態(tài)場景中智能行為的偶然性和復(fù)雜環(huán)境情境數(shù)據(jù)的非獨(dú)立同分布特性,研究群體機(jī)器智能結(jié)構(gòu)性實(shí)現(xiàn)方法,按照本能反應(yīng)式智能——局部后天反應(yīng)式智能——全局后天反應(yīng)式智能——慎思式智能等多個(gè)人類的智能水平層級,設(shè)計(jì)并實(shí)現(xiàn)平行學(xué)習(xí)架構(gòu),包括:在分布式智能無人平臺上實(shí)現(xiàn)本能反應(yīng)式智能的學(xué)習(xí)、局部后天反應(yīng)式智能的學(xué)習(xí)、在群體機(jī)器智能系統(tǒng)的云端分級實(shí)現(xiàn)全局后天反應(yīng)式智能的學(xué)習(xí)、慎思式智能的學(xué)習(xí)等.這種架構(gòu)解決了群體機(jī)器智能聯(lián)合學(xué)習(xí)算法設(shè)計(jì)和群體機(jī)器智能系統(tǒng)設(shè)計(jì)相結(jié)合的問題.
另外,通過虛實(shí)聯(lián)動的平行控制解決學(xué)習(xí)器訓(xùn)練的問題.據(jù)此,把體系中的要素分為實(shí)際系統(tǒng)和人工系統(tǒng),實(shí)際系統(tǒng)可是無人系統(tǒng),也可是人機(jī)共融系統(tǒng),人工系統(tǒng)是基于計(jì)算機(jī)模擬的虛擬系統(tǒng).實(shí)際系統(tǒng)在實(shí)際環(huán)境中運(yùn)行,人工系統(tǒng)在模擬仿真的虛擬環(huán)境中運(yùn)行,與實(shí)際系統(tǒng)聯(lián)動.同時(shí),實(shí)際環(huán)境為虛擬環(huán)境提供了基礎(chǔ)性數(shù)據(jù),虛擬環(huán)境可以通過訓(xùn)練和推理的方式生成數(shù)據(jù),為實(shí)際環(huán)境提供海量的數(shù)據(jù)擴(kuò)充.通過實(shí)際系統(tǒng)和人工系統(tǒng)的相互耦合、虛實(shí)互動,可為群體智能行為的自學(xué)習(xí)、自演進(jìn)、智能涌現(xiàn)奠定技術(shù)基礎(chǔ).
針對大規(guī)模群體無人系統(tǒng)的平行學(xué)習(xí),基于云平臺和輕量級容器技術(shù),在后臺虛擬空間中構(gòu)造與前端物理空間中的無人集群系統(tǒng)保持虛實(shí)聯(lián)動同步演進(jìn)的平行管控系統(tǒng).構(gòu)建“平臺即服務(wù)”的平行控制系統(tǒng)構(gòu)造所需的基礎(chǔ)設(shè)施,設(shè)計(jì)計(jì)算資源、存儲資源以及網(wǎng)絡(luò)資源的按需分配、協(xié)同調(diào)度、高效并發(fā)等機(jī)制,支持前端智能無人集群系統(tǒng)大規(guī)模并發(fā)訪問、信息共享、全局視圖的快速構(gòu)建;基于容器云消息隊(duì)列構(gòu)建松耦合的基于發(fā)布/訂閱模式的互操作協(xié)議與平行管控協(xié)議,統(tǒng)一前端異構(gòu)無人系統(tǒng)之間及其與后臺平行管控系統(tǒng)之間的互操作模型和框架;基于容器云快速構(gòu)建深度學(xué)習(xí)器,為前端智能演算提供實(shí)時(shí)算力支持.
控制抽象和數(shù)據(jù)抽象是操作系統(tǒng)基礎(chǔ)研究的核心內(nèi)容.在計(jì)算機(jī)操作系統(tǒng)發(fā)展過程中,基于“進(jìn)程/線程”模型的控制抽象的提出具有劃時(shí)代的意義,是現(xiàn)代操作系統(tǒng)資源管理和程序執(zhí)行的基本單元,是構(gòu)成并發(fā)、實(shí)時(shí)、分布等計(jì)算模式的基礎(chǔ),并衍生出許多計(jì)算機(jī)基礎(chǔ)理論,例如進(jìn)程代數(shù)理論等.基于文件的數(shù)據(jù)抽象同樣是計(jì)算機(jī)操作系統(tǒng)發(fā)展過程中的重要里程碑,使得不同來源的異構(gòu)數(shù)據(jù)和設(shè)備能夠被統(tǒng)一管理和共享使用.
群體智能機(jī)器人操作系統(tǒng)擔(dān)負(fù)管理機(jī)器人和群體機(jī)器人的資源和行為的任務(wù),資源管理從信息域擴(kuò)展到物理、信息、認(rèn)知、社會四域,行為管理更是計(jì)算機(jī)操作系統(tǒng)所不具備的功能.另外,機(jī)器人需要具備觀察、判斷、決定、行動的態(tài)勢元素集,以及空間數(shù)據(jù)庫、人機(jī)自然交互系統(tǒng)、目標(biāo)與場景識別等系統(tǒng).因此,群體智能機(jī)器人操作系統(tǒng)需要設(shè)計(jì)和實(shí)現(xiàn)不同于傳統(tǒng)計(jì)算機(jī)操作系統(tǒng)的控制抽象和數(shù)據(jù)抽象機(jī)制.
我們認(rèn)為,智能是有結(jié)構(gòu)的.為了揭示多元群體機(jī)器智能的分布結(jié)構(gòu)模型形成機(jī)理,采用基于角色(actor)的思想,研究單體機(jī)器智能與群體機(jī)器智能結(jié)構(gòu)的關(guān)聯(lián)性,重點(diǎn)是角色設(shè)定與交互規(guī)則、基于學(xué)習(xí)的角色能力形成機(jī)理、角色的智能生成與演化機(jī)理,以及分布結(jié)構(gòu)模型中各角色的分工協(xié)作.我們以多智能體(multi agent system, MAS)、計(jì)算機(jī)支持協(xié)同工作(computer supported cooperative work,CSCW)等理論為基礎(chǔ),提出了基于角色模型的群體智能機(jī)器人操作系統(tǒng)控制抽象.角色是機(jī)器人及機(jī)器人群體面向特定任務(wù)的一次行為的抽象,它與傳統(tǒng)計(jì)算機(jī)操作系統(tǒng)中進(jìn)程核心概念的對比如表1所示.我們設(shè)計(jì)了角色的核心數(shù)據(jù)結(jié)構(gòu),并實(shí)現(xiàn)了機(jī)器人群體中角色的扮演、激活、調(diào)度和遷移等基本操作.
1) 角色扮演.角色扮演是指將角色與傳感器、機(jī)器人、機(jī)器人群體等進(jìn)行綁定,實(shí)現(xiàn)資源分配,并建立機(jī)器人群體的組織結(jié)構(gòu)、交互關(guān)系等.
2) 角色激活.角色激活是指將任務(wù)分配給角色,角色按照所分配的任務(wù),開始執(zhí)行以O(shè)ODA循環(huán)為模型的行為.
Table1 Comparison of Process and Actor表1 進(jìn)程與角色的對比
3) 角色調(diào)度.傳感器、機(jī)器人平臺、機(jī)器人群體等可以并發(fā)扮演不同的角色,根據(jù)任務(wù)需求、資源約束等進(jìn)行調(diào)度.
4) 角色遷移.面向傳感器、機(jī)器人平臺或機(jī)器人群體失效等情況,由不同的傳感器、機(jī)器人平臺或機(jī)器人群體扮演原有角色,繼續(xù)完成任務(wù),實(shí)現(xiàn)群體的任務(wù)彈性.
基于以上角色模型,課題組正在研究面向群體智能行為管理與協(xié)同任務(wù)管理的機(jī)制與算法.
我們提出語義情境圖作為機(jī)器人操作系統(tǒng)的數(shù)據(jù)抽象,以實(shí)現(xiàn)機(jī)-機(jī)協(xié)同與人-機(jī)協(xié)同、數(shù)據(jù)融合、異步更新、多視圖共享、事件觸發(fā)等功能.語義情境圖和傳統(tǒng)計(jì)算機(jī)操作系統(tǒng)中文件的概念對比如表2所示.在群體智能操作系統(tǒng)中,語義情境圖包含可幫助機(jī)器人具備觀察、判斷、決定、行動的態(tài)勢元素集,以及空間數(shù)據(jù)庫、人機(jī)自然交互系統(tǒng)、目標(biāo)與場景識別等系統(tǒng).
Table 2 Comparison of Files and Semantic Situational Maps表2 文件與語義情境圖的對比
根據(jù)DARPA提出的適應(yīng)環(huán)境的人工智能思想,針對基于群體機(jī)器智能構(gòu)建可解釋環(huán)境模型的挑戰(zhàn),我們重點(diǎn)提出了可解釋環(huán)境表征、單體環(huán)境模型構(gòu)建和群體環(huán)境模型構(gòu)建機(jī)理.針對構(gòu)建可解釋復(fù)雜環(huán)境表征的挑戰(zhàn),我們提出了復(fù)雜環(huán)境的分解機(jī)理,重點(diǎn)是可解釋的環(huán)境積木發(fā)現(xiàn)和表征機(jī)制;針對單體機(jī)器人構(gòu)建環(huán)境模型的挑戰(zhàn),我們提出了基于可解釋的環(huán)境積木的動態(tài)組合機(jī)制,重點(diǎn)是環(huán)境積木的相關(guān)性分析和層次式組合派生機(jī)制;針對群體構(gòu)建環(huán)境模型的挑戰(zhàn),我們通過設(shè)計(jì)與實(shí)現(xiàn),探索了群體共享環(huán)境模型的可擴(kuò)展性,重點(diǎn)是環(huán)境模型知識與語義有組織的理解和共享.
4.1.1 群體智能行為操控技術(shù)
美國軍事戰(zhàn)略家約翰·博伊德(John Boyd)提出了一個(gè)行為認(rèn)知模型——OODA循環(huán)[29],該模型最初用于描述軍事對抗行動,現(xiàn)在已經(jīng)被廣泛擴(kuò)展到商業(yè)行為、社會事件和學(xué)習(xí)過程等應(yīng)用領(lǐng)域.OODA循環(huán)由“觀察(observe)、判斷(orient)、決定(decide)、行動(act)”4個(gè)環(huán)節(jié)組成.該模型充分考慮到了開放環(huán)境和復(fù)雜系統(tǒng)的特征,能夠用于描述高級和復(fù)雜的群體行為.群體智能操作系統(tǒng)以“自主觀察與群體感知、自主判斷與群體認(rèn)知、自主決定與群體博弈、自主行動與群體動力”這4個(gè)科學(xué)問題為牽引,參照OODA行為認(rèn)知模型,將感知智能、認(rèn)知智能、群體智能、人機(jī)混合智能等人工智能技術(shù)應(yīng)用于OODA循環(huán)的4個(gè)環(huán)節(jié),實(shí)現(xiàn)了對群體機(jī)器人的智能行為管理.
群體智能行為可以看作是一個(gè)復(fù)雜適應(yīng)系統(tǒng)(complex adaptive systems, CAS),系統(tǒng)中的成員是具有一定適應(yīng)性的主體,每個(gè)主體能夠與環(huán)境以及其他主體進(jìn)行交互作用.主體在這種持續(xù)不斷的交互作用的過程中,不斷地“學(xué)習(xí)”或“積累”經(jīng)驗(yàn),并且根據(jù)學(xué)到的經(jīng)驗(yàn)改變自身的結(jié)構(gòu)和行為方式.整個(gè)宏觀系統(tǒng)的演變或進(jìn)化,包括新層次的產(chǎn)生、分化和多樣性的出現(xiàn)新的、聚合而成的、更大的主體的出現(xiàn)等,都將在這個(gè)基礎(chǔ)上逐步派生而來.群體智能體在這一過程中涌現(xiàn)出來的群體智能,使得整個(gè)群體行為系統(tǒng)不斷發(fā)展和進(jìn)化,通過不斷地適應(yīng)產(chǎn)生群體智能行為的復(fù)雜性.
4.1.2 自組織無線網(wǎng)絡(luò)技術(shù)
具有適應(yīng)性和涌現(xiàn)性的智能群體通過單體之間的信息流動,實(shí)現(xiàn)復(fù)雜適應(yīng)系統(tǒng)的“流”特性.在群體機(jī)器智能系統(tǒng)中,信息的流動依賴于自適應(yīng)、自組織的網(wǎng)絡(luò).因此,自組織網(wǎng)絡(luò)不僅是對群體機(jī)器智能適應(yīng)性與環(huán)境交互機(jī)理的運(yùn)用,也是構(gòu)建具有適應(yīng)性和涌現(xiàn)性的各類群體機(jī)器智能系統(tǒng)的共性基礎(chǔ).
群體機(jī)器智能系統(tǒng)自組織網(wǎng)絡(luò)以群體機(jī)器智能聯(lián)合感知、群體機(jī)器智能聯(lián)合學(xué)習(xí)、群體機(jī)器智能聯(lián)合抽象和群體機(jī)器智能聯(lián)合推理算法為指導(dǎo),一方面涉及分布式寬帶頻譜探測與認(rèn)知機(jī)制、多維智能通信機(jī)制和彈性自組織網(wǎng)絡(luò)機(jī)制,另一方面涵蓋將上述模型和機(jī)制物化為實(shí)體的自組織網(wǎng)絡(luò)系統(tǒng)集成方法,主要包括:
1) 分布式寬帶頻譜探測與認(rèn)知機(jī)制.基于分布式多無人平臺的協(xié)作頻譜探測,聚合多個(gè)平臺的探測頻段并進(jìn)行精確的頻譜認(rèn)知,從聚合的智能電磁群體與電磁環(huán)境的交互機(jī)制出發(fā),設(shè)計(jì)自適應(yīng)調(diào)控和折衷的單體規(guī)則.重點(diǎn)還包括基于機(jī)器學(xué)習(xí)的無線信道模型、多維頻譜地圖模型構(gòu)建方法、頻譜感知網(wǎng)絡(luò)與自適應(yīng)通信網(wǎng)絡(luò)動態(tài)構(gòu)建方法.
2) 多維智能通信機(jī)制.主要是具有自主調(diào)節(jié)能力的多維智能通信機(jī)制,包括發(fā)射端基于學(xué)習(xí)型算法的波形自適應(yīng)機(jī)制和接收端基于學(xué)習(xí)型算法的自適應(yīng)接收技術(shù),以實(shí)現(xiàn)空、時(shí)、頻、能、碼等多個(gè)維度的智能通信,匹配集群機(jī)器智.
3) 彈性自組織網(wǎng)絡(luò)機(jī)制.可進(jìn)一步分解為通信運(yùn)動聯(lián)合規(guī)劃和混合式自適應(yīng)路由.群體機(jī)器智能系統(tǒng)通信運(yùn)動聯(lián)合規(guī)劃根據(jù)任務(wù)需求量化系統(tǒng)優(yōu)化目標(biāo),對物理電磁環(huán)境等外部約束、無人平臺自主感知-規(guī)劃-控制能力、通信能力和能量等內(nèi)部約束進(jìn)行建模,設(shè)計(jì)群體通信運(yùn)動聯(lián)合規(guī)劃.混合式自適應(yīng)路基于群體智能的適應(yīng)性機(jī)理,在拓?fù)浣Y(jié)構(gòu)變化動態(tài)性較低的子網(wǎng)中采用反應(yīng)式路由協(xié)議,在高動態(tài)拓?fù)渥兓臒o人機(jī)子網(wǎng)中采用先應(yīng)式路由協(xié)議等.
4) 自組織網(wǎng)絡(luò)系統(tǒng)集成方法.根據(jù)層次式和軟件構(gòu)件化的設(shè)計(jì)思路,設(shè)計(jì)和實(shí)現(xiàn)支持分布式寬帶頻譜探測與認(rèn)知機(jī)制、多維智能通信機(jī)制和彈性自組織網(wǎng)絡(luò)機(jī)制的自組織網(wǎng)絡(luò)系統(tǒng)集成方法,形成物化的分布可擴(kuò)展互操作協(xié)議棧.
我們已完成了群體智能操作系統(tǒng)軟件micROS原型版本的開發(fā),初步實(shí)現(xiàn)了多態(tài)分布體系架構(gòu),并且支持基于軟件總線的軟件插件化擴(kuò)展.該軟件原型主要采用C++程序設(shè)計(jì)語言開發(fā).micROS按照群體智能操作系統(tǒng)的結(jié)點(diǎn)層次式架構(gòu)設(shè)計(jì)開發(fā),核心模塊包括資源管理層和群體行為操控支撐架構(gòu)層.其中,資源管理層分為物理域(physics domain)資源管理、信息域(information domain)資源管理、認(rèn)知域(cognition domain)資源管理和作戰(zhàn)域/社會域(social domain)資源管理共4個(gè)子模塊;群體行為操控支撐架構(gòu)層分為群體觀察支撐框架observe、群體判斷支撐框架orient、群體決定支撐框架decide、群體行動支撐框架act共4個(gè)子模塊.群體智能操作系統(tǒng)軟件原型的每一個(gè)子模塊都基于“軟件總線+插件”的設(shè)計(jì)進(jìn)行開發(fā),例如群體行動支撐框架act子模塊中包含群體行動軟件總線act_softbus和群體行動功能插件庫plugins.micROS在插件庫中提供了典型功能插件范例,并且支持第三方根據(jù)插件接口規(guī)范進(jìn)行軟件的插件化擴(kuò)展.目前micROS提供的典型插件范例包括多種無人系統(tǒng)傳感器驅(qū)動插件、典型控制器插件、導(dǎo)航定位數(shù)據(jù)處理插件、可見光數(shù)據(jù)處理插件、路徑規(guī)劃插件、群體行動自適應(yīng)插件、群體動力控制插件、局部運(yùn)動插件等.
針對大規(guī)模群體無人系統(tǒng)在虛擬空間中的行為仿真,基于高性能三維物理引擎、精細(xì)化虛擬實(shí)體建模系統(tǒng)、逼真環(huán)境生成系統(tǒng)、可視化展示系統(tǒng)構(gòu)建并行化模擬仿真環(huán)境,為micROS提供仿真支撐,為平行學(xué)習(xí)架構(gòu)提供平臺支撐,形成基本功能要素齊全的可視化展示能力、實(shí)物試驗(yàn)前的功能集成測試能力、大規(guī)模集群的實(shí)驗(yàn)驗(yàn)證能力.針對物理引擎模塊計(jì)算復(fù)雜度高,仿真效率低的問題,基于自適應(yīng)參數(shù)設(shè)置、多線程并發(fā)等技術(shù),構(gòu)建高性能物理引擎并行計(jì)算模塊.
針對單一仿真器可擴(kuò)展性差,不足以支撐大規(guī)模集群實(shí)時(shí)/超實(shí)時(shí)仿真的缺點(diǎn),基于micROS架構(gòu)和發(fā)布/訂閱模式,構(gòu)建可擴(kuò)展的多仿真器分布式仿真架構(gòu).通過物理引擎并行計(jì)算與分布式仿真架構(gòu),實(shí)現(xiàn)大規(guī)模無人系統(tǒng)實(shí)時(shí)/超實(shí)時(shí)高精度并行仿真.針對仿真器可視化功能弱、展示效果差的問題,在可擴(kuò)展的分布式仿真架構(gòu)下,搭建三維可視化平臺,構(gòu)建精細(xì)化虛擬實(shí)體建模系統(tǒng)、逼真環(huán)境生成系統(tǒng),將仿真計(jì)算功能與可視化展示功能解耦,具備高逼真度的三維可視化展示能力.
4.3.1 低成本群體無人機(jī)試驗(yàn)系統(tǒng)Beebots
為了便于群體無人系統(tǒng)實(shí)物試驗(yàn)的開展,我們首先基于商用微型四旋翼無人機(jī)搭建了群體無人機(jī)實(shí)驗(yàn)硬件系統(tǒng).相比固定翼無人機(jī),旋翼無人機(jī)具有成本低、速度慢、安全性好、場地需求小等優(yōu)勢,在系統(tǒng)研制初期試驗(yàn)開展方面具有較大優(yōu)勢.為了確保機(jī)上有足夠的計(jì)算資源部署和運(yùn)行無人機(jī)應(yīng)用程序,為無人機(jī)配備專門的任務(wù)板,為了使實(shí)驗(yàn)平臺對機(jī)器人軟件開發(fā)有良好的支持,我們完成了群體智能操作系統(tǒng)軟件原型同無人機(jī)和任務(wù)板的適配與優(yōu)化工作.如圖2所示,我們選取了Parrot Bebop 2旋翼無人機(jī)和樹莓派3 b開發(fā)板,作為無人機(jī)硬件和機(jī)載任務(wù)板,組成Beebots群體無人機(jī)實(shí)驗(yàn)系統(tǒng)的個(gè)體.任務(wù)板可通過USB線纜直接連接無人機(jī)傳輸控制指令.
Fig. 2 Beebots experimental platform圖2 Beebots實(shí)驗(yàn)系統(tǒng)
將樹莓派3 b和Parrot Bebop 2連接后組裝成Beebot個(gè)體,即可由多個(gè)Beebot個(gè)體組網(wǎng)形成無人機(jī)群,再加入PC地面站即可構(gòu)成一套完整的無人機(jī)實(shí)物實(shí)驗(yàn)驗(yàn)證硬件系統(tǒng),如圖3所示.進(jìn)行組網(wǎng)時(shí),既可以將所有樹莓派與地面站的無線網(wǎng)卡連接到同一路由器,也可以直接利用所有樹莓派與地面站的無線網(wǎng)卡組成無線自組網(wǎng),從而實(shí)現(xiàn)Beebot個(gè)體之間以及與地面站之間的通信.
在上述Beebot群體無人機(jī)實(shí)驗(yàn)硬件系統(tǒng)之上,我們完成了群體智能操作系統(tǒng)軟件原型適配、實(shí)驗(yàn)輔助工具軟件開發(fā)等工作,進(jìn)行了包括自主起飛、編隊(duì)生成、編隊(duì)機(jī)動、隊(duì)形變換、自主降落等科目在內(nèi)的無人機(jī)群體協(xié)同行動能力實(shí)物驗(yàn)證.
Fig. 3 Collective Beebots connected by ad hoc network圖3 Beebots群體無人機(jī)系統(tǒng)硬件結(jié)構(gòu)示意圖
4.3.2 無人潛航器
無人潛航器在民用領(lǐng)域可執(zhí)行鋪設(shè)管線、海底考察、海底施工等危險(xiǎn)工作,在軍用領(lǐng)域則可用于偵察、布雷、掃雷、援潛和救生等任務(wù).水域無人系統(tǒng)的推進(jìn)方式和載荷類型與無人機(jī)具有顯著的不同,為驗(yàn)證micROS對于水域無人系統(tǒng)的適配能力,我們對某型無人潛航器展開適配.
潛航器采用輪緣推進(jìn)器實(shí)現(xiàn)動力推進(jìn),采用集成有多普勒測速儀的捷聯(lián)慣性系統(tǒng)實(shí)現(xiàn)位姿和速度估計(jì),采用溫濕度傳感器、壓力計(jì)、電源管理等傳感器實(shí)現(xiàn)意外檢測和應(yīng)急處理,采用前置聲吶實(shí)現(xiàn)障礙物檢測.此外,潛航器還配備有水下攝像頭、側(cè)掃聲吶等載荷.在micROS中,對潛航器的推進(jìn)器和各型傳感器進(jìn)行了資源適配,行動控制采用姿態(tài)位置控制回路和導(dǎo)引回路,實(shí)現(xiàn)了對潛航器的懸停、上移、下沉、等高航行和轉(zhuǎn)向等基本控制,以及繞航跡點(diǎn)的自主航行控制和行進(jìn)過程中的自主避撞.
以無人系統(tǒng)實(shí)際應(yīng)用需求作為機(jī)器人操作系統(tǒng)研發(fā)的導(dǎo)向,構(gòu)建良好的機(jī)器人操作系統(tǒng)生態(tài)環(huán)境,以機(jī)器人操作系統(tǒng)易用、易開發(fā)為目標(biāo),在實(shí)際應(yīng)用中驗(yàn)證、發(fā)展micROS.值得注意的是,在傳統(tǒng)計(jì)算機(jī)操作系統(tǒng)的發(fā)展歷程中,不乏具備技術(shù)特色和技術(shù)優(yōu)勢的產(chǎn)品,但是這些產(chǎn)品重技術(shù)輕應(yīng)用、重研發(fā)輕驗(yàn)證、重實(shí)驗(yàn)輕推廣,最終都逐漸退出了歷史舞臺.以史為鑒,micROS從研發(fā)工作開始,就強(qiáng)調(diào)面向?qū)嶋H需求的應(yīng)用驗(yàn)證,近年來國內(nèi)智能無人系統(tǒng)領(lǐng)域產(chǎn)業(yè)發(fā)展迅速,形成了一大批具備強(qiáng)大研發(fā)實(shí)力的企業(yè),我們目前已開展的應(yīng)用包括:無人農(nóng)機(jī)、無人物流、協(xié)同搜救、通信中繼等,主要應(yīng)用領(lǐng)域覆蓋無人系統(tǒng)相關(guān)的機(jī)械制造、動力控制、關(guān)鍵零部件加工、裝備實(shí)驗(yàn)測試等.
在應(yīng)用驗(yàn)證的技術(shù)手段方面,借助并行化模擬仿真環(huán)境,根據(jù)現(xiàn)實(shí)應(yīng)用需求牽引,采用虛實(shí)結(jié)合的方式,開發(fā)面向群體的地面站軟件,對micROS支持人機(jī)自主協(xié)同的能力進(jìn)行驗(yàn)證.另外,設(shè)計(jì)面向群體的任務(wù)級地面站軟件,作為面向應(yīng)用的人機(jī)交互界面.該軟件擺脫了簡單一對一、一對多的遙控式交互方式,而是按照任務(wù)和功能劃分設(shè)計(jì)操作席位,例如任務(wù)規(guī)劃席、群體操控席、無人平臺監(jiān)控席、通信保障席等,以實(shí)現(xiàn)操作員對群體無人系統(tǒng)的人機(jī)交互式操作.
群體智能機(jī)器人是有別于群體生物和群體社會的“新物種”,micROS創(chuàng)新了機(jī)器人操作系統(tǒng)的體系架構(gòu)和核心概念的設(shè)計(jì)與實(shí)現(xiàn).目前,micROS重點(diǎn)面向的是群體智能的結(jié)構(gòu)性和適應(yīng)性科學(xué)問題,下一步工作還將考慮群體智能機(jī)器人系統(tǒng)的智能涌現(xiàn)問題,朝著這一有挑戰(zhàn)的領(lǐng)域拓進(jìn)發(fā)展.