亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        異構(gòu)Agent協(xié)作的研究進(jìn)展

        2017-08-08 02:38:44晶,劉瑋,吳坤,李
        關(guān)鍵詞:異構(gòu)協(xié)作決策

        王 晶,劉 瑋,吳 坤,李 爽

        武漢工程大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,湖北 武漢 430205

        異構(gòu)Agent協(xié)作的研究進(jìn)展

        王 晶,劉 瑋*,吳 坤,李 爽

        武漢工程大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,湖北 武漢 430205

        首先在介紹多Agent協(xié)作的研究背景以及國內(nèi)外研究現(xiàn)狀的基礎(chǔ)上,對(duì)多Agent理論及其協(xié)作機(jī)制分別進(jìn)行了分類和總結(jié);然后,在研究多Agent協(xié)作框架的基礎(chǔ)上,分析了當(dāng)前最具代表性的幾種多Agent協(xié)作模型,如黑板模型、合同網(wǎng)模型、熟人模型、關(guān)系網(wǎng)模型以及承諾模型,闡述各模型特點(diǎn)并在動(dòng)態(tài)性、異構(gòu)性、靈活性和反應(yīng)性等方面進(jìn)行比較,突出承諾模型與其它協(xié)作模型相比的優(yōu)勢(shì);最后,介紹了異構(gòu)Agent協(xié)作模型在智能足球機(jī)器人、協(xié)同決策以及虛擬訓(xùn)練等領(lǐng)域的具體應(yīng)用.在Agent協(xié)作模型的比較與具體應(yīng)用中,突出了承諾模型在異構(gòu)Agent協(xié)作過程中所展現(xiàn)的較好的動(dòng)態(tài)性、靈活性和反應(yīng)性等特征,并提出了在開放環(huán)境下,當(dāng)前Agent承諾模型在動(dòng)態(tài)生成承諾協(xié)議方面的不足與改進(jìn)方向.

        多Agent系統(tǒng);異構(gòu);協(xié)作;機(jī)制;框架;模型

        多Agent系統(tǒng)(multi-agent systems,MAS)是由多個(gè)Agent組成,通過各Agent間相互協(xié)作,形成擁有豐富知識(shí)庫和強(qiáng)大功能的系統(tǒng)[1].在該系統(tǒng)中,為完成一個(gè)共同全局目標(biāo),各Agent之間相互合作、協(xié)調(diào)、共享知識(shí)和資源并最終解決問題.同構(gòu)Agent系統(tǒng)(homogeneous multi-agent systems)是由多個(gè)具有相同行為能力、相同組織結(jié)構(gòu)的Agent組成;而異構(gòu) Agent系統(tǒng)[2](heterogeneous multi-agentsystems)則是由多個(gè)具有相似或不同行為能力的、相互獨(dú)立的Agent組成,它們之間存在可以相互理解和協(xié)作的接口,根據(jù)一定的邏輯關(guān)系進(jìn)行協(xié)作和資源共享.

        由于各個(gè)系統(tǒng)間的數(shù)據(jù)是動(dòng)態(tài)、異構(gòu)、有限的數(shù)據(jù)共享,因此實(shí)現(xiàn)不同系統(tǒng)間協(xié)作顯得格外重要.面向異構(gòu)Agent的協(xié)作技術(shù),是MAS研究亟待解決的問題之一.

        在一些典型的多Agent研究領(lǐng)域中,比如智能機(jī)器人足球大賽[3]、醫(yī)療機(jī)構(gòu)中基于無人駕駛小車(AGV)的醫(yī)療垃圾運(yùn)輸問題[4]以及股票投資決策[5]等領(lǐng)域,復(fù)雜、動(dòng)態(tài)變化的環(huán)境都要求Agent為完成任務(wù)而必須采取協(xié)作行為,即把多個(gè)Agent看做一個(gè)團(tuán)體,通過建立多Agent之間合作、協(xié)調(diào)、通信等機(jī)制來提高整個(gè)系統(tǒng)效率和性能.異構(gòu)Agent由于組織結(jié)構(gòu)、行為能力的不同能夠彌補(bǔ)在完成任務(wù)時(shí)同構(gòu)Agent的不足,降低系統(tǒng)的構(gòu)建成本,提高Agent的使用效率.

        Agent協(xié)作是指多Agent間協(xié)作、保持一致性以及聯(lián)合行動(dòng)的過程.一致性意味著團(tuán)體中的多Agent是作為一個(gè)整體行動(dòng)而不是某個(gè)Agent的個(gè)體行為.MAS環(huán)境從封閉到開放,從可預(yù)知到不確定的變化,導(dǎo)致Agent協(xié)作經(jīng)歷了從同構(gòu)Agent協(xié)作到異構(gòu)Agent協(xié)作、從靜態(tài)協(xié)作到動(dòng)態(tài)協(xié)作的過程,這種變化趨勢(shì)對(duì)當(dāng)前Agent協(xié)作模型提出了新的難題和挑戰(zhàn).

        筆者針對(duì)MAS面臨的變化和挑戰(zhàn),首先在介紹多Agent協(xié)作的研究背景以及國內(nèi)外研究現(xiàn)狀的基礎(chǔ)上,對(duì)MAS理論和協(xié)作機(jī)制分別進(jìn)行了分類和總結(jié);然后,在研究多Agent協(xié)作框架的基礎(chǔ)上,總結(jié)了當(dāng)前最具代表性的幾種多Agent協(xié)作模型,闡述其特點(diǎn)并進(jìn)行比較,突出了承諾模型在異構(gòu)Agent協(xié)作性能上的優(yōu)勢(shì);最后,介紹了異構(gòu)Agent協(xié)作模型的具體應(yīng)用,在分析當(dāng)前承諾模型性能的基礎(chǔ)上,提出了當(dāng)前Agent承諾模型的不足與改進(jìn)方向.

        1 異構(gòu)Agent相關(guān)理論概述

        1.1 異構(gòu)Agent系統(tǒng)協(xié)作機(jī)制

        與同構(gòu)Agent相比,異構(gòu)Agent由于組織結(jié)構(gòu)、行為能力的不同,能夠彌補(bǔ)在完成任務(wù)時(shí)同構(gòu)Agent的不足,降低系統(tǒng)的構(gòu)建成本,提高Agent的使用效率;同時(shí)在當(dāng)前網(wǎng)絡(luò)信息量急劇增長(zhǎng)的情況下,由于不同系統(tǒng)間數(shù)據(jù)共享非常有限,因此迫切需要異構(gòu)Agent系統(tǒng)來加速系統(tǒng)間信息的傳遞和共享[6].

        當(dāng)前異構(gòu)Agent協(xié)作解決的問題主要是集中在承諾、規(guī)劃、協(xié)商和學(xué)習(xí)這四個(gè)方面,它們共同作用于Agent協(xié)作的整個(gè)過程.

        承諾是保證Agent完成接受任務(wù)的一種機(jī)制.在一個(gè)MAS中,每一個(gè)Agent僅僅擁有其它Agent行為的部分知識(shí)[7].所以,為使各主體之間協(xié)調(diào)合作,系統(tǒng)中的每個(gè)Agent內(nèi)部需要建立起一種機(jī)制去解決由于只知道部分Agent的知識(shí)庫而影響到它們之間協(xié)作的問題.當(dāng)Agent承諾某個(gè)活動(dòng)時(shí),它實(shí)際上就保證了實(shí)現(xiàn)整個(gè)活動(dòng)需要的全部資源.若Agent執(zhí)行一個(gè)特定的動(dòng)作,那么在環(huán)境不發(fā)生改變的情況下,它將努力遵循這一保證.可以看出,承諾機(jī)制是各Agent之間相互協(xié)調(diào)、合作和通訊的必要保證,它確保Agent擁有足夠的能力完成它所承諾的任務(wù).

        規(guī)劃是Agent進(jìn)行決策的主要途徑,它是控制Agent執(zhí)行動(dòng)作的基礎(chǔ).Agent通過推理從而產(chǎn)生實(shí)現(xiàn)目標(biāo)的有效動(dòng)作.在規(guī)劃的經(jīng)典理論中,Agent擁有自己的領(lǐng)域知識(shí),它可以描述目標(biāo)狀態(tài)、環(huán)境狀態(tài)和已知的自身動(dòng)作集合.Agent會(huì)通過一種特定方法執(zhí)行一個(gè)動(dòng)作序列,當(dāng)該動(dòng)作序列完成之后會(huì)達(dá)到設(shè)定的最終目標(biāo)狀態(tài),這就是Agent的規(guī)劃過程.多Agent規(guī)劃可以分為集中式規(guī)劃和分布式規(guī)劃兩種,當(dāng)選擇好規(guī)劃方式之后,就需要解決規(guī)劃算法和規(guī)劃沖突這兩個(gè)核心問題.

        協(xié)商過程需要進(jìn)行信息的交換處理,從而使整個(gè)系統(tǒng)的行為保持一致,其目的是解決在多Agent協(xié)作的過程中發(fā)生的沖突問題.傳統(tǒng)的協(xié)商是基于納什的平衡理論,當(dāng)然也可以通過引入Agent對(duì)象的偏好來進(jìn)行協(xié)商.根據(jù)已有的協(xié)商理論,可以將協(xié)商過程概括為三個(gè)部分,即協(xié)商協(xié)議、協(xié)商策略和協(xié)商處理[8].協(xié)商協(xié)議是 Agent通信交流的基礎(chǔ),它可以規(guī)范協(xié)商雙方的數(shù)據(jù)表示;協(xié)商決策可支撐Agent內(nèi)部協(xié)商交互處理過程,目的是產(chǎn)生協(xié)商結(jié)果;協(xié)商處理包含協(xié)商交互分析,以及關(guān)于對(duì)結(jié)果一致性的認(rèn)可.協(xié)商過程的三個(gè)部分將決定Agent協(xié)商的能力強(qiáng)弱,也是協(xié)商方法的核心內(nèi)容.

        學(xué)習(xí)是在Agent完成任務(wù)的基礎(chǔ)上進(jìn)行歸納和自優(yōu)化的過程[9].而機(jī)器學(xué)習(xí)(machine learning)是提高Agent智力的有效方法,從連接主義的角度可分為非監(jiān)督學(xué)習(xí)、監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)三種.而強(qiáng)化學(xué)習(xí)方法則是其中一種非常重要的機(jī)器學(xué)習(xí)方法.在協(xié)作Agent之間,強(qiáng)化學(xué)習(xí)主要是采用交換方式,如交換狀態(tài)、交換策略、交換經(jīng)驗(yàn)以及建議等方式進(jìn)行學(xué)習(xí).但由于學(xué)習(xí)方法的復(fù)雜性,其需要大量的記憶空間以及復(fù)雜的邏輯推理,因此使得其在實(shí)際應(yīng)用中具有很大局限性.

        1.2 異構(gòu)Agent協(xié)作框架

        異構(gòu)Agent協(xié)作體系主要采用混合式結(jié)構(gòu),即集中式和分布式的混合組合.它分為3個(gè)層次,即交互層、管理執(zhí)行層和資源層,每一層至少含有一個(gè)或多個(gè)Agent,這些Agent會(huì)根據(jù)自身能力來完成各自承擔(dān)的任務(wù).基于異構(gòu)Agent協(xié)作的體系結(jié)構(gòu)如圖1所示,它由多種具有不同功能的Agent組成.

        圖1 異構(gòu)Agent協(xié)作的體系結(jié)構(gòu)Fig.1 Framework of heterogeneous agent collaboration

        在交互層,交互Agent主要負(fù)責(zé)與用戶進(jìn)行交互并將用戶發(fā)送的請(qǐng)求轉(zhuǎn)化為系統(tǒng)可以識(shí)別的指令,并將其發(fā)送給管理執(zhí)行層.

        在管理執(zhí)行層,管理協(xié)作Agent統(tǒng)一管理和調(diào)用所有執(zhí)行Agent,然后將任務(wù)分配給不同的Agent.當(dāng)管理協(xié)作Agent接收到來自用戶的任務(wù)請(qǐng)求后,首先會(huì)對(duì)其進(jìn)行逐步分解,然后將分解后的子任務(wù)分配給相應(yīng)的執(zhí)行Agent來執(zhí)行.

        在資源層,主要是為管理執(zhí)行層提供相對(duì)應(yīng)的數(shù)據(jù)服務(wù)功能,并對(duì)執(zhí)行過程中產(chǎn)生的新知識(shí)、新數(shù)據(jù)進(jìn)行分類保存,實(shí)時(shí)更新相應(yīng)數(shù)據(jù)庫,相當(dāng)于一個(gè)本地知識(shí)庫.當(dāng)管理執(zhí)行層Agent需要某數(shù)據(jù)服務(wù)時(shí),可從資源層調(diào)用,當(dāng)執(zhí)行完某任務(wù)后,也可將執(zhí)行過程中產(chǎn)生的新數(shù)據(jù)存儲(chǔ)到資源層,以便下次調(diào)用.

        參考異構(gòu) Agent協(xié)作框架[10],以及交互層、管理執(zhí)行層與資源層三層之間的交互可以看到異構(gòu)Agent協(xié)作包含以下特征:

        1)每一個(gè)Agent都呈模塊化結(jié)構(gòu),方便研究人員獨(dú)立開發(fā)和設(shè)計(jì),它們可以根據(jù)環(huán)境變化迅速做出反應(yīng),并可以根據(jù)需要靈活增減Agent的數(shù)量;

        2)Agent之間相互獨(dú)立,一個(gè)Agent失效不會(huì)對(duì)其它Agent產(chǎn)生影響;

        3)數(shù)據(jù)服務(wù)Agent會(huì)對(duì)新到來的數(shù)據(jù)進(jìn)行分類和存儲(chǔ),有助于系統(tǒng)學(xué)習(xí)新的知識(shí)并優(yōu)化自身模型,豐富系統(tǒng)知識(shí)庫;

        4)每一個(gè)Agent都可以使用自身的知識(shí)庫獨(dú)立解決問題,從而提高整個(gè)系統(tǒng)解決問題的效率.

        2 異構(gòu)Agent協(xié)作研究及其進(jìn)展

        2.1 異構(gòu)Agent協(xié)作的研究方向

        當(dāng)前關(guān)于異構(gòu)Agent協(xié)作的研究主要分為兩種研究方向.

        一種是借鑒其他領(lǐng)域研究協(xié)作的技術(shù)和方法(如馬爾可夫模型,遺傳算法,博弈論等)應(yīng)用于Agent協(xié)作研究中[11].以馬爾可夫模型[12]為例,它通常被認(rèn)為是快速精確實(shí)現(xiàn)語音識(shí)別的最好方法之一,其復(fù)雜的語音識(shí)別問題可通過隱含馬爾可夫模型簡(jiǎn)單地描述與解決.然而這種方法所運(yùn)用的各種理論主要適用于語音識(shí)別、音字轉(zhuǎn)換和詞性標(biāo)注,適用范圍較小,一旦環(huán)境復(fù)雜度上升,學(xué)習(xí)周期將變得很長(zhǎng),很難發(fā)揮作用.

        另一種是從 Agent的信念(belief)、期望(de?sire)、意圖(intention)(即BDI)等方面出發(fā)來研究多Agent之間的協(xié)作[13-14],這種方法從邏輯論的角度,注重分析Agent的目標(biāo)、能力以及需求.在共享計(jì)劃理論[15]方面,這種協(xié)調(diào)方法是以BDI理論作為基礎(chǔ),采用人工智能領(lǐng)域中的符號(hào)推理,通過建立相對(duì)完整的符號(hào)體系進(jìn)行知識(shí)推理,因而使Agent具有自主思考、決策和協(xié)調(diào)的能力.此方法的適用范圍較前者更加廣泛,側(cè)重于問題的規(guī)劃與求解.

        在當(dāng)前人工智能領(lǐng)域尤其是自適應(yīng)系統(tǒng)方面,基于BDI的推理模型有非常廣泛的應(yīng)用.由于這種方法從邏輯角度出發(fā),注重分析Agent的目標(biāo)、能力、需求以及環(huán)境變化,具有開放性和動(dòng)態(tài)性,因此,也成為近年來Agent協(xié)作研究的熱門方向.

        2.2 異構(gòu)Agent協(xié)作研究進(jìn)展

        隨著Agent系統(tǒng)環(huán)境從封閉到開放,從可預(yù)知到不確定變化,導(dǎo)致Agent協(xié)作經(jīng)歷了從靜態(tài)到動(dòng)態(tài)交互,從同構(gòu)到異構(gòu)變化的過程.

        1)從靜態(tài)到動(dòng)態(tài)交互.早期的Agent協(xié)作研究認(rèn)為Agent之間不會(huì)產(chǎn)生沖突,因?yàn)锳gent被認(rèn)為是唯一的,可兼容的個(gè)體.隨著Agent技術(shù)發(fā)展的愈加深入,需要Agent能夠在有目標(biāo)沖突的情況下,通過Agent之間的不斷交互,以此逐步協(xié)調(diào)Agent與環(huán)境之間的關(guān)系及各自行為,從而達(dá)到共同的目標(biāo).于是Rosenschein[16]在其博士論文中深入研究目標(biāo)沖突下的Agent交互過程,應(yīng)用博弈論建立了理性Agent靜態(tài)交互模型,奠定了解決多Agent協(xié)作問題的基礎(chǔ).

        近年來,由于現(xiàn)實(shí)世界的開放性和動(dòng)態(tài)性,傳統(tǒng)的Agent靜態(tài)交互模型已經(jīng)不能滿足研究需要.Hewitt等人[17]指出系統(tǒng)的協(xié)作應(yīng)該是開放和動(dòng)態(tài)的,并在此基礎(chǔ)上提出了開放分布式人工智能系統(tǒng)思想,即Agent的動(dòng)態(tài)交互思想.而后來的研究在協(xié)作求解方面提出了一些Agent協(xié)作模型,比如:聯(lián)合意圖模型、聯(lián)合承諾模型,共同計(jì)劃模型等[2].隨后在對(duì)協(xié)作問題的研究中,又將MAS間主要協(xié)作模型分為:黑板模型[18-19]、合同網(wǎng)模型[20]、關(guān)系網(wǎng)模型[21]、熟人模型[22].之后在此基礎(chǔ)上將Agent協(xié)作與語義技術(shù)相結(jié)合,進(jìn)一步提出承諾模型[23]的概念.關(guān)于承諾模型的研究也是當(dāng)前Agent協(xié)作領(lǐng)域最新的研究方向之一.

        2)從同構(gòu)到異構(gòu)變化.隨著網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,研究適應(yīng)于互聯(lián)網(wǎng)的異構(gòu)Agent技術(shù)和協(xié)作模型逐漸成為MAS領(lǐng)域的熱點(diǎn)[24].一方面,有關(guān)開放環(huán)境下的Agent語言、交互協(xié)議、體系結(jié)構(gòu)等標(biāo)準(zhǔn)和規(guī)范不斷被提出;另一方面,由于Internet的動(dòng)態(tài)開放等特性,傳統(tǒng)的各種協(xié)作技術(shù)和協(xié)作模型也在進(jìn)行修改和擴(kuò)展,使之能適用于互聯(lián)網(wǎng)環(huán)境.與此同時(shí),MAS與其它新興網(wǎng)絡(luò)技術(shù)的密切結(jié)合日益成為一種新的發(fā)展趨勢(shì).語義Web技術(shù)、自治計(jì)算技術(shù)、面向服務(wù)的計(jì)算技術(shù)、網(wǎng)格計(jì)算、P2P計(jì)算等新興計(jì)算技術(shù)已經(jīng)引起國內(nèi)外學(xué)術(shù)界的廣泛關(guān)注.

        在最近幾年里,開放環(huán)境下異構(gòu)Agent協(xié)作發(fā)展趨勢(shì)是Agent技術(shù)與語義技術(shù)的結(jié)合[25-28],目前語義技術(shù)的核心就是使用本體論中的概念、屬性和關(guān)系給出一個(gè)機(jī)器可理解的明確的規(guī)范說明,從而通過Agent團(tuán)隊(duì)管理和協(xié)作求解來促進(jìn)和管理異構(gòu)Agent的協(xié)作.而承諾模型[29-31]是異構(gòu)Agent協(xié)作與語義技術(shù)結(jié)合的最具代表性模型之一,也是當(dāng)前異構(gòu)Agent協(xié)作研究的重點(diǎn).

        2012 年,Singh和 Telang[32-34]從語義學(xué)(seman?tics)的角度將目標(biāo)(goal)和承諾(commitment)結(jié)合起來,提出了承諾的生命周期理論,并從語義學(xué)上定義了Agent的目標(biāo)和承諾,同時(shí)定義了一系列基于承諾的推理規(guī)則.

        2013 年,Meneguzzi[35-36]在 Telang的承諾理論基礎(chǔ)上提出了基于承諾和目標(biāo)的一階線性表達(dá)式,并使用 HTN(hierarchical task networks,HTN)來描述如何將一個(gè)等級(jí)較高的任務(wù)分解成一個(gè)個(gè)小的、離散的任務(wù),并生成解決方案的過程.

        2014 年,Akin Gunay[37]在結(jié)合 Telang和 Singh關(guān)于Agent承諾研究的基礎(chǔ)上進(jìn)一步簡(jiǎn)化了承諾的生命周期模型,并提出了在開放系統(tǒng)中動(dòng)態(tài)生成承諾協(xié)議的實(shí)現(xiàn)方法.

        2015 年 ,Matteo Baldoni[38]在 JaCaMo(一 種Agent程序設(shè)計(jì)框架)開發(fā)平臺(tái)的基礎(chǔ)上提出了JaCaMo+,并從程序設(shè)計(jì)的角度闡述了如何動(dòng)態(tài)生成Agent承諾和目標(biāo)的過程.

        3 多Agent協(xié)作模型比較

        3.1 多Agent協(xié)作模型

        比較具有代表性的Agent協(xié)作模型主要包括:黑板模型、合同網(wǎng)模型、關(guān)系網(wǎng)模型和熟人模型.后來的很多研究在此基礎(chǔ)上做了補(bǔ)充和擴(kuò)展,進(jìn)一步提出承諾模型[39]的概念.

        Erman等人在1980年首次提出了黑板模型[40].基于黑板模型的MAS包括Agent,黑板和網(wǎng)絡(luò)三個(gè)部分.黑板是Agent之間交互的中介,Agent通過黑板與其它Agent進(jìn)行交互并完成協(xié)作過程,而Agent之間的通訊則是靠網(wǎng)絡(luò)實(shí)現(xiàn)的,通常是TCP∕IP協(xié)議.其體系結(jié)構(gòu)比較簡(jiǎn)單,容易理解,重點(diǎn)是規(guī)范黑板消息格式.黑板模型的不足之處在于結(jié)構(gòu)單一,集中式交互使得黑板開銷過大,交互方式缺乏靈活性.

        Davis和R.G Smith提出合同網(wǎng)模型[20],該模型是協(xié)商模型最典型的代表,其源自于社會(huì)生產(chǎn)生活,它仿照企業(yè)合同模式,以滿足全局最大利益為目標(biāo).在合同網(wǎng)中主要包括三種對(duì)象:管理者、投標(biāo)者以及合同者.其整個(gè)過程類似于工程的招標(biāo)和投標(biāo)行為,管理者首先發(fā)布需求,而若干個(gè)有能力完成任務(wù)的Agent成為投標(biāo)者,最終中標(biāo)者將成為合同簽訂者,從而建立簡(jiǎn)單的合作關(guān)系.在合同簽訂結(jié)束后簽訂者要向管理者反饋其執(zhí)行結(jié)果,然后管理者進(jìn)行審查,若審查通過,則給出終止信息,合同網(wǎng)協(xié)議過程便會(huì)停止.該模型以及相關(guān)擴(kuò)展模型[41-43]可解決任務(wù)分配及資源沖突問題.合同網(wǎng)的不足在于以廣播方式招標(biāo)且所有Agent均可投標(biāo),通信負(fù)載大,系統(tǒng)效率不高.

        Jennings和 Roda提出熟人模型[44],這種模型以人類合作習(xí)慣與合作機(jī)制為范本,設(shè)計(jì)了一個(gè)模型表示Agent自身的信息,該方法使用一個(gè)熟人模型來專門表示其他Agent的能力和資源方面的信息.若需要確定協(xié)作對(duì)象,它首先會(huì)先對(duì)各熟人活動(dòng)進(jìn)行評(píng)估,然后從中選擇最適合的合作對(duì)象.熟人模型的不足在于增加了在本地建立和維護(hù)熟人模型所帶來的系統(tǒng)資源開銷.

        陳剛和陳汝玲為解決多Agent系統(tǒng)協(xié)作中通信和資源開銷問題提出了關(guān)系網(wǎng)模型[21].關(guān)系網(wǎng)模型不需要?jiǎng)?chuàng)建專門的中間協(xié)調(diào)Agent或熟人模型來記錄所有Agent通訊信息,可有效降低系統(tǒng)資源開銷.熟人關(guān)系網(wǎng)中的每一個(gè)Agent結(jié)點(diǎn)只需在內(nèi)部創(chuàng)建并維護(hù)一個(gè)最近訪問頻率較高的熟人通訊錄,限定通訊錄的容量(比如只記錄幾十條熟人信息).關(guān)系網(wǎng)模型的不足之處在于對(duì)個(gè)體信息處理和存儲(chǔ)能力的要求很高,且信任度的設(shè)置具有主觀性.

        Cohen和 Levesque從意圖(intention)和目標(biāo)(goal)的角度提出了Agent承諾(commitment)的概念[45].國內(nèi)學(xué)者張偉、石純一則在此基礎(chǔ)上提出Agent的組織承諾和小組承諾[46],進(jìn)一步推廣了Jennings和Ferber等人對(duì)Agent組織的研究.在上一節(jié)中闡述了Agent承諾機(jī)制的基本概念,它是各Agent之間相互協(xié)調(diào)、合作和通訊的必要保證,確保Agent擁有足夠的能力完成它所承諾的任務(wù).Agent對(duì)一個(gè)意圖應(yīng)該承諾多少既取決于最大期待值,又取決于最小風(fēng)險(xiǎn)值.通過比較各Agent的承諾值,選取最合適的Agent對(duì)象進(jìn)行協(xié)作,既保證了任務(wù)完成的可靠性也提高了Agent的使用效率.承諾模型的研究難點(diǎn)在于由任務(wù)本身的不確定以及Agent規(guī)劃過程的不確定導(dǎo)致承諾的不確定性.

        3.2 協(xié)作模型的特點(diǎn)及比較

        從以上對(duì)多Agent協(xié)作機(jī)制及相應(yīng)模型的研究中可以看出:一個(gè)高效的Agent協(xié)作模型應(yīng)該具有以下5個(gè)基本特點(diǎn):

        1)健壯性和容錯(cuò)性.健壯性是指團(tuán)隊(duì)具有故障弱化的能力,即團(tuán)隊(duì)中某個(gè)個(gè)體任務(wù)的失敗不會(huì)影響整體行為;容錯(cuò)性是指團(tuán)隊(duì)?wèi)?yīng)具有檢測(cè)和彌補(bǔ)這部分失敗的能力.

        2)實(shí)時(shí)反應(yīng)性.復(fù)雜動(dòng)態(tài)、不確定性的環(huán)境要求Agent能在環(huán)境的動(dòng)態(tài)變化中進(jìn)行及時(shí)、快速的反應(yīng).

        3)靈活性.這里的靈活性包括三個(gè)方面:a)協(xié)作模型的適應(yīng)性;b)協(xié)作模型的可重用性;c)協(xié)作模型的可擴(kuò)展性.

        4)持久穩(wěn)定性.許多Agent環(huán)境都要求Agent和Agent團(tuán)隊(duì)具有持久穩(wěn)定性,即它能夠長(zhǎng)時(shí)間的穩(wěn)定的運(yùn)行.

        5)動(dòng)態(tài)性和異構(gòu)性.動(dòng)態(tài)性是指Agent可在動(dòng)態(tài)、開放環(huán)境下運(yùn)行;異構(gòu)性是指不同的Agent可以擁有不同的能力或組織結(jié)構(gòu).

        如果將Agent性能的量化等級(jí)分為5級(jí):極差、較差、一般、較好、極好,則上述5種模型在多Agent協(xié)作模型性能方面的比較如表1所示.

        表1 多Agent協(xié)作模型性能比較Tab.1 Comparison of performance of five models in agent collaboration

        1)黑板模型:集中式交互導(dǎo)致一旦黑板共享資源發(fā)生未知錯(cuò)誤,整個(gè)Agent系統(tǒng)都會(huì)崩潰,健壯性較差.

        集中式交互使得各Agent能及時(shí)將主體信息發(fā)布到黑板上,實(shí)時(shí)反應(yīng)性較好.

        2)合同網(wǎng)模型:各Agent間通過招標(biāo)-投標(biāo)-中標(biāo)方式協(xié)作,部分Agent故障不會(huì)影響全局,健壯性較好.以廣播方式招標(biāo)且所有Agent均可投標(biāo),導(dǎo)致通信負(fù)載大,實(shí)時(shí)反應(yīng)性較差.

        3)熟人模型:使用熟人模型集中對(duì)各Agent進(jìn)行評(píng)估,一旦熟人模型評(píng)估出現(xiàn)錯(cuò)誤將影響全局,健壯性較差.采用集中式評(píng)估避免通信負(fù)載過大,實(shí)時(shí)反應(yīng)性較好.

        4)關(guān)系網(wǎng)模型:分布式管理使得部分Agent關(guān)系異常不會(huì)影響整個(gè)關(guān)系網(wǎng),健壯性較好.個(gè)體Agent具有信息處理能力,可同時(shí)進(jìn)行多個(gè)Agent協(xié)作過程,實(shí)時(shí)反應(yīng)性較好.

        5)承諾模型:通過Agent之間的社會(huì)承諾,確保Agent擁有足夠的能力完成它所承諾的任務(wù),減少任務(wù)失敗率,健壯性較好.以承諾度作為選擇合作Agent的標(biāo)準(zhǔn),提高了Agent使用效率和任務(wù)的完成效率,實(shí)時(shí)反應(yīng)性較好.

        由上述比較可以看出,在健壯性方面,由于承諾模型通過Agent之間相互承諾,確保Agent有能力完成它所承諾的任務(wù),因而任務(wù)完成率較高,健壯性較好;在反應(yīng)性和靈活性方面,由于承諾模型中,Agent之間可以進(jìn)行分布式交互,即不需要中央管理器的控制,因此靈活性較好,Agent之間信息交互可以不經(jīng)過中央管理器,因此所占資源較少,實(shí)時(shí)反應(yīng)性更強(qiáng);在動(dòng)態(tài)性和異構(gòu)性方面,當(dāng)外界環(huán)境動(dòng)態(tài)發(fā)生改變時(shí),各異構(gòu)Agent之間會(huì)根據(jù)當(dāng)前環(huán)境動(dòng)態(tài)生成承諾協(xié)議,即完成整個(gè)任務(wù)的所有步驟,在生成的多個(gè)承諾協(xié)議中,根據(jù)最大效用值選擇最優(yōu)協(xié)議,并順序執(zhí)行.若當(dāng)前環(huán)境再次發(fā)生改變,則會(huì)使已生成的協(xié)議失效,并重新生成新的協(xié)議.由此可以看出承諾模型在異構(gòu)Agent中具有較好的動(dòng)態(tài)性和自適應(yīng)性.

        4 異構(gòu)Agent協(xié)作模型應(yīng)用

        異構(gòu)Agent協(xié)作模型具有非常廣泛的應(yīng)用,基于Action的協(xié)作模型主要應(yīng)用在仿真機(jī)器人領(lǐng)域[47];基于學(xué)習(xí)和規(guī)劃的協(xié)作模型可以應(yīng)用在金融學(xué)、生物學(xué)、數(shù)學(xué)、自動(dòng)化等協(xié)作決策領(lǐng)域[48]以及虛擬現(xiàn)實(shí)領(lǐng)域[49]中.

        4.1 異構(gòu)模型在智能足球機(jī)器人中的應(yīng)用

        制造和訓(xùn)練機(jī)器人使其仿照人類進(jìn)行足球比賽,是當(dāng)前人工智能和機(jī)器人領(lǐng)域研究熱點(diǎn)之一[47].比賽通常是在仿真環(huán)境下進(jìn)行,而仿真平臺(tái)的設(shè)計(jì)充分體現(xiàn)了智能機(jī)器人在通訊、傳感等方面的限制,以及環(huán)境的開放性與不確定性.

        在2D仿真機(jī)器人組中,足球比賽是在仿真環(huán)境下完成.其中包括Agent之間交互、協(xié)商、合作、實(shí)時(shí)規(guī)劃與決策的過程.在仿真機(jī)器人球隊(duì)中主要有兩種類型的Agent,即守門員Agent和球員Agent.由于各自分配的任務(wù)不同,它們的功能也不相同,因而整個(gè)協(xié)作過程就是異構(gòu)多Agent協(xié)作、決策、規(guī)劃的動(dòng)態(tài)過程.當(dāng)前的機(jī)器人仿真組具有以下幾個(gè)特點(diǎn):

        1)復(fù)雜性.隊(duì)員沒有完整的外界環(huán)境信息;

        2)不確定性.有一定幾率會(huì)發(fā)生隊(duì)員執(zhí)行任務(wù)失敗的情況;

        3)動(dòng)態(tài)性.每一個(gè)隊(duì)員可以獨(dú)立行動(dòng),而且對(duì)手可以隨時(shí)出現(xiàn)或消失;

        4)對(duì)抗性.對(duì)手的存在意味著在執(zhí)行任務(wù)時(shí)會(huì)受到更多的阻礙;

        5)不可靠通信環(huán)境.由于低帶寬所造成的通訊延遲或中斷,導(dǎo)致比賽過程受阻.

        從上述特點(diǎn)可以看出,機(jī)器人足球是一個(gè)相對(duì)復(fù)雜的領(lǐng)域,它需要Agent之間能夠?qū)崟r(shí)交互和協(xié)作,動(dòng)態(tài)規(guī)劃和實(shí)時(shí)決策,進(jìn)而克服復(fù)雜的,動(dòng)態(tài)的,不確定的環(huán)境影響,以及通訊和傳感等方面的限制.

        4.2 異構(gòu)模型在市場(chǎng)投資決策中的應(yīng)用

        市場(chǎng)決策Agent[48]是用于模擬市場(chǎng)運(yùn)行機(jī)制、拍賣策略以及供給產(chǎn)業(yè)鏈管理等的一種概念模型,可有效協(xié)助人類進(jìn)行智能決策.這種Agent協(xié)作過程與同構(gòu)Agent協(xié)作不同,因?yàn)樗a(chǎn)生貿(mào)易信息的方式通常是由多個(gè)異構(gòu)Agent實(shí)現(xiàn)的.在整個(gè)市場(chǎng)投資協(xié)同決策中,主要有兩類Agent,一類是自演化決策Agent,另一類是協(xié)作決策Agent.

        自演化Agent擁有自優(yōu)化的計(jì)算能力,它們能基于當(dāng)前給定的最優(yōu)化目標(biāo)尋找最優(yōu)策略.整個(gè)搜索過程包括發(fā)出最優(yōu)化請(qǐng)求,創(chuàng)建候選決策,評(píng)估候選決策,候選決策間的交互,改變候選決策,重新評(píng)估候選決策和最優(yōu)化決策的過濾.

        協(xié)作Agent在整個(gè)任務(wù)求解過程中用于與自演化Agent協(xié)商和協(xié)調(diào)以尋找局部最優(yōu)決策.在必要條件下協(xié)作Agent會(huì)和自演化Agent團(tuán)體協(xié)商多個(gè)回合以尋找每個(gè)自演化Agent的局部最優(yōu)化決策,接下來將這些局部最優(yōu)決策整合生成一個(gè)全局最優(yōu)目標(biāo).

        協(xié)同決策系統(tǒng)多用于股票投資市場(chǎng),通過收集多個(gè)股票市場(chǎng)近幾年股票價(jià)格的走勢(shì)以及在每個(gè)交易點(diǎn)用戶做過的最佳決策,對(duì)自演化Agent進(jìn)行最優(yōu)化訓(xùn)練.比如,收集近5年的股市信息,其中3年用于Agent自演化訓(xùn)練,另外兩年用于測(cè)試Agent自演化訓(xùn)練的結(jié)果.整個(gè)決策過程包括:

        1)數(shù)據(jù)管理Agent準(zhǔn)備測(cè)試數(shù)據(jù),一部分用于Agent自演化過程,另一部分則用于自演化結(jié)果的測(cè)試.

        2)自演化Agent尋找自身局部最優(yōu)決策,保存在自己知識(shí)庫中,同時(shí)過濾掉相對(duì)較差的決策.這個(gè)過程是一直迭代進(jìn)行的,既發(fā)生在演化學(xué)習(xí)階段,也發(fā)生在測(cè)試階段.

        3)協(xié)作Agent提取每個(gè)自演化Agent存儲(chǔ)的最優(yōu)化決策,整合生成一個(gè)全局最優(yōu)決策,最終做出合理投資決策.

        4.3 異構(gòu)模型在虛擬團(tuán)隊(duì)訓(xùn)練中的應(yīng)用

        在現(xiàn)實(shí)生活中,團(tuán)隊(duì)任務(wù)無處不在,復(fù)雜的任務(wù)通常需要多個(gè)不同角色協(xié)作來完成[49].每一個(gè)角色必須能夠熟悉自己的任務(wù)、職責(zé)并且學(xué)習(xí)如何在團(tuán)隊(duì)中和隊(duì)友進(jìn)行協(xié)調(diào).然而由于訓(xùn)練設(shè)備在通常情況下很難獲得或者代價(jià)昂貴等問題,這種訓(xùn)練條件往往難以達(dá)到,因此虛擬團(tuán)隊(duì)訓(xùn)練產(chǎn)生了.它通過虛擬現(xiàn)實(shí)技術(shù),創(chuàng)造出一個(gè)3D的,虛擬訓(xùn)練者與被訓(xùn)練者之間交互的仿真環(huán)境.而異構(gòu)模型就被應(yīng)用到這個(gè)仿真環(huán)境中,通過Agent與受訓(xùn)者之間的交互,保證受訓(xùn)者的學(xué)習(xí)效率并控制學(xué)習(xí)成本.

        在仿真環(huán)境下,虛擬團(tuán)隊(duì)由Agent和受訓(xùn)者組成.在團(tuán)隊(duì)中每一個(gè)成員都會(huì)被分配給一個(gè)特定的角色,當(dāng)然也包括Agent在內(nèi),每一個(gè)受訓(xùn)者都會(huì)分配一個(gè)Agent訓(xùn)練者.通過在虛擬環(huán)境下Agent充當(dāng)訓(xùn)練者的過程,可以在缺少真人教練的情況下對(duì)受訓(xùn)者進(jìn)行仿真訓(xùn)練.整個(gè)虛擬環(huán)境具有開放性、動(dòng)態(tài)性的特點(diǎn),訓(xùn)練者與Agent之間也會(huì)進(jìn)行人機(jī)交互,而其中環(huán)境的變化,人對(duì)Agent做出動(dòng)作的不確定性,都會(huì)使整個(gè)環(huán)境的狀態(tài)變得無法預(yù)測(cè).因此虛擬訓(xùn)練向Agent協(xié)作研究提出新要求,即如何在動(dòng)態(tài)、未知環(huán)境下,實(shí)現(xiàn)人機(jī)之間友好交互,并能實(shí)時(shí)處理突發(fā)情況.

        5 結(jié) 語

        多Agent系統(tǒng)(MAS)是分布式人工智能領(lǐng)域一個(gè)熱門的研究方向,其理論研究和相關(guān)技術(shù)在社會(huì)各個(gè)領(lǐng)域得到廣泛應(yīng)用.在異構(gòu)Agent系統(tǒng)應(yīng)用中,面對(duì)復(fù)雜、動(dòng)態(tài)變化的網(wǎng)絡(luò)和社會(huì)環(huán)境,如何構(gòu)建高效、靈活、反應(yīng)速度快的協(xié)作模型,是多Agent協(xié)作系統(tǒng)必須解決的難點(diǎn)問題.

        在分析異構(gòu)Agent協(xié)作的研究背景及國內(nèi)外研究現(xiàn)狀的基礎(chǔ)上,對(duì)異構(gòu)Agent理論和協(xié)作機(jī)制分別進(jìn)行了概述.在介紹Agent協(xié)作框架的基礎(chǔ)上,總結(jié)了當(dāng)前最具代表性的幾種Agent協(xié)作模型,闡述其特點(diǎn)并進(jìn)行對(duì)比,突出了承諾模型在異構(gòu)Agent協(xié)作性能中的優(yōu)勢(shì).最后介紹了Agent協(xié)作模型在不同領(lǐng)域的應(yīng)用,并提出當(dāng)前承諾模型的不足與改進(jìn)方向.

        在當(dāng)前異構(gòu)Agent協(xié)作的研究中,環(huán)境的開放性和不確定性是構(gòu)建協(xié)作模型的難題,因此,需要一種能將這種不確定信息考慮進(jìn)去的表示方法.Agent承諾模型能夠較好解決由于環(huán)境不確定導(dǎo)致任務(wù)完成率不高以及Agent異構(gòu)等問題[50-51].

        然而,目前關(guān)于Agent承諾的生成大多停留在手工預(yù)設(shè)和創(chuàng)建階段[52-53].這種創(chuàng)建模式有以下不足:1)Agent發(fā)生改變.在開放系統(tǒng)中,新的Agent隨時(shí)可能進(jìn)入系統(tǒng),不能保證新的Agent會(huì)使用該系統(tǒng)中原有Agent使用的協(xié)議;2)環(huán)境發(fā)生改變.當(dāng)環(huán)境發(fā)生改變時(shí),某些原有的Agent服務(wù)可能無法執(zhí)行,從而導(dǎo)致當(dāng)前Agent承諾協(xié)議失效;3)Agent的優(yōu)先項(xiàng)發(fā)生改變.由于Agent自身資源占用問題,可能會(huì)出現(xiàn)暫時(shí)資源不足無法完成任務(wù)的情形,這時(shí)原有的承諾協(xié)議便失去作用,因此如何在開放環(huán)境下動(dòng)態(tài)地生成Agent承諾是一個(gè)亟待解決的問題.

        [1]HOEK W V D,WOOLDRIDGE M.Model checking cooperation,knowledge and time——a case study[J].Research in Economics,2003,57(3):235-265.

        [2]黃麗麗.基于多Agent的智能生存空間異構(gòu)協(xié)作研究[D].北京:北京交通大學(xué),2014.

        [3]李靜,陳兆乾,陳世福,等.多Agent Teamwork研究綜述[J]. 計(jì)算機(jī)研究與發(fā)展,2004,40(3):422-429.LI J,CHEN Z Q,CHEN S F,et al.Survey of multiple agents teamwork[J].Journal of Computer Research and Development,2004,40(3):422-429.

        [4]IBM.UPMC takes health care delivery to new levels with dynamic infrastructure [EB∕OL](2012-09-05)[2015-05-06]. https:∕∕www-03.ibm.com∕press∕us∕en∕pressrelease∕38722.wss.

        [5]CAO L,LUO D,ZHENG X Y.Agent collaboration for multiple trading strategy integration[C]∕∕KES-AMSTA.Second Kes International Symposium.Incheon:ACM Press,2008:361-370.

        [6]WOOLDRIDGE M,JENNINGS N R.Intelligent agents:theory and practice [J]. Knowledge Engineering Review,1994,10(2):115-152.

        [7]張斯亮.MAS中各Agent之間的沖突與協(xié)調(diào)[J].計(jì)算機(jī)科學(xué),2004,31(10):264-266.ZHANG S L.The conflict and cooperation of individual agents in MAS[J].Computer Science,2004,31(10):264-266.

        [8]STONE P,VELOSO M.Multi-agent systems:a survey from a machine learning perspective[J].Autonomous Robots,2000,8(3):345-383.

        [9]徐衛(wèi)濱.多Agent系統(tǒng)中Agent承諾的研究[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2008,18(18):125-126.XU W B.The research on the commitment in the multi-agent system [J]. Sci-tech Information Development and Economy,2008,18(18):125-126.

        [10]賈利民,劉剛,秦勇.基于智能Agent的動(dòng)態(tài)協(xié)作任務(wù)求解[M].1版.北京:北京科學(xué)出版社,2007.

        [11]段領(lǐng)玉.基于博弈論的多Agent協(xié)作研究[D].新鄉(xiāng):河南師范大學(xué),2015.

        [12]RIEDMILLER M,GABEL T.Brainstormers 2D——team description[C]∕∕RSWC.Ninth Robot Soccer World Cup.Berlin:Springer Press,2005:17-26.

        [13]劉榮.多Agent協(xié)作機(jī)制的研究與應(yīng)用[D].南京:南京航空航天大學(xué),2012.

        [14]竇立謙.多Agent協(xié)作與協(xié)調(diào)的研究[D].天津:天津大學(xué),2005.

        [15]GROSE B.Collaborative system[M].1st ed.Palo Alto:AAAI Press,1996.

        [16]ROSENSCHEIN J S.Rational interaction:cooperation among intelligent agents[D].San Francisco:Stanford University,1986.

        [17]HEWITT C,INMAN J.DAI betwixt and between:from“intelligentagents” to open systems science[J].Systems Man&Cybernetics IEEE Transactions on,1991,21(6):1409-1419.

        [18]NII H P.Blackboard systems:the blackboard and model of problem solving and the evolution of blackboard architectures[J].AI Magazine,1986,7(2):38-53.

        [19]GILMORE J F.Implementation of a generic blackboard architecture[J].Applications of Artificial Intelligence,1987,786(5):116-124.

        [20]SMITH R G.The contract net protocol:high-level communication and control in a distributed problem solver[J].IEEE Transactions on Computers,1980,29(12):1104-1113.

        [21]陳剛,陸汝玲.關(guān)系網(wǎng)模型——基于社會(huì)合作機(jī)制的多Agent協(xié)作組織方法[J].計(jì)算機(jī)研究與發(fā)展,2003,40(1):107-114.CHEN G,LU R L.The relation web model——an organizational approach to agent cooperation based on social mechanism[J].Journal of Computer Research and Development,2003,40(1):107-114.

        [22]袁源,慕德俊,戴冠中.基于熟人模型的移動(dòng)Agent安全機(jī)制研究[J].微處理機(jī),2012,33(1):37-39.YUAN Y,MU D J,DAI G Z.Mobile agent security based on acquaintance model[J].Microprocessors,2012,33(1):37-39.

        [23]莫思敏,譚瑛,曾建潮.基于承諾度的尋找合作Agent的方法[J].計(jì)算機(jī)科學(xué)與工程,2006,28(5):91-93.MO S M,TAN Y,ZENG J C.A method of finding cooperative agents based on the degree of commitment[J].Computer Engineering and Science,2006,28(5):91-93.

        [24]劉芳.基于過程本體的異質(zhì)Agent協(xié)作技術(shù)研究[D].長(zhǎng)沙:國防科技大學(xué),2006.

        [25]WINIKOFF M.Implementing flexible and robust agent interactions using distributed commitment machines[J].Multiagent and Grid Systems,2006,2(4):365–381.

        [26]YOLUM P.Design time analysis of multiagent protocols[J].Data and Knowledge Engineering,2007,63(1):137-154.

        [27]GERARD S N,SINGH M P.Evolving protocols and agents in multiagent systems [C]∕∕ AAMAS.Proceedings of2013 InternationalConference on Autonomous Agent and Multi-Agent Systems.New York:ACM Press,2013:997-1004.

        [28]TELANG P R,MENEGUZZIF,SINGH M P.Hierarchical planning about goals and commitments[C]∕∕AAMAS.Proceedingsof2013 InternationalConference on Autonomous Agent and Multi-Agent Systems.New York:ACM Press,2013:877-884.

        [29]YOLUM P,SINGH M P.Reasoning about commitments in the event calculus:an approach for specifying and executing protocols[J].Annals of Mathematics&Artificial Intelligence,2004,42(1∕2∕3):227-253.

        [30]TORRONI P,CHESANI F,GAVANELLI M,et al.A computational logic application frame work for service discovery and contracting[J].International Journal of Web Services Research,2011,8(3):1-25.

        [31]PHAM D Q,HARLAND J.Temporal linear logic as a basis for flexible agent interactions[C]∕∕AAMAS.Proceedings of the 2007 International Joint Conference on Autonomous Agents and Multi-Agent Systems.New York:ACM Press,2007:1-8.

        [32]SINGH M P.Trust as dependence:a logical approach[C]∕∕AAMAS.Proceedings of the 2011 International Joint Conference on Autonomous Agents and Multi-Agent Systems.New York:ACM Press,2011:863-870.

        [33]TEACY W T L,PATEL J,JENNINGS N R,et al.TRAVOS:Trust and reputation in the context of inaccurate information sources [J]. Autonomous AgentsandMulti-agentSystems,2006,12(2):183-198.

        [34]TELANG P R, SINGH M P.Comma:a commitment-based business modeling methodology and its empirical evaluation [C]∕∕ AAMAS.Proceedings of the 2012 International Joint Conference on Autonomous Agents and Multi-agent Systems.New York:ACM Press,2012:1073-1080.

        [35]TELANG P R, SINGH M P, YORKESMITH N.Relating goal and commitment semantics [J].International Conference on Programming Multi-Agent Systems,2011,7217(1):22-37.

        [36]MENEGUZZI F,TELANG P R,SINGH M P.A first-order formalization of commitments and goals for planning[C]∕∕AAAI.Twenty-seventh Conference on Artificial Intelligence.New York:ACM Press,2013:697-703.

        [37]GUNAY A,WINIKOFF M,YOLUM P.Dynamically generated commitment protocols in open systems[J].Auton Agent Multi-Agent System,2015,29(2):192-229.

        [38]MATTEO B.Programming with commitments and goals in JaCaMo+[D].Piedmont:Università di Torino,2015.

        [39]楊靈利.多Agent系統(tǒng)交互協(xié)作的研究與建模[D].沈陽:沈陽師范大學(xué),2013.

        [40]ERMAN L D,HAYESROTH F,LESSER V R,et al.The Hearsay-II speech understanding system[J].The Journal of the Acoustical Society of America,1976,60(11):11-23.

        [41]BIETHAH N J,HUMMELTENBERG W,SCHMIDT B,et al.Multi-agent system negotiation based on contract netprotocolresearch [C]∕∕ NLP-KE.The 2005 International Conference on Natural Language Processing.Piscataway:IEEE Press,2005:472-478.

        [42]YUN H,LI Q,JIANG D,et al.A contract net protocol based on information intermediary service in multi-agent system[C]∕∕AICI.The 2009 International Conference on Artificial Intelligence and Computational Intelligence.Piscataway:IEEE Press,2009:19-23.

        [43]ZHOU Z,CHENG S,LIU Q.A novel contract net negotiation model based on trust mechanism[C]∕∕ICCIS.The 2008 Conference on Cybernetics and Intelligent Systems.Piscataway:IEEE Press,2008:884-887.

        [44]RODA C,JENNINGS N R,MAMDANI E H,et al.The impact of heterogeneity on cooperating agents[J].History of Neuroscience,1991,42(1):556-561.

        [45]COHEN P R,LEVESQUE H J.Intention is choice with commitment[J]. Artificial Intelligence,1990, 42(2∕3):213-261.

        [46]張偉,石純一.Agent的組織承諾和小組承諾[J].軟件學(xué)報(bào),2003,14(3):473-478.ZHANG W,SHI C Y.Agent organization commitment and group commitment[J].Journal of Software,2003,14(3):473-478.

        [47]盧振利,田鎧,劉叔軍,等.足球機(jī)器人交互規(guī)則控制系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)仿真,2015,32(5):368-373.LU Z L,TIAN K,LIU S J,et al.The rules of soccer robot interaction control system design[J].Computer Simulation,2015,32(5):368-373.

        [48]PLAZA E,ONTANON S.Learningcollaboration strategies for committees oflearning agents[J].Autonomous Agents and Multi-Agent Systems,2006,13(3):429-461.

        [49]蔡林沁,梅濤,孫怡寧.用于決策訓(xùn)練的虛擬人行為認(rèn)知模型研究[J].系統(tǒng)仿真學(xué)報(bào),2008,20(2):368-371.CAI L Q,MEI T,SUN Y N.Research on behavior and cognition models of virtual human for decision training[J].Journal of System Simulation,2008,20(2):368-371.

        [50]OSAWA E I.A scheme for agent collaboration in open multiagent environments[C]∕∕AAAI.Proceedings of the 1993 International Joint Conference on Artificial Intelligence.New York:ACM Press,1993:352-358.

        [51]ANGELOPOULOS K,AYDEMIR F B,GIORGINI P,etal.Solving the nextadaptation problem with prometheus [C]∕∕ RCIS. Tenth International Conference on Research Challenges in Information Science.Piscataway:IEEE Press,2016:1-10.

        [52]ZAHARIJA G,MLADENOVIC S,MALES L.Unibot,a universal agent architecture for robots[J].Journal of Computing and Information Technology, 2017,25(1):31-45.

        [53]MALIAH S, SHANI G, STERN R.Collaborative privacy preserving multi-agent planning planners and heuristics[J]. Auton AgentMulti-AgentSystem,2017,31(1):493-530.

        本文編輯:陳小平

        Progress in Heterogeneous Agent Collaboration

        WANG Jing,LIU Wei*,WU Kun,LI Shuang
        School of Computer Science and Engineering,Wuhan Institute of Technology,Wuhan 430205,China

        To begin with,we summarized the multi-agent theories and collaborative mechanisms based on analyzing the background and current situation of agent collaboration research.Then,after the study of agent collaborative framework,we analyzed some most representative collaboration models,such as blackboard model,contract model,acquaintance model,relation web model and commitment model,illustrating and comparing their characteristics in the aspects of dynamic,heterogeneity,reaction and flexibility to reflect the advantages of commitment model.Finally,we introduced the application of agent collaborative models in the fields of artificial soccer robots,integrating decision and virtual training.By comparing different collaboration models and describing their applications,we presented the advantages of commitment model in the aspects of dynamics,flexibility and reaction and tried to improve the current agent commitment model and proposed the improvement direction of the model.

        multi-agent system;heterogeneous;collaboration;mechanism;framework;model

        TP311

        A

        10.3969∕j.issn.1674?2869.2017.04.012

        2017-05-22

        國家自然科學(xué)基金(61502355);國家測(cè)繪局測(cè)繪地理信息公益性行業(yè)科研專項(xiàng)(201412014);武漢工程大學(xué)科學(xué)研究基金(K201475)

        王 晶,碩士研究生.E-mail:878376339@qq.com

        *通訊作者:劉 瑋,博士,副教授.E-mail:liuwei@wit.edu.cn

        王晶,劉瑋,吳坤,等.異構(gòu)Agent協(xié)作的研究進(jìn)展[J].武漢工程大學(xué)學(xué)報(bào),2017,39(4):378-386.

        WANG J,LIU W,WU K,et al.Progress in heterogeneous agent collaboration[J].Journal of Wuhan Institute of Technology,2017,39(4):378-386.

        1674-2869(2017)04-0378-09

        猜你喜歡
        異構(gòu)協(xié)作決策
        試論同課異構(gòu)之“同”與“異”
        為可持續(xù)決策提供依據(jù)
        團(tuán)結(jié)協(xié)作成功易
        決策為什么失誤了
        協(xié)作
        讀者(2017年14期)2017-06-27 12:27:06
        overlay SDN實(shí)現(xiàn)異構(gòu)兼容的關(guān)鍵技術(shù)
        LTE異構(gòu)網(wǎng)技術(shù)與組網(wǎng)研究
        協(xié)作
        讀寫算(下)(2016年9期)2016-02-27 08:46:31
        可與您并肩協(xié)作的UR3
        在新興異構(gòu)SoCs上集成多種系統(tǒng)
        91亚洲欧洲日产国码精品| 中国黄色偷拍视频二区| 一区二区三区国产内射| 青青草亚洲视频社区在线播放观看| 国产伦精品免编号公布| 少妇高潮喷水正在播放| 大白屁股流白浆一区二区三区| 日韩av一区二区三区高清| 久久久久人妻精品一区三寸| 亚洲综合久久成人a片| 国产午夜精品美女裸身视频69| 日韩美腿丝袜三区四区| 无码人妻一区二区三区兔费| 成人性生交大片免费看r| 亚洲中文字幕女同一区二区三区| 一区二区三区日本高清| 国内女人喷潮完整视频| 国产精品第一二三区久久蜜芽| 日韩女优中文字幕在线| 亚洲精品视频中文字幕| 久久精品亚洲精品国产色婷| 国产又黄又爽又色的免费| 久久精品国产丝袜| 少妇高潮太爽了免费网站| 狠狠综合久久av一区二区蜜桃 | 国产福利永久在线视频无毒不卡 | 青青草一级视频在线观看| 老熟女老女人国产老太| 欧美一区二区三区红桃小说| 午夜无码一区二区三区在线| 午夜麻豆视频在线观看| 久久天天躁夜夜躁狠狠| 亚洲精品无码av片| 国产av一区网址大全| 深夜福利国产精品中文字幕| 国产综合精品| 四虎4545www国产精品| 国产av一区仑乱久久精品| 精品无码av一区二区三区不卡| 亚洲美免无码中文字幕在线| 91免费国产|