亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多智能體博弈的紡織車間搬運(yùn)機(jī)器人任務(wù)分配

        2021-01-05 03:43:38南愷愷趙征凡王曉華景軍鋒
        紡織學(xué)報(bào) 2020年7期
        關(guān)鍵詞:車間決策機(jī)器人

        李 珣,南愷愷,趙征凡,王曉華,景軍鋒

        (1. 西安工程大學(xué) 電子信息學(xué)院,陜西 西安 710048; 2. 工業(yè)和信息化部 電子第五研究所,廣東 廣州 510610)

        無人化、智能化的生產(chǎn)加工環(huán)境是近年紡織產(chǎn)業(yè)升級(jí)的主流方向,因此,將機(jī)器人設(shè)置在生產(chǎn)環(huán)節(jié)中替代一部分簡(jiǎn)單的人力工作是紡織企業(yè)所采用的初步升級(jí)方式。對(duì)于紡織產(chǎn)品生產(chǎn)的基本單元車間而言,特別是紡織車間的棉卷搬運(yùn),以及某一特定棉卷裝卸需求,存在時(shí)間上的連續(xù)性和狀態(tài)上的離散性特征,所以需要多個(gè)移動(dòng)機(jī)器人協(xié)作完成,但是,當(dāng)大量的機(jī)器人出現(xiàn)在生產(chǎn)現(xiàn)場(chǎng),各機(jī)器人之間的對(duì)抗關(guān)系會(huì)顯著增加,系統(tǒng)生產(chǎn)效率會(huì)大大減?。灰虼?,將機(jī)器人個(gè)體間的信息與資源共享,對(duì)多機(jī)器人系統(tǒng)進(jìn)行智能化改造,能夠互補(bǔ)機(jī)器人狀態(tài)未知造成的任務(wù)完成時(shí)間斷續(xù)、累積,提升系統(tǒng)的魯棒性和容錯(cuò)能力。多機(jī)器人智能系統(tǒng)中,多任務(wù)的分配方案最優(yōu)化,是保障整體工作有序完成的基本條件,同時(shí)也是提高生產(chǎn)效率和降低機(jī)器人使用成本的前提。

        當(dāng)前多機(jī)器人任務(wù)分配的研究尚未有直接應(yīng)用在紡織制造領(lǐng)域的研究方案,但針對(duì)其他不同的應(yīng)用場(chǎng)景,國(guó)內(nèi)外學(xué)者提出了諸多卓有成效的任務(wù)分配實(shí)現(xiàn)方法[1-2]。從宏觀上主要可劃分為集中式和分布式2類。集中式的任務(wù)分配,如多維旅行商模型[3]、多維動(dòng)態(tài)網(wǎng)絡(luò)流優(yōu)化模型[4],能夠得到在靜態(tài)環(huán)境中的任務(wù)分配最優(yōu)解。隨著計(jì)算機(jī)運(yùn)行能力的提升和機(jī)器人個(gè)體智能化發(fā)展的需求,分布式的任務(wù)分配方法已成為主流的研究方向。其中,基于行為的分配方法,如Tang等[5]提出了一種基于啟發(fā)式搜索的多機(jī)器人系統(tǒng)任務(wù)分配算法,實(shí)現(xiàn)了異構(gòu)多機(jī)器人系統(tǒng)中的任務(wù)分配。雖然實(shí)時(shí)性和魯棒性較好,但是不能獲得全局最優(yōu)解。市場(chǎng)機(jī)制的任務(wù)分配方法[6-7]是基于市場(chǎng)經(jīng)濟(jì)的原則,在求解過程中充分考慮各個(gè)平臺(tái)間的信息交互和協(xié)商:如段俊花等[8]提出的基于視覺的閾值模型和基于通信的顯式協(xié)商協(xié)調(diào)機(jī)制相結(jié)合的多模態(tài)融合算法,解決了多機(jī)器人對(duì)未知區(qū)域有害廢棄物的清理問題;齊心躍等[9]提出的基于市場(chǎng)機(jī)制的多機(jī)器人救火任務(wù)分配策略,能較好地實(shí)現(xiàn)不同工況下動(dòng)態(tài)分布式任務(wù)的分配。但該類方法工作時(shí)各系統(tǒng)獨(dú)立運(yùn)行,應(yīng)變能力較差,通信成本高,當(dāng)網(wǎng)絡(luò)通信較差時(shí),系統(tǒng)性能將大大降低。

        基于多智能體的任務(wù)分配算法[10]能夠較好解決未知環(huán)境中多機(jī)器人的自組織任務(wù)分配問題,且具有隨機(jī)性,任務(wù)探索范圍廣,對(duì)于動(dòng)態(tài)的任務(wù)分配適應(yīng)性強(qiáng)。秦新立等[11]提出的改進(jìn)蟻群算法,實(shí)現(xiàn)了發(fā)電廠清潔機(jī)器人對(duì)太陽(yáng)能電池板清潔工作的任務(wù)分配;劉淑華等[12]針對(duì)大規(guī)模多機(jī)器人系統(tǒng)中任務(wù)的緊密耦合性,采用了層次結(jié)構(gòu),分別使用基于蟻群、粒子群蟻群和量子蟻群實(shí)現(xiàn)機(jī)器人集合,產(chǎn)生緊密耦合型任務(wù)解;Fang等[13]考慮到情感對(duì)行為和決策自主性和多樣化的影響,將情緒感染引入到機(jī)器人任務(wù)分配中,提出了一種基于情感傳染的尋蹤任務(wù)分配算法(PTA-EC),該算法描述了機(jī)器人之間情感的相互影響對(duì)任務(wù)分配的積極影響。但這些算法收斂速度較慢且易陷入局部極值。近年來,借鑒經(jīng)濟(jì)學(xué)中的博弈論[14],將其進(jìn)行啟發(fā)式改進(jìn)應(yīng)用于任務(wù)分配中,較好地解決了上述智能體在資源分配中存在的問題。

        綜上,現(xiàn)有多機(jī)器人系統(tǒng)中任務(wù)分配研究,多以分布式方法解決非特定環(huán)境下的任務(wù)分配,基于啟發(fā)式的智能算法在面向特定環(huán)境下的任務(wù)分配的解決上已初現(xiàn)優(yōu)勢(shì)。本文通過調(diào)研相關(guān)紡織企業(yè),根據(jù)當(dāng)前紡織廠所存在的提高車間物料調(diào)度效率、減少人工成本等問題,針對(duì)具體的棉卷搬運(yùn)過程:多任務(wù)、多機(jī)器人、分配任務(wù)隨機(jī)等復(fù)雜動(dòng)態(tài)任務(wù)分配問題,以及任務(wù)分配過程中的個(gè)體間的沖突、化解的最優(yōu)化問題,根據(jù)實(shí)際生產(chǎn)空間、時(shí)間、效率等限制,進(jìn)行了針對(duì)多機(jī)器人多任務(wù)分配模型和優(yōu)化算法的研究。引入博弈論思想,并進(jìn)行啟發(fā)式改進(jìn),提出基于智能體博弈理論分布式自主決策框架,在該決策框架下任務(wù)的分配能夠得到全局最優(yōu)解,具有較強(qiáng)的可擴(kuò)展性、良好的魯棒性與收斂性能和合理的分配結(jié)果。

        1 紡織車間物理環(huán)境及任務(wù)描述

        1.1 紡織車間物理環(huán)境及智能體抽象描述

        1.1.1 車間物理環(huán)境及機(jī)器人狀態(tài)

        圖1 精梳車間工藝流程圖Fig.1 Process flow chart of combing workshop

        由于傳統(tǒng)的人工上料存在這些較長(zhǎng)的延誤時(shí)間,大大影響車間生產(chǎn)效率,因此,本文從消除以上時(shí)間延誤著手對(duì)精梳車間智能化改造,將實(shí)際車間生產(chǎn)環(huán)境構(gòu)造為多機(jī)器人隨機(jī)分布的精梳機(jī)車間示意圖,如圖2所示。每個(gè)機(jī)器人只有負(fù)載1個(gè)棉卷的能力,只要并條機(jī)某一工位有任務(wù)需求則機(jī)器人就能夠響應(yīng),使得各工位之間獨(dú)立運(yùn)行,換料時(shí)間互不等待。針對(duì)工序特征,將每個(gè)工作點(diǎn)位獨(dú)立作為供料對(duì)象,存在條并卷機(jī)8臺(tái),工作點(diǎn)位8個(gè)/臺(tái),充電位1個(gè),棉卷供給機(jī)1臺(tái),替代人工的機(jī)器人若干。

        圖2 紡織車間生產(chǎn)任務(wù)抽象簡(jiǎn)化示意圖Fig.2 Abstract description and simplified schematic of textile workshop production task. (a)Combing workshop; (b) Machine distribution in combing workshop; (c) Simplified task abstraction diagram of workshop

        1.1.2 智能體及任務(wù)抽象描述

        由于多任務(wù)的完成需要智能體具有彼此合作、協(xié)調(diào)和談判的能力,移動(dòng)機(jī)器人需要進(jìn)行自身判斷和信息共享,所以將搬運(yùn)機(jī)器人抽象成一個(gè)具有簡(jiǎn)單邏輯判斷的智能體Agent。同時(shí),由于從精梳機(jī)上下料的棉卷在厚度上存在一定的差異,并且任意2個(gè)并條機(jī)的不同工作點(diǎn)在工作完成時(shí)間上不同步,所以對(duì)于順序執(zhí)行和分配僅存在于車間內(nèi)機(jī)器首次開車工作時(shí)。本文研究?jī)?nèi)容是針對(duì)正常生產(chǎn)需求時(shí)的多任務(wù)分配工作,任務(wù)與機(jī)器人狀態(tài)均為隨機(jī),因此,紡織車間棉卷搬運(yùn)任務(wù)分配問題是一個(gè)動(dòng)態(tài)決策問題,從實(shí)現(xiàn)的角度來看,可以看作是3個(gè)基本對(duì)象:時(shí)間、任務(wù)環(huán)境狀態(tài)信息和智能體之間的交互,該問題符合在時(shí)間上迭代求解[15]。將具體的紡織生產(chǎn)過程中的任務(wù)環(huán)境進(jìn)行抽象簡(jiǎn)化,如圖2(c)所示。圖中:方框表示生產(chǎn)工位;T1~Tn代表存在n個(gè)任務(wù)需求(即任務(wù)分布情況);圓點(diǎn)表示具有簡(jiǎn)單思維判斷的智能移動(dòng)機(jī)器人。

        綜上,以現(xiàn)實(shí)需求的場(chǎng)景為例:當(dāng)某時(shí)刻、某工位處有任務(wù)執(zhí)行需求(裝載/卸載),則會(huì)向分布在工位周邊的多個(gè)智能體發(fā)出任務(wù)請(qǐng)求,智能體根據(jù)自身狀態(tài)進(jìn)行應(yīng)答。為完備智能體工作環(huán)境,根據(jù)生產(chǎn)環(huán)境對(duì)任務(wù)分配研究背景進(jìn)行以下假設(shè)。

        1) 任務(wù)環(huán)境地圖已知,以某精梳車間為例,如圖2(b)所示,任務(wù)位置和智能體位置存在于已知的環(huán)境地圖中,即本文中智能體在獲得任務(wù)分配時(shí)不需要考慮創(chuàng)建環(huán)境地圖。

        2) 智能體移動(dòng)范圍有界,由于生產(chǎn)車間通信和場(chǎng)地范圍限制,智能體僅于有界范圍內(nèi)移動(dòng)。

        3) 智能體任務(wù)獲得過程不存在復(fù)雜障礙物的干擾,無人化生產(chǎn)環(huán)境,除生產(chǎn)設(shè)備和工作機(jī)器人自身的相互位置沖突外,無其他突發(fā)障礙物對(duì)智能體的任務(wù)獲得過程造成干擾。

        4) 智能體的運(yùn)動(dòng)路徑不受約束,實(shí)際生產(chǎn)對(duì)象為非循跡機(jī)器人,智能體在任務(wù)分配過程中自主決策,路徑除受固定設(shè)備約束外不受隨機(jī)障礙約束。

        5) 智能體與任務(wù)之間的強(qiáng)通信連接,智能體能夠?qū)崟r(shí)獲取與發(fā)送任務(wù)需求與自身狀態(tài)。

        6) 智能體移動(dòng)速度相同,考慮實(shí)際工作中所有的搬運(yùn)機(jī)器人是同構(gòu)的,則要求智能體的運(yùn)動(dòng)速度恒定且相同,僅在啟停時(shí)存在加速度和減速度。

        7) 智能體預(yù)知的信息:每個(gè)智能體實(shí)時(shí)獲取自身的狀態(tài)StateAj,通信獲知其余智能體狀態(tài),以及該智能體當(dāng)前時(shí)刻可選擇的某個(gè)任務(wù)Ti。

        1.2 基本任務(wù)分配

        1.2.1 靜態(tài)任務(wù)分配

        靜態(tài)任務(wù)主要出現(xiàn)在系統(tǒng)第1次上線情況,即在任務(wù)分配初始時(shí)刻所有工位均處于未分配狀態(tài),智能體處于空閑狀態(tài);或是車間中某臺(tái)機(jī)器進(jìn)行檢修,首次加入到車間生產(chǎn)系統(tǒng)中時(shí),該并條機(jī)整機(jī)工位均處于未分配狀態(tài)。則任務(wù)分配決策過程中,每個(gè)智能體根據(jù)目標(biāo)函數(shù)值,選擇最適合自己的任務(wù),如果有智能體選擇了相同的任務(wù),則它們之間呈現(xiàn)協(xié)作關(guān)系。任務(wù)執(zhí)行時(shí),由于每個(gè)智能機(jī)器人被認(rèn)為單獨(dú)完成任務(wù)的能力有限,因此,每個(gè)智能體在時(shí)刻t只能選擇1個(gè)任務(wù)T執(zhí)行,每個(gè)任務(wù)需要由多個(gè)智能體協(xié)作且智能體處于空閑狀態(tài)才能響應(yīng)任務(wù)的請(qǐng)求。

        1.2.2 動(dòng)態(tài)任務(wù)智能體響應(yīng)

        在實(shí)際生產(chǎn)中存在動(dòng)態(tài)情況發(fā)生時(shí),定義動(dòng)態(tài)情況為系統(tǒng)中某一時(shí)刻t有新任務(wù)的產(chǎn)生或任務(wù)丟失事件發(fā)生時(shí),環(huán)境的動(dòng)態(tài)變化會(huì)導(dǎo)致任務(wù)完成的代價(jià)發(fā)生變化,從而導(dǎo)致目標(biāo)函數(shù)值的變化,故系統(tǒng)需要根據(jù)智能體的能力約束和目標(biāo)值,盡量在不改變?cè)谕Y(jié)果的情況下快速尋找最優(yōu)調(diào)整策略。這就要求將1組任務(wù)分配給1組機(jī)器人的同時(shí),要將能力約束與任務(wù)調(diào)度結(jié)合起來,在約束條件中建立和時(shí)間有關(guān)的目標(biāo)函數(shù)找到1組任務(wù)的最優(yōu)分配給1個(gè)智能體子集,該子集將負(fù)責(zé)完成任務(wù)。

        2 基于博弈理論多任務(wù)分配模型

        在對(duì)紡織生產(chǎn)過程中的機(jī)器人基本任務(wù)類型歸類的基礎(chǔ)上,針對(duì)車間任務(wù)類型簡(jiǎn)單,任務(wù)數(shù)量較大的特點(diǎn),依據(jù)多智能體和多任務(wù)間“多對(duì)多”的協(xié)作關(guān)系、擾動(dòng)關(guān)系,首先需要分別對(duì)智能體和任務(wù)狀態(tài)建立數(shù)學(xué)模型;其次,對(duì)于任務(wù)和資源的時(shí)間上連續(xù),狀態(tài)離散特征,借助復(fù)雜博弈論對(duì)此類問題進(jìn)行建模,已被證明較其他方法具有先進(jìn)性[16]。因此,本文針對(duì)特定環(huán)境下的任務(wù)分配,根據(jù)任務(wù)和對(duì)象特點(diǎn),對(duì)復(fù)雜博弈論根據(jù)文中優(yōu)化決策對(duì)象進(jìn)行啟發(fā)式算法改進(jìn),建立多任務(wù)分配模型,解決紡織車間多智能體任務(wù)分配問題。

        2.1 博弈理論

        2.2 紡織車間多任務(wù)智能體基本模型

        借助博弈理論中個(gè)體博弈以及Nash均衡的描述,同時(shí)結(jié)合1.2節(jié)中車間任務(wù)需求和智能體的任務(wù)狀態(tài),對(duì)任務(wù)與智能體進(jìn)行模型建立。

        2.2.1 物理集合

        (1)

        執(zhí)行任務(wù)Ti,智能體所需代價(jià)為Pi,代價(jià)矩陣為

        Pn×m=(bi,j)

        (2)

        式中,bi,j表示任務(wù)Ti與智能體Aj之間的歐氏距離,距離越遠(yuǎn),代價(jià)越高。

        物理集合中,本文根據(jù)任務(wù)等待時(shí)間確定了任務(wù)的優(yōu)先級(jí),將任務(wù)優(yōu)先級(jí)轉(zhuǎn)化為任務(wù)收益;根據(jù)任務(wù)與智能體之間的物理距離確定了每個(gè)智能體對(duì)應(yīng)不同任務(wù)的代價(jià)矩陣。

        2.2.2 工位任務(wù)狀態(tài)

        2.2.3 智能體狀態(tài)

        在t時(shí)刻智能體Aj的狀態(tài)用函數(shù)StateAj(t)=〈posj(t),ej(t),vj,q(t)〉描述。其中,posj(t)為智能體Aj在t時(shí)刻的位置信息;ej(t)為智能體Aj在t時(shí)刻相應(yīng)的能量存儲(chǔ)值;vj為智能體Aj的速度值;q(t)為t時(shí)刻的智能體Aj任務(wù)分配狀態(tài)矩陣。

        (3)

        qi,j(t)=1表示t時(shí)刻將目標(biāo)任務(wù)Ti分配給智能體Aj;qi,j(t)=0表示未將任務(wù)Ti分配給Aj,即智能體Aj處于空閑狀態(tài)。智能體間信息交互能力用con表示,為n×n矩陣,其元素conij表示智能體之間的通信網(wǎng)絡(luò)連接強(qiáng)度,conij=k。k∈[0,1],其中1表示強(qiáng)連接,0表示無連接。同時(shí),t時(shí)刻智能體Aj完成任務(wù)Ti的能力用式(4)表示:

        capi,j(t)=ej(t)-FPi

        (4)

        式中:F是阻力常量;Pi是執(zhí)行任務(wù)Ti所需的距離代價(jià)。任務(wù)分配映射關(guān)系:T×A?{S1,S2,…,Si},Si是對(duì)任務(wù)Ti特定的任務(wù)集合。

        2.2.4 目標(biāo)函數(shù)

        本文中對(duì)某一時(shí)刻進(jìn)行多任務(wù)分配的目的,是計(jì)算該時(shí)刻多個(gè)任務(wù)機(jī)器人完成收益,并尋找到全局收益最大化的分配,根據(jù)式(1)和(2),要求該時(shí)刻機(jī)器人全局消耗最優(yōu),任務(wù)收益最大。即本文中智能體獲得任務(wù)后保留最大能量存儲(chǔ)和最大任務(wù)收益,因此認(rèn)為系統(tǒng)目標(biāo)函數(shù)是整個(gè)智能體個(gè)體能力與收益的總和。目標(biāo)效用函數(shù)的定義如下:

        (5)

        (Ti,l)表示對(duì)完成任務(wù)Ti所形成的智能體集合。

        上式滿足條件:

        dij∈{0,1}, ?Ti∈T, ?Aj∈A

        (6)

        這里的dij是智能體的二進(jìn)制決策變量,指是否將執(zhí)行任務(wù)Ti。

        2.3 多智能體博弈的任務(wù)分配算法

        以往在完全連接的網(wǎng)絡(luò)中,在每次迭代中只選擇1個(gè)智能體(領(lǐng)導(dǎo)者)來做出決策,而本文中提出的分布式的決策算法,將紡織車間搬運(yùn)機(jī)器人任務(wù)分配問題轉(zhuǎn)化為一個(gè)博弈事件,建立一個(gè)針對(duì)特定任務(wù)無需領(lǐng)導(dǎo)機(jī)制的智能體集合決策框架,當(dāng)有任務(wù)需求時(shí),其中每個(gè)智能體會(huì)根據(jù)自己的狀態(tài)StateAj(t)加入一個(gè)集合。

        2) Nash穩(wěn)定性分區(qū)的建立:對(duì)智能體建立不相交分區(qū)∏={S1,S2,…,Si},如果對(duì)于任意一個(gè)智能體Aj∈A,存在maxA(T∏(j),|S∏(j)|)≥maxA(Ti,|Si∪{Aj}|),?Si∈∏。則稱這個(gè)分區(qū)∏是Nash穩(wěn)定的。即在Nash穩(wěn)定分區(qū)中,與其他任何集合相比,每個(gè)智能體都更傾向于其當(dāng)前所在的集合。每個(gè)智能體在該分區(qū)內(nèi)無需任何形式的信息和通信技術(shù),任何智能體不得單方面偏離其目前的決定,系統(tǒng)保持一種穩(wěn)定狀態(tài)。

        3) 決策結(jié)果:在智能體尋找強(qiáng)偏好任務(wù)的決策過程中Nash均衡理論決定任務(wù)的最終分配結(jié)果。Nash穩(wěn)定分區(qū)一旦建立,任意一個(gè)智能體都不可能在其他智能體任務(wù)完成策略不變時(shí),單方面改變?nèi)蝿?wù)完成策略增加其整體收益,即對(duì)任務(wù)目標(biāo)生成了一種最優(yōu)策略組合。

        4) 對(duì)不確定性問題的適應(yīng):本文將紡織車間多機(jī)器人系統(tǒng)的不確定性主要?dú)w結(jié)為機(jī)器的機(jī)械故障、搬運(yùn)機(jī)器人的動(dòng)作輸出故障、噪聲所造成的通信的不確定性和傳感器的不確定性。當(dāng)前主要考慮車間環(huán)境下的多任務(wù)分配問題,在任務(wù)分配過程中智能體只對(duì)任務(wù)需求作響應(yīng),即任務(wù)層面的協(xié)調(diào),而不考慮多機(jī)器人運(yùn)動(dòng)控制層面的協(xié)同,所以搬運(yùn)機(jī)器人動(dòng)作輸出的不確定性和傳感器所造成的運(yùn)動(dòng)上的不確定性不在本文考慮范圍;機(jī)械故障所造成的工位停工,任務(wù)需求中止,屬于任務(wù)動(dòng)態(tài)的發(fā)生;另外由于任務(wù)分配很難保證每個(gè)智能體之間能夠強(qiáng)通信連接,因此將噪聲所造成的通信的不確定性和傳感器信息感知的不確定性歸結(jié)為通信失效,而針對(duì)通信失效的問題,本文多智能體博弈的分布式智能算法中,以局部信息廣播的形式做個(gè)體信息的交互,對(duì)通信具備很好的自適應(yīng)能力,具體在模型中體現(xiàn)為每個(gè)智能體只需根據(jù)自己的目標(biāo)效用函數(shù)maxA選擇加入一個(gè)任務(wù)分區(qū)∏,只需將自己的決策狀態(tài)dij廣播出去,而其他智能體只根據(jù)自身所獲得的局部信息State(t)做出決策,并同時(shí)影響其相鄰智能體。決策實(shí)現(xiàn)的算法流程如圖3所示。

        圖3 算法流程圖Fig.3 Algorithm flow chart

        3 實(shí)驗(yàn)結(jié)果與分析

        3.1 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)初始化

        1) 實(shí)驗(yàn)環(huán)境描述。根據(jù)實(shí)際生產(chǎn)需求,本文實(shí)驗(yàn)中的任務(wù)為緊耦合型任務(wù),即每個(gè)任務(wù)的完成需要多個(gè)智能體的合作,要求將m個(gè)智能體合理地分配給n個(gè)工位的任務(wù),任務(wù)的分配決策過程應(yīng)該由智能體以分布式、自組織的方式完成。

        從分析結(jié)果可以看出,電機(jī)的溫度分布中,最高溫度產(chǎn)生在繞組部位為130℃。對(duì)于一般電機(jī)來說完全不是問題,也就是說該電機(jī)完全可以滿足長(zhǎng)時(shí)工作的需求。

        2) 數(shù)據(jù)初始化及實(shí)驗(yàn)流程。本實(shí)驗(yàn)在MatLab R2016a上實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果如圖4所示,圖中X,Y為偽坐標(biāo),用于描述智能體位置之間的相互關(guān)系。

        圖4 任務(wù)分配迭代完成過程Fig.4 Iterative completion process of task allocation. (a) Iteration 79th; (b) Iteration 139th; (c) Iteration 189th; (d) Iteration 331th; (e) Iteration 597th; (f) Iteration 682th; (g) Iteration 771th; (h) Iteration 804th

        圖4示出用于任務(wù)(n=6)分配的多個(gè)智能體(m=60)的分布式?jīng)Q策過程,任務(wù)分布在1 000×1 000的范圍,智能體分布在800×800的范圍。圖中,圓表示智能體,正方形則表示任務(wù),圓之間的線代表智能體的通信網(wǎng)絡(luò)。為了直觀,本文任務(wù)分配結(jié)果根據(jù)顏色的區(qū)分將有色智能體被分配給相同顏色的任務(wù),例如黃色智能體(圖中黃點(diǎn))屬于執(zhí)行黃色任務(wù)(黃色方框?qū)?yīng)任務(wù)t4)的集合。如圖4(a)中,初始時(shí)刻智能體針對(duì)任務(wù)需求決策處于隨機(jī)狀態(tài),隨著時(shí)間的推移,算法迭代,智能體之間以局部交互的方式做出對(duì)任務(wù)的臨時(shí)決策(迭代過程如圖4中(b)~(g)所示)。最終如圖4(h)所示,經(jīng)過804次算法迭代之后,各智能體集合形成Nash穩(wěn)定分區(qū),系統(tǒng)得到穩(wěn)定的決策結(jié)果。

        3) 實(shí)驗(yàn)結(jié)果及分析。為驗(yàn)證本文算法針對(duì)不同任務(wù)的完成效率,首先進(jìn)行了弱通信網(wǎng)絡(luò)強(qiáng)度下不同任務(wù)需求數(shù)量的任務(wù)分配結(jié)果比較,完成了智能體個(gè)數(shù)m=60,任務(wù)個(gè)數(shù)分別為n=5,6,7,8狀態(tài)下的任務(wù)分配。以算法迭代次數(shù)作為性能評(píng)價(jià)依據(jù),實(shí)驗(yàn)結(jié)果如圖5所示。

        圖5 相同數(shù)量智能體在不同任務(wù)數(shù)量下的完成結(jié)果Fig.5 Results of the same quantity of agents in different task quantities

        在相同執(zhí)行智能體數(shù)量下,任務(wù)數(shù)n=5,6,7,8時(shí)任務(wù)分配完成算法迭代次數(shù)分別為722、748、767、758??梢钥闯?,在弱通信網(wǎng)絡(luò)強(qiáng)度狀態(tài)下任務(wù)的增加對(duì)本文任務(wù)分配決策的完成效率影響并不顯著。

        本文任務(wù)分配算法在強(qiáng)通信網(wǎng)絡(luò)強(qiáng)度下,分別取任務(wù)數(shù)n=4,5,6,7,8的不同數(shù)量級(jí)智能體的任務(wù)分配完成性能實(shí)驗(yàn),結(jié)果如表1所示。

        針對(duì)緊耦合型任務(wù)中智能體數(shù)量m略多于任務(wù)數(shù)量n時(shí)算法均能快速迭代完成分配。在表1結(jié)果中觀察每一行實(shí)驗(yàn)數(shù)據(jù),不論智能體數(shù)量m的值取多少,任務(wù)數(shù)n=4,5,6,7,8算法迭代結(jié)果比較接近,不存在明顯異常情況,那么同樣可以得到如前述結(jié)果,即本文算法在同一數(shù)量級(jí)智能體情況下,每一行中任務(wù)的增加對(duì)決策的完成效率影響并不顯著。

        從表1數(shù)據(jù)還可看出,隨著智能體數(shù)量的增加,算法中智能體需要更多的信息交互,因此算法迭代次數(shù)也會(huì)如表1結(jié)果所示隨之增加。當(dāng)n=4,m=120時(shí);n=5,m=130時(shí);n=6,7,8,m=135時(shí),在有限的空間內(nèi)智能體數(shù)量達(dá)到飽和,此時(shí)當(dāng)智能體數(shù)量繼續(xù)增加,算法無法完成任務(wù)的分配。

        3.2 對(duì)比實(shí)驗(yàn)

        表1 不同數(shù)量級(jí)m,n下算法迭代性能結(jié)果Tab.1 Iterative performance results of algorithms under different order of magnitude m and n

        圖6 3種不同方法的任務(wù)分配收益情況Fig.6 Task allocation income of three different methods

        從實(shí)驗(yàn)結(jié)果可以看出,在任務(wù)完成的總收益值上本文特定模型下的多智能體博弈任務(wù)分配算法具有明顯優(yōu)勢(shì),本文算法的任務(wù)總收益值明顯高于文獻(xiàn)[9]基于市場(chǎng)法的任務(wù)分配算法,略高于文獻(xiàn)[14]中救火任務(wù)模型中的空閑型實(shí)驗(yàn)。這是由于市場(chǎng)法中參加招標(biāo)的智能體并不能保證其他個(gè)體選擇與其相同的任務(wù)策略,個(gè)體之間存在競(jìng)爭(zhēng)和干擾關(guān)系,因此需要更多的迭代次數(shù)算法才能達(dá)到收斂,系統(tǒng)獲得的收益值較少。而文獻(xiàn)[14]所提出的救火模型不僅計(jì)算其自身的最優(yōu)效用函數(shù),還計(jì)算其他可能參與合作滅火的機(jī)器人的效用函數(shù),雖然獲得的總收益高于市場(chǎng)法,與本文算法收益值接近,但是需要更多的計(jì)算,且算法在迭代65次之后才能達(dá)到穩(wěn)定狀態(tài);而本文算法能夠在保證獲得穩(wěn)定的高收益值的情況下,僅需要迭代45次即可得到穩(wěn)定的分配結(jié)果,因此,本文算法在緊耦合型任務(wù)分配中的系統(tǒng)收益和分配效率明顯優(yōu)于另外2種算法。

        3.3 動(dòng)態(tài)任務(wù)決策能力和系統(tǒng)擴(kuò)展性分析

        在實(shí)際生產(chǎn)加工環(huán)境中,存在大功率電動(dòng)機(jī)等強(qiáng)電磁干擾,任務(wù)信號(hào)的丟失與干擾信號(hào)的出現(xiàn)也是本文算法需要考慮的問題,因此,對(duì)提出的決策框架進(jìn)行了動(dòng)態(tài)環(huán)境擾動(dòng)實(shí)驗(yàn),如意外的任務(wù)添加或丟失。以m=15,n=10進(jìn)行實(shí)驗(yàn)。算法在第1階段迭代45次后完成分配決策獲得穩(wěn)定收益,本文設(shè)置了在a點(diǎn)處隨機(jī)丟失1個(gè)任務(wù),b點(diǎn)處增加該任務(wù),結(jié)果如圖7所示。

        圖7 任務(wù)發(fā)生動(dòng)態(tài)變化時(shí)系統(tǒng)收益Fig.7 System benefits in dynamic task change

        本文算法在迭代105次時(shí)隨機(jī)丟失1個(gè)任務(wù),此時(shí)系統(tǒng)收益值明顯下降,但是依舊能夠達(dá)到穩(wěn)定狀態(tài),當(dāng)穩(wěn)定狀態(tài)持續(xù)一段時(shí)間后又增加該任務(wù),算法仍能快速收斂獲得穩(wěn)定收益。這是因?yàn)橹悄荏w博弈過程中能夠根據(jù)自身收益決定對(duì)任務(wù)的偏好關(guān)系,快速組成新的任務(wù)集合收斂到Nash穩(wěn)定分區(qū),可以響應(yīng)于任何動(dòng)態(tài)任務(wù)環(huán)境變化。

        為驗(yàn)證本文所述算法對(duì)通信網(wǎng)絡(luò)動(dòng)態(tài)環(huán)境的魯棒性,以相同數(shù)量的智能體和任務(wù)對(duì)不同網(wǎng)絡(luò)通信情況下的任務(wù)分配效率進(jìn)行比較,實(shí)驗(yàn)結(jié)果如圖8所示。圖8(a)為強(qiáng)通信連接;圖8(b)為通信失效30%的弱通信連接。

        圖8 不同通信網(wǎng)絡(luò)強(qiáng)度下的任務(wù)分配結(jié)果Fig.8 Task allocation results under different communication network strength. (a) Strong communication; (b) Weak communication

        當(dāng)智能體之間的通信網(wǎng)絡(luò)是強(qiáng)連接時(shí),本文的分布式?jīng)Q策算法能夠快速完成129次迭代,達(dá)到良好的任務(wù)分配結(jié)果。以同一實(shí)驗(yàn)對(duì)象,在智能體弱通信網(wǎng)絡(luò)情況下,通過193次算法迭代完成分配,雖然在弱通信網(wǎng)絡(luò)連接下算法迭代次數(shù)多于強(qiáng)通信網(wǎng)絡(luò)下,但同樣具有良好的任務(wù)分配結(jié)果表現(xiàn)。

        為進(jìn)一步探討本文算法的魯棒性,實(shí)驗(yàn)對(duì)本文算法和常見的基于粒子群算法(PSO)及基于市場(chǎng)法的任務(wù)分配,在無通信失效的強(qiáng)網(wǎng)絡(luò)連接和通信失效30%的弱通信網(wǎng)絡(luò)進(jìn)行任務(wù)數(shù)為6,不同數(shù)量級(jí)智能體任務(wù)完成時(shí)間比較,實(shí)驗(yàn)結(jié)果如表2、3所示。

        表2 強(qiáng)通信網(wǎng)絡(luò)連接實(shí)驗(yàn)結(jié)果Tab.2 Experimental results of strong communication network connection

        表3 通信失效30%的弱通信網(wǎng)絡(luò)連接實(shí)驗(yàn)結(jié)果Tab.3 Test results of weak communication network connection with 30% communication failure

        從表2、3結(jié)果可以看出,通信部分失效使得系統(tǒng)完成任務(wù)的時(shí)間均有所增加。在強(qiáng)通信網(wǎng)絡(luò)下,市場(chǎng)法優(yōu)于PSO算法,但收斂速度不及本文算法。在弱通信的情況下,本文算法能更快地收斂,找到最優(yōu)的任務(wù)分配方案,此時(shí)PSO算法的魯棒性較優(yōu)于市場(chǎng)法。這是由于基于市場(chǎng)機(jī)制的任務(wù)分配算法本身應(yīng)變能力較差,而且對(duì)通信成本要求很大,當(dāng)網(wǎng)絡(luò)通信較差時(shí),系統(tǒng)性能大大降低,任務(wù)分配完成時(shí)間受通信失效的影響較大;而PSO算法由于粒子之間不需要全連接,所以通信魯棒性較好。但粒子隨機(jī)運(yùn)動(dòng)中允許不可行解的存在,因此存在部分死鎖解的情況,而死鎖解的存在使得PSO解空間減小,因而全局尋優(yōu)能力受到影響,在強(qiáng)通信連接下收斂較慢。而本文博弈論中在Nash穩(wěn)定性區(qū)間建立過程中個(gè)體以自身收益值作為目標(biāo)函數(shù)的關(guān)聯(lián)度,進(jìn)行局部的廣播式的信息交互使得該決策框架對(duì)通信部分失效具有很好的魯棒性,同時(shí)在相同的任務(wù)環(huán)境下,博弈論任務(wù)完成時(shí)間明顯優(yōu)于PSO和市場(chǎng)法,因此,本文的多智能體博弈的任務(wù)分配算法更適合于紡織車間這種環(huán)境復(fù)雜、通信覆蓋不穩(wěn)定、對(duì)任務(wù)分配完成時(shí)間有嚴(yán)格限制的實(shí)際生產(chǎn)場(chǎng)合。

        為驗(yàn)證該任務(wù)分配決策框架的可擴(kuò)展性和大規(guī)模任務(wù)分配的效率,分別取5~8個(gè)任務(wù),采用大規(guī)模智能體群體做實(shí)驗(yàn)驗(yàn)證,分別針對(duì)不同任務(wù)以165~210個(gè)智能體作為實(shí)驗(yàn)對(duì)象,實(shí)驗(yàn)結(jié)果如圖9所示。

        圖9 不同情況下任務(wù)分配實(shí)驗(yàn)Fig.9 Task allocation experiments under different conditions. (a) Allocation of efficiency in different situations; (b) Isometric map for allocation efficiency

        對(duì)比發(fā)現(xiàn),任務(wù)分配的完成效率和智能體的數(shù)量相關(guān)性較強(qiáng),隨著智能體數(shù)量的增加,任務(wù)完成的迭代次數(shù)呈現(xiàn)正相關(guān)性。而任務(wù)數(shù)量的增加對(duì)迭代次數(shù)的影響較為微弱,在圖9(b)等高線圖中呈現(xiàn)出清晰的分布和均勻的過渡,所以該任務(wù)分配決策框架不論在任務(wù)還是智能體上均表現(xiàn)出良好的擴(kuò)展性能。

        4 結(jié)束語(yǔ)

        本文將多智能體博弈論的思想引入紡織服裝生產(chǎn)過程中搬運(yùn)機(jī)器人的任務(wù)分配決策中,將移動(dòng)機(jī)器人定義為能夠獨(dú)立思考的智能體,智能體間各自通過局部狀態(tài)信息的交互,追求利益的最大化,實(shí)現(xiàn)了隨機(jī)環(huán)境下多機(jī)器人系統(tǒng)的分布式自組織任務(wù)分配。文中深入探討了智能體集合建立過程中的關(guān)鍵問題和博弈論中Nash穩(wěn)定性分區(qū)建立的過程。最后對(duì)算法實(shí)現(xiàn)了仿真,仿真結(jié)果表明該決策框架具有良好的魯棒性、可擴(kuò)展性和良好的動(dòng)態(tài)任務(wù)分配結(jié)果表現(xiàn)。對(duì)特定問題的模型構(gòu)建和算法求解是解決精梳車間具體問題的關(guān)鍵,也是下一步在機(jī)器人本體應(yīng)用調(diào)試的重要基礎(chǔ)。在今后的研究中,將根據(jù)實(shí)際生產(chǎn)需求完善約束條件,進(jìn)一步改進(jìn)任務(wù)模型和決策框架,進(jìn)行初步的多機(jī)器人多任務(wù)應(yīng)用研究,使之適用更多的實(shí)際任務(wù)分配需求。

        猜你喜歡
        車間決策機(jī)器人
        100MW光伏車間自動(dòng)化改造方案設(shè)計(jì)
        智能制造(2021年4期)2021-11-04 08:54:28
        為可持續(xù)決策提供依據(jù)
        決策為什么失誤了
        招工啦
        “扶貧車間”拔窮根
        把農(nóng)業(yè)搬進(jìn)車間
        機(jī)器人來幫你
        認(rèn)識(shí)機(jī)器人
        機(jī)器人來啦
        認(rèn)識(shí)機(jī)器人
        久久99热久久99精品| 999精品无码a片在线1级| 色大全全免费网站久久| 免费大片黄国产在线观看| 无码字幕av一区二区三区 | 国产天堂在线观看| 无码人妻久久一区二区三区免费| 少妇无码太爽了不卡视频在线看| 少妇人妻200篇白洁| 内射交换多p国产| 国产激情久久99久久| 亚洲国产福利成人一区二区| 久久久婷婷综合亚洲av| 国产成人高清视频在线观看免费 | 九一九色国产| 欧美精品偷自拍另类在线观看| 国产亚洲日本人在线观看| 国产黄色看三级三级三级| 蓝蓝的天空,白白的云| 青青草在线免费播放视频| 色偷偷色噜噜狠狠网站30根| 国产精品免费_区二区三区观看| 国产亚洲人成a在线v网站| 另类免费视频在线视频二区| 亚洲中文字幕乱码一二三区| 免费美女黄网站久久久| 亚洲一二三区免费视频| 亚洲精品第一国产综合精品| 国产精品国产三级国av在线观看| 十八岁以下禁止观看黄下载链接| 在线你懂| 国产三级一区二区三区在线观看| 国产一区二区三区视频地址| 精品亚洲a∨无码一区二区三区| 特级a欧美做爰片第一次| a亚洲va欧美va国产综合| 亚洲影院丰满少妇中文字幕无码| 91精品国产闺蜜国产在线| 久久久免费精品国产色夜| 97在线视频人妻无码| 国产精品亚洲成在人线|