亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于反饋系統(tǒng)的2D 仿真生存挑戰(zhàn)策略

        2022-12-12 12:07:48謝夢(mèng)煒夏慶鋒朱佳悅
        關(guān)鍵詞:反饋系統(tǒng)柵格障礙物

        謝夢(mèng)煒 夏慶鋒 朱佳悅

        (無(wú)錫學(xué)院自動(dòng)化學(xué)院,江蘇無(wú)錫,210089)

        0 引言

        機(jī)器人自誕生以來(lái),其理論和技術(shù)一直在不斷發(fā)展,其應(yīng)用領(lǐng)域也更加廣闊。其中,機(jī)器人比賽不僅以科技創(chuàng)新為實(shí)踐,加強(qiáng)相關(guān)技術(shù)研討和培訓(xùn),促進(jìn)產(chǎn)學(xué)研合作,推動(dòng)技術(shù)創(chuàng)新和轉(zhuǎn)化,為中國(guó)機(jī)器人產(chǎn)業(yè)培育人才,同時(shí)在日常生活中,也具有科普性、娛樂性和權(quán)威性。

        作為機(jī)器人大賽的“一份子”,國(guó)際水中機(jī)器人大賽已有14 年的發(fā)展歷程,其比賽項(xiàng)目種類繁多。大賽的2D 仿真組設(shè)有對(duì)抗性和非對(duì)抗性比賽項(xiàng)目,其中,對(duì)抗性比賽包括搶球博弈、生存挑戰(zhàn)等;非對(duì)抗性比賽包括水中搬運(yùn)、花樣游泳等。

        基于2020 年第十三屆國(guó)際水中機(jī)器人大賽時(shí)采用的策略和比賽后的實(shí)驗(yàn)策略,筆者對(duì)生存挑戰(zhàn)項(xiàng)目持續(xù)地進(jìn)行研究,提出了一種基于反饋系統(tǒng)的2D 仿真生存挑戰(zhàn)策略。該策略主要是利用模軸運(yùn)動(dòng)和扇形運(yùn)動(dòng)構(gòu)成一個(gè)反饋系統(tǒng),讓躲避魚及時(shí)調(diào)整位置坐標(biāo),從而順利逃避攻擊魚的捉捕,在實(shí)驗(yàn)與比賽中均達(dá)到了良好的效果。

        1 2D 仿真生存挑戰(zhàn)項(xiàng)目介紹

        1.1 生存挑戰(zhàn)規(guī)則和比賽內(nèi)容

        水中機(jī)器人大賽2D 仿真生存挑戰(zhàn)項(xiàng)目采用標(biāo)準(zhǔn)仿真場(chǎng)地,如圖1 所示,場(chǎng)地中有3 個(gè)矩形仿真障礙物,主要起阻攔作用,障礙物邊長(zhǎng)為400mm,中心點(diǎn)坐標(biāo)分別為(0,0),(0,700),(0,-700)[1]。每場(chǎng)比賽由2 支隊(duì)伍參加,每支隊(duì)伍有4 條仿真機(jī)器魚。其中,1 號(hào)魚為特殊魚,當(dāng)隊(duì)伍進(jìn)攻時(shí)充當(dāng)“捉捕手”角色,其余2、3、4 號(hào)為常規(guī)魚;當(dāng)隊(duì)伍在防守時(shí),1 號(hào)魚充當(dāng)“防御手”角色,2、3、4號(hào)魚充當(dāng)“躲避手”角色。

        參加比賽的兩支隊(duì)伍需要進(jìn)行攻防交換。一場(chǎng)比賽時(shí)間總計(jì)10min,以5min 為時(shí)間節(jié)點(diǎn)進(jìn)行半場(chǎng)交換。其中,在暫停比賽交換半場(chǎng)時(shí),雙方都可以進(jìn)行比賽策略的更換,其他時(shí)間雙方不可更換策略。在比賽過程中,常規(guī)魚的速度取值范圍是0-14,共15 個(gè)整數(shù)值,每個(gè)數(shù)值代表一個(gè)速度值。0 表示靜止,14 對(duì)應(yīng)的速度是0.25m/s。其中常規(guī)魚的速度最大為8,特殊魚的速度最大為14。進(jìn)攻方的“捉捕手”每觸碰一次對(duì)方“躲避手”,對(duì)方的“躲避手”便在平臺(tái)上消失,此時(shí)記錄所需時(shí)間,進(jìn)攻方得1 分。“捉捕手”與“防御手”相互之間碰撞不計(jì)分。當(dāng)半場(chǎng)時(shí)間未到時(shí),防御方3 條魚均已下場(chǎng),則該半場(chǎng)比賽立即結(jié)束,進(jìn)入交換半場(chǎng)或比賽結(jié)束階段。在單場(chǎng)比賽中,規(guī)定時(shí)間(10 min)內(nèi)得分多的隊(duì)伍取勝;得分相同時(shí)判定最后得分用時(shí)少者獲勝;若得分為 0:0 或得分相同且最后得分用時(shí)相同,則視為平局。

        1.2 常用技術(shù)

        以往比賽常采用一系列的相關(guān)理論技術(shù),如一致性理論、基于柵格法下的策略優(yōu)化、基于虛擬切線圓的策略優(yōu)化等[2]?;谶@些理論的策略雖然在一定程度上達(dá)到了比賽的效果,但是實(shí)際應(yīng)用中機(jī)器魚存在躲避不具有連續(xù)性和針對(duì)性等問題[3],同時(shí),由于角度變化引起的震動(dòng)和水的波動(dòng)等不穩(wěn)定因素,使機(jī)器魚的躲避變得不太有效,此外,也不能很好地滿足比賽中對(duì)處于特殊位置的機(jī)器魚的穩(wěn)定性要求[4]。

        經(jīng)過實(shí)踐和比賽證明,本文提出的基于反饋系統(tǒng)的比賽策略,可以使仿真機(jī)器魚更加靈活,很好地解決了躲避魚被攻擊的問題,大大提升了躲避魚的躲避率,從而達(dá)到良好的比賽效果。

        1.3 運(yùn)行模式

        國(guó)際水中機(jī)器人比賽采用URWPGSim2D 軟件(比賽專用仿真器),該軟件可提供 Local (本地模式)和 Remote(遠(yuǎn)程模式)兩種運(yùn)行模式。參賽隊(duì)伍根據(jù)比賽時(shí)賽場(chǎng)具體情況對(duì)這兩種模式二選一[5]。

        2 反饋系統(tǒng)策略的策劃

        2.1 基于柵格法的平臺(tái)區(qū)域化

        柵格法是通過將2D 仿真比賽平臺(tái)的比賽環(huán)境分為具有二值信息的一個(gè)個(gè)小網(wǎng)格。首先,作為策略實(shí)行的前提,需要對(duì)場(chǎng)地進(jìn)行抽象簡(jiǎn)化。筆者對(duì)場(chǎng)地進(jìn)行基于柵格法的簡(jiǎn)化,將其劃分為不同的區(qū)域,并以編號(hào)代表其中每一片區(qū)域。具體如圖2 所示。

        基于柵格法的每個(gè)區(qū)域并不需要有完全相同的長(zhǎng)寬,只需相對(duì)近似即可,在障礙物區(qū)域,即編號(hào)7、17、27區(qū)域周邊的9 宮格的高度需要和障礙物或其間空隙等高,寬度則需大于機(jī)器魚身長(zhǎng)。在比賽中,通過在機(jī)器魚身上獲取的坐標(biāo)點(diǎn)位置與對(duì)應(yīng)區(qū)域比對(duì),可獲得躲避魚目前所處的區(qū)域編號(hào)。

        2.2 反饋運(yùn)動(dòng)思想

        反饋運(yùn)動(dòng)的原理是指在比賽過程中,每條躲避魚依據(jù)各個(gè)障礙物、攻擊魚形成以繞障礙物為主的反饋環(huán),這可以很好地解決處于特殊位置的機(jī)器魚的穩(wěn)定性問題。當(dāng)攻擊魚發(fā)起攻擊時(shí),躲避魚一直繞障礙物運(yùn)動(dòng),形成一種防被抓到的迂回戰(zhàn)術(shù),使得躲避魚不易被攻擊魚抓到。其中任何一個(gè)環(huán)節(jié)或要素的變化,都會(huì)引起其他環(huán)節(jié)或要素發(fā)生變化,并促使該環(huán)節(jié)或要素進(jìn)一步變化,從而形成反饋運(yùn)動(dòng)思想。由此,參賽隊(duì)員在比賽過程中要注意把握攻擊魚和躲避魚或障礙物之間的關(guān)系,通過抓住這些主要因素,以提高生存挑戰(zhàn)項(xiàng)目的比賽勝率。反饋運(yùn)動(dòng)思想如圖3 所示。

        在比賽過程中,防御方的整體策略需先分析攻擊魚的位置,來(lái)決定2、3、4 號(hào)魚的位置。當(dāng)進(jìn)攻魚在區(qū)域化7 號(hào)的位置時(shí),進(jìn)攻魚的位置以及障礙物及時(shí)反饋給躲避魚,躲避魚可以圍繞7 號(hào)區(qū)域進(jìn)行迂回戰(zhàn)術(shù)。同樣,躲避魚也可圍繞17 號(hào)區(qū)域、27 號(hào)區(qū)域進(jìn)行迂回戰(zhàn)術(shù)。

        在比賽過程中,依據(jù)上述反饋運(yùn)動(dòng)思想,反饋的信息使得躲避魚總能躲避攻擊魚的抓捕,從而提高躲避魚的生存率,延長(zhǎng)比賽時(shí)間,直至勝利。躲避魚的反饋區(qū)域具體如圖4 所示。

        2.3 模軸運(yùn)動(dòng)策略

        模軸運(yùn)動(dòng)是依據(jù)運(yùn)動(dòng)控制中機(jī)械臂繞電機(jī)軸進(jìn)行周期式的運(yùn)動(dòng)。參照這一思想,可以以障礙物為軸,當(dāng)攻擊魚和躲避魚圍繞障礙物進(jìn)行運(yùn)動(dòng)時(shí),躲避魚可以進(jìn)行一種接近周期式的圓周運(yùn)動(dòng),從而躲避攻擊魚的抓捕。

        由比賽規(guī)則可知,攻擊魚和躲避魚在直線上的最大速度分別為14 和8,但在曲線運(yùn)動(dòng)中,雙方的速度差距會(huì)縮小。根據(jù)這一規(guī)則,筆者提出一種以障礙物為軸的繞軸策略。該策略是以3 個(gè)正方形障礙物為軸,讓1 號(hào)魚與2、3、4 號(hào)魚中其中一個(gè)進(jìn)行繞軸運(yùn)動(dòng),從而形成周期式的繞軸運(yùn)動(dòng)。以障礙物為中心,建立坐標(biāo),如圖5所示,箭頭方向代表躲避魚模軸運(yùn)動(dòng)策略的方向之一,ΔX和ΔY可以反映出模軸運(yùn)動(dòng)時(shí)2、3、4 號(hào)魚的位置,躲避魚可以和攻擊魚周旋,延長(zhǎng)躲避魚被追擊的時(shí)間,最終取得良好的預(yù)期效果。

        如圖6 所示,當(dāng)攻擊魚抓捕躲避魚時(shí),躲避魚依賴障礙物和攻擊魚進(jìn)行周旋,躲避魚依據(jù)反饋系統(tǒng)獲取攻擊魚的坐標(biāo)位置,從而進(jìn)行模軸運(yùn)動(dòng)。在特殊位置(依賴障礙物的情況)下,仿真結(jié)果證明了模軸運(yùn)動(dòng)的有效性。

        2.4 扇形運(yùn)動(dòng)策略

        扇形運(yùn)動(dòng)是指以攻擊魚為頂點(diǎn)、以障礙物為兩邊和這兩邊所截一段圓弧圍成的區(qū)域內(nèi)進(jìn)行的運(yùn)動(dòng)。如圖7所示,當(dāng)攻擊魚進(jìn)攻時(shí),躲避魚將繞著7 號(hào)和27 號(hào)障礙物進(jìn)行運(yùn)動(dòng),從而與攻擊魚之間繞障礙物形成模軸運(yùn)動(dòng),進(jìn)行迂回戰(zhàn)術(shù),最后達(dá)到較好的比賽效果。

        要采用扇形運(yùn)動(dòng)策略,首先要將2D 仿真區(qū)域規(guī)劃為一個(gè)個(gè)小區(qū)域。如圖7 所示,當(dāng)進(jìn)攻魚沿箭頭方向出發(fā)時(shí),躲避魚沿3 個(gè)障礙物區(qū)域(7、17、27)移動(dòng),盡可能地依據(jù)扇形運(yùn)動(dòng)方向來(lái)提前預(yù)判攻擊魚的攻擊路線,分析攻擊魚的坐標(biāo)位置,提前規(guī)劃更優(yōu)的躲避路線,實(shí)現(xiàn)和進(jìn)攻魚圍繞障礙物進(jìn)行模軸運(yùn)動(dòng)。

        3 原策略與反饋策略實(shí)驗(yàn)結(jié)果對(duì)比

        筆者發(fā)現(xiàn),在比賽過程中,采用一些傳統(tǒng)方法不僅會(huì)導(dǎo)致特殊位置的機(jī)器魚穩(wěn)定性較差,也會(huì)導(dǎo)致有障礙物區(qū)域的比賽結(jié)果和躲避效果較差。本團(tuán)隊(duì)對(duì)于有障礙物區(qū)域的比賽進(jìn)行了大量的實(shí)驗(yàn),最后驗(yàn)證了采用反饋系統(tǒng)策略十分有效。

        圖8所示是一個(gè)機(jī)器魚依賴障礙物比賽的實(shí)驗(yàn)畫面,當(dāng)采用基于反饋系統(tǒng)的比賽策略時(shí),躲避魚會(huì)以障礙物為依靠,繞障礙物進(jìn)行運(yùn)動(dòng),拖延被攻擊魚抓捕的時(shí)間,以達(dá)到良好的比賽效果。

        在國(guó)際水中機(jī)器人2D 仿真平臺(tái)中進(jìn)行對(duì)比實(shí)驗(yàn),筆者分別選取了3 組實(shí)驗(yàn)數(shù)據(jù)和比賽現(xiàn)場(chǎng)的數(shù)據(jù),將本文策略和本團(tuán)隊(duì)在2019 年和2020 年兩次比賽中獲獎(jiǎng)的策略進(jìn)行模擬比賽,具體結(jié)果如表1 所示。按照比賽規(guī)則,得分多者即為獲勝方,雖然在模擬比賽過程中,本團(tuán)隊(duì)的2020 年策略和本文策略 “糾纏”時(shí)間較長(zhǎng),但最終還是本文策略獲勝。由此可見,反饋運(yùn)動(dòng)策略下的實(shí)驗(yàn)和比賽效果均比原策略的效果要好,在2019 年比賽中,基本比賽時(shí)間都控制在4.05min 左右,在2020 年比賽中,基于反饋系統(tǒng)的策略取得了良好的成績(jī),時(shí)間控制在3.37min。

        表1 新舊策略實(shí)驗(yàn)對(duì)比

        4 結(jié)語(yǔ)

        本文提出的反饋運(yùn)動(dòng)策略方法在實(shí)際應(yīng)用中取得了不錯(cuò)的效果,比賽中輸贏的隨機(jī)性,讓躲避魚的生存能力得到了進(jìn)一步的提升。同時(shí),筆者發(fā)現(xiàn)可以在區(qū)域劃分構(gòu)成的反饋系統(tǒng)中,添加更多有效的防守策略來(lái)應(yīng)對(duì)不同的攻擊策略;在本方案中,當(dāng)出現(xiàn)防守魚對(duì)躲避魚有不良影響時(shí),可以采取讓防守魚在場(chǎng)邊停滯的方式來(lái)規(guī)避這一不良影響。

        猜你喜歡
        反饋系統(tǒng)柵格障礙物
        基于鄰域柵格篩選的點(diǎn)云邊緣點(diǎn)提取方法*
        高低翻越
        SelTrac?CBTC系統(tǒng)中非通信障礙物的設(shè)計(jì)和處理
        基于ZigBee技術(shù)的交互式智能教學(xué)反饋系統(tǒng)設(shè)計(jì)
        一種用于生物刺激反饋系統(tǒng)的新型刺激電流源
        不同剖面形狀的柵格壁對(duì)柵格翼氣動(dòng)特性的影響
        基于WiFi-SMS的互動(dòng)反饋系統(tǒng)的設(shè)計(jì)與應(yīng)用
        基于CVT排布的非周期柵格密度加權(quán)陣設(shè)計(jì)
        基于PCI 2501的高速數(shù)據(jù)采集與反饋系統(tǒng)
        土釘墻在近障礙物的地下車行通道工程中的應(yīng)用
        日本高清aⅴ毛片免费| 初高中生精品福利视频| 国产成人av一区二区三区在线| 欧美日韩区1区2区3区| 久久精品国产丝袜| 欧美成人久久久| 色人阁第四色视频合集网| 丰满人妻一区二区三区免费| 日本一区二区三区免费| 国产特黄a三级三级三中国| 一区二区三区日本视频| 手机在线免费观看的av| 草逼视频污的网站免费| 日本顶级metart裸体全部| 日躁夜躁狠狠躁2001| 欧美韩日亚洲影视在线视频| 国产成人综合久久久久久| 亚洲av有码精品天堂| 日本高清免费播放一区二区| 精品在线视频在线视频在线视频| 国产在线一区二区三区四区 | 少妇激情一区二区三区99| 国产亚洲精品一区二区无| 国产二区交换配乱婬| 精品少妇人妻av免费久久久| 曰本亚洲欧洲色a在线| 白色白色视频在线观看| 国产精品久人妻精品老妇| 最新亚洲人成网站在线观看 | 日产精品99久久久久久| 国产在线观看无码免费视频| 中文无码制服丝袜人妻av | 区三区久久精品水蜜桃av| 天堂免费av在线播放| 亚洲精品色婷婷在线影院| 无码成人aaaaa毛片| 亚洲成在人网av天堂| 国产女主播视频一区二区三区| 久久精品熟女亚洲av香蕉| 少妇真实被内射视频三四区| 18禁美女裸身无遮挡免费网站|