亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多智能體強(qiáng)化學(xué)習(xí)的露天礦車輛調(diào)度方法

        2023-07-01 06:49:16李新華
        關(guān)鍵詞:智能環(huán)境模型

        李新華

        (國(guó)家能源集團(tuán) 神東煤炭集團(tuán)有限責(zé)任公司,陜西 榆林 719315)

        近年來(lái),無(wú)人駕駛作為結(jié)合人工智能與工程技術(shù)的最新技術(shù),在各種露天礦山得到廣泛應(yīng)用,實(shí)現(xiàn)了對(duì)露天礦區(qū)的智能化控制和管理,從而提高了生產(chǎn)效率和安全性。研究應(yīng)用于露天礦的無(wú)人駕駛卡車的運(yùn)輸調(diào)度,不僅有助于企業(yè)提高經(jīng)濟(jì)效益,降低資源消耗,而且對(duì)于實(shí)現(xiàn)露天礦的自動(dòng)化和智能化開(kāi)采具有重要意義[1-3]。隨著露天礦無(wú)人駕駛技術(shù)的不斷發(fā)展,基于遺傳算法、模擬退火等元啟發(fā)式算法以及基于線性規(guī)劃、整數(shù)規(guī)劃等傳統(tǒng)優(yōu)化方法已經(jīng)不能滿足露天礦車輛實(shí)時(shí)調(diào)度、高能耗比和提高調(diào)度智能化水平等新需求[4-6]。因此,將工程技術(shù)手段和人工智能技術(shù)結(jié)合,提高車輛調(diào)度的精確度和智能化水平、實(shí)現(xiàn)自動(dòng)化控制和優(yōu)化管理已成為智慧礦山建設(shè)過(guò)程中亟待解決的問(wèn)題[7]。

        露天礦車輛調(diào)度問(wèn)題本質(zhì)上是一個(gè)運(yùn)輸成本最小化的優(yōu)化問(wèn)題,一般采用傳統(tǒng)優(yōu)化方法或元啟發(fā)式算法。隨著無(wú)人駕駛技術(shù)的發(fā)展,針對(duì)露天礦車輛調(diào)度問(wèn)題,相關(guān)研究主要從排隊(duì)論、線性規(guī)劃及多目標(biāo)優(yōu)化等3個(gè)方面開(kāi)展了研究。排隊(duì)論算法是將卡車視作運(yùn)輸隊(duì)列中等待裝礦/卸載服務(wù)的個(gè)體,并建立排隊(duì)論模型明確卡車運(yùn)輸目的地,即裝礦/卸載點(diǎn)。雖然可以配置卡車的最佳方案,但存在車輛同質(zhì)性的約束[8]。線性規(guī)劃方法目前已經(jīng)被廣泛應(yīng)用于露天礦卡車調(diào)度模型,但隨著卡車數(shù)量的增加,存在組合爆炸的風(fēng)險(xiǎn)[9]。多目標(biāo)優(yōu)化模型是國(guó)內(nèi)外露天礦車輛調(diào)度從業(yè)者研究的重點(diǎn),這是由于在露天礦調(diào)度問(wèn)題上不能只考慮單個(gè)經(jīng)濟(jì)指標(biāo)作為車輛調(diào)度的目標(biāo)[10]。張明[11]等以礦車運(yùn)輸總成本和等待時(shí)間作為優(yōu)化目標(biāo),運(yùn)用多目標(biāo)遺傳算法求解了露天礦車輛調(diào)度問(wèn)題。此外,阮順領(lǐng)[12]等除了考慮卡車運(yùn)輸成本和等待時(shí)間外,還將卸礦站品位偏差率作為優(yōu)化目標(biāo),最終結(jié)合歷史調(diào)度數(shù)據(jù)使用改進(jìn)的人工魚(yú)群算法求解。程平[10]等綜合考慮電池電量、車鏟生產(chǎn)能力及礦石品位等多種影響因素,構(gòu)建了基于碳排放成本的露天礦新能源純電動(dòng)卡車多目標(biāo)調(diào)度優(yōu)化模型?;诙嗄繕?biāo)優(yōu)化模型的露天礦調(diào)度方法雖然能夠考慮多重因素,從而求解出較優(yōu)的解,但存在模型參數(shù)多及求解耗時(shí)的問(wèn)題。現(xiàn)有研究方法在一定程度上改善了露天礦車輛調(diào)度問(wèn)題,但存在難以兼顧調(diào)度精度和調(diào)度效率的問(wèn)題。

        隨著強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)算法的興起,也有一些基于強(qiáng)化學(xué)習(xí)的調(diào)度方法。葉則芳[13]等提出了一種改進(jìn)的強(qiáng)化學(xué)習(xí)調(diào)度算法,在Spark調(diào)度模型中取得了良好的調(diào)度性能,有效解決了計(jì)算集群調(diào)度問(wèn)題。朱家政[14]等針對(duì)傳統(tǒng)調(diào)度算法實(shí)時(shí)性較差而難以應(yīng)對(duì)復(fù)雜多變的實(shí)際生產(chǎn)調(diào)度環(huán)境的問(wèn)題,提出了一種長(zhǎng)短期記憶的近端策略優(yōu)化算法,用于解決復(fù)雜條件下的作業(yè)車間調(diào)度問(wèn)題。強(qiáng)化學(xué)習(xí)模型能夠在短時(shí)間內(nèi)較好地給出復(fù)雜調(diào)度問(wèn)題,是一個(gè)較優(yōu)的調(diào)度方法。

        為實(shí)現(xiàn)對(duì)露天礦車輛的實(shí)時(shí)調(diào)度,擬提出基于多智能體強(qiáng)化學(xué)習(xí)的露天礦車輛調(diào)度方法。該方法基于集中式訓(xùn)練分布式執(zhí)行的范式構(gòu)建了一個(gè)多智能體強(qiáng)化學(xué)習(xí)模型,用于處理露天礦車輛調(diào)度問(wèn)題。通過(guò)對(duì)露天礦車輛調(diào)度、裝礦點(diǎn)及卸礦點(diǎn)特征的分析,設(shè)計(jì)露天礦車輛調(diào)度仿真環(huán)境。構(gòu)建一個(gè)演員評(píng)論家框架的多智能體強(qiáng)化學(xué)習(xí)模型,用于對(duì)露天礦車輛調(diào)度。同時(shí),對(duì)比分析所構(gòu)建的基于社交感知的多智能體深度確定性策略梯度(Socially aware-Multi-Agent Deep Deterministic Policy Gradient,S-MADDPG)模型與多智能體深度確定性策略梯度(Multi-Agent Deep Deterministic Policy Gradient,MADDPG)模型及深度確定性策略梯度(Deep Deterministic Policy Gradient,DDPG)模型等兩個(gè)典型模型的調(diào)度效率。最后,驗(yàn)證所提方法的可行性。

        1 相關(guān)理論基礎(chǔ)

        1.1 強(qiáng)化學(xué)習(xí)

        強(qiáng)化學(xué)習(xí)研究的是智能體在復(fù)雜環(huán)境下采取怎樣的動(dòng)作最終獲取最大的獎(jiǎng)勵(lì)。強(qiáng)化學(xué)習(xí)由智能體和環(huán)境兩部分組成。智能體通過(guò)對(duì)從環(huán)境中觀測(cè)到的狀態(tài)進(jìn)行分析后做出動(dòng)作,然后環(huán)境會(huì)給出執(zhí)行動(dòng)作后的下一個(gè)狀態(tài)和該動(dòng)作在復(fù)雜環(huán)境下獲得的獎(jiǎng)勵(lì)。

        在隨機(jī)過(guò)程中,馬爾科夫性[15]是指一個(gè)隨機(jī)過(guò)程在給定現(xiàn)在狀態(tài)st和過(guò)去狀態(tài)ht的情況下,未來(lái)狀態(tài)st+1的概率分布p僅依賴于當(dāng)前狀態(tài)的性質(zhì),其表達(dá)式為

        p(st+1|st)=p(st+1|ht)

        (1)

        因此,智能體與環(huán)境的交互過(guò)程可以通過(guò)馬爾科夫決策過(guò)程(Markov Decision Process,MDP)表示。

        通常情況下,智能體能觀測(cè)到的狀態(tài)都是部分信息,這種部分可觀測(cè)MDP通常被用一個(gè)七元組描述[S,A,T,R,Ω,O,γ][16]。其中:S表示狀態(tài)空間;A為動(dòng)作空間;T(s′|s,a)表示狀態(tài)轉(zhuǎn)移概率;R為獎(jiǎng)勵(lì)函數(shù);Ω(o,|s,a)表示觀測(cè)概率;O為觀測(cè)空間;γ為折扣因子。強(qiáng)化學(xué)習(xí)的狀態(tài)價(jià)值函數(shù)Vπ和動(dòng)作價(jià)值函數(shù)Qπ可以分為即時(shí)獎(jiǎng)勵(lì)和后續(xù)狀態(tài)折扣價(jià)值兩部分,分別定義為

        Vπ(s)=

        (2)

        (3)

        式中,π表示策略矩陣。

        1.2 多智能體強(qiáng)化學(xué)習(xí)

        多智能體強(qiáng)化學(xué)習(xí)是強(qiáng)化學(xué)習(xí)和多智能體體系結(jié)合而成的新領(lǐng)域。多智能體的核心是把系統(tǒng)分成若干智能體及自治的子系統(tǒng),在物理和地理上既可以分散且可以獨(dú)立執(zhí)行任務(wù),多智能體之間又可以相互通信、相互協(xié)調(diào)及共同完成任務(wù)。多智能體強(qiáng)化學(xué)習(xí)目前有集中式學(xué)習(xí)、獨(dú)立式學(xué)習(xí)和集中式訓(xùn)練分布式執(zhí)行等3種通用范式。集中式學(xué)習(xí)是將整個(gè)系統(tǒng)視為一個(gè)整體,與單智能體強(qiáng)化學(xué)習(xí)模型類似;獨(dú)立式學(xué)習(xí)是讓每個(gè)智能體獨(dú)立訓(xùn)練自己的策略,其建模簡(jiǎn)單,但忽視了多智能體之間的聯(lián)系;集中式訓(xùn)練分布式執(zhí)行作為前兩者的折中選擇,在訓(xùn)練時(shí)利用全局視角,執(zhí)行過(guò)程中各自獨(dú)立。多智能體強(qiáng)化學(xué)習(xí)系統(tǒng)描述為

        [N,E,a1,a2,…,aN,T,γ,r1,…,rN]

        (4)

        式中:N為智能體個(gè)數(shù);E為系統(tǒng)狀態(tài),一般指多智能體的聯(lián)合狀態(tài),例如可以是(x1,y1),(x2,y2),…,(xN,yN),即表示運(yùn)輸卡車的位置坐標(biāo);a1,a2,…,aN表示智能體的動(dòng)作合集;T表示狀態(tài)轉(zhuǎn)移函數(shù),可以根據(jù)當(dāng)前系統(tǒng)狀態(tài)和聯(lián)合動(dòng)作給出下一狀態(tài)的概率分布;r1,…,rN表示智能體在多智能體采取聯(lián)合動(dòng)作后各智能體分別獲得的獎(jiǎng)勵(lì)。多智能體強(qiáng)化學(xué)習(xí)架構(gòu)示意圖如圖1所示。

        圖1 多智能體強(qiáng)化學(xué)習(xí)架構(gòu)示意圖

        2 露天礦車輛調(diào)度問(wèn)題

        在露天礦的實(shí)際開(kāi)采過(guò)程中,系統(tǒng)需要協(xié)調(diào)多個(gè)裝礦點(diǎn)和卸載點(diǎn)之間的工作。礦車將礦物從裝礦點(diǎn)運(yùn)輸?shù)揭粋€(gè)或多個(gè)卸載點(diǎn)進(jìn)行作業(yè)[17]。裝礦點(diǎn)到卸載點(diǎn)距離不同,礦車產(chǎn)生的運(yùn)輸成本也不同。因此,這里將露天礦車輛調(diào)度問(wèn)題看作是求解礦車最小運(yùn)輸成本的問(wèn)題。

        在露天礦車輛運(yùn)輸過(guò)程中,礦車狀態(tài)可簡(jiǎn)單地分為空載、待載、載入、運(yùn)輸、帶卸、卸載及故障7種狀態(tài)。假設(shè)礦車從第i個(gè)裝礦點(diǎn)Mi載入到第i個(gè)裝礦點(diǎn)裝車再到第j個(gè)卸載點(diǎn)卸載,再回到Mi為一次完整的運(yùn)輸調(diào)度過(guò)程,則該過(guò)程中產(chǎn)生的運(yùn)輸成本為燃油成本、啟動(dòng)成本及故障維修成本之和。其中:i=1,2,…,I,I為裝礦點(diǎn)數(shù)量;j=1,2,…,J,J為卸載點(diǎn)數(shù)量。

        2.1 燃油成本

        在一次調(diào)度過(guò)程中產(chǎn)生的燃油成本z1為礦車空載、運(yùn)輸及卸載時(shí)所消耗的成本之和,其表達(dá)式為

        (5)

        2.2 啟動(dòng)成本

        礦車一次完整調(diào)度運(yùn)輸過(guò)程中的啟動(dòng)成本的表達(dá)式為

        (6)

        式中,P2表示每輛礦車的啟動(dòng)成本。

        2.3 故障維修成本

        故障維修費(fèi)用為

        (7)

        式中,P3表示每輛礦車的平均故障維修成本。因此,露天礦車輛運(yùn)輸調(diào)度優(yōu)化模型為

        minZ=min(z1+z2+z3)

        (8)

        式中:Vk表示第k輛礦車的裝載量;Qi表示對(duì)應(yīng)裝礦點(diǎn)的總礦量;S表示一次生產(chǎn)計(jì)劃中總調(diào)度次數(shù);gi表示對(duì)應(yīng)卸載點(diǎn)的卸載總量。

        3 S-MADDPG模型構(gòu)建

        3.1 強(qiáng)化學(xué)習(xí)環(huán)境

        結(jié)合露天礦車輛調(diào)度的特點(diǎn),設(shè)計(jì)了強(qiáng)化學(xué)習(xí)仿真環(huán)境,具體如圖2所示。其中,實(shí)心方框?yàn)檠b載點(diǎn),空心方框?yàn)樾遁d點(diǎn)。

        圖2 露天礦強(qiáng)化學(xué)習(xí)仿真環(huán)境

        為簡(jiǎn)化強(qiáng)化學(xué)習(xí)模型,將隨時(shí)間的連續(xù)變化轉(zhuǎn)換為按時(shí)間片逐幀變化。也就是說(shuō),環(huán)境中的所有信息都會(huì)在每個(gè)時(shí)間片更新一次,時(shí)間片是環(huán)境的一個(gè)超參數(shù),可以進(jìn)行調(diào)節(jié)。露天礦車輛調(diào)度環(huán)境可分為獎(jiǎng)勵(lì)設(shè)置、裝載點(diǎn)礦量變化、車輛位置及車輛可選擇的路徑變化。

        對(duì)于復(fù)雜問(wèn)題而言,強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)設(shè)置通常都是較為稀疏的。為削弱強(qiáng)化學(xué)習(xí)模型獎(jiǎng)勵(lì)的稀疏性,設(shè)置當(dāng)?shù)V車裝有礦物并執(zhí)行卸礦操作時(shí),進(jìn)行一次獎(jiǎng)勵(lì)。這樣可激勵(lì)智能體執(zhí)行裝礦和卸礦操作,而不是進(jìn)行無(wú)用的調(diào)度。在實(shí)際的露天礦生產(chǎn)過(guò)程中裝載點(diǎn)的礦量會(huì)實(shí)時(shí)發(fā)生變化,這種變化與裝礦點(diǎn)產(chǎn)礦能力相關(guān)。因此,需要對(duì)每個(gè)裝礦點(diǎn)的產(chǎn)礦速度進(jìn)行設(shè)置,而不是將裝礦點(diǎn)的礦量假設(shè)為無(wú)限。

        車輛的位置在該環(huán)境中用二維x-y坐標(biāo)表示。考慮到當(dāng)所有智能體走的路徑都是最優(yōu)的條件下礦車不會(huì)走回頭路,因此假設(shè)所有礦車類型相同,都不走回頭路,即只有當(dāng)?shù)V車走到卸載點(diǎn)或者裝載點(diǎn)的時(shí)候才能選擇路徑,當(dāng)走到路中間時(shí)不可回頭。此時(shí),裝礦和卸礦時(shí)間各消耗一個(gè)時(shí)間片。

        3.2 強(qiáng)化學(xué)習(xí)智能體

        強(qiáng)化學(xué)習(xí)智能體是一種能夠通過(guò)與環(huán)境進(jìn)行交互來(lái)學(xué)習(xí)最優(yōu)決策的人工智能系統(tǒng),其多智能體訓(xùn)練網(wǎng)絡(luò)如圖3所示[18]。其中,Q表示Q-學(xué)習(xí)模型。每個(gè)智能體網(wǎng)絡(luò)的輸入為當(dāng)前礦車的位置、裝貨狀態(tài)及所有裝礦點(diǎn)的礦量輸出礦車的行駛方向,評(píng)論家網(wǎng)絡(luò)的輸入為所有礦車的位置、裝貨情況及所有裝礦點(diǎn)的礦量。

        圖3 多智能體訓(xùn)練網(wǎng)絡(luò)

        4 實(shí)驗(yàn)結(jié)果及分析

        4.1 仿真環(huán)境

        編程環(huán)境設(shè)置為Python3.9、Pytorch1.13,顯卡為Rtx3090,電腦環(huán)境為I9-12900k,搭建一個(gè)基于Tkinter0.1.0框架的仿真環(huán)境。

        4.2 強(qiáng)化學(xué)習(xí)仿真環(huán)境

        根據(jù)強(qiáng)化學(xué)習(xí)方法構(gòu)建強(qiáng)化學(xué)習(xí)仿真環(huán)境,為后續(xù)智能體網(wǎng)絡(luò)訓(xùn)練做準(zhǔn)備。基于多智能體強(qiáng)化學(xué)習(xí)的露天礦無(wú)人車調(diào)度實(shí)驗(yàn)仿真過(guò)程如圖4所示。環(huán)境中實(shí)心圓點(diǎn)為裝有礦物的礦車,空心圓點(diǎn)為沒(méi)有礦物的礦車。

        圖4 露天礦無(wú)人車調(diào)度實(shí)驗(yàn)仿真過(guò)程

        (續(xù))圖4 露天礦無(wú)人車調(diào)度實(shí)驗(yàn)仿真過(guò)程

        4.3 模型訓(xùn)練過(guò)程分析

        MADDPG模型是集中式學(xué)習(xí)的代表,其訓(xùn)練過(guò)程獎(jiǎng)勵(lì)變化情況如圖5所示。該模型權(quán)重多、信息冗余,難以收斂。將整個(gè)系統(tǒng)視為一個(gè)整體,采用單智能體強(qiáng)化學(xué)習(xí)算法訓(xùn)練,解決了環(huán)境非平穩(wěn)問(wèn)題,但需要全局通信,不可擴(kuò)展,且在解決無(wú)通信、大規(guī)模和大動(dòng)作空間方面存在不足。

        圖5 MADDPG模型訓(xùn)練過(guò)程獎(jiǎng)勵(lì)變化情況

        DDPG模型是獨(dú)立式學(xué)習(xí)的代表,其訓(xùn)練過(guò)程獎(jiǎng)勵(lì)變化情況如圖6所示。由圖6可以看出,平均獎(jiǎng)勵(lì)隨著交互次數(shù)的增加波動(dòng)較為明顯,但整體呈現(xiàn)出穩(wěn)定趨勢(shì)。但是,DDPG模型的獨(dú)立式學(xué)習(xí)策略忽視了多個(gè)智能體之間的聯(lián)系,這對(duì)于一些合作任務(wù)會(huì)增加學(xué)習(xí)過(guò)程的不穩(wěn)定性。

        圖6 DDPG模型訓(xùn)練過(guò)程獎(jiǎng)勵(lì)變化情況

        S-MADDPG模型訓(xùn)練過(guò)程獎(jiǎng)勵(lì)變化情況如圖7所示。作為折中,訓(xùn)練時(shí)擁有全局通信,提高學(xué)習(xí)效率,執(zhí)行時(shí)各自獨(dú)立決策,這在一定程度上改善了多智能體學(xué)習(xí)問(wèn)題。S-MADDPG模型在改善環(huán)境非平穩(wěn)問(wèn)題的同時(shí),在合作任務(wù)中可以更好地適應(yīng)于協(xié)作的情況,通過(guò)訓(xùn)練智能體之間的合作和協(xié)調(diào)實(shí)現(xiàn)了較優(yōu)的運(yùn)輸策略。

        圖7 S-MADDPG模型訓(xùn)練過(guò)程獎(jiǎng)勵(lì)變化情況

        4.4 模型測(cè)試過(guò)程分析

        不同模型測(cè)試過(guò)程獎(jiǎng)勵(lì)變化情況如圖8所示。由圖8可以看出,所構(gòu)建的S-MADDPG模型的范式模型較其他模型效果更優(yōu)。該模型能夠在合作任務(wù)中通過(guò)協(xié)作、競(jìng)爭(zhēng)和協(xié)調(diào)等機(jī)制,使得多個(gè)智能體能夠相互合作,有效地完成任務(wù)。

        圖8 不同模型測(cè)試過(guò)程獎(jiǎng)勵(lì)變化情況

        4.5 多智能體礦車調(diào)度的實(shí)時(shí)性和能耗比分析

        基于多智能體強(qiáng)化學(xué)習(xí)構(gòu)建的露天礦車輛調(diào)度方法能夠根據(jù)車輛自身信息和所有裝載點(diǎn)信息對(duì)車輛的路徑進(jìn)行導(dǎo)引。在實(shí)驗(yàn)過(guò)程中,計(jì)算出車輛路徑過(guò)程只需1 s,因此理論上完全能夠達(dá)到實(shí)時(shí)調(diào)度。

        在強(qiáng)化學(xué)習(xí)的環(huán)境中車輛除了在裝載和卸載過(guò)程中是處于停車狀態(tài)外,其他狀態(tài)都保持在行進(jìn)狀態(tài)中??梢酝ㄟ^(guò)總的時(shí)間片減去裝載和卸載消耗的時(shí)間片得到車輛運(yùn)行的時(shí)間片,表達(dá)式為

        T=Tsum-Tstop

        在每個(gè)時(shí)間片中,研究人員記錄了每輛車的位置、速度和油量等信息。通過(guò)計(jì)算每個(gè)時(shí)間片中每輛車消耗的油量,并將其與總時(shí)間片相乘,得出了測(cè)試過(guò)程中所有車輛的總耗油量。此外,在獎(jiǎng)勵(lì)分析中,每卸礦一次進(jìn)行一次獎(jiǎng)勵(lì),對(duì)每輛車在卸煤時(shí)進(jìn)行了記錄和統(tǒng)計(jì),并據(jù)此計(jì)算出每輛車的總裝載量和運(yùn)礦量。由此可以發(fā)現(xiàn),通過(guò)該多智能體強(qiáng)化學(xué)習(xí)模型的應(yīng)用,不僅可以優(yōu)化車輛調(diào)度系統(tǒng),還可以提高運(yùn)輸效率并降低成本。

        5 結(jié)語(yǔ)

        針對(duì)露天礦車輛調(diào)度問(wèn)題,提出了一種基于多智能體強(qiáng)化學(xué)習(xí)的露天礦車輛調(diào)度方法,旨在通過(guò)協(xié)同決策和資源共享提高車輛調(diào)度效率和成本效益。該方法的核心是將多個(gè)智能體進(jìn)行耦合,并使其在任務(wù)執(zhí)行中實(shí)現(xiàn)協(xié)調(diào)和協(xié)作,從而能夠更好地應(yīng)對(duì)復(fù)雜的調(diào)度環(huán)境和動(dòng)態(tài)變化的任務(wù)需求。為了驗(yàn)證所提方法的有效性,將所構(gòu)建的S-MADDPG模型與MADDOG模型、DDPG模型等兩個(gè)經(jīng)典模型在實(shí)時(shí)性和能耗比等方面進(jìn)行對(duì)比。驗(yàn)證結(jié)果表明,所提方法能夠改善卡車調(diào)度的實(shí)時(shí)性問(wèn)題,并能提高露天礦車輛調(diào)度能耗比。通過(guò)該多智能體強(qiáng)化學(xué)習(xí)模型的應(yīng)用,可以實(shí)現(xiàn)車輛的自主調(diào)度、多智能體協(xié)同決策、動(dòng)態(tài)資源分配和成本優(yōu)化等功能。

        猜你喜歡
        智能環(huán)境模型
        一半模型
        長(zhǎng)期鍛煉創(chuàng)造體內(nèi)抑癌環(huán)境
        一種用于自主學(xué)習(xí)的虛擬仿真環(huán)境
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        孕期遠(yuǎn)離容易致畸的環(huán)境
        環(huán)境
        智能前沿
        文苑(2018年23期)2018-12-14 01:06:06
        智能前沿
        文苑(2018年19期)2018-11-09 01:30:14
        智能前沿
        文苑(2018年17期)2018-11-09 01:29:26
        国产精品每日更新在线观看| 欧美日韩国产高清| 456亚洲人成在线播放网站| 91国在线啪精品一区| 国产成人8x视频网站入口| 日韩一区二区超清视频| 欧美成人网视频| 一区二区三区乱码专区| 亚洲中文字幕一区二区三区多人| 亚洲男人的天堂色偷偷| 饥渴少妇一区二区三区| 精品私密av一区二区三区| 日韩精品一区二区三区人妻在线| 偷拍韩国美女洗澡一区二区三区| 日本av一区二区三区视频| 久久一二区女厕偷拍图| 亚洲av无码精品色午夜app| 又紧又大又爽精品一区二区| 亚洲 另类 日韩 制服 无码| 成人性生交大片免费| 人妻无码αv中文字幕久久琪琪布 美女视频黄的全免费视频网站 | 91人妻人人做人人爽九色| 麻豆人妻性色av专区0000| 无码a级毛片免费视频内谢5j| 久久99国产综合精品| aaa级久久久精品无码片| 91国际视频| 国产精品一区二区午夜久久| 久久久噜噜噜噜久久熟女m| 国产亚洲人成在线观看| 欧美人妻aⅴ中文字幕| 水蜜桃亚洲一二三四在线| 欧美日韩国产一区二区三区地区| 免費一级欧美精品| 国产老熟女精品一区二区| 日本久久久久亚洲中字幕| √新版天堂资源在线资源| 少妇久久久久久被弄到高潮| 欧美日韩一区二区三区自拍| 国产最新AV在线播放不卡| 久久激情人妻中文字幕|