亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于DQN 的車載邊緣網(wǎng)絡(luò)任務(wù)分發(fā)卸載算法

        2020-11-03 06:54:14趙海濤張?zhí)苽?/span>陳躍趙厚麟朱洪波
        通信學(xué)報(bào) 2020年10期

        趙海濤,張?zhí)苽?,陳躍,趙厚麟 ,朱洪波

        (1.南京郵電大學(xué)教育部泛在網(wǎng)絡(luò)健康服務(wù)系統(tǒng)工程研究中心,江蘇 南京 210003;2.南京郵電大學(xué)江蘇省無線通信重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210003;3.南京郵電大學(xué)通信與信息工程學(xué)院,江蘇 南京 210003)

        1 引言

        作為5G 移動(dòng)通信代表性應(yīng)用場景之一,車聯(lián)網(wǎng)及自動(dòng)駕駛已經(jīng)成為熱點(diǎn)研究領(lǐng)域,在未來將會經(jīng)歷前所未有的發(fā)展[1]。隨著車聯(lián)網(wǎng)等技術(shù)的快速發(fā)展及數(shù)據(jù)量的日益龐大,大量對計(jì)算資源高需求的車載應(yīng)用任務(wù)隨之出現(xiàn),如自動(dòng)駕駛、智能識別、實(shí)時(shí)路況等[2]。這些車載應(yīng)用任務(wù)不僅需要大量的存儲與計(jì)算資源,同時(shí)對于任務(wù)執(zhí)行時(shí)延的要求非常嚴(yán)格,給現(xiàn)有車載設(shè)備的通信能力、計(jì)算能力帶來了很大的挑戰(zhàn)[3]。為了解決車輛終端與車載應(yīng)用任務(wù)之間的矛盾,融合移動(dòng)邊緣計(jì)算(MEC,mobile edge computing)的協(xié)同通信技術(shù)被引入車聯(lián)網(wǎng)中[4]。車輛終端攜帶的計(jì)算任務(wù)可以卸載到路邊單元(RSU,road side unit)配置的MEC 服務(wù)器上,在車輛終端旁邊就能夠完成任務(wù)的計(jì)算及分析,有效緩解了車輛終端計(jì)算、存儲資源不足的困境,減小了計(jì)算任務(wù)的處理時(shí)延與車輛終端能耗[5]。針對任務(wù)遷移和資源調(diào)度問題,國內(nèi)外進(jìn)行了大量相關(guān)研究。文獻(xiàn)[6]對通信與計(jì)算融合技術(shù)的機(jī)遇與挑戰(zhàn)做了大量的介紹,并針對“邊緣智能”提出了具體的實(shí)施方案。然而,動(dòng)態(tài)的車聯(lián)網(wǎng)場景給MEC 技術(shù)的大規(guī)模應(yīng)用帶來了許多問題,車輛終端的高速移動(dòng)及通信參數(shù)的變化導(dǎo)致計(jì)算任務(wù)卸載決策復(fù)雜化[7]。

        目前車聯(lián)網(wǎng)場景下計(jì)算任務(wù)卸載決策主要解決車載應(yīng)用任務(wù)是否需要卸載及卸載多少的問題。卸載決策的主要優(yōu)化目標(biāo)有任務(wù)執(zhí)行時(shí)延、能耗及時(shí)延與能耗的權(quán)衡等[8]。文獻(xiàn)[9]提出了一種面向5G的邊緣計(jì)算多用戶卸載方案,將問題轉(zhuǎn)換為多重背包問題,有效降低了任務(wù)執(zhí)行時(shí)延。文獻(xiàn)[10-12]基于各種數(shù)值優(yōu)化算法,提出了一系列計(jì)算卸載決策及資源配置方案?;隈R爾可夫決策過程理論(MDP,Markov decision process)的強(qiáng)化學(xué)習(xí)方法,如Q 學(xué)習(xí)算法、深度強(qiáng)化學(xué)習(xí)(DRL,deep reinforcement learning)方法如深度Q 網(wǎng)絡(luò)(DQN,deep Q nework)也被研究人員用來解決卸載問題。文獻(xiàn)[13]構(gòu)建了馬爾可夫決策過程函數(shù),解決了車輛終端由于MEC 服務(wù)器服務(wù)范圍不足而導(dǎo)致的服務(wù)中斷問題,解決了單純基于距離進(jìn)行卸載服務(wù)的不足,但是該方法在卸載過程中沒有對服務(wù)方的時(shí)延、能耗等成本進(jìn)行合理的評估。文獻(xiàn)[14]提出了一種基于DQN 的多用戶單小區(qū)計(jì)算卸載與資源分配算法,聯(lián)合優(yōu)化任務(wù)執(zhí)行時(shí)延與能耗的加權(quán)和,實(shí)現(xiàn)了任務(wù)總成本的下降。與其他方法明顯不同的是,DQN 可以在沒有任何先驗(yàn)信息的前提下與環(huán)境進(jìn)行交互,從中學(xué)習(xí)并調(diào)整卸載策略以達(dá)到最佳的長期回報(bào)[15-16],這對于動(dòng)態(tài)時(shí)變的車聯(lián)網(wǎng)環(huán)境來說尤其重要。

        上述方法都沒有針對不同車輛終端進(jìn)行任務(wù)優(yōu)先級劃分,從而不能實(shí)現(xiàn)處理程序的優(yōu)化。同時(shí)這些方法需要實(shí)時(shí)準(zhǔn)確的信道狀態(tài)消息,算法復(fù)雜度高、迭代步驟長,難以滿足時(shí)延敏感型的車聯(lián)網(wǎng)通信系統(tǒng)。針對以上研究中存在的問題,本文通過引入移動(dòng)邊緣計(jì)算,根據(jù)車輛終端任務(wù)屬性的不同進(jìn)行優(yōu)先級劃分,使車輛終端攜帶的計(jì)算任務(wù)能夠直接在邊緣節(jié)點(diǎn)進(jìn)行處理;在車輛終端,基于DQN研究了計(jì)算速率最優(yōu)的任務(wù)卸載策略,在信道條件時(shí)變的環(huán)境中能夠根據(jù)過去的經(jīng)驗(yàn)實(shí)現(xiàn)卸載策略的自我更新,從而有效降低任務(wù)執(zhí)行時(shí)延、提高車聯(lián)網(wǎng)車輛終端用戶的使用體驗(yàn)。

        2 系統(tǒng)模型

        本文選取車輛終端、RSU 與其連接的MEC 服務(wù)器所構(gòu)成的網(wǎng)絡(luò)通信模型。由于車輛終端的快速移動(dòng),車聯(lián)網(wǎng)絡(luò)拓?fù)浼軜?gòu)會產(chǎn)生動(dòng)態(tài)變化。為了滿足時(shí)延要求,車輛終端將其攜帶的計(jì)算任務(wù)遷移至RSU 連接的MEC 服務(wù)器中。這產(chǎn)生了2 個(gè)問題,具體如下。

        1) 卸載決策的制定問題。由于計(jì)算任務(wù)的類型、信道增益均不相同,如果將計(jì)算任務(wù)統(tǒng)一卸載到MEC 服務(wù)器,在信道增益很差的情況下會造成非常嚴(yán)重的傳輸時(shí)延問題,同時(shí)車輛終端計(jì)算資源也得不到充分利用,導(dǎo)致計(jì)算資源浪費(fèi)。因此本文根據(jù)車輛終端信道實(shí)時(shí)狀態(tài)制定卸載決策,將部分車輛終端的計(jì)算任務(wù)卸載至邊緣側(cè)服務(wù)器,從而降低計(jì)算任務(wù)處理時(shí)延、提高計(jì)算資源利用率。

        2) 計(jì)算資源分配問題。系統(tǒng)會根據(jù)業(yè)務(wù)類型分配優(yōu)先級,但是相同類型業(yè)務(wù)由于其屬性的不同,也可能具有不同的優(yōu)先級需求,因此,必須在計(jì)算資源分配之前根據(jù)計(jì)算任務(wù)屬性的不同進(jìn)行預(yù)處理,否則相同的卸載決策會導(dǎo)致MEC 服務(wù)器不能合理分配計(jì)算資源,影響用戶使用體驗(yàn)。

        車聯(lián)網(wǎng)環(huán)境下的計(jì)算任務(wù)卸載模型架構(gòu)如圖1所示。在該模型架構(gòu)中,受限于較弱的計(jì)算能力,部分車輛終端會將自身攜帶的計(jì)算任務(wù)通過無線網(wǎng)絡(luò)卸載到RSU 連接的MEC 服務(wù)器進(jìn)行處理。首先,車輛終端會將自身攜帶的計(jì)算任務(wù)信息如最大可容忍時(shí)延、數(shù)據(jù)量大小、計(jì)算復(fù)雜度等上傳至RSU。RSU 通過計(jì)算得到計(jì)算任務(wù)優(yōu)先級,然后根據(jù)MEC 服務(wù)器的計(jì)算任務(wù)調(diào)度算法決定將哪些車輛終端的計(jì)算任務(wù)卸載至服務(wù)器。車輛終端隨后接受RSU 的調(diào)度信息,開始卸載或執(zhí)行計(jì)算任務(wù)。假設(shè)在計(jì)算任務(wù)執(zhí)行過程中,一旦執(zhí)行時(shí)間超過其最大容忍時(shí)延,就判定當(dāng)前計(jì)算任務(wù)執(zhí)行失敗,并將當(dāng)前計(jì)算任務(wù)執(zhí)行時(shí)間設(shè)置為最大值。

        圖1 計(jì)算任務(wù)卸載模型架構(gòu)

        本文假設(shè)RSU 覆蓋范圍內(nèi)有K個(gè)車輛終端,車輛終端攜帶的計(jì)算任務(wù)表示為Ck=(Vk,Dk,Γk,Pk),其中,Dk表示計(jì)算任務(wù)的數(shù)據(jù)大小,單位為bit;Vk表示計(jì)算任務(wù)計(jì)算復(fù)雜度,單位為round/bit;Γk表示計(jì)算任務(wù)最大可容忍時(shí)延,單位為ms;Pk表示計(jì)算任務(wù)的優(yōu)先級,由RSU計(jì)算后得出。假設(shè)計(jì)算任務(wù)無論是在車輛終端執(zhí)行還是卸載到MEC 服務(wù)器執(zhí)行,以上參數(shù)均保持不變。RSU 覆蓋范圍內(nèi)的所有車輛終端的計(jì)算任務(wù)表示為M={M1,M2,…,Mk},其中k∈K。

        3 車載邊緣網(wǎng)絡(luò)計(jì)算任務(wù)分發(fā)卸載方案

        3.1 計(jì)算任務(wù)優(yōu)先級劃分

        車輛終端將攜帶的計(jì)算任務(wù)卸載到MEC 服務(wù)器時(shí),由于計(jì)算任務(wù)類型的不同導(dǎo)致所需要的計(jì)算資源也不同。層次分析法(AHP,analytic hierarrchy process)指將與決策總是有關(guān)的元素分解成目標(biāo)層、準(zhǔn)則層、方案層等層次,并在此基礎(chǔ)之上進(jìn)行定性和定量分析的決策方法,是一個(gè)多標(biāo)準(zhǔn)決策/多屬性決策模型,非常適用于權(quán)重分配的計(jì)算任務(wù)調(diào)度應(yīng)用場景[17]。本文通過AHP 算法可以給容忍時(shí)延小、計(jì)算復(fù)雜度高的計(jì)算任務(wù)分配相對高一些的權(quán)重系數(shù),為MEC 服務(wù)器的計(jì)算資源調(diào)度過程提供更合理的依據(jù),提高車輛終端計(jì)算任務(wù)的卸載執(zhí)行成功率。

        當(dāng)確定計(jì)算任務(wù)的權(quán)重系數(shù)時(shí),本文主要考慮計(jì)算任務(wù)的計(jì)算復(fù)雜度、數(shù)據(jù)總量和最大容忍時(shí)延這3 個(gè)評價(jià)因素,其中,計(jì)算復(fù)雜度的重要程度最高,數(shù)據(jù)總量次之,最大容忍時(shí)延最低。本文將計(jì)算任務(wù)目標(biāo)層的因素進(jìn)行兩兩比較,構(gòu)造出評價(jià)因素判斷矩陣A=(aij)3×3,以及目標(biāo)層相對于準(zhǔn)則層的判斷矩陣B1,B2,…,B3=(aij)K×K。其中,

        根據(jù)方根法求得判斷矩陣Bk對應(yīng)的權(quán)重向量元素,如式(2)所示。

        其中,k表示第k個(gè)終端車輛,i表示第k個(gè)終端車輛所攜帶任務(wù)的第i個(gè)評價(jià)因素,可以得到所有車輛終端計(jì)算任務(wù)的權(quán)重矢量矩陣為

        根據(jù)同樣的方法求得評價(jià)因素判斷矩陣A的權(quán)重向量Δ=[Δ1,Δ2,Δ3],其權(quán)重元素為

        權(quán)重元素通過一致性檢驗(yàn)后,得到所有計(jì)算任務(wù)的權(quán)重向量W,其中每一個(gè)元素分別代表對應(yīng)車輛終端計(jì)算任務(wù)的權(quán)重,如式(5)所示。

        3.2 卸載決策制定問題的建模

        車輛終端攜帶的計(jì)算任務(wù)分為車輛終端計(jì)算模式和卸載計(jì)算模式。車輛終端用于執(zhí)行計(jì)算任務(wù)的總能耗Econstraint為額定值,當(dāng)前計(jì)算任務(wù)執(zhí)行能耗Ecurrent表示為

        其中,pk為車輛終端發(fā)射功率,kk為能量效率系數(shù),fk為車輛終端處理器頻率,tk為計(jì)算任務(wù)傳輸時(shí)間或車輛終端執(zhí)行時(shí)間。

        其中,Bk為當(dāng)前車輛終端傳輸帶寬,其中最大傳輸帶寬為BHz,N0為信道傳輸噪聲?;贚TE-V2X(long term evolution-vehicle to X)技術(shù),本文假設(shè)無線信道增益gk、車輛終端發(fā)射功率pk及傳輸帶寬Bk在對應(yīng)的時(shí)間段內(nèi)均是時(shí)變的,并且基于分布式方式下的SPS(semi persistent scheduling)資源分配算法[19]對RSU 覆蓋范圍下的車輛終端進(jìn)行統(tǒng)一控制。本文以最大化計(jì)算任務(wù)處理速率為優(yōu)化目標(biāo),以車輛終端能耗與傳輸帶寬為約束,在求得計(jì)算任務(wù)處理速率最大加權(quán)和之后,可求得對應(yīng)的計(jì)算任務(wù)最小執(zhí)行時(shí)延。同時(shí),基于式(5)得出的計(jì)算任務(wù)權(quán)重wk,對于優(yōu)先級別更高的計(jì)算任務(wù)可以分配更多的計(jì)算資源,使其執(zhí)行時(shí)間小于計(jì)算任務(wù)最大容忍時(shí)延,保證計(jì)算任務(wù)卸載過程成功進(jìn)行。本文的優(yōu)化目標(biāo)為

        其中,xk表示為卸載決策向量元素,xk=0 表示車輛終端計(jì)算模式,xk=1 表示卸載計(jì)算模式;約束條件C2 和C3 分別表示計(jì)算任務(wù)執(zhí)行能耗和車輛終端傳輸帶寬不能超過額定值。

        通過求出卸載決策向量的最優(yōu)值可以求解式(8)所示優(yōu)化問題。然而該問題是一個(gè)非凸問題,隨著車輛終端數(shù)量及計(jì)算任務(wù)大小的增加,該問題的計(jì)算復(fù)雜度也會迅速增加。

        3.3 AHP-DQN 任務(wù)分發(fā)卸載算法

        面對上述挑戰(zhàn),傳統(tǒng)的數(shù)值優(yōu)化方法效率較低。本文提出了一種AHP-DQN 任務(wù)分發(fā)卸載算法,其核心思想是將Q 網(wǎng)絡(luò)作為策略評判標(biāo)準(zhǔn),通過Q網(wǎng)絡(luò)遍歷當(dāng)前狀態(tài)下的各種動(dòng)作與環(huán)境進(jìn)行實(shí)時(shí)交互,其動(dòng)作、狀態(tài)值、獎(jiǎng)勵(lì)值存放于回訪記憶單元通過Q 學(xué)習(xí)算法經(jīng)歷多個(gè)迭代過程來反復(fù)訓(xùn)練Q網(wǎng)絡(luò),最后得到最佳卸載策略。與文獻(xiàn)[14]算法不同的是,本文算法通過引入層次分析法對車輛終端計(jì)算任務(wù)進(jìn)行預(yù)處理,提高M(jìn)EC 服務(wù)器對計(jì)算資源的合理分配能力。同時(shí)重新定義了Q 網(wǎng)絡(luò)中的獎(jiǎng)勵(lì)函數(shù),以加權(quán)后的計(jì)算任務(wù)處理速率和為優(yōu)化目標(biāo),減小算法迭代過程中的計(jì)算復(fù)雜度,加快算法收斂速度。本文的卸載決策算法致力于設(shè)計(jì)一個(gè)卸載策略函數(shù),當(dāng)MEC 服務(wù)器收到車輛終端的計(jì)算任務(wù)信息并得出計(jì)算任務(wù)對應(yīng)的權(quán)重時(shí),能夠根據(jù)當(dāng)前車輛終端的無線信道增益情況,快速調(diào)整深度學(xué)習(xí)網(wǎng)絡(luò)參數(shù)θt,并生成計(jì)算任務(wù)卸載策略,策略函數(shù)可以表示為π:g→x。該策略函數(shù)的產(chǎn)生可以分為兩步,具體如下。

        1) 卸載決策動(dòng)作的產(chǎn)生。當(dāng)MEC 服務(wù)器收到車輛終端當(dāng)前的信道增益信息后,深度學(xué)習(xí)網(wǎng)絡(luò)根據(jù)當(dāng)前觀測到的狀態(tài)st得到卸載動(dòng)作向量Xt=[x1,x2,…,xK],并根據(jù)式(7)生成獎(jiǎng)勵(lì)值rt。同時(shí)本文的動(dòng)作狀態(tài)函數(shù)Q(st,xt,θt)由深度學(xué)習(xí)網(wǎng)絡(luò)確定,深度學(xué)習(xí)網(wǎng)絡(luò)激活函數(shù)為ReLu 函數(shù),網(wǎng)絡(luò)輸出函數(shù)為Sigmoid 函數(shù),其對應(yīng)卸載動(dòng)作的概率值。

        2)卸載決策動(dòng)作的更新。根據(jù)式(9)實(shí)現(xiàn)動(dòng)作狀態(tài)函數(shù)的更新。

        其中,αk與γ分別為學(xué)習(xí)速率與折扣因子,s'為第k次迭代過程中執(zhí)行動(dòng)作xt后的狀態(tài)觀測值,x'為狀態(tài)s′下獎(jiǎng)勵(lì)值最大的動(dòng)作,Ek為迭代過程中的累積獎(jiǎng)勵(lì)值。對于第k次迭代過程而言,通過最小化式(10)目標(biāo)函數(shù),可以更新網(wǎng)絡(luò)參數(shù)θ,從而實(shí)現(xiàn)卸載決策動(dòng)作的更新。

        重復(fù)上述2 個(gè)步驟得到t時(shí)刻最佳狀態(tài)對后,將該狀態(tài)?動(dòng)作對(gt,)放入經(jīng)驗(yàn)池,作為新的訓(xùn)練樣本。當(dāng)經(jīng)驗(yàn)池容量足夠后,新生成的狀態(tài)?動(dòng)作對會代替舊的數(shù)據(jù)樣本。深度學(xué)習(xí)網(wǎng)絡(luò)反復(fù)學(xué)習(xí)最佳狀態(tài)對(gt,),并隨著時(shí)間的推移生成更好的卸載決策輸出。在存儲空間有限的約束下,DNN 僅從最新生成的數(shù)據(jù)樣本中進(jìn)行學(xué)習(xí),這種閉環(huán)強(qiáng)化學(xué)習(xí)機(jī)制會不斷改善其卸載策略,直到收斂。本文算法偽代碼如算法1 所示。

        算法1AHP-DQN 計(jì)算任務(wù)分發(fā)卸載算法

        輸入計(jì)算任務(wù)的計(jì)算復(fù)雜度Vk、數(shù)據(jù)總量Dk及最大容忍時(shí)延Γk。根據(jù)式(1)~式(5)得到每個(gè)計(jì)算任務(wù)的優(yōu)先級Pk,即計(jì)算任務(wù)的計(jì)算資源分配權(quán)重

        輸出車輛終端攜帶任務(wù)的最終卸載決策X=[x1,x2,…,xK]

        4 仿真結(jié)果與分析

        本節(jié)通過Python 編程語言對本文算法進(jìn)行仿真以評估算法性能。本文仿真場景為IEEE 802.11p 標(biāo)準(zhǔn)規(guī)定下的車聯(lián)網(wǎng)場景,仿真實(shí)驗(yàn)參數(shù)根據(jù)文獻(xiàn)[20]及移動(dòng)邊緣計(jì)算白皮書相關(guān)約束進(jìn)行假設(shè)。在車聯(lián)網(wǎng)場景下,每個(gè)RSU 的覆蓋范圍為1 000 m,車輛終端速度假設(shè)為40 km/h,每個(gè)車輛終端計(jì)算能力為108round/s,車載車輛終端計(jì)算功率為3 W,發(fā)射功率為0.3 W。攜帶的計(jì)算任務(wù)數(shù)據(jù)(以kbit 為單位)服從[300,500]的均勻分布,計(jì)算任務(wù)復(fù)雜度(以兆輪為單位)服從[9 000,11 000]的均勻分布。下面將本文算法分別與全部車輛終端計(jì)算、Q 學(xué)習(xí)算法、DQN[14]進(jìn)行比較。

        本文算法收斂過程如圖2 所示。縱軸分別表示訓(xùn)練過程中所有車輛終端的歸一化計(jì)算速率及損失函數(shù)值。根據(jù)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的知識,收斂概率與網(wǎng)絡(luò)復(fù)雜度負(fù)相關(guān),結(jié)合應(yīng)用場景的實(shí)際維度情況,本文選擇了兩層DNN 結(jié)構(gòu),同時(shí)在時(shí)延要求較高的車載邊緣網(wǎng)絡(luò)中并不注重未來的潛在回報(bào),因此本文設(shè)置了一個(gè)較小的折扣因子γ。在樣本不多的初期采用較高的學(xué)習(xí)速率αk,隨著經(jīng)驗(yàn)池樣本增加,逐漸減小αk,避免損失函數(shù)過于震蕩。在設(shè)計(jì)Q函數(shù)與獎(jiǎng)勵(lì)值時(shí),一方面盡量使收斂過程中Q的均值為0,另一方面使獎(jiǎng)勵(lì)值的正反饋稍大些,保證初期獎(jiǎng)勵(lì)值的負(fù)反饋過程中能夠采取人工干預(yù)提升正回報(bào),加速收斂過程。從圖2 可以看出,在車輛終端數(shù)目為10 的情況下,本文算法經(jīng)過50 次迭代后,DQN 已經(jīng)逐漸收斂到最優(yōu)解。與Q 學(xué)習(xí)算法的收斂結(jié)果相比較,本文算法得到的優(yōu)化目標(biāo)具有更好的效果。從圖2 還可以看出,盡管設(shè)置了較大的經(jīng)驗(yàn)回放池尺度,由于貪婪概率ε的存在,收斂曲線存在些許波動(dòng),但不影響算法總體的收斂性。

        圖2 3 種算法的收斂過程

        圖3 中,在車輛終端數(shù)目為10 的情況下,將本文算法與全部車輛終端計(jì)算、Q 學(xué)習(xí)算法[14]進(jìn)行比較。從圖3 可以看到,隨著計(jì)算任務(wù)復(fù)雜度的增加,3 種算法的計(jì)算任務(wù)執(zhí)行成功率都在下降。當(dāng)計(jì)算任務(wù)復(fù)雜度最高時(shí),全部車輛終端計(jì)算的計(jì)算任務(wù)執(zhí)行成功率只有24%,Q 學(xué)習(xí)算法的執(zhí)行成功率由81%下降到了64%。與之相對應(yīng)的是,本文算法的執(zhí)行成功率保持了一個(gè)相對穩(wěn)定的狀態(tài)。與Q 學(xué)習(xí)算法一樣,本文算法只對能耗及傳輸帶寬做了相應(yīng)的約束,但是隨著計(jì)算任務(wù)復(fù)雜度的上升,計(jì)算任務(wù)的差異度變大,基于AHP 算法對計(jì)算任務(wù)做的預(yù)處理能夠使MEC 服務(wù)器更加合理地調(diào)度計(jì)算資源,從而提高計(jì)算任務(wù)卸載執(zhí)行成功率。

        圖3 計(jì)算任務(wù)執(zhí)行成功率與計(jì)算復(fù)雜度的關(guān)系

        在計(jì)算任務(wù)復(fù)雜度不變的情況下,將本文算法與全部車輛終端計(jì)算、Q 學(xué)習(xí)算法、DQN 進(jìn)行比較,如圖4 所示。從圖4 可以看到,隨著車輛終端數(shù)的增加,計(jì)算任務(wù)量變大,計(jì)算任務(wù)執(zhí)行時(shí)延都隨之上升。當(dāng)車輛終端數(shù)目小于10 時(shí),本文算法與Q學(xué)習(xí)算法、DQN 的執(zhí)行時(shí)延幾乎沒有不同。當(dāng)車輛終端數(shù)目超過10 時(shí),本文算法的計(jì)算任務(wù)平均執(zhí)行時(shí)延相比全部車輛終端計(jì)算的時(shí)延減少了95 ms,相比Q 學(xué)習(xí)算法減少了24 ms,相比于DQN 有些許提升。隨著計(jì)算任務(wù)數(shù)目的增加,相比全部車輛終端計(jì)算與Q 學(xué)習(xí)算法,本文算法的卸載方案能夠根據(jù)信道實(shí)際情況進(jìn)行學(xué)習(xí),從而做出更合適的卸載決策,使計(jì)算任務(wù)執(zhí)行時(shí)延更小。但是在仿真實(shí)驗(yàn)中,僅改變車輛終端數(shù)目,車輛終端計(jì)算任務(wù)的計(jì)算復(fù)雜度、數(shù)據(jù)量大小等屬性保持不變,基于AHP算法對計(jì)算任務(wù)做出的預(yù)處理產(chǎn)生的效果有限,因此本文算法與Q 學(xué)習(xí)算法的效果提升有限。

        圖4 任務(wù)平均時(shí)延與車輛終端數(shù)目的關(guān)系

        在車輛終端數(shù)目為10 的情況下,隨著一半的車輛終端計(jì)算任務(wù)計(jì)算復(fù)雜度的增加,4 種算法的計(jì)算任務(wù)平均執(zhí)行時(shí)延都在增加,如圖5 所示。從圖5 中可以看出,在計(jì)算任務(wù)復(fù)雜度最高時(shí),本文算法的計(jì)算任務(wù)執(zhí)行時(shí)延與全部車輛終端計(jì)算相比減少了219 ms,與Q 學(xué)習(xí)算法相比減少了64 ms,與DQN 相比減少了24 ms。比較圖4 與圖5 可以看出,在計(jì)算任務(wù)差異度越大的應(yīng)用場景中,本文算法優(yōu)勢越明顯。隨著計(jì)算復(fù)雜度的上升,不同車輛終端的計(jì)算任務(wù)差異度越大,MEC 服務(wù)器計(jì)算資源的分配權(quán)重也隨之變化。與Q 學(xué)習(xí)算法和DQN 不同的是,本文算法對所有車輛終端的計(jì)算任務(wù)做了自適應(yīng)優(yōu)先級預(yù)處理,給優(yōu)先級更高的計(jì)算任務(wù)分配了更多的計(jì)算資源,使計(jì)算任務(wù)執(zhí)行成功概率更高,從而提高卸載決策正確率,有效減小了計(jì)算任務(wù)執(zhí)行時(shí)延。

        圖5 任務(wù)平均時(shí)延與計(jì)算任務(wù)復(fù)雜度的關(guān)系

        5 結(jié)束語

        面向車聯(lián)網(wǎng)環(huán)境中車輛終端受最大容忍時(shí)延及最大能耗約束的情況,本文提出了一種基于深度Q 網(wǎng)絡(luò)的計(jì)算任務(wù)分發(fā)卸載算法。車輛終端首先根據(jù)自身計(jì)算任務(wù)大小、計(jì)算復(fù)雜度及最大容忍時(shí)延等因素對計(jì)算任務(wù)優(yōu)先級進(jìn)行合理劃分,并根據(jù)車輛終端實(shí)時(shí)信道增益進(jìn)行自主卸載決策部署,以找到最優(yōu)策略。通過對該算法的大量仿真分析及數(shù)值驗(yàn)證,本文提出的AHP-DQN 任務(wù)分發(fā)卸載算法在不同的系統(tǒng)參數(shù)下都具有較好的性能。今后的研究將會考慮對DQN 的訓(xùn)練算法及神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行持續(xù)優(yōu)化改進(jìn),同時(shí)對無線電干擾等復(fù)雜環(huán)境因素也會加以考慮。

        久久老熟女一区二区三区福利| 九九在线视频| 国产精品va在线观看一| 亚洲av手机在线观看| 日日麻批免费40分钟无码| 成人区人妻精品一熟女| 久久亚洲AV无码精品色午夜| 在线一区二区三区免费视频观看| 国产午夜亚洲精品国产成人av| 久久99精品久久久久久9蜜桃 | 理论片87福利理论电影| 精品国产乱码一区二区三区在线| 白白色发布视频在线播放| 大地资源网在线观看免费官网| 国产精品久久久久久影视| 一区二区韩国福利网站| 五月综合丁香婷婷久久| 欧美大胆性生话| 国产zzjjzzjj视频全免费| 亚洲加勒比无码一区二区在线播放| 看国产亚洲美女黄色一级片| 欧洲女人与公拘交酡视频| 日韩有码中文字幕在线观看 | 久久精品日本不卡91| 久久久精品人妻无码专区不卡| 欧美深夜福利网站在线观看| 国产精品一区一区三区| 本道天堂成在人线av无码免费 | 不卡免费在线亚洲av| 男女视频在线观看一区| 人妻少妇粉嫩av专区一| 大香蕉久久精品一区二区字幕| 日韩精品有码在线视频| 少妇又色又爽又高潮在线看| 久久精品国产精油按摩| 91免费永久国产在线观看| av成人资源在线播放| 寂寞人妻渴望被中出中文字幕| 午夜三级a三级三点| 粉嫩高中生无码视频在线观看| 精品国产乱子伦一区二区三|