亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向軟件定義多模態(tài)車聯(lián)網(wǎng)的雙時(shí)間尺度RAN 切片資源分配

        2022-04-29 05:15:28亓偉敬宋清洋郭磊
        通信學(xué)報(bào) 2022年4期
        關(guān)鍵詞:時(shí)間尺度資源分配傳輸速率

        亓偉敬,宋清洋,郭磊

        (重慶郵電大學(xué)通信與信息工程學(xué)院智能通信與網(wǎng)絡(luò)安全研究院,重慶 400065)

        0 引言

        5G 低時(shí)延特點(diǎn)為車聯(lián)網(wǎng)發(fā)展提供了先決條件,車聯(lián)網(wǎng)從車載信息服務(wù)階段逐漸邁向基于智能網(wǎng)聯(lián)的駕駛輔助階段和自動(dòng)駕駛階段。近年來,具有不同的用戶體驗(yàn)質(zhì)量(QoE,quality of experience)、服務(wù)質(zhì)量(QoS,quality of service)等級需求的新型車載應(yīng)用不斷涌現(xiàn),對車聯(lián)網(wǎng)功能、系統(tǒng)性能、安全性等也提出了不同的要求[1]。多媒體、在線會(huì)議和增強(qiáng)現(xiàn)實(shí)/虛擬現(xiàn)實(shí)等信息娛樂服務(wù)通常占用大網(wǎng)絡(luò)帶寬,以保證較高的網(wǎng)絡(luò)吞吐量。相反,支撐智能駕駛的安全信息服務(wù)通常需要通過協(xié)作感知消息(CAM,cooperative awareness message)、分散環(huán)境通知消息(DENM,decentralized environment notification message)等承載駕駛環(huán)境狀態(tài),由于環(huán)境狀態(tài)信息的高動(dòng)態(tài)性,在這些情況下應(yīng)保證低時(shí)延且高可靠性的網(wǎng)絡(luò)連接。為每項(xiàng)業(yè)務(wù)提供專用網(wǎng)絡(luò)可以滿足其相應(yīng)的需求,但絕大多數(shù)服務(wù)提供商無法承擔(dān)專用網(wǎng)絡(luò)建設(shè)和維護(hù)成本。軟件定義網(wǎng)絡(luò)(SDN,software defined network)技術(shù)將網(wǎng)絡(luò)設(shè)備的控制面與數(shù)據(jù)面分離,從而擺脫硬件對網(wǎng)絡(luò)架構(gòu)的限制,對網(wǎng)絡(luò)流量進(jìn)行靈活控制。SDN 是構(gòu)建全維可定義開放網(wǎng)絡(luò)架構(gòu)、實(shí)現(xiàn)多模態(tài)網(wǎng)絡(luò)的基礎(chǔ)[2]。文獻(xiàn)[3]明確提出城市交通是全維可定義多模態(tài)智慧網(wǎng)絡(luò)的一個(gè)典型垂直應(yīng)用,近年來,針對軟件定義多模態(tài)車聯(lián)網(wǎng)的研究也在不斷開展[4-5]。網(wǎng)絡(luò)切片可以通過網(wǎng)絡(luò)功能虛擬化(NFV,network function virtualization)將網(wǎng)絡(luò)資源虛擬化并聚合為資源池,并由支持SDN 的切片管理控制器集中管理,實(shí)現(xiàn)更細(xì)粒度的資源編排,在通用物理基礎(chǔ)設(shè)施上按需定制虛擬網(wǎng)絡(luò),實(shí)現(xiàn)軟件定義的多模態(tài)網(wǎng)絡(luò),為不同類型的車聯(lián)網(wǎng)業(yè)務(wù)提供差異化QoS 保障。例如,增強(qiáng)型移動(dòng)寬帶(eMBB,enhanced mobile broadband)切片可以承載信息娛樂等大帶寬業(yè)務(wù),超可靠低時(shí)延通信(URLLC,ultra-reliable and low-latency communication)切片可以承載實(shí)時(shí)路況監(jiān)測、實(shí)時(shí)路況更新、導(dǎo)航準(zhǔn)確度提升、安全自動(dòng)駕駛等低時(shí)延、高可靠業(yè)務(wù)[6]。在車聯(lián)網(wǎng)這樣的高動(dòng)態(tài)網(wǎng)絡(luò)中,網(wǎng)絡(luò)切片在無線接入網(wǎng)(RAN,radio access network)側(cè)的功能實(shí)現(xiàn)簡稱為RAN 切片,其可以顯著提高網(wǎng)絡(luò)的靈活性和資源的利用效率,從而提高網(wǎng)絡(luò)在連接性、端到端時(shí)延、數(shù)據(jù)傳輸速率等方面的性能。

        在實(shí)際的RAN 切片實(shí)現(xiàn)和部署中,其資源分配根據(jù)對資源使用的動(dòng)態(tài)性和彈性程度,可劃分為以下三大類:靜態(tài)預(yù)留、半靜態(tài)預(yù)留、動(dòng)態(tài)共享[7]。其中,動(dòng)態(tài)共享方式基于用戶QoS 在每個(gè)時(shí)隙靈活為切片分配資源,相應(yīng)資源就會(huì)通過網(wǎng)絡(luò)下層信令的方式進(jìn)行動(dòng)態(tài)調(diào)整,實(shí)現(xiàn)資源快速回收或增配。RAN 切片資源動(dòng)態(tài)共享方式具有較高的資源利用率,因此被廣泛采用。然而,車聯(lián)網(wǎng)拓?fù)浜蛿?shù)據(jù)流量的高動(dòng)態(tài)性對RAN 切片資源分配提出了巨大挑戰(zhàn)。如何有效利用網(wǎng)絡(luò)的動(dòng)態(tài)異構(gòu)資源以滿足不同服務(wù)的多維QoS 需求成為發(fā)揮RAN 切片潛在優(yōu)勢的關(guān)鍵。因此,從用戶QoS和網(wǎng)絡(luò)資源利用的角度來看,開發(fā)高效的RAN切片資源分配方案勢在必行。

        近年來,針對車聯(lián)網(wǎng)環(huán)境中的RAN 切片資源分配已有很多成果,主要解決車聯(lián)網(wǎng)中用戶的QoS 需求保證問題。文獻(xiàn)[8]中較早提出了支持各種車載服務(wù)的RAN 切片概念。文獻(xiàn)[9]針對車聯(lián)網(wǎng)場景提出了一種動(dòng)態(tài)RAN 切片框架,通過均衡網(wǎng)絡(luò)負(fù)載和分配網(wǎng)絡(luò)資源,實(shí)現(xiàn)在任務(wù)卸載最大時(shí)延和排隊(duì)穩(wěn)定性約束下的系統(tǒng)通信、計(jì)算成本最小化。文獻(xiàn)[10]描述了一個(gè)針對RAN 切片的資源分配和計(jì)算卸載聯(lián)合優(yōu)化問題,以實(shí)現(xiàn)通信、計(jì)算資源利用率最大化為目標(biāo)??紤]到2 個(gè)優(yōu)化問題之間的耦合作用,文獻(xiàn)[10]提出分層優(yōu)化框架,基于協(xié)作多智能體DDQN(double deep Q-learning network)框架來學(xué)習(xí)卸載策略,基于凸優(yōu)化實(shí)現(xiàn)RAN 切片資源分配。文獻(xiàn)[11]基于深度強(qiáng)化學(xué)習(xí)提出了適用于智能車聯(lián)網(wǎng)和智慧城市系統(tǒng)的切片方案,智能體可以通過與環(huán)境的密切交互來自適應(yīng)地學(xué)習(xí)最佳網(wǎng)絡(luò)切片策略。針對車聯(lián)網(wǎng)中的關(guān)鍵任務(wù)和非關(guān)鍵任務(wù)需求,文獻(xiàn)[12]通過端到端切片對整體帶寬資源進(jìn)行隔離,研究表明,基于人工智能(AI,artificial intelligence)的切片管理系統(tǒng)可以智能調(diào)配RAN 切片資源,解決業(yè)務(wù)需求高動(dòng)態(tài)對服務(wù)質(zhì)量帶來的影響。文獻(xiàn)[13]提出了基于交叉熵的蒙特卡羅樹搜索-快速動(dòng)作價(jià)值估計(jì)算法來設(shè)計(jì)智能切片資源分配方案,此方案不需要任何動(dòng)態(tài)數(shù)據(jù)流相關(guān)的先驗(yàn)知識(shí)。為權(quán)衡車聯(lián)網(wǎng)中視頻流傳輸質(zhì)量與資源消耗代價(jià),文獻(xiàn)[14]提出了一種新穎的RAN 切片資源分配和視頻質(zhì)量選擇聯(lián)合優(yōu)化算法。文獻(xiàn)[15]設(shè)計(jì)了一種基于深度確定性策略梯度的動(dòng)態(tài)RAN 切片方案,其獎(jiǎng)勵(lì)由車到車(V2V,vehicle-to-vehicle)用戶的效用總和與QoS 度量組成。綜上所述,現(xiàn)有工作大多側(cè)重于RAN 切片分配通信和計(jì)算資源,很少考慮將緩存策略視為切片資源分配的一個(gè)因素,由于無線資源分配和緩存放置之間的密切關(guān)系,將緩存策略和資源分配聯(lián)合考慮至關(guān)重要。但是由于緩存內(nèi)容更新產(chǎn)生的高傳輸代價(jià)導(dǎo)致緩存決策不可能頻繁執(zhí)行,這與無線資源分配需要在每個(gè)時(shí)隙內(nèi)快速?zèng)Q策的特點(diǎn)不同,因此需要考慮兩類決策時(shí)間尺度的差異。此外,車聯(lián)網(wǎng)運(yùn)行在高動(dòng)態(tài)環(huán)境中,車載服務(wù)請求在時(shí)空域隨機(jī)到達(dá),未來網(wǎng)絡(luò)狀態(tài)難以預(yù)測,這使長期穩(wěn)定的系統(tǒng)性能尤為重要。本文工作旨在對現(xiàn)有研究的上述缺陷進(jìn)行一定程度的彌補(bǔ)。

        本文考慮軟件定義車聯(lián)網(wǎng)中同時(shí)存在eMBB和URLLC 兩類RAN 切片,提出一種雙時(shí)間尺度的RAN 切片資源分配算法,本文主要貢獻(xiàn)如下。

        1) 建立了軟件定義車聯(lián)網(wǎng)中URLLC 和eMBB的RAN 切片緩存、頻譜、功率資源分配優(yōu)化問題。最大化長期累積時(shí)間下的URLLC 切片用戶的平均時(shí)延,并滿足eMBB 切片用戶最小速率約束、V2V鏈路可靠性約束、節(jié)點(diǎn)最大功率約束、資源塊(RB,resource block)約束等。該問題是一個(gè)非凸、非線性、多變量耦合的NP-hard 問題,很難直接獲得解析解。

        2) 提出了一種雙時(shí)間尺度求解算法。將原NP-hard 問題轉(zhuǎn)換為2 個(gè)子問題:大時(shí)間尺度內(nèi)用戶關(guān)聯(lián)和緩存放置子問題、小時(shí)間尺度內(nèi)RB 分配和復(fù)用子問題。針對第一個(gè)子問題,基于拉格朗日對偶原理將其分解,并基于匈牙利算法、線性整數(shù)規(guī)劃方法獲得最優(yōu)解;針對第二個(gè)子問題,基于DDQN 算法求解。

        3) 開展了廣泛的仿真驗(yàn)證。仿真結(jié)果表明,所提資源分配算法在保證不同切片用戶QoS 需求和提高頻譜利用率方面優(yōu)于傳統(tǒng)算法,驗(yàn)證了本文算法的有效性。

        1 系統(tǒng)模型

        1.1 場景描述

        本文考慮一個(gè)基站(BS,base station)覆蓋的道路區(qū)域,其中部署了若干個(gè)路邊單元(RSU,road side unit),RSU 功率較低,覆蓋范圍有限。在此區(qū)域內(nèi)的車輛用戶根據(jù)業(yè)務(wù)需求連接到BS 或RSU,組成如圖1 所示的基于網(wǎng)絡(luò)切片的車聯(lián)網(wǎng)。其包含三類鏈路:BS 到車輛(B2V,BS-to-vehicle)下行鏈路、RSU 到車輛(R2V,RSU-to-vehicle)下行鏈路以及V2V 鏈路。

        圖1 基于網(wǎng)絡(luò)切片的車聯(lián)網(wǎng)架構(gòu)

        設(shè)該車聯(lián)網(wǎng)架構(gòu)中具有N個(gè)RSU,其集合表示為N={1,2,…,N},K個(gè)具有eMBB 切片需求的車輛用戶B2V-eUE 通過高容量的B2V 鏈路傳輸數(shù)據(jù),U個(gè)具有URLLC 切片需求的車輛用戶R2V-uUE 通過低時(shí)延的R2V 鏈路傳輸數(shù)據(jù),M對具有URLLC切片需求的車輛用戶V2V-uUE 通過V2V 鏈路交換數(shù)據(jù)。K={1,2,…,K}、U={K+1,K+2,…,K+U}、M={1,2,…,M}分別表示B2V-eUE、R2V-uUE 和V2V-uUE 三類用戶的集合。需要注意的是,對于V2V-uUE 成對計(jì)入,即集合M中的第m個(gè)元素表示第m個(gè)V2V-uUE 用戶對。B2V-eUE 和R2V-uUE 下行用戶集合表示為Q=K∪U={1,2,…,Q},Q=K+U。假設(shè)內(nèi)容服務(wù)器中共有F個(gè)用戶感興趣的內(nèi)容文件,其集合表示為F={1,2,…,F},第f個(gè)文件的大小為Cf。如果某個(gè)R2V-uUE 用戶請求的文件緩存在某個(gè)RSU 中,則直接從該RSU 獲取其請求的文件,否則需要向BS 請求該文件。在時(shí)分雙工(TDD,time division duplexing)-正交頻分復(fù)用(OFDM,orthogonal frequency-division multiplexing)技術(shù)支持下的5G 網(wǎng)絡(luò)通信系統(tǒng)中,在頻域中以12個(gè)子載波為一組進(jìn)行調(diào)度,子載波組稱為新空口(NR,new radio)RB。RB 帶寬取決于子載波間隔。假設(shè)系統(tǒng)只能將一個(gè)RB 分配給集合Q中的一個(gè)下行用戶B2V-eUE 或者R2V-uUE,S={1,2,…,S}表示系統(tǒng)中的RB 集合。為了提高頻譜利用效率,V2V-uUE 用戶對復(fù)用了正交分配給B2V-eUE 或者R2V-uUE 的下行頻譜。

        1.2 系統(tǒng)模型

        1.2.1 通信模型

        考慮信道衰落,當(dāng)占用第s個(gè)RB 時(shí),BS 到第k個(gè)B2V-eUE 的信道增益為

        其中,hk,s是快速衰落分量,αk,s是路徑損耗和陰影衰落分量。

        類似地,占用第s個(gè)RB 時(shí),第n個(gè)RSU 到第u個(gè)R2V-uUE 的信道增益為gn,u,s。對于第m個(gè)V2V-uUE 用戶對,當(dāng)其復(fù)用第q個(gè)下行用戶(B2V-eUE 或者R2V-uUE)占用的RB 時(shí),其信道增益為gm,q,且其對第q個(gè)用戶帶來的干擾為g~m,q,第q個(gè)B2V-eUE 對第m個(gè)V2V-uUE 帶來的干擾為。假設(shè)基站作為該系統(tǒng)的決策控制器可以實(shí)時(shí)獲得所有鏈路的信道狀態(tài)信息。

        定義ρm,q∈{0,1}為一個(gè)二進(jìn)制變量,表示第m個(gè)V2V-uUE 對是(ρm,q=1)否(ρm,q=0)復(fù)用第q個(gè)用戶的頻譜。因此頻譜復(fù)用配對策略矩陣可以表示為

        第k個(gè)B2V-eUE 占用第s個(gè)RB 時(shí)接收的瞬時(shí)信噪比(SINR,signal noise ratio)為

        第k個(gè)B2V-eUE 占用第s個(gè)RB 時(shí)可達(dá)到的傳輸數(shù)據(jù)速率由香農(nóng)方程計(jì)算,即

        定義δq,s∈{0,1}為二進(jìn)制變量,表示是(δq,s=1)否(δq,s=0)將第s個(gè)RB 分配給第q個(gè)用戶。因此,頻譜分配策略集合可表示為

        第k個(gè)B2V-eUE 可達(dá)到的傳輸數(shù)據(jù)速率為

        第u個(gè)R2V-uUE 與第n個(gè)RSU 連接所接收到的瞬時(shí)下行SINR 為

        第u個(gè)R2V-uUE 與第n個(gè)RSU 連接可達(dá)到的傳輸數(shù)據(jù)速率為

        定義αn,u∈{0,1}為一個(gè)二進(jìn)制變量,表示第u個(gè)R2V-uUE 是(αn,u=1)否(αn,u=0)與第n個(gè)RSU建立連接。因此,R2V-uUE 與RSU 的關(guān)聯(lián)策略矩陣為

        第u個(gè)R2V-uUE 可達(dá)到的傳輸數(shù)據(jù)速率為

        當(dāng)?shù)趍個(gè)V2V-uUE 對共享第q個(gè)下行用戶的RB 時(shí),第m個(gè)V2V-uUE 的SINR 為

        第m個(gè)V2V-uUE 對共享第q個(gè)下行用戶的RB可達(dá)到的傳輸數(shù)據(jù)速率為

        第m個(gè)V2V-uUE 的傳輸數(shù)據(jù)速率為

        1.2.2 緩存模型

        定義βf,n∈{0,1}為一個(gè)二進(jìn)制變量,表示第f個(gè)文件是(βf,n=1)否(βf,n=0)緩存在第n個(gè)RSU中。因此,緩存放置策略矩陣為

        同時(shí),第u個(gè)R2V-uUE 用戶的文件請求偏好用請求概率Pu,f來表示,且滿足。如果關(guān)聯(lián)第n個(gè)RSU 的第u個(gè)R2V-uUE 請求的第f個(gè)文件緩存在此RSU中,則第u個(gè)R2V-uUE直接從該RSU獲取其請求的文件,其無線傳輸時(shí)延部分為

        其中,Cf是第f個(gè)文件的大小。

        如果文件未緩存在用戶關(guān)聯(lián)的RSU 中,則通過光纖鏈路從云服務(wù)器中獲取文件。除了無線傳輸時(shí)延,還需要考慮增加的光纖傳輸時(shí)延。為簡化起見,假設(shè)光纖傳輸時(shí)延為固定值LF,那么總時(shí)延為。

        因此,關(guān)聯(lián)第n個(gè)RSU 的第u個(gè)R2V-uUE 請求的第f個(gè)文件的時(shí)延為

        2 問題描述

        2.1 切片QoS 需求

        利用eMBB切片承載的車載應(yīng)用需要高數(shù)據(jù)傳輸速率,因此B2V 鏈路的數(shù)據(jù)傳輸速率需要滿足閾值,BS 到第k個(gè)B2V-eUE 的數(shù)據(jù)傳輸速率滿足

        對于R2V-uUE 來說,其向RSU 或者云服務(wù)器請求的文件利用URLLC 切片承載,從系統(tǒng)最優(yōu)的角度來考慮,需要保證所有R2V-uUE 的平均時(shí)延最小化,R2V-uUE 平均時(shí)延為

        對于V2V-uUE 來說,假設(shè)車輛之間交換短消息,一旦建立可靠鏈路,其傳輸時(shí)延可以保證。但是在車輛高速運(yùn)動(dòng)的過程中,需要保證V2V 鏈路的可靠性,即V2V 鏈路中斷概率小于閾值,第m個(gè)V2V-uUE 的中斷概率滿足

        2.2 聯(lián)合優(yōu)化問題描述

        為了優(yōu)化兩類切片中用戶不同的性能指標(biāo),一種常見的方法是將多個(gè)指標(biāo)組合成一個(gè)統(tǒng)一的優(yōu)化目標(biāo),例如定義系統(tǒng)數(shù)據(jù)傳輸速率與能耗比率為能量效率[16],定義系統(tǒng)數(shù)據(jù)傳輸速率與通信信道帶寬比率為頻譜效率[17]。但是,目前速率與時(shí)延的比率尚未定義,沒有實(shí)際意義。因此,本文優(yōu)化R2V-uUE 的URLLC切片的時(shí)延性能,同時(shí)保證B2V-mUE 的eMBB 切片傳輸速率需求和V2V-uUE 的URLLC 切片鏈路可靠性需求。本文提出了一個(gè)聯(lián)合頻譜資源分配及復(fù)用、緩存內(nèi)容放置及R2V-uUE 用戶關(guān)聯(lián)的優(yōu)化問題,以最小化在URLLC切片中R2V-uUE的長期累積平均時(shí)延,同時(shí)OFDMA 載波正交性、載波允許復(fù)用數(shù)量、用戶接入容量、用戶最大發(fā)射功率、緩存容量以及不同用戶QoS 需求(即B2V-mUE 的數(shù)據(jù)傳輸速率和V2V-uUE 的鏈路可靠性)被視為約束。令ρ={ρm,q:為頻譜復(fù)用關(guān)聯(lián)矩陣、RB 分配矩陣、R2V-uUE 與RSU關(guān)聯(lián)矩陣、RSU 中文件緩存狀態(tài)矩陣和V2V-uUE 發(fā)射功率矩陣。該問題可以表示為

        其中,優(yōu)化目標(biāo)是最小化URLLC 切片中R2V-uUE的平均時(shí)延。約束式(21a)限制 eMBB 切片中B2V-eUE 的數(shù)據(jù)傳輸速率不低于閾值;約束式(21b)限制URLLC 切片中V2V-uUE 的鏈路中斷概率不大于閾值;約束式(21c)限制RSU 中緩存的所有文件大小不超過其緩存空間;約束式(21d)限制每個(gè)V2V-uUE 必須且只能復(fù)用一個(gè) B2V-eUE 或者R2V-uUE 的RB;約束式(21e)限制一個(gè)B2V-eUE 或者R2V-uUE 的RB 最多提供給一個(gè)V2V-uUE 復(fù)用;約束式(21f)限制必須且只能給每個(gè)B2V-eUE 和R2V-uUE 分配一個(gè)RB;約束式(21g)限制每個(gè)RB 最多分配給一個(gè)B2V-eUE 或者R2V-uUE;約束式(21h)限制每個(gè)R2V-uUE 必須且只能關(guān)聯(lián)一個(gè)RSU;約束式(21i)限制每個(gè)RSU 最多接入的R2V-uUE 數(shù)量;約束式(21j)限制V2V-uUE 的最大功率不超過閾值PV;約束式(21k)~式(21n)為二進(jìn)制變量約束。

        優(yōu)化問題P1 是一個(gè)混合整數(shù)非線性組合優(yōu)化問題,是典型的NP-hard 問題。由于該網(wǎng)絡(luò)中有大量的內(nèi)容文件、車輛和RB,因此P1 無法在多項(xiàng)式時(shí)間內(nèi)解決。獲得最優(yōu)解的直接方法是將問題分解為多個(gè)子問題并進(jìn)行窮舉搜索。然而,在這樣一個(gè)高度動(dòng)態(tài)的車載網(wǎng)絡(luò)中,應(yīng)該實(shí)時(shí)做出優(yōu)化決策。

        3 雙時(shí)間尺度資源分配算法

        為了解決P1 的計(jì)算復(fù)雜性,本節(jié)提出了一種有效的雙時(shí)間尺度資源分配算法來優(yōu)化網(wǎng)絡(luò)切片的子載波分配、用戶關(guān)聯(lián)和緩存放置。假設(shè)網(wǎng)絡(luò)系統(tǒng)在一個(gè)時(shí)間窗口上工作,該時(shí)間窗口被劃分為由t∈T={1,2,…,T}表示的離散時(shí)隙。假設(shè)基站作為該系統(tǒng)的決策控制器,其在每個(gè)時(shí)間窗開始進(jìn)行用戶關(guān)聯(lián)和緩存放置決策,在每個(gè)時(shí)隙開始時(shí)為發(fā)送數(shù)據(jù)傳輸請求的車輛用戶分配(包括復(fù)用匹配)RB 和功率。

        3.1 大時(shí)間尺度內(nèi)用戶關(guān)聯(lián)和緩存放置決策

        基于給定的RB 分配和復(fù)用策略,P1 目標(biāo)函數(shù)中的傳輸速率Rn,u變?yōu)橐阎?,記作,P1 簡化為只包含用戶關(guān)聯(lián)和緩存放置策略的優(yōu)化問題P2,即

        由于存在αn,u與βf,n這2 個(gè)變量相乘項(xiàng),P2 為整數(shù)非線性規(guī)劃問題,利用McCormick 包絡(luò)將該問題松弛。定義χf,n,u=α n,uβf,n并引入上述目標(biāo)函數(shù),可將P2 轉(zhuǎn)化為P3。

        為了簡化P3 的約束,本文利用拉格朗日松弛乘子法轉(zhuǎn)換該問題。定義拉格朗日乘子φf,n,u,γf,n,u,ηf,n,u≥ 0,拉格朗日函數(shù)表示為

        因此,P3 可以轉(zhuǎn)化為P4。

        分解后,聯(lián)合優(yōu)化問題變成了單獨(dú)的優(yōu)化問題。子問題P4_1 是一個(gè)典型的賦值問題,可以用匈牙利算法解決。子問題P4_2 和P4_3 都是線性整數(shù)優(yōu)化問題,可以用線性整數(shù)規(guī)劃方法求解。

        3.2 小時(shí)間尺度內(nèi)RB 分配和功率控制決策

        在大時(shí)間尺度內(nèi)進(jìn)行用戶關(guān)聯(lián)和緩存放置決策后,優(yōu)化問題P1 可以簡化為RB 分配和功率控制問題,在每個(gè)小時(shí)間尺度-時(shí)隙內(nèi)求解。優(yōu)化問題為

        不考慮上述優(yōu)化問題目標(biāo)函數(shù)中的固定值,P5等價(jià)于

        本文提出了一種基于多智能體DDQN 的RB 分配和功率控制算法,并對算法在訓(xùn)練階段和推理階段的執(zhí)行流程和工作方式分別進(jìn)行了介紹。該算法能夠?qū)W習(xí)用戶所處的狀態(tài),做出最佳的決策,使一個(gè)時(shí)間窗內(nèi)所有R2V-uUE 的累積傳輸速率和最高,同時(shí)保證B2V-eUE 和V2V-uUE 的QoS 需求。由于時(shí)間相關(guān)特性,決策被建模為馬爾可夫決策過程。

        3.2.1 馬爾可夫決策過程

        在馬爾可夫決策過程中,在每個(gè)時(shí)隙t,智能體通過識(shí)別當(dāng)前狀態(tài)來感知環(huán)境,然后選擇一個(gè)動(dòng)作并在環(huán)境中執(zhí)行。隨后環(huán)境回應(yīng)智能體的動(dòng)作at,反饋回獎(jiǎng)勵(lì),同時(shí)以概率過渡到下一個(gè)狀態(tài)。

        1) 狀態(tài)空間

        因此,第t個(gè)時(shí)隙網(wǎng)絡(luò)狀態(tài)集合可表示為

        2) 動(dòng)作空間

        車聯(lián)網(wǎng)切片資源調(diào)度歸結(jié)為頻譜RB 選擇和傳輸功率控制。系統(tǒng)中頻譜被分為S個(gè)不相交的RB,每個(gè)RB 都由一個(gè)B2V 或者R2V 鏈路占據(jù),同時(shí)每個(gè)V2V 鏈路采用一定的發(fā)射功率復(fù)用B2V 或者R2V 鏈路的RB。定義網(wǎng)絡(luò)中每個(gè)用戶為一個(gè)智能體,每個(gè)B2V-eUE 和R2V-uUE 在每個(gè)時(shí)隙采取的動(dòng)作為RB 選擇,其動(dòng)作空間維度為S。

        V2V-uUE 在每個(gè)時(shí)隙采取的動(dòng)作為RB 復(fù)用配對及發(fā)射功率選擇。為了簡化動(dòng)作空間,本文將功率控制選項(xiàng)限制為4 個(gè)級別,即[23,10,5,-100]dBm。需要注意的是,-100 dBm 意味著發(fā)射功率為0。因此,動(dòng)作空間的維度為4×S,每個(gè)動(dòng)作對應(yīng)于RB分配選擇和功率選擇組合。

        3) 獎(jiǎng)勵(lì)

        智能體通過未來一段時(shí)間內(nèi)獎(jiǎng)勵(lì)的期望值來表示對當(dāng)前狀態(tài)下執(zhí)行該動(dòng)作的滿意程度??紤]到P5的優(yōu)化目標(biāo)為最大化R2V-uUE的平均傳輸速率,定義獎(jiǎng)勵(lì)rt=r(,at)為用戶在狀態(tài)下采取行動(dòng)at時(shí)所獲得的R2V-uUE 的平均傳輸速率,這有利于實(shí)現(xiàn)優(yōu)化目標(biāo)。本文使那些導(dǎo)致更高能源效率的行動(dòng)獲得更高的相應(yīng)獎(jiǎng)勵(lì)。此外,還需要考慮約束條件式(21a)和式(21b)。為了保證用戶的公平性,對不能滿足B2V-eUE 最低通信速率和B2V-uUE 最低鏈路可靠性要求的動(dòng)作進(jìn)行懲罰。因此,設(shè)定獎(jiǎng)勵(lì)函數(shù)包含兩部分,一是對R2V-uUE 平均傳輸速率的貢獻(xiàn),二是當(dāng)傳輸速率和鏈路可靠性不能滿足用戶需求時(shí)的懲罰。用戶在第t個(gè)時(shí)隙獲得的獎(jiǎng)勵(lì)為

        其中,w1為貢獻(xiàn)對應(yīng)的權(quán)重,w2和w3為2 個(gè)懲罰對應(yīng)的權(quán)重;ξ(·) 為一個(gè)函數(shù),且當(dāng)·為真時(shí),ξ(·) =1。

        3.2.2 基于DDQN 的RB 分配和功率控制

        根據(jù)上述定義,便可基于多智能體DDQN 實(shí)現(xiàn)車輛用戶分配RB 和功率的決策。在多智能體DDQN算法中,智能體將每一步的狀態(tài)、功率分配決策、網(wǎng)絡(luò)能量效率獎(jiǎng)勵(lì)和下一狀態(tài)作為經(jīng)驗(yàn)存儲(chǔ)到經(jīng)驗(yàn)重放器。在每次的迭代訓(xùn)練中,神經(jīng)網(wǎng)絡(luò)從經(jīng)驗(yàn)重放器中隨機(jī)選擇一部分樣本來訓(xùn)練。多智能體DDQN 使用損失函數(shù)評估其性能,并采用反向傳播算法實(shí)現(xiàn)目標(biāo)Q 網(wǎng)絡(luò)和原Q 網(wǎng)絡(luò)權(quán)值的更新。

        多智能體DDQN 算法通過值函數(shù)來評價(jià)當(dāng)前資源分配策略的好壞,其中,值函數(shù)表示智能體在某個(gè)狀態(tài)下執(zhí)行某個(gè)分配決策獲得的長期回報(bào)。在策略π下,智能體的動(dòng)作值函數(shù)為

        其中,θ為DDQN 網(wǎng)絡(luò)參數(shù),E[]為期望運(yùn)算。

        首先,在當(dāng)前Q 網(wǎng)絡(luò)中找到最大Q值對應(yīng)的動(dòng)作,表示為amax,如式(34)所示。

        然后,利用amax計(jì)算目標(biāo)Q 網(wǎng)絡(luò)的Q值,如式(35)所示。

        其中,yt是目標(biāo)網(wǎng)絡(luò)的Q值。

        將式(34)代入式(35),結(jié)果如式(36)所示。

        DDQN 的損失函數(shù)為

        DDQN 采用隨機(jī)梯度下降法訓(xùn)練θ,最終得到最優(yōu)的θ,以逼近動(dòng)作價(jià)值函數(shù)。其中,參數(shù)θ的更新式為

        其中,η是學(xué)習(xí)率。

        綜上所述,本文所提的雙時(shí)間尺度智能資源分配算法流程如算法1 所示。

        算法1雙時(shí)間尺度智能資源分配算法

        4 仿真與結(jié)果分析

        4.1 仿真場景

        本文設(shè)計(jì)了雙時(shí)間尺度RAN 切片資源智能分配算法,該算法融合匈牙利算法、線性整數(shù)規(guī)劃方法和DDQN 算法,在滿足eMBB 切片用戶最小傳輸速率需求和V2V 鏈路可靠性的前提下,最小化URLLC 切片用戶的平均傳輸速率。本節(jié)使用Python語言基于開源深度學(xué)習(xí)平臺(tái)TensorFlow 對本文算法進(jìn)行仿真和性能驗(yàn)證。

        默認(rèn)情況下,本文考慮一個(gè)包含一個(gè)基站、5 個(gè)B2V-eUE、5個(gè)RSU、12個(gè)R2V-uUE和2個(gè)V2V-uUE的車聯(lián)網(wǎng)系統(tǒng),系統(tǒng)中可分配的RB 數(shù)量為20,每個(gè)RB 的帶寬為15 kHz。為了驗(yàn)證算法性能,本文調(diào)節(jié)網(wǎng)絡(luò)規(guī)模、網(wǎng)絡(luò)中各節(jié)點(diǎn)和RB 數(shù)量。實(shí)驗(yàn)中共傳輸10 個(gè)文件,每個(gè)文件的大小為 1 kbit。每個(gè)RSU 可以緩存3 個(gè)文件。前傳時(shí)延為0.5 s。智能體DDQN 由3 個(gè)完全連接的隱藏層組成,分別包含500、250、120 個(gè)神經(jīng)元。采用ReLU 為激活函數(shù),RMSProp 優(yōu)化器以0.01 的學(xué)習(xí)率更新網(wǎng)絡(luò)參數(shù)。訓(xùn)練探索率從0.4 下降到0.001,然后保持不變。具體參數(shù)設(shè)置如表1 所示。

        表1 仿真參數(shù)設(shè)置

        為驗(yàn)證本文所提的雙時(shí)間尺度資源分配算法的性能,將其與以下3 種算法進(jìn)行對比。

        1) 隨機(jī)算法,在滿足約束的情況下隨機(jī)進(jìn)行緩存、頻譜和功率資源分配。

        2) 貪婪算法,當(dāng)前狀態(tài)下最好或最優(yōu)(即最有利)的選擇。

        3) 基于Q-Learning 的雙時(shí)間尺度算法,即在大時(shí)間尺度內(nèi)與本文所提算法相同,采用基于匈牙利算法、線性整數(shù)規(guī)劃方法求解;在小時(shí)間尺度內(nèi)則基于Q-Learning 算法進(jìn)行頻譜和功率資源的分配。

        4.2 仿真結(jié)果與分析

        損失函數(shù)值隨訓(xùn)練迭代次數(shù)的變化如圖2 所示,展現(xiàn)了本文所提的小時(shí)間尺度下基于DDQN通信資源分配算法的收斂過程。從圖2 中可以看出,隨著訓(xùn)練迭代次數(shù)的增加,損失函數(shù)值不斷減小,當(dāng)訓(xùn)練迭代次數(shù)達(dá)到400 時(shí),損失函數(shù)值已經(jīng)收斂到0.5 左右;當(dāng)訓(xùn)練迭代次數(shù)達(dá)到2 000 時(shí),損失函數(shù)值已經(jīng)達(dá)到0.17?;诖耍诮酉聛碓u估算法性能時(shí),本文將DDQN 模型訓(xùn)練了2 000 次,以保障其收斂性。

        圖2 損失函數(shù)值隨訓(xùn)練迭代次數(shù)的變化

        圖3為4種不同的切片資源分配算法下R2V-uUE平均時(shí)延隨R2V-uUE 數(shù)量的變化曲線。從圖3 可以看出,4 種分配算法的R2V-uUE 平均時(shí)延都隨R2V-uUE 數(shù)量的增加而增加。其中,隨機(jī)算法曲線具有更大的波動(dòng)性,網(wǎng)絡(luò)性能不穩(wěn)定。貪婪算法和基于Q-Learning 的雙時(shí)間尺度算法在網(wǎng)絡(luò)規(guī)模較小(即網(wǎng)絡(luò)中R2V-uUE 數(shù)量較少)時(shí)與本文所提算法表現(xiàn)相當(dāng)。但是,隨著網(wǎng)絡(luò)中R2V-uUE 數(shù)量的增加,本文所提算法的平均時(shí)延低于其他3 種算法?;贒DQN的算法解決了Q-Learning 中的維數(shù)災(zāi)難問題并克服了DQN 中Q 值過估計(jì)的缺點(diǎn),可以通過學(xué)習(xí)得到適用于環(huán)境的資源分配策略,實(shí)現(xiàn)最小化R2V-uUE 平均時(shí)延的目標(biāo)。

        圖3 R2V-uUE 平均時(shí)延隨R2V-uUE 數(shù)量的變化

        圖 4 為 4 種不同的切片資源分配算法下R2V-uUE 平均時(shí)延隨V2V-uUE 對數(shù)的變化曲線。從圖4 可以看出,4 種分配算法的R2V-uUE 平均時(shí)延都隨V2V-uUE 對數(shù)的增加而增加。這是由于過多的V2V-uUE 用戶對復(fù)用R2V-uUE 的頻譜對其R2V 鏈路的傳輸速率產(chǎn)生了影響。但是本文所提算法最大限度地克服了這種影響。

        圖4 R2V-uUE 平均時(shí)延隨V2V-uUE 對數(shù)的變化

        不同RSU 緩存容量下R2V-uUE 平均時(shí)延隨系統(tǒng)文件數(shù)量的變化如圖5 所示。從圖5 可以看出,平均時(shí)延會(huì)隨著RSU 緩存容量的增加而減少。但當(dāng)文件總數(shù)遠(yuǎn)大于容量時(shí),下降趨勢不明顯。由于RSU 具有緩存能力,R2V-uUE 可以直接從關(guān)聯(lián)的RSU 獲取緩存文件,而沒有前傳時(shí)延。

        圖5 R2V-uUE 平均時(shí)延隨系統(tǒng)文件數(shù)量的變化

        本文所提算法下用戶滿意度隨RB 數(shù)量的變化如圖6 所示。從圖6 可以看出,系統(tǒng)采用相同RB 數(shù)量的前提下,允許頻譜共享具有更高的用戶滿意度,從而容納更多用戶,提高了頻譜資源利用率。

        5 結(jié)束語

        針對軟件定義多模態(tài)車聯(lián)網(wǎng),本文設(shè)計(jì)了雙時(shí)間尺度RAN 切片資源緩存、頻譜、功率智能分配算法。該算法在大時(shí)間尺度內(nèi)基于匈牙利算法、線性整數(shù)規(guī)劃方法解決用戶關(guān)聯(lián)和緩存放置決策子問題,在小時(shí)間尺度內(nèi)基于DDQN 算法解決RB 分配和功率控制子問題。在滿足eMBB 切片用戶最小傳輸速率需求和V2V 鏈路可靠性的前提下,算法通過不斷學(xué)習(xí)車輛用戶信道狀態(tài)變化,最終最小化URLLC 切片用戶的平均傳輸速率。仿真結(jié)果表明,本文所提算法在保證不同切片用戶QoS 需求和提高頻譜利用率方面優(yōu)于傳統(tǒng)算法。

        猜你喜歡
        時(shí)間尺度資源分配傳輸速率
        時(shí)間尺度上非完整系統(tǒng)的Noether準(zhǔn)對稱性與守恒量
        時(shí)間尺度上Lagrange 系統(tǒng)的Hojman 守恒量1)
        交直流混合微電網(wǎng)多時(shí)間尺度協(xié)同控制
        能源工程(2021年1期)2021-04-13 02:06:12
        新研究揭示新冠疫情對資源分配的影響 精讀
        英語文摘(2020年10期)2020-11-26 08:12:20
        一種基于價(jià)格競爭的D2D通信資源分配算法
        跨山通信中頻段選擇與傳輸速率的分析
        黑龍江電力(2017年1期)2017-05-17 04:25:16
        大連市暴雨多時(shí)間尺度研究分析
        數(shù)據(jù)傳輸速率
        CHIP新電腦(2016年9期)2016-09-21 10:31:09
        新一代全球衛(wèi)星通信網(wǎng)絡(luò)將百倍提升傳輸速率
        新一代全球衛(wèi)星通信網(wǎng)絡(luò)將百倍提升傳輸速率
        极品精品视频在线观看| 国产内射合集颜射| 九九久久99综合一区二区| 亚洲精品一区二区三区大桥未久| 亚洲国产精品自产拍久久蜜AV | 久久久久亚洲av无码a片软件 | 日本女优激情四射中文字幕| 粗大的内捧猛烈进出小视频| 精品国产乱码久久久软件下载| 欧美深夜福利视频| 国产一区二区三区观看视频| 成人性生交c片免费看| 一本到亚洲av日韩av在线天堂 | a毛片全部免费播放| 在线观看极品裸体淫片av| 极品尤物在线精品一区二区三区 | 亚洲无线一二三四区手机| 人妻无码久久一区二区三区免费| 欧美日韩中文字幕日韩欧美| 亚洲国产成人va在线观看天堂| 日韩人妻系列在线观看| 巨人精品福利官方导航| 欧美成人免费高清视频| 亚洲AV乱码毛片在线播放| av毛片亚洲高清一区二区| 国精产品一区一区三区有限在线| 欧美 丝袜 自拍 制服 另类| 亚洲日韩精品A∨片无码加勒比| 一区二区三区视频免费观看在线| 日韩av无码一区二区三区| 免费人成视频x8x8入口| 亚洲日韩中文字幕一区| 亚洲综合无码| 久久久亚洲精品蜜臀av| 中文字幕一区二区av| 天天躁日日躁狠狠躁| 中文字幕乱码人妻无码久久麻豆| 狠狠色丁香婷婷久久综合2021| 熟妇人妻精品一区二区视频| 少妇高潮惨叫久久久久电影69| 日韩人妻无码一区二区三区久久99|