亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        無人機(jī)系統(tǒng)中基于能量效率的資源分配研究

        2021-12-23 12:50:36張志才尹振華
        關(guān)鍵詞:最大化信道信息安全

        張志才,付 芳,尹振華

        (山西大學(xué) 物理電子工程學(xué)院,山西 太原 030006)

        0 引 言

        無人機(jī)被認(rèn)為是5G網(wǎng)絡(luò)重要的組成部分,能為地面用戶提供豐富的服務(wù),如軍事偵察、監(jiān)控和公共安全等[1-3],目前學(xué)術(shù)界關(guān)于無人機(jī)通信系統(tǒng)的研究已經(jīng)有了一定研究基礎(chǔ)[4,5].文獻(xiàn)[4]針對(duì)無人機(jī)系統(tǒng)的緩存放置問題,通過聯(lián)合優(yōu)化無人機(jī)路徑和緩存內(nèi)容放置以達(dá)到最大化吞吐量.文獻(xiàn)[5]提出一種無人機(jī)路徑規(guī)劃模式,以保證信道吞吐量.需要注意的是,上述研究[4,5]都忽略了信息安全,然而,由于無人機(jī)通信信道的廣播特性及信息傳輸?shù)碾[私性,無人機(jī)系統(tǒng)安全傳輸是不得不考慮的問題.雖然傳統(tǒng)的應(yīng)用層加密算法能有效地保證信息安全傳輸,但是這類方法的復(fù)雜度過高.近年來,物理層安全作為一種保密通信的技術(shù)手段受到學(xué)術(shù)界的廣泛研究[6-10].文獻(xiàn)[6]針對(duì)準(zhǔn)靜態(tài)衰落信道下無線通信網(wǎng)絡(luò)場(chǎng)景,通過分析衰落信道的信噪比對(duì)保密速率和通信中斷概率的影響,從而提出基于低密度奇偶校驗(yàn)碼(LDPC)的密鑰協(xié)議;文獻(xiàn)[7]對(duì)無人機(jī)路徑和時(shí)間調(diào)度進(jìn)行了聯(lián)合優(yōu)化,實(shí)現(xiàn)了最小平均保密速率的最大化;文獻(xiàn)[8]綜合考慮優(yōu)化無人機(jī)路徑和功率控制,以最大化無人機(jī)通信系統(tǒng)下行鏈路的平均保密速率;文獻(xiàn)[9]針對(duì)監(jiān)控?zé)o人機(jī)下行傳輸場(chǎng)景,通過優(yōu)化無人機(jī)路徑以最大化接收端信干噪比,用凸優(yōu)化理論求解.文獻(xiàn)[10]綜合考慮無人機(jī)路徑規(guī)劃和傳輸速率分配,以最小化無人機(jī)信息傳輸時(shí)的中斷概率.需要注意的是,目前關(guān)于無人機(jī)安全通信的研究多以保密速率最大化[7,8]、或接收端信干噪比最大化[9]或中斷概率最小化[10]為優(yōu)化目標(biāo),沒有考慮無人機(jī)飛行能量消耗的限制,然而,由于無人機(jī)電池容量有限,如何提高無人機(jī)的能量效率是非常重要的問題.本文旨在通過物理層安全容量描述數(shù)據(jù)傳輸速率定義能量效率并通過合理的功率控制使能量效率最大化,將此優(yōu)化問題建模為MDP,用深度 Q 學(xué)習(xí)網(wǎng)絡(luò)(DQN)來尋求最佳功率策略,在保證信息安全的同時(shí)合理分配功率.

        1 系統(tǒng)架構(gòu)

        1.1 信道模型

        如圖 1 所示,本文設(shè)計(jì)了一種無人機(jī)信息傳輸和防竊取系統(tǒng).該系統(tǒng)主要由軟件定義網(wǎng)絡(luò)(SDN)控制器、無人機(jī)(UAV)、地面宏基站(MBS)和多個(gè)竊聽者(Eves)組成.無人機(jī)飛行在一個(gè)小區(qū)上空以廣播的形式向MBS發(fā)送信息,竊聽者隨機(jī)分布在該小區(qū)里想要截獲無人機(jī)發(fā)送的信息.假設(shè)無人機(jī)能通過機(jī)載攝像頭或雷達(dá)探測(cè)到竊聽者的位置,從而計(jì)算出無人機(jī)到竊聽者之間的距離.為了掩藏和保護(hù)UAV發(fā)送的信號(hào)不被地面Eves非法竊取,MBS發(fā)射人工噪聲干擾Eves,而MBS則可通過消除自身產(chǎn)生的干擾安全獲取信息,即無人機(jī)和MBS之間的合法信道能夠消除人工噪聲的影響,但是無人機(jī)和竊聽者之間的竊聽信道由于不易消除人工噪聲的影響而信道質(zhì)量明顯下降,從而保護(hù)無人機(jī)發(fā)出的信息安全傳輸避免竊聽.SDN控制層中的UAV和MBS根據(jù)基礎(chǔ)層獲取的信道條件(CSI)等信息,通過控制UAV發(fā)射信號(hào)功率和MBS發(fā)射人工噪聲功率以最大化能量效率和保證信息安全傳輸.

        圖1 網(wǎng)絡(luò)架構(gòu)圖

        為了表示方便,令UAV,MBS以及Eves 的位置在笛卡爾坐標(biāo)系中分別表示為(xU,yU,zU),(xB,yB,0)和(xe,ye,0),e∈ε={1,2,3,…,E}表示竊聽設(shè)備集合.因此,UAV與MBS之間的距離

        (1)

        編號(hào)為e的竊聽者記作Evee,UAV與Evee之間的距離

        e∈ε.

        (2)

        MBS與Evee之間的距離

        (3)

        令hU2B表示 UAV與MBS之間的合法信道增益,hU2e表示UAV與Evee之間的竊聽信道增益,假設(shè)它們均是由視距(LoS)主導(dǎo)的信道模型,則

        (4)

        式中:dU2B表示UAV與MBS之間的3D距離,k為dU2B等于1 m時(shí)的單位信道增益,δ1為L(zhǎng)oS信道的路徑損耗指數(shù).同理,hU2e滿足

        (5)

        令hB2e表示MBS 與Evee之間的非視距(NLoS)信道增益,主要由大規(guī)模路徑損耗和小型瑞麗衰落引起.則

        (6)

        式中:δ2為大規(guī)模路徑損耗指數(shù);ξ為小型衰落引起的遵循指數(shù)分布的隨機(jī)變量.

        1.2 安全傳輸能效模型

        由于UAV的電池容量是一定的,如果用于通信設(shè)備的能量消耗過大,無人機(jī)的續(xù)航能力將會(huì)減小,并可能影響整個(gè)UAV系統(tǒng)網(wǎng)絡(luò).因此,本文在考慮信息安全的同時(shí),將提高能量效率考慮在內(nèi).

        傳輸速率是反映信息傳輸快慢的指標(biāo),根據(jù)香農(nóng)公式,UAV與MBS之間合法信道的傳輸速率

        (7)

        式中:B表示帶寬資源;pU(t)是無人機(jī)的發(fā)射功率;hU2B為合法信道增益;NB0是MBS的自然噪聲功率.由于Eves在接收UAV信息的同時(shí),也會(huì)受到來自MBS人工噪聲的干擾,因此,竊聽信道的傳輸速率

        rU2E(pU(t),pB(t))=

        (8)

        式中:NE0表示竊聽設(shè)備的自然噪聲功率;pB(t)表示MBS產(chǎn)生的人工噪聲功率.UAV與MBS之間的物理層安全容量可以定義為合法信道與竊聽信道的速率差,即安全速率

        r(pU(t),pB(t))=

        (9)

        (10)

        1.3 優(yōu)化目標(biāo)

        本文通過SDN控制無人機(jī)發(fā)射有用信號(hào)的功率pU(t)和基站MBS發(fā)射人工噪聲的功率pB(t),以實(shí)現(xiàn)在最大化能量效率的同時(shí)保證安全速率.無人機(jī)系統(tǒng)中的能效問題可表述為

        Maximize∶η

        s.t.minpU≤pU(t)≤maxpU,

        minpB≤pB(t)≤maxpB,

        (11)

        式中:minpU與maxpU分別表示UAV的最小和最大發(fā)射功率;minpB與maxpB分別表示MBS的最小和最大干擾功率.約束條件的含義是,無人機(jī)發(fā)射有用信號(hào)的功率范圍在minpU與maxpU之間,并且基站MBS發(fā)射人工噪聲的功率pB(t)范圍在minpB與maxpB之間.

        1.4 問題建模與求解思路

        對(duì)上述優(yōu)化問題進(jìn)行建模,考慮到無線環(huán)境的動(dòng)態(tài)特性具有馬爾科夫性質(zhì),因此我們將其建模為MDP〈S,A,P,r)〉,其中S表示狀態(tài)空間,包括以下內(nèi)容:

        ?UAV與MBS之間的距離dU2B;

        ?UAV與Eve e之間的距離dU2e,e∈ε;

        ?MBS與Eve e之間的距離dB2e,e∈ε;

        A表示動(dòng)作空間,包括以下內(nèi)容:

        ?UAV發(fā)射有用信號(hào)的功率pU(t);

        ?MBS發(fā)射人工噪聲的功率pB(t);

        P∶S×A×S→[0,∞) 表示狀態(tài)轉(zhuǎn)移函數(shù),由于很難精準(zhǔn)預(yù)測(cè)狀態(tài)轉(zhuǎn)移函數(shù),故采用無模型的深度強(qiáng)化學(xué)習(xí)算法來求解上述MDP問題;

        考慮到實(shí)際無人機(jī)網(wǎng)絡(luò)環(huán)境動(dòng)作和狀態(tài)空間的連續(xù)性和多維度,以及相鄰時(shí)隙動(dòng)作的耦合性,傳統(tǒng)以最大化短期回報(bào)為目標(biāo)的優(yōu)化方法很難保證長(zhǎng)期回報(bào)最大化,而且由于Q學(xué)習(xí)過于依賴Q表,當(dāng)動(dòng)作和狀態(tài)空間維度顯著增加時(shí),Q學(xué)習(xí)會(huì)發(fā)生維度災(zāi)難.策略梯度Policy Graident算法是基于策略搜索的強(qiáng)化學(xué)習(xí)算法,當(dāng)無人機(jī)網(wǎng)絡(luò)動(dòng)態(tài)變化時(shí),梯度易出現(xiàn)不穩(wěn)定,導(dǎo)致收斂性能不好.針對(duì)無人機(jī)網(wǎng)絡(luò)環(huán)境動(dòng)作和狀態(tài)空間具有多維連續(xù)的特征,采用DQN算法來求解上述MDP問題,它是一種基于值函數(shù)的深度強(qiáng)化學(xué)習(xí)算法,在訓(xùn)練時(shí)采用了Q學(xué)習(xí)的思路,用神經(jīng)網(wǎng)絡(luò)擬合Q學(xué)習(xí)中的誤差項(xiàng).

        2 基于Deep Q-learning Network算法的資源優(yōu)化

        DQN算法采用神經(jīng)網(wǎng)絡(luò)近似值函數(shù),如圖 2 所示.算法包含兩個(gè)結(jié)構(gòu)相同參數(shù)不同的Q網(wǎng)絡(luò),分別為current Q網(wǎng)絡(luò)和target Q網(wǎng)絡(luò).一個(gè)step中,agent在狀態(tài)s下根據(jù)ε-greedy策略(π)做出動(dòng)作a時(shí)會(huì)獲得回報(bào)r,同時(shí)轉(zhuǎn)移到下一狀態(tài)s′,這些信息(s,a,r,s′)存儲(chǔ)在Replay Buffer中,算法從中隨機(jī)選取minibatch經(jīng)驗(yàn)用于訓(xùn)練,從而打亂了相關(guān)性,使學(xué)習(xí)更有效率.由于動(dòng)作a同時(shí)影響當(dāng)前回報(bào)和未來收益,因此基于Bellman方程,current Q的近似值

        Qπ(s,a)≈Q(s,a;θ)=r+γQ(s′,a′;θ),

        (12)

        式中:γ=[0,1]為折扣因子,θ為current Q網(wǎng)絡(luò)的參數(shù),該網(wǎng)絡(luò)每隔N步將參數(shù)傳遞給target網(wǎng)絡(luò).current Q值Q(s,a;θ)與target Q值Q*(s,a;θ*)之差構(gòu)成損失函數(shù),即

        (13)

        圖 2 算法流程圖

        參數(shù)θ的更新公式為梯度下降

        θi+1=θi+α?θL(θ),

        (14)

        式中:0<α≤1為學(xué)習(xí)效率.

        3 算法仿真與數(shù)據(jù)分析

        本節(jié)中,針對(duì)本文提出的基于DQN算法的功率控制策略,在Python平臺(tái)進(jìn)行仿真.在覆蓋半徑為100 m的區(qū)域中,每個(gè)Episode隨機(jī)初始UAV和MBS的位置,多個(gè)Eves的位置在每個(gè)Step均進(jìn)行初始化,具體仿真參數(shù)如表 1 所示.

        表 1 仿真參數(shù)設(shè)置

        圖 3 是DQN算法不同學(xué)習(xí)效率(α)的收斂圖,從圖 3 中可知,當(dāng)α=0.1時(shí),大約40個(gè)Episodes(每個(gè)Episode包含100個(gè)Step)可以收斂,而α=0.01時(shí),大約需要300個(gè)Episodes才可以收斂,可見,在一定范圍內(nèi),收斂速度會(huì)隨著學(xué)習(xí)率的增高而加快.但并非學(xué)習(xí)率越高越好,如圖 3 中,當(dāng)α=0.5時(shí),雖然收斂速度與α=0.1相當(dāng),但是收斂值明顯更低,這是因?yàn)橄萑肓司植渴諗?因此,最佳的學(xué)習(xí)率為α=0.1.

        圖 3 不同學(xué)習(xí)率收斂圖

        從圖 4 可以看到,經(jīng)典的Policy Gradient算法在400個(gè)Episodes左右可以達(dá)到收斂,收斂值大約比DQN算法低100,這是因?yàn)镈QN中采用了ε-greedy策略,從而使探索更充分,避免陷入局部最優(yōu).因此,本文所提出的算法在回報(bào)值和學(xué)習(xí)速度方面都優(yōu)于Policy Gradient算法,并且遠(yuǎn)勝過隨機(jī)選動(dòng)作的情況,可以說明本文算法的有效性.

        圖 4 本文算法與其他算法的性能比較

        圖5為竊聽者密度與平均回報(bào)之間的關(guān)系圖,將UAV和MBS固定在半徑為100 m的區(qū)域中隨機(jī)撒點(diǎn),變化Eves的密度和范圍.可以看到,當(dāng)覆蓋半徑一定時(shí),隨著竊聽數(shù)量的減少,平均回報(bào)值會(huì)增大.當(dāng)竊聽數(shù)量固定時(shí),隨著覆蓋半徑的擴(kuò)展,平均回報(bào)值逐漸增大.可見,區(qū)域面積竊聽密度越小,平均回報(bào)值越高.

        圖 5 竊聽密度與平均回報(bào)關(guān)系圖

        4 結(jié) 論

        本文考慮了無人機(jī)系統(tǒng)中的物理層安全傳輸,主要研究了通過控制無人機(jī)發(fā)射有用信號(hào)的功率和MBS發(fā)射人工噪聲的功率,在保證無人機(jī)信息安全傳輸?shù)耐瑫r(shí),最大化其能量效率.考慮到實(shí)際無人機(jī)網(wǎng)絡(luò)環(huán)境動(dòng)作和狀態(tài)空間具有多維連續(xù)的特征,將上述優(yōu)化問題建模為MDP,并采用DQN算法來求解最優(yōu)功率控制策略.

        猜你喜歡
        最大化信道信息安全
        勉縣:力求黨建“引領(lǐng)力”的最大化
        Advantages and Disadvantages of Studying Abroad
        劉佳炎:回國(guó)創(chuàng)業(yè)讓人生價(jià)值最大化
        保護(hù)信息安全要滴水不漏
        高校信息安全防護(hù)
        保護(hù)個(gè)人信息安全刻不容緩
        基于導(dǎo)頻的OFDM信道估計(jì)技術(shù)
        一種改進(jìn)的基于DFT-MMSE的信道估計(jì)方法
        戴夫:我更愿意把公益性做到最大化
        基于MED信道選擇和虛擬嵌入塊的YASS改進(jìn)算法
        国产亚洲综合一区二区三区| 国产v精品成人免费视频400条 | 中文字幕人妻少妇伦伦| 少妇被又大又粗又爽毛片| 亚洲精品乱码久久久久久蜜桃不卡| 四虎影院在线观看| 中日无码精品一区二区三区| 8888四色奇米在线观看| 精品无码成人片一区二区| 国产三级在线观看不卡| 亚洲另类丰满熟妇乱xxxx| 国产自拍偷拍精品视频在线观看| 日本一区二区三区免费精品| 永久黄网站色视频免费看| 日韩欧美在线综合网| 2022Av天堂在线无码| 男人的av天堂狠狠操| 高清不卡av一区二区| 无码人妻一区二区三区在线 | 亚洲国产精品一区二区成人av| 美女脱了内裤张开腿让男人桶网站| 丰满少妇被粗大的猛烈进出视频| 国产香蕉97碰碰视频va碰碰看| 亚洲Av无码专区尤物| 白白色发布视频在线播放 | 97在线视频免费| 国产一级淫片a免费播放口| 亚洲一区二区三区天堂av| 干日本少妇一区二区三区| 波多野结衣的av一区二区三区| 亚洲日韩∨a无码中文字幕| 蜜桃av无码免费看永久| 日韩极品在线观看视频| 日本顶级metart裸体全部| 色五月丁香五月综合五月4438| 粗了大了 整进去好爽视频| 日本a在线播放| 白丝美女扒开内露出内裤视频 | 国产日产精品_国产精品毛片| 人妻夜夜爽天天爽一区| 一区二区视频观看在线|