亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        無人機(jī)系統(tǒng)中基于能量效率的資源分配研究

        2021-12-23 12:50:36張志才尹振華
        關(guān)鍵詞:最大化信道信息安全

        張志才,付 芳,尹振華

        (山西大學(xué) 物理電子工程學(xué)院,山西 太原 030006)

        0 引 言

        無人機(jī)被認(rèn)為是5G網(wǎng)絡(luò)重要的組成部分,能為地面用戶提供豐富的服務(wù),如軍事偵察、監(jiān)控和公共安全等[1-3],目前學(xué)術(shù)界關(guān)于無人機(jī)通信系統(tǒng)的研究已經(jīng)有了一定研究基礎(chǔ)[4,5].文獻(xiàn)[4]針對(duì)無人機(jī)系統(tǒng)的緩存放置問題,通過聯(lián)合優(yōu)化無人機(jī)路徑和緩存內(nèi)容放置以達(dá)到最大化吞吐量.文獻(xiàn)[5]提出一種無人機(jī)路徑規(guī)劃模式,以保證信道吞吐量.需要注意的是,上述研究[4,5]都忽略了信息安全,然而,由于無人機(jī)通信信道的廣播特性及信息傳輸?shù)碾[私性,無人機(jī)系統(tǒng)安全傳輸是不得不考慮的問題.雖然傳統(tǒng)的應(yīng)用層加密算法能有效地保證信息安全傳輸,但是這類方法的復(fù)雜度過高.近年來,物理層安全作為一種保密通信的技術(shù)手段受到學(xué)術(shù)界的廣泛研究[6-10].文獻(xiàn)[6]針對(duì)準(zhǔn)靜態(tài)衰落信道下無線通信網(wǎng)絡(luò)場(chǎng)景,通過分析衰落信道的信噪比對(duì)保密速率和通信中斷概率的影響,從而提出基于低密度奇偶校驗(yàn)碼(LDPC)的密鑰協(xié)議;文獻(xiàn)[7]對(duì)無人機(jī)路徑和時(shí)間調(diào)度進(jìn)行了聯(lián)合優(yōu)化,實(shí)現(xiàn)了最小平均保密速率的最大化;文獻(xiàn)[8]綜合考慮優(yōu)化無人機(jī)路徑和功率控制,以最大化無人機(jī)通信系統(tǒng)下行鏈路的平均保密速率;文獻(xiàn)[9]針對(duì)監(jiān)控?zé)o人機(jī)下行傳輸場(chǎng)景,通過優(yōu)化無人機(jī)路徑以最大化接收端信干噪比,用凸優(yōu)化理論求解.文獻(xiàn)[10]綜合考慮無人機(jī)路徑規(guī)劃和傳輸速率分配,以最小化無人機(jī)信息傳輸時(shí)的中斷概率.需要注意的是,目前關(guān)于無人機(jī)安全通信的研究多以保密速率最大化[7,8]、或接收端信干噪比最大化[9]或中斷概率最小化[10]為優(yōu)化目標(biāo),沒有考慮無人機(jī)飛行能量消耗的限制,然而,由于無人機(jī)電池容量有限,如何提高無人機(jī)的能量效率是非常重要的問題.本文旨在通過物理層安全容量描述數(shù)據(jù)傳輸速率定義能量效率并通過合理的功率控制使能量效率最大化,將此優(yōu)化問題建模為MDP,用深度 Q 學(xué)習(xí)網(wǎng)絡(luò)(DQN)來尋求最佳功率策略,在保證信息安全的同時(shí)合理分配功率.

        1 系統(tǒng)架構(gòu)

        1.1 信道模型

        如圖 1 所示,本文設(shè)計(jì)了一種無人機(jī)信息傳輸和防竊取系統(tǒng).該系統(tǒng)主要由軟件定義網(wǎng)絡(luò)(SDN)控制器、無人機(jī)(UAV)、地面宏基站(MBS)和多個(gè)竊聽者(Eves)組成.無人機(jī)飛行在一個(gè)小區(qū)上空以廣播的形式向MBS發(fā)送信息,竊聽者隨機(jī)分布在該小區(qū)里想要截獲無人機(jī)發(fā)送的信息.假設(shè)無人機(jī)能通過機(jī)載攝像頭或雷達(dá)探測(cè)到竊聽者的位置,從而計(jì)算出無人機(jī)到竊聽者之間的距離.為了掩藏和保護(hù)UAV發(fā)送的信號(hào)不被地面Eves非法竊取,MBS發(fā)射人工噪聲干擾Eves,而MBS則可通過消除自身產(chǎn)生的干擾安全獲取信息,即無人機(jī)和MBS之間的合法信道能夠消除人工噪聲的影響,但是無人機(jī)和竊聽者之間的竊聽信道由于不易消除人工噪聲的影響而信道質(zhì)量明顯下降,從而保護(hù)無人機(jī)發(fā)出的信息安全傳輸避免竊聽.SDN控制層中的UAV和MBS根據(jù)基礎(chǔ)層獲取的信道條件(CSI)等信息,通過控制UAV發(fā)射信號(hào)功率和MBS發(fā)射人工噪聲功率以最大化能量效率和保證信息安全傳輸.

        圖1 網(wǎng)絡(luò)架構(gòu)圖

        為了表示方便,令UAV,MBS以及Eves 的位置在笛卡爾坐標(biāo)系中分別表示為(xU,yU,zU),(xB,yB,0)和(xe,ye,0),e∈ε={1,2,3,…,E}表示竊聽設(shè)備集合.因此,UAV與MBS之間的距離

        (1)

        編號(hào)為e的竊聽者記作Evee,UAV與Evee之間的距離

        e∈ε.

        (2)

        MBS與Evee之間的距離

        (3)

        令hU2B表示 UAV與MBS之間的合法信道增益,hU2e表示UAV與Evee之間的竊聽信道增益,假設(shè)它們均是由視距(LoS)主導(dǎo)的信道模型,則

        (4)

        式中:dU2B表示UAV與MBS之間的3D距離,k為dU2B等于1 m時(shí)的單位信道增益,δ1為L(zhǎng)oS信道的路徑損耗指數(shù).同理,hU2e滿足

        (5)

        令hB2e表示MBS 與Evee之間的非視距(NLoS)信道增益,主要由大規(guī)模路徑損耗和小型瑞麗衰落引起.則

        (6)

        式中:δ2為大規(guī)模路徑損耗指數(shù);ξ為小型衰落引起的遵循指數(shù)分布的隨機(jī)變量.

        1.2 安全傳輸能效模型

        由于UAV的電池容量是一定的,如果用于通信設(shè)備的能量消耗過大,無人機(jī)的續(xù)航能力將會(huì)減小,并可能影響整個(gè)UAV系統(tǒng)網(wǎng)絡(luò).因此,本文在考慮信息安全的同時(shí),將提高能量效率考慮在內(nèi).

        傳輸速率是反映信息傳輸快慢的指標(biāo),根據(jù)香農(nóng)公式,UAV與MBS之間合法信道的傳輸速率

        (7)

        式中:B表示帶寬資源;pU(t)是無人機(jī)的發(fā)射功率;hU2B為合法信道增益;NB0是MBS的自然噪聲功率.由于Eves在接收UAV信息的同時(shí),也會(huì)受到來自MBS人工噪聲的干擾,因此,竊聽信道的傳輸速率

        rU2E(pU(t),pB(t))=

        (8)

        式中:NE0表示竊聽設(shè)備的自然噪聲功率;pB(t)表示MBS產(chǎn)生的人工噪聲功率.UAV與MBS之間的物理層安全容量可以定義為合法信道與竊聽信道的速率差,即安全速率

        r(pU(t),pB(t))=

        (9)

        (10)

        1.3 優(yōu)化目標(biāo)

        本文通過SDN控制無人機(jī)發(fā)射有用信號(hào)的功率pU(t)和基站MBS發(fā)射人工噪聲的功率pB(t),以實(shí)現(xiàn)在最大化能量效率的同時(shí)保證安全速率.無人機(jī)系統(tǒng)中的能效問題可表述為

        Maximize∶η

        s.t.minpU≤pU(t)≤maxpU,

        minpB≤pB(t)≤maxpB,

        (11)

        式中:minpU與maxpU分別表示UAV的最小和最大發(fā)射功率;minpB與maxpB分別表示MBS的最小和最大干擾功率.約束條件的含義是,無人機(jī)發(fā)射有用信號(hào)的功率范圍在minpU與maxpU之間,并且基站MBS發(fā)射人工噪聲的功率pB(t)范圍在minpB與maxpB之間.

        1.4 問題建模與求解思路

        對(duì)上述優(yōu)化問題進(jìn)行建模,考慮到無線環(huán)境的動(dòng)態(tài)特性具有馬爾科夫性質(zhì),因此我們將其建模為MDP〈S,A,P,r)〉,其中S表示狀態(tài)空間,包括以下內(nèi)容:

        ?UAV與MBS之間的距離dU2B;

        ?UAV與Eve e之間的距離dU2e,e∈ε;

        ?MBS與Eve e之間的距離dB2e,e∈ε;

        A表示動(dòng)作空間,包括以下內(nèi)容:

        ?UAV發(fā)射有用信號(hào)的功率pU(t);

        ?MBS發(fā)射人工噪聲的功率pB(t);

        P∶S×A×S→[0,∞) 表示狀態(tài)轉(zhuǎn)移函數(shù),由于很難精準(zhǔn)預(yù)測(cè)狀態(tài)轉(zhuǎn)移函數(shù),故采用無模型的深度強(qiáng)化學(xué)習(xí)算法來求解上述MDP問題;

        考慮到實(shí)際無人機(jī)網(wǎng)絡(luò)環(huán)境動(dòng)作和狀態(tài)空間的連續(xù)性和多維度,以及相鄰時(shí)隙動(dòng)作的耦合性,傳統(tǒng)以最大化短期回報(bào)為目標(biāo)的優(yōu)化方法很難保證長(zhǎng)期回報(bào)最大化,而且由于Q學(xué)習(xí)過于依賴Q表,當(dāng)動(dòng)作和狀態(tài)空間維度顯著增加時(shí),Q學(xué)習(xí)會(huì)發(fā)生維度災(zāi)難.策略梯度Policy Graident算法是基于策略搜索的強(qiáng)化學(xué)習(xí)算法,當(dāng)無人機(jī)網(wǎng)絡(luò)動(dòng)態(tài)變化時(shí),梯度易出現(xiàn)不穩(wěn)定,導(dǎo)致收斂性能不好.針對(duì)無人機(jī)網(wǎng)絡(luò)環(huán)境動(dòng)作和狀態(tài)空間具有多維連續(xù)的特征,采用DQN算法來求解上述MDP問題,它是一種基于值函數(shù)的深度強(qiáng)化學(xué)習(xí)算法,在訓(xùn)練時(shí)采用了Q學(xué)習(xí)的思路,用神經(jīng)網(wǎng)絡(luò)擬合Q學(xué)習(xí)中的誤差項(xiàng).

        2 基于Deep Q-learning Network算法的資源優(yōu)化

        DQN算法采用神經(jīng)網(wǎng)絡(luò)近似值函數(shù),如圖 2 所示.算法包含兩個(gè)結(jié)構(gòu)相同參數(shù)不同的Q網(wǎng)絡(luò),分別為current Q網(wǎng)絡(luò)和target Q網(wǎng)絡(luò).一個(gè)step中,agent在狀態(tài)s下根據(jù)ε-greedy策略(π)做出動(dòng)作a時(shí)會(huì)獲得回報(bào)r,同時(shí)轉(zhuǎn)移到下一狀態(tài)s′,這些信息(s,a,r,s′)存儲(chǔ)在Replay Buffer中,算法從中隨機(jī)選取minibatch經(jīng)驗(yàn)用于訓(xùn)練,從而打亂了相關(guān)性,使學(xué)習(xí)更有效率.由于動(dòng)作a同時(shí)影響當(dāng)前回報(bào)和未來收益,因此基于Bellman方程,current Q的近似值

        Qπ(s,a)≈Q(s,a;θ)=r+γQ(s′,a′;θ),

        (12)

        式中:γ=[0,1]為折扣因子,θ為current Q網(wǎng)絡(luò)的參數(shù),該網(wǎng)絡(luò)每隔N步將參數(shù)傳遞給target網(wǎng)絡(luò).current Q值Q(s,a;θ)與target Q值Q*(s,a;θ*)之差構(gòu)成損失函數(shù),即

        (13)

        圖 2 算法流程圖

        參數(shù)θ的更新公式為梯度下降

        θi+1=θi+α?θL(θ),

        (14)

        式中:0<α≤1為學(xué)習(xí)效率.

        3 算法仿真與數(shù)據(jù)分析

        本節(jié)中,針對(duì)本文提出的基于DQN算法的功率控制策略,在Python平臺(tái)進(jìn)行仿真.在覆蓋半徑為100 m的區(qū)域中,每個(gè)Episode隨機(jī)初始UAV和MBS的位置,多個(gè)Eves的位置在每個(gè)Step均進(jìn)行初始化,具體仿真參數(shù)如表 1 所示.

        表 1 仿真參數(shù)設(shè)置

        圖 3 是DQN算法不同學(xué)習(xí)效率(α)的收斂圖,從圖 3 中可知,當(dāng)α=0.1時(shí),大約40個(gè)Episodes(每個(gè)Episode包含100個(gè)Step)可以收斂,而α=0.01時(shí),大約需要300個(gè)Episodes才可以收斂,可見,在一定范圍內(nèi),收斂速度會(huì)隨著學(xué)習(xí)率的增高而加快.但并非學(xué)習(xí)率越高越好,如圖 3 中,當(dāng)α=0.5時(shí),雖然收斂速度與α=0.1相當(dāng),但是收斂值明顯更低,這是因?yàn)橄萑肓司植渴諗?因此,最佳的學(xué)習(xí)率為α=0.1.

        圖 3 不同學(xué)習(xí)率收斂圖

        從圖 4 可以看到,經(jīng)典的Policy Gradient算法在400個(gè)Episodes左右可以達(dá)到收斂,收斂值大約比DQN算法低100,這是因?yàn)镈QN中采用了ε-greedy策略,從而使探索更充分,避免陷入局部最優(yōu).因此,本文所提出的算法在回報(bào)值和學(xué)習(xí)速度方面都優(yōu)于Policy Gradient算法,并且遠(yuǎn)勝過隨機(jī)選動(dòng)作的情況,可以說明本文算法的有效性.

        圖 4 本文算法與其他算法的性能比較

        圖5為竊聽者密度與平均回報(bào)之間的關(guān)系圖,將UAV和MBS固定在半徑為100 m的區(qū)域中隨機(jī)撒點(diǎn),變化Eves的密度和范圍.可以看到,當(dāng)覆蓋半徑一定時(shí),隨著竊聽數(shù)量的減少,平均回報(bào)值會(huì)增大.當(dāng)竊聽數(shù)量固定時(shí),隨著覆蓋半徑的擴(kuò)展,平均回報(bào)值逐漸增大.可見,區(qū)域面積竊聽密度越小,平均回報(bào)值越高.

        圖 5 竊聽密度與平均回報(bào)關(guān)系圖

        4 結(jié) 論

        本文考慮了無人機(jī)系統(tǒng)中的物理層安全傳輸,主要研究了通過控制無人機(jī)發(fā)射有用信號(hào)的功率和MBS發(fā)射人工噪聲的功率,在保證無人機(jī)信息安全傳輸?shù)耐瑫r(shí),最大化其能量效率.考慮到實(shí)際無人機(jī)網(wǎng)絡(luò)環(huán)境動(dòng)作和狀態(tài)空間具有多維連續(xù)的特征,將上述優(yōu)化問題建模為MDP,并采用DQN算法來求解最優(yōu)功率控制策略.

        猜你喜歡
        最大化信道信息安全
        勉縣:力求黨建“引領(lǐng)力”的最大化
        Advantages and Disadvantages of Studying Abroad
        劉佳炎:回國(guó)創(chuàng)業(yè)讓人生價(jià)值最大化
        保護(hù)信息安全要滴水不漏
        高校信息安全防護(hù)
        保護(hù)個(gè)人信息安全刻不容緩
        基于導(dǎo)頻的OFDM信道估計(jì)技術(shù)
        一種改進(jìn)的基于DFT-MMSE的信道估計(jì)方法
        戴夫:我更愿意把公益性做到最大化
        基于MED信道選擇和虛擬嵌入塊的YASS改進(jìn)算法
        偷拍自拍一区二区三区| 中文字幕在线播放| 国产亚洲精品aaaa片app| 欧美一级视频在线| 久久人妻少妇嫩草av蜜桃| 色欲欲www成人网站| 少妇脱了内裤让我添| 精品国产品欧美日产在线| 激情内射亚洲一区二区三区爱妻| 99色网站| 亚洲天堂av另类在线播放| 亚洲精品中文字幕视频色| 真实国产老熟女无套中出| 7777奇米四色成人眼影| 国产精品久久久久…| 久久久精品人妻一区二区三区免费 | 国产香蕉国产精品偷在线| 91av在线播放| 免费的黄网站精品久久| 色综合久久中文综合网亚洲| 国产一区二区波多野结衣 | 久久精品这里只有精品| 国产内射视频免费观看| 性感美女脱内裤无遮挡| 久久久久久久极品内射| 欧韩视频一区二区无码| 亚洲精品二区三区在线观看| 美利坚合众国亚洲视频 | 国产三级精品三级在线观看| 国产精品九九九久久九九| 熟女系列丰满熟妇av| 成人自拍一二在线观看| 亚洲人成色7777在线观看不卡| 久久国产精品国产精品日韩区| 国产美女被遭强高潮露开双腿| 日韩精品一区二区在线视 | 久久精品国产亚洲AⅤ无码| 亚洲日本精品一区二区三区| 婷婷五月六月激情综合色中文字幕| 无码人妻av免费一区二区三区| 國产AV天堂|