亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于MDP的Massive MIMO物理層安全算法

        2018-11-30 01:47:00侯夢茹張昕然王慶瑞
        計算機應用與軟件 2018年11期
        關鍵詞:物理層信道加密

        蔣 華 侯夢茹 張昕然 王慶瑞

        1(北京電子科技學院通信工程系 北京 100070)2(西安電子科技大學通信工程學院 陜西 西安 710071)

        0 引 言

        隨著智能終端的普及,人們越來越依賴無線網(wǎng)絡進行重要信息的傳輸。與通過密碼技術保護數(shù)據(jù)安全的傳統(tǒng)方法相比,通信系統(tǒng)的物理層安全通過利用通信介質(zhì)的缺陷來提供安全的無線傳輸,不僅不依賴于計算復雜性,同時具有很高的可擴展性,為信息的保密傳輸提供了巨大優(yōu)勢[1-2]。作為最常用的物理層安全技術,MIMO技術可以在一個或多個非法用戶存在的情況下支持高速率的安全通信[3]。近年提出的大規(guī)模多天線陣列MIMO技術可以在不增加帶寬或提高發(fā)射功率的情況下顯著提高數(shù)據(jù)吞吐量和鏈路可靠性,因此成為5G移動通信系統(tǒng)的關鍵技術之一[4-5]。

        在Massive MIMO系統(tǒng)中,在發(fā)射機上使用非常大的天線陣列(通常為數(shù)十甚至數(shù)百個)接收器,數(shù)百個天線同時服務于數(shù)十個用戶。理論和測量結果表明,大規(guī)模MIMO技術可以通過利用低復雜度傳輸設計提供的大陣列增益來提供高功率和能源效率。此外,當大量天線部署在基站時,可以降低隨機損傷(如小規(guī)模衰落和噪聲)的干擾[6-7]。由于MIMO技術只能輻射天線陣固定下傾角水平方向的波束,為了更好地利用信號傳播的垂直角度分辨率,將MIMO的輻射信號控制在3D空間中,采用矩形、球形或圓柱形的天線陣列配置,被稱為3D MIMO技術。第三代合作伙伴計劃(3GPP)指出,具有大量天線的3D MIMO可被看作是Massive MIMO的實際形式之一[5]。

        對于通信系統(tǒng)而言,信道容量上限代表了用戶可達的最大速率。文獻[8]提出了竊聽信道三端口網(wǎng)絡的加密容量的概念。竊聽者通過其自己的通道收聽傳輸信號不能解碼消息的情況下,能夠以嚴格正確的速率可靠地進行通信。即在加密容量存在的情況下,一定存在一種編碼方式使得非法用戶的信道容量為零。同時研究表明,隨著天線陣列規(guī)模的增加,信道容量將和天線數(shù)呈線性增長的關系。因此對MIMO信道的物理層保密問題引起了研究學者的廣泛興趣[9]。

        馬爾可夫決策過程(MDP)模型是在不確定情況下進行順序決策、考慮當前決策的結果和未來的決策機會的數(shù)學方法[10]。在近幾年關于Massive MIMO技術的文獻中,經(jīng)常使用MDP模型作為優(yōu)化工具,在多小區(qū)Massive MIMO系統(tǒng)中實現(xiàn)全局最優(yōu)。例如使用MDP模型處理Massive MIMO通信系統(tǒng)的資源分配問題[11]。在文獻[12]中,采用SMDP(semi-Markov decision process)方法,提出了一種資源分配方案,以實現(xiàn)OFDMA(orthogonal frequency division multiple Access)多小區(qū)協(xié)作網(wǎng)絡中保證通信質(zhì)量業(yè)務的最優(yōu)功率效率。Massive MIMO系統(tǒng)中的功率和速率分配問題在文獻[13]中被建模為CMDP(constrained Markov decision process),其優(yōu)化目標是受延遲約束的最小化發(fā)射功率。下行鏈路OFDMA系統(tǒng)的功率和子載波分配問題在文獻[14]中被建模為CMDP,優(yōu)化目標是在平均延遲約束下的最大化能量效率。當模型參數(shù)不可知時,強化學習算法被經(jīng)常用來求解MDP模型。它是從控制理論、統(tǒng)計學、心理學等相關學科發(fā)展而來,具有自學習和在線學習的優(yōu)點[15]。MDP模型的最優(yōu)策略可以用值迭代和動態(tài)規(guī)劃算法確定。值迭代算法的優(yōu)勢在于其在實現(xiàn)上的簡易性,可以用來進一步研究分析得到的最優(yōu)策略的結構。

        本文從物理層角度提出了基于MDP模型的Massive MIMO系統(tǒng)安全傳輸技術。利用互阻抗模型建立了Massive MIMO系統(tǒng)下行鏈路的信道模型。建立了基于平均無折扣回報的MDP模型,利用有限狀態(tài)馬氏信道FSMC的區(qū)間轉移概率模型[16],給出了MDP的轉移概率表達式,并提出了基于值迭代的動態(tài)規(guī)劃算法,計算了全局最優(yōu)的系統(tǒng)加密容量。通過仿真對算法性能進行了驗證,給出了仿真結果,并對結果進行了分析。仿真結果給出了基站發(fā)射信號功率對信道物理層加密容量的影響并評估了算法的性能。

        1 系統(tǒng)模型

        如圖1所示,系統(tǒng)模型是多小區(qū)Massive MIMO系統(tǒng)的下行鏈路模型,此小區(qū)包括K個移動用戶,每個小區(qū)的基站裝載NT根天線,每個用戶有NR根接收天線??紤]小區(qū)中使用相同時頻資源的一個合法用戶和一個竊聽用戶,則系統(tǒng)的物理場景簡化模型如圖2所示。

        圖1 多小區(qū)Massive MIMO系統(tǒng)模型

        圖2 系統(tǒng)下行鏈路簡化模型

        系統(tǒng)模型為:

        yk,t=Htx+nt

        (1)

        yk,e=Hex+ne

        (2)

        式中:x∈NT×1表示基站端的發(fā)射信號,yk,t∈NR×1和yk,e∈NR×1分別表示第k個小區(qū)的合法用戶和非法用戶接收到的信號和為服從獨立高斯分布,具有零均值和單位方差的加性高斯白噪聲。H={hk}為信道傳輸矩陣。在Massive MIMO信道場景下,應使用互阻抗模型對信道進行建模[5]。因此,第k個小區(qū)的傳輸信道為:

        (3)

        式中:hk∈NR×NT。

        (4)

        gk=[ZRkvk]T

        (5)

        ZP=(AZ+LZ)(Ψ+LZI)-1

        (6)

        (7)

        式中:AZ、LZ、MZ分別表示天線的阻抗、負載阻抗和互耦阻抗。矩陣γk∈NT×NR,滿足:

        (8)

        (9)

        2 基于MDP的值迭代算法

        2.1 MDP建模

        為了模擬系統(tǒng)的物理層時變特性,建立有限狀態(tài)馬爾科夫信道(FSMC)模型來描述信道的時變行為。把下行鏈路增益量化為許多區(qū)間,第j個區(qū)間φj對應一個鏈路增益范圍:φj={φ:χj≤φ≤χj+1},χj為區(qū)間邊界,信道被量化為FSMC模型。為上述Massive MIMO系統(tǒng)建立馬爾科夫決策過程(MDP)模型,模型的組成部分包括,各項分別代表狀態(tài)、動作、狀態(tài)轉移函數(shù)、回報函數(shù),各項表述為:

        (2) 動作a:動作用來控制系統(tǒng)的狀態(tài)。at表示t時刻下MDP模型的動作,它代表基站的發(fā)射功率。馬爾科夫決策過程在t時刻所有可行的行為構成一個行為集,即行為空間At,At={a1,a2,…,aNT}。

        (3) 狀態(tài)轉移函數(shù)p:在離散的時刻t,對狀態(tài)st采取動作at,狀態(tài)轉移至下一狀態(tài)st+1,其轉移通過狀態(tài)轉移函數(shù)得到。文獻[16]指出,假定在時間間隔T內(nèi)φ值保持在同一個區(qū)間內(nèi),在這個時間間隔結束時,可能繼續(xù)停留在本區(qū)間內(nèi)或者轉移到相鄰的鏈路增益區(qū)間。定義狀態(tài)增量函數(shù)δ(·)用來表示相鄰狀態(tài)的變化量,則區(qū)間之間的轉移概率為:

        (10)

        式中:Lj是χj處的電平通過率,即單位時間內(nèi)信號包絡向下穿過電平χj的平均次數(shù),滿足:

        (11)

        式中:fm是多普勒頻率;ρ為基站發(fā)送端信噪比的期望。

        ρ=E{SNRt}

        (12)

        (13)

        式中:Rt代表單位時間內(nèi)信號傳輸速率;κj代表當前狀態(tài)下的穩(wěn)態(tài)概率,滿足:

        (14)

        (4) 回報函數(shù)c:在與環(huán)境的交互過程中,在離散的時隙t,對狀態(tài)st采取動作at,狀態(tài)轉移至下一狀態(tài)st+1,產(chǎn)生回報。在此Massive MIMO系統(tǒng)中,以系統(tǒng)物理層的加密容量作為MDP模型的回報函數(shù)。由于Massive MIMO的物理層安全優(yōu)勢,可獲得加密容量的表達式,從而無需使用任何正式的加密系統(tǒng),該速率就可以可靠而安全地傳輸[17]。因此,三端口網(wǎng)絡竊聽系統(tǒng)中的加密容量為:

        (15)

        式中:Rxx=E{xxH},是發(fā)送信號的自相關矩陣。

        (5) 策略π:給定一個MDP模型,馬爾科夫策略就是在某一狀態(tài)下,決策者所采取的動作或者所采取的動作的概率。而在有限MDP中,一定至少存在一個策略π,使得任意狀態(tài)st∈S下,值函數(shù)Jπ(st)≥Jπ′(st),被稱為最優(yōu)策略π*。簡單來說,解決一項強化學習任務的本質(zhì)是尋找到最優(yōu)策略。

        2.2 基于值迭代的動態(tài)規(guī)劃算法

        強化學習算法是以評估價值函數(shù)為基礎,通過價值函數(shù)將MDP的最優(yōu)標準與策略聯(lián)系起來。動態(tài)規(guī)劃算法是在已知MDP模型的基礎上,首先計算狀態(tài)值函數(shù),然后利用模型,計算出該狀態(tài)下的最優(yōu)動作,尋找出最優(yōu)化策略。為了計算系統(tǒng)最大化加密容量,采用值迭法算法,從初始狀態(tài)價值開始反復迭代計算,最終收斂至全局最優(yōu)價值函數(shù)J*,從而達到系統(tǒng)模型的最優(yōu)結果。

        (16)

        根據(jù)貝爾曼方程,滿足值迭代算法,最優(yōu)值函數(shù)滿足的迭代形式如下:

        (17)

        式中:l為迭代步數(shù)。對于每個狀態(tài)s,迭代地更新每一個狀態(tài)動作對應的值,得到下一值函數(shù)Jl+1(s,a)。直到Jl+1(s,a)達到最優(yōu),滿足:

        (18)

        具體算法見算法1。

        算法1基于MDP模型的物理層安全算法

        步驟1 輸入轉移概率P(s′|s,a)和獎賞函數(shù)R(s,a)

        步驟2 初始化參數(shù):令J0(s,a)=0,temp=Jl(s,a)

        步驟3 for 每個迭代步l={0,1,2,…}

        do

        Jl(s,a)←Jl+1(s,a)

        until

        |Jl(s,a)-temp|<ε,ε為足夠小量

        3 仿真與分析

        圖3描述了基站發(fā)射信號對信道容量的影響,可以看出,隨著發(fā)射端信噪比的增大,加密容量會增大。當最大發(fā)送信噪比大于某個門限信噪比時,策略的性能增長趨勢減緩并趨于恒定,因此當發(fā)射功率較大時,即使再增加發(fā)射功率,也不能進一步提高系統(tǒng)加密容量。同時,竊聽用戶和信道噪聲功率會影響加密容量,竊聽用戶接收信噪比增大,加密容量會減?。恍诺涝肼暪β试龃?,加密容量減小。因此通信環(huán)境需要警惕干擾信號,需要盡量減小干擾信號對加密容量的削弱作用,比如非法竊聽用戶的接收信號和信道噪聲功率的負面影響,從而保證高質(zhì)量的通信。

        由圖4可以看出,隨著竊聽非法用戶接收端信噪比增大,加密容量會下降。非法用戶小規(guī)模的竊聽對加密容量的影響不大,當竊聽用戶竊聽信號過大時,信道性能急劇惡化,因此通信傳輸過程中,減少非法用戶的竊聽是保證通信質(zhì)量的基礎。同時,圖4體現(xiàn)出信道本身的衰減對加密容量也有影響。同等前提條件下,合法用戶信道噪聲功率的增加會削弱加密容量。

        圖4 竊聽用戶接收端信噪比對信道容量的影響

        表1是MDP模型的策略表,是一個輸出動作標號的序列。它描述了算法在不同狀態(tài)下尋找到的最優(yōu)策略,即基站在每一狀態(tài)下選擇的行為以確保模型中的加密容量最大。具體來說,就是在此算法下,基站可以根據(jù)不同的信道增益狀態(tài)選擇發(fā)射功率,使系統(tǒng)模型獲得最大的加密容量。

        表1 策略π

        4 結 語

        本文基于MDP模型研究了Massive MIMO系統(tǒng)的物理層安全算法。通過對Massive MIMO下行鏈路模型進行MDP建模,利用值迭代算法求解MDP模型,計算出系統(tǒng)最大化加密容量。根據(jù)算法模型,基站可以在不同信道增益下控制發(fā)射功率,求解出保證物理層加密容量的全局最優(yōu)策略。分析結果說明了基站發(fā)射信號功率對三端口網(wǎng)絡信道物理層加密容量的影響,即系統(tǒng)的加密容量會隨著基站發(fā)射功率的增大而增大,隨著非法竊聽用戶的接收信噪比的增大而減小,證明了算法的正確性和有效性。進一步說明強化學習的相關算法可以解決通信系統(tǒng)中相關的控制問題,為今后的研究奠定了理論和應用基礎。

        猜你喜歡
        物理層信道加密
        基于K-ML-MPWFRFT的物理層安全傳輸技術
        公路聯(lián)網(wǎng)電子不停車收費系統(tǒng)路側單元物理層自動測試軟件研發(fā)
        一種基于熵的混沌加密小波變換水印算法
        認證加密的研究進展
        多天線物理層安全傳輸系統(tǒng)性能分析
        基于導頻的OFDM信道估計技術
        一種改進的基于DFT-MMSE的信道估計方法
        基于ECC加密的電子商務系統(tǒng)
        基于MED信道選擇和虛擬嵌入塊的YASS改進算法
        基于格的公鑰加密與證書基加密
        久久99精品久久久久久琪琪| 无码无在线观看| 最全精品自拍视频在线| 亚洲精品粉嫩美女一区| 97精品超碰一区二区三区| 亚洲av无码一区二区二三区下载| 亚洲中文字幕不卡无码| 精品嫩模福利一区二区蜜臀| 成在线人av免费无码高潮喷水| 国产精品无码不卡一区二区三区| www.日本一区| 亚洲第一大av在线综合| 精品无码一区二区三区爱欲| 国产久热精品无码激情| 偷拍网日本一区二区三区| 国产av一区二区三区天美| 国产成人亚洲综合| 久久久久亚洲av无码专区| caoporon国产超碰公开| 亚洲一区二区三区重口另类 | 亚洲一区二区不卡日韩| 亚洲天堂二区三区三州| 九一九色国产| 亚洲AV无码未成人网站久久精品 | 24小时免费在线观看av| 午夜福利一区二区三区在线观看| 精品人无码一区二区三区 | 亚洲av色福利天堂| 青青草免费高清视频在线观看 | 国产一女三男3p免费视频| 亚洲公开免费在线视频| 一级内射免费观看视频| 国产亚洲精品久久久闺蜜| 中文幕无线码中文字蜜桃| 日本红怡院东京热加勒比| 一个人看的视频在线观看| 亚洲男人的天堂网站| 91青青草久久| 中文字幕精品一区二区的区别| 夜夜添夜夜添夜夜摸夜夜摸 | 怡红院免费的全部视频|