崔方宇,蔡云龍,趙民建
(浙江大學信息與電子工程學院,浙江 杭州 310027)
由于無人機的靈活、可移動和低成本的特性,無人機通信系統(tǒng)得到廣泛關(guān)注[1]。無人機在通信系統(tǒng)中可作為基站來服務(wù)地面用戶。起初,研究者們將無人機用作可靈活部署的準靜態(tài)基站或中繼,通過優(yōu)化其高度和位置,以有限的無人機覆蓋最多的用戶[2]。而移動無人機網(wǎng)絡(luò)則是利用無人機的可移動性,將其視為移動的基站。這樣一來,無人機的移動軌跡也可被當作一個新的維度來優(yōu)化系統(tǒng)性能[3]。為了進一步提高無人機通信系統(tǒng)的傳輸速率,研究者們開始嘗試將非正交多址接入技術(shù)(Non-Orthogonal Multiple Access, NOMA)應(yīng)用于其中[4-7]。然而,這方面的研究仍以靜態(tài)或固定軌跡的無人機通信系統(tǒng)為主[6-7]。主要原因在于,在NOMA中串行干擾消除(Successive Interference Cancellation, SIC)檢測順序是由信道增益大小決定的[4-5],而在移動無人機網(wǎng)絡(luò)中,信道增益隨著無人機的移動而改變。這樣一來,無人機軌跡會和信號檢測順序相耦合,使得優(yōu)化問題更加復(fù)雜。針對這個問題,本文首先建模并描述基于NOMA的移動無人機系統(tǒng)的軌跡與功率聯(lián)合優(yōu)化問題,即在無人機的起點與終點、飛行時間、飛行速度和發(fā)送功率等約束的情況下,通過對無人機的飛行軌跡與功率分配進行聯(lián)合優(yōu)化,最大化用戶的最小可達平均速率。為了求解這個非凸的問題,本文將其等價轉(zhuǎn)化為一個符合懲罰對偶分解(Penalty Dual Decomposition, PDD)算法框架[8]的形式,然后提出一種基于PDD的雙層迭代算法,以求得優(yōu)化問題的一個穩(wěn)態(tài)解。
圖1 基于NOMA的移動無人機通信系統(tǒng)
假設(shè)下行移動無人機通信網(wǎng)絡(luò)如圖1所示,用1個無人機作為空中基站服務(wù)K個地面用戶。該無人機花費時間T從起始位置q0飛行到終點位置qT,且其與地面的距離固定為dh。由于無人機在飛行一段時間后需要到固定站點進行充能補給,因此,假設(shè)無人機的起始位置與終點位置是固定的。無人機的最大飛行速度為Vmax。所有的用戶利用同樣的頻帶進行信號傳輸,無人機利用NOMA技術(shù)對這些用戶進行功率域上的復(fù)用。接收端使用SIC技術(shù)進行多用戶信號檢測,且SIC隨信道增益升序進行。
將用戶k的水平坐標表示為wk∈R2,k∈K{1,…,K},移動無人機基站的時變的水平坐標表示為q(t)∈R2,0≤t≤T。為了使問題更容易處理,將飛行時間T離散成N個時隙,則無人機的飛行軌跡坐標可表示為q(n)∈R2,n∈N{1,…,N}。此外,軌跡坐標點還需要滿足由最大飛行速度、起始位置和終點位置決定的約束條件:
(1)
q(1)=q0,q(N)=qT
(2)
式中,δt表示時隙長度。時隙長度δt需要足夠小,使得在每個時隙中無人機的位置近似不變。另一方面,為了避免復(fù)雜度大幅提升,δt也不能過小。在時隙n中,無人機與用戶k的距離表示為:
(3)
由于空中沒有障礙物,故假設(shè)無人機與用戶間的鏈路以視距傳輸為主。這樣一來,信道增益遵循自由空間模型,僅由無人機與用戶間的距離決定。假設(shè)路徑損耗的指數(shù)因子為2,則在時隙n中,用戶k的信道增益表示為:
(4)
式中,ρ0表示在1 m的參考距離下信道的功率增益。
在進行多用戶信號檢測時,SIC是隨信道增益升序進行的。信道增益高(距離無人機近)的用戶信號會干擾信道增益低(距離無人機遠)的用戶信號。因此,引入二進制輔助變量βk,l(n)∈{0,1}來表示用戶k和l的相對遠近。若用戶k與無人機的距離相較于用戶l更遠,則βk,l(n)=1,否則βk,l(n)=0。然后,用戶k在時隙n的信干噪比(Signal-to-Interference-plus-Noise power ratio, SINR)表示為:
(5)
式中,Pk(n)表示在時隙n中分配給用戶k的下行發(fā)送功率,并且需要滿足以下約束:
(6)
本文設(shè)計的目標是通過聯(lián)合優(yōu)化無人機飛行軌跡{q(n)}與功率分配{Pk(n)},來最大化所有用戶中的最小可達平均速率。這個優(yōu)化問題可以描述為:
(7)
(8)
βk,l(n)+βl,k(n)=1,?n,k,l
(9)
式(1),(2),(6)
(10)
(11)
(12)
則原問題(7)可以轉(zhuǎn)化為
(13)
(14)
(15)
γk(n)≥θk(n),?n,k
(16)
式(1),(2),(6),(8),(9)
(17)
πk(n)θk(n)≤ρ0Pk(n),?n,k
(18)
(19)
(20)
(21)
(22)
(23)
綜合以上轉(zhuǎn)化,把復(fù)雜的原問題(7)等價轉(zhuǎn)化為
(24)
s.t. 式(1),(2),(6),(9),(14),(15),(18)—(23)
(25)
2.2.1 增廣拉格朗日問題
在PDD算法框架中,等式約束作為增廣拉格朗日項添加到目標函數(shù)中,得到對應(yīng)的增廣拉格朗日問題,然后再進行求解。問題(24)的增廣拉格朗日問題表示如下:
(26)
s.t. 式(1),(2),(6),(14),(15),(18),(19),(22),(23)
(27)
0≤βk,l(n)≤1,?n,k,l
(28)
其中約束(28)的引入可以加快收斂速度且不影響問題的最優(yōu)解。
2.2.2 非凸約束的近似
由于約束(18)、(19)和(23)非凸,問題(26)難以直接求解。然而,根據(jù)凹凸過程(Concave-convex Procedure, CCCP)理論[9],在每一次內(nèi)循環(huán),可以利用一階泰勒展開對這些非凸約束進行近似。以約束(18)為例,首先將其改寫為如下凸減凸的形式:
(29)
利用一階泰勒展開對減去的凸函數(shù)進行線性化,得到如下凸約束:
(30)
(31)
采用同樣的步驟,將非凸約束(19)和(23)分別近似為以下凸約束:
(32)
(33)
(34)
綜上,在第i+1次內(nèi)層迭代,問題(26)可以近似為
(35)
s.t. 式(1),(2),(6),(14),(15),(28),(31)—(34)
(36)
2.2.3 內(nèi)循環(huán)算法
(37)
(38)
s.t. 式(1),(2),(6),(14),(15),(28),(31)—(34)
(39)
綜上,內(nèi)循環(huán)算法即迭代執(zhí)行步驟1和步驟2,直到目標函數(shù)值在相繼的兩次迭代中的差值小于內(nèi)循環(huán)容錯精度δ,或者迭代次數(shù)達到最大值Nmax。
2.2.4 整體算法
算法1 對問題(24)的基于PDD的優(yōu)化算法 (1)以一個可行解對算法進行初始化。設(shè)迭代次數(shù)r=0。并且設(shè)c<1和0>0。 (2)Repeat (3) 迭代執(zhí)行步驟1和步驟2,直到目標函數(shù)值在相繼的兩次迭代中的差值小于內(nèi)循環(huán)容錯精度δ,或者迭代次數(shù)達到最大值Nmax (4) Ifgr(Z)∞≤ηrthen (5) λr+1=λr+1rgr(Z), r+1=r (6) Else (7) λr+1=λr,r+1=cr (8) End if (9) 更新迭代次數(shù):r=r+1 (10)Until gr(Z)∞≤δO
圖2 基于PDD的算法收斂性
圖2展現(xiàn)了本文算法的收斂性。從圖2可以看出:最大化的最小可達平均速率隨著外循環(huán)迭代次數(shù)的增加而增加,且可以在10次迭代以內(nèi)收斂。此外,等式約束的違反程度可以在25次迭代以內(nèi)下降到10-6以下,證明了所提的基于PDD的算法可以有效地處理優(yōu)化問題中的復(fù)雜約束。
圖3展現(xiàn)了優(yōu)化后的無人機的飛行軌跡。從圖3中可以看出:當飛行時間足夠長,即T=50 s時,無人機相繼飛過每一用戶以實現(xiàn)公平性;而當飛行時間比較短,即T=25 s時,無人機難以飛到距離較遠的用戶處,則通過為遠處用戶分配更多的發(fā)送功率來實現(xiàn)公平性。這樣一來,無人機會在近處用戶處停留一段時間。采用NOMA后,無人機既可以通過優(yōu)化自身位置,也可以通過優(yōu)化功率分配來提高遠處用戶的傳輸速率,資源分配更加靈活。
圖4比較了不同方案下最大化的最小可達平均速率與飛行時間T的關(guān)系,包括以下方案進行比較。
?聯(lián)合優(yōu)化:本文提出的聯(lián)合優(yōu)化無人機軌跡與功率分配的算法。
?無軌跡優(yōu)化:無人機以直線軌跡勻速飛行,僅優(yōu)化功率分配。
?基于正交多址接入技術(shù)(Orthogonal Multiple Access, OMA)的聯(lián)合優(yōu)化:使用基于OMA的多址接入方式,聯(lián)合優(yōu)化無人機軌跡與用戶調(diào)度。
從圖4中可以看出:本文提出的聯(lián)合優(yōu)化算法性能強于僅對功率分配進行優(yōu)化的方案。而且,隨著飛行時間T的增長,軌跡優(yōu)化方案相較于固定直線軌跡方案的性能優(yōu)勢更加明顯,并在T=70 s時增益達到0.7 bit·s-1·Hz-1。此外,本文提出的基于NOMA的聯(lián)合優(yōu)化方案性能優(yōu)于基于傳統(tǒng)OMA的聯(lián)合優(yōu)化方案,尤其是在飛行時間T比較短的時候,增益可以超過0.1 bit·s-1·Hz-1。其原因在于,當無人機沒有足夠時間飛到遠距離用戶處時,NOMA能夠通過功率分配來增加遠處用戶的傳輸速率,從而達到比傳統(tǒng)OMA更好的性能。
圖3 優(yōu)化后的無人機飛行軌跡
圖4 不同方案下的系統(tǒng)傳輸速率
本文研究了基于NOMA的移動無人機系統(tǒng)的優(yōu)化設(shè)計。在NOMA中,接收端串行干擾消除檢測的順序由信道增益大小決定,而在移動無人機系統(tǒng)中,用戶的信道增益隨著無人機基站的位置而變化,因此,將NOMA技術(shù)應(yīng)用于移動無人機系統(tǒng)后,軌跡優(yōu)化與功率分配優(yōu)化互相耦合,使得優(yōu)化設(shè)計十分復(fù)雜。本文提出一種基于PDD的優(yōu)化算法,通過聯(lián)合優(yōu)化無人機軌跡與功率分配來最大化用戶的最小可達平均速率,更靈活地進行資源分配,獲得了比其他基準算法更好的性能。本文旨在研究NOMA技術(shù)與移動無人機系統(tǒng)的結(jié)合,只研究比較簡單的單無人機系統(tǒng)。下一步將研究多無人機系統(tǒng)以提高系統(tǒng)的覆蓋能力。