張小沛,趙梓曉,杜清河
(西安交通大學(xué),西安 710049)
傳統(tǒng)意義上的無線通信主要是利用地面上的固定基站等設(shè)施,但為了滿足日益增長的多樣化的通信需求,可利用無人機作為空中通信平臺,從空中為地面終端提供無線通信服務(wù)。因為空中視野開闊,遮蔽物少,所以無人機可以提供視距鏈路,從而提供良好的服務(wù)質(zhì)量。目前,有大量的研究工作致力于優(yōu)化無人機在二維或三維空間的布局[1-4]。同時,隨著信息技術(shù)領(lǐng)域的日益普及,無人機已經(jīng)可以為無線用戶提供無縫的互聯(lián)網(wǎng)連接服務(wù)。無人機的自由移動特性可以讓無人機能根據(jù)服務(wù)的地面終端位置及其通信要求動態(tài)調(diào)整空中位置。因此,無人機能夠在缺乏地面基礎(chǔ)設(shè)施的地區(qū)或過載條件下,為地面用戶提供地面—空中通信服務(wù)。例如,在文獻[5]中,優(yōu)化無人機的部署位置可以改善無線網(wǎng)絡(luò)的連接質(zhì)量。在文獻[6]中,用無人機作為通信中繼,幫助無人水下航行器與地面設(shè)備進行通信連接。在文獻[7]中,研究了無人系統(tǒng)在多障礙環(huán)境中的路徑規(guī)劃。
當(dāng)前,網(wǎng)絡(luò)中數(shù)據(jù)流優(yōu)化的解決方案包括帶寬管理、編碼壓縮、路由選擇等,但這些解決方案不能很好地適應(yīng)數(shù)據(jù)的爆炸式增長。影響網(wǎng)絡(luò)吞吐量和傳輸時延的關(guān)鍵因素之一是內(nèi)容提供商與終端用戶之間的距離。因此,通過在靠近用戶的邊緣服務(wù)器上緩存流行內(nèi)容可有效減少內(nèi)容與終端用戶的距離。在這種情況下,緩存是提高網(wǎng)絡(luò)傳輸效率的一種有效技術(shù)。在機器學(xué)習(xí)的基礎(chǔ)上,大量文獻提出了各種基于機器學(xué)習(xí)的緩存策略。文獻[8]將緩存替換問題建模成一種經(jīng)典的多臂老虎機問題,利用強化學(xué)習(xí)來解決緩存問題。文獻[9]提出了一種基于遷移學(xué)習(xí)的緩存策略。該策略所用的機器學(xué)習(xí)模式與傳統(tǒng)的機器學(xué)習(xí)模式不同,傳統(tǒng)的機器學(xué)習(xí)模式訓(xùn)練完畢后,如果再添加新的訓(xùn)練數(shù)據(jù),機器學(xué)習(xí)將重新從零開始訓(xùn)練。
在移動邊緣計算網(wǎng)絡(luò)中,無人機搭載緩存服務(wù)器可視為移動的邊緣節(jié)點,其可以按照一定順序接近每個地面終端。在這種場景中,無人機不僅需要盡可能地縮短與每個地面終端的視距距離,以獲得更高效的傳輸速率和通信質(zhì)量,而且還需要使無人機盡可能快速地滿足所有地面終端的通信需求。然而,先前的工作主要集中在無人機導(dǎo)航應(yīng)用上,以確保其在已預(yù)先確定的初始位置和最終位置之間能安全飛行,如研究如何避免與其他無人機或地形障礙物發(fā)生碰撞[10]。對于無人機搭載緩存服務(wù)器的場景,無人機的軌跡決定了系統(tǒng)性能。近年來,已有部分文獻研究了如何通過設(shè)計無人機的飛行軌跡來優(yōu)化系統(tǒng)通信性能。例如,文獻[11]研究了無人機在物聯(lián)網(wǎng)中的應(yīng)用,即利用無人機進行數(shù)據(jù)采集和機器通信時,無人機通過依次靠近每個地面終端的方式來縮短通信與移動調(diào)度距離,以實現(xiàn)更高效的數(shù)據(jù)采集。文獻[12]研究了無人機作為移動中繼的場景,當(dāng)其為不同用戶傳輸數(shù)據(jù)時,需在數(shù)據(jù)量和下載延遲之間進行權(quán)衡,為此可通過遺傳算法優(yōu)化無人機軌跡。在文獻[13]中,提出了一種使無人機通信的能效最大化的軌跡優(yōu)化方案。在文獻[14]中,針對無人機移動中繼系統(tǒng),為了最大化吞吐量,提出了一個功率/速率分配和無人機軌跡(包括飛行方向和速度)的聯(lián)合優(yōu)化方案。針對優(yōu)化無人機的飛行時間和飛行總長,文獻[15]為了最大限度地提高了無人機的能量效率,利用線性規(guī)劃和凸優(yōu)化來優(yōu)化無人機的飛行軌跡。但該算法僅考慮了無人機和地面終端的吞吐量,未考慮無人機與地面終端的實時通信質(zhì)量。文獻[16]研究了一種基于無人機多播系統(tǒng)的飛行軌跡設(shè)計問題,其優(yōu)化目標是在確保每個地面終端能成功接收到內(nèi)容的基礎(chǔ)上保證無人機完成任務(wù)的時間最小。該方案將復(fù)雜的軌跡約束條件簡化為每個地面終端的最小連接時間約束,利用凸優(yōu)化方法,提出了一種有效路徑點的設(shè)計方案。該文獻中的無人機軌跡僅由直線段,其中包含了大量的急轉(zhuǎn)彎。在實際應(yīng)用中,由于慣性等物理因素,無人機較難實現(xiàn)這種軌跡。文獻[17]針對多任務(wù)場景中的多子群任務(wù)分配和路徑規(guī)劃問題,將任務(wù)分配和路徑規(guī)劃聯(lián)合優(yōu)化,提出了改進的蟻群優(yōu)化算法。
在本文中,我們利用半監(jiān)督學(xué)習(xí)的思想,提出了一種緩存需求驅(qū)動的無人機軌跡優(yōu)化方案。該方案解決了單無人機和多個地面終端通信時的飛行軌跡設(shè)計問題,優(yōu)化了無人機飛行軌跡總長和飛行時間。無人機從部署服務(wù)器的位置出發(fā),依次經(jīng)過各地面終端并完成通信任務(wù),然后返回至初始位置。其中,當(dāng)無人機起飛時,根據(jù)已確定的與地面各結(jié)點的通信順序,依次朝各地面終端位置飛去;當(dāng)無人機進入地面終端的通信范圍時,無人機初始化地面終端的信息,同時地面終端向無人機發(fā)送需求信息,無人機接收到需求信息后則開始向地面終端傳輸需求內(nèi)容,其中,同一時間無人機只能與一個地面終端進行通信。無人機在與地面終端的通信過程中,利用迭代采取啟發(fā)式隨機法及半監(jiān)督模型法優(yōu)化局部飛行軌跡,當(dāng)無人機與當(dāng)前地面終端完成通信任務(wù)后,無人機飛向下一個地面終端或返回初始位置。仿真表明,該方案可以明顯降低無人機的飛行距離及飛行時間,降低周期循環(huán)時間,有效地為地面終端提供邊緣計算服務(wù)。
在一些特殊場景,地面終端與基站間的通信質(zhì)量較差,無法滿足通信需求。如圖1所示,我們考慮一個基站服務(wù)多個地面終端的場景?;咎幙膳汕泊钶d緩存服務(wù)器的無人機飛向地面終端,并向地面終端提供內(nèi)容下載緩存、數(shù)據(jù)采集緩存、雙向信息傳輸、擴展網(wǎng)絡(luò)覆蓋等通信服務(wù)。無人機與基站可通過無線或有線的方式進行數(shù)據(jù)傳輸,在無人機的緩存服務(wù)器中存儲內(nèi)容后,無人機成為一個移動邊緣節(jié)點。隨后無人機將從基站位置出發(fā),向所有地面終端提供內(nèi)容后返回基站位置,我們將整個流程定義為一個周期。在本文中,我們專注于單無人機和多個地面終端通信的場景。
圖1 系統(tǒng)模型圖Fig.1 System model
我們用K= {1,… ,k,…K}表示的K個地面終端組成的無線通信系統(tǒng),地面終端k的位置表示為wk∈R2×1,k∈K。在實踐中,地面終端的位置可以在系統(tǒng)數(shù)據(jù)庫中(例如用無線傳感器網(wǎng)絡(luò))獲得,或者由標準定位技術(shù)(例如GPS 定位)確定。無人機的飛行高度固定為H。在實踐中,為確保無人機安全飛行,H可以對應(yīng)于最合適的飛行高度(例如躲避障礙而不頻繁地使飛機上升或下降)。
因此, 無人機軌跡可用[x(t),y(t),H],0≤t≤TP表示,其中,x(t)和y(t)表示在水平面上投影的x和y的坐標,H表示無人機與地面終端的高度差。那么,無人機的投影位置可以用q(t) =[x(t),y(t)]表示,其中0≤t≤TP。為了便于問題的公式化,我們引入時隙δ(t),將周期時間離散為M個時隙δ(t),我們假設(shè)無人機的軌跡滿足以下約束:
式(1)表明無人機的起始位置和終止位置。說明在一個周期內(nèi),無人機從基站位置出發(fā)最終返回至基站位置。式(2)中,L表示無人機在一個時隙的飛行距離,即在一個時隙中,無人機的飛行距離不超過L。
在任何一個時隙內(nèi),無人機與地面終端k之間的距離d k(n) 為:
式中,wk為地面終端的位置坐標。
假設(shè)每個UAV-GT 信道遵循LoS 鏈路且其他地面終端不會對無人機和當(dāng)前通信任務(wù)的地面終端k之間的通信信道造成任何干擾。實際的UAV-GT 信道可以很好地近似于LoS 模型,同時假設(shè)由于無人機的移動性引起的多普勒頻移可以完全預(yù)補償?shù)鬧13],從地面終端k到無人機的信道功率增益符合自由空間損耗模型,其表示為
式中,β0為距離d0=1 m 處的接收功率。
每個時隙中的每個地面終端的傳輸功率P是恒定的,則時隙n時地面終端k的接收信噪比SNR 為
式中,σ2為加性高斯白噪聲功率。為d0= 1m 時接收機的信噪比(SNR)。
根據(jù)式(5),為滿足服務(wù)質(zhì)量,即γk(n)的值應(yīng)大于某個閾值,這個條件等價于無人機與地面終端k之間的水平距離不應(yīng)大于某個閾值D。
我們定義了一個二進制變量αk(n),代表地面終端的通信調(diào)度因子,表示無人機在時隙n是否與地面終端k發(fā)生數(shù)據(jù)交互。αk(n)具體表示無人機在時隙n時是否與地面終端發(fā)生數(shù)據(jù)交互,即αk(n) = 1,則表明無人機在時隙n時與地面終端發(fā)生了數(shù)據(jù)交互通信;αk(n) = 0,則表明無人機在時隙n時沒有與地面終端發(fā)生數(shù)據(jù)交互通信,所以αk(n)應(yīng)滿足
假設(shè)無人機的通信帶寬為B,無人機和地面終端k之間的瞬時信道容量可以被寫為
在整個周期,地面終端k的吞吐量為
具體的,設(shè)無人機搭載的邊緣計算服務(wù)器需要處理來自地面終端的各種數(shù)據(jù)請求,與地面終端請求的所有內(nèi)容可以用一組數(shù)據(jù)集表示:C={1,2, …,Cmax},C中的元素代表數(shù)據(jù)對象,這些數(shù)據(jù)對象的類型多種多樣。同樣在實際系統(tǒng)中,數(shù)據(jù)集C中元素可能有無限多個,但由于無人機搭載的緩存設(shè)備容量有限,無人機會對其緩存服務(wù)器中的緩存內(nèi)容進行處理,使其在每個周期內(nèi)其緩存的內(nèi)容都是該周期內(nèi)流行度最高(需求量最高)的內(nèi)容,以保證無人機的傳輸效率和緩存效率最大化。即使無人機在當(dāng)前周期無法向地面終端提供所需內(nèi)容,當(dāng)無人機返回起始地面服務(wù)器時,在下個周期的準備時間里無人機會更新緩存內(nèi)容,以保證無人機在下個周期為地面終端提供上周期未能提供的內(nèi)容。總的來說,無人機向地面終端提供內(nèi)容這一需求可以表述為
式中:為本周期內(nèi)地面終端k所需內(nèi)容的總和。
綜上所述,我們最終的目標是要優(yōu)化無人機的飛行軌跡q(n) ,使其所飛行的時長最短,進而飛行路徑最短。建立的全局軌跡優(yōu)化問題如式(10)所示。
式中:M為周期時間內(nèi)離散間隙δ(t) 數(shù)量。
尋找式(10)最優(yōu)解等價于尋找有序路徑點Q的最優(yōu)集合,其中包含表示每路徑段的起點和終點的位置。但該優(yōu)化問題是NP-hard,難以直接求解。
對于終端通信半徑D=0 時的極端情況,即無人機需要按某種順序訪問所有地面終端,并在每個地面終端的頂部保持靜止Tmin。在這種情況下,尋找到式(10)的最優(yōu)路徑點集簡化為確定所有地面終端的訪問順序,這樣就可以最小化總的無人機飛行距離,這基本上等同于TSP。
但在實際中,終端通信半徑D>0 ,所以我們尋找次優(yōu)解。為此,我們首先假設(shè)無人機與各地面終端的通信順序已知,即通信調(diào)度表已確定(或利蟻群算法確構(gòu)建通信調(diào)度表),然后將全局優(yōu)化問題轉(zhuǎn)變?yōu)榫植績?yōu)化問題。
如圖2所示,當(dāng)前周期開始時,無人機從基站處將數(shù)據(jù)存入自身緩存服務(wù)器。接著無人機從基站位置出發(fā),根據(jù)已知的通信順序飛向目標地面終端。當(dāng)進入目標地面終端的通信范圍后,無人機在與地面終端通信的同時根據(jù)算法決定每一時刻的飛行軌跡。當(dāng)完成與該地面終端的通信任務(wù)后,無人機根據(jù)通信調(diào)度表確定下一個地面終端的位置。如果無人機已經(jīng)完成所有任務(wù),則無人機返回基站更新緩存服務(wù)器的內(nèi)容,為下周期通信任務(wù)做準備。
圖2 無人機緩存通信流程圖Fig.2 Flow diagram of UAV trajectory
根據(jù)通信調(diào)度表,無人機首先飛往的地面終端及其位置我們用w1表示,以此類推,通信調(diào)度表中順序為第k個地面終端的位置為wk。也就是說,無人機從起始位置出發(fā),依次飛向{w1,w2,…,wK}并在完成所有通信任務(wù)后返回起始位置。根據(jù)通信調(diào)度表中的順序,當(dāng)無人機需要與wk進行通信時,即在進行第k個通信任務(wù)時,算法進入地面終端k的局部軌跡優(yōu)化環(huán)節(jié),并當(dāng)完成當(dāng)前局部優(yōu)化后,將局部優(yōu)化軌跡并入全局優(yōu)化軌跡中。
在第k個通信任務(wù)中,當(dāng)前需求通信的地面終端k為wk,下一個需要通信的地面終端為wk+1(未完成所有通信任務(wù)的情況下)。為了不失一般性和方便表述,將當(dāng)前需求通信的地面終端k定義為wT,其有效通信半徑為D。wS為無人機在局部軌跡中的初始位置,wE為下一個要前往的地面終端。無人機從wS出發(fā),經(jīng)過wT的通信范圍,并完成通信任務(wù)后前往下個目的地wE。
我們的局部優(yōu)化問題就是要使得無人機在完成wT通信任務(wù)的同時,使得無人機的飛行距離和飛行時間最少。因此,式(10)的優(yōu)化問題轉(zhuǎn)化為式(11)。
該問題仍屬于NP-hard。本文所述算法利用半監(jiān)督學(xué)習(xí)的思想,通過訓(xùn)練參考軌跡,逼近最優(yōu)解。當(dāng)無人機進入局部軌跡優(yōu)化區(qū)域時,無人機的計算系統(tǒng)先判斷系統(tǒng)中有無存儲的參考軌跡。若無人機計算系統(tǒng)中無參考軌跡,則通過仿真啟發(fā)式的生成參考軌跡,并判斷該軌跡是否滿足任務(wù)需求。若滿足任務(wù)需求,則記錄該軌跡和其特征向量。
式中:qk(n)為無人機在第k個通信任務(wù)中的位置。
若無人機計算系統(tǒng)中存在參考軌跡時,則通過對參考軌跡的特征向量的訓(xùn)練,形成新模型來生成新的飛行軌跡。若該軌跡可提升性能,則記錄該軌跡和其特征向量,并利用該軌跡以及其特征向量優(yōu)化參考軌跡生成模型。
算法通過循環(huán)迭代不斷優(yōu)化軌跡生成模型,使得無人機在進入局部優(yōu)化區(qū)域時可以快速地生成一條符合性能標準的軌跡曲線。循環(huán)迭代同時也可以使得生成的軌跡曲線進行再次優(yōu)化,直到性能逼近理論上界或迭代計數(shù)到達上界。
在局部軌跡優(yōu)化場景中,根據(jù)式(7)對于無人機傳輸速率的描述,無人機在距離目標地面終端越近時,其傳輸速率越大。那么無人機在wT處有最大傳輸速率
人機處于邊界上有最小傳輸速率
關(guān)于無人機飛行的方向選擇有兩種可能。第一種可能:為了獲得更高的傳輸速率,無人機可能會朝著目標地面終端wT的方向飛行。第二種可能:為了縮短無人機飛行距離,無人機可能朝著下一目標地面終端wE的方向飛行。總之無論無人機如何選擇飛行方向,無人機在飛行時每一時隙所在的位置必然比上一時隙所在的位置更接近目標地面終端wT或下一個地面終端wE。無人機的飛行區(qū)域存在非優(yōu)解區(qū)域和優(yōu)解區(qū)域。
無人機與目標地面終端wT的距離為
無人機與下一目標地面終端wE的距離為
無人機在n+1 時刻與地面終端wT和wE的加權(quán)距離必然比n時刻與地面終端wT和wE的加權(quán)距離短,如式(16)所示。
式中:ζ為距離重要程度因子,0≤ζ≤1 ,ζ值越大,距離對方向的選擇越重要。ζ由式(17)表示
式中:Rk為已傳輸?shù)臄?shù)據(jù)總量。
滿足式(2)的條件下,為了保證飛行時間最短,我們假設(shè)無人機只有兩個狀態(tài):靜止或以最大速度飛行。則無人機在第i+1 個時隙的位置坐標可以表示為
在滿足式(16)的條件下,可解出θi的上界θiH及下界θiL,θi表示無人機在第i~i+1 個時隙之間的飛行方向。
根據(jù)無人機的計算系統(tǒng)中有沒有存儲最佳飛行軌跡或者貪心指數(shù)的大小,可將算法細分為兩大類,分別為啟發(fā)式優(yōu)化飛行軌跡和半監(jiān)督模型化優(yōu)化飛行軌跡。
如果無人機的計算系統(tǒng)中沒有存儲參考軌跡,或滿足貪心指數(shù),那么本次局部軌跡優(yōu)化采用啟發(fā)式的貪心策略,根據(jù)θi的概率密度P(θi)隨機選取θi值,得qk(i+1)=[x k(i+1),y k(i+1)]的坐標,其θi的概率密度如式(19)。隨著時隙的不斷增加,最終獲得本次局部優(yōu)化的軌跡,并得到方向參數(shù)數(shù)據(jù)集。
對于本次局部優(yōu)化的軌跡qk,其路徑長度為
如果無人機的計算系統(tǒng)中存儲最佳飛行軌跡,最優(yōu)空間中的參數(shù)為Θ=[θ1B,θ2B,…,θNB],那么本時隙無人機的飛行方向采用機器學(xué)習(xí)的方式,根據(jù)θi的概率密度P(θi)隨機選取θi值,得qk(i+1)=[x k(i+1),y k(i+1)]的坐標;其θi的概率密度如式(21)。隨著時隙的不斷增加,最終獲得本次局部優(yōu)化的軌跡。
在基于飛行軌跡優(yōu)化的無人機緩存通信策略中,本文提出了一種基于半監(jiān)督學(xué)習(xí)的軌跡優(yōu)化方案。我們通過仿真結(jié)果來評估所提出方案的性能。為了突出比較,在仿真中設(shè)置了一種對比算法,即基于橢圓折線的軌跡優(yōu)化算法。在我們的仿真中設(shè)置了兩種對比算法,分別為基于TSP 的軌跡優(yōu)化算法和基于橢圓折線的軌跡優(yōu)化算法。
4.1.1 基于TSP 的軌跡優(yōu)化算法
這種方案的假設(shè)是當(dāng)?shù)孛娼K端的通信范圍D= 0時,與地面終端的通信范圍相當(dāng)于一個點。如果無人機需要與各地面終端進行通信,那么無人機必須經(jīng)過(貼近)地面終端,此時可以將該問題看作是一般的經(jīng)典TSP,可利用蟻群算法加以解決。
4.1.2 基于橢圓折線的軌跡優(yōu)化算法
在現(xiàn)實中,無人機的飛行軌跡是一條有向曲線,但如果把曲線離散化形成一個個坐標點,那么無人機飛行軌跡可由一系列坐標點組合而成。如果需要找到無人機在每個時隙的最優(yōu)坐標點,那么算法難以設(shè)計。橢圓折線法的核心思想是只找最優(yōu)飛行軌跡的關(guān)鍵坐標點,通過將關(guān)鍵坐標點相連,近似地逼近最優(yōu)飛行軌跡。
基于橢圓折線的軌跡優(yōu)化算法,根據(jù)已確定的通信順序,在與地面終端進行通信的同時進行局部軌跡優(yōu)化。可以說,基于橢圓折線的軌跡優(yōu)化算法是一種局部軌跡優(yōu)化算法。
具體來說,當(dāng)無人機與wk進行通信時,即在進行第k個通信任務(wù)時,算法進入地面終端k的局部軌跡優(yōu)化環(huán)節(jié)。同樣,將當(dāng)前需求通信的地面終端k定義為wT,其有效通信半徑為D。wS為無人機在局部軌跡中的初始位置,wE為下一個要前往的地面終端。
我們需要將地面終端的有效通信半徑D再度離散化,定義離散程度d將通信半徑D分為nD=D/d段。在每一段通信區(qū)域內(nèi),無人機與地面終端的通信速率相等,即
式中,nP為無人機所在的離散通信區(qū)域序號,序號相同時,無人機與地面終端的通信速率相等。
即離散通信區(qū)域Pn的通信區(qū)域為
我們知道,無人機在飛行過程中要盡可能地縮短飛行距離。如果無人機能以直線飛行,那么其飛行距離一定是最短的。但是由于通信范圍的限制,無人機幾乎不可能以一條直線為軌跡,所以我們需要找出幾個關(guān)鍵的拐點,以折線為飛行軌跡。
利用橢圓性質(zhì):橢圓上任意一點到兩焦點的距離相等。
式中,(xp,yp)為無人機進入離散通信區(qū)域nP的外邊界時的坐標。(xE,yE)為下一個要前往的地面終端wE的坐標。
通過調(diào)整C的大小,作一個橢圓與離散通信區(qū)域nP的內(nèi)邊界相切,該切點即所找的拐點。
本節(jié)中將所有仿真實驗涉及的參數(shù)匯總,如表1所示。
表1 仿真參數(shù)表Table 1 Simulation parameters
在第一組實驗中,我們首先仿真了在兩個地面終端在需求數(shù)據(jù)量不同的情況下的無人機飛行軌跡,設(shè)置兩地面終端所需求的數(shù)據(jù)量分別為110 Mbit 和60 Mbit,通信半徑都為60 m。從圖3可以看出,藍色路線為基于半監(jiān)督學(xué)習(xí)的飛行軌跡,其總長為459 m,比TSP 蟻群算法軌跡(紅色路線)總長減少202 m,優(yōu)化30.6%;兩地面終端的軌跡不相似,左側(cè)的地面終端需求數(shù)據(jù)量較小,無人機繞其邊界飛行;右側(cè)地面終端需求數(shù)據(jù)量較大,則需要略微深入地面終端的通信范圍。說明本算法能很好地把握終端的通信需求。
圖3 兩地面終端無人機軌跡優(yōu)化圖Fig.3 Ground terminal UAV trajectory optimization
在第二組實驗中,我們仿真了D= 60 m 時無人機的飛行軌跡圖?;跈E圓折線法的無人機飛行軌跡,其總長為2251 m,比TSP 蟻群算法軌跡總長減少511 m,總長優(yōu)化18.5%;如圖4所示,藍色路線為基于半監(jiān)督學(xué)習(xí)的無人機飛行軌跡,其總長為2152 m,比TSP 蟻群算法軌跡總長減少610 m,優(yōu)化22.1%。
圖4 D=60 m 時基于半監(jiān)督學(xué)習(xí)的無人機飛行軌跡圖Fig.4 UAVs flight trajectory graph based on Semi-supervised Learning (D=60 m)
在第三組實驗中,我們仿真了D=140 m 時無人機的飛行軌跡圖。如圖5所示,藍色路線為基于半監(jiān)督學(xué)習(xí)的無人機飛行軌跡,其總長為1836 m,比TSP 蟻群算法軌跡總長減少926 m,優(yōu)化33.5%?;跈E圓折線法的無人機飛行軌跡,其總長為1910 m,比TSP 蟻群算法軌跡總長減少852 m,總長優(yōu)化30.8%。
圖5 D=140 m 時基于半監(jiān)督學(xué)習(xí)的無人機飛行軌跡圖Fig.5 UAVs flight trajectory graph based on Semi-supervised Learning (D=140 m)
兩種方法相比TSP 蟻群算法,有明顯的提升?;诎氡O(jiān)督學(xué)習(xí)的無人機飛行軌跡總長比基于橢圓折線法的無人機飛行軌跡總長減少74 m,性能提升3.8%。從性能提升上看,半監(jiān)督學(xué)習(xí)法比橢圓折線法只有略微的提升。但從飛行軌跡上看,橢圓折線法的飛行軌跡拐角較大,無人機因為自身性能和慣性的原因其轉(zhuǎn)向較慢,無人機按照橢圓折線法的軌跡可能較難操作,達不到實際要求。半監(jiān)督學(xué)習(xí)法拐角圓潤,易于操作。
本文研究了在移動邊緣計算系統(tǒng)中,搭載邊緣計算服務(wù)器的無人機與地面終端的通信問題,并將該問題轉(zhuǎn)化為無人機的飛行軌跡優(yōu)化問題。并且提出了緩存需求驅(qū)動的無人機軌跡優(yōu)化方案。具體為:在一個周期內(nèi),無人機從部署服務(wù)器的位置出發(fā),依次經(jīng)過各地面終端并完成通信任務(wù),然后返回至初始位置。其中,當(dāng)無人機起飛時,根據(jù)已知的通信順序,依次飛行經(jīng)過各地面終端并與各地面終端通信;當(dāng)無人機進入地面終端的通信范圍時,無人機初始化地面終端的信息,同時地面終端向無人機發(fā)送需求信息,無人機接收到需求信息后則開始向地面終端傳輸需求內(nèi)容。其中,同一時間無人機只能與一個地面終端進行通信,無人機在與地面終端的通信過程中,利用迭代采取啟發(fā)式隨機法及半監(jiān)督模型法優(yōu)化局部飛行軌跡,無人機沿著優(yōu)化軌跡飛行。仿真表明,該方案可以明顯降低無人機的飛行距離及飛行時間,有效地為地面網(wǎng)絡(luò)節(jié)點提供邊緣計算服務(wù)。