蔣志函,王 斌,潘志文,2,劉 楠
(1.東南大學(xué) 移動(dòng)通信國(guó)家重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210096;2.網(wǎng)絡(luò)通信與安全紫金山實(shí)驗(yàn)室,江蘇 南京 211100;3.通信網(wǎng)信息傳輸與分發(fā)技術(shù)重點(diǎn)實(shí)驗(yàn)室,河北 石家莊 050081)
基于信道狀態(tài)信息(Channel State Information,CSI)的指紋定位技術(shù)能通過離線階段構(gòu)建指紋庫和在線階段搜索匹配的方式實(shí)現(xiàn)定位,在非視距傳輸(Non Line of Sight,NLOS)下具有較高的精度和魯棒性,因此被廣泛應(yīng)用于室內(nèi)和其他復(fù)雜多徑環(huán)境下[1-3]。CSI指紋是對(duì)信道的細(xì)粒度描述,且在大規(guī)模多輸入多輸出(Massive Multiple Input Multiple Output,M-MIMO)和正交頻分復(fù)用(Orthogonal Frequency Division Multiplexing,OFDM)下的寬帶通信系統(tǒng)中,CSI包含精確的位置相關(guān)信息,如功率、角度、時(shí)延等,從而可以獲得更高的定位精度[4-9]。
現(xiàn)有的指紋匹配方式通常假設(shè)離線指紋庫和在線測(cè)試樣本滿足相同的分布。然而,由于環(huán)境的變化(如室內(nèi)布局的變化),即使同一位置下離線和在線階段獲得的CSI指紋也可能存在偏差,因此只能獲得較差的定位精度。領(lǐng)域自適應(yīng)方法可以通過學(xué)習(xí)域不變特征,來解決兩個(gè)相關(guān)領(lǐng)域的數(shù)據(jù)在不同分布下的問題[10-12]。通過將離線和在線指紋數(shù)據(jù)看作位于源域和目標(biāo)域這兩個(gè)分布不同的相關(guān)領(lǐng)域,一些利用領(lǐng)域自適應(yīng)來減輕指紋變化影響的方法被提出[13-14]。其中DMCA方法[13]通過聯(lián)合最小化最大均值差異(Maximum Mean Discrepancy,MMD)和相關(guān)對(duì)齊(Correlation Alignment,CORAL)損失學(xué)習(xí)域不變特征,再訓(xùn)練位置預(yù)測(cè)器,F(xiàn)iDo方法[14]則利用自編碼器學(xué)習(xí)源域和目標(biāo)域的域不變特征。但是這些方法在獲取域不變特征時(shí)都沒有考慮目標(biāo)樣本和任務(wù)決策之間的關(guān)系,因此可能無法提取有效特征,導(dǎo)致定位精度有限。
本文提出了一種基于分歧差異的深度卷積對(duì)抗網(wǎng)絡(luò)(Disparity Discrepancy based Deep Convolutional Adversarial Network,DDCAN)領(lǐng)域自適應(yīng)定位方法,其將M-MIMO的CSI經(jīng)逆傅里葉變換(Inverse Fourier Transform,IDFT)得到角度時(shí)延信道幅度響應(yīng)矩陣(Angle Delay Channel Amplitude Matrix,ADCAM)作為指紋,并構(gòu)建深度對(duì)抗網(wǎng)絡(luò)訓(xùn)練目標(biāo)域的定位模型,在只有源域樣本和少量目標(biāo)域無標(biāo)簽樣本的情況下,目標(biāo)域定位模型可以通過最小化源域誤差和源域、目標(biāo)域的分歧差異得到有效訓(xùn)練。此外,分別構(gòu)建了分類和回歸的領(lǐng)域自適應(yīng)定位方法,并針對(duì)分類方法中邊界用戶類別模糊的問題,提出了網(wǎng)格中心重定位的方法來進(jìn)一步提高定位精度。仿真表明,DDCAN方法能有效地減輕環(huán)境變化的影響,達(dá)到較高的定位精度。
考慮一個(gè)單基站(Base Station,BS)的M-MIMO-OFDM系統(tǒng),如圖1所示。
圖1 基站接收信號(hào)示意圖
不失一般性地,假設(shè)BS配置了以半波長(zhǎng)λc/2的距離等間隔排列的均勻面陣(Uniform Planar Array,UPA),其中天線的列數(shù)為M,行數(shù)為N,基站處天線的總個(gè)數(shù)記為Nt=MN(均勻線陣(Uniform Linear Array,ULA)可看作UPA在M或N為1下的特例)。K個(gè)移動(dòng)基站(Mobile Station,MS)在服務(wù)區(qū)域內(nèi)隨機(jī)分布,每個(gè)MS配置單個(gè)全向天線,BS通過信道估計(jì)獲得CSI矩陣。假設(shè)無線信號(hào)到達(dá)基站經(jīng)過的多徑數(shù)為P,第k個(gè)MS信號(hào)經(jīng)第p條路徑到達(dá)基站的到達(dá)角(Angle of Arrival,AOA)可以被分解為垂直方向的俯仰角θp,k和水平方向的方位角φp,k,θp,k,φp.k∈(0,π),以BS處UPA中原點(diǎn)處的天線為參考天線,則該路徑所對(duì)應(yīng)的陣列響應(yīng)矢量為[9]:
v(θp,k,φp,k)=v(v)(θp,k)?v(h)(θp,k,φp,k),
(1)
其中,?為克羅內(nèi)科積,且有:
v(v)(θp,k)=[1,e-jπcosθp,k,…,e-jπ(M-1)cosθp,k]T,
(2)
v(h)(θp,k,φp,k)=[1,e-jπsinθp,kcosφp,k,…,e-jπ(N-1)sinθp,kcosφp,k]T,
(3)
qp,k=αp,kv(θp,k,φp,k),
(4)
第k個(gè)MS的CIR可以表示為:
(5)
其中,Pk表示第k個(gè)MS信道的多徑數(shù)。
(6)
其中,Hk∈Nt×Nc,Υp,k=τp,k/Ts為采樣后的多徑傳播時(shí)延,[·]l表示矩陣的第l列向量或向量的第l個(gè)元素。
在實(shí)際通信過程中,BS通過信道估計(jì)獲得第k個(gè)用戶的CFR矩陣Hk。通過時(shí)間域和角度域的IDFT將矩陣從空頻域變換到角度時(shí)延域,得到角度時(shí)延信道矩陣(Angular Delay Channel Matrix,ADCM)Gk[9]:
(7)
其中,Gk∈Nt×Nc,Gk中的Nt行對(duì)應(yīng)Nt個(gè)AOA,Nc列對(duì)應(yīng)Nc個(gè)TOA,VM∈M×M、VN∈N×N為角度域IDFT矩陣,U∈Nc×Nc為時(shí)間域IDFT矩陣,它們分別定義為[9]:
(8)
(9)
其中,[·]r,c表示矩陣的第r行c列個(gè)元素。
定義第k個(gè)MS的ADCAM:
Ωk?{|Gk|},
(10)
δ(j-rp,k))=0,
(11)
其中,
(12)
由式(11)可知,當(dāng)M,N,Nc趨于無窮時(shí),Ωk為稀疏的并僅在有限的多徑AOA和TOA對(duì)應(yīng)位置上有值。當(dāng)M或N為1時(shí),BS處的天線陣列變化為ULA,ADCAM只擁有垂直或者水平角度的分辨率。由于在一般的配置了UPA的M-MIMO-OFDM系統(tǒng)中M,N,Nc?1,因此Ωk是近似稀疏的。
與一般的指紋定位方法不同,DDCAN方法在離線和在線階段之間增加了一個(gè)離線校準(zhǔn)的中間階段。
假設(shè)在定位區(qū)域內(nèi)均勻劃分ns個(gè)參考點(diǎn),則可以通過參考點(diǎn)構(gòu)建離線指紋庫FDB:
(13)
其中,F(xiàn)i為參考點(diǎn)指紋,ai為對(duì)應(yīng)二維位置坐標(biāo)。
分別考慮回歸任務(wù)和分類任務(wù)下的領(lǐng)域自適應(yīng)方法。
分類問題中,離線階段在獲得指紋庫的基礎(chǔ)上進(jìn)一步將定位區(qū)域以間隔d劃分為C個(gè)網(wǎng)格,則離線階段指紋庫中每個(gè)指紋的類別標(biāo)簽為:
ci∈{0,1,…,C-1}, fori=1,2,…,ns。
(14)
errQ(fc)=(F,y)~QLc(fc(F),c),
(15)
式中,Lc為對(duì)應(yīng)的分類損失函數(shù)。在線階段分類定位模型將待定位用戶的搜索范圍縮小到某一特定類別,再利用加權(quán)K近鄰(Weighted K-Nearest Neighbor,WKNN)方法進(jìn)行位置估計(jì)。
(16)
(17)
其中,sup為取上界。
當(dāng)損失函數(shù)L滿足三角不等式時(shí),可以得到[15]:
(18)
其中,λ為理想誤差,其滿足
(19)
(20)
根據(jù)該優(yōu)化函數(shù)構(gòu)建了如圖2所示的DDCAN。
圖2 DDCAN結(jié)構(gòu)
(21)
當(dāng)在f′下的差異損失接近上界時(shí),通過最小化下式可以達(dá)到有效減小errQ(f(ψ))的目的。
(22)
其中,ys為源域樣本的標(biāo)簽,在回歸問題中為參考點(diǎn)位置坐標(biāo)a,分類問題中為所屬類別c,η為平衡系數(shù)。最終的優(yōu)化目標(biāo)變?yōu)椋?/p>
(23)
在分類任務(wù)中,DDCAN輸出為指紋所在的網(wǎng)格類別。受文獻(xiàn)[15]的啟發(fā),針對(duì)源域和目標(biāo)域給出不同的損失函數(shù)。記softmax函數(shù)為σ,對(duì)于z∈C有:
(24)
(25)
式中,?(·)為取向量最大元素對(duì)應(yīng)下標(biāo)。為了抑制在對(duì)抗學(xué)習(xí)中梯度爆炸或消失,目標(biāo)域使用修正的交叉熵?fù)p失[16]:
L′(f′(ψ(Ft)),f(ψ(Ft)))?lb[1-σ?(f(ψ(xt)))(f′(ψ(Ft)))]。
(26)
(27)
需要注意,γ越大泛化效果越好,但過大會(huì)導(dǎo)致梯度爆炸。
離線校準(zhǔn)階段通過有標(biāo)簽的離線指紋庫和無標(biāo)簽的目標(biāo)域樣本完成對(duì)DDCAN的訓(xùn)練,得到定位模型f(ψ(·))。在線階段將待定位用戶指紋作為測(cè)試數(shù)據(jù)輸入給訓(xùn)練好的定位模型,得到其在每個(gè)網(wǎng)格的概率。由于相鄰網(wǎng)格的邊界重合,邊界附近的用戶容易被DDCAN誤判,且邊界上的用戶只用單個(gè)網(wǎng)格內(nèi)的離線指紋進(jìn)行WKNN估計(jì)結(jié)果次優(yōu),因此提出改進(jìn)的網(wǎng)格重定位方法。具體地,保留第j個(gè)待定位用戶通過定位模型f(ψ(·))得到的概率向量bj=σ(f(ψ(Fj)))∈C,為了避免小概率網(wǎng)格的干擾,進(jìn)一步對(duì)bj進(jìn)行濾波后得到b′j,其中
(28)
其中,[·]i為向量第i個(gè)元素。將概率最大的4個(gè)網(wǎng)格塊的中心坐標(biāo)進(jìn)行加權(quán)求和,得到重定位的搜索網(wǎng)格中心坐標(biāo):
(29)
其中,gj為b′j中索引按照對(duì)應(yīng)元素值降序排列后的索引向量,qi為第i個(gè)網(wǎng)格的中心坐標(biāo)。重定位的搜索網(wǎng)格大小同為d,不會(huì)引入額外的搜索復(fù)雜度,但其更易包含待定位用戶,有助于通過WKNN方法估計(jì)位置。
(30)
其中,wi為加權(quán)系數(shù),其滿足
(31)
式中,sij為第j個(gè)待定位用戶指紋和第i個(gè)離線指紋間的相似度,其可以表示為:
(32)
(33)
(34)
(35)
與分類定位方法相比,回歸定位方法直接進(jìn)行位置估計(jì),不需要進(jìn)行搜尋匹配,顯著提高了在線階段定位的速率。但是分類定位方法對(duì)DDCAN提取域不變特征的要求低,只要能滿足待定位用戶所在網(wǎng)格的相對(duì)概率準(zhǔn)確即可,而回歸方法的域不變特征直接影響到位置估計(jì)結(jié)果,因此分類方法更容易進(jìn)行域自適應(yīng)和在目標(biāo)域獲得更高精度。
源域的離線指紋樣本和目標(biāo)域的測(cè)試樣本通過DeepMIMO數(shù)據(jù)集[17]生成。
為了將DDCAN方法和其他領(lǐng)域自適應(yīng)方法比較,在分類問題中對(duì)比了DaNN[10]、DANN[11]和BDA[12]方法。首先比較了這幾種方法的平均定位誤差(Mean Absolute Error,MAE):
(36)
如表1所示,RLoc_WKNN表示在WKNN前進(jìn)行了網(wǎng)格中心重定位,在不同的方法中,相比于直接使用WKNN均獲得了一定的精度提升。NoAdp表示將在源域訓(xùn)練的模型直接用于目標(biāo)域的定位結(jié)果,由于環(huán)境的變化,源域訓(xùn)練的模型存在較大定位誤差,不同的領(lǐng)域自適應(yīng)算法都取得了一定的精度提升,其中DDCAN方法獲得了最好的定位結(jié)果,相比于BDA方法定位精度提升了29.7%。
幾種方法的定位誤差累計(jì)分布函數(shù)(Cumulative Distribution Function,CDF)曲線如圖3所示。
圖3 分類領(lǐng)域自適應(yīng)方法CDF對(duì)比結(jié)果
從圖3中可以看出,DDCAN定位方法在可靠度為90%的概率下達(dá)到了最高的定位精度(1.2 m),DANN和BDA方法在相同的可靠度下能保證2 m以內(nèi)的定位精度,而NoAdp方法僅能保證6.6 m內(nèi)的定位誤差,這對(duì)提供定位服務(wù)來說是不可接受的。
在回歸問題中將DDCAN方法、DaNN和DANN方法(BDA不適用于回歸問題)進(jìn)行了對(duì)比,其中MAE對(duì)比結(jié)果如表2所示。
表2 回歸領(lǐng)域自適應(yīng)算法對(duì)比結(jié)果
回歸問題下幾種方法的定位誤差累計(jì)分布函數(shù)曲線如圖4所示。
圖4 回歸領(lǐng)域自適應(yīng)方法CDF對(duì)比結(jié)果
圖4中,Rec表示回歸問題,可以看到DDCAN方法在90%的可靠度下達(dá)到1.4 m內(nèi)的定位誤差,而DANN和DaNN在相同的可靠性下都只能滿足2.3 m內(nèi)的定位誤差,而直接使用源域模型僅能滿足2.75 m內(nèi)的定位誤差。
DDCAN方法和DMCA、FiDo兩個(gè)基于深度域自適應(yīng)的定位方法對(duì)比如圖5所示。
圖5 域自適應(yīng)定位方法CDF對(duì)比結(jié)果
DDCAN定位方法相較于其他的定位方法而言定位精度都有一定的提升,其中基于DDCAN的回歸定位方法在90%可靠性下的定位誤差為1.4 m,相對(duì)于FiDo的1.6 m定位精度提高了12.5%,相對(duì)于DMCA的2.2 m定位精度提高了36.4%。
本文提出了一種結(jié)合深度領(lǐng)域自適應(yīng)方法的DDCAN指紋定位方法,該方法僅需要有標(biāo)簽的離線指紋庫和離線校準(zhǔn)階段采集的無標(biāo)簽?zāi)繕?biāo)域指紋,通過聯(lián)合優(yōu)化源域誤差和源域、目標(biāo)域的分歧差異能夠有效訓(xùn)練并提高定位模型在目標(biāo)域上的定位精度。分別針對(duì)分類和回歸問題設(shè)計(jì)了相對(duì)應(yīng)的定位模型,其中針對(duì)分類問題,考慮網(wǎng)格邊界處的用戶指紋分類困難的情況,提出網(wǎng)格重定位的方法,通過增加用戶包含在搜索網(wǎng)格內(nèi)的概率,提高了定位精度。仿真結(jié)果表明,DDCAN方法相比于其他一些領(lǐng)域自適應(yīng)方法和定位方法都取得了一定的精度提升。