陳明發(fā) 嚴(yán)天峰,3
1(蘭州交通大學(xué)電子與信息工程學(xué)院 甘肅 蘭州 730070) 2(甘肅省無線電監(jiān)測及定位行業(yè)技術(shù)中心 甘肅 蘭州 730070) 3(甘肅省高精度北斗定位技術(shù)工程實(shí)驗(yàn)室 甘肅 蘭州 730070)
微蜂窩預(yù)測模型是基于容量節(jié)儉進(jìn)行微蜂窩系統(tǒng)設(shè)計(jì)的工具,對于移動(dòng)通信的應(yīng)用研究有著巨大的指導(dǎo)意義。微蜂窩預(yù)測半徑在1.6 km以內(nèi),微蜂窩預(yù)測模型大體可以劃分為兩類:理論模型和經(jīng)驗(yàn)?zāi)P?。理論模型是?yīng)用電磁波理論計(jì)算得到的確定性模型;經(jīng)驗(yàn)?zāi)P褪墙y(tǒng)計(jì)性模型,是在大量測量數(shù)據(jù)基礎(chǔ)上形成的。經(jīng)驗(yàn)?zāi)P椭斜容^經(jīng)典的就是Lee微蜂窩預(yù)測模型,它根據(jù)信號的傳播距離,在自由空間損耗模型上添加不同場景下的損耗參數(shù),與其他模型相比,復(fù)雜度不高且適用各類場景,經(jīng)驗(yàn)證,其準(zhǔn)確度較高[1-3]。Lee微蜂窩建筑物損耗分析方法研究的是建筑物損耗與射頻路徑上穿過建筑物寬度之和的關(guān)系,然后應(yīng)用最小二乘法構(gòu)建成模型,但是在市區(qū)場景下,建筑物形狀的多樣性和布局的復(fù)雜性等對分析建筑物損耗造成較大影響,使用Lee建筑物簡化算法來計(jì)算建筑物損耗存在較大誤差,而精準(zhǔn)地得到射頻路徑上的信號穿過每個(gè)建筑物的寬度又很困難。
本文基于實(shí)地測試數(shù)據(jù)對Lee模型進(jìn)行了建模以及仿真,建立路徑損耗參數(shù),改進(jìn)自由空間損耗模型;針對Lee對與建筑物損耗分析誤差較大的問題,應(yīng)用機(jī)器學(xué)習(xí)中隨機(jī)森林和GBRT兩種集成回歸算法對建筑物損耗數(shù)據(jù)進(jìn)行分析,建立建筑物損耗模型;綜合自由空間損耗模型與建筑物損耗模型使得市區(qū)微蜂窩模型更為精準(zhǔn)。
基于市區(qū)建筑物場景下衰減預(yù)測的基礎(chǔ)模型為Lee微蜂窩模型。接收端接收的強(qiáng)信號是來自于多條經(jīng)過建筑多次反射的反射波,而不是穿透建筑的無線電波,Lee微蜂窩傳播模型的預(yù)測公式為:
Pr=Pt-LLOS(dA,h1)-LB+GA+Ga
(1)
式中:Pt為發(fā)射功率;LB為建筑損耗,B表示射頻信號路徑上信號穿過建筑物的總厚度;GA是射頻路徑上信號到達(dá)第一個(gè)建筑物的損耗,由發(fā)射端到建筑物的距離決定。本次實(shí)驗(yàn)中GA=0,LLOS(dA,h1)為視距dA處的路徑損耗,即自由空間損耗。距離發(fā)射端的自由空間損耗的公式為:
(2)
式中:df為近場距離。微蜂窩的近場距離公式為:
(3)
式中:h1為發(fā)射天線高度;h2接收天線高度;λ為波長[4]。
Lee微蜂窩建筑損耗模型為:
(4)
式中:LB表示建筑物造成的信號傳播損失;B(單位為m)為Lee建筑物損耗模型傳輸路徑上所有建物寬度之和。
集成算法是指由多個(gè)弱分類器模型組成的整體模型,主要有兩大類:Boosting和Bagging[5-7]。本文中選取Boosting中最具代表性的算法GBRT和Bagging中最具代表性的算法Random Forest進(jìn)行數(shù)據(jù)預(yù)測分析。
隨機(jī)森林[8]是復(fù)合決策樹的集成機(jī)器學(xué)習(xí)算法。隨機(jī)森林使用booststrap方法構(gòu)建n個(gè)訓(xùn)練集,每個(gè)訓(xùn)練集對應(yīng)生成一個(gè)決策樹,總體就有n個(gè)決策樹,因?yàn)槊總€(gè)決策樹的數(shù)據(jù)集都不相同,所以每棵樹又有少量區(qū)別。最后對所有的決策樹的預(yù)測結(jié)果取平均減少預(yù)測的方差,提高在測試集上的性能表現(xiàn)。相比較單棵樹訓(xùn)練過程,隨機(jī)性主要體現(xiàn)在兩個(gè)方面:每次迭代是在原始數(shù)據(jù)集中重新抽樣獲得不同的訓(xùn)練集;對于每一個(gè)樹節(jié)點(diǎn),考慮不同的隨機(jī)特征子集來進(jìn)行分裂。
隨機(jī)森林的數(shù)學(xué)模型公式如下:
(5)
式中:N為回歸樹模型回歸樹的數(shù)量。
GBRT[9]算法是一種迭代決策樹的集成機(jī)器學(xué)習(xí)算法,該算法由多棵決策樹組成,所有樹的結(jié)論加起來就是最終答案,GBRT的數(shù)學(xué)模型fGBRT如下:
(6)
式中:T為建立模型的回歸樹的數(shù)量;h(x;at)為一個(gè)回歸樹模型;at為每個(gè)回歸樹模型的參數(shù)。算法的核心思想是第T樹學(xué)習(xí)的是前T-1棵樹結(jié)論和的殘差,通過疊加所有決策樹的結(jié)論不斷逼近真實(shí)值。為了防止過擬合,GBRT算法加入了Boosting這一項(xiàng)。
最小二乘法[10]是線性擬合中最常見的一種,是通過最小化誤差的平方和尋找最為逼近原始數(shù)據(jù)的函數(shù)表達(dá)式,形如y=f(x,b),求出函數(shù)關(guān)系。
本次實(shí)驗(yàn)選取的測試地點(diǎn)為以蘭州交通大學(xué)電信樓為中心,以半徑為微蜂窩極限距離1 600 m的圓為測試范圍進(jìn)行測試計(jì)算。測試場景和測試點(diǎn)分布使用ArcGIS[11]繪制如圖1所示。
圖1 測試場景圖
圖中黑色圓點(diǎn)為發(fā)射基站位置,黑色三角形為移動(dòng)接收點(diǎn)。本次實(shí)驗(yàn)中發(fā)射天線高度為45 m,接收天線高度為2.5 m,測試頻率為400 MHz,頻率為400 MHz時(shí)的近場距離為600 m,微蜂窩的極限距離為1 600 m。
表1為本文測試的設(shè)備信息。
表1 測試設(shè)備信息
經(jīng)過測試以及分析得出,功率放大器和天線增益為33 dB,設(shè)備損耗為8 dB,饋線損耗為5.3 dB。
為了驗(yàn)證市區(qū)微蜂窩場景中建筑對信號傳播的影響,測試得到的數(shù)據(jù)要盡可能詳細(xì),包括接收點(diǎn)的功率值、經(jīng)緯度值、海拔值。
如圖1所示,研究建筑物對信號傳播的損耗就是研究射頻路徑上信號穿過建筑物的寬度與建筑物損耗之間的關(guān)系。Lee建筑物損耗模型提出了簡便計(jì)算射頻路徑上信號穿過建筑物寬度之和的方法:將測試地區(qū)的建筑物按照建筑物布局和街道分布劃分為如圖1所示的5個(gè)建筑物區(qū)塊,分別計(jì)算5個(gè)建筑物區(qū)塊的建筑物占比,由穿過建筑物區(qū)塊的距離和建筑物占比得到等價(jià)建筑物區(qū)塊總寬度B,若射頻信號穿過圖1中的2和4區(qū)域,則:
B=a2·L2+a4·L4
(7)
式中:ai為各個(gè)區(qū)域的建筑物面積占比;Li為射頻信號穿過各個(gè)區(qū)域的距離。
在同一個(gè)建筑物區(qū)塊內(nèi)的兩個(gè)測試點(diǎn),建筑物占比是相同的,測試點(diǎn)與發(fā)射點(diǎn)的距離是相近的,但是由Lee建筑物損耗模型得到的建筑物損耗與實(shí)際測得建筑物損耗差值卻很大。針對這一缺點(diǎn),本文提出如下橢圓區(qū)域計(jì)算方法。
由惠更斯-菲涅爾原理可以得到:對電波傳播造成較大影響主要是位于第一菲涅爾區(qū)域的障礙物。因此,以收發(fā)兩點(diǎn)間距離的一半為長半軸,以第一菲涅爾半徑F為短半軸構(gòu)建收發(fā)兩點(diǎn)間信號的橢圓傳播區(qū)域,計(jì)算該橢圓區(qū)域的建筑物面積占比a,如圖2所示。
圖2 基于菲涅爾區(qū)域的橢圓區(qū)域示意圖
得到等價(jià)建筑物區(qū)塊總寬度B:
B=L×a
(8)
式中:L為收發(fā)兩點(diǎn)間的距離。
由式(2)可以得到,自由空間損耗主要有兩大參數(shù)決定,一是距離,二是路徑損耗斜率γ。本文中使用發(fā)射點(diǎn)(ET,NT)、接收點(diǎn)(ER,NR)的經(jīng)緯度計(jì)算兩點(diǎn)之間的距離,公式如下:
S=2r·arcsin(sin2(NT-NR)+cos(NT)·
cos(NR)·sin2(ET-ER))1/2
(9)
式中:r=6 378.137 km為地球赤道半徑。
測試地區(qū)的路徑損耗斜率γ以前往往是參考類似地區(qū)的路徑損耗斜率得到的,而每個(gè)地區(qū)的地形、建筑物分布、建筑物形狀、街道走向又各不相同,因此引用其他地區(qū)的γ計(jì)算本地區(qū)的自由空間損耗往往會對近場距離以外的點(diǎn)造成自由空間損耗誤差。本文將測試計(jì)算本地區(qū)的路徑損耗斜率γ,從而提高自由空間損耗模型精度。將損耗數(shù)據(jù)進(jìn)行線性分析,得到路徑損耗斜率圖如圖3所示。
圖3 路徑損耗斜率圖
取圖3中的7組數(shù)據(jù)分別計(jì)算路徑損耗斜率[12],再取平均值得:
γ=23.51 dB/dec
研究地區(qū)的微蜂窩路徑損耗斜率為23.51 dB/dec。已知路徑損耗斜率與距離,得到改進(jìn)自由空間損耗模型與傳統(tǒng)的自由空間損耗模型對比如圖4所示。
圖4 自由空間損耗模型
可以看出,自由空間損耗誤差主要在近場距離以外,誤差在1.5 dB 左右。
將數(shù)據(jù)集按照3∶7的比例劃分為測試集和訓(xùn)練集,使用隨機(jī)森林、GBRT兩種集成算法構(gòu)建市區(qū)建筑物損耗的預(yù)測模型,模型的構(gòu)建流程如圖5所示。
圖5 模型構(gòu)建流程圖
4.2.1參數(shù)設(shè)置
集成機(jī)器學(xué)習(xí)算法中回歸樹的數(shù)量是影響算法的預(yù)測性能的重要參數(shù)。本文依據(jù)模型在數(shù)據(jù)集上的評價(jià)參數(shù)(RMSE、R2)與回歸樹數(shù)量之間的關(guān)系曲線選擇最佳的回歸樹數(shù)量進(jìn)行模型訓(xùn)練,兩種算法的關(guān)系曲線分別如圖6和圖7所示,其構(gòu)建的市區(qū)建筑物場景的微蜂窩預(yù)測模型達(dá)到訓(xùn)練的最優(yōu)。
(a)
(a)
由圖6和圖7得到構(gòu)建集成損耗模型時(shí)的最佳回歸樹的數(shù)量如表2所示。
表2 回歸模型回歸樹的選定
4.2.2建筑物損耗建模對比分析
本文選取了Lee建筑物損耗模型與隨機(jī)森林、GBRT兩種集成算法構(gòu)建的模型進(jìn)行對比,結(jié)果如圖8-圖10所示。
圖8 GBRT建筑物損耗模型與實(shí)測模型對比
圖9 隨機(jī)森林建筑物損耗模型與實(shí)測模型對比
圖10 Lee建筑物損耗模型與實(shí)測模型對比
圖8、圖9中橫軸上的距離是由式(8)計(jì)算得到的信號傳播區(qū)域中信號穿過的總寬度;圖10中橫軸上的距離是按照LEE建筑物模型簡化算法得到信號穿過建筑物的總寬度。由圖8-圖10得到三種建筑損耗模型在測試集上的精度如表3所示。
表3 回歸模型精度對比
由上述對比結(jié)果可得:(1)由集成回歸算法構(gòu)建的建筑物損耗模型普遍優(yōu)于Lee建筑物損耗模型。(2)當(dāng)RMSE和R2趨于穩(wěn)定時(shí),基于隨機(jī)森林算法構(gòu)建的模型的RMSE最小且R2最大,但是基于GBRT算法構(gòu)建的模型恰恰相反,并且GBRT模型預(yù)測值與實(shí)測值誤差明顯大于隨機(jī)森林模型。綜上,基于隨機(jī)森林算法構(gòu)建的建筑物損耗模型是穩(wěn)定而且最優(yōu)越的。
結(jié)合三種建筑物損耗模型和改進(jìn)自由空間損耗模型得到微蜂窩模型預(yù)測曲線在測試集上的表現(xiàn)以及誤差累計(jì)分布曲線如圖11、圖12所示??梢钥闯觯陔S機(jī)森林構(gòu)建的市區(qū)建筑物場景損耗模型最貼近測試集數(shù)據(jù)曲線,因此最終選擇隨機(jī)森林回歸模型進(jìn)行微蜂窩損耗分析。比較最終模型與實(shí)測損耗測試集數(shù)據(jù)發(fā)現(xiàn),基于隨機(jī)森林實(shí)現(xiàn)的市區(qū)建筑物場景微蜂窩模型的R2為0.918 5,RMSE為2.321 4,最大誤差不超過4 dB。造成本次實(shí)驗(yàn)誤差的原因分析如下:(1)由于接受天線架設(shè)的高度為2.5 m,測試時(shí)天線的抖動(dòng)可能形成測試值與實(shí)際值存在偏差;(2)測試時(shí)來往行人和車輛的干擾也會造成實(shí)際值與測試值的偏差;(3)發(fā)射點(diǎn)與接收點(diǎn)的地勢高度差產(chǎn)生的有效天線高度增益或損耗也會使實(shí)驗(yàn)數(shù)據(jù)產(chǎn)生誤差。
圖11 模型曲線對比
圖12 誤差累計(jì)分布曲線
在信號穿過市區(qū)建筑物的場景下,建筑物的阻擋使得電磁波在到達(dá)接收端時(shí)存在多路信號且多路信號之間存在相位差,多路信號的合成過程中形成了多徑衰落,造成信號的衰減,同時(shí)也使得市區(qū)建筑物場景下微蜂窩的電波損耗預(yù)測難度增大[13-15]。隨機(jī)森林、GBRT與最小二乘法相比較具有很大的優(yōu)勢,可以充分應(yīng)用數(shù)據(jù)含有的特征而又不擔(dān)心過擬合。使用基于隨機(jī)森林算法構(gòu)建的微蜂窩模型在預(yù)測損耗時(shí),預(yù)測誤差不超過4 dB,預(yù)測精度較高,可以有效精準(zhǔn)地應(yīng)用于城市環(huán)境下?lián)p耗的預(yù)測。由于市區(qū)建筑物的多樣性以及測試環(huán)境周圍的復(fù)雜性,造成信測試點(diǎn)信號衰減的因素也不盡相同,因此使用隨機(jī)森林算法對市區(qū)建筑物的形狀和測試環(huán)境進(jìn)行分類判別,再結(jié)合實(shí)測數(shù)據(jù)分析。未來將對市區(qū)建筑物微蜂窩預(yù)測模型進(jìn)行更進(jìn)一步優(yōu)化,并構(gòu)建更貼近實(shí)際的微蜂窩模型。