亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)的5G無(wú)線傳播模型的構(gòu)建

        2022-02-19 11:16:30譚海軍朱世宇單欲立陳善雄
        關(guān)鍵詞:特征參數(shù)柵格決策樹(shù)

        譚海軍 朱世宇 單欲立 陳善雄

        1(長(zhǎng)江師范學(xué)院信息化辦公室 重慶 408100) 2(重慶工程學(xué)院計(jì)算機(jī)與物聯(lián)網(wǎng)學(xué)院 重慶 400056) 3(西南大學(xué)計(jì)算機(jī)與信息科學(xué)院 重慶 400715)

        0 引 言

        相比于傳統(tǒng)4G網(wǎng)絡(luò),5G的顯著特點(diǎn)是波長(zhǎng)下降到了毫米波的區(qū)間,因此收發(fā)天線及設(shè)備尺寸大大減小。此外,毫米波的繞射和穿墻能力差,在傳播中的衰減大,趨近于直線傳播。基于以上兩個(gè)原因,5G發(fā)射基站的體積和發(fā)射功率都有所下降,這就要求覆蓋區(qū)域內(nèi)的5G基站密度增加。因此,在5G網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)的過(guò)程中,發(fā)射基站的設(shè)備成本占總成本的比例相比于4G網(wǎng)絡(luò)大大提高[1]。合理地規(guī)劃5G網(wǎng)絡(luò)部署需要高效的網(wǎng)絡(luò)估算模型,該模型可以去預(yù)測(cè)通信覆蓋區(qū)域內(nèi)的無(wú)線電傳播特性,進(jìn)而使得估算小區(qū)覆蓋范圍、小區(qū)間網(wǎng)絡(luò)干擾以及通信速率等指標(biāo)成為可能。對(duì)于5G網(wǎng)絡(luò)目前學(xué)術(shù)界和工業(yè)界尚未有通用、成熟的部署算法。通常的思路是參考以往4G網(wǎng)絡(luò)中的無(wú)線傳播模型,并根據(jù)5G的新特點(diǎn)對(duì)原有模型進(jìn)行修正和優(yōu)化。然而,在4G及4G以前的無(wú)線網(wǎng)絡(luò)的實(shí)際應(yīng)用中,由于無(wú)線電波傳播環(huán)境復(fù)雜,傳播路徑上會(huì)受到諸如平原、山體、建筑物、湖泊等各種因素的影響,使得電磁波的傳播方式和路徑不再單一,產(chǎn)生復(fù)雜的透射、繞射、散射、反射和折射等現(xiàn)象。而在5G網(wǎng)絡(luò)中,毫米波作為信號(hào)的載波,基本是以直線傳播,此外,鏈路衰減差異和Massive MIMO技術(shù)也使5G無(wú)線傳播模型與4G及以前的模型有明顯的差異[2]。因此,本文需要借鑒4G及以前無(wú)線通信環(huán)境建模的思想,并結(jié)合5G通信中的新特性,使之既具有傳統(tǒng)經(jīng)驗(yàn)?zāi)P突蚶碚撃P偷目山忉屝裕帜芨鶕?jù)特定地理位置上實(shí)際部署的5G無(wú)線網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)模型修正,從而建立一個(gè)準(zhǔn)確有效的模型。

        傳統(tǒng)通信模型通過(guò)參數(shù)的擬合來(lái)進(jìn)行修正,但龐大的數(shù)據(jù)和實(shí)時(shí)更新的要求,讓傳統(tǒng)模型的預(yù)測(cè)能力捉襟見(jiàn)肘。因此需要建立合適的無(wú)線傳播模型,對(duì)目標(biāo)通信覆蓋區(qū)域內(nèi)的無(wú)線電波傳播特性進(jìn)行預(yù)測(cè),使得對(duì)小區(qū)覆蓋范圍、小區(qū)間網(wǎng)絡(luò)干擾以及通信速率等指標(biāo)的估算更加準(zhǔn)確。近年來(lái),大數(shù)據(jù)驅(qū)動(dòng)下的人工智能,機(jī)器學(xué)習(xí)技術(shù)獲得了長(zhǎng)足的進(jìn)步,在無(wú)線通信、模型預(yù)測(cè)等領(lǐng)域取得了非常成功的運(yùn)用。機(jī)器學(xué)習(xí)算法可以合理地規(guī)劃特定地理位置的基站,使其對(duì)覆蓋小區(qū)通信中產(chǎn)生的大量數(shù)據(jù)進(jìn)行自動(dòng)學(xué)習(xí),建立該小區(qū)的無(wú)線傳播模型,以預(yù)測(cè)該小區(qū)的通信指標(biāo),輔助該小區(qū)5G基站部署方案的設(shè)計(jì)。

        本文采用機(jī)器學(xué)習(xí)的相關(guān)方法來(lái)構(gòu)建5G無(wú)線智能傳播模型。首先,參照模型Cost231-Hata[3],從已知的參數(shù)中選取出傳播路徑損耗最小的特征;接著通過(guò)Pearson系數(shù)來(lái)分析這些特征與參考信號(hào)接收功率RSRP(Reference Signal Receiving Power)的相關(guān)性,從中選取出相關(guān)性最高的前十個(gè)特征;最終將這些特征分別送入到?jīng)Q策樹(shù)、隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò),這三個(gè)模型中進(jìn)行訓(xùn)練。實(shí)驗(yàn)中,本文以4 000個(gè)小區(qū)的5G網(wǎng)絡(luò)傳播參數(shù)作為樣本,對(duì)三種模型進(jìn)行參數(shù)上和結(jié)構(gòu)上的微調(diào)來(lái)提高模型的預(yù)測(cè)性能,結(jié)合Root mean squared error(RMSE)對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)估,最終在RMSE的結(jié)果中選取出了最佳的訓(xùn)練參數(shù)和結(jié)構(gòu)。實(shí)驗(yàn)結(jié)果表明,采用隨機(jī)森林模型的預(yù)測(cè)結(jié)果的準(zhǔn)確率高于其他模型,有利于減少網(wǎng)絡(luò)的建設(shè)成本,提高了基站的建設(shè)效率。

        1 研究現(xiàn)狀

        一個(gè)優(yōu)秀的無(wú)線傳播模型要能夠適應(yīng)不同的特征地貌輪廓,如平原、丘陵、山谷等,或者是不同的人造環(huán)境,例如開(kāi)闊地、郊區(qū)、市區(qū)等。這些環(huán)境因素涉及了傳播模型中的很多變量,它們對(duì)無(wú)線信號(hào)的傳播有著重要影響。因此,一個(gè)性能良好的移動(dòng)無(wú)線傳播模型需要不斷修正和改進(jìn)才能形成。為了完善模型,需要利用統(tǒng)計(jì)方法,在測(cè)量出大量的數(shù)據(jù)基礎(chǔ)上,對(duì)模型進(jìn)行校正。一個(gè)好的模型應(yīng)該簡(jiǎn)單易用、結(jié)構(gòu)清晰,不應(yīng)該讓用戶進(jìn)行主觀判斷和解釋,因?yàn)橹饔^判斷和解釋往往在同一區(qū)域會(huì)得出不同的預(yù)期值。同時(shí),模型應(yīng)具有好的公認(rèn)度和可接受性。目前主要的無(wú)線傳播模型分為經(jīng)驗(yàn)?zāi)P?、物理理論模型、改進(jìn)模型,當(dāng)然,這種通用傳播模型的分類思想也適用于當(dāng)前5G傳播模型。

        就經(jīng)驗(yàn)?zāi)P投?,Okumura-Hata和Cost-23-Hata是兩個(gè)比較典型的模型,文獻(xiàn)[4]對(duì)比了Okumura-Hata與Cost-231-Hata之間的差異。Cost231-Hata適用于1.5 G到2 G的信號(hào),小區(qū)半徑大于1 km的蜂窩系統(tǒng),有效天線高度在30到200 m之間,接收天線在1到10 m之間,它可以作為5G通信模型的參考,但是因?yàn)閭鬏敳ǘ芜h(yuǎn)低于5G模型,所需模型中的經(jīng)驗(yàn)參數(shù)不適用于新的5G網(wǎng)絡(luò)群。Okumura-Hata[5]模型適用頻率范圍150~1 920 MHz,距離1到100 km,天線高度30到1 000 m。此模型信號(hào)頻率的更低,但是模型構(gòu)建思想值得借鑒。

        物理理論模型根據(jù)電磁波傳播理論,考慮了電磁波在空間中的反射、折射等計(jì)算損耗,如Volcano模型[9]。但是這種物理模型只適用于干擾因素少、范圍比較小的理想環(huán)境,不太適用于現(xiàn)實(shí)中復(fù)雜多變的無(wú)線通信環(huán)境。

        針對(duì)改進(jìn)模型,文獻(xiàn)[6]提出了一種適用于28 GHz和38 GHz毫米波頻段蜂窩規(guī)劃的新的路徑損耗模型,該模型來(lái)源于對(duì)無(wú)線覆蓋商業(yè)規(guī)劃工具中使用的現(xiàn)有路徑損耗模型的修正。文獻(xiàn)[7]提出了針對(duì)特定城市的5G移動(dòng)通信的路徑損耗模型,為其他地區(qū)模型及通用模型的建立提供了參考。另外Standard Propagation Model[8]也是一種應(yīng)用廣泛的模型,它從Hata公式演化而來(lái)的,適合頻率在150~3 500 MHz,傳輸距離在1~20 km場(chǎng)景。同時(shí),該模型在擬合公式中引入更多的參數(shù),從而可以適應(yīng)更細(xì)的分類場(chǎng)景。

        2 特征設(shè)計(jì)

        對(duì)于移動(dòng)通信系統(tǒng)中的信號(hào)傳輸,很難建立一個(gè)完全與實(shí)際情況吻合的理論模型。由于環(huán)境的繁雜多樣,導(dǎo)致信號(hào)傳播呈現(xiàn)出多樣化的形式。目前已知的電磁理論,很難直接應(yīng)用于較大計(jì)算量的無(wú)線網(wǎng)絡(luò)傳播模型的體系之中,往往只能預(yù)測(cè)微蜂窩以及微微蜂窩模型。通常情況下需要專家結(jié)合各個(gè)地區(qū)的實(shí)測(cè)數(shù)據(jù),通過(guò)分析和計(jì)算然后對(duì)傳播模型的參數(shù)進(jìn)行校正,進(jìn)而提高預(yù)測(cè)模型的準(zhǔn)確率。而由于傳播模型的結(jié)構(gòu)和參數(shù)的復(fù)雜性,使得直接進(jìn)行優(yōu)化變得比較困難,通常采用了提取傳播模型特征的方式,利用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)最優(yōu)設(shè)定。

        數(shù)據(jù)及對(duì)應(yīng)的特征表達(dá)是機(jī)器學(xué)習(xí)的目標(biāo),而模型和算法正是為了達(dá)到這一目標(biāo),所以特征選擇是首要步驟。在移動(dòng)通信系統(tǒng)的傳播模型中,原始數(shù)據(jù)集特征包括小區(qū)發(fā)射機(jī)相對(duì)地面的高度、小區(qū)發(fā)射機(jī)水平方向角、小區(qū)發(fā)射機(jī)中心頻率、柵格點(diǎn)位置到基站的水平距離等二十余項(xiàng)特征指標(biāo)。本文需要從原始特征集合中抽取對(duì)預(yù)測(cè)結(jié)果最有效的特征集合,簡(jiǎn)化算法模型,加快計(jì)算的速度,實(shí)現(xiàn)網(wǎng)絡(luò)優(yōu)化和維護(hù)的靈活性。

        2.1 數(shù)據(jù)編碼

        在移動(dòng)通信系統(tǒng)的通信過(guò)程中會(huì)產(chǎn)生大量的傳輸數(shù)據(jù),對(duì)海量數(shù)據(jù)的分析增加了計(jì)算和存儲(chǔ)的復(fù)雜度,數(shù)據(jù)壓縮是進(jìn)行數(shù)據(jù)分析前的一個(gè)重要的預(yù)處理步驟,能有效去除特征變量集的信息冗余。通常特征包含連續(xù)型特征和離散特征。

        (1) 連續(xù)型特征。對(duì)于連續(xù)型特征,用z-score標(biāo)準(zhǔn)化的方法,消除每個(gè)特征向量的均值冗余,使方差范圍在[0,1],使得各個(gè)參數(shù)的取值在一個(gè)相對(duì)穩(wěn)定的范圍。通過(guò)標(biāo)準(zhǔn)化,可以在不損失該特征的波動(dòng)特性的前提下消除冗余,減少算法學(xué)習(xí)過(guò)程中的計(jì)算量,同時(shí)提高收斂速度,從而增強(qiáng)機(jī)器學(xué)習(xí)模型訓(xùn)練的效率。

        (2) 離散型特征。本文中的數(shù)據(jù)是無(wú)序的離散變量,將其直接送入到模型中是不可取的。而One-hot編碼[9]可以將類別特征轉(zhuǎn)化為二進(jìn)制向量來(lái)表示,首先將類別映射到整數(shù)值,每個(gè)整數(shù)值被表示為二進(jìn)制向量,除了整數(shù)索引被標(biāo)記為1外,其他都為0。

        2.2 特征冗余約減

        特征約減是將特征參數(shù)集合中相互之間存在冗余的特征參數(shù)重新組合,構(gòu)造新的特征參數(shù)。在特征設(shè)計(jì)之前,通常需要先理解所提供的數(shù)據(jù)變量,再對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和適當(dāng)?shù)淖儞Q,從中挖掘出所需要的信息。這里,Cost 231-Hata模型對(duì)變量的定義如下:

        PL=46.3+33.9log10f-13.82log10hb-α+

        (44.9-6.55log10hb)log10d+Cm

        (1)

        其中:

        式中:PL定義為傳播路徑損耗(單位:dB);f為載波頻率(單位:MHz);hb為基站天線有效高度(單位:m);hue為用戶天線有效高度(單位:m)、α為用戶天線高度糾正項(xiàng)(單位:dB);d為鏈路距離(單位:km);Cm為場(chǎng)景糾正常數(shù)(單位:dB)。

        以Cost 231-Hata模型為例,從特征工程的角度分析,數(shù)據(jù)集的特征參數(shù)包括三種類型:

        (1) 與Cost 231-Hata傳播模型參數(shù)定義一致的,如f、hb。

        (2) Cost 231-Hata傳播模型中含有的特征參數(shù),但是,不是直接在數(shù)據(jù)集中定義的特征參數(shù),而是需要通過(guò)對(duì)多個(gè)數(shù)據(jù)集中原始的特征參數(shù)進(jìn)行計(jì)算而得。比如:

        (2)

        式中:d在Cost 231-Hata是指鏈路距離,理論上是一個(gè)三維空間直線距離。但是因?yàn)閷?shí)際工程應(yīng)用中,數(shù)據(jù)集是5G基站在開(kāi)闊的室外無(wú)穿墻的情況下采集的,所以小區(qū)覆蓋半徑在1.5 km左右,而發(fā)射點(diǎn)和接收點(diǎn)的高度差基本不會(huì)影響最終的鏈路距離,所以直接用二維距離代替三維距離。把垂直特征作為一個(gè)單獨(dú)的特征,并在下面的相關(guān)性分析中發(fā)現(xiàn)它與預(yù)測(cè)結(jié)果RSRP相關(guān)性較大。

        (3) Cost 231-Hata模型中沒(méi)有,但是數(shù)據(jù)集中含有的類型信息,如地形類型信息。

        第一類特征參數(shù)可以直接利用;第二類特征參數(shù)可數(shù)據(jù)預(yù)處理提取出有效參數(shù);第三類特征參數(shù)需根據(jù)這些特征是否發(fā)散以及特征與目標(biāo)的相關(guān)性進(jìn)行合理篩選。

        2.3 特征參數(shù)選擇

        完成降維之后,我們需要從特征參數(shù)中篩選出對(duì)預(yù)測(cè)結(jié)果影響大的特征參數(shù),作為下一步訓(xùn)練機(jī)器學(xué)習(xí)模型的精簡(jiǎn)有效的輸入?yún)?shù)。通常來(lái)說(shuō),可以從以下兩個(gè)篩選指標(biāo)來(lái)判斷這個(gè)特征參數(shù)是否合適。

        (1) 特征參數(shù)自身發(fā)散性。如果一個(gè)特征參數(shù)不發(fā)散,例如方差接近于0,也就是說(shuō)樣本在這個(gè)特征參數(shù)上基本上沒(méi)有差異,這個(gè)特征參數(shù)對(duì)于樣本的區(qū)分作用較小。特征參數(shù)自身的微小波動(dòng)是具有正態(tài)分布特征的隨機(jī)性引起的,因此對(duì)于預(yù)測(cè)目標(biāo)而言是一種噪聲,與預(yù)測(cè)目標(biāo)無(wú)關(guān)。由于各個(gè)小區(qū)是分散地分布在實(shí)際地理環(huán)境中的,因此接收點(diǎn)的位置具有發(fā)散性。表1展示了單個(gè)基站覆蓋區(qū)域中,接收站點(diǎn)位置特征。可以看出接收點(diǎn)的水平坐標(biāo)(X,Y)具有發(fā)散性,而海拔和接收物高度的發(fā)散性則明顯低于水平坐標(biāo)的發(fā)散性。

        表1 接收站點(diǎn)特征的發(fā)散性分析

        (2) 特征與目標(biāo)的相關(guān)性。通常,與目標(biāo)相關(guān)性高的特征,應(yīng)當(dāng)優(yōu)先選擇。本文通過(guò)評(píng)估單個(gè)特征與預(yù)測(cè)結(jié)果之間的相關(guān)程度,排序后留下排在前10位的特征子集作為優(yōu)選特征。雖然這個(gè)方法只評(píng)估了單個(gè)特征對(duì)結(jié)果的影響,沒(méi)有考慮特征之間的相互關(guān)聯(lián),但由于預(yù)處理階段已經(jīng)消除特征集合之間的相關(guān)性,所以可以完全規(guī)避單一特征相關(guān)系數(shù)篩選方法的弊端。采用這種方式的原因在于,數(shù)據(jù)的特征本身已經(jīng)相互獨(dú)立,而且沒(méi)有時(shí)間上的因果關(guān)聯(lián),具備良好的獨(dú)立條件。

        3 傳播模型的構(gòu)建

        本文針對(duì)5G無(wú)線網(wǎng)絡(luò)傳播模型的構(gòu)建,通過(guò)特征參數(shù)分析和選擇,構(gòu)造出新的特征參數(shù),再將這些特征參數(shù)送入到基于決策樹(shù)、隨機(jī)森林以及BP神經(jīng)網(wǎng)絡(luò)交替優(yōu)化模型中來(lái)建立無(wú)線傳播模型,并且能夠預(yù)測(cè)出新環(huán)境下無(wú)線信號(hào)覆蓋的強(qiáng)度。

        3.1 決策樹(shù)

        解決分類與回歸問(wèn)題經(jīng)典的模型便是決策樹(shù)模型,此模型有很多經(jīng)典的算法,例如ID3算法、C4.5算法、CART算法和CART剪枝算法[10-11],本實(shí)驗(yàn)中采用的是CART算法,此算法既可以用于分類,也可以用于回歸。CART算法由決策樹(shù)生成和決策樹(shù)剪枝兩個(gè)步驟組成。在決策樹(shù)生成步驟中,使用訓(xùn)練數(shù)據(jù)生成盡可能大的決策樹(shù);在決策樹(shù)剪枝步驟中,使用驗(yàn)證數(shù)據(jù)對(duì)已生成的決策樹(shù)剪枝并選擇最優(yōu)的子樹(shù)。具體的決策樹(shù)生成算法如下:

        輸入:訓(xùn)練數(shù)據(jù)集D,特征集合A,模型停止條件E;

        輸出:決策樹(shù)T。

        使用訓(xùn)練數(shù)據(jù)集,從根節(jié)點(diǎn)開(kāi)始,遞歸地對(duì)每個(gè)節(jié)點(diǎn)進(jìn)行如下操作,構(gòu)建二叉決策樹(shù):

        (1) 使用訓(xùn)練數(shù)據(jù)集D,對(duì)每一個(gè)特征Ai和該特征的每一個(gè)取值aij,將訓(xùn)練數(shù)據(jù)集劃分為D1和D2兩部分,計(jì)算特征Ai在aij處的基尼指數(shù)。

        (2) 針對(duì)所有可能的特征Ai和該特征所有可能的切分點(diǎn)aij,選擇基尼指數(shù)最小的特征及其對(duì)應(yīng)的切分點(diǎn)作為最優(yōu)特征和最優(yōu)切分點(diǎn)。從該最優(yōu)切分點(diǎn)生成兩個(gè)子節(jié)點(diǎn),將劃分?jǐn)?shù)據(jù)集D1和D2分別分配到兩個(gè)子節(jié)點(diǎn)。

        (3) 對(duì)兩個(gè)子節(jié)點(diǎn)遞歸地調(diào)用步驟(1)和(2),直到滿足停止條件,停止條件是節(jié)點(diǎn)中樣本個(gè)數(shù)小于預(yù)定閾值,或樣本集基尼指數(shù)小于預(yù)定閾值,或者無(wú)可用特征。

        (4) 生成CART決策樹(shù)。

        3.2 隨機(jī)森林

        在特征選擇的過(guò)程中,隨機(jī)森林是通過(guò)特征對(duì)模型的貢獻(xiàn)率進(jìn)行特征的重要性評(píng)分[12],對(duì)于評(píng)分高的特征,其貢獻(xiàn)率就大,將這些因素納入最后的機(jī)器學(xué)習(xí)模型中,進(jìn)一步進(jìn)行回歸預(yù)測(cè),其具體算法流程如下:

        (1) 原始訓(xùn)練集為N,應(yīng)用bootstrap方法,有放回地隨機(jī)抽取k個(gè)新的樣本集,并由此構(gòu)建k棵分類樹(shù),每次未被抽到的樣本組成了k個(gè)候選數(shù)據(jù)。

        (2) 設(shè)有mall個(gè)變量,則在每一棵樹(shù)的每個(gè)節(jié)點(diǎn)處隨機(jī)抽取mtry個(gè)變量(mtry

        (3) 每棵樹(shù)最大限度地生長(zhǎng),不做任何修剪。

        (4) 將生成的多棵分類樹(shù)組成隨機(jī)森林,用隨機(jī)森林分類器對(duì)新的數(shù)據(jù)進(jìn)行判別與分類,分類結(jié)果按樹(shù)分類器的投票多少而定。

        3.3 BP神經(jīng)網(wǎng)絡(luò)

        BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法[13]是目前為止最為成功的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法之一,其原理可以概括為“模型+誤差修正函數(shù)”,每次只需要對(duì)訓(xùn)練得到的結(jié)果與實(shí)際值進(jìn)行誤差分析,進(jìn)而修改權(quán)值和閾值,通過(guò)重復(fù)迭代來(lái)輸出和預(yù)想結(jié)果一致的模型。在本文中將已有的RSRP值作為實(shí)際的標(biāo)簽值,并將已選取的特征送入模型中,使用均方根誤差作為損失函數(shù),并用Adam優(yōu)化器來(lái)修正網(wǎng)絡(luò)參數(shù)使其達(dá)到理想的效果。

        4 實(shí)驗(yàn)與分析

        實(shí)驗(yàn)在分析各區(qū)域的數(shù)據(jù)集選取特征時(shí),將弱覆蓋率的準(zhǔn)確率也納入其中,因?yàn)槿醺采w率可直接幫助運(yùn)營(yíng)商精準(zhǔn)規(guī)劃區(qū)域,還能提升用戶的體驗(yàn)感。因此,將弱覆蓋率、非弱覆蓋率的均值以及標(biāo)準(zhǔn)差作為模型訓(xùn)練的評(píng)價(jià)指標(biāo)。這里采用Pearson系數(shù)作為評(píng)價(jià)方法來(lái)計(jì)算各特征的相關(guān)系數(shù),其計(jì)算公式如下:

        (3)

        經(jīng)過(guò)Pearson系數(shù)的檢驗(yàn)后,得出的各特征與目標(biāo)的相關(guān)性系數(shù)如表2所示。其中,發(fā)現(xiàn)柵格點(diǎn)位置到基站的水平距離和柵格點(diǎn)到基站的直線距離對(duì)RSRP的影響最大,表明高相關(guān)的特征對(duì)傳播模型的構(gòu)建起著較大作用。

        表2 特征與目標(biāo)的相關(guān)系數(shù)

        4.1 特征選擇結(jié)果分析

        為了研究特征對(duì)非弱覆蓋和弱覆蓋區(qū)域的影響,這里選取d(柵格點(diǎn)位置到基站的水平距離)、distance_2(柵格點(diǎn)位置到基站的直線距離)、Height(小區(qū)發(fā)射機(jī)相對(duì)地面的高度)、Azimutj(小區(qū)發(fā)射機(jī)水平方向角)、PL(傳播路徑損耗)五個(gè)特征,分析它們?cè)诜侨醺采w和弱覆蓋區(qū)域的分布密度。

        圖1展示的是Azimutj特征的分布密度。可以看出,弱覆蓋區(qū)主要集中在值150~350之間,并且分布的密度很大,與之相對(duì)應(yīng)的是非弱覆蓋區(qū)的分布密度較小,覆蓋區(qū)間較大,橫跨0~350之間。

        結(jié)合信號(hào)發(fā)射機(jī)相對(duì)地面的高度hb、機(jī)械下傾角θMD、垂直電下傾角θED以及信號(hào)發(fā)射機(jī)自身所在的柵格位置和目標(biāo)柵格位置所形成的三角形的斜邊長(zhǎng)度和發(fā)射機(jī)的高度,可以得到柵格與發(fā)射機(jī)的高度以及柵格與信號(hào)線的相對(duì)高度Δhv,由此可以得到特征distance在非弱覆蓋和弱覆蓋的分布密度。如圖2所示,特征distance_2與distance_3的非弱覆蓋和弱覆蓋的差異,其中distance_3是在特征distance_2的基礎(chǔ)上加入了機(jī)械下傾角θMD、垂直電下傾角θED的計(jì)算而得到。可以看出特征distance_2的非弱覆蓋和弱覆蓋的分布密度基本一致,說(shuō)明該特征對(duì)區(qū)域模型影響較大,而distance_3的分布則不一致,因此影響較小。

        (a) 特征distance_2 (b) 特征distance_3圖2 distance特征對(duì)非弱覆蓋和弱覆蓋分布的影響

        接著對(duì)發(fā)射機(jī)高度和柵格與發(fā)射機(jī)的距離在弱覆蓋區(qū)和覆蓋區(qū)兩類情況下的分布進(jìn)行分析,結(jié)果可如圖3所示,發(fā)射機(jī)高度和柵格與發(fā)射機(jī)的距離對(duì)非弱覆蓋和弱覆蓋分布的影響。從圖可知,弱覆蓋區(qū)發(fā)射機(jī)到柵格的距離的密度值較大,而非弱覆蓋區(qū)的密度相對(duì)較小,從發(fā)射機(jī)高度的連續(xù)分布圖來(lái)說(shuō),弱覆蓋區(qū)的發(fā)射機(jī)高度在20 m左右的較多,而非弱覆蓋區(qū)的發(fā)射機(jī)高度分布相對(duì)較均勻。因此可以得出柵格與發(fā)射機(jī)的距離這一特征對(duì)模型構(gòu)建的影響較大。

        (a) 發(fā)射機(jī)高度 (b) 柵格與發(fā)射機(jī)的距離圖3 發(fā)射機(jī)高度和柵格與發(fā)射機(jī)的距離對(duì)非弱覆蓋和弱覆蓋分布的影響

        為了研究傳播過(guò)程特征參數(shù)對(duì)模型構(gòu)建的影響,結(jié)合經(jīng)驗(yàn)信道模型Cost 231-Hata,計(jì)算傳播路徑損耗。

        從圖4可以看出,PL的值在弱覆蓋區(qū)時(shí),主要集中在100~200之間,與之對(duì)應(yīng)的是非弱覆蓋區(qū)主要集中分布在80~200之間,可以明顯看到這個(gè)特征的差異性不大。

        圖4 信號(hào)傳播路徑損耗對(duì)非弱覆蓋和弱覆蓋分布的影響

        通過(guò)對(duì)以上幾個(gè)特征的分析表明,經(jīng)過(guò)Pearson系數(shù)進(jìn)行相關(guān)性計(jì)算后,相關(guān)系數(shù)值最大的10個(gè)特征,能較好地表示5G傳播模型特征參數(shù)性能,能有效地度量弱覆蓋區(qū)和非弱覆蓋區(qū)的;而在選取的最大相關(guān)系數(shù)的10個(gè)特征之外的特征,其差異性較小,不作為5G傳播模型的主要度量特征。

        4.2 RSRP預(yù)測(cè)模型的測(cè)試結(jié)果分析

        實(shí)驗(yàn)從4 000個(gè)小區(qū)中獲取移動(dòng)通信系統(tǒng)中的特征數(shù)據(jù),選取排名前10的特征送入到模型中進(jìn)行訓(xùn)練,采用五折交叉驗(yàn)證對(duì)數(shù)據(jù)多次劃分,訓(xùn)練集和測(cè)試集的比例為4 ∶1,這樣能極大提升模型的泛化能力。隨機(jī)森林的隨機(jī)種子設(shè)置為2 018,BP網(wǎng)絡(luò)中使用Kears框架,其網(wǎng)絡(luò)層數(shù)分別設(shè)置為256、128、64、12、1,學(xué)習(xí)率設(shè)置為0.001,優(yōu)化器選擇Adam,而batch_size設(shè)置為4 000,epoch設(shè)置為100其具體參數(shù)可見(jiàn)表3。

        表3 BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)

        為了詳細(xì)分析決策樹(shù)、隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)在5G無(wú)線網(wǎng)絡(luò)傳播模型中,特征參數(shù)的定量化影響,這里引入MAE、RMS和PCRR三個(gè)指標(biāo)連進(jìn)行度量。

        (1) 平均絕對(duì)值誤差(Mean Absolute Deviation,MAE)是預(yù)測(cè)值和觀測(cè)值之間絕對(duì)誤差的平均值。平均絕對(duì)值誤差可以避免誤差相互抵消的問(wèn)題,因而可以準(zhǔn)確反映實(shí)際預(yù)測(cè)誤差的大小,公式如下:

        (4)

        (2) 均方根誤差(Root Mean Squared Error,RMSE)。RMSE是評(píng)估預(yù)測(cè)值和實(shí)測(cè)值整體偏差的指標(biāo),其大小表明了測(cè)試的準(zhǔn)確性。RMSE的計(jì)算公式如下:

        (5)

        (3) 弱覆蓋識(shí)別率(Poor Coverage Recognition Rate,PCRR)。為更好地幫助運(yùn)營(yíng)商精準(zhǔn)規(guī)劃和優(yōu)化網(wǎng)絡(luò)從而提升客戶體驗(yàn),實(shí)驗(yàn)中,弱覆蓋判決門限Pth的值設(shè)定為-103 dBm。若RSRP預(yù)測(cè)值或?qū)嶋H值小于Pth則為弱覆蓋,標(biāo)記為1;若大于等于Pth則為非弱覆蓋,標(biāo)記為0。根據(jù)比較預(yù)測(cè)值和實(shí)際值得到的弱覆蓋以及非弱覆蓋的差別,這里采用ROC指標(biāo)進(jìn)行分析:

        True Positive(TP):真實(shí)值為弱覆蓋,預(yù)測(cè)值也為弱覆蓋;

        False Positive(FP):真實(shí)值為非弱覆蓋,預(yù)測(cè)值為非弱覆蓋;

        False Negative(FN):真實(shí)值為弱覆蓋,預(yù)測(cè)值為非弱覆蓋;

        True Negative(TN):真實(shí)值為非弱覆蓋,預(yù)測(cè)值也為非弱覆蓋。

        PCRR的計(jì)算公式定義為:

        (6)

        式中:Precision可以理解為預(yù)測(cè)結(jié)果為弱覆蓋的柵格,實(shí)際也是弱覆蓋的概率,定義為:

        (7)

        Recall表示真實(shí)結(jié)果為弱覆蓋的柵格有多少被預(yù)測(cè)成了弱覆蓋的概率,其定義為:

        (8)

        最終,通過(guò)對(duì)決策樹(shù)、隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)的測(cè)試、得出結(jié)果,對(duì)于5G無(wú)線網(wǎng)絡(luò)信號(hào)傳播中的均方根誤差和弱覆蓋識(shí)別率如圖5(a)所示??梢钥闯鲭S機(jī)森林的預(yù)測(cè)效果優(yōu)于決策樹(shù)和BP神經(jīng)網(wǎng)絡(luò),其PCRR值最大(0.894),而RMSE最小(4.31)(PCRR越大表明弱覆蓋識(shí)別率的精度越高;RMSE越小表示識(shí)別誤差越低)。在實(shí)驗(yàn)中,BP神經(jīng)網(wǎng)絡(luò)雖然經(jīng)過(guò)一些列的改進(jìn)使得訓(xùn)練的結(jié)果并未出現(xiàn)過(guò)擬合的情況,但是得到的結(jié)果較差。為了進(jìn)一步對(duì)表2篩選出的前10個(gè)特征,與其他特征在無(wú)線信號(hào)覆蓋的差異,我們從其余特征中每次抽取3個(gè)替換掉篩選出的10個(gè)特征的任意三個(gè),進(jìn)行對(duì)比測(cè)試。根據(jù)表2所示,用特征Altitude(序號(hào)20)、Clutter_index2(序號(hào)21)、P(序號(hào)22)L替換掉Clutter_index10(序號(hào)8)、Clutter_index7(序號(hào)9)、Clutter_index9(序號(hào)10),如圖5(b)所示??梢钥闯觯N方法得到PCRR都有不同程度的下降,而RMSE值都有所增加。同樣,用序號(hào)17、18、19替換序號(hào)6、7、8特征(如圖5(c)所示),用序號(hào)14、15、16替換序號(hào)序號(hào)3、4、5特征(如圖5(d)所示),PCRR都出現(xiàn)下降,RMSE值都有上升。而且排序越靠前的特征,多模型的影響越大,所以圖5(d)的模型預(yù)測(cè)效果最差。因此可以得出采用隨機(jī)森林方式對(duì)5G無(wú)線傳播模型的信號(hào)預(yù)測(cè)具有更好的效果。

        (a) 算法利用篩選出的10個(gè)特征的預(yù)測(cè)效果

        (b) 用序號(hào)22、21、20特征替換8、9、10特征后的預(yù)測(cè)效果

        (c) 用序號(hào)17、18、19特征替換6、7、8特征后的預(yù)測(cè)效果

        (d) 用序號(hào)14、15、16特征替換3、4、5特征后的預(yù)測(cè)效果圖5 決策樹(shù)、隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)對(duì)5G無(wú)線網(wǎng)絡(luò)信號(hào) 傳播預(yù)測(cè)效果

        5 結(jié) 語(yǔ)

        5G網(wǎng)絡(luò)的部署,需要充分考慮各種因素來(lái)選擇基站地址,而網(wǎng)絡(luò)規(guī)劃的流程中,高效的網(wǎng)絡(luò)估算可以使得5G網(wǎng)絡(luò)部署事半功倍。本文中對(duì)比傳統(tǒng)的Cost 231-Hata模型來(lái)選取特征,使用Pearson系數(shù)量化特征與目標(biāo)值之間的相關(guān)性,并以此構(gòu)造出新的特征,再將這些特征送入到機(jī)器學(xué)習(xí)的模型中來(lái)建立無(wú)線傳播模型,并且能夠預(yù)測(cè)新環(huán)境下無(wú)線信號(hào)覆蓋的強(qiáng)度,使得網(wǎng)絡(luò)建設(shè)成本大大減少的同時(shí),還提高了建設(shè)效率。未來(lái)還需要考慮的是:面對(duì)實(shí)時(shí)更新的數(shù)據(jù),構(gòu)造出的模型是否也能取得理想的成績(jī),以及是否還能在此基礎(chǔ)上構(gòu)造出更多有利的特征來(lái)改善模型的精確度。

        猜你喜歡
        特征參數(shù)柵格決策樹(shù)
        基于鄰域柵格篩選的點(diǎn)云邊緣點(diǎn)提取方法*
        故障診斷中信號(hào)特征參數(shù)擇取方法
        基于特征參數(shù)化的木工CAD/CAM系統(tǒng)
        一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
        決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        基于PSO-VMD的齒輪特征參數(shù)提取方法研究
        基于決策樹(shù)的出租車乘客出行目的識(shí)別
        統(tǒng)計(jì)特征參數(shù)及多分類SVM的局部放電類型識(shí)別
        不同剖面形狀的柵格壁對(duì)柵格翼氣動(dòng)特性的影響
        基于肺癌CT的決策樹(shù)模型在肺癌診斷中的應(yīng)用
        日韩毛片无码永久免费看| 美女狂喷白浆网站视频在线观看| 全部亚洲国产一区二区| 国产自国产自愉自愉免费24区| 免费看黄色电影| 国产免费资源| 精品蜜桃一区二区三区| 美女扒开内裤让我捅的视频| 欧美69久成人做爰视频| 国产色诱视频在线观看| 亚洲欧美日韩高清一区二区三区 | 国产午夜亚洲精品一级在线| 青青草手机在线免费视频| 一 级做人爱全视频在线看| 99re热视频这里只精品| 欧美亚洲国产人妖系列视| 国产激情免费观看视频| 亚洲一区二区三区内裤视| 国产97在线 | 中文| 亚洲国产99精品国自产拍| 日韩精品成人一区二区三区| 国产精品毛片无遮挡高清| 国产综合无码一区二区色蜜蜜 | 亚洲综合久久1区2区3区| 亚洲熟女熟妇另类中文| 亚洲无线一二三四区手机| 国产精品福利自产拍久久| 狠狠色丁香婷婷久久综合2021| 人妻中文久久人妻蜜桃| 把女的下面扒开添视频| 亚洲精品国产综合一线久久| 中文字幕一区二区三区97| 一区二区三区视频在线观看| 亚洲av无码一区二区乱孑伦as| 日本亚洲欧美在线观看| 亚洲一区二区三区新视频| 亚洲国产av无码精品无广告| 亚洲av无码1区2区久久| 欧美成人a视频免费专区| 精品三级国产一区二区三| 美女av一区二区三区|