鄭娟毅,崔 卓,蘇海龍,殷帥帥,劉遙遙
(西安郵電大學通信與信息工程學院,西安710121)
2019年為5G 元年,很多通信企業(yè)為推動5G 在國內與海外的部署而努力[1]。在5G 網(wǎng)絡的部署過程中,需要合理地選定基站部署位置以滿足客戶的通信需求,而無線信道評估對網(wǎng)絡部署和鏈路預算尤其重要。目前,研究者對于無線信道測量主要分大尺度[2]和小尺度[3]兩種特性進行研究。前者考慮無線電波的路徑傳播損耗,后者研究信號在傳輸過程中時域、頻域和空域的參數(shù)變化以及基帶調制等問題。本文從大尺度特性這一角度展開研究。
5G 網(wǎng)絡可使人們能夠以極低的延遲和極高的數(shù)據(jù)傳輸速率在大范圍的場景中訪問和共享信息[4]。然而,5G 移動通信系統(tǒng)的網(wǎng)絡規(guī)劃面臨嚴峻挑戰(zhàn),需要更高效、精準的無線信道傳播損耗預測模型。傳統(tǒng)的信道傳播損耗預測模型分為經(jīng)驗模型、確定性模型[5]和隨機模型[6]。經(jīng)驗模型基于廣泛的測量數(shù)據(jù)得到,其通過函數(shù)來描述傳播環(huán)境的主要特征,經(jīng)典經(jīng)驗模型有Okumura、SPM 和Hata[7]。經(jīng)驗模型所需特征少,當環(huán)境發(fā)生變化時,需要進行參數(shù)的重新擬合,否則其準確度可能很差[8]。確定性模型需要通過大量的計算和數(shù)據(jù)校準來保證精確度[9],這會導致計算復雜度較高,并使模型過分依賴傳播場景的精準信息。隨機模型利用一定的概率分布來描述信道參數(shù),以相對較低的精度來適應各種場景。5G 通信系統(tǒng)中的各種技術[10]與傳統(tǒng)通信系統(tǒng)相比具有明顯不同的傳播特性,如大規(guī)模MIMO 通信、V2V 通信、HST 通信、mmWave 通信等[11]。5G 信道建模具有需要考慮的頻率范圍寬、帶寬大、天線數(shù)量多、場景多樣、測量數(shù)據(jù)量巨大等特性,而對測量數(shù)據(jù)進行處理是一個十分耗時的過程,并且需要很強的計算能力[12]。
近年來,大數(shù)據(jù)研究取得了較多成果。文獻[13]提出利用大數(shù)據(jù)理論來構建信道傳播模型的思路具有合理性,文獻[14]則利用少量實測數(shù)據(jù)證明了基于人工神經(jīng)網(wǎng)絡、支持向量機、隨機森林等機器學習的路徑損耗預測模型均優(yōu)于傳統(tǒng)的log-distance 模型。機器學習,特別是監(jiān)督學習方法,可以模擬隱藏的非線性關系,能夠很好地權衡模型的準確性與復雜性之間的關系。文獻[15-16]證實了基于機器學習的模型比經(jīng)驗模型更準確,比確定性模型計算效率更高。
神經(jīng)網(wǎng)絡具有并行處理、自適應性、自學習性、魯棒性等優(yōu)點,常被用于解決非線性系統(tǒng)問題。Elman 神經(jīng)網(wǎng)絡與神經(jīng)網(wǎng)絡不同之處在于其具有局部記憶功能,但也不可避免地繼承了神經(jīng)網(wǎng)絡的一些不足[17],例如容易陷入局部極小解甚至訓練失敗和隱藏神經(jīng)元數(shù)量需要反復試錯確定等。針對這些問題,研究者對Elman的連接權值閾值和網(wǎng)絡結構單獨進行優(yōu)化,在改善網(wǎng)絡性能方面取得了較好的效果。
本文提出一種通過遺傳算法(Genetic Algorithm,GA)改進Elman 網(wǎng)絡模型的無線智能傳播損耗預測方法。利用自適應遺傳算法同時對Elman 神經(jīng)網(wǎng)絡的權值、閾值和網(wǎng)絡結構進行優(yōu)化,解決Elman 神經(jīng)網(wǎng)絡連接權值、閾值和神經(jīng)元難以確定的問題,從而避免陷入局部最優(yōu),提高神經(jīng)網(wǎng)絡的預測性能。
Elman 神經(jīng)網(wǎng)絡是一種具有局部記憶功能的反饋型遞歸神經(jīng)網(wǎng)絡,其為4 層結構網(wǎng)絡,包含輸入層、隱含層、承接層和輸出層。輸入層神經(jīng)元接收外部信息,將信號傳遞給隱含層;隱含層通過激活函數(shù)對信號進行變換處理;承接層記憶隱含層前一時刻輸出值,增強網(wǎng)絡的內部反饋機制,從而使網(wǎng)絡能夠適應動態(tài)、時變的特性,并保證全局的穩(wěn)定性[18];輸出層輸出結果。Elman 網(wǎng)絡模型結構如圖1所示。
圖1 Elman 網(wǎng)絡結構Fig.1 Structure of Elman network
假設系統(tǒng)有n個輸入、m個輸出,隱含層和承接層各具有r個神經(jīng)元,w1~w3分別記作輸入層到隱含層、承接層到隱含層、隱含層到輸出層的連接權值,Elman網(wǎng)絡的非線性狀態(tài)空間描述表達式為:
其中,h(·)表示隱含層的傳遞函數(shù),通常為s 型函數(shù)[19],如式(3)所示。
輸出向量y(k)表示為式(4),其中,g表示輸出層傳遞函數(shù)。
在Elman 神經(jīng)網(wǎng)絡中使用人工神經(jīng)網(wǎng)絡算法對權值進行修正,網(wǎng)絡誤差表示表示為:
遺傳算法(GA)是一種具有高度并行性、隨機性和自適應性的全局搜索算法。研究者利用GA 較強的全局搜索能力來解決多目標優(yōu)化、最優(yōu)路線、特征選擇和神經(jīng)網(wǎng)絡算法易陷入局部最優(yōu)等問題。
遺傳算法流程如圖2所示,其主要由編碼機制、適應度函數(shù)、遺傳算子和控制參數(shù)組成。在使用遺傳算法解決問題時,首先對可能解進行個體編碼,確定初始種群,在計算適應度函數(shù)后輸出滿足終止條件的個體,算法結束,否則,系統(tǒng)將一系列遺傳操作(如選擇、交叉、突變等)應用于當前種群,形成新一代的種群。新的種群繼承了上一代的優(yōu)良特性,并優(yōu)于上一代,因此,可以逐步發(fā)展為更好的解決方案。
圖2 遺傳算法流程Fig.2 Procedure of genetic algorithm
傳統(tǒng)的Elman 神經(jīng)網(wǎng)絡模型通常使用梯度下降法對連接權值閾值進行訓練學習,容易陷入局部極小值。同時,神經(jīng)網(wǎng)絡的連接權值閾值和網(wǎng)絡結構主要依賴于網(wǎng)絡訓練者的試錯經(jīng)驗確定,并沒有理論依據(jù)支撐,這都使神經(jīng)網(wǎng)絡很難具有全局性,易導致訓練失敗或者過擬合現(xiàn)象。遺傳算法是一種自適應全局尋優(yōu)算法,具有很好的全局搜索能力[20],可用于搜索不可微、多模和大規(guī)模的問題空間而不需要關于誤差函數(shù)梯度的信息。使用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡的連接權值和閾值時,應在誤差函數(shù)中插入一個懲罰項,該懲罰項與是否可微無關,這可以降低神經(jīng)網(wǎng)絡的復雜度,提高其泛化能力,對于優(yōu)化Elman 神經(jīng)網(wǎng)絡的連接權值閾值具有很大的潛力。同時,遺傳算法還可以探索不同的優(yōu)化拓撲結構,緩解隱含神經(jīng)元數(shù)量難以確定的問題。
考慮以往單獨從權值閾值方面或者僅從網(wǎng)絡結構方面來優(yōu)化神經(jīng)網(wǎng)絡的方法和現(xiàn)實應用環(huán)境的復雜性,本文構建一個改進的GA-Elman 神經(jīng)網(wǎng)絡算法。首先利用遺傳算法對神經(jīng)網(wǎng)絡結構進行優(yōu)化,然后在確定Elman 神經(jīng)網(wǎng)絡結構的前提下,推導出其中的連接權值閾值,從而得到最優(yōu)的含有單層隱含層的Elman 神經(jīng)網(wǎng)絡。
在信道傳輸損耗預測模型的構建過程中,必然會應用到超大量的無線傳輸歷史數(shù)據(jù)。在通常情況下,Elman 神經(jīng)網(wǎng)絡都是采用單隱含層的結構。當輸入超大量數(shù)據(jù)時,為提高學習效率和收斂速度,常采用多隱含層的結構,每一層對前一層的抽象會表達得更加深入,深層的網(wǎng)絡比淺層的網(wǎng)絡具有更高的識別效率[21]。通過遺傳算法對Elman 神經(jīng)網(wǎng)絡算法的優(yōu)化,能夠得到單層最優(yōu)網(wǎng)絡。假設單層隱含層包含神經(jīng)元數(shù)量為n,則k層隱含層時設置的單層節(jié)點數(shù)為n/k,在運行速率一定的情況下,本文通過比較選取誤差最小的隱含層數(shù),構造GA-Elman 神經(jīng)網(wǎng)絡模型。
本文提出的優(yōu)化訓練過程本質是一種混合的同步訓練過程,其效果優(yōu)于單純的Elman 訓練。本文對Elman 算法的優(yōu)化,是基于結構完全優(yōu)化的同時也對連接權值閾值進行優(yōu)化。
本文使用遺傳算法同時優(yōu)化Elman 網(wǎng)絡結構和連接權值閾值,具體步驟如下:
步驟1對網(wǎng)絡結構和連接權值閾值進行編碼。
基于問題的復雜性,原有的二進制編碼明顯不合適,本文采用實數(shù)編碼,簡單直觀。假設一個有R個輸入、M個輸出和N個隱含神經(jīng)元的Elman 神經(jīng)網(wǎng)絡。該實數(shù)編碼針對給定的網(wǎng)絡結構條件。
1)對權值和閾值進行編碼,編碼長度為:
2)對網(wǎng)絡結構進行編碼,與權值閾值不同之處在于要在隱含層的神經(jīng)元基因中加入一個利用隨機函數(shù)生成的0/1 控制基因。當該控制基因的值為0時,對應的隱含層神經(jīng)元對輸出層不產(chǎn)生影響,反之,當控制基因的值為1 時,隱含神經(jīng)元會對輸出層產(chǎn)生影響。編碼長度為:
步驟2對步驟1 的編碼鏈進行解碼,得到N個不同的神經(jīng)網(wǎng)絡。
步驟3根據(jù)給定的訓練樣本預先定義學習參數(shù)。
步驟4確定是否存在滿足誤差精度要求的神經(jīng)網(wǎng)絡。如果是,轉到步驟9;否則,轉到步驟5。
步驟5計算每個個體的適應度,根據(jù)個體的適應度值對個體進行排序,選擇適應度值最高的個體直接留到下一代。適應度函數(shù)是用來評價個體優(yōu)劣程度的函數(shù),函數(shù)值越小,個體越優(yōu)秀。具體公式如下:
其中,Yi為預測值為期望值,n為樣本數(shù)目。
步驟6對當前種群進行遺傳操作,將選擇、交叉和變異操作應用于當前種群,產(chǎn)生新生代,并添加到下一代。
步驟7確定人口規(guī)模是否達到上限。如果是,轉到步驟8;否則,轉到步驟5。
步驟8確定遺傳算法的迭代次數(shù)是否達到預先設定的限制。如果是,轉到步驟9;否則,轉到步驟4。
步驟9確定最優(yōu)的初始Elman 神經(jīng)網(wǎng)絡,使用預先設定的參數(shù)繼續(xù)訓練。
步驟10如果精度滿足誤差函數(shù)的要求,或者Elman 算法的迭代次數(shù)達到預先設定的限制,則算法終止。
上述對Elman 網(wǎng)絡的優(yōu)化,意義在于設計出最優(yōu)網(wǎng)絡結構的Elman,從而提高其解決問題的能力,同時優(yōu)化連接權值和閾值,增強訓練速度等收斂性能,縮短訓練時間,提高神經(jīng)網(wǎng)絡的運行效率。
本節(jié)將GA-Elman 網(wǎng)絡應用于無線通信中,并與僅優(yōu)化連接權值閾值的GA-Elman 神經(jīng)網(wǎng)絡[22](記為GA-Elman)和標準Elman 神經(jīng)網(wǎng)絡(記為Elman)的預測結果進行對比。將本文利用遺傳算法同時優(yōu)化網(wǎng)絡結構和權值閾值的Elman 神經(jīng)網(wǎng)絡記為Improved-GA-Elman。
采用均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差比(Average Absolute Error Ratio,MAPE)、平均絕對誤差(Mean Absolute Error,MAE)和均方誤差(Mean Square Error,MSE)作為預測結果是否準確的評價標準,分別用RRMSE、MMAPE、MMAE和MMSE表示,計算公式如下:
其中,Yi為預測值,為期望值,n為樣本數(shù)目。
仿真所選用的數(shù)據(jù)來源于華為云,其中包含4 000個小區(qū)約1 200 萬條數(shù)據(jù),本次實驗從中隨機抽取600 個小區(qū),共計約196 萬條數(shù)據(jù),在每個小區(qū)中隨機抽取400 條數(shù)據(jù),共約24 萬條數(shù)據(jù)作為測試集,將其余數(shù)據(jù)作為訓練集。數(shù)據(jù)已經(jīng)經(jīng)過清洗,不包含損壞的數(shù)據(jù)。
本文首先對數(shù)據(jù)特征進行相關性分析,然后選取15 項特征,分別為自由空間的無線傳播損耗、接收點和發(fā)射點之間的水平距離、接收點和發(fā)射點之間的三維空間距離、接收點和發(fā)射點之間的相對高度、小區(qū)發(fā)射機水平方向角、小區(qū)發(fā)射機垂直電下傾角、小區(qū)發(fā)射機垂直機械下傾角、發(fā)射機中心頻率、小區(qū)發(fā)射機發(fā)射功率、發(fā)射點地物類型、接收點地物類型、阻擋物數(shù)量、最差阻擋物高度、最差阻擋物與發(fā)射點的水平距離和參考信號接收功率(Reference Signal Received Power,RSRP)。實驗通過前14 項特征對第15 項RSRP 標簽數(shù)據(jù)進行預測。
為防止因輸入各特征量級差別太大導致網(wǎng)絡的預測精度變差,對輸入數(shù)據(jù)進行歸一化處理,如式(13)所示,并且對預測結果進行反歸一化處理,如式(14)所示。
其中,xmax、xmin表示樣本數(shù)據(jù)中最大和最小值,Qi表示歸一化后的數(shù)據(jù)。
通過仿真測試New-GA-Elman、GA-Elman 和Elman 是否滿足5G 無線智能傳播損耗預測并具有較好的預測精度。
3 種神經(jīng)網(wǎng)絡的輸入為14 個特征,輸出為對RSRP標簽數(shù)據(jù)的預測結果。GA-Elman 與Elman 神經(jīng)網(wǎng)絡都是具有一層隱含層的網(wǎng)絡結構,經(jīng)過多次嘗試可知,設定其隱含層神經(jīng)元總數(shù)為7 個~9 個比較合適,本文實驗設定取8 個。遺傳算法初始種群為600,交叉概率0.35,變異概率0.09,遺傳代數(shù)1 000 代。Improved-GAElman、GA-Elman、Elman 預測算法輸出值以及期望值擬合與誤差情況如圖3~圖6所示。
圖3 Improved-GA-Elman 與Elman 預測結果對比(部分)Fig.3 Comparison of prediction results of Improved-GA-Elman and Elman(partial data)
圖6 Improved-GA-Elman 與GA-Elman 預測誤差對比(部分)Fig.6 Comparison of prediction errors of Improved-GA-Elman and GA-Elman(partial data)
圖5 Improved-GA-Elman 與GA-Elman 預測結果對比(部分)Fig.5 Comparison of prediction results of Improved-GA-Elman and GA-Elman(partial data)
從圖4 和圖6 可以看出,Improved-GA-Elman 神經(jīng)網(wǎng)絡的預測精度明顯高于GA-Elman 和Elman。為進行更清晰的對比,列出不同預測方法的MAE、MAPE、MSE 和RMSE 指標,如表1所示,可以看出Improved-GA-Elman 神經(jīng)網(wǎng)絡的預測精度明顯優(yōu)于GA-Elman 和Elman 網(wǎng)絡。
圖4 Improved-GA-Elman 與Elman 預測誤差對比(部分)Fig.4 Comparison of prediction errors of Improved-GA-Elman and Elman(partial data)
表1 預測誤差指標對比Table 1 Comparison of prediction error indicators
根據(jù)中國移動測試要求:當RSRP 大于-85 dBm時,屬于信號極好點;當RSRP在-85 dBm~-95 dBm范圍內時,屬于信號好點;當RSRP 在-95 dBm~-105 dBm 范圍內時,屬于信號中點;當RSRP在-105 dBm~-115 dBm 范圍內時,屬于信號差點;當RSRP 小于-115 dB 時,屬于信號極差點。其中,每個級別相差10 dBm。因此,當預測結果與真實值相差在±5 dBm 之間時,說明預測結果相當準確,基本不會造成對無線網(wǎng)絡規(guī)劃的錯誤指導。從表2 可以看出,Improved-GA-Elman 有92.76%的預測樣本相對誤差≤5 dBm,說明本文提出的基于改進GA-Elman的無線智能傳播損耗預測方法對無線通信建設具有較好的指導作用。
表2 預測誤差在真實值±5 dBm 之間的預測樣本統(tǒng)計Table 2 Prediction sample statistics with prediction errors between true value ±5 dBm
針對Elman 神經(jīng)網(wǎng)絡易陷入局部極小值、訓練速度慢和隱藏神經(jīng)元數(shù)量難以確定的問題,本文通過引入遺傳算法,設計一種基于網(wǎng)絡結構和連接權值閾值聯(lián)合優(yōu)化的無線信道損耗預測方法。利用遺傳算法的全局搜索和Elman 神經(jīng)網(wǎng)絡的局部搜索能力,使網(wǎng)絡結構和連接權值閾值得到精確調整,在此基礎上進行無線信道傳播損耗預測。實驗結果表明,該方法能夠精準預測平均接收信號功率(RSRP),可對網(wǎng)絡建設起到指導作用。下一步將從提高預測效率、降低時間消耗和利用大數(shù)據(jù)平臺建立實時動態(tài)無線傳播模型的角度出發(fā)對本文方法進行優(yōu)化,并使其能夠適用于一些特殊場景(如高鐵、飛機、隧道等場景)。