尚教凱 賀寅 徐池 徐銘
摘要:研究中發(fā)現(xiàn),將短波遠程通信中兩點間的可用頻率作為單特征輸入,利用長短期記憶人工神經(jīng)網(wǎng)絡(luò)(ISTM)可以實現(xiàn)對未來幾天短波頻率進行預(yù)測。該文對輸入的樣本數(shù)據(jù)存在缺失值條件下的情況進行分析,最終得到缺失值條件下該方法的應(yīng)用策略,對遠程短波通信保障具有重要意義。
關(guān)鍵詞:頻率預(yù)測;LSTM;缺失值
中圖分類號:TP319 文獻標識碼:A
文章編號:1009-3044(2020)09-0251-04
1 引言
短波通信一直是海上遠程通信不可缺少的手段??茖W技術(shù)的不斷進步推動著短波通信向著建鏈速度更迅捷、數(shù)據(jù)傳輸容量更大的方向發(fā)展,但實現(xiàn)準確的短波通信頻率預(yù)測是制約著遠程短波通信質(zhì)量提升的關(guān)鍵問題。
現(xiàn)有的ITS-HF系列短波頻率預(yù)測軟件雖然能夠?qū)崿F(xiàn)復(fù)雜鏈路程序化,但該系列預(yù)測軟件的輸入條件過于苛刻,且局限性較強,在實際海上通信過程中的效果并不好。而短波頻率作為典型的非線性時間序列,有很多學者基于模糊小波、神經(jīng)網(wǎng)絡(luò)、混沌理論等算法對時間序列預(yù)測開展研究,任淑婷采用模糊小波神經(jīng)網(wǎng)絡(luò)方法對短波頻率進行預(yù)測,預(yù)測值與實際值的相對誤差在9%左右,但工程實現(xiàn)難度較大。
根據(jù)深度學習擅長提取非線性時間序列數(shù)據(jù)特征的特點,通過時間半年,間隔一小時的頻率樣本數(shù)據(jù)對長短期記憶人工神經(jīng)網(wǎng)絡(luò)( ISTM)進行訓練,實現(xiàn)了對未來約20天每小時為間隔的點對點短波遠程通信頻率預(yù)測。在實際應(yīng)用過程中,收集樣本數(shù)據(jù)過程中存在出現(xiàn)數(shù)據(jù)缺失的可能,這種情況就不能滿足預(yù)測模型對樣本數(shù)據(jù)中時間間隔為一小時的訓練需求,那么出現(xiàn)這種缺失值時,該模型是否還能實現(xiàn)頻率預(yù)測?缺失比例是否對預(yù)測結(jié)果產(chǎn)生影響?
為進一步明確基于LSTM實現(xiàn)頻率預(yù)測方法對樣本數(shù)據(jù)的需求,本文對樣本數(shù)據(jù)存在缺失值的情況進行分析。
2 LSTM模型
3 缺失值處理
數(shù)據(jù)收集過程中出現(xiàn)缺失值存在以下幾個原因,一是沒有歷史經(jīng)歷,未積累過相關(guān)資源;二是有歷史經(jīng)歷,資源積累過程中因為設(shè)備原因出現(xiàn)缺少丟失,比如數(shù)據(jù)未存儲成功、設(shè)備故障導致某些數(shù)據(jù)未收集或者未傳遞到數(shù)據(jù)庫中;三是出現(xiàn)奇異樣本,不適合被調(diào)用,處理過程中被刪除。
缺失值的處理辦法包括填充和刪除,而填充的方法包括:
1)當調(diào)用的數(shù)據(jù)集中出現(xiàn)缺失值時,將所有缺失值用NULL進行填充,表示該項空值,不影響使用,
2)平均值填充。用該屬性其他值的平均值對該缺失項進行填充。
3)用最可能的值填充。本系統(tǒng)中頻率生成子模塊能夠根據(jù)一定數(shù)量的樣本進行頻率預(yù)測,當可通頻率存在缺失時,該預(yù)測值就是最可能的值,用預(yù)測值進行填充能夠補充缺失項。
為更好地明確缺失值對基于LSTM單特征輸入實現(xiàn)頻率預(yù)測的影響,本文對樣本數(shù)據(jù)中缺失值的處理辦法是刪除該項的整組數(shù)據(jù)。
4 仿真模型構(gòu)建
1)仿真環(huán)境
本文的仿真是在Python3.7環(huán)境下采用Python語言實現(xiàn)的,為滿足Python中numpy庫(Numerical Python,Python進行科學計算和大數(shù)據(jù)分析的基礎(chǔ)庫)導人數(shù)據(jù)要求,需要將仿真數(shù)據(jù)存儲為.csv或.xlsx格式文件。
2)仿真數(shù)據(jù)
由于數(shù)據(jù)需求量多,難以獲得能夠滿足算法訓練要求的實際數(shù)據(jù),本文提取“亞大預(yù)測”模型預(yù)測結(jié)果中的兩點間最高可用頻率(Maximum Usable Frequency,MUF)替代短波可通頻率作為模型驗證的仿真數(shù)據(jù)。
數(shù)據(jù)由兩部分組成,一部分是由2014年8月31日0900至2015年3月1日0800的跨度半年,間隔1小時的時間,另一部分是北京市石景山區(qū)與福建省福州市臺江區(qū)兩點間通信的最高可用頻率的數(shù)值。以上兩部分組成了4368組該時刻最高可用頻率的樣本數(shù)據(jù)集合,如下表所示:
通過Python編程,在數(shù)據(jù)預(yù)處理過程中,對仿真數(shù)據(jù)進行缺失值處理,包括連續(xù)缺失、隨機缺失兩種方法,進行缺失值處理后繼續(xù)進行下一步。
3)為能夠驗證該模型的訓練效果,需要測試樣本與預(yù)測結(jié)果進行比對,因此,在仿真實現(xiàn)過程需要將預(yù)處理后的仿真數(shù)據(jù)劃分成訓練樣本集和測試樣本集兩部分。
4)確定能夠評估短波頻率預(yù)測效果的評價指標。這里選用均方根誤差( RMSE)作為計算短波頻率預(yù)測值與測試值誤差的公式。
5)將整個仿真的結(jié)果可視化,便于觀察進行對比分析。這里使用Python中的matplotlib庫進行實現(xiàn)。
整個仿真實現(xiàn)流程如圖1所示:
5 仿真結(jié)果與分析
缺失值的情況分為連續(xù)缺失以及隨機缺失兩種,下面通過Python軟件對這兩種情況進行仿真,根據(jù)仿真結(jié)果進行總結(jié)分析。
5.1 連續(xù)缺失情況
在基于LSTM單特征輸入實現(xiàn)頻率預(yù)測的方法中,當需要調(diào)用的樣本數(shù)據(jù)集從中間部分連續(xù)缺失比例為12.5%時,運行結(jié)果如圖2所示。其中圖2(a)中的藍色部分為訓練區(qū)域,黃色部分為預(yù)測區(qū)域,橫軸代表日期,坐標間隔為1個月,縱軸代表頻率值,單位為MHz。圖2/b)中黃色線條為預(yù)測值,藍色線條為實際值.橫軸為日期,坐標間隔為6小時,縱軸為頻率值,單位為MHz。
當需要調(diào)用的樣本數(shù)據(jù)集從中間部分連續(xù)缺失比例為25%時,其預(yù)測值結(jié)果如圖3所示:
5.2 隨機缺失情況
當需要調(diào)用的樣本數(shù)據(jù)集中隨機缺失比例為1.25%時,其預(yù)測值結(jié)果如圖4所示:
當需要調(diào)用的樣本數(shù)據(jù)集中隨機缺失比例為2.5%時,其預(yù)測值結(jié)果如圖5所示:
當需要調(diào)用的樣本數(shù)據(jù)集中隨機缺失比例為15%時,其仿真結(jié)果如圖6所示:
當需要調(diào)用的樣本數(shù)據(jù)集中隨機缺失比例為20%時,其仿真結(jié)果如圖7所示:
當需要調(diào)用的樣本數(shù)據(jù)集中隨機缺失比例為25%時,其仿真結(jié)果如圖8所示:
基于LSTM單特征輸入實現(xiàn)頻率預(yù)測方法在缺失數(shù)據(jù)情況下的均方根誤差及運行時間如表2所示:
通過對以上圖表對比分析,可以總結(jié)如下:
(l)從2(a)中可以看出兩塊藍色部分中間的白色區(qū)域為樣本數(shù)據(jù)集中缺失部分,通過圖表觀察可以發(fā)現(xiàn)在單特征輸入頻率預(yù)測模型中連續(xù)出現(xiàn)缺失值與未出現(xiàn)缺失值時相比RMSE值偏大,模型運行時間稍少一些,但擬合效果較好,仍能夠滿足預(yù)測精度需求。
(2)隨機缺失數(shù)據(jù)情況下RMSE值比未出現(xiàn)缺失值時大,隨著隨機缺失數(shù)據(jù)增多,模型運行時間減少。
(3)當隨機缺失比例達到20%開始,預(yù)測精度難以滿足通信需求,因此當可通頻率資源庫中可提供的樣本數(shù)據(jù)集中隨機缺失比例達到20%以上時,單特征輸入頻率預(yù)測模型的預(yù)測結(jié)果不可靠。
6 結(jié)語
本文通過對樣本數(shù)據(jù)中的缺失值情況進行分析,總結(jié)得出當訓練樣本數(shù)量不少于3000組,時間間隔1小時,隨機缺失比例不高于20%的條件時,基于LSTM單特征輸入模型能夠用于實現(xiàn)短波頻率預(yù)測。
參考文獻:
[1]賀驍,劉蕓江,肖瑤,等.基于傳播損耗的短波自適應(yīng)快速建鏈[J].電訊技術(shù),2014,54(3):302-306.
[2]楊青彬,余毅敏,余奇,等.基于lTS軟件的短波頻率管理系統(tǒng)設(shè)計[J].電訊技術(shù),2013,53(3):249-253.
[3]田曉銘,張海勇,徐池,等.泛Kriging法在海上短波通信頻率預(yù)測中的應(yīng)用[J].電訊技術(shù),2018,58(12):1434-1440.
[4]黃少昆,王偉民,黃子洋,等,電離層F2層臨界頻率預(yù)測方法探討[J].氣象水文裝備,2009,4(20):19-21.
[5]簡相超,鄭君里,混沌和神經(jīng)網(wǎng)絡(luò)相結(jié)合預(yù)測短波通信頻率參數(shù)[J].清華大學學報f自然科學版),2001,41(1):16-19.
[6] Wang Y C.Short-term wind power forecasting by genetic algo-rithm of wavelet neural network[C]//2014 International Confer-ence on Information Science,Electronics and Electrical Engi-neering, April 26-28, 2014. Sapporo, Japan. IEEE, 2014:1752-1755,
[7]任淑婷,郭黎利.基于模糊小波神經(jīng)網(wǎng)絡(luò)的短波頻率預(yù)測[J].通信技術(shù),201 1,44(4):37-39.
[8]徐池,邱楚楚,李梁,等.海上短波通信頻率優(yōu)選技術(shù)現(xiàn)狀與分析[J].通信技術(shù),2015,48(10):1101-1105.
[9]尚教凱,張海勇,徐池,等.基于LSTM單特征輸入的短波可用預(yù)測研究[J].艦船電子工程,2019,39(11):76-78,88.
[10]鄧建新,單路寶,賀德強,等.缺失數(shù)據(jù)的處理方法及其發(fā)展趨勢[J].統(tǒng)計與決策,2019(23):28-34.
【通聯(lián)編輯:朱寶貴】