吉長(zhǎng)東,王 強(qiáng),沈祎凡,潘 飛
(遼寧工程技術(shù)大學(xué) 測(cè)繪與地理科學(xué)學(xué)院,遼寧 阜新 123000)
全球衛(wèi)星導(dǎo)航系統(tǒng)(global navigation satellite system,GNSS),在各行各業(yè)都得到了廣泛應(yīng)用,當(dāng)GNSS衛(wèi)星信號(hào)穿過(guò)電離層時(shí),預(yù)報(bào)電離層總電子含量(total electric contents,TEC)對(duì)研究電離層隨時(shí)間變化和電離層暴都有著重要意義[1-2]。目前應(yīng)用國(guó)際GNSS服務(wù)組織(international GNSS service,IGS)提供的格網(wǎng)數(shù)據(jù)建立高精度的TEC預(yù)報(bào)模型的方法在TEC短期預(yù)報(bào)中取得了很好的效果。具體包括自回歸移動(dòng)平均模型(auto regressive integrated moving average,ARIMA)[3]、指數(shù)平滑(Holt-Winters)模型[4]、神經(jīng)網(wǎng)絡(luò)模型[5-8]等。其中,神經(jīng)網(wǎng)絡(luò)以其優(yōu)秀的學(xué)習(xí)能力、大規(guī)模并行處理海量數(shù)據(jù)能力以及其在處理非線性與時(shí)變性問(wèn)題上有著巨大優(yōu)勢(shì)。但傳統(tǒng)的前饋式神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型屬于一種非動(dòng)態(tài)的非循環(huán)的神經(jīng)網(wǎng)絡(luò)模型,利用靜態(tài)網(wǎng)絡(luò)將動(dòng)態(tài)時(shí)間序列建模問(wèn)題當(dāng)作靜態(tài)建模問(wèn)題,不能精確地反映TEC時(shí)間序列的特性,同時(shí)還存在著輸入數(shù)據(jù)個(gè)數(shù)難以確定、容易陷入局部最小值和網(wǎng)絡(luò)結(jié)構(gòu)難以確定等不足。而非線性自回歸(nonlinear auto regressive,NAR)神經(jīng)網(wǎng)絡(luò)模型[9-11]是一種動(dòng)態(tài)的神經(jīng)網(wǎng)絡(luò)模型,能夠記憶以往時(shí)間序列的信息并加入到當(dāng)前的輸出計(jì)算中。同時(shí),采用動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)動(dòng)態(tài)系統(tǒng)進(jìn)行預(yù)測(cè),則能夠更好地反映出TEC時(shí)間序列的動(dòng)態(tài)變化特性。由于時(shí)間序列的復(fù)雜性直接對(duì)其利用模型預(yù)測(cè)并不能取得很好的效果,文獻(xiàn)[12]首先利用經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)的方法對(duì)電離層TEC時(shí)間序列進(jìn)行分解變換,再對(duì)分解后的各個(gè)序列分別建立模型進(jìn)行預(yù)報(bào),有效的提高了TEC值預(yù)報(bào)精度[12]。因此,本文采用經(jīng)驗(yàn)?zāi)B(tài)分解[13-14]與非線性自回歸神經(jīng)網(wǎng)絡(luò)模型相結(jié)合的方法對(duì)電離層TEC值進(jìn)行短期預(yù)報(bào),并利用均方根誤差(root mean square error,RMSE)和日平均相對(duì)精度(relative accuracy,RA)來(lái)評(píng)定模型的預(yù)報(bào)精度。
NAR模型全稱是非線性自回歸模型它是一種回歸型的動(dòng)態(tài)的循環(huán)神神經(jīng)網(wǎng)絡(luò)[9]。NAR模型可以實(shí)現(xiàn)時(shí)間序列依次多個(gè)輸入輸出,同時(shí)隱層之間采用自鏈接,展開(kāi)后相當(dāng)于時(shí)序之間的相互影響,具有時(shí)間觀念。NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型的輸入層和輸出層之前增加輸入滯時(shí)和輸出滯時(shí)來(lái)體現(xiàn)其動(dòng)態(tài)特性。NAR模型的基本結(jié)構(gòu)可以由圖1表示[10]。
圖1中:Y(t)表示神經(jīng)網(wǎng)絡(luò)的輸入與輸出;1∶12表示延時(shí)階數(shù),即t時(shí)刻的電離層TEC值受到y(tǒng)(t-1),y(t-2),…,y(t-12)時(shí)刻TEC值的影響;w為鏈接權(quán)值;b為閾值。NAR電離層TEC值預(yù)測(cè)模型的數(shù)學(xué)表達(dá)式為
y(t)=f(y(t-1),y(t-2),y(t-3),…,
y(t-n))
(1)
式中:t為當(dāng)前時(shí)刻;n為延時(shí)變量的個(gè)數(shù);(t-1),y(t-2),…,y(t-n)為模型過(guò)去時(shí)刻的輸出值;y(t)表示當(dāng)前時(shí)刻的預(yù)測(cè)值;f是通過(guò)網(wǎng)絡(luò)訓(xùn)練的得到的非線性映射函數(shù)。具體的NAR網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示[11]。
圖2中:Xi為網(wǎng)絡(luò)的輸入信號(hào);Hj為隱含層神經(jīng)元的輸出;O(t)為網(wǎng)絡(luò)的輸出。計(jì)算公式為
(2)
(3)
式中:Hj為隱含層的輸出;f為隱含層的激活函數(shù);Xi為輸入數(shù)據(jù);wij為輸入層第i個(gè)神經(jīng)元到隱含層第j個(gè)神經(jīng)元的系數(shù)(權(quán)值);aj為隱含層第j神經(jīng)元的線性關(guān)系的偏倚;O為網(wǎng)絡(luò)的輸出;wj為隱含層第j個(gè)神經(jīng)元到輸出層的權(quán)連接值;b為輸出層神經(jīng)元的閾值。
NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型需要通過(guò)不斷地調(diào)試參數(shù),使得電離層TEC的預(yù)測(cè)值與真值得到有效擬合。其中隱含層節(jié)點(diǎn)數(shù)和延時(shí)階數(shù)的選取對(duì)NAR動(dòng)態(tài)神經(jīng)網(wǎng)模型的創(chuàng)建起著決定性作用。隱層節(jié)點(diǎn)個(gè)數(shù)的選取目前還沒(méi)有具體的數(shù)學(xué)公式,節(jié)點(diǎn)個(gè)數(shù)過(guò)多不僅會(huì)降低網(wǎng)絡(luò)的運(yùn)行速度,同時(shí)還容易出現(xiàn)過(guò)度擬合問(wèn)題,網(wǎng)絡(luò)的泛化能力降低;節(jié)點(diǎn)個(gè)數(shù)過(guò)少,雖然可以提高網(wǎng)絡(luò)的運(yùn)行速度,但網(wǎng)絡(luò)的學(xué)習(xí)能力不夠,導(dǎo)致網(wǎng)絡(luò)的預(yù)報(bào)精度較差。隱含層節(jié)點(diǎn)數(shù)通常采用經(jīng)驗(yàn)公式和大量試驗(yàn)的方法來(lái)確定。經(jīng)驗(yàn)公式為
(4)
式中:n1為隱含層節(jié)點(diǎn)神經(jīng)元個(gè)數(shù);n2為輸入層節(jié)點(diǎn)神經(jīng)元個(gè)數(shù);n3為輸出層節(jié)點(diǎn)神經(jīng)元個(gè)數(shù);a為[1,10]之間的調(diào)整值(整數(shù))。本文先以經(jīng)驗(yàn)公式作為隱含層節(jié)點(diǎn)數(shù)的初始值然后經(jīng)過(guò)大量實(shí)驗(yàn)不斷調(diào)整節(jié)點(diǎn)個(gè)數(shù)和延遲參數(shù)選取最優(yōu)神經(jīng)元結(jié)構(gòu)。隱層訓(xùn)練函數(shù)使用運(yùn)算時(shí)間較短和收斂速度較快的LM算法。
經(jīng)驗(yàn)?zāi)B(tài)分解是在傅里葉變換和小波變換的基礎(chǔ)上發(fā)展起來(lái)的一種新型的信號(hào)預(yù)處理的方法,它不需要任何基函數(shù)就可以自適應(yīng)的將復(fù)雜的無(wú)規(guī)律的信號(hào)分解為特征單一的不同頻率的imf分量和一個(gè)趨勢(shì)項(xiàng),各個(gè)imf分量可以看作是影響原始信號(hào)的不同因數(shù),趨勢(shì)項(xiàng)則反映了原始信號(hào)的整體變化趨勢(shì)[12]。
EMD-NAR模型的算法流程圖如圖3所示。
首先利用EMD頻譜分析功能將IGS提供的電離層TEC數(shù)據(jù)進(jìn)行分解變換得到不同級(jí)別不同頻率的單一的子時(shí)間序列,然后對(duì)所得的各個(gè)子時(shí)間序列分別建立NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)報(bào)進(jìn)而重構(gòu)得到最終預(yù)報(bào)值。具體步驟如下:
1)利用EMD分解將TEC時(shí)間序列x(t)分解為一系列不同級(jí)別不同頻率且特征單一的imf分量,即[13]
(5)
式中:imfi為EMD分解所得到的本特征分量;n為分量總數(shù);r(t)為趨勢(shì)項(xiàng)余量。
2)對(duì)得到的分量和趨勢(shì)項(xiàng)分別建立NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)報(bào),并整合所有模型的結(jié)果,得到TEC的預(yù)報(bào)值。采用IGS中心提供的觀測(cè)數(shù)據(jù)作為對(duì)比值,以日平均相對(duì)精度RA和均方根誤差RMSE作為評(píng)價(jià)指標(biāo)。其相應(yīng)的定義為
(6)
(7)
式中:Ipre,i為第i個(gè)歷元的預(yù)報(bào)值;IIGS,i為第i個(gè)歷元IGS中心的觀測(cè)值;n為時(shí)段的歷元長(zhǎng)度。
根據(jù)太陽(yáng)黑子數(shù)和F10.7指數(shù),選取IGS提供的2008年年積日第61~80天、第147~166天、第239~258天、第330~349天高緯度(85°N,120°E)、中緯度(45°N,120°E)和低緯度(5°N,120°E)數(shù)據(jù)作為電離層平靜期樣本序列;選取2013年年積日第146~165天和第225~244天高緯度(85°N,125°E)、中緯度(45°N,120°E)和低緯度(5°N,120°E)的數(shù)據(jù)建立電離層活躍期TEC時(shí)間序列。將所選TEC樣本序列數(shù)據(jù)分為3個(gè)部分:60 %(所選序列前12 d)的數(shù)據(jù)作為訓(xùn)練集訓(xùn)練模型,以10 %(所選序列中間2 d)的數(shù)據(jù)作為驗(yàn)證集來(lái)輔助模型的構(gòu)建,以30 %(所選序列后6 d)的數(shù)據(jù)作為測(cè)試數(shù)據(jù)用于評(píng)估模型的精度。
為了驗(yàn)證EMD-NAR模型的預(yù)報(bào)精度,采用單一的NAR模型、EMD-BP模型作為對(duì)比模型進(jìn)行對(duì)比分析,以預(yù)測(cè)擬合電離層TEC值圖形與計(jì)算誤差的形式來(lái)實(shí)證其差異。
圖4為EMD-NAR模型和單一的NAR模型的預(yù)報(bào)結(jié)果對(duì)比圖。其中橫坐標(biāo)為預(yù)測(cè)歷元的個(gè)數(shù),以時(shí)段長(zhǎng)度2 h為單位;縱坐標(biāo)表示TEC值,單位為TUCu的個(gè)數(shù),1個(gè)TUCu等于“1016個(gè)電子/平方米”??梢钥闯鱿噍^于單一模型EMD-NAR模型的預(yù)報(bào)結(jié)果能更好地反映電離層TEC值的變化情況,預(yù)測(cè)性能更好,且預(yù)報(bào)結(jié)果IGS中心提供的TEC值更為接近,誤差更小。表1從整體上反映了單一NAR模型和EMD-NAR模型的殘差誤差的分布情況。單一NAR模型預(yù)報(bào)6 d的平均殘差小于1個(gè)TECu的約占66.7 %,而組合模型約為81.9 %,殘差大于3個(gè)TECu的單一NAR模型約占8.3 %,而EMD-NAR模型僅為5.5 %。
預(yù)報(bào)天數(shù)/dNAR模型/EMD-NAR模型(以TECu個(gè)數(shù)計(jì))Δ<1 1≤Δ<22≤Δ<3Δ≥3158.3/75.016.7/8.38.3/16.716.7/0.0266.7/91.68.3/8.316.7/0.08.3/0.0358.3/83.333.3/0.08.3/8.30.0/8.3475.0/75.08.3/8.38.3/8.38.3/8.3575.0/75.00.0/16.716.7/0.08.3/8.3666.7/91.616.7/0.08.3/0.08.3/8.3
圖5為EMD-NAR模型和EMD-BP模型的預(yù)報(bào)結(jié)果對(duì)比圖。其中橫坐標(biāo)為預(yù)測(cè)歷元的個(gè)數(shù),以時(shí)段長(zhǎng)度2 h為單位;縱坐標(biāo)表示TEC值,單位為TECu的個(gè)數(shù)??梢悦黠@看出相較于EMD-BP模型EMD-NAR模型具有更好的預(yù)報(bào)精度。統(tǒng)計(jì)不同時(shí)段的預(yù)報(bào)殘差得到表2。可以看出EMD-NAR模型的預(yù)報(bào)精度數(shù)學(xué)性能指標(biāo)方面也明顯優(yōu)于EMD-BP模型。
預(yù)報(bào)天數(shù)/dEMD-BP模型/EMD-NAR模型(以TECu個(gè)數(shù)計(jì))Δ<1 1≤Δ<22≤Δ<3Δ≥3152.8/83.316.7/8.316.7/5.613.8/2.8261.1/75.019.4/16.711.1/8.38.3/0.0358.3/77.816.7/11.18.3/5.616.7/5.6463.9/83.38.3/8.316.7/2.811.1/5.6555.6/80.619.5/16.713.8/0.011.1/2.8666.7/75.016.7/16.78.3/5.68.3/2.8
計(jì)算各個(gè)時(shí)段的相對(duì)精度和RMSE得到表3,可以看出在相對(duì)精度和RMSE方面,EMD-NAR模型明顯優(yōu)于單一NAR模型和EMD-BP模型,從數(shù)學(xué)性能指標(biāo)方面驗(yàn)證了上述結(jié)果。
表3 不同模型的RMSE和RA
圖6對(duì)EMD-NAR模型在平靜期和活躍期高、中、低3個(gè)不同緯度的預(yù)報(bào)結(jié)果進(jìn)行了統(tǒng)計(jì),其中橫坐標(biāo)為預(yù)測(cè)歷元的個(gè)數(shù),以時(shí)段長(zhǎng)度2 h為單位;縱坐標(biāo)表示TEC值,單位為TECu的個(gè)數(shù)??梢钥闯?,在電離層平靜期與活躍期利用EMD-NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)得到的TEC值與實(shí)際值相比在高、中和低緯度地區(qū)都能較好地反映TEC的變化情況。 且在平靜期有更好的擬合效果。
由表4的殘差統(tǒng)計(jì)結(jié)果得出,電離層平靜期和活躍期的預(yù)報(bào)殘差在1個(gè)TECu的分別占71.2 %和68.5 %,預(yù)報(bào)殘差大于3個(gè)TECu的分別為9.3 %和12.5 %??梢钥闯觯嚎傮w來(lái)說(shuō)EMD-NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型具有較高的預(yù)報(bào)精度,預(yù)報(bào)結(jié)果也比較理想;但是活躍期的電離層的不穩(wěn)定性導(dǎo)致在電離層平靜期的預(yù)報(bào)結(jié)果要明顯優(yōu)于電離層活躍期的預(yù)報(bào)結(jié)果。
預(yù)報(bào)天數(shù)/d平靜期活躍期Δ<1 1≤Δ<22≤Δ<3Δ≥3Δ<11≤Δ<22≤Δ<3Δ≥3175.011.15.68.363.913.98.313.9269.413.95.611.166.711.111.111.1366.716.711.15.669.411.15.613.9472.213.95.68.372.25.65.616.7575.08.35.611.166.78.38.311.1669.411.18.311.172.211.111.18.3
表5和表6對(duì)電離層平靜期、活躍期在不同經(jīng)度的相對(duì)精度和均方根誤差進(jìn)行了統(tǒng)計(jì);從另一個(gè)角度驗(yàn)證了圖6的結(jié)論??梢钥闯觯籈MD-NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型在平靜期和活躍期的不同經(jīng)緯度預(yù)報(bào)值都有較高相對(duì)精度和較優(yōu)的均方根誤差;預(yù)報(bào)結(jié)果的相對(duì)精度和均方根誤差在不同緯度地區(qū)略有差異,相對(duì)精度在低緯度地區(qū)最優(yōu),而均方根誤差則在高緯度地區(qū)最優(yōu),這主要是由TEC的含量在不同緯度有很大不同所導(dǎo)致的。
表5 電離層平靜期預(yù)測(cè)值的RMSE和RA
本文首先對(duì)比了單一NAR模型和EMD-NAR模型在相同環(huán)境下的預(yù)報(bào)性能,驗(yàn)證了組合模型的優(yōu)越性,然后經(jīng)過(guò)大量實(shí)驗(yàn)對(duì)EMD-NAR模型在不同環(huán)境下(不同活躍期、不同緯度)的預(yù)報(bào)性能做出如下小結(jié):
1)相較于單一NAR模型,EMD-NAR模型,預(yù)報(bào)效果和精度都有很好的提升,與實(shí)際數(shù)據(jù)吻合更好;
2)與一般神經(jīng)網(wǎng)絡(luò)相比,動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的擬合和預(yù)測(cè)性能更優(yōu);
3)EMD-NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型能很好地反映電離層TEC的變化特性,平靜期和活躍期的預(yù)測(cè)平均相對(duì)精度分別為94 %和88.3 %,預(yù)報(bào)殘差小于1個(gè)TECu的分別占71 %和68.5 %,小于3個(gè)TECu的分別占90.3 %和87.5 %,活躍期的電離層的不穩(wěn)定性導(dǎo)致在電離層平靜期的預(yù)報(bào)結(jié)果要明顯優(yōu)于電離層活躍期的預(yù)報(bào)結(jié)果。