趙丹寧,雷 雨
(1. 寶雞文理學院電子電氣工程學院,陜西 寶雞 721016;2. 西安郵電大學計算機學院,陜西 西安 710121)
地球極移表示地球瞬時自轉(zhuǎn)軸相對于地球表面或者歷元平極的運行,是表征地球自轉(zhuǎn)變化的一個重要參量,簡稱極移。極移的兩個分量xp和yp、UT1-UTC與歲差、章動統(tǒng)稱為地球定向參數(shù)(Earth Orientation Parameters, EOP),地球定向參數(shù)是天球參考系和地球參考系相互轉(zhuǎn)換的必需參數(shù)。甚長基線干涉(Very Long Baseline Interferometry, VLBI)和全球?qū)Ш叫l(wèi)星系統(tǒng)(Global Navigation Satellite Systems, GNSS)等空間大地測量技術(shù)的極移測定精度可達0.05 mas[1]。但由于復雜的資料處理過程,由空間大地測量技術(shù)獲取的極移結(jié)果存在一定的延遲,而深空探測和衛(wèi)星精密定軌等領域?qū)O移的實時測量有重要需求,所以對極移進行短期預報就顯得尤為必要,此外,極移中長期預報在衛(wèi)星自主導航和天文地球動力學研究中也有重要應用,因此,極移的中長期預報具有重要的科學及現(xiàn)實意義。
國內(nèi)外學者提出了多種極移預報方法,如最小二乘外推[2]、自協(xié)方差模型[3]、模糊推理系統(tǒng)[4]、神經(jīng)網(wǎng)絡[5]、自回歸模型[5-6]以及這些模型的不同組合。受大氣和海洋等多種激發(fā)源的影響,極移呈現(xiàn)復雜的非線性、非平穩(wěn)變化,因此,采用神經(jīng)網(wǎng)絡等非線性方法對其進行預報在理論上更為合適,許多學者將神經(jīng)網(wǎng)絡應用于極移預報,取得了較好的預報效果[7-8]。國際地球定向參數(shù)比較活動的結(jié)果也表明,神經(jīng)網(wǎng)絡是當前極移預報精度最高的方法之一[9]。
反向傳播神經(jīng)網(wǎng)絡是當前應用最為廣泛的一種網(wǎng)絡學習算法,在時間序列預測、圖像處理和自動控制等領域均有應用,但反向傳播神經(jīng)網(wǎng)絡存在易陷入局部極小值、學習速度慢和泛化能力弱等缺點。極限學習機是近年發(fā)展起來的一種新型單隱含層前饋神經(jīng)網(wǎng)絡,其特點是隱含層神經(jīng)元的權(quán)重可以隨機給定,且不需要更新,網(wǎng)絡學習過程僅計算輸出權(quán)重,因此,在學習速度與泛化能力方面較傳統(tǒng)反向傳播神經(jīng)網(wǎng)絡具有一定優(yōu)勢[10-11]。基于此,本文將極限學習機神經(jīng)網(wǎng)絡應用于極移中長期預報,根據(jù)極移時間序列特征,建立了基于極限學習機神經(jīng)網(wǎng)絡的極移預報模型,試驗結(jié)果驗證了極限學習機神經(jīng)網(wǎng)絡應用于極移預報的有效性和實用性。
給定N個訓練樣本(xi,yi),其中,輸入向量xi=[xi1,xi2, …,xiu]T∈Ru,輸出向量yi=[yi1,yi2, …,
yiv]T∈Rv,u,v分別為輸入向量維數(shù)與輸出向量維數(shù),則具有h個隱含層節(jié)點的單隱含層前饋神經(jīng)網(wǎng)絡能夠以零誤差逼近這N個樣本,即[10]:
(1)
其中,wj=[wj1,wj2, …,wju]T為第j個隱含層神經(jīng)元與輸入層神經(jīng)元間的連接權(quán)重;βj=[βj1,βj2, …,
βjv]T為第j個隱含層神經(jīng)元與輸出層神經(jīng)元間的連接權(quán)重;bj為第j個隱含層神經(jīng)元的偏置;g(x)為激活函數(shù)。(1)式可以表示為矩陣相乘的形式:
Y=Hβ,
(2)
其中,H為隱含層輸出矩陣:
(3)
β和Y為
(4)
極限學習機神經(jīng)網(wǎng)絡的訓練步驟如下[10]:(1)隨機選取輸入層權(quán)重wj和偏置bj,j=1,2,…,h;(2)計算隱含層輸出矩陣H;(3)計算輸出層權(quán)值β=H?Y,其中H?為矩陣H的Moore-Penrose廣義逆。
最小二乘外推模型包含3部分:線性趨勢項、錢德勒項和周年項,其數(shù)學模型為
(5)
其中,T1,T2分別為錢德勒項和周年項的振蕩周期,取T1=432.08天、T2=365.24天;a,γ為趨勢項參數(shù);c1,d1為錢德勒項參數(shù);c2,d2為周年項參數(shù),這些未知參數(shù)可以根據(jù)最小二乘法求解。
最小二乘擬合殘差含有剩余的短周期成分,也含有各種準周期和非線性成分,對于這些成分,利用神經(jīng)網(wǎng)絡的非線性擬合能力對其進行建模與預報。依據(jù)神經(jīng)網(wǎng)絡模型構(gòu)建與極移預報的實際情況,采用如下方式確定網(wǎng)絡的輸入和輸出:
[ε(t-k-u+1),ε(t-k-u+2),…,ε(t-k)]→ε(t) ,
(6)
其中,ε(t)為最小二乘擬合殘差,t=1, 2, …,n;k為預報跨度。為了提高數(shù)據(jù)利用率,采用滑動窗口的方式構(gòu)建訓練樣本:
(7)
相應地,在預報階段網(wǎng)絡的輸入和輸出為
[ε(n-u+1),ε(n-u+2),…,ε(n)]→ε^(n+k),
(8)
其中,ε^(n+k)為神經(jīng)網(wǎng)絡模型的第k步預報值。
由于本文利用極限學習機神經(jīng)網(wǎng)絡實現(xiàn)從輸入到輸出的非線性映射,需要事先確定激活函數(shù)類型和網(wǎng)絡拓撲結(jié)構(gòu)(輸入層神經(jīng)元數(shù)和隱含層神經(jīng)元數(shù)),其中,激活函數(shù)選用Sigmoid函數(shù),表達式為
g(x)=1/(1+e-x) .
(9)
由于網(wǎng)絡拓撲結(jié)構(gòu)對網(wǎng)絡性能有至關重要的影響,為了確定較優(yōu)的網(wǎng)絡拓撲結(jié)構(gòu),通過觀察網(wǎng)絡訓練誤差隨輸入層神經(jīng)元數(shù)和隱含層神經(jīng)元數(shù)的變化情況優(yōu)化網(wǎng)絡拓撲結(jié)構(gòu),即網(wǎng)絡訓練誤差最小時所對應的輸入層神經(jīng)元數(shù)和隱含層神經(jīng)元數(shù)為最優(yōu)輸入層和隱含層神經(jīng)元數(shù)。以預報跨度30 d為例,圖1給出了網(wǎng)絡訓練均方根誤差(Root Mean Square Error, RMSE)隨輸入層和隱含層神經(jīng)元數(shù)的變化情況,從圖1可以看出,當輸入層神經(jīng)元數(shù)為17、隱含層神經(jīng)元數(shù)為47時,網(wǎng)絡訓練均方根誤差最小。
圖1 網(wǎng)絡訓練均方根誤差隨輸入層和隱含層神經(jīng)元數(shù)的變化情況
Fig.1 Changes of the network training RMSE with the neutron number of input and hidden layers
為了評估極限學習機神經(jīng)網(wǎng)絡用于極移長期預報的性能,首先將本文的預報結(jié)果同文[7]的反向傳播神經(jīng)網(wǎng)絡預報結(jié)果進行比較和分析,為了較為客觀地對二者的結(jié)果進行對比,本文預報過程中采用與文[7]相同的預報策略和誤差評價指標,其中,試驗數(shù)據(jù)采用國際地球自轉(zhuǎn)與參考服務(International Earth Rotation and Reference Systems Service, IERS)發(fā)布的EOP 05C04序列,基礎數(shù)據(jù)長度為3年,預報時段為2001年4月6日(MJD 52005)至2010年3月25日(MJD 55280),每隔91天預報一次,一共進行了37期的預報,預報誤差評價指標選用平均絕對誤差(Mean Absolute Error, MAE),其計算公式為
(10)
其中,Oj,Pj分別表示j點的觀測值與預測值;l為預報期數(shù)。
圖2給出了本文極移預報結(jié)果的誤差曲線和文[7]預報結(jié)果的誤差曲線,表1統(tǒng)計了兩者1天、5天、10天、20天、30天、60天、90天、120天、180天、240天、300天和360天預報跨度的平均絕對誤差。從圖2和表1可以看出,對于xp分量中長期預報,除了120天、180天和240天的極限學習機神經(jīng)網(wǎng)絡方法的預報精度稍遜于文[7]的反向傳播神經(jīng)網(wǎng)絡方法,其余跨度的預報精度優(yōu)于文[7]的反向傳播神經(jīng)網(wǎng)絡方法或與之相當;對于yp分量中長期預報,除了120天的預報精度稍遜于文[7]的反向傳播神經(jīng)網(wǎng)絡方法,其余跨度的預報精度優(yōu)于文[7]的反向傳播神經(jīng)網(wǎng)絡方法或與之相當。從圖2還可以發(fā)現(xiàn),極限學習機神經(jīng)網(wǎng)絡預報誤差曲線變化比較平緩,預報誤差呈現(xiàn)逐漸增大的趨勢,而反向傳播神經(jīng)網(wǎng)絡預報誤差曲線跳躍較為明顯,預報誤差不穩(wěn)定。
圖2 極限學習機神經(jīng)網(wǎng)絡預報誤差與文[7]預報誤差的對比
Fig.2 Comparison of the prediction errors for pole coordinates obtained by the ELM and reference [7]
表1 極限學習機神經(jīng)網(wǎng)絡極移預報與文[7]預報結(jié)果的平均絕對誤差統(tǒng)計(單位: mas)
為了進一步分析極限學習機神經(jīng)網(wǎng)絡方法的預報性能,本文也預報了2005年10月1日至2008年2月28日(與EOP PCC時段相同)不同預報跨度的極移值,并將本文預報結(jié)果的平均絕對誤差與EOP PCC預報結(jié)果的平均絕對誤差進行對比分析[9],如圖3~圖5,圖中數(shù)字代表參與EOP PCC的不同團隊的編號,不同顏色曲線表示不同團隊預報結(jié)果的平均絕對誤差,參與EOP PCC的團隊詳細情況見文[9],其中,極移超短期(1~10天)預報精度較高的團隊是Kalarus(編號061,黑色實線)和IERS EOP產(chǎn)品中心(編號071,綠色實線);短期(1~30天)預報精度較高的團隊是Kalarus(編號061,黑色實線)、Zotov(編號091,淺藍色實線)和Kosek(編號051,灰藍色實線);中長期(1~500天)預報精度較高的團隊是Kalarus(編號061,黑色實線)和Kosek(編號051,灰藍色實線)。
從圖3~圖5可以看到,對于1~10天的超短期預報,極限學習機神經(jīng)網(wǎng)絡方法的預報精度僅低于排在第1位的Kalarus團隊的預報精度,優(yōu)于其他團隊的預報精度;對于1~30天的短期預報,極限學習機神經(jīng)網(wǎng)絡方法的預報精度大體處于所有團隊的中間位置;對于1~500天的中長期預報,極限學習機神經(jīng)網(wǎng)絡方法的預報精度低于排在第1位的Kalarus團隊的預報精度,稍遜于排在第2位的Kosek團隊的預報精度或與之相當,優(yōu)于其他團隊的預報精度。
圖3 極限學習機神經(jīng)網(wǎng)絡超短期(1~10天)預報誤差與EOP PCC的對比
Fig.3 Comparison of the ultra short-term (1-10d) prediction errors obtained by the ELM and EOP PCC
圖4 極限學習機神經(jīng)網(wǎng)絡短期(1~30天)預報誤差與EOP PCC的對比
Fig.4 Comparison of the short-term (1-30d) prediction errors obtained by the ELM and EOP PCC
圖5 極限學習機神經(jīng)網(wǎng)絡中長期(1~500天)預報誤差與EOP PCC的對比
Fig.5 Comparison of the medium- and long-term (1-500d) prediction errors obtained by the ELM and EOP PCC
本文針對極移序列非線性、非平穩(wěn)變化的特性,將一種新型極限學習機神經(jīng)網(wǎng)絡用于極移中長期預報。通過預報試驗可以發(fā)現(xiàn),極限學習機神經(jīng)網(wǎng)絡用于極移中長期預報可以獲得較好的預報效果。與反向傳播神經(jīng)網(wǎng)絡預報結(jié)果的對比表明,極限學習機神經(jīng)網(wǎng)絡的預報精度優(yōu)于反向傳播神經(jīng)網(wǎng)絡的預報精度;與EOP PCC預報結(jié)果的比較發(fā)現(xiàn),極限學習機神經(jīng)網(wǎng)絡的中長期預報精度優(yōu)于大部分參與EOP PCC團隊的預報精度。