雷 雨,蔡宏兵
(1. 中國科學院國家授時中心,陜西 西安 710600;2. 中國科學院時間頻率基準重點實驗室,陜西 西安 710600;3. 中國科學院大學,北京 100049)
?
顧及最小二乘擬合端點效應的日長變化預報*
雷雨1,2,3,蔡宏兵1,2
(1. 中國科學院國家授時中心,陜西 西安710600;2. 中國科學院時間頻率基準重點實驗室,陜西 西安710600;3. 中國科學院大學,北京100049)
針對日長(Length Of Day, LOD)變化預報中最小二乘(Least Squares, LS)擬合存在端點效應的問題,采用時間序列分析方法對日長變化序列進行端點延拓,形成一個新序列,然后用新序列建立最小二乘模型,最后再結(jié)合最小二乘模型和自回歸(Autoregressive, AR)模型對原始日長變化序列進行預報。實驗結(jié)果表明,在日長變化序列兩端增加統(tǒng)計延拓數(shù)據(jù),能有效減小最小二乘擬合序列的端點畸變,從而提高日長變化的預報精度,尤其對中長期預報精度提高明顯。
日長變化;預報;最小二乘擬合;端點效應;時間序列分析
日長變化是表征地球自轉(zhuǎn)運動的一個重要參量,反映了地球自轉(zhuǎn)速率的快慢。日長變化與極移(Polar Motion, PM)的兩個分量統(tǒng)稱為地球自轉(zhuǎn)參數(shù)(Earth Rotation Parameters, ERP)。地球自轉(zhuǎn)參數(shù)是實現(xiàn)地球參考系與天球參考系相互轉(zhuǎn)換的必需參數(shù),在衛(wèi)星導航、深空探測以及天文地球動力學研究等領(lǐng)域有重要應用[1]。衛(wèi)星激光測距(Satellite Laser Ranging, SLR)、甚長干涉基線測量(Very Long Baseline Interferometry, VLBI)與全球衛(wèi)星導航系統(tǒng)(Global Navigation Satellite System, GNSS)等現(xiàn)代空間測地技術(shù)是獲取地球自轉(zhuǎn)參數(shù)的主要手段,但復雜的資料處理過程使得地球自轉(zhuǎn)參數(shù)的獲取存在一定延遲,因此對地球自轉(zhuǎn)參數(shù)進行高精度預報是一項必要工作。
當前預報日長變化的方法有多種,這些方法大多是最小二乘外推模型和其他模型的組合,如最小二乘外推與自回歸(Autoregressive, AR)模型的組合(LS+AR)[2]、最小二乘外推與神經(jīng)網(wǎng)絡(luò)(Neural Network, NN)技術(shù)的組合(LS+NN)[3-5]和最小二乘外推與高斯過程回歸(Gaussian Process Regression, GPR)模型的組合(LS+GPR)[6-7]等。這些組合方法均是首先建立最小二乘外推模型,得到日長變化序列趨勢項和周期項的外推值,再利用其他方法對最小二乘擬合殘差序列進行預報,而日長變化預測值為最小二乘外推值和殘差序列預測值的疊加。
實際工作中發(fā)現(xiàn),在利用最小二乘模型對日長變化序列進行擬合時,在擬合序列的兩端存在發(fā)散畸變現(xiàn)象(在數(shù)據(jù)處理中稱作端點畸變效應,簡稱端點效應),致使趨勢項、周期項和殘差序列的預報值出現(xiàn)偏差,最終導致日長變化序列的最終預測值不準確。本文針對日長變化預報中最小二乘擬合存在端點效應的問題,在利用最小二乘模型擬合日長變化序列之前,先采用時間序列分析方法對日長變化序列進行數(shù)據(jù)延拓,即在觀測序列的兩端增加用統(tǒng)計學方法延拓出的若干數(shù)據(jù)點,形成一個新序列,然后用新序列求得最小二乘模型系數(shù),最后再利用最小二乘外推與自回歸組合模型對日長變化原始序列進行預測。算例表明,通過對觀測序列兩端的數(shù)據(jù)延拓,可以有效消除端點效應的影響,從而提高日長變化預報的精度。
1.1資料預處理
本文所用日長變化資料源自國際地球自轉(zhuǎn)與參考系服務(wù)(International Earth Rotation and Reference Systems Service, IERS)組織發(fā)布的EOP 05 C04序列,采樣間隔為1 d。日長變化序列中包含多種周期性變化成分,其中對周期為5 d~18.6 a的62個固體地球帶諧潮汐項利用IERS協(xié)議給出的經(jīng)驗模型給予扣除[8],而扣除這些固體潮汐項后的日長變化稱為ΔLODR。本文對日長變化的預報均是針對ΔLODR的預報。
1.2最小二乘外推模型
日長變化序列扣除固體潮汐項后,還含有長期趨勢項和周年項、半周年項等季節(jié)性變化成分,這些趨勢項和周期項采用下述最小二乘模型進行擬合和外推:
(1)
其中,T1和T2分別表示周年項和半周年項的振蕩周期,本文取T1=365.24 d、T2=182.62 d;a和b表示長期趨勢項參數(shù);c1和d1表示周年項參數(shù);c2和d2表示半周年項參數(shù)。這6個未知參數(shù)可以通過最小二乘法求得。
1.3自回歸模型
自回歸模型是對平穩(wěn)時間序列{zt,t=1, 2, …,n}建立的一個概率統(tǒng)計模型,它根據(jù)變量自身過去的變化規(guī)律來建立預報模型,其數(shù)學模型為
(2)
其中,p為模型階次;εt為白噪聲;φ1,φ2, …,φp為模型參數(shù),可以采用Yule-Walker方程求解。
使用自回歸模型的關(guān)鍵在于選取模型階次p。常用的定階準則有信息論準則、傳遞函數(shù)準則與最終預報誤差準則,這3種準則在實際應用中是等效的[9]。本文選用赤池信息量準則(Akaike Information Criterion, AIC)確定階次p,準則函數(shù)可以表示為
(3)
當模型階次p和模型參數(shù)φ1, φ2, …, φp確定時,可根據(jù)下述方式進行時間序列的多步外推預報。
(4)
(5)
(6)
1.4預報流程
本文預報方法與常規(guī)方法的區(qū)別在于,本文方法在對ΔLODR序列建立趨勢項和周期項最小二乘外推模型之前,首先利用時間序列分析方法在ΔLODR序列首尾兩端進行數(shù)據(jù)延拓,以削弱最小二乘擬合端點效應的影響,具體方法如下:
(1)首先根據(jù)(1)式對ΔLODR序列進行最小二乘擬合,建立趨勢項和周期項外推模型,然后利用自回歸模型對最小二乘殘差序列進行預報,最后利用最小二乘外推與自回歸組合模型在ΔLODR序列首尾兩端分別外推若干數(shù)據(jù)點,這樣原始ΔLODR序列加上首尾兩端外推的數(shù)據(jù)形成了一個新序列。
(2)利用新序列確定最小二乘模型系數(shù),即用新序列重新建立趨勢項和周期項最小二乘外推模型,然后再結(jié)合最小二乘模型和自回歸模型對原始ΔLODR序列進行預報。
需要說明的是,新序列只用來求解最小二乘模型系數(shù),而在后續(xù)預報中仍然使用原始ΔLODR序列。
選用1999年1月1日至2011年10月22日期間的日長變化數(shù)據(jù)進行實驗,其中2010年1月1日至2011年10月22日作為預報期,建模序列長度取為10a。
為了驗證端點數(shù)據(jù)延拓方法對端點效應的改善效果,首先對比端點延拓前后最小二乘擬合效果。圖1繪出了端點延拓前后最小二乘擬合的殘差序列,其中圖1(a)為最小二乘擬合序列首端前50個歷元的殘差序列,圖1(b)為最小二乘擬合序列尾端最后50個歷元的殘差序列,擬合時段為2000年10月26日至2010年10月25日,端點延拓數(shù)據(jù)個數(shù)為360,即在首尾兩端各外推360個數(shù)據(jù)點。
圖1端點延拓前后最小二乘擬合效果對比
Fig.1ComparisonofLSfittingwithandwithoutedgeextension
從圖1可以看到,與端點延拓前相比,端點延拓后最小二乘擬合殘差在序列首尾兩端更接近于0,即端點延拓后最小二乘擬合的ΔLODR序列更為準確,這說明端點延拓方法能有效抑制最小二乘擬合出現(xiàn)的端點效應問題。為了進一步說明端點延拓方法對端點效應的改善作用,本文選取1999年1月1日至2009年12月31日期間的日長變化數(shù)據(jù)進行擬合實驗,將擬合長度取為10 a,每隔1 d擬合1次,即擬合滑動窗口為10 a,總共擬合300次,并統(tǒng)計每次端點延拓前后首部和尾部50個歷元殘差序列的均方根誤差(Root Mean Square Error, RMSE),其中端點延拓前首部和尾部50個歷元殘差序列的300次平均均方根誤差分別為0.29 ms和0.30 ms,端點延拓后首部和尾部50個歷元殘差序列的300次平均均方根誤差分別為0.22 ms和0.23 ms,實驗結(jié)果可以說明端點延拓方法對端點畸變的抑制效果。
為了驗證本文方法相對于常規(guī)最小二乘外推與自回歸組合模型對日長變化預報精度的改善情況,分別利用這兩種方法對日長變化進行1~360 d跨度預報,選用均方根誤差作為精度評估指標,其計算公式為
(7)
其中,Pj、Oj分別表示j點的日長變化預測值和觀測值;l為預報跨度;N為預報期數(shù)。本文總共進行了300期的預報,每次預報時建模序列長度始終取為10 a,每隔1 d滑動預報1次,即N=300。
圖2給出了本文方法和常規(guī)最小二乘外推與自回歸組合模型的日長變化預報均方根誤差對比圖,表1統(tǒng)計了兩種方法在各種跨度的預報均方根誤差情況。結(jié)合圖2和表1可以看出,本文方法的預報精度相對于常規(guī)最小二乘外推與自回歸組合模型在各個預報跨度有不同程度的改善,其中,對于1~30 d短期預報,預報精度改善不明顯,在10%以內(nèi);從第30 d開始,本文方法的預報精度明顯優(yōu)于常規(guī)最小二乘外推與自回歸組合模型,精度最大改善了15.80%,且一直保持在13%左右,這說明本文方法對于中長期跨度預報具有更明顯的優(yōu)勢,同時也從側(cè)面說明端點效應對日長變化中長期預報的影響更大。
圖2本文方法和常規(guī)最小二乘外推與自回歸組合模型的日長變化預報均方根誤差對比
Fig.2 Comparison of the prediction RMSE between the LS+AR and the proposed method
本文提出了一種顧及最小二乘擬合端點效應的日長變化預報方法,其實質(zhì)是在原始序列兩端增加統(tǒng)計延拓數(shù)據(jù),以將最小二乘擬合出現(xiàn)的端點效應移至模擬序列的兩端,從而減小原始序列的端點畸變。算例表明,通過在觀測序列的兩端增加用時間序列分析方法延拓的模擬數(shù)據(jù)點,然后再進行最小二乘擬合,可以有效削弱端點效應的影響;相對于常規(guī)最小二乘外推與自回歸組合預報模型,本文方法的日長變化預報精度有明顯改善,對于中長期預報其精度提高尤為明顯。此外,在實驗中發(fā)現(xiàn),端點延拓長度對本文方法的預報精度具有較大影響,本文對此并未進行深入研究,而僅僅選取了相對較優(yōu)的預報結(jié)果,因此,本文方法仍有提升空間。對于如何選取最佳的端點延拓長度,將進行深入研究。
[1]Gambis D, Luzum B. Earth rotation monitoring, UT1 determination and prediction[J]. Metrologia, 2011, 48(4): 165-170.
[2]Xu Xueqing, Zhou Yonghong. EOP prediction using least square fitting and autoregressive filter over optimized data intervals[J]. Advances in Space Research, 2015, 56(10): 2248-2253.
[3]Wang Qijie, Du Yanan, Liu Jian. Introducing atmospheric angular momentum into prediction of length of day change by generalized regression neural network model[J]. Journal of Central South University, 2014, 21(4): 1396-1401.
[4]Lei Yu, Zhao Danning, Cai Hongbing. Prediction of length-of-day using extreme learning machine[J]. Geodesy and Geodynamics, 2015, 6(2): 151-159.
[5]雷雨, 蔡宏兵, 趙丹寧. 樣本輸入方式對極端學習機預報日長變化的影響[J]. 天文研究與技術(shù), 2015, 12(3): 299-305.
Lei Yu, Cai Hongbing, Zhao Daning. Effects of training patterns on predictions of variations of length of day using an extreme learning machine neural network[J]. Astronomical Research & Technology, 2015, 12(3): 299-305.
[6]雷雨, 趙丹寧, 高玉平, 等. 基于高斯過程的日長變化預報[J]. 天文學報, 2015, 56(1): 53-62.
Lei Yu, Zhao Daning, Gao Yuping, et al. The prediction of length-of-day variations based on Gaussian processes[J]. Acta Astronomica Sinica, 2015, 56(1): 53-62.
[7]Lei Yu, Guo Min, Cai Hongbing, et al. Prediction of length-of-day using Gaussian process regression[J]. The Journal of Navigation, 2015, 68(3): 563-575.
[8]Petit G, Luzum B. IERS conventions (2010) [R]. Frankfurt am Main: Verlag des Bundesamts für Kartographie und Geod?sie, 2011: 123-131.
[9]丁月蓉, 鄭大偉. 天文數(shù)據(jù)處理方法[M]. 南京: 南京大學出版社, 1998: 307-308.
Enhancing the Prediction Accuracy of the Length of Day Change by Eliminating the Edge-effect of Least Squares Fitting
Lei Yu1,2,3, Cai Hongbing1,2
(1. National Time Service Center, Chinese Academy of Sciences, Xi’an 710600, China, Email: leiyu@ntsc.ac.cn;2. Key Laboratory of Time and Frequency Primary Standards, Chinese Academy of Sciences, Xi’an 710600, China;3. University of Chinese Academy of Sciences, Beijing 100049, China)
In order to eliminate the edge-effect of least squares (LS) fitting for the length of day change (ΔLOD), the time-series analysis model is first used to extrapolate ΔLOD series forward and backward and then generate a new series. Subsequently, the cofficients of a LS model are estimated using the new generated series. As a result, the edge-effect is changed to the edge of the new series, and thus the original fitted ΔLOD series can be free from the edge-effect. Finally, a combination of LS and autoregressive (AR) models (LS+AR) is employed to predict the original ΔLOD data. The results indicate that the proposed method can efficiently eliminate the edge-effect, and thus improve the prediction accurcy of the LS+AR model, especially for medium- and long-term prediction.
Length Of Day (LOD) change; Prediction; Least Squares (LS) fitting; Edge-effect; Time-series analysis
中國科學院 “西部之光” 人才培養(yǎng)計劃聯(lián)合學者項目(201491) 資助.
2015-12-29;
2016-01-19
雷雨,男,博士. 研究方向:地球自轉(zhuǎn)變化監(jiān)測與預報. Email: leiyu@ntsc.ac.cn
P227.1
A
1672-7673(2016)04-0441-05
CN 53-1189/PISSN 1672-7673