錢 煒 岳建平 單麗杰 韓宸宇
1 河海大學(xué)地球科學(xué)與工程學(xué)院,南京市佛城西路8號(hào),211100
日長(zhǎng)(length-of-day,LOD)是地球自轉(zhuǎn)參數(shù)之一,獲取LOD時(shí)存在著時(shí)延問(wèn)題,因此,對(duì)日長(zhǎng)變化進(jìn)行高精度預(yù)報(bào)具有重要的科學(xué)意義和應(yīng)用價(jià)值[1]。傳統(tǒng)的日長(zhǎng)變化預(yù)報(bào)采用最小二乘擬合外推與其他殘差修正的組合模型[2-4]方法。然而,最小二乘法是線性擬合方法,不能很好地?cái)M合日長(zhǎng)變化序列中實(shí)際存在的非線性特征,從而影響最終的預(yù)報(bào)精度。研究表明,大氣活動(dòng)與日長(zhǎng)變化密切相關(guān),甚至部分日長(zhǎng)變化年際尺度信號(hào)可以完全由大氣激發(fā)來(lái)解釋[5-6]。文獻(xiàn)[7-8]在預(yù)報(bào)日長(zhǎng)變化時(shí),在誤差修正模型中引入軸向大氣角動(dòng)量(atmospheric angular momentum,AAM)序列,結(jié)果表明,顧及大氣角動(dòng)量能夠有效提高日長(zhǎng)變化的預(yù)報(bào)精度。
本文提出應(yīng)用于日長(zhǎng)變化預(yù)測(cè)的Prophet與向量自回歸(VAR)組合模型。Prophet模型適用于擬合信號(hào)的非線性特征,VAR模型本質(zhì)上是自回歸模型(AR)在多元變量時(shí)間序列領(lǐng)域的推廣。首先,利用Prophet模型代替最小二乘法,分別對(duì)日長(zhǎng)變化參數(shù)序列及大氣角動(dòng)量序列進(jìn)行趨勢(shì)項(xiàng)及周期項(xiàng)擬合外推;然后,針對(duì)所得的兩種時(shí)序殘差,利用VAR模型再次進(jìn)行擬合;最后,將兩種模型預(yù)報(bào)結(jié)果相加,即可得到日長(zhǎng)變化的最終預(yù)報(bào)結(jié)果。
Prophet模型是由Facebook在2017年構(gòu)建的一種用于時(shí)序分析的新模型,該模型算法將時(shí)間序列y(t)分解為長(zhǎng)期趨勢(shì)項(xiàng)、季節(jié)周期項(xiàng)以及節(jié)假日效應(yīng)項(xiàng)等特征,并通過(guò)貝葉斯曲線擬合分別對(duì)各特征序列進(jìn)行建模及預(yù)測(cè),最后根據(jù)如下廣義加法模型對(duì)特征序列進(jìn)行累加,以此得到完整的擬合及預(yù)測(cè)結(jié)果[9]:
y(t)=g(t)+s(t)+h(t)+ε(t)
(1)
式中,y(t)為完整時(shí)間序列,g(t)、s(t)、h(t)分別為趨勢(shì)項(xiàng)、周期項(xiàng)及節(jié)日項(xiàng),ε(t)為誤差項(xiàng)。趨勢(shì)項(xiàng)g(t)的邏輯回歸函數(shù)為[9]:
(2)
式中,C為趨勢(shì)上限,k為增長(zhǎng)率,m為偏移量。隨著時(shí)間t的延續(xù),曲線以增長(zhǎng)率k非線性增加,最后趨于上限值C[10]。周期項(xiàng)s(t)的模型為[11]:
(3)
式中,T為周期,N為頻譜個(gè)數(shù)。
p階的VAR(p)模型可以表達(dá)為[12]:
yt=c+A1yt-1+…+Apyt-p+εt
(4)
式中,c為n×1階待估常數(shù)向量;Ai為n×n階待估系數(shù)矩陣;yi為n維內(nèi)生變量組成的向量;εt為隨機(jī)擾動(dòng)項(xiàng),與自身滯后項(xiàng)及等式右邊各變量嚴(yán)格無(wú)關(guān)[12]。構(gòu)建VAR模型最關(guān)鍵的步驟是通過(guò)不同的篩選準(zhǔn)則確定最優(yōu)滯后階數(shù)p。以最終預(yù)測(cè)誤差(FPE)為例,其表達(dá)式為:
FPE(p)=
(5)
預(yù)報(bào)流程如下:1)在原始LOD時(shí)序中去除固體潮影響,得到LODR序列;2)利用Prophet算法將LODR序列進(jìn)行特征分解,得到基于Prophet的擬合序列;3)利用LODR擬合的殘差序列,以及經(jīng)過(guò)Prophet擬合的AAM殘差序列,共同建立VAR模型,從而得到顧及大氣角動(dòng)量的殘差修正模型預(yù)測(cè)結(jié)果;4)將Prophet擬合序列和VAR擬合序列的預(yù)測(cè)結(jié)果相加,得到最終的LODR預(yù)測(cè)值。采用平均絕對(duì)誤差(MAE)作為預(yù)測(cè)精度的評(píng)價(jià)指標(biāo),其計(jì)算公式為[15]:
(6)
日長(zhǎng)變化數(shù)據(jù)為IERS發(fā)布的EOP14 C04地球自轉(zhuǎn)參數(shù)序列(http:∥hpiers.obspm.fr/iers/eop),大氣角動(dòng)量序列來(lái)源于由歐洲中期氣候預(yù)報(bào)中心(ECMWF)發(fā)布的軸向分量χ3序列(http:∥rz-vm115.gfz-potsdam.de:8080/repository)。序列區(qū)間為2008-01-01~2020-12-31,區(qū)間內(nèi)序列保持連續(xù),其中2008-01-01~2019-12-31為初始建模序列,預(yù)報(bào)跨度為150 d。每進(jìn)行一次預(yù)報(bào)后將序列整體進(jìn)行隔天前推,從而在維持預(yù)報(bào)序列總長(zhǎng)度為12 a的情況下進(jìn)行第二次預(yù)報(bào)。以此類推,總預(yù)報(bào)期數(shù)為217組,統(tǒng)計(jì)所有組1~150 d預(yù)報(bào)期間的平均絕對(duì)誤差進(jìn)行分析。圖1為去除潮汐項(xiàng)后的LODR序列及原始AAM序列,可以看出,兩個(gè)序列之間存在明顯的同向運(yùn)動(dòng)規(guī)律,對(duì)其進(jìn)行皮爾遜相關(guān)性分析,得到二者的相關(guān)系數(shù)為0.751,呈強(qiáng)相關(guān),因此完全可以引入大氣角動(dòng)量序列來(lái)預(yù)報(bào)日長(zhǎng)變化。
圖1 去除潮汐項(xiàng)后的LODR序列及原始AAM序列Fig.1 LODR sequence after deducting tidal term and original AAM sequence
采用Prophet算法分別對(duì)LODR和AAM序列進(jìn)行擬合,并預(yù)測(cè)2020年數(shù)值,結(jié)果如圖2和圖3所示。由圖可見(jiàn),經(jīng)過(guò)Prophet算法擬合后,擬合曲線可以較好地反映相應(yīng)原始序列的發(fā)展趨勢(shì)。為更好地顯示擬合效果,對(duì)LODR序列與其擬合序列作差,并統(tǒng)計(jì)殘差序列的分布情況,將統(tǒng)計(jì)結(jié)果與經(jīng)過(guò)最小二乘擬合去除趨勢(shì)項(xiàng)及周期項(xiàng)的殘差統(tǒng)計(jì)信息進(jìn)行對(duì)比。表1(單位ms)給出了LODR序列分別經(jīng)過(guò)Prophet、LS擬合后殘差序列的均方根誤差(RMSE)、平均值、最大值及最小值信息。統(tǒng)計(jì)發(fā)現(xiàn),采用Prophet算法來(lái)擬合外推LODR序列更為有效。
圖2 Prophet模型擬合預(yù)報(bào)LODR效果Fig.2 The results of fitting and predicting LODR by Prophet model
圖3 Prophet模型擬合預(yù)報(bào)AAM效果Fig.3 The results of fitting and predicting AAM by Prophet model
表1 LODR殘差序列的統(tǒng)計(jì)信息
圖4為擬合后的LODR及AAM殘差序列,二者之間的相關(guān)系數(shù)為0.815。這說(shuō)明殘差序列之間依然存在著較強(qiáng)的相關(guān)性,并且兩個(gè)殘差序列均為平穩(wěn)序列。因此,可以考慮建立聯(lián)合LODR殘差序列及AAM殘差序列的VAR誤差補(bǔ)償模型,再次對(duì)Prophet模型的LODR預(yù)測(cè)誤差進(jìn)行擬合修正。
圖4 LODR及AAM殘差序列Fig.4 Residual sequences of LODR and AAM
建立VAR模型的關(guān)鍵是確定模型的階數(shù)q。利用初始?xì)埐钚蛄?,分別計(jì)算其1~100階內(nèi)的FPE、AIC及SC指數(shù),結(jié)果如圖5所示。圖中虛線代表序列最小值處的階數(shù),分別為63、63、26。根據(jù)多數(shù)原則,本文選取p值為63作為VAR模型的階數(shù),從而構(gòu)建VAR(63)模型用于擬合預(yù)測(cè)。值得注意的是,這僅僅是初始?xì)埐罱P蛄兴鶚?gòu)造的預(yù)報(bào)模型,當(dāng)完成一期預(yù)報(bào)后,第二期的建模序列會(huì)整體向前推移1 d,此時(shí)需要重新構(gòu)造VAR模型。
圖5 3種定階準(zhǔn)則指數(shù)信息Fig.5 Index information of three order determination criteria
構(gòu)建好VAR模型后,需要檢驗(yàn)?zāi)P褪欠穹€(wěn)定,判斷的準(zhǔn)則是模型特征根倒數(shù)的模均小于1。檢驗(yàn)結(jié)果如圖6所示,圖中點(diǎn)表示特征根的倒數(shù)。如果沒(méi)有點(diǎn)落在單位圓外,就認(rèn)為通過(guò)了平穩(wěn)檢驗(yàn),VAR誤差補(bǔ)償模型有效。
圖6 特征根檢驗(yàn)Fig.6 Eigenvalues test
利用Prophet和VAR模型,可得到每期最終的LODR預(yù)測(cè)序列。將EOP14 C04序列作為真值序列,在217組預(yù)報(bào)全部完成以后,計(jì)算1~150 d跨度的MAE值,并將其作為精度評(píng)價(jià)指標(biāo)。為了更好地分析預(yù)報(bào)效果,本文設(shè)計(jì)另外兩種方案作為對(duì)比:
1)Prophet-AR模型。不考慮AAM序列,僅依據(jù)LODR序列進(jìn)行日長(zhǎng)預(yù)測(cè)。此時(shí),VAR模型變?yōu)閱巫兞康腁R模型。將此方法與本文方法進(jìn)行對(duì)比,可分析顧及大氣角動(dòng)量對(duì)預(yù)報(bào)效果的影響。
2)LS-AR模型。提取原始序列趨勢(shì)項(xiàng),選用傳統(tǒng)的LS算法來(lái)代替Prophet算法。將此方法與本文方法及方案1進(jìn)行對(duì)比,可分析Prophet算法與LS算法的優(yōu)劣。
3種方案采用同樣的預(yù)報(bào)流程,最終的MAE序列如圖7所示。由圖可見(jiàn),在1~150 d的預(yù)報(bào)跨度內(nèi),本文給出的Prophet-VAR預(yù)報(bào)模型最優(yōu)。為定量分析預(yù)報(bào)效果,表2(單位ms)列出3種方案在1~150 d預(yù)報(bào)跨度的MAE值,并分別計(jì)算Prophet-AR模型及Prophet-VAR模型相對(duì)于LS-AR模型的精度改善百分比。
圖7 3種預(yù)報(bào)模型的MAE曲線Fig.7 The MAE curves of three prediction models
表2 3種預(yù)報(bào)模型的MAE值及對(duì)比LS-AR的改善程度
由表2可見(jiàn),Prophet-AR與LS-AR相比,精度提升8%~40%,尤其是在超短期預(yù)報(bào)(1~10 d)中精度改善幅度更大。Prophet-VAR與LS-AR相比,精度提升16%~57%,在任意預(yù)報(bào)跨度內(nèi)的精度提升都非常明顯,且顯著高于同時(shí)段Prophet-AR方法的改善精度,表明在日長(zhǎng)變化參數(shù)預(yù)報(bào)中加入大氣角動(dòng)量序列,對(duì)預(yù)報(bào)精度有明顯的提升作用。綜上所述,顧及大氣角動(dòng)量的Prophet-VAR模型是一種非常有效的日長(zhǎng)變化預(yù)報(bào)方法。
本文提出一種顧及大氣角動(dòng)量的Prophet-VAR日長(zhǎng)變化參數(shù)預(yù)報(bào)模型,利用2008-01-01~2020-12-31期間的日長(zhǎng)變化序列進(jìn)行實(shí)驗(yàn),以1~150 d的預(yù)報(bào)跨度來(lái)分析該模型的預(yù)報(bào)效果。為便于比較,同時(shí)設(shè)計(jì)了傳統(tǒng)的LS-AR及不顧及大氣角動(dòng)量的Prophet-AR兩種預(yù)報(bào)方案與本文方法進(jìn)行對(duì)比分析,評(píng)價(jià)指標(biāo)采用平均絕對(duì)誤差。結(jié)果表明,Prophet算法代替LS算法來(lái)結(jié)合AR模型在預(yù)報(bào)日長(zhǎng)變化參數(shù)時(shí)更有優(yōu)勢(shì),這種優(yōu)勢(shì)在超短期預(yù)報(bào)時(shí)最為明顯,且加入大氣角動(dòng)量序列對(duì)提高預(yù)報(bào)精度有顯著的提升效果。由此說(shuō)明,在預(yù)報(bào)日長(zhǎng)變化參數(shù)時(shí)顧及大氣角動(dòng)量的Prophet-VAR模型是一種更有優(yōu)勢(shì)的高精度預(yù)報(bào)模型。
本文在分析過(guò)程中發(fā)現(xiàn),盡管Prophet算法相較于LS算法能夠更加有效地?cái)M合LODR原始序列中的趨勢(shì)項(xiàng),從而提取出更多真實(shí)的非線性長(zhǎng)期趨勢(shì)項(xiàng)信號(hào),但在提取周期項(xiàng)時(shí),其與LS算法一樣,仍然是提取振幅固定的周期信號(hào),這并不符合日長(zhǎng)變化序列的周期振幅時(shí)變特征。因此下一步的工作可以從該角度出發(fā),探索如何通過(guò)提取更準(zhǔn)確的周期項(xiàng)信號(hào)來(lái)提升日長(zhǎng)變化參數(shù)預(yù)報(bào)的效果。