甄福東, 周淑玥, 陳麗晶, 朱嘉慧, 王海江
(1.中國民用航空西北地區(qū)空中交通管理局甘肅分局,甘肅 蘭州 730087;2.成都信息工程大學(xué),四川 成都 610225)
航線上的天氣狀況是影響航班運(yùn)行和調(diào)度的主要因素,由于缺乏準(zhǔn)確的高空風(fēng)場測量信息,研究人員不得不依賴數(shù)值天氣預(yù)報模型,該類模型通常會以較大的局部精度進(jìn)行平滑處理從而保證較大區(qū)域上的準(zhǔn)確度。與其他氣象觀測數(shù)據(jù)相比,高分辨率高空風(fēng)場觀測資料尤其稀缺,不能作為空中交通管制的參考資料[1-2]。隨著對高空風(fēng)場資料的需求,各國發(fā)展二次雷達(dá)(secondary surveillance radar,SSR)和廣播式自動相關(guān)監(jiān)視系統(tǒng)(automatic dependent surveillance-broadcast,ADS-B)技術(shù),它們不僅對航空交通管制做出了貢獻(xiàn),對解決氣象領(lǐng)域數(shù)據(jù)匱乏的問題具有重要意義,而且在實際氣象監(jiān)測和航空作戰(zhàn)中具有實用價值。因此,本文在先前的研究基礎(chǔ)上,利用ADS-B反演風(fēng)場結(jié)果進(jìn)行短時風(fēng)場的預(yù)測研究[3]。
線性回歸模型、季節(jié)性差分自回歸滑動平均模型(seasonal autoregressive integrated moving average,SARIMA)和高斯過程回歸模型(Gaussian process regression,GPR)多用于時間序列預(yù)測。第一種模型太簡單,無法對時間序列中的復(fù)雜模式進(jìn)行建模。SARIMA模型效果較好,但存在均值收斂問題,這阻礙了其在長期時間序列預(yù)測中的性能,對長期預(yù)測問題建模是不夠的。高斯過程回歸是一種非參數(shù)概率回歸技術(shù),由于其非參數(shù)特性,GPR模型比SARIMA模型具有更靈活的建模能力[4]。
GPR模型是一種強(qiáng)大的機(jī)器學(xué)習(xí)算法,只依賴很少的參數(shù)進(jìn)行預(yù)測。由于它幾乎是非參數(shù)的,所以即使在可用數(shù)據(jù)很少的情況下,也能有效地解決各種監(jiān)督學(xué)習(xí)問題[5]。目前,基于機(jī)器學(xué)習(xí)的預(yù)測模型可以考慮時間相關(guān)的組件,如季節(jié)性、趨勢、周期、不規(guī)則分量等,以最大化數(shù)據(jù)驅(qū)動預(yù)測和預(yù)測的準(zhǔn)確性。本文研究了SARIMA模型和GPR模型的建模方法,用這兩種模型預(yù)測高空風(fēng)場的時間序列,并討論了這兩種模型在短時高空風(fēng)場預(yù)測中的性能。
ARIMA模型來源于自回歸移動平均(ARMA)模型,該模型是自回歸(AR)模型和移動平均(MA)模型的組合。結(jié)構(gòu)表示為ARIMA(p,d,q),p是自回歸參數(shù),d是差分次數(shù),即用于消除趨勢和季節(jié)性并穩(wěn)定時間序列的平均水平,q是移動平均參數(shù)[6]。模型由AR模型、差分模型和MA模型3部分組成,方程式如下:
其中:Y是時序觀測值,μ是該序列的平均值,α和β分別是其對應(yīng)的權(quán)重值,εt是隨機(jī)波動偏差,ε是預(yù)測的殘差。兩個模型的混合即為ARMA(p,q)模型,從該模型出發(fā)對時間序列進(jìn)行d次差分得到ARIMA(p,d,q)模型。
時間序列一般可以分解為長期趨勢項、季節(jié)周期項和殘差項。趨勢項是指數(shù)據(jù)在很長一段時間內(nèi)的上升和下降運(yùn)動;季節(jié)周期項是數(shù)據(jù)具有季節(jié)性變化;殘差項即噪聲,是隨機(jī)間隔的尖峰和低谷。預(yù)測平穩(wěn)序列相對容易,預(yù)測更可靠,因為它消除了任何連續(xù)的自相關(guān),因此預(yù)測模型中的預(yù)測變量幾乎是獨(dú)立的。時間序列的每個周期都有其獨(dú)特的行為,如果序列不平穩(wěn),就無法預(yù)測或概括未來的時間段。因此,有必要在預(yù)測之前進(jìn)行穩(wěn)定檢驗,主要方法是利用原始數(shù)據(jù)的ADF(augmented dickey-fuller)檢驗,判斷其單位根的存在性來定義平穩(wěn)性[7]。最初的假設(shè)是有一個單位根,只要統(tǒng)計值小于1%,原始假設(shè)就會被顯著拒絕,數(shù)據(jù)被認(rèn)為平穩(wěn)。
時間序列的平穩(wěn)方法一般采用差分法,通常從差分的最低值開始,即d=1,使序列平穩(wěn)。然而,如果仍然存在顯著的趨勢或自相關(guān)性,則滯后≥10,序列需要二階差分。如果差分序列滯后1的自相關(guān)為零或負(fù),或自相關(guān)較小且無規(guī)律,則序列不需要更多差分。在獲得平穩(wěn)序列后,需要選擇模型和相應(yīng)的參數(shù)。在此之前,需要了解自相關(guān)和偏自相關(guān)的概念。自相關(guān)衡量信號與其自身的相關(guān)性,而自相關(guān)函數(shù)圖(autocorrelation bunction,ACF)是上述結(jié)果的圖形表示。偏自相關(guān)是自相關(guān)的一個子集,偏自相關(guān)函數(shù)圖(partial autocorrelation function,PACF)表示兩個時間點觀測值之間的相關(guān)性。ACF可以用來確定MA模型中使用的最佳參數(shù),而AR模型的識別通常由PACF完成[8]。
雖然ARIMA模型可以處理帶有趨勢的數(shù)據(jù),但不支持帶有季節(jié)性成分的時間序列。實驗中,由于時間序列的季節(jié)性,ARIMA的預(yù)測效果不佳。因此,本文將利用SARIMA模型對高空風(fēng)場序列進(jìn)行預(yù)測。該模型通過在ARIMA模型中加入額外的季節(jié)性項,添加3個新的超參數(shù)和額外的季節(jié)周期參數(shù)而形成。模型的季節(jié)性部分包括與模型的非季節(jié)性部分相似的項,但它們涉及季節(jié)周期的后移。SARIMA模型的建立過程如下:
(1)分析高空風(fēng)場序列的趨勢特征和季節(jié)性;
(2)時間序列數(shù)據(jù)平穩(wěn)性判斷,并對序列進(jìn)行ADF檢驗;
(3)對于非平穩(wěn)序列進(jìn)行差分處理;
(4)繪制相關(guān)圖和自相關(guān)圖;
(5)根據(jù)上述結(jié)果構(gòu)建SARIMA模型,確定相應(yīng)的參數(shù)范圍。
SARIMA模型有7個參數(shù),其結(jié)構(gòu)表示為SARIMA(p,d,q)(P,D,Q)m。非季節(jié)參數(shù)p,d,q與ARIMA模型類似,而季節(jié)參數(shù)P,D,Q是參數(shù)p,d,q對應(yīng)的季節(jié)參數(shù),m是單個季節(jié)性周期的時間步數(shù)。m會影響P,D,Q。在基于ARIMA模型配置SARIMA模型時,還需要為序列的季節(jié)性元素選擇超參數(shù)。根據(jù)ACF和PACF的圖表分布情況進(jìn)一步確定參數(shù)信息,以明確最新時間步長的相關(guān)性。同樣,也能夠根據(jù)兩個圖表得出季節(jié)滯后時間步長的相關(guān)性,從而確定SARIMA的參數(shù)值[9]。如果季節(jié)滯后k處的自相關(guān)為正,則將季節(jié)AR項(P)添加到模型中。若季節(jié)性滯后的自相關(guān)為負(fù),則將季節(jié)性MA項(Q)添加到模型中。
在建立時間序列預(yù)測模型之前,本文分析了高空風(fēng)場數(shù)據(jù)的時間序列。分析了季節(jié)性和平穩(wěn)性,以獲得未來預(yù)測的相關(guān)參數(shù)。以位置Point(0,0,11)為例對時間序列分析做說明,圖1是高空風(fēng)場x和y分量的原始序列圖,顯示了它們的變化趨勢。首先,分析原始序列的季節(jié)性,分解數(shù)據(jù)并查看季節(jié)性。圖2是相應(yīng)的季節(jié)性分析圖,x和y分量的單個季節(jié)性周期的時間步長為9 min。從圖中可以看出,該序列沒有明顯的趨勢。然后進(jìn)行ADF檢驗,發(fā)現(xiàn)高空風(fēng)場原始數(shù)據(jù)的x和y分量非平穩(wěn),因此有必要對其進(jìn)行一階差分。
圖1 高空風(fēng)場原始序列圖
圖2 高空風(fēng)場原始序列季節(jié)性分析圖
對非平穩(wěn)數(shù)據(jù)進(jìn)行差分處理,并對高空風(fēng)場時間序列的ADF檢驗結(jié)果進(jìn)行分析,該序列通過了一階差分檢驗。取d=1,并得到最終的差分序列圖,x和y分量的一階差分序列如圖3所示。同時,結(jié)合參數(shù)搜索法得到季節(jié)性預(yù)測和非季節(jié)性預(yù)測的相關(guān)參數(shù),得到了合適的預(yù)測模型。本文計算了原始序列的ACF和PACF,結(jié)果如圖4所示,反映了時間序列中的觀測值和前一時間步長中的觀測值之間的關(guān)系強(qiáng)度。根據(jù)ACF和PACF圖以及ADF檢驗結(jié)果判斷序列是否平穩(wěn),ACF函數(shù)圖和PACF函數(shù)圖顯示了明顯的截尾現(xiàn)象,再次驗證了該序列是一個平穩(wěn)時序。
圖3 高空風(fēng)場一階差分序列圖
圖4中,ACF圖顯示了時間序列與其自身滯后的相關(guān)性,每條垂直線代表序列和從滯后零點開始的滯后之間的相關(guān)性,藍(lán)色陰影區(qū)域是顯著性水平,藍(lán)色陰影區(qū)域之外的滯后是更大的滯后。PACF顯示任何給定時間序列滯后與當(dāng)前序列之間的自相關(guān),但消除了兩者之間的滯后。從ACF圖可以看出,除了第一條垂直線之外,幾乎所有的滯后都在藍(lán)色突出顯示的區(qū)域,這表明不同滯后觀測值之間的相關(guān)性幾乎為零。最后,結(jié)合直接搜索結(jié)果,確定兩個序列的模型如下:
圖4 高空風(fēng)場一階差分序列ACF和PACF圖
高斯過程的一種應(yīng)用是通過監(jiān)督學(xué)習(xí)進(jìn)行回歸,被稱為高斯過程回歸(GPR)。GPR可以看作是一種機(jī)器學(xué)習(xí)算法,結(jié)合先驗知識并找到一個函數(shù)來盡可能接近地描述一組給定的數(shù)據(jù)點。換句話說,高斯過程回歸的主要思想是從無數(shù)函數(shù)中找到滿足測試數(shù)據(jù)的任何函數(shù)集,根據(jù)一組數(shù)據(jù)集的先驗信息不斷縮小找到的函數(shù)集的范圍,最后通過貝葉斯法則的方法和高斯分布的性質(zhì)來計算找到的函數(shù)集的分布,并根據(jù)函數(shù)集的分布對后續(xù)數(shù)據(jù)進(jìn)行預(yù)測[10]。
高斯過程由一個過程f(x)的均值函數(shù)m(x)和核函數(shù)k(x,x')確定,其中x和x'表示兩個不同的樣本輸入隨機(jī)變量。那么f(x)的高斯過程即可表示為
核函數(shù)是高斯過程的核心,決定了高斯過程的性質(zhì)。在高斯過程中生成一個協(xié)方差矩陣來衡量任意兩點之間的距離。矩陣描述了分布的形狀,決定了預(yù)測函數(shù)的特性。核函數(shù)的作用是在空間上平滑先驗分布,即通過先驗約束使相鄰點具有更大的相似度,其測量值或估計值也具有更大的相似度,從而使擬合函數(shù)具有更好的空間平滑性。同時,生成的協(xié)方差矩陣不僅描述了分布的形狀,還決定了預(yù)測函數(shù)的特性。因此,可以建立訓(xùn)練集數(shù)據(jù) y和測試集 y'的聯(lián)合分布[11]:
由此可以算出待測試數(shù)據(jù)y'的后驗概率分布。
不同的核函數(shù)有不同的衡量方法,得到的高斯過程的性質(zhì)也不同。本文將討論3個常見的核函數(shù):平方指數(shù)核(squared exponential,SE)、有理二次核(rational quadratic kernel,RQ)和周期性內(nèi)核(periodic kernel,PER)。
2.2.1 平方指數(shù)核(SE)
平方指數(shù)核是無窮可微的,作為協(xié)方差函數(shù),具有所有階導(dǎo)數(shù)和2個自由參數(shù):
在函數(shù)假設(shè)中,長度比例參數(shù)l起著重要作用。較小的l會使函數(shù)曲線變化更快,且協(xié)方差隨著點間距離的增大而迅速衰減到零。相反,較大的l會導(dǎo)致緩慢的變化,會產(chǎn)生一個非常平滑的函數(shù)。在實際訓(xùn)練過程中,為了模擬快速變化的函數(shù),應(yīng)該使用較小的l;要外推一個遠(yuǎn)離訓(xùn)練數(shù)據(jù)的值,應(yīng)選擇較大的l。噪聲方差參數(shù)決定了函數(shù)與其平均值之間的平均距離,該距離通常用作衡量先驗函數(shù)簇波動的尺度因子。
2.2.2 有理二次核(RQ)
有理二次核可以看作是將不同長度比例的平方指數(shù)核相加,在一定程度上可以替代平方指數(shù)內(nèi)核,解決高斯核計算速度慢的問題。它有2個自由參數(shù),函數(shù)形式為
其中,α是形狀參數(shù),其定義了局部變化的速度,α越大局部變化則越快。l與平方指數(shù)核的含義相同。有理二次核更適合對非光滑、粗糙的函數(shù)進(jìn)行建模。
2.2.3 周期性內(nèi)核(PER)
周期性內(nèi)核允許模擬周期性函數(shù),類似于平方指數(shù)核,但其距離是實際距離的正弦。周期性內(nèi)核有2個自由參數(shù),函數(shù)形式為
其中,p是周期參數(shù),控制著函數(shù)上的重復(fù)結(jié)構(gòu),周期參數(shù)p越大,變化趨勢越平緩。同時,它會導(dǎo)致精確的重復(fù)結(jié)構(gòu),但在實際數(shù)據(jù)中出現(xiàn)的重復(fù)結(jié)構(gòu)通常不會有精確的振蕩。l與平方指數(shù)核的含義相同。
SE、RQ和PER共有的一個重要特性是平穩(wěn)性。核函數(shù)具有平移不變性,其中函數(shù)的值僅取決于數(shù)據(jù)點之間的差異,而不取決于數(shù)據(jù)點本身。另一個重要方面是內(nèi)核的局部性,SE和RQ核函數(shù)在相似數(shù)據(jù)點之間表現(xiàn)出很強(qiáng)的協(xié)方差,但協(xié)方差隨著差異的增加而衰減為零。這是一個局部內(nèi)核的指示器,只顯示與附近點的高度相似性。與SE和RQ核不同,PER不具有局部特征。當(dāng)進(jìn)行外推時,會退回到?jīng)]有數(shù)據(jù)點的區(qū)域,所以核的局部特征非常重要。否則,所有外推數(shù)據(jù)點與其他數(shù)據(jù)點之間的相似度將為零,GP模型將僅由均值函數(shù)控制[12]。
通常在模型的訓(xùn)練中尋找最優(yōu)參數(shù),本文采用最大化邊際對數(shù)似然法。通過組合核函數(shù)中的每個超參數(shù)來建立超參數(shù)矢量θ。設(shè)計了訓(xùn)練樣本的條件概率信息似然函數(shù),并將邊緣對數(shù)似然表示為式(13)。同時,采用極大似然方法最大化在這些超參數(shù)下y出現(xiàn)的概率,并根據(jù)訓(xùn)練樣本求解超參數(shù)矢量θ。一旦給出了核函數(shù)、核函數(shù)的參數(shù)和訓(xùn)練數(shù)據(jù),就可以唯一確定模型。
給定一些訓(xùn)練數(shù)據(jù),高斯過程可以通過獲得其后驗分布來進(jìn)行回歸。本文建立模型的主要步驟如下:
(1)輸入實際觀測到的風(fēng)速時間序列;
(2)確定實驗的樣本數(shù)量并進(jìn)行單一核函數(shù)實驗;
(3)選擇合適的組合核函數(shù);
(4)采用極大似然法并結(jié)合數(shù)據(jù)分布獲得適合該時間序列的超參數(shù)。
2.3.1 實驗數(shù)據(jù)說明
目前,ADS-B設(shè)備的覆蓋仍然不完整,航班數(shù)量較少,在某些時段和高度缺乏數(shù)據(jù)。通過對各位置風(fēng)場時間序列的分析,發(fā)現(xiàn)數(shù)據(jù)缺失程度嚴(yán)重。如果按照通常的風(fēng)場補(bǔ)盲處理,可能會得到不理想的值,甚至?xí)淖冋鎸嶏L(fēng)場的特征和變化規(guī)律,從而影響模型的訓(xùn)練結(jié)果和預(yù)測的準(zhǔn)確性。為保證所研究模型適合真實的反演風(fēng)場且不受插值誤差的影響,本文選取數(shù)據(jù)完整的風(fēng)場序列進(jìn)行短期的風(fēng)場預(yù)測模型研究。
2.3.2 核函數(shù)的選擇與超參數(shù)的確定
常用的核函數(shù)只適用于簡單的場合,核函數(shù)的一個優(yōu)點是可以組合形成一個更專門的核函數(shù)。這允許在先驗?zāi)P椭屑尤敫嘈畔?以使預(yù)測更準(zhǔn)確。本文的高空風(fēng)場信號中,特別是在風(fēng)場的擬合和外推方面,性能不足。因此,有必要深入分析每個核函數(shù)的特性,通過核函數(shù)之間的簡單運(yùn)算,如加法、乘法和指數(shù)運(yùn)算,創(chuàng)建更復(fù)雜的核函數(shù)。本文考慮了多個核函數(shù)的線性組合,核函數(shù)的組合形式為
其中:Km為第m個簡單核函數(shù),am為權(quán)重系數(shù)。GPR的核函數(shù)應(yīng)該充分展示輸入之間的相似性。
本文對風(fēng)場的水平分量和垂直分量進(jìn)行多次實驗,最后為這兩個分量選擇了不同的組合核函數(shù)。對于水平風(fēng)分量,選取有理二次核和周期性內(nèi)核的組合作為核函數(shù),組合形式如式(15)所示。對于垂直風(fēng)分量,選取平方指數(shù)核與周期性內(nèi)核的組合作為核函數(shù),組合形式如式(16)所示。
確定了核函數(shù)后,對模型進(jìn)行訓(xùn)練和優(yōu)化,通過最大化邊緣對數(shù)似然法確定每個組合核函數(shù)的超參數(shù),并獲得更好的參數(shù)值。
基于高斯過程的預(yù)測算法在確定核函數(shù)時,選擇了兩個基本核函數(shù)的加性組合,得到理想結(jié)果。未來,將會考慮核函數(shù)的自動選擇算法來比較和分析更多的核函數(shù),并盡可能詳細(xì)地選擇最佳的時間序列預(yù)測模型[13]。
原始風(fēng)場時間序列包含1 h的風(fēng)場數(shù)據(jù),通過反復(fù)實驗,并結(jié)合現(xiàn)有數(shù)據(jù)的特點,本文利用1 h數(shù)據(jù)進(jìn)行實驗??刂茦颖军c為120,將樣本點分為訓(xùn)練集A1[1:60]、驗證集A2[61:90]和測試集A3[91:120]。在實際預(yù)測中,通過前60個采樣點預(yù)測接下來30個采樣點的風(fēng)場,即利用30 min的數(shù)據(jù)集預(yù)測未來的15 min。將選用2018年1月1-10日的完整風(fēng)場時間序列來描述實驗過程,并分別對SARIMA模型和高斯過程回歸模型的預(yù)測結(jié)果進(jìn)行對比分析。
將SARIMA模型用于預(yù)測2018年1月1-10日的完整風(fēng)場時間序列。為保證所研究的模型適用于實際的反演風(fēng)場且不受插值誤差的影響,隨機(jī)選擇4個位置Point1(-60,-120,11),Point2(0,-120,11),Point3(60,-120,11)和Point4(60,60,1)的風(fēng)場序列進(jìn)行短期風(fēng)場預(yù)測模型研究和實驗。圖5~8顯示了選取前60個采樣點預(yù)測未來30個點的值,從圖中的結(jié)果來看,SARIMA模型基本上可以捕捉到短時風(fēng)場的變化。特別是對于緩慢變化的x分量,該模型很適合于訓(xùn)練集,但個別值存在突變,同時,它在測試集上具有一定的泛化能力,能夠基本預(yù)測風(fēng)場時間序列的變化趨勢。對于數(shù)據(jù)波動較大的y分量,結(jié)果不太理想,誤差較大。首先,該模型在測試集中誤差較大,個別數(shù)值的突變情況更加嚴(yán)重,但也保持了整體的變化趨勢。預(yù)測結(jié)果偏差較大,不在可接受范圍內(nèi)。
圖5 Point1(-60,-120,11)一階差分序列ACF和PACF圖
圖6 Point2(0,-120,11)一階差分序列ACF和PACF圖
圖7 Point3(60,-120,11)一階差分序列ACF和PACF圖
圖8 Point4(60,60,1)一階差分序列ACF和PACF圖
此外,表1是預(yù)測的相關(guān)指標(biāo),風(fēng)速預(yù)測偏差保持在10 m/s以內(nèi),整體結(jié)果可接受。COR衡量的方向相似性較低,尤其是y分量,存在完全不相關(guān)的情況。用R衡量的相似性相對更可靠,基本上超過70%。綜合評價指標(biāo)Combine的值基本在50%以上,低于50%的部分效果并不理想。
表1 基于SARIMA模型的預(yù)測結(jié)果準(zhǔn)確性
將高斯過程回歸模型用于預(yù)測2018年1月1-10日的完整風(fēng)場時間序列。上節(jié)中4個位置的風(fēng)場序列,用于短時風(fēng)場預(yù)測模型研究和實驗。圖9~12所示是選取前60個采樣點預(yù)測未來30個點的值,其中淺藍(lán)色區(qū)域是95%置信區(qū)間。從結(jié)果來看,無論是x分量還是y分量,該模型都能很好地擬合測試集數(shù)據(jù),并預(yù)測未來風(fēng)場序列的變化趨勢。
圖9 Point1(-60,-120,11)一階差分序列ACF和PACF圖
圖10 Point2(0,-120,11)一階差分序列ACF和PACF圖
圖11 Point3(60,-120,11)一階差分序列ACF和PACF圖
圖12 Point4(60,60,1)一階差分序列ACF和PACF圖
計算的高斯過程回歸模型預(yù)測的風(fēng)場序列的各項指標(biāo)如表2所示。分別顯示了x和y分量預(yù)測指標(biāo)的統(tǒng)計結(jié)果。平均絕對誤差MAE在5 m/s以內(nèi),x分量的準(zhǔn)確性普遍優(yōu)于y分量。COR和R指標(biāo)幾乎都在50%以上,綜合評價指標(biāo)Combine的值都高于50%,說明預(yù)測結(jié)果具有較高的可靠性。
表2 基于GPR模型的預(yù)測結(jié)果準(zhǔn)確性
通過對兩種預(yù)測方法的研究,發(fā)現(xiàn)基于高斯過程的回歸預(yù)測模型的性能優(yōu)于基于SARIMA的預(yù)測模型。SARIMA模型對x分量有很好的預(yù)測效果,但對y分量的預(yù)測效果不理想。無論是x分量還是y分量,GPR模型的預(yù)測準(zhǔn)確性都優(yōu)于SARIMA模型。
首先,GPR模型能夠更好地掌握一些細(xì)節(jié)信息和數(shù)據(jù)變化趨勢,具有很好的泛化能力,而SARIMA模型更能預(yù)測序列的變化趨勢,因此在一定程度上降低了準(zhǔn)確性。其次,由于本文研究的是短時風(fēng)場預(yù)測,采樣點數(shù)量較少,且GPR模型的核函數(shù)相對簡單,兩種模型所花費(fèi)的時間差別不大。最后,統(tǒng)計發(fā)現(xiàn)SARIMA模型的整體穩(wěn)定性不如GPR模型。前者能更好地預(yù)測某些時間序列的結(jié)果,但難以預(yù)測某些趨勢變化較大的序列。GPR模型具有更好的整體穩(wěn)定性和更廣泛的適用性??傮w而言,基于GPR的方法優(yōu)于基于SARIMA的方法。
本文分析了高空風(fēng)場時間序列的分布特征,研究高空風(fēng)場時間序列的短時預(yù)測算法。首先,建立了SARIMA預(yù)測模型,并根據(jù)時間序列的季節(jié)性和平穩(wěn)性選擇了模型細(xì)節(jié)和參數(shù)。其次,為GPR預(yù)測模型選擇合適的核函數(shù),并不斷優(yōu)化模型的超參數(shù)。最后,利用兩種模型對高空風(fēng)場的完整時間序列進(jìn)行了預(yù)測,并對兩種模型在實際時間序列中的應(yīng)用結(jié)果進(jìn)行了比較和評價。比較分析了上述模型的優(yōu)缺點和適應(yīng)性,得出了適合高空風(fēng)場序列預(yù)測的模型。
研究結(jié)果表明,基于GPR的方法優(yōu)于基于SARIMA的方法。對于具有明顯規(guī)律性的長期時間序列問題,基于GPR的方法比基于SARIMA的方法更可取。此外,還應(yīng)考慮結(jié)構(gòu)建模的性能,因為與SARIMA相比,GPR需要大量的訓(xùn)練時間。計算時間已成為所提出的GPR方法的主要缺點,但這一缺點對本文所研究的問題沒有影響,時間差異不大。當(dāng)然,在與大數(shù)據(jù)預(yù)測相關(guān)的其他問題上,盡管GPR在預(yù)測性能上優(yōu)于SARIMA模型,但這個計算問題是使用GPR方法取代SARIMA模型的最大障礙。