張大斌, 曾莉玲, 凌立文
(華南農業(yè)大學 數學與信息學院,廣東 廣州 510642)
農產品期貨價格時間序列的準確預測不僅能夠指導農業(yè)生產和經營,而且為政府輔助決策提供依據。因受多種因素,如外部市場、金融投機、國際形勢等影響,農產品期貨市場價格呈現出復雜的波動性、非線性特征,是一種典型的復雜時間序列,其準確預測極具挑戰(zhàn)性。
在復雜時間序列預測建模領域中,分解集成方法論被視為是一種有效的提高預測精度的策略,其核心思想是利用信號分解算法將復雜的時間序列分解為一系列相對簡單且平穩(wěn)的子序列,以此降低建模工作的復雜度[1]。相比于其他分解模型,如小波分解(Wavelet Transform, WT)、經驗模態(tài)分解 (Empirical Mode Decomposition, EMD)[2,3],變分模態(tài)分解(Variational Mode Decomposition, VMD)作為一種完全內在、自適應非遞歸的分解技術,可以更為有效的捕獲時間序列的波動特征,從而提高預測精度,在能源、有色金屬等眾多領域已經得到廣泛應用[4,5]。例如,Liu等將LSTM網絡結合EMD、VMD構建集成預測模型,選擇有色金屬價格作為對象,結合VMD分解技術的集成模型預測性能更優(yōu)[6]。在農產品價格預測領域中也有相應的運用,例如,Wang分別將反向傳播神經網絡(BPNN)結合EMD、VMD、WT和STL分解,選擇三種期貨價格進行實驗,所有混合模型與分解技術相結合均具有比單個模型更好的性能,VMD在提高預測能力方面貢獻最大[7]。
盡管眾多研究表明VMD分解具有較優(yōu)的性能,但其分解效果受關鍵參數模態(tài)數K值的影響,即分解過多或不足都會影響分析結果的準確性[8]。因此在分解前選擇適當的K值,是VMD廣泛應用的關鍵。針對K值選取的難題,Zhang等使用VMD對風速時間序列進行分解,并且通過計算重構后序列的樣本熵(Sample Entropy, SE)優(yōu)化分解K值[9]。然而,樣本熵采用二值函數度量相似度,且不計算自身匹配的統(tǒng)計量,因此容易產生不準確或無定義的樣本熵[10]。基于此,本文在樣本熵的基礎上,引入模糊熵(Fuzzy Entropy, FE)優(yōu)化VMD分解,獲得適當的模態(tài)數K。與樣本熵的二值函數相比,使用模糊隸屬度函數進行相似性的度量,其模糊邊界測量,能夠提高對信號復雜度的評估,使得熵值的變化更加連續(xù)平穩(wěn)[11]。由于模糊熵反映了時間序列的復雜度,因此當時間序列受到干擾,其狀態(tài)值的不確定性增加時,熵值會相應地增加。
上述優(yōu)化VMD分解得到不同尺度的子序列以后,需要選擇有效的預測模型,適應不同尺度的時間序列預測。極限學習機(Extreme Learning Machine, ELM)由于無需多次迭代調整神經網絡權值,學習過程僅需計算輸出權重,強大的學習速度和泛化能力,能夠有效捕捉VMD分解得到的不同尺度子序列的波動特征,已經在農產品價格預測中得到廣泛應用[12]。本文選擇ELM對VMD分解得到的子序列進行預測,集成得到最終預測結果。選取CBOT交易所的小麥、稻谷和豆粕期貨價格作為實證對象,構建VMD-ELM的分解集成預測模型,實驗驗證了所提出的分解集成預測模型的有效性。
就時間序列分解算法而言,奇異譜分解(Singular Spectrum Analysis, SSA)是一種時域和頻域相結合的非參數方法,能夠有效提取時間序列中的主要成分,具有適用性廣泛且操作靈活的優(yōu)點[13]。互補集合經驗模態(tài)分解方法(Complementary ensemble empirical mode decomposition,CEEMD)因能在一定程度上抑制了EMD分解中存在的模態(tài)混淆、端點效應等問題,因此廣泛用于序列分解領域[14]。VMD分解是Dragomiretskiy等于2014年提出一種新型分解方法,其不僅計算效率高,且在解決信號噪聲和避免模態(tài)混淆的問題上具有優(yōu)勢[15]。VMD分解通過設置合理的預設模態(tài)數K,將原始時間序列x(t)分解成K個模態(tài)函數uk,算法步驟如下:
(1)對于模態(tài)uk,通過Hilbert變換計算相應解析信號,從而獲得單邊頻譜,隨后加入指數項調整各自的中心頻率ωk,將每個模態(tài)函數的頻譜調制到基帶,使得uk的有限頻帶圍繞著其中心頻率ωk,對已解調信號應用高斯平滑估算相應的帶寬,使得帶寬之和最小,故將受約束的變分模型構造為:
(1)
式中,t為時間,δ(t)為單位沖擊函數,uk為分解模態(tài),wk為模態(tài)對應的中心頻率,約束條件為∑kuk=f(t)各模態(tài)之和等于原始信號f(t)。
(2)引入二次懲罰因子α和拉格朗日乘子λ,將變分問題轉化為無約束優(yōu)化問題:
L({uk},{wk},λ)
(2)
(3)使用拉格朗日函數將其從時域轉化到頻域,并計算相應的極值,模態(tài)分量uk及其中心頻率wk的求解表達式如下:
(3)
(4)采用交替方向乘子法(ADMM)交替更新,將原始信號分解為K個窄帶模態(tài)分量,得到約束變分模型的最優(yōu)解。
(4)
針對VMD分解模態(tài)數K值選擇的難題,本文利用模糊熵優(yōu)化VMD分解模型,模糊熵的具體計算過程如下:
(4)因此,定義模糊熵FE(m,n,r,N)=lnφm(n,r)-lnφm+1(n,r)。
FE的計算與m,n,r這幾個參數有關,通常嵌入維數m取2,此時計算量較小且對序列的變化更敏感;相似容限度r不宜過大,一般取r=0.2*std,std為序列的標準差,n取常用值1。由于模糊熵能度量時間序列的復雜度,基于此,基于最小模糊熵準則優(yōu)化VMD分解模態(tài)數K值的方法具體步驟如下:首先,給定K=3,4,…,14,使用VMD模型將原始時間序列x(t)(t=1,2,…,N)自適應地分解為K個不同尺度的IMF分量序列集{Ii(t)}(i=1,2,…,K)。其次,計算IMF分量序列集{Ii(t)}模糊熵并排序,定義模糊熵最小的IMF分量為趨勢項,其他IMF分量為隨機干擾項。最后,比較不同分解K值下趨勢項的模糊熵,以便獲得適當的分解次數,當K值較小的時候,趨勢項的模糊熵很大,隨著K值的增加,模糊熵逐漸趨于穩(wěn)定。因此,為了避免過度分解,將模糊熵趨于穩(wěn)定的轉折點作為VMD分解的模態(tài)數K。
本文構建的VMD-ELM分解集成預測模型結構框圖如圖1所示:
圖1 VMD-ELM分解集成預測模型
其具體建模步驟如下:
步驟1K值優(yōu)化:計算在不同VMD分解模態(tài)K下趨勢項的模糊熵,根據最小模糊熵準則確定分解的最優(yōu)參數K值。
步驟2時序分解:確定最優(yōu)K值以后,使用VMD模型將原始時間序列自適應地分解為K個IMF分量序列集{Ii(t)}(i=1,2,…,K)
步驟3集成預測:利用ELM模型對IMF分量中的趨勢項和隨機干擾項進行訓練和預測,得到IMF分量的預測值si={s1,s2,s3,…,sK} ,線性相加si得到最終預測結果。
選取CBOT交易所的小麥、稻谷、豆粕期貨收盤價作為樣本數據,該樣本數據涵蓋了2013年1月到2020年9月期間的的周度價格,共398個觀測值,圖2顯示了小麥、稻谷、豆粕的周度價格曲線。選取樣本數前80%的數據作為訓練集,后20%的數據作為測試集。
圖2 農產品價格周度曲線
3.3.1 優(yōu)化VMD分解模型
為了驗證基于模糊熵的K值優(yōu)化法的有效性,計算VMD分解不同K值條件下的樣本熵和模糊熵,圖3~4展示了樣本熵和模糊熵的變化折線??梢钥闯?,除了豆粕以外,其余農產品的樣本熵在一定范圍內并未趨于穩(wěn)定,而是處于大幅度波動變化的,且豆粕的樣本熵和模糊熵的變化情況相似,而三種農產品的模糊熵均在一定范圍內趨于穩(wěn)定,因此利用最小模糊熵準則對VMD分解的K值進行優(yōu)化,根據圖4可以看出,具有不同K值的趨勢項的模糊熵結果如下:對于稻谷期貨,當K超過11的時候,模糊熵趨于穩(wěn)定,因此利用VMD對稻谷期貨進行分解得到11個模態(tài)分量。對于小麥期貨,當K超過10的時候,模糊熵趨于穩(wěn)定,因此利用VMD方法對小麥期貨進行分解得到10個模態(tài)分量。同理,對于豆粕期貨,當K超過10的時候,模糊熵趨于穩(wěn)定,因此利用VMD對稻谷期貨進行分解得到10個模態(tài)分量。
圖3 農產品價格VMD分解不同K值下的樣本熵
圖4 農產品價格VMD分解不同K值下的模糊熵
3.3.2 VMD分解價格序列
通過以上分析確定合適的VMD分解模態(tài)數K,對稻谷、小麥、豆粕期貨價格進行分解。圖5表示了通過VMD分解原始稻谷、小麥、豆粕數據獲得的子序列,圖中,IMF1是趨勢項,其余IMF是隨機波動項。因此,可以通過預測模型研究農產品價格數據中具有不同特征的子序列。
圖5 農產品價格VMD分解結果
3.3.3 預測建模
圖6 農產品價格VMD分解子序列預測結果
對IMF的分解結果進行線性相加,得到最終預測值,圖7顯示了六種不同模型的稻谷、小麥、豆粕期貨預測曲線。其中,黑色實現表示實際觀測值,由圖可知,單模型ELM預測結果不穩(wěn)定,與實際觀測值擬合程度最差,集成模型相比于單模型更加接近實際曲線,特別地,所提出的集成預測模型VMD-ELM非常接近實際觀測值。
圖7 不同模型預測農產品價格擬合曲線
3.4.1 VMD-ELM預測效果的比較分析
為驗證所提出的VMD-ELM分解集成預測模型的預測性能, 統(tǒng)計并且比較分析ELM、VMD-ELM、SSA-ELM、CEEMD-ELM模型在農產品期貨市場價格的預測結果,獲得的預測誤差對比如表1所示,黑色加粗表示最優(yōu)誤差值。
表1 預測模型預測精度
對比單預測模型和分解集成預測模型,所有分解集成預測模型的三種誤差指標和方向性指標均優(yōu)于單模型,這說明了分解集成策略的有效性。其中,所提出的VMD-ELM分解集成預測模型的小麥和豆粕期貨預測的MAPE誤差僅為0.6578%,0.5414%,對比單模型誤差下降率為66.5%,70.4%。對比其他分解集成模型,VMD- ELM分解集成模型能夠更好的將復雜的農產品期貨數據分解為相對簡單的子序列,減低單模型的預測壓力,從而提升自身泛化能力,具有最優(yōu)的預測性能。
3.4.2 VMD分解K值優(yōu)化效果的比較分析
為驗證所提出基于最小化模糊熵準則的K值優(yōu)化法對VMD分解性能提升的有效性,統(tǒng)計并且比較分析VMD-ELM(1)、VMD-ELM(2)、以及所提出VMD-ELM的預測結果,獲得的預測誤差如表2所示,黑色加粗表示最優(yōu)誤差值。
表2 不同VMD分解K值優(yōu)化方法預測誤差
對比三種VMD分解模態(tài)K值選取方法,所提出的基于最小模糊熵準則的K值優(yōu)化法的三種誤差指標和方向性指標均優(yōu)于其他兩種。這有力的證明了基于最小模糊熵準則的K值優(yōu)化法可以提高VMD的分解能力,使得預測模型能夠更好的捕獲時間序列的特征,從而提高預測精度。
3.4.3 統(tǒng)計學檢驗
為了更好的從數值上表示其中的差異,表3給出了所提出的模型與其他模型的統(tǒng)計學Diebold-Mariano(DM)檢測P值結果。
表3 DM檢測P值
從表3的DM檢驗結果可以看出,針對小麥、豆粕期貨價格,DM檢驗的P值絕大部分都小于0.01,這說明在1%的顯著性水平上,DM檢驗的結果拒絕兩個模型的預測誤差無顯著性差異的零假設。也就是說,VMD-ELM在顯著性水平為1%的情況下優(yōu)于單模型,其他分解集成模型,和其他VMD分解K值優(yōu)化方法。針對稻谷期貨,DM檢驗的P值絕大部分都小于0.1,這說明所提出的VMD-ELM在顯著性水平為10%的情況下優(yōu)于單模型,其他分解集成模型,和其他VMD分解K值優(yōu)化方法。這個結果從統(tǒng)計上證實了所提出的VMD-ELM分解集成預測模型的優(yōu)越性。
由于農產品期貨市場價格具有高度復雜性,單一預測模型難以捕捉其規(guī)律特征。因此本文構建了VMD-ELM農產品期貨價格分解集成預測模型,并且針對VMD分解關鍵參數模態(tài)數K值選擇難題,提出了基于最小模糊熵準則的K值優(yōu)化法,通過對CBOT交易所的稻谷、小麥和豆粕期貨價格的實證研究,可以得出以下四個結論:(1)對比單預測模型和分解集成預測模型,所有分解集成預測模型的水平精度指標和方向性指標均優(yōu)于單預測模型,這證實了分解集成策略在農產品期貨價格預測的有效性。(2)對比3個分解集成預測模型,VMD-ELM的預測誤差遠遠小于其他分解集成預測模型,這證實了VMD-ELM相比于其他的分解集成模型能夠更好的將復雜的農產品市場期貨價格序列分解為簡單的子序列,減低單模型的預測壓力,以此提高自身泛化能力,能有效的提高預測性能。(3)對比3種VMD分解K值選取方法,所提出了基于最小化模糊熵準則的K值優(yōu)化法表現最佳,這證實了所提出的方法能有效避免VMD分解不足或過分解,從而提升模型的預測性能。(4)通過DM檢驗,在統(tǒng)計上證實了所提出VMD-ELM分解集成模型相比于其他模型具有更優(yōu)的預測性能、更高的預測精度。