經(jīng)對比分析,XGBooSt在捕捉非線性關系和應對復雜數(shù)據(jù)方面更具優(yōu)勢。
用燃料油逐漸成為市場需求的焦點。舟山作為我國主要的船燃供應中心,其低硫船燃價格波動對航運經(jīng)濟、能源市場和決策具有重要影響。因此,準確預測舟山低硫船燃的短期價格具有顯著的實際意義。
傳統(tǒng)時間序列模型如ARIMA×在長周期、平穩(wěn)數(shù)據(jù)預測中表現(xiàn)良好,但在短期時間序列中,尤其面對復雜的非線性價格波動時,其預測效果存在局限性。近年來,機器學習模型如XGBoost憑借對非線性關系建模的優(yōu)勢,為短期時間序列預測提供了新的解決方案。本文研究對比了ARIMAX與XGBoost兩種模型在舟山低硫船燃價格預測中的應用。結果表明,XGBoost在捕捉非線性關系和應對復雜數(shù)據(jù)方面具有優(yōu)勢,而ARIMAX在解釋性和處理平穩(wěn)時間序列方面更具優(yōu)勢。
兩種模型特征進行比較
本文分別對ARIMAX與XGBoost的優(yōu)勢與局限進行了對比分析,為后續(xù)模型選擇與優(yōu)化提供理論依據(jù)和實證支持。
ARIMAX的主要優(yōu)勢如下:一是只需要較少變量作為載體,即能夠依據(jù)歷史數(shù)據(jù)建模,較少依賴其他變量。二是其適用于趨勢分析,無論線性還是非線性,ARIMAX能夠有效差分數(shù)據(jù)后建模,對于分析及預測變化特征具有良好優(yōu)勢。三是其擁有良好的模型檢測能力,能夠識別殘差自相關性,有利于識別和檢測異常結果。盡管ARIMAX在時間序列分析領域有著廣泛的應用,但存在著明顯的局限性。比如面臨高度復雜的時間序列或非線性序列難以捕捉時間序列中的隱含特征,操作層面需要手動調(diào)整多個參數(shù),人工風險較大等。
XGBoost的主要優(yōu)勢如下:一是非線性建模能力強,能夠捕捉時間序列中的非線性信息及特征,提高了模型的精準度和使用范圍。二是能夠識別處理數(shù)據(jù)中的缺失值,使得在數(shù)據(jù)不完整時能夠選擇最優(yōu)擬合。三是能自動識別與評估各變量的重要性并高效篩選出有用的特征,減少了人工處理,使得預測工程更精準與自動化。四是采用并行化計算技術,能夠即時接受最新的數(shù)據(jù),并快速更新到模型中,無須從頭訓練模型,極大地提高了模型訓練效率。五是正則化機制能夠自動處理并適應噪聲大的數(shù)據(jù),控制擬合程度,魯棒性強,抗噪性高。六是對于非平穩(wěn)時間序列預測具有更高強適用性。盡管在短期預測中表現(xiàn)優(yōu)異,但XGBoost也具有一些不足:比如使用模型的成本更高,計算機性能等硬件要求較高、預測結果不能直接解釋變量間的關系等。
總之,在短期時間序列預測中,XGBoost憑借其非線性建模能力、對數(shù)據(jù)缺失與噪聲的適應性、特征選擇的自動化及快速高效的模型訓練過程,相較于ARIMAX表現(xiàn)出顯著優(yōu)勢,并成為廣泛使用的理想預測模型。
系統(tǒng)評估兩種模型設計思路
研究采用對比匹配的實驗設計,系統(tǒng)評估ARIMAX和XGBoost對舟山低硫船用燃料油價格的預測效果,研究設計思路如下。
在自變量選取上,研究基于船燃市場的價格形成機制,從國際原油價格、進出口量、船運指數(shù)、高低硫價差等維度選取關鍵影響因素作為外生變量。在樣本選取上,選取2021年1月至2024年6月這一政策環(huán)境相對穩(wěn)定、市場波動平緩的時段作為樣本區(qū)間。在模型構建上,確保ARIMAX和XGBoost在一致的環(huán)境下進行預測。
為全面探究舟山低硫船燃價格的影響因素,在實際市場機制分析的基礎上,研究選取包括能源價格、宏觀經(jīng)濟、航運供需、區(qū)域市場結構以及季節(jié)性因素等多個維度的自變量,并對所選變量與舟山低硫船燃價格之間的關系進行了統(tǒng)計顯著性檢驗。檢驗結果顯示,所有自變量均通過顯著性檢驗,表明其對舟山低硫船燃價格存在顯著影響,具備納入后續(xù)建模分析的合理性與必要性。
XGBoost模型更適用于價格短期預測
本文通過構建ARIMAX和XGBoost兩種模型,探究其在舟山低硫船燃價格的短期預測中的表現(xiàn)和特性。研究采用了特征選擇、樣本匹配和模型訓練等步驟進行建模,并對比兩種模型的預測精度與誤差。
為評估ARIMAX與XGBoost模型的預測能力,研究以2021年1月至2023年12月的數(shù)據(jù)作為訓練集,構建包含外生變量的預測模型,并預測2024年1月至2024年6月的舟山低硫船燃價格。將預測價格與實際舟山低硫船燃價格進行對比,計算各期的絕對誤差(AE)和絕對百分比誤差(PE)(如表所示)。
從預測結果來看,ARIMAX在部分月份預測誤差較小,如第2024年2月的預測結果的百分比誤差僅為 1.00% 表現(xiàn)出一定的趨勢跟蹤能力。但在部分月份,如2024年1月和6月,模型出現(xiàn)明顯高估情況,百分比誤差分別達到了 8.75% 和 16.20% ,表明對局部波動的響應相對滯后。XGBoost模型預測表現(xiàn)相對穩(wěn)定,除2024年1月外,各月份預測的絕對百分比誤差均低于 5% ,說明XGBoost作為一個非線性模型,對常規(guī)波動趨勢具有良好的擬合能力。
從整體模型表現(xiàn)來看,XGBoost的平均絕對百分比誤差(MAPE)為 2.78% ,低于ARIMAX的平均絕對百分比誤差 6.74% ,且XGBoost的均方根誤差(RMSE)為22.21,低于ARIMAX均方根誤差49.75,說明XGBoost整體預測誤差更小,擬合效果更好,在控制大幅偏離值方面具有顯著優(yōu)勢。
綜上所述,兩種模型對于舟山低硫船燃價格均展現(xiàn)出一定的預測能力。XGBoost模型憑借其非線性擬合優(yōu)勢,在整體誤差控制和趨勢跟蹤方面表現(xiàn)更為優(yōu)越,更適用于舟山低硫船燃價格的短期預測。