DOI:10.3969/j.issn.1004-910X.2025.07.012 [中圖分類號]F205;F832.5 [文獻(xiàn)標(biāo)識碼]A
引言
為有效應(yīng)對日益嚴(yán)峻的全球氣候變暖與環(huán)境危機(jī),我國于2020年制定了“雙碳”目標(biāo)戰(zhàn)略,即2030年前實(shí)現(xiàn)碳達(dá)峰,2060年前達(dá)成碳中和。碳交易市場作為強(qiáng)有力的碳排放控制體系,是實(shí)現(xiàn)“雙碳”目標(biāo)的重要抓手。碳交易價格與溫度、空氣質(zhì)量指數(shù)和煤碳等因素相關(guān)性較高[1],其精準(zhǔn)預(yù)測對于緩解環(huán)境問題、推進(jìn)“雙碳”目標(biāo)、為政府制定政策提供參考以及幫助企業(yè)管控碳資產(chǎn)與金融風(fēng)險具有重要意義。然而,由于碳價格具有非線性、非平穩(wěn)且高噪音的復(fù)雜特性,且受到能源、政策、經(jīng)濟(jì)等外部環(huán)境影響,使得碳價格精準(zhǔn)預(yù)測成為學(xué)術(shù)研究的熱點(diǎn)與難點(diǎn)。
目前,學(xué)術(shù)界有關(guān)碳價格的預(yù)測研究可分為兩類。第一類是基于多重碳價影響因素的預(yù)測研究。該類研究將氣候環(huán)境、能源價格以及宏觀經(jīng)濟(jì)等結(jié)構(gòu)化數(shù)據(jù)與預(yù)測模型相結(jié)合,以實(shí)現(xiàn)碳價格的精準(zhǔn)預(yù)測。具體而言,崔煥影與竇祥勝采用EMD-GA-BP組合預(yù)測模型,將原始碳價格分解序列及宏觀經(jīng)濟(jì)因素納入其中預(yù)測碳價格波動。王一蓉等[3]則在電力行業(yè)碳排放因素的基礎(chǔ)上,引入外生變量的自回歸模型預(yù)測全國碳價格。高長征等4通過皮爾森相關(guān)系數(shù)法識別關(guān)鍵影響因素,并運(yùn)用CEEMDAN-Transformers智能機(jī)器學(xué)習(xí)方法對湖北碳價格進(jìn)行預(yù)測。Mao與 Yu[5] 進(jìn)一步構(gòu)建了四維碳價格指標(biāo)體系,采用FS-CEEMDAN一VMD-GWO-LightGBM多功能混合預(yù)測模型,從經(jīng)濟(jì)形勢、碳交易市場、國際碳交易市場、化石能源4個維度預(yù)測全國碳價格。在此基礎(chǔ)上,學(xué)者們試圖將新聞文本[6]、投資者關(guān)注度[7]以及百度搜索指數(shù)[8.9]等非結(jié)構(gòu)化數(shù)據(jù)納入模型,提出基于非結(jié)構(gòu)化數(shù)據(jù)的組合預(yù)測模型,相較于傳統(tǒng)的非文本挖掘技術(shù),這些方法在碳價格預(yù)測上準(zhǔn)確性更高。然而,鮮有研究充分考慮了影響因素的降維處理和特征選擇的有效性,顯著提升了模型處理的復(fù)雜度。此外,模型中潛在的遺漏變量問題以及變量間的多重共線性,可能影響預(yù)測結(jié)果的精確性,降低模型預(yù)測的可靠性[10]
第二類研究是基于歷史數(shù)據(jù)的碳價格預(yù)測,涵蓋計量經(jīng)濟(jì)模型、機(jī)器學(xué)習(xí)方法以及各模型混合等,僅以原始碳價格數(shù)據(jù)作為數(shù)據(jù)源,突破了上述研究的局限。為有效彌補(bǔ)傳統(tǒng)計量經(jīng)濟(jì)模型對樣本數(shù)據(jù)穩(wěn)定性、線性度要求高及模型結(jié)構(gòu)與理論假設(shè)要求嚴(yán)格的缺點(diǎn),不少學(xué)者引入機(jī)器學(xué)習(xí)對碳價格時間序列進(jìn)行預(yù)處理與預(yù)測,結(jié)果表明機(jī)器學(xué)習(xí)方法在建模非線性和復(fù)雜的碳價數(shù)據(jù)方面更具有效性[1]。其中,ANN(Artificial Neural Net-work)具備捕捉變量之間高度復(fù)雜非線性關(guān)系的自適應(yīng)映射能力與結(jié)構(gòu)靈活性等優(yōu)點(diǎn)[12]。CNN(Con-volutionalNeuralNetwork)擅長處理并捕獲空間結(jié)構(gòu)數(shù)據(jù)[13]。RNN(Recurrent Neural Network)因其擁有以上深度神經(jīng)網(wǎng)絡(luò)所不具備的強(qiáng)大記憶特性,更適用于順序數(shù)據(jù)的處理,在時間序列預(yù)測方面優(yōu)勢明顯[14]。然而,RNN在模型訓(xùn)練中,通常存在梯度爆炸或梯度消失的隱患。為克服這一問題,學(xué)者創(chuàng)新性引入了具備門控機(jī)制的LSTM(LongShort-TermMemoryNeural Network),該方法也已成為時序預(yù)測任務(wù)中的主流解決方案[15]
Hochreiter和Schmidhuber[16]提出的LSTM是一種經(jīng)典的深度學(xué)習(xí)算法,廣泛應(yīng)用于時間序列建模問題。通過創(chuàng)新性地引人門控機(jī)制,有效解決了傳統(tǒng)RNN在處理長序列時的梯度消失和梯度爆炸問題,顯著提升了模型捕捉長距離依賴關(guān)系的能力[17]。每個LSTM神經(jīng)元由輸入門、遺忘門和輸出門3個主要門控組成。其中,輸入門和輸出門分別負(fù)責(zé)控制網(wǎng)絡(luò)的輸入結(jié)構(gòu)和記憶單元的輸出結(jié)構(gòu),而遺忘門用于調(diào)節(jié)記憶單元的遺忘程度。通過這些門控機(jī)制,LSTM能夠在每個時間步選擇性地保留重要的輸入特征,有效解決傳統(tǒng)RNN在反向傳播過程中,梯度逐漸變小,導(dǎo)致網(wǎng)絡(luò)難以更新早期時間步的權(quán)重,亦或者由于梯度逐漸擴(kuò)大,導(dǎo)致權(quán)重更新不穩(wěn)定的問題[18],從而有效地處理長距離依賴關(guān)系,在時間序列處理中具有重要的理論和實(shí)踐意義,成為現(xiàn)代時間序列分析中的前沿模型[19]。與單向LSTM相比,BiLSTM(Bidi-rectionalLong-Short TermMemoryNeuralNetwork)通過引入前向和反向處理層,顯著提升了模型性能。其從左到右和從右到左對輸入序列進(jìn)行雙重優(yōu)化,增強(qiáng)了模型對時間序列的學(xué)習(xí)能力;另外,其通過兩個連接輸入和輸出單元的LSTM神經(jīng)元,使輸出單元既能保留來自過去的輸入信息,又能捕捉未來時刻的潛在模式[20],大幅擴(kuò)展了信息處理的范圍和深度,在解決時間序列數(shù)據(jù)中的長間隔和延遲問題時表現(xiàn)出色[21]
基于此,為探索一種基于機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的新型混合預(yù)測模型,以有效提高碳價格的預(yù)測精度,本文采用BiLSTM方法,創(chuàng)新性地選取兩個具備相同結(jié)構(gòu)的LSTM框架以處理隨機(jī)IMFs(In-trinsicModeFunctions)組合與所有IMFs樣本,前者為預(yù)防框架,防止過擬合問題,后者則為預(yù)測框架,實(shí)現(xiàn)預(yù)測功能。將兩平行框架的輸出值作為一個新輸入特征,傳輸?shù)饺B接神經(jīng)網(wǎng)絡(luò)中,生成最終的碳價格預(yù)測結(jié)果。
能源價格的非平穩(wěn)性及高噪聲特性對精確預(yù)測構(gòu)成了重大挑戰(zhàn)[22],為實(shí)現(xiàn)碳價格的精準(zhǔn)預(yù)測,對碳價序列進(jìn)行分解降噪處理極其重要。本文將子序列分析納人預(yù)測模型,使原始時間序列解構(gòu)為一系列有限相關(guān)的靜止分量,即固有模態(tài)函數(shù),從而更精確地揭示序列的內(nèi)在特性[23]。在能源價格預(yù)測領(lǐng)域,EMD(Empirical Mode Decomposition)、EEMD(Ensemble Empirical Mode Decomposition)、CEEMD(Complete Ensemble Empirical Mode Decom-position)以及基于VMD(VariationalModeDecompo-sition)的算法已被證實(shí)為有效的技術(shù)手段[20]。與經(jīng)典的小波變換方法相比,EMD及其衍生算法無需預(yù)設(shè)基函數(shù),克服了前者的非自適應(yīng)性局限[24」,在處理非線性、非平穩(wěn)信號方面呈現(xiàn)明顯優(yōu)勢,但也存在著模態(tài)混疊的缺陷[10]。VMD 算法雖具有比EMD更好的處理非平穩(wěn)信號與分解的能力,但也具有參數(shù)選擇敏感性、計算復(fù)雜度高、易引入額外噪音等方面的不足[25]。因此,本文選用EMD算法展開對歷史碳價格數(shù)據(jù)的分解降噪處理,并創(chuàng)新引入數(shù)據(jù)增強(qiáng)技術(shù),加強(qiáng)數(shù)據(jù)隨機(jī)組合,提高模型對關(guān)鍵特征信息的提取能力,不僅在一定程度上緩解了模態(tài)混疊問題對預(yù)測模型的負(fù)面影響,還克服了樣本內(nèi)預(yù)測效果好而樣本外預(yù)測效果不理想的過擬合困境。
因此,本文基于湖北碳交易市場的2532份日度收盤價格數(shù)據(jù),開展湖北碳價格預(yù)測的實(shí)證研究。將EMD算法、數(shù)據(jù)增強(qiáng)技術(shù)和雙向長短期記憶神經(jīng)網(wǎng)絡(luò)BiLSTM框架相結(jié)合,提出Mod-EMD-BiLSTM新型混合預(yù)測模型,邊際貢獻(xiàn)如下:
(1)構(gòu)建了融合數(shù)據(jù)增強(qiáng)技術(shù)、變分模態(tài)分解與雙向長短期記憶神經(jīng)網(wǎng)絡(luò)的新型混合預(yù)測框架,即由預(yù)防和預(yù)測框架組成的Mod-EMD-BiL-STM碳價預(yù)測模型,有效防止過擬合問題,顯著提高模型預(yù)測精準(zhǔn)性。
(2)本文并非傳統(tǒng)地將EMD的分解序列IMFs直接輸入到預(yù)測模型中展開訓(xùn)練,而是創(chuàng)建預(yù)防和預(yù)測兩大平行機(jī)制,采取獨(dú)立框架處理IMFs的隨機(jī)組合,減輕整體模式對數(shù)據(jù)端點(diǎn)極值的可能依賴,降低意外噪聲信息的產(chǎn)生。此外,引入數(shù)據(jù)增強(qiáng)思想,將數(shù)據(jù)增強(qiáng)與預(yù)防模塊結(jié)合,增加數(shù)據(jù)組合量,增強(qiáng)模型對IMFs中有效信息的提取能力,緩解了由EMD模態(tài)混疊缺陷為模型預(yù)測的負(fù)面影響,防止因訓(xùn)練集數(shù)據(jù)不足而導(dǎo)致嚴(yán)重的過擬合問題。
1 研究方法
1. 1 EMD
EMD是一種自適應(yīng)信號處理技術(shù),它無需預(yù)先了解信號的頻率特性,而是基于數(shù)據(jù)本身的內(nèi)在特征來分解非平穩(wěn)、非線性的碳價格時間序列。其IMF需滿足以下條件:在整個信號上的極值點(diǎn)數(shù)目相同或最多相差1個;在任何點(diǎn)上,通過IMF的局部均值計算得到的殘差均值為0。其分解步驟如下:
(1)構(gòu)建由整個數(shù)據(jù)區(qū)間所有局部極大值與極小值連線而成的上下包絡(luò)線。(2)從原始信號中減去局部平均值,得到初始 MIF(Modal Instantaneous Function)。(3)若MIF滿足IMF的條件(局部同質(zhì)且在所有時間尺度上其瞬時頻率變化有限)則作為第一個IMF,否則進(jìn)入下一步循環(huán)。(4)重復(fù)上述步驟,對剩余信號進(jìn)行迭代處理,每次提取1個新的IMF分量,直至剩余部分變?yōu)橼厔蓓椈蚪咏诹愕脑肼?。?)最終得到一系列IMFs和1個殘余項(Re-sidual)。其中,每個IMF代表原信號的1個固有振動模式,頻率由高到低排列,殘余項則通常包含信號的全局趨勢信息。
1.2 BiLSTM
BiLSTM由兩個相同結(jié)構(gòu)的LSTM組合而成,分別作為處理隨機(jī)IMFs組合的預(yù)防框架與實(shí)現(xiàn)預(yù)測功能的預(yù)測框架。LSTM作為一種有效處理時間建模問題的深度學(xué)習(xí)算法,由輸入門、遺忘門與輸出門3個門控機(jī)制組成,具備良好的保持、感知與更新長期時間模式的能力,其內(nèi)在結(jié)構(gòu)原理如圖1所示。此外,BiLSTM引入雙向機(jī)制,可更好處理更多內(nèi)存信息,有效解決時間序列數(shù)據(jù)預(yù)測的延遲和長間隔問題,從而具備比常規(guī)LSTM更好的預(yù)測性能[26]
圖1中, xt 代表 χt 時刻時間步的輸入狀態(tài), Ct 為記憶細(xì)胞, ht 代表輸入下一時間步的隱藏狀態(tài),ht-1 代表上一時間步的隱藏狀態(tài)。LSTM的更新過程大致如下:(1)由遺忘門(ForgetGate, ft )接收xt 與 ht-1 ,進(jìn)而確定前一時間步的記憶細(xì)胞 Ct-1 中哪些信息應(yīng)該被遺忘,并基于式(1)計算收斂于[0,1]范圍內(nèi)代表遺忘程度的 ft 值;(2)基于輸入門(InputGate, it )同樣接收 xt 與 ht-1 ,決定當(dāng)前時間步的輸入信息 (xt) 哪些需存儲于記憶細(xì)胞 Cι ,并基于式(2)計算[0,1]內(nèi)的 it 值,表示新信息進(jìn)入細(xì)胞狀態(tài)的比例。另外,圖中的 σ 層控制信息的更新過程且式(5)的 nt 值代表細(xì)胞狀態(tài)候選值,而tanh層則是創(chuàng)建候選值項 Cι 并基于遺忘門與輸出門的結(jié)果輸入式(3)來更新 Ct 細(xì)胞狀態(tài);(3)利用輸出門(Output Gate, ot )確保當(dāng)前時間步的記憶細(xì)胞 Cι 中哪些信息被輸出到下一時間步的隱藏狀態(tài) ht 并計算[0,1]范圍內(nèi)代表輸出信息量的 ot 值。需注意,在式(1)\~(8)中,A、 B 均表示權(quán)重矩陣, b 代表偏置項,符號 * 表示逐元乘法, tanh(Σ) 表示雙曲正切函數(shù)且輸出值在[-1,1]范圍內(nèi)。 σ(θ) 表示Sigmoid函數(shù),能夠?qū)⑤敵鲋凳諗恐羀0,1]范圍內(nèi),并且若輸出值為0,則所有信息均無法通過激活函數(shù),輸出值增加,則允許更多信息,當(dāng)輸出值為1時,則能夠保留所有信息。
式分別如下所示:
其中, yt 代表真實(shí)值, 代表預(yù)測值, N 為樣本長度。 R2 反映預(yù)測模型的擬合優(yōu)度和解釋能力,其值與1越接近,預(yù)測效果越好;MSE和MAE主要評估預(yù)測結(jié)果與真實(shí)值的偏差程度,其值越小,模型預(yù)測越精確;DA用于衡量模型碳價格預(yù)測方向的精準(zhǔn)性,DA值越高,表明模型方向預(yù)測精度越高,該模型預(yù)測性能越好。
2 模型構(gòu)建
本文提出一種基于數(shù)據(jù)分解與LSTM技術(shù)融合的新型混合預(yù)測方法。傳統(tǒng)方式將分解后的IMF分量直接代入預(yù)測模型,此做法在數(shù)據(jù)豐富且相對穩(wěn)定時預(yù)測較準(zhǔn),但在數(shù)據(jù)低頻、非線性甚至高噪聲時,難以獲取足夠的樣本點(diǎn)來訓(xùn)練深度學(xué)習(xí)預(yù)測模型,無法充分捕捉樣本數(shù)據(jù)中隱藏的關(guān)鍵特征信息,難以避免過擬合問題。因此,本文引入數(shù)據(jù)增強(qiáng)技術(shù)和預(yù)防框架,加強(qiáng)輸人數(shù)據(jù)組合,擴(kuò)大訓(xùn)練集數(shù)據(jù)量,使得預(yù)測框架充分提取IMFs模態(tài)分量所隱藏的重要預(yù)測信息,從而提高模型的精準(zhǔn)性,消除過擬合問題。該預(yù)測模型由預(yù)防框架與預(yù)測框架組成,完整模型框架如圖2所示,具體步驟如下:
1.3 評價指標(biāo)
為更好地評估預(yù)測模型的優(yōu)越性,本文選取盡可能多的不同損失函數(shù)來綜合判斷模型預(yù)測的精確性,將決定系數(shù) (R2 )、均方誤差(MSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)和方向精度(DA)作為評價標(biāo)準(zhǔn),各項指標(biāo)計算公
(1)數(shù)據(jù)選取與預(yù)處理?;赑ython爬蟲技術(shù)獲取湖北碳價格數(shù)據(jù),通過EMD方法分解原始碳價格序列,得到內(nèi)在模態(tài)分量。利用數(shù)據(jù)增強(qiáng)技術(shù),增強(qiáng)數(shù)據(jù)組合,獲得一半IMFs的隨機(jī)組合。
(2)處理后數(shù)據(jù)代人模型框架。將數(shù)據(jù)增強(qiáng)技術(shù)生成的隨機(jī)組合輸入預(yù)防框架,提取模型訓(xùn)練過程中所有IMFs隱藏的本質(zhì)特征信息,記為結(jié)果1。該操作旨在強(qiáng)化組合,避免特定IMF中噪聲信息對碳價格預(yù)測產(chǎn)生干擾。將所有IMF數(shù)據(jù)輸入預(yù)測框架,得到初始預(yù)測結(jié)果,記為結(jié)果2。將結(jié)果1與結(jié)果2串聯(lián)生成的新輸入特征輸入到全連接層中,預(yù)測最終碳價格。
(3)模型訓(xùn)練與碳價格預(yù)測。通過計算原始碳價格與預(yù)測值之間的均方誤差MSE損失值,迭代優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù)。并重復(fù)上述步驟,直至MSE收斂至特定值0.01,固定模型參數(shù),使用訓(xùn)練好的模型預(yù)測樣本外碳價格。
(4)模型檢驗(yàn)。用 R2 、MSE、MAE、MAPE、DA這5種評價指標(biāo)來衡量模型的預(yù)測性能,并通過實(shí)證分析與模型比較進(jìn)一步確定預(yù)測模型的精準(zhǔn)性與有效性。
3 實(shí)證分析
3.1 數(shù)據(jù)來源
湖北碳排放交易市場是我國首批高度市場化的碳排放交易市場之一,憑借成熟交易機(jī)制和海量的交易數(shù)據(jù),在全國碳排放配額成交量與成交額中占據(jù)重要地位。本文基于湖北碳排放權(quán)交易中心官方網(wǎng)站(https://www.hbets.cn),利用Python爬蟲技術(shù),爬取2014年4月2日至2024年1月31日碳交易日度收盤價格的2532份數(shù)據(jù),作為研究樣本,對碳價格預(yù)測進(jìn)行深人研究。湖北碳交易價格曲線如圖3所示。
為更好地訓(xùn)練模型并檢驗(yàn)其性能,本文參考Guan與 Gong[27] 的做法,將樣本數(shù)據(jù)按9:1的比例劃分為訓(xùn)練集(2279條)與測試集(253條),如圖3中實(shí)線與虛線所示。其中,2023年1月26日之前的數(shù)據(jù)用于模型訓(xùn)練,其余數(shù)據(jù)作為測試集,用于檢驗(yàn)?zāi)P偷木珳?zhǔn)性與優(yōu)越性。
3.2 數(shù)據(jù)預(yù)處理
3.2.1 數(shù)據(jù)分解
經(jīng)驗(yàn)?zāi)B(tài)分解(EmpiricalModeDecomposition,EMD)是一種自適應(yīng)的信號處理技術(shù),它無需預(yù)先了解信號頻率特性,通過數(shù)據(jù)本身的內(nèi)在特征來分解信號。EMD將復(fù)雜非平穩(wěn)信號分解為多個獨(dú)立、易于理解的IMF分量(內(nèi)在模態(tài)分量),每個分量反映信號在不同時間尺度上的自然波動特性,有助于更深人地理解與分析信號內(nèi)容。
本文采用EMD方法來處理非平穩(wěn)、非線性、高噪聲的原始碳價格時間序列數(shù)據(jù),并將其分解為10個IMF和1個殘余項(Residual)。其中每個IMF代表原始信號的一個固有振動模式,頻率由高到低排列。殘余項則包含信號的全局趨勢信息。最終碳價格分解序列如圖4所示,分解后的子序列從低頻到高頻依次呈現(xiàn)。IMF1及原始序列的峰值信息與長期趨勢高度相關(guān),其他分量包含短期或中期的碳價格波動信息。分解后的子序列相較原始數(shù)據(jù)更具規(guī)律性與周期性,因此將其代入不同模型預(yù)測,可顯著提高預(yù)測效果。
3.2.2 數(shù)據(jù)增強(qiáng)
本文創(chuàng)新性地引人數(shù)據(jù)增強(qiáng)思想,采取EMD分解后的數(shù)據(jù)增強(qiáng)技術(shù),提高預(yù)測模型的訓(xùn)練性能與精準(zhǔn)度。將訓(xùn)練集與測試集比例設(shè)置為 9:1 從而擴(kuò)大訓(xùn)練集數(shù)據(jù)量,避免因訓(xùn)練集數(shù)據(jù)不足導(dǎo)致的過擬合問題;從數(shù)據(jù)預(yù)處理著手,摒棄傳統(tǒng)地將EMD分解子序列IMFs直接輸入到預(yù)測模型中展開訓(xùn)練,而是運(yùn)用數(shù)據(jù)增強(qiáng)技術(shù),強(qiáng)化數(shù)據(jù)組合,更有效地提取IMFs中隱藏的一般特征信息,提高模型精準(zhǔn)性。以下是數(shù)據(jù)增強(qiáng)技術(shù)的具體內(nèi)容。
(1)基于圖5所示原理,隨機(jī)選取5個分解子序列(一半的IMF)作為輸入特征,擴(kuò)充訓(xùn)練集數(shù)據(jù),使數(shù)據(jù)組合數(shù)量提高252倍,如式(14)所示;(2)在往后的500次迭代中,每過10個Epoch,將會任意選擇一個IMF組合輸人神經(jīng)網(wǎng)絡(luò);(3)對這252個組合平均進(jìn)行4\~5輪模型訓(xùn)練,以此充分減少數(shù)據(jù)組合隨機(jī)性對模型預(yù)測性能的干擾,增強(qiáng)模型的魯棒性與可重復(fù)性。綜上,神經(jīng)網(wǎng)絡(luò)習(xí)慣通過不特定的組合序列學(xué)習(xí),因此在模型訓(xùn)練時,其將基于整體視角有效提取隱藏在子序列中的一般特征模式。另外,由于IMF均源自于原始碳價格序列的分解,因此,在各歷史階段,每個序列所包含的特征信息給碳價格預(yù)測帶來的影響都是相近的,且不會因IMF成分比重改變而導(dǎo)致影響程度產(chǎn)生變化的狀況。
3.3 Mod-EMD-BiLSTM模型預(yù)測
鑒于碳價格數(shù)據(jù)具有高噪聲和非線性特征,為精準(zhǔn)捕捉其自然波動規(guī)律并開展預(yù)測。本文首先基于EMD算法將日度碳交易價格時間序列分解為10個分解子序列(IMF分量)和1個殘余項。并將獲取的子序列按 9:1 的比例劃分為訓(xùn)練集(2279條)與測試集(253條)。
其次,鑒于將分解后的IMF分量直接作為輸入特征進(jìn)行碳價格預(yù)測的傳統(tǒng)做法,難以充分提取復(fù)雜且低頻時間序列中的關(guān)鍵預(yù)測信息,并難以有效緩解因訓(xùn)練集數(shù)據(jù)不足而導(dǎo)致的過擬合問題,因此本文創(chuàng)新性地引入數(shù)據(jù)增強(qiáng)技術(shù)并將其與預(yù)防框架有效融合,這不僅克服了傳統(tǒng)預(yù)測方法的缺陷,還有效提高預(yù)測模型的穩(wěn)定性與精準(zhǔn)性。具體而言,隨機(jī)生成的5個IMF組合被輸入預(yù)防框架,用于提取模型訓(xùn)練中所有IMFs隱藏的關(guān)鍵特征信息,輸出結(jié)果1;同時,將所有IMF分量輸入預(yù)測框架生成初始預(yù)測值,記為結(jié)果2。將結(jié)果1與結(jié)果2聯(lián)合生成的新變量傳送至全連接層,輸出最終的碳價格預(yù)測結(jié)果。值得注意的是,預(yù)防與預(yù)測框架為兩個獨(dú)立結(jié)構(gòu),旨在處理IMF分量組合,以防止過擬合及間接信息干擾。此外,預(yù)防框架通過隨機(jī)生成的反饋組合避免對IMF中的噪聲信息進(jìn)行過度提取。
最后,計算真實(shí)值與預(yù)測結(jié)果間的均方誤差損失值,當(dāng)損失值為0.01時,模型將停止訓(xùn)練,優(yōu)化并固定其參數(shù),接著利用訓(xùn)練好的預(yù)測模型開展碳價格的精準(zhǔn)預(yù)測。此外,本文選用決定系數(shù) (R2 )、均方誤差(MSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)和方向精度(DA)五項指標(biāo)對模型預(yù)測性能進(jìn)行全面評估。
3.4基準(zhǔn)模型的構(gòu)建與參數(shù)設(shè)置
為驗(yàn)證本文構(gòu)建的Mod-EMD-BiLSTM模型的優(yōu)越性,選取并設(shè)計15種機(jī)器學(xué)習(xí)技術(shù)模型作為基準(zhǔn),進(jìn)行橫向與縱向?qū)Ρ确治觥?/p>
選用Ridge回歸模型、多層感知器模型(MLP)、決策樹模型(DT)、隨機(jī)森林模型(RF)、Adaboost模型(Ada)和支持向量回歸模型(SVR)6種經(jīng)典機(jī)器學(xué)習(xí)模型。此外,因LightGBM以其高效性與準(zhǔn)確性在數(shù)據(jù)挖掘領(lǐng)域表現(xiàn)突出,亦被納入橫向?qū)Ρ饶P?。各模型的具體參數(shù)設(shè)定詳見表1。
為進(jìn)一步探索預(yù)防框架性能,本文創(chuàng)新性地設(shè)計了八大深度學(xué)習(xí)模型展開縱向比較。其構(gòu)建原理如下:為檢驗(yàn)本模型預(yù)防框架是否有利于提升模型預(yù)測精度并規(guī)避過擬合問題,本文基于預(yù)測框架分別構(gòu)建了輸入特征為滯后3個月碳價序列的LSTM模型與所有未進(jìn)行置換處理IMF分量的EMD-LSTM模型。此外,為證實(shí)LSTM在防止過擬合方面的優(yōu)越性,本文用普通循環(huán)神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)替換各模型中的LSTM神經(jīng)元,形成6種競爭模型:RNN、EMD-RNN、Mod-EMD-RNN、ANN、EMD-ANN、Mod-EMD-ANN??紤]到LSTM和RNN神經(jīng)網(wǎng)絡(luò)的層數(shù)均為2,為保持一致性,將兩個人工神經(jīng)網(wǎng)絡(luò)代替為1個BiLSTM神經(jīng)元。因此,1個ANN擁有3個人工神經(jīng)網(wǎng)絡(luò),輸出維數(shù)分別為100、32和1。此外,各模型參數(shù)設(shè)置基本與Mod-EMD-BiLSTM參數(shù)一致,見表1。
3.5 實(shí)驗(yàn)結(jié)果與分析
3.5.1 模型預(yù)測結(jié)果
比較真實(shí)值與預(yù)測值間的誤差大小是衡量模型預(yù)測性能不可或缺的手段之一。本文基于樣本內(nèi)、樣本外以及全樣本2個范圍,繪制各模型的預(yù)測趨勢圖,并通過 R2 、MAE、MSE、DA4個常見誤差評價指標(biāo),初步驗(yàn)證模型有效性。由圖6\~9可見,本模型在樣本內(nèi)外均展現(xiàn)良好的預(yù)測趨勢,預(yù)測結(jié)果與真實(shí)值也存在著良好的擬合效果?;谡w視角,無論訓(xùn)練集還是測試集,模型均能有效捕捉碳價格的劇烈波動,顯示出較強(qiáng)預(yù)測能力。進(jìn)一步分析評價指標(biāo),結(jié)果表明在3種數(shù)據(jù)范圍內(nèi)的模型指標(biāo)表現(xiàn)穩(wěn)定,無明顯差異,且DA值接近0.8,進(jìn)一步凸顯模型的穩(wěn)定性與精準(zhǔn)性,具體數(shù)據(jù)詳見表2。
3.5.2 不同模型的比較與評價
為突顯本文構(gòu)建的預(yù)測模型的優(yōu)越性,下文對3.4節(jié)所提各基準(zhǔn)模型與本模型進(jìn)行橫向與縱向比較。并通過 R2 、MSE、MAE、MAPE、DA這5種評價指標(biāo)評估預(yù)測性能。由圖6\~9可初步判定,決策樹模型和Mod-EMD-ANN模型在樣本內(nèi)外預(yù)測效果較差。表3表示,盡管本模型的 R2 、MSE、MAE、MAPE四類誤差評價指標(biāo)值均排名第三,但與最優(yōu)值間差距較小,并且本模型的方向預(yù)測精度( DA=79.0514Ω )位居第一。因此本模型兼具方向預(yù)測精度與良好的預(yù)測性能。
(1)比較輸入特征均為碳價格序列的3個深度學(xué)習(xí)模型ANN、RNN、LSTM發(fā)現(xiàn),三者的 R2 、MSE、MAE、MAPE指標(biāo)結(jié)果無較大懸殊,但是LSTM的DA值最優(yōu),表明其在精準(zhǔn)預(yù)測碳價格方面具備優(yōu)勢。此外,相較于簡單的線性機(jī)器學(xué)習(xí)模型Ridge,以上3種單一深度學(xué)習(xí)模型在預(yù)測性能方面仍有提升的空間。
(2)當(dāng)以IMFs內(nèi)在模態(tài)分量為輸入特征時,ANN模型各項指標(biāo)值由 R2=0.851 ! MSE=1.2405 MAE=0.7553 一 MAPE=0.0176 : DA=62.0553 顯著上升到EMD-ANN模型 R2=0.9261 MSE=0.6153 、MAE=0.5945 、 MAPE=0.0138 : DA=77.4704 ,且RNN與LSTM模型的DA分別由61.2648、64.0316提高至模型EMD-RNN的69.17和EMD-LSTM的66.4032。這表明,融合數(shù)據(jù)增強(qiáng)的EMD分解技術(shù)有利于提高后期模型預(yù)測的精準(zhǔn)性與有效性。
(3)將分解得到的IMFs輸入Prevention框架進(jìn)行預(yù)處理,EMD-RNN模型由 R2=0.7307 、MSE=2.2415 、 MAE=1.0246 、 MAPE=0.0236 、DA=69. 17顯著上升至Mod-EMD-RNN模型 R2=Φ 0.92、 MSE=0.6663 、 MAE=0.586 、 MAPE=0.0135 DA=76.6798 ;EMD-LSTM模型的DA值由66.4032提高至本模型的79.0514。該結(jié)果表明,Mod-EMD-RNN和Mod-EMD-BiLSTM模型的預(yù)測能力比EMD-RNN和EMD-LSTM模型均有了明顯提高。預(yù)防框架的預(yù)處理機(jī)制能有效增強(qiáng)模型捕捉隱藏信息的能力,提高模型的預(yù)測精度并規(guī)避過擬合。
(4)與各基準(zhǔn)模型相比,本模型具備良好的預(yù)測性能,方向預(yù)測精度最佳,這間接證明LSTM神經(jīng)網(wǎng)絡(luò)在處理復(fù)雜、非平穩(wěn)、高噪音時間序列時,具備卓越的關(guān)鍵信息提取能力及門控機(jī)制對低頻復(fù)雜序列建模的適應(yīng)性和泛化能力。橫縱向?qū)Ρ冗M(jìn)一步驗(yàn)證了本文提出的Mod-EMD-BiLSTM模型的優(yōu)越性和卓越的預(yù)測性能。
4結(jié)論與展望
隨著碳金融市場的日臻完善與碳定價機(jī)制的日漸成熟,精準(zhǔn)預(yù)測碳價格對推動低碳經(jīng)濟(jì)發(fā)展、應(yīng)對氣候變化意義重大。本文基于機(jī)器學(xué)習(xí)技術(shù)構(gòu)建了融合數(shù)據(jù)增強(qiáng)、經(jīng)驗(yàn)?zāi)B(tài)分解和雙向長短期記憶技術(shù)的新型混合預(yù)測模型,以提升其精準(zhǔn)性與有效性,為碳價格預(yù)測領(lǐng)域注人新思維并提供理論參考。(1)利用EMD技術(shù)處理非平穩(wěn)、非線性的碳價格時間序列,生成較平穩(wěn)的內(nèi)在模態(tài)分量(IMF);(2)引入數(shù)據(jù)增強(qiáng)技術(shù),將其與預(yù)防框架有效結(jié)合,旨在處理IMF分量組合,強(qiáng)化預(yù)測模型對關(guān)鍵預(yù)測信息的提取能力,提高其預(yù)測性能并消除過擬合困境。再將所有的IMF子序列輸入預(yù)測框架生成初始預(yù)測值;(3)將預(yù)防與預(yù)測框架生成的結(jié)果輸人至BiLSTM網(wǎng)絡(luò)全連接層進(jìn)行精準(zhǔn)預(yù)測。對比分析表明,本文所提模型具備優(yōu)越性與精準(zhǔn)性,呈現(xiàn)出最佳的碳價格方向預(yù)測精度。本文的研究結(jié)論如下:
(1)提出一種結(jié)合數(shù)據(jù)增強(qiáng)、經(jīng)驗(yàn)?zāi)B(tài)分解和雙向長短期記憶技術(shù)的新型混合預(yù)測模型,不但能夠有效地捕捉變量之間高度復(fù)雜的非線性關(guān)系,提取隱藏于IMFs模態(tài)分量的有效預(yù)測信息,而且規(guī)避了由訓(xùn)練集數(shù)據(jù)不足導(dǎo)致的過擬合問題。相較于其他流行的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型,本文預(yù)測模型具備最佳的樣本外方向預(yù)測精度,呈現(xiàn)穩(wěn)定且優(yōu)越的碳價格預(yù)測性能。
(2)創(chuàng)新性地引入數(shù)據(jù)增強(qiáng)技術(shù),并將其與EMD分解方法相融合,不僅擴(kuò)充訓(xùn)練數(shù)據(jù),還自適應(yīng)地將非線性、非平穩(wěn)、高噪音的碳價格序列分解為容納更多預(yù)測信息的IMFs模態(tài)分量,進(jìn)而增強(qiáng)LSTM神經(jīng)網(wǎng)絡(luò)對時間序列的建模能力,避免模型花費(fèi)大量時間尋找自標(biāo)變量的預(yù)測因子,并消除過擬合,提高預(yù)測模型的精準(zhǔn)性與魯棒性。
(3)Mod-EMD-BiLSTM新型混合預(yù)測模型涵蓋預(yù)防與預(yù)測兩個創(chuàng)新機(jī)制,引入預(yù)防框架,有利于充分捕獲IMFs組合中隱藏的關(guān)鍵特征信息并防止特定IMF中噪聲信息對模型預(yù)測產(chǎn)生干擾。接著將預(yù)防框架提取的有效預(yù)測信息與所有IMF子序列輸入預(yù)測框架后生成的初步預(yù)測結(jié)果串聯(lián)至全連接層,輸出最終預(yù)測結(jié)果,從而提供模型的預(yù)測性能和泛化能力。
伴隨人工智能熱潮的興起,機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)的方法逐漸被應(yīng)用于碳價格預(yù)測領(lǐng)域。本文提出的Mod-EMD-BiLSTM新型混合預(yù)測框架顯著提高了碳價格預(yù)測精度,為碳價格預(yù)測增添新思路,并為該領(lǐng)域的預(yù)測者和投資者提供理論借鑒。此外,未來將嘗試引人二次分解技術(shù),并將經(jīng)濟(jì)、政策、新聞影響力、國際形勢等與碳價格相關(guān)的重要影響因素納入研究范圍,以增強(qiáng)模型的預(yù)測性能,擴(kuò)大其在股票市場、債券市場等其他領(lǐng)域的預(yù)測通用性與有效性。
參考文獻(xiàn)
[1]HanM,DingL,ZhaoX,et al.ForecastingCarbonPricesintheShenzhenMarket,China:TheRoleofMixed-frequencyFac-tors[J].Energy,2019,171:69~76.
[2]崔煥影,竇祥勝.基于EMD-GA-BP與EMD-PSO-LSSVM的中國碳市場價格預(yù)測[J].運(yùn)籌與管理,2018,27(7):133~143.
[3]王一蓉,陳浩林,林立身,等.考慮電力行業(yè)碳排放的全國碳價預(yù)測[J].中國電力,2024,57(5):79~87.
[4]高長征,李東偉,王秀娜,等.利用智能機(jī)器學(xué)習(xí)方法對區(qū)域碳排放權(quán)交易價格預(yù)測研究——基于湖北碳市場數(shù)據(jù)的分析[J].價格理論與實(shí)踐,2022,(4):89~93,205.
[5]MaoYQ,YuXB,etal.AHybridForecastingApproach forChina'sNational Carbon Emission Allowance Priceswith BalancedAccuracyand Interpretability[J].Journal of Environmental Mana-gement,2024,351:119873.
[6]張大斌,黃均杰,凌立文,等.融合新聞影響力衰減的碳價格多元分解集成預(yù)測[J].河南科技大學(xué)學(xué)報(自然科學(xué)版),2024,45(1):51~61,7~8.
[7]PanD,ZhangC,ZhuD,etal.CarbonPrice ForecastingBasedonNews Text Mining Considering Investor Attention [J].Envi-ronmental Scienceand Pollution Research,2O23,30(11):28704~28717.
[8]劉金培,張了丹,朱家明,等.非結(jié)構(gòu)性數(shù)據(jù)驅(qū)動的混合分解集成碳交易價格組合預(yù)測[J].運(yùn)籌與管理,2023,32(3):149~154.
[9]周熠烜,陳華友,周禮剛,等.基于非結(jié)構(gòu)化數(shù)據(jù)的LLE-WOA-LSSVR碳價格組合預(yù)測模型[J].合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版),2022,45(4):570~576.
[10]高楊,李健.基于EMD-PSO-SVM誤差校正模型的國際碳金融市場價格預(yù)測[J].中國人口·資源與環(huán)境,2014,24(6):163~170.
[11]Xu YY,Dai YF,Guo L L,et al.Leveraging Machine Lear-ning to Forecast Carbon Returns:Factors from Energy Markets [J].Applied Energy,2024,357:122515.
[12] Cicek Z I E,Ozturk Z K. Optimizing the Artificial Neural Net-work Parameters Using a Biased Random Key Genetic Algorithmfor Time Series Forecasting [J].Applied Soft Computing,2021,102:107091.
[13]JiL, Zou Y C,He KJ,et al. Carbon Futures Price Forecas-ting Based with ARIMA-CNN-LSTM Model[J]. Procedia Com-puter Science,2019,162:33~38.
[14]Fern(ndez-Martinez D, Jaramillo-Morán M A. Multi-step HourlyPower Consumption Forecasting in a Healthcare Building with Recur-rent Neural Networksand Empirical Mode Decomposition[J].Sen-sors,2022,22(10):3664.
[15]ZhouF,Huang Z,Zhang C,et al. Carbon Price ForecastingBased on CEEMDAN and LSTM[J]. Applied Energy,2022,311: 118601.
[16]Hochreiter S,SchmidhuberJ.Long Short-term Memory[J].NeuralComputation Mit-press,1997,9(8):1735~1780.
[17]Yu,Lean,Liang,et al.Predicting Monthly Biofuel Produc-tionUsing a Hybrid Ensemble Forecasting Methodology[J].In-ternational Journal of Forecasting,2022,38(1):3~20.
[18]Baek Y,Kim H Y. ModAugNet:A New Forecasting Frame-work for Stock Market Index Value with an Overfiting PreventionLSTM Module and a Prediction LSTM Module[J].Expert Sys-tems with Applications,2018,113:457~480.
[19]Houdt G V,Mosquera C,Napoles G.A Review on the LongShort-termMemoryModel[J].Artificial IntelligenceReview,2020,53(8): 5929~5955.
[20]Lin Y,Lu Q,TanB,et al. Forecasting Energy Prices Using aNovel Hybrid Model with Variational Mode Decomposition[J].Energy,2022,246:123366.1~123366.16.
[21]Tian P,Zhang C,Zhou JZ,et al. An Integrated Framework ofBi-directional Long-short Term Memory(BiLSTM)BasedonSine Cosine Algorithm for Hourly Solar Radiation Forecasting[J].Energy,2021,221:119887.1~119887.19.
[22]Huang YS,Deng Y.A New Crude Oil Price Forecasting ModelBased on Variational Mode Decomposition[J].Knowledge-basedSystems,2021,213:106669.
[23]Zhang K,CaoH,TheJ,et al.A Hybrid Model for Multi-step CoalPrice Forecasting Using Decomposition Technique and Dep Lear-ning Algorithms[J]. Applied Energy,2022,(306):118011.1~118011. 21.
timeAlgorithm for Signal Analysiswiththe Help oftheWaveletTransform[A]//Wavelets:Time-frequencyMethodsandPhaseSpaceProceedings of the International Conference[C].Marseille,F(xiàn)rance,December14~18,1989:286~297.[25]Wu LL,TaiQR,BianY,et al.Point and Interval ForecastingofUltra-short-term Carbon Price in China [J].Carbon Manage-ment,2023,14(1):1~16.
[26]吳麗麗,部慶瑞,卞洋,等.基于GA-VMD與CNN-BiL-STM-Attention模型的區(qū)域碳排放交易價格預(yù)測研究[J].運(yùn)籌與管理,2024,33(9):134~139.
[27]Guan,Keqin,Gong,etal.ANewHybrid Deep Learning ModelforMonthly Oil Prices Forecasting[J].Energy Economics,2023,128:107136.
[Abstract]Accurate predictionofcarbon pricescanprovidequantitative supportandreferencebasisforclimate policy formulation,rationaldecisionmakingof investors,andmaintaining thestableoperationofthecarbonmarket.Thisarticleproposesao velhybrid machinelearning Mod-EMD-BiSTMpredictionmodelthatcombinesdataaugmentation,empirical mode decomposition, andbidirectionallongshorttermmemorytechniques.Specifically,theoriginalcarbonpriceseriesisfistsubjectedtoempirical modedecompositiontoobtainaseriesofrelativelystableandlownoise intrinsicmodecomponents(IMF).Secondly,introducedataaugmentationtechniquestoenhancedatarecombinationandrandomlygeneratehalfoftheIMFcombinations.Furthermore,based onthetwoparalelmechanismsofpreventionandpredictioninthismodel,theIMFcompositecomponentsarefurtherpreprocesed andmodeltrainingiscarrdout.Fially,theoutputvauesoftetwoframeworksareintegratedtroughthefullycoectedlayerf the BiLSTMneural network toobtainthefinalcarbonpricepredictionresults.OnthebasisofestablishingapredictionmodelempiricalesearchisconductedbycrawlingthedailyclosingpricesofcarbontradinginHubei’scarbontrading marketfrom2014to 2024.Teresultsshowthatthemodelestablishedinthisarticleexhibitsthebestdirectionpredictionaccuracycomparedtotheother 16 benchmark models,reflecting the superior prediction performance and good practicality of the model.
[Key words]carbon finance;machine learning;empirical mode decomposition;BiLSTM;data augmentation technology: carbon market mechanism;directional prediction accuracy;time series analysis
[Jelclassification]O16;F18(責(zé)任編輯:張舒逸)