趙 峰, 徐丹華
(安徽工業(yè)大學(xué) 管理科學(xué)與工程學(xué)院, 安徽 馬鞍山 243032)
我國(guó)碳交易已經(jīng)擁有一定規(guī)模且市場(chǎng)前景廣闊[1-2]。碳價(jià)格在促進(jìn)“雙碳”目標(biāo)實(shí)現(xiàn)的基礎(chǔ)上具有一定的負(fù)面影響[3],如何通過(guò)碳交易價(jià)格引導(dǎo)投資者更好地利用碳排放權(quán)交易市場(chǎng)進(jìn)行投資,推動(dòng)市場(chǎng)的理性發(fā)展,已成為問(wèn)題的關(guān)鍵。
目前,國(guó)內(nèi)外學(xué)者不斷對(duì)碳交易價(jià)格及其影響因素進(jìn)行研究和分析,并嘗試建立模型對(duì)碳交易價(jià)格進(jìn)行預(yù)測(cè)。有關(guān)碳交易價(jià)格預(yù)測(cè)的研究主要涉及兩個(gè)方面。
1) 針對(duì)碳交易價(jià)格的時(shí)間序列建立預(yù)測(cè)模型。文獻(xiàn)[4]~[8]通過(guò)對(duì)碳價(jià)時(shí)間序列進(jìn)行分解、重組,分別對(duì)重組后的序列建立不同的模型進(jìn)行碳交易價(jià)格預(yù)測(cè)。Zhang等[9]提出了一種先進(jìn)的深度神經(jīng)網(wǎng)絡(luò)模型來(lái)預(yù)測(cè)碳價(jià)格。Xu等[10]利用時(shí)間序列復(fù)雜網(wǎng)絡(luò)分析技術(shù)和極限學(xué)習(xí)機(jī)算法提出了一種新的碳價(jià)預(yù)測(cè)模型。Yang等[11]提出了包括改進(jìn)數(shù)據(jù)特征提取技術(shù),建立LSTM、CNN、ELM預(yù)測(cè)子模型及多目標(biāo)優(yōu)化算法加權(quán)策略的集成預(yù)測(cè)系統(tǒng)(EPS)。彭武元等[12]針對(duì)碳價(jià)格時(shí)間序列,建立了馬爾科夫轉(zhuǎn)換多重分形模型。Zhang 等[13]提出了一種整合 PSO 和多輸出支持向量回歸(MSVR)的混合方法來(lái)預(yù)測(cè)碳價(jià)格。蔣鋒等[14]基于混沌粒子群優(yōu)化(CPSO)算法提出了一種優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)碳價(jià)格預(yù)測(cè)模型。
2) 針對(duì)碳價(jià)波動(dòng)的相關(guān)因素建立預(yù)測(cè)模型。Xie 等[15]創(chuàng)新性地使用文本在線新聞來(lái)構(gòu)建與氣候相關(guān)的變量,并結(jié)合其它變量利用長(zhǎng)短期記憶網(wǎng)絡(luò)和隨機(jī)森林模型對(duì)碳價(jià)進(jìn)行預(yù)測(cè)。劉金培等[16]對(duì)非結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)和碳交易價(jià)格分別進(jìn)行分解、重組,建立了自回歸積分滑動(dòng)平均模型、偏最小二乘回歸和神經(jīng)網(wǎng)絡(luò)模型。魏宇等[17]對(duì)影響我國(guó)碳價(jià)格的相關(guān)因素進(jìn)行了分析,篩選出9個(gè)重要影響因素,并對(duì)各類經(jīng)典預(yù)測(cè)模型進(jìn)行對(duì)比分析。
通過(guò)相關(guān)文獻(xiàn)分析發(fā)現(xiàn),針對(duì)國(guó)內(nèi)碳交易價(jià)格預(yù)測(cè)的文獻(xiàn)相對(duì)較少,且大部分文獻(xiàn)僅從碳交易價(jià)格本身或碳交易價(jià)格相關(guān)影響因素著手進(jìn)行建模預(yù)測(cè),目前尚沒(méi)有綜合考慮兩種建模方法的相關(guān)文獻(xiàn)。因此,本文綜合考慮以上兩個(gè)方面,分別建立CEEMDAN-ARIMA-指數(shù)平滑模型和改進(jìn)的哈里斯鷹優(yōu)化極限學(xué)習(xí)機(jī)的碳價(jià)格預(yù)測(cè)模型,并通過(guò)lp范數(shù)建立組合預(yù)測(cè)模型。為此,論文在現(xiàn)有文獻(xiàn)的基礎(chǔ)上,構(gòu)建了基于lp范數(shù)的碳交易價(jià)格組合預(yù)測(cè)模型。該模型具有如下創(chuàng)新性:
1) 為了充分挖掘碳交易價(jià)格所帶來(lái)的信息,一方面考慮碳交易價(jià)格本身建立了CEEMDAN-ARIMA-指數(shù)平滑模型,另一方面考慮碳交易價(jià)格的經(jīng)濟(jì)指標(biāo)和技術(shù)指標(biāo)等建立了THHO-ELM模型;
2) 利用多策略融合改進(jìn)的哈里斯鷹算法優(yōu)化極限學(xué)習(xí)機(jī)模型中的權(quán)值和閾值,并利用優(yōu)化后的模型對(duì)廣東省碳交易價(jià)格進(jìn)行訓(xùn)練和預(yù)測(cè);
3) 為充分利用上述兩個(gè)模型的優(yōu)勢(shì),建立了基于lp范數(shù)的誤差平方絕對(duì)值模型。實(shí)證結(jié)果表明,本文提出的lp范數(shù)組合預(yù)測(cè)模型優(yōu)于單一的分類模型,對(duì)碳交易價(jià)格預(yù)測(cè)精度較高。此外,本文在我國(guó)的東、中、西部分別選取上海、湖北和重慶碳交易試點(diǎn)進(jìn)行預(yù)測(cè),進(jìn)一步驗(yàn)證了模型的可靠性。
經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition, EMD)是處理非平穩(wěn)信號(hào)的方法之一,其本質(zhì)是將原始的復(fù)雜信號(hào)分解成包含原始信號(hào)部分特性的多個(gè)IMF分量和殘余分量之和[18]。EMD算法雖對(duì)信號(hào)具有一定的適應(yīng)性,但易產(chǎn)生模態(tài)混疊現(xiàn)象,從而影響信號(hào)分解質(zhì)量。而完全自適應(yīng)噪聲集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN)加入了經(jīng)EMD分解后含輔助噪聲的IMF分量,并對(duì)分解得到的IMF分量進(jìn)行總體平均,完美解決了EMD算法中存在的模態(tài)混疊現(xiàn)象。
CEEMDAN算法的實(shí)現(xiàn)步驟:
1.2.1傳統(tǒng)的哈里斯鷹優(yōu)化算法
哈里斯鷹算法(harris hawks optimization, HHO)是基于哈里斯鷹的群體捕食行為而提出的一種元啟發(fā)式算法[19],主要包括探索階段、探索到開(kāi)發(fā)的轉(zhuǎn)換以及局部開(kāi)采三個(gè)階段。每個(gè)階段的具體描述如下。
階段1:探索階段哈里斯鷹的位置更新:
(1)
式中:q、r1、r2、r3、r4均為[0,1]內(nèi)的隨機(jī)數(shù);ub、lb為搜索空間的上、下界;Xrand為群體內(nèi)隨機(jī)個(gè)體位置;Xrabbit為獵物位置;Xm為種群內(nèi)所有個(gè)體的平均位置。
階段2:探索到開(kāi)發(fā)的轉(zhuǎn)換:
(2)
式中:E0為初始狀態(tài)的逃逸能量,在算法迭代過(guò)程中于[-1,1]之間隨機(jī)變化;t為種群當(dāng)前迭代次數(shù);T為種群的最大迭代次數(shù)。
階段3: HHO算法根據(jù)哈里斯鷹的圍捕方式和獵物的逃脫行為,提出了四種攻擊策略。
策略1:當(dāng)逃逸能量|E|≥0.5且隨機(jī)數(shù)r≥0.5時(shí),哈里斯鷹采取軟圍攻策略。其位置更新為:
X(t+1)=Xrabbit(t)-X(t)-E|JXrabbit(t)-X(t)|
(3)
式中:J=2(1-r5)為獵物的跳躍距離;r5為[0,1]內(nèi)的隨機(jī)數(shù)。
策略2:當(dāng)逃逸能量|E|<0.5且隨機(jī)數(shù)r≥0.5時(shí),哈里斯鷹采取硬圍攻策略。其位置更新為:
X(t+1)=Xrabbit(t)-E|Xrabbit(t)-X(t)|
(4)
策略3:當(dāng)逃逸能量|E|≥0.5且隨機(jī)數(shù)r<0.5時(shí),哈里斯鷹采取漸進(jìn)式快速俯沖軟包圍。其位置更新為:
(5)
式中:S為隨機(jī)行向量;D為解決問(wèn)題的維度;LF為levy函數(shù)。
策略4:當(dāng)逃逸能量|E|<0.5且隨機(jī)數(shù)r<0.5時(shí),采取漸進(jìn)式快速俯沖硬包圍。其位置更新為:
X(t+1)=
(6)
1.2.2改進(jìn)的哈里斯鷹優(yōu)化算法
傳統(tǒng)的HHO算法與其他群智能優(yōu)化算法一樣,在求解復(fù)雜優(yōu)化問(wèn)題時(shí),存在易陷入局部最優(yōu)且收斂精度不高等缺點(diǎn)。針對(duì)以上問(wèn)題,文獻(xiàn)[20]引入了指數(shù)能量方程、正弦逃逸距離方程、柯西變異和Circle混沌擾動(dòng)對(duì)傳統(tǒng)的HHO算法進(jìn)行改進(jìn),改進(jìn)的哈里斯鷹算法記為THHO。
1) 指數(shù)能量方程
逃逸能量E的取值決定了種群是進(jìn)行探索還是局部開(kāi)采,但在傳統(tǒng)的HHO算法中E是通過(guò)線性遞減進(jìn)行更新,即在迭代后期種群只進(jìn)行局部開(kāi)采,這使得算法易陷入局部最優(yōu),因此本文對(duì)E作如下改進(jìn):
(7)
E=E0×(2×r6-1)
(8)
式中:c為常數(shù)2;r6為[0,1]之間均勻分布的隨機(jī)數(shù)。
2) 逃逸距離方程
獵物逃逸能量E的變化必然會(huì)引起其在逃跑過(guò)程中跳躍距離J的變化,因此設(shè)置J的取值如下:
3) 柯西變異和Circle混沌擾動(dòng)
柯西變異來(lái)源于連續(xù)型概率分布的柯西分布,主要特點(diǎn)為零處峰值較小,從峰值到零值下降緩慢,可使變異范圍更均勻。在種群個(gè)體位置更新中引入柯西變異,提升算法的搜索能力。變異公式為:
mutationX(t)=X(t)(1+tan(π(u-0.5)))
(10)
式中:mutationX(t)為個(gè)體經(jīng)過(guò)柯西變異后的位置;X(t)為個(gè)體原來(lái)位置;u為區(qū)間[0,1]內(nèi)的隨機(jī)數(shù)。
混沌擾動(dòng)可增強(qiáng)算法的全局搜索能力。在全局探索和局部開(kāi)采后,對(duì)種群中適應(yīng)度值較高的個(gè)體進(jìn)行Circle混沌擾動(dòng),與柯西變異同時(shí)發(fā)揮作用,以增加種群的多樣性,防止陷入局部最優(yōu)。
(11)
式中:CircleX(t)為個(gè)體經(jīng)過(guò)混沌擾動(dòng)后的位置;X(t)為個(gè)體原來(lái)位置;a為常數(shù)0.5,b為常數(shù)2.2。
設(shè)J表示基于lp范數(shù)的誤差絕對(duì)值之和,則:
(12)
式中:et為第t時(shí)點(diǎn)組合預(yù)測(cè)的誤差;eit為第t時(shí)點(diǎn)的第i種預(yù)測(cè)方法的誤差;
為第i種預(yù)測(cè)方法在組合預(yù)測(cè)模型中的權(quán)重;p可取不同值,本文p取2;N為模態(tài)分量個(gè)數(shù);n為預(yù)測(cè)方法種類數(shù)。
基于lp范數(shù)的誤差平方絕對(duì)值之和能夠說(shuō)明兩個(gè)序列的接近程度,其數(shù)值越小,表明預(yù)測(cè)值越接近實(shí)際值,模型的預(yù)測(cè)效果越好,反之則說(shuō)明兩個(gè)序列相差較大,預(yù)測(cè)效果較差。但是在預(yù)測(cè)過(guò)程中難免會(huì)出現(xiàn)誤差,因此構(gòu)建最優(yōu)化組合預(yù)測(cè)模型為:
(13)
本文選取均方誤差(MSE)、平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)對(duì)預(yù)測(cè)結(jié)果的有效性進(jìn)行評(píng)估。
(14)
首先對(duì)廣東省的碳交易價(jià)格序列進(jìn)行CEEMDAN分解,根據(jù)分解序列的均值將其重組為高頻序列和低頻序列。將2019年1月2日至2021年2月10日的數(shù)據(jù)作為訓(xùn)練集,對(duì)高頻序列建立ARIMA模型,對(duì)低頻序列建立指數(shù)平滑模型,然后對(duì)2021年2月18日至2021年3月18日的20條數(shù)據(jù)進(jìn)行預(yù)測(cè),通過(guò)將高頻序列的預(yù)測(cè)結(jié)果和低頻序列的預(yù)測(cè)結(jié)果加和,對(duì)廣東省碳交易價(jià)格進(jìn)行預(yù)測(cè)。
2.2.1模型I數(shù)據(jù)選取
本文選取廣東省碳交易每日的收盤價(jià)格作為模型I預(yù)測(cè)研究的基礎(chǔ)數(shù)據(jù)。利用Python 從碳交易網(wǎng)抓取2019年1月2日至2021年3月18日之間廣東省碳交易的相關(guān)數(shù)據(jù),剔除法定節(jié)假日等因素的影響,共包含536條數(shù)據(jù)。
2.2.2CEEMDAN分解與重組
由于碳交易價(jià)格具有不平穩(wěn)、非線性特征,因此對(duì)2019年1月2日至2021年3月18日之間廣東省碳交易價(jià)格進(jìn)行CEEMDAN分解,由圖1可知,CEEMDAN將原始的碳交易價(jià)格數(shù)據(jù)按照頻率的高低分為7組不同頻率的IMF序列及一組殘余趨勢(shì)序列Res。其本征模函數(shù)(IMF)和殘余項(xiàng)如圖1所示。
圖1 CEEMDAN分解產(chǎn)生的IMF及ResFig.1 IMF and Res generated by CEEMDAN decomposition
通過(guò)計(jì)算本征模函數(shù)IMF的均值,將廣東省的碳交易價(jià)格分解序列重構(gòu)成高頻分量和低頻分量,殘余項(xiàng)的數(shù)值忽略不計(jì)。由表1可知,IMF1~I(xiàn)MF6的均值與0相近,而IMF7的分量顯著偏離0,因此,本文將IMF1~I(xiàn)MF6加和重構(gòu)為高頻分量,將IMF7重構(gòu)為低頻分量。
表1 各個(gè)IMF分量的均值Tab.1 Mean value of each IMF component
2.2.3高頻序列ARIMA預(yù)測(cè)
對(duì)高頻序列建立差分整合移動(dòng)平均自回歸(ARIMA)模型,為驗(yàn)證該模型的可靠性,選取支持向量機(jī)(SVM)模型和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)模型作為基準(zhǔn)對(duì)照模型。由于ARIMA模型要求序列是平穩(wěn)序列,因此要對(duì)高頻序列進(jìn)行平穩(wěn)性檢驗(yàn)。通過(guò)SPSS對(duì)訓(xùn)練集的高頻序列進(jìn)行自相關(guān)(ACF)和偏自相關(guān)(PACF)檢驗(yàn),結(jié)果如圖2所示。
由圖2可知,高頻序列的ACF不趨于0,說(shuō)明序列具有很強(qiáng)的長(zhǎng)期相關(guān)性,因此該序列為非平穩(wěn)序列。對(duì)高頻序列進(jìn)行一階差分,使其平穩(wěn)化,并對(duì)一階差分序列進(jìn)行平穩(wěn)性檢驗(yàn),由圖3可知,高頻序列一階差分的ACF和PACF均為拖尾,因此其為平穩(wěn)序列。
圖2 高頻序列的ACF和PACF圖Fig.2 ACF and PACF diagram of high frequency sequence
圖3 一階差分的ACF和PACF圖Fig.3 ACF and PACF diagram of first-order difference
由圖3可知,一階差分的ACF是一個(gè)逐漸趨于0的拖尾,ACF自1階過(guò)后都落在置信區(qū)間內(nèi),所以是MA(1)模型;一階差分的PACF是一個(gè)逐漸趨于0的拖尾,PACF自3階過(guò)后基本都落在置信區(qū)間內(nèi),所以是AR(3)模型,因此應(yīng)對(duì)高頻序列建立ARIMA(3,1,1)模型。
ARIMA(3,1,1)模型、支持向量機(jī)模型(SVM)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)模型(LSTM)對(duì)高頻序列的預(yù)測(cè)精度如表2所示。
表2 高頻序列預(yù)測(cè)精度對(duì)比Tab.2 Comparison of prediction accuracy of high frequency series
由表2可知,ARIMA(3,1,1)模型比支持向量機(jī)(SVM)模型的MSE、MAE、RMSE、MAPE值分別降低了69.00%、47.12%、44.33%、32.92%,且ARIMA(3,1,1)模型的預(yù)測(cè)精度遠(yuǎn)高于LSTM模型,說(shuō)明ARIMA(3,1,1)模型對(duì)高頻序列的預(yù)測(cè)效果優(yōu)于其對(duì)照模型。
2.2.4低頻序列指數(shù)平滑預(yù)測(cè)
由于低頻序列具有線性、平穩(wěn)特征,因此對(duì)低頻序列采用指數(shù)平滑預(yù)測(cè)。通過(guò)對(duì)低頻數(shù)據(jù)訓(xùn)練集進(jìn)行不同平滑次數(shù)、不同平滑系數(shù)的研究及對(duì)比分析,可知當(dāng)平滑次數(shù)為3次、平滑系數(shù)為0.1時(shí),模型的預(yù)測(cè)效果最佳。為驗(yàn)證指數(shù)平滑模型對(duì)低頻序列預(yù)測(cè)效果的可靠性,選取支持向量機(jī)(SVM)模型和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)模型作為基準(zhǔn)對(duì)照模型,結(jié)果如表3所示。
表3 低頻序列預(yù)測(cè)精度對(duì)比 Tab.3 Comparison of prediction accuracy of low frequency series
由表3可知,當(dāng)平滑次數(shù)為3次、平滑系數(shù)為0.1時(shí),3次指數(shù)平滑模型的MSE、MAE、RMSE、MAPE值分別為1.54E-05、0.003 3、0.003 9、0.011 0,均遠(yuǎn)低于SVM和LSTM模型,說(shuō)明3次指數(shù)平滑模型對(duì)低頻序列的預(yù)測(cè)效果優(yōu)于SVM和LSTM模型。
2.2.5模型I預(yù)測(cè)結(jié)果
相比于SVM模型和LSTM模型,對(duì)高頻序列建立ARIMA模型、對(duì)低頻序列建立指數(shù)平滑模型預(yù)測(cè)效果最優(yōu)。將ARIMA高頻序列預(yù)測(cè)結(jié)果和指數(shù)平滑模型低頻序列預(yù)測(cè)結(jié)果加和,作為2021年2月18日至2021年3月18日的碳交易價(jià)格的預(yù)測(cè)值,并由此得出模型I的預(yù)測(cè)精度,結(jié)果如表4所示。
表4 模型I預(yù)測(cè)精度Tab.4 Prediction accuracy of Model I
通過(guò)對(duì)碳交易價(jià)格時(shí)間序列進(jìn)行CEEMDAN分解、重組,然后對(duì)高頻序列建立ARIMA模型,對(duì)低頻序列建立指數(shù)平滑模型,得到模型I預(yù)測(cè)結(jié)果的MSE、 MAE、RMSE、MAPE值分別為0.255 7、0.340 0、0.505 7、1.008 2。
另一方面,綜合考慮碳交易價(jià)格的行情指標(biāo)和經(jīng)濟(jì)指標(biāo)兩個(gè)維度,從中找出與碳交易價(jià)格相關(guān)的15個(gè)影響因素,通過(guò)Pearson相關(guān)系數(shù)選取與下一日碳交易價(jià)格高度相關(guān)的6個(gè)變量并將其作為解釋變量,然后將下一日碳交易價(jià)格作為被解釋變量,建立多策略融合改進(jìn)的哈里斯鷹優(yōu)化極限學(xué)習(xí)機(jī)模型(THHO_ELM),從而對(duì)廣東省碳交易價(jià)格進(jìn)行預(yù)測(cè)。
2.3.1模型II數(shù)據(jù)選取
利用Python 從碳交易網(wǎng)抓取廣東省碳交易的相關(guān)數(shù)據(jù),選取廣東省碳交易的最高價(jià)、最低價(jià)、開(kāi)盤價(jià)、收盤價(jià)和交易額5個(gè)變量作為行情指標(biāo),通過(guò)多日內(nèi)碳交易的行情指標(biāo)數(shù)據(jù)計(jì)算出碳交易的10個(gè)經(jīng)濟(jì)指標(biāo)數(shù)據(jù),其中包括12日短期移動(dòng)平均線(MA12)、26日長(zhǎng)期移動(dòng)平均線(MA26)、平滑異同移動(dòng)平均線(MACD)、簡(jiǎn)易波動(dòng)指標(biāo)(EMV)、隨機(jī)指標(biāo)(K、D、J)、相對(duì)強(qiáng)弱指標(biāo)(RSI)、乖離率和心理線(PSY)。根據(jù)當(dāng)日碳交易的行情指標(biāo)、經(jīng)濟(jì)指標(biāo)與下一日收盤價(jià)的Pearson系數(shù)來(lái)判定二者之間的相關(guān)性強(qiáng)弱,結(jié)果如表5所示。
由表5可知,碳交易的最高價(jià)、最低價(jià)、開(kāi)盤價(jià)、收盤價(jià)、MA12和MA26與下一日收盤價(jià)高度相關(guān),其相關(guān)系數(shù)分別為0.971、0.962、0.984、0.989、0.982、0.974。因此,論文將2019年1月2日至2021年2月10日的數(shù)據(jù)作為訓(xùn)練集,將廣東省碳交易的最高價(jià)、最低價(jià)、開(kāi)盤價(jià)、收盤價(jià)、MA12和MA26作為解釋變量,下一日碳交易收盤價(jià)作為被解釋變量,建立哈里斯鷹優(yōu)化極限學(xué)習(xí)機(jī)模型(THHO_ELM)對(duì)2021年2月18日至2021年3月18日的碳交易收盤價(jià)進(jìn)行預(yù)測(cè)。
表5 碳交易價(jià)格的Pearson相關(guān)系數(shù)Tab.5 Pearson correlation coefficient of carbon trading price
2.3.2THHO_ELM算法流程
為了提高傳統(tǒng)ELM算法的預(yù)測(cè)準(zhǔn)確度,論文利用改進(jìn)的哈里斯鷹算法對(duì)ELM算法的權(quán)值和閾值進(jìn)行優(yōu)化。其中種群初始規(guī)模為50,最大迭代次數(shù)為500,ELM算法的權(quán)值取值范圍為[-1,1],ELM算法的閾值取值范圍為[-10,10],THHO_ELM算法具體流程如下:
1) 確定ELM模型的結(jié)構(gòu),其中主要包括輸入層神經(jīng)元個(gè)數(shù)、隱含層神經(jīng)元個(gè)數(shù)、輸入權(quán)值數(shù)、隱含層節(jié)點(diǎn)閾值數(shù);
2) 根據(jù)ELM模型進(jìn)行哈里斯鷹種群初始化,設(shè)置種群規(guī)模、最大迭代次數(shù)等參數(shù),在給定范圍內(nèi)隨機(jī)產(chǎn)生哈里斯鷹種群;
3) 采用訓(xùn)練集、初始權(quán)值和閾值訓(xùn)練ELM模型并對(duì)測(cè)試集進(jìn)行預(yù)測(cè),將測(cè)試集的MSE值作為個(gè)體的適應(yīng)度值,計(jì)算哈里斯鷹種群的初始適應(yīng)度值;
4) 根據(jù)逃逸能量E和隨機(jī)數(shù)r的值選擇相應(yīng)的階段或圍攻策略,根據(jù)位置更新公式對(duì)哈里斯鷹種群進(jìn)行更新;
5) 計(jì)算每個(gè)個(gè)體的適應(yīng)度值,更新全局最優(yōu)值;
6) 判斷是否達(dá)到算法終止條件,若達(dá)到條件,則輸出全局的最優(yōu)適應(yīng)度值,否則循環(huán)執(zhí)行步驟4)和5);
7) 將哈里斯鷹算法得到的最優(yōu)位置參數(shù)賦值給ELM模型的輸入權(quán)值和隱層節(jié)點(diǎn)的閾值。在訓(xùn)練集樣本下,計(jì)算ELM的輸出權(quán)值矩陣,并對(duì)測(cè)試集樣本進(jìn)行預(yù)測(cè)。
2.3.3模型II預(yù)測(cè)結(jié)果
將每日的碳交易最高價(jià)、最低價(jià)、開(kāi)盤價(jià)、收盤價(jià)、MA12和MA26作為解釋變量,下一日收盤價(jià)作為被解釋變量,建立ELM模型對(duì)碳交易價(jià)格進(jìn)行預(yù)測(cè)。為了驗(yàn)證ELM模型預(yù)測(cè)效果的可靠性,選取隨機(jī)森林模型(RF)、支持向量回歸機(jī)模型(SVR) 進(jìn)行對(duì)比試驗(yàn),結(jié)果如表6所示。
表6 ELM模型預(yù)測(cè)精度Tab.6 ELM model prediction accuracy
由表6可知,ELM 模型的預(yù)測(cè)效果要優(yōu)于RF模型和SVR模型,因此本文選擇利用群智能優(yōu)化算法對(duì)ELM模型做進(jìn)一步優(yōu)化。
本文選用粒子群算法(PSO) 、灰狼優(yōu)化算法(GWO)和HHO算法優(yōu)化ELM模型,對(duì)碳交易價(jià)格進(jìn)行預(yù)測(cè)。結(jié)果如表7所示。
表7 ELM優(yōu)化模型預(yù)測(cè)精度Tab.7 ELM optimization model prediction accuracy
由表7可知,PSO算法、GWO算法和HHO算法都對(duì)ELM模型具有一定的優(yōu)化效果,且HHO算法的MSE、MAE、RMSE、MAPE值均低于PSO算法和GWO算法,即HHO算法對(duì)ELM模型的優(yōu)化效果優(yōu)于PSO算法和GWO算法。因此選用HHO算法對(duì)ELM模型做進(jìn)一步優(yōu)化。
THHO_ELM模型的MSE、MAE、RMSE、MAPE值分別為0.095 3、0.263 1、0.308 6、0.774 2。由ELM模型、HHO_ELM模型和THHO_ELM 模型的MSE、MAE、RMSE、MAPE值可知,HHO算法和THHO算法都能提升ELM模型的預(yù)測(cè)精度,且THHO_ELM模型的預(yù)測(cè)精度優(yōu)于HHO_ELM模型。
為了綜合模型優(yōu)勢(shì),將 CEEMDAN-ARIMA-指數(shù)平滑模型和 THHO_ELM 模型進(jìn)行組合,建立基于lp范數(shù)的誤差平方絕對(duì)值模型。
在CEEMDAN-ARIMA-指數(shù)平滑模型和THHO_ELM模型的基礎(chǔ)上進(jìn)行l(wèi)p范數(shù)組合預(yù)測(cè)。當(dāng)CEEMDAN-ARIMA-指數(shù)平滑模型的權(quán)值為0.211、THHO_ELM模型的權(quán)值為0.789時(shí),模型的組合預(yù)測(cè)誤差最小?;趌p范數(shù)的組合預(yù)測(cè)模型及單一模型的預(yù)測(cè)結(jié)果如表8所示,對(duì)比圖如圖4所示。
表8 lp范數(shù)組合預(yù)測(cè)模型及單一模型的預(yù)測(cè)結(jié)果Tab.8 Prediction results of single model and combined forecasting model based on lp norm
圖4 各模型預(yù)測(cè)對(duì)比圖Fig.4 Comparison of prediction of each model
由表8可知,基于lp范數(shù)的組合預(yù)測(cè)模型相比于最優(yōu)的單一預(yù)測(cè)模型(THHO_ELM),其MSE、MAE、RMSE、MAPE值分別降低了4.72%、9.43%、2.33%、9.74%,說(shuō)明基于lp范數(shù)的組合預(yù)測(cè)模型優(yōu)于CEEMDAN-ARIMA-指數(shù)平滑模型和THHO_ELM模型。為進(jìn)一步驗(yàn)證基于lp范數(shù)的組合預(yù)測(cè)模型的預(yù)測(cè)效果,本文選取文獻(xiàn)[21]作為對(duì)照,結(jié)果表明,基于lp范數(shù)的組合預(yù)測(cè)模型優(yōu)于對(duì)照模型。
此外,考慮到不同碳交易試點(diǎn)的差異性,論文又在我國(guó)的東、中、西部分別選取上海、湖北和重慶碳交易試點(diǎn),并利用上述模型進(jìn)行預(yù)測(cè),結(jié)果如表9所示。
表9 碳交易試點(diǎn)模型對(duì)比Tab.9 Comparison of carbon trading pilot models
由表9可以看出,基于lp范數(shù)的組合預(yù)測(cè)模型優(yōu)于其單一預(yù)測(cè)模型。因此認(rèn)為,該組合模型對(duì)碳交易價(jià)格有較好的預(yù)測(cè)效果。
論文在傳統(tǒng)的碳交易價(jià)格預(yù)測(cè)模型的基礎(chǔ)上綜合考慮了碳交易價(jià)格本身和碳交易價(jià)格的相關(guān)影響因素,分別建立了CEEMDAN-ARIMA-指數(shù)平滑模型和改進(jìn)的哈里斯鷹優(yōu)化極限學(xué)習(xí)機(jī)的碳價(jià)格預(yù)測(cè)模型。為綜合二者優(yōu)勢(shì),論文建立了基于lp范數(shù)的組合預(yù)測(cè)模型,實(shí)證結(jié)果表明,基于lp范數(shù)的組合預(yù)測(cè)模型相比于最優(yōu)的單一預(yù)測(cè)模型,其MSE、MAE、RMSE、MAPE值分別降低了4.72%、9.43%、2.33%、9.74%,取得了較好的預(yù)測(cè)效果。該組合預(yù)測(cè)模型可為預(yù)測(cè)碳交易價(jià)格提供參考和借鑒,同時(shí)該模型也可應(yīng)用于其它行業(yè)的預(yù)測(cè)。
西安理工大學(xué)學(xué)報(bào)2023年3期