梁文建 石衛(wèi)兵 韓玉穩(wěn) 戴峰 馬亞文
1.中車青島四方機車車輛股份有限公司 山東 青島 266000
2.云南省機電一體化應用技術重點實驗室 云南 昆明 650031
3.南通市中央創(chuàng)新區(qū)建設投資有限公司 江蘇 南通 226010
4.元始智能科技(南通)有限公司 江蘇 南通 226010
世界范圍內的建筑能耗已超越了工業(yè)、交通等領域,世界各國的建筑能耗普遍約為33%[1]。我國建筑能耗已達到全國總能源消費的三分之一,工業(yè)園區(qū)能耗作為建筑能耗的主要組成部分,園區(qū)能源消耗精準預測對園區(qū)節(jié)能有著重要作用。目前,園區(qū)能耗預測模型方法主要分為兩種,一種是工程模型或正演模型,另一種是基于數(shù)據(jù)驅動模型。技術建模使用物理和熱力學函數(shù)來量化理論過程和系統(tǒng)的能耗。技術模型可提供精確的結果,但也需要詳細的輸入數(shù)據(jù)[2]。
數(shù)據(jù)驅動模型,其目的是能在缺少園區(qū)物理參數(shù)的情況下對園區(qū)能耗進行預測,是通過過去的數(shù)據(jù)以此來建立能耗數(shù)據(jù)驅動模型。當前,廣泛使用的機器學習方法有支持向量回歸(Support Vector Recovery, SVR)[3]、人工神經網絡(ANN)[4]和梯度漸進回歸樹(GBRT)等。然而,大多數(shù)機器學習方法用來降低數(shù)據(jù)的復雜性是需要大量的人為操作進行特征提取。
隨著數(shù)據(jù)規(guī)模的不斷擴大和技術不斷發(fā)展,基于數(shù)據(jù)驅動的模型正逐步從淺層向深層過渡[5],即在多層網絡中直接從數(shù)據(jù)中進行特征提取。與傳統(tǒng)的機器學習方法相比,深度學習的預測準確率隨訓練樣本數(shù)量的增加而持續(xù)提升[6]。在能源預測領域,循環(huán)神經網絡(RNN)和長短期記憶網絡(LSTM)等模型目前在園區(qū)能耗預測中占主導地位,而卷積神經網絡(CNN)則較少使用,因為CNN更能捕捉局部特征,能有效學習到影響園區(qū)能耗的變量之間的非線性關系。
針對目前園區(qū)能耗預測方法存在的問題和兩種模型各存在的不足和各自的優(yōu)勢,本文提出了一種基于CNN-LSTM聯(lián)合模型的園區(qū)能耗融合預測模型。具體來說,這個聯(lián)合模型是用來對數(shù)據(jù)進行平穩(wěn)分析的,再將數(shù)據(jù)輸入到ARIMA預測模型,得到一組預測值;將經過預處理的數(shù)據(jù)進行特征構造得到處理后的數(shù)據(jù),然后用CNN-LSTM聯(lián)合模型對其進行擬合,獲得了預測結果。在此基礎上,利用卷積神經網絡的預測精度與ARIMA擬合趨勢的一致性,對預測結果進行加權融合,實現(xiàn)能耗融合預測的目的。為了驗證所提預測模型性能的有效性,本文利用某高鐵制造工業(yè)園區(qū)動力柜輸出用電數(shù)據(jù)進行實驗。實驗結果表明,本文提出的融合預測模型在能耗預測準確率方面均高于ARIMA模型和CNN-LSTM模型。本文的主要貢獻可以概括為:(1)將CNN和LSTM兩種算法結合起來,同時提取局部關聯(lián)特征和時序特征,實現(xiàn)更可靠的園區(qū)能耗預測;(2)采用stacking集成學習的模式,將深度學習預測結果與ARIMA預測結果進行融合;(3)利用深度學習模型預測的準確率和ARIMA擬合趨勢的吻合度進行權重分配。
整體結構分成四個部分,第一部分是數(shù)據(jù)采集;第二部分是數(shù)據(jù)處理,對采集到的原始數(shù)據(jù)進行處理,該數(shù)據(jù)為本文實驗數(shù)據(jù);第三部分是模型構建,第四部分給出了本文所建模型的預測結果。
CNN通過處理輸入數(shù)據(jù)的局部相關性可以避免過多的參數(shù)模型,而卷積操作最重要的特點之一就是權值共享。
通常用全連接層、池化層和卷積層構成CNN。其中,卷積層的主要作用是從輸入數(shù)據(jù)中提取有用的信息,通過卷積核對數(shù)據(jù)進行特征提取,形成特征映射圖。
長短期記憶網絡(LSTM)是一種能夠學習并記憶序列長期信息的遞歸模型。LSTM的核心是由三個存儲單元組成,每一次都可以對輸入信息進行編碼。其運算公式如下所示,
其中x表示輸入向量,h表示輸出向量,⊙表示點乘運算符,矩陣表示待訓練參數(shù)。σ(·)表示sigmoid非線性函數(shù),tanh(·)表示雙曲正切函數(shù)。
差分自回歸移動平均模型
差分自回歸移動平均模型(ARIMA)是時間序列預測常用的一種模型。ARIMA模型將時間序列數(shù)據(jù)默認為一組隨機序列,是非平穩(wěn)的數(shù)據(jù)經過差分后趨于平穩(wěn),轉換為平穩(wěn)的時間序列,并對以往數(shù)據(jù)間的線性關系構建模型,以預測數(shù)據(jù)未來值。ARIMA(p, d, q)模型的表現(xiàn)形式為:
式(2)中,yt為當前預測值,μ為常數(shù)項,p為自回歸的階數(shù),q為移動平均的階數(shù),tε為隨機擾動項序列。
針對園區(qū)能耗預測領域,在CNN模型中,可通過卷積核構成高維特征;在LSTM預測模型中,LSTM模型有輸入門it、輸出門ot、和忘記門ft,信息流ct;CNN-LSTM組合模型是混合模型,分為兩層,第一層采用CNN網絡;第二層采用LSTM模型。CNN模型接受訓練數(shù)據(jù)的輸入,提取特征信息,最后輸出預測結果,將預測結果輸入到后端LSTM模型中,LSTM再對輸入進行訓練??梢蕴嵘W絡的非線性映射能力,同時避免過擬合。
融合預測模型(Stacking CNN-LSTM ARIMA,SCLA)是將ARIMA預測模型和CNN-LSTM預測模型結合起來,在有限的數(shù)據(jù)上,提高模型的預測能力。該模型主要包含基于ARIMA模型預測、CNN-LSTM模型預測以及融合預測三個階段。
圖1 融合預測模型
本文選擇了某高鐵制造工業(yè)園區(qū)動力柜用電2022年8月9日到2022年8月23日共358個電表讀數(shù)作為數(shù)據(jù)集,來進行訓練和測試。將2022年8月9日到2022年8月22日的數(shù)據(jù)作為訓練集,2022年8月23日的數(shù)據(jù)作為測試集。
異常值是指在樣本中明顯偏離其他數(shù)值的樣本點,這些異常值與其他數(shù)據(jù)點相比具有顯著的差異。本文使用箱線圖對異常值進行處理。
為了更好地評估模型的預測結果,本文選擇三個性能指標,利用均方誤差(MSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE),以評估和比較模型的預測能力。MSE是真實值與預測值的差值的平方然后求和平均;MAE揭示誤差絕對值的均值情況;MAPE是統(tǒng)計預測準確性的一種方法。以上三類誤差均實數(shù)值越小表示模型預測效果越好。其方程如下
其中,表示預測值,yi表示真實值。
本文使用某高鐵制造工業(yè)園區(qū)電表讀數(shù)作為數(shù)據(jù)源,且需要對其進行處理,計算出其每小時的用電量。
本文使用箱線圖檢測異常數(shù)據(jù),其結果如圖2所示。從圖7中可以發(fā)現(xiàn),數(shù)據(jù)集中各個時間段均存在異常值的情況,對于所檢測出的異常值,采用刪除異常值的方式進行處理。
圖2 異常數(shù)據(jù)檢測
為了確定ARIMA模型的結束,本文應用AIC準則確定最終模型的階數(shù)。AIC準則是由日本統(tǒng)計學家Akaike提出的,該準則要求選擇使下式最小化的模型:
計算p,q取不同的值得到的ARIMA模型的AIC值,最小AIC值對應的p,q即為最優(yōu)參數(shù)。本文所用ARIMA模型的最優(yōu)階數(shù)是(3,0,4)。
為了驗證本文所提模型的有效性和可行性,與ARIMA算法和CNN-LSTM算法進行對比分析。幾種模型的評估指標如下表所示:
從表1可知,本文所提SCLA模型的MSE指標、MAE指標和MAPE指標均低于ARIMA算法和CNN-LSTM算法。
表1 模型評估指標
為了更好的對比三種模型的預測效果,三種模型的預測結果的預測結果如圖3所示。
圖3 預測結果對比
由圖3可知,本文所提的融合模型SCLA的預測曲線更加平滑,相較于ARIMA模型和CNN-LSTM模型其預測結果更接近真實值,預測效果更好。
綜上,根據(jù)三個模型的預測結果和評估指標對比可以看出,本文所提SCLA融合模型預測的整體趨勢和真實值更吻合,特別是在峰值處的預測值和真實值十分貼近,預測效果更好。
本文建立了基于ARIMA和CNN-LSTM融合模型的園區(qū)能耗預測模型利用高鐵制造工業(yè)園區(qū)能耗實測數(shù)據(jù)進行驗證和分析,并得出以下結論:
(1)利用ARIMA預測模型對數(shù)據(jù)進行平穩(wěn)性檢測,并利用箱線圖檢測并刪除異常值得到了有利于能耗預測的平穩(wěn)、完整的實驗數(shù)據(jù)。
(2)提出了CNN-LSTM組合模型,利用卷積神經網絡對提取局部關聯(lián)特征的能力以及長短期記憶網絡學習時序特征的能力進行能耗預測,以實現(xiàn)深度學習在預測公園能耗方面的重要性。
(3)提出了一種新的改進算法,該算法將ARIMA和CNN-LSTM預測進行了校準,該算法充分利用了周期性趨勢的優(yōu)勢,使之能更好地反映實際的變化趨勢。實驗結果顯示,本文所提模型相較于ARIMA和CNN-LSTM的預測精度都大幅度提高。