王 可,盧煥達,鄭軍紅,何利力
(1.浙江理工大學信息學院,浙江 杭州 310018)(2.浙大寧波理工學院計算機與數據工程學院,浙江 寧波 315100)
工業(yè)企業(yè)普遍存在能源利用率偏低、能耗偏高的問題,降低能源工業(yè)消耗比重是企業(yè)首要考慮的問題之一. 中央空調的蒸汽供應模塊作為能源供應中的重要一環(huán),與企業(yè)能源消耗結構息息相關. 由于生產工況不穩(wěn)定、多臺空調機組相互作用、系統(tǒng)產生數據分析復雜等問題,傳統(tǒng)的蒸汽能源供應策略往往不易獲得最佳效果,致使工業(yè)企業(yè)能耗居高不下[1-3].
目前對蒸汽消耗預測問題多采用統(tǒng)計學方法、傳統(tǒng)機器學習方法和深度學習方法. 文獻[4]采用自回歸移動平均對造紙廠蒸汽消耗需求進行預測,對未來生產的汽耗需求提供了理論指導;文獻[5]提出使用機器學習方法對火力發(fā)電蒸汽量預測展開研究,實現了鍋爐運行過程模擬,提高了整體工藝水平;文獻[6]通過構建梯度提升機模型,對氣體脫硫過程的蒸汽消耗精準預測,減少了電量損耗.
本文對某大型企業(yè)卷包車間空調蒸汽消耗預測問題展開研究. 由于蒸汽供應策略的實施與策略生效之間有一定的滯后效應,因此必須預測每個班次中的蒸汽消耗量的變化趨勢,盡快實施工業(yè)策略消除滯后效應對生產造成的影響. 空調消耗量的動態(tài)變化過程中,各種因素之間存在復雜的相互作用,故需要考慮多種因素特征來構建預測模型. 最后力求達到根據預測結果系統(tǒng)自動調控多空調蒸汽消耗量的目的,實現節(jié)能降耗.
空調給車間生產提供了良好的環(huán)境條件,不同空調機組的運作方式直接影響著空調的蒸汽消耗量. 空調系統(tǒng)處理空氣的簡易流程如圖1所示. 通過回風閥和新風閥調節(jié)支管的風量,將新風與回風混合調節(jié)送入過濾器中. 表冷器利用冷水通過冷卻盤管使盤管表面呈現低溫狀態(tài),過濾后的空氣通過表冷器盤管達到降溫效果. 當空氣溫度降到露點溫度,水蒸氣分壓大于飽和蒸汽壓,出現結露,達到除濕效果. 加熱器是由干蒸汽加熱盤管對過濾后的空氣進行加溫,干蒸汽加濕器則對空氣進行等溫加濕. 處理好的空氣通過送風機送入生產車間.
圖1 空調系統(tǒng)處理空氣的簡易流程
全年空氣處理過程如圖2所示,符號含義如表1所示. 室內恒溫恒濕狀態(tài)點N和N1由自控系統(tǒng)自動設置. 過程1和過程2是夏季機組空氣處理流程,過濾后的空氣通過表冷盤管冷凍除濕降至露點,除濕后的低溫空氣經過蒸汽加熱升溫,達到送風狀態(tài)點,由送風機送到車間,此過程中會出現冷源與熱源相互抵消的情況. 過程3-6是過渡季節(jié)機組空氣處理流程,通過降溫加濕或升溫除濕操作達到送風狀態(tài)點. 冬季機組空氣處理流程為過程7和過程8,新回風通過過濾器過濾為干凈空氣,經蒸汽加熱后,由干蒸汽加濕器等溫加濕后滿足送風狀態(tài).
圖2 全年空調焓濕圖
表1 焓濕圖符號表示含義
由圖2可知,空調機組8種處理方式的蒸汽消耗量都不相同,其原因為機組工作方式受時間因素、外部因素和空間因素的共同影響. 時間因素表現在歷史蒸汽消耗量對預測蒸汽消耗量的影響. 外部因素包括氣候、生產班次等,其中生產班次分為早中晚班,早班時間為7:00—15:30,中班時間為15:30—0:00,晚班時間為0:00—7:00,每個班次相應的生產計劃不同. 空間因素是指調控區(qū)域無間隔,多臺大型空調機組存在動態(tài)聯動關系,共同作用來維持車間生產環(huán)境條件的穩(wěn)定. 本文的目標是對未來班次中每分鐘的蒸汽消耗量進行準確預測,實現瞬時動態(tài)預測防止產生滯后效應,給空調系統(tǒng)自動調控提供策略依據,實現節(jié)能降耗. 該問題可用公式(1)描述:
F=f(X,E,I,W),
(1)
式中,F為預測蒸汽消耗量;f為混合深度學習模型;X為歷史蒸汽消耗量輸入;E為外部因素特征輸入;I為空間因素特征輸入;W為學習權重.
該企業(yè)車間具有大面積無隔斷的特點,相鄰機組互相影響,存在一個生產機械設備分布在兩臺機組調控區(qū)域之間的情況,因此每臺機組的蒸汽消耗量不能單獨計算預測. 每個班次的任務量不同會導致不同班次的蒸汽消耗量不同,外界環(huán)境條件、廠房溫濕度環(huán)境等外部條件也同樣影響蒸汽消耗量. 目前存在的制造企業(yè)對蒸汽預測方法不能解決本文中基于復雜環(huán)境下的空調蒸汽預測問題. 文獻[5]利用多元線性回歸、支持向量回歸、樹模型和改進模型融合構建模型,主要為驗證最合理的工藝參數來提升設備精度. 文獻[7]使用基于混沌時間序列的支持向量機來構建預測模型,只考慮了時間因素單方面的影響. 本文采用一種混合模型來解決復雜環(huán)境下的空調蒸汽預測問題,從時間因素、外部因素和空間因素多角度綜合考慮,以提升預測模型的準確性并降低企業(yè)能耗.
時間因素、空間因素和外部因素共同作用影響空調蒸汽消耗量,本文采用不同方法提取3種因素特征,作為預測模型的輸入:采用平滑過程模式、趨勢性模式和周期性模式結合門控循環(huán)單元(gate recurrent unit,GRU)捕捉時間因素特征;采用GRU和兩層全連接網絡耦合外部因素特征;利用三維卷積(convolutions over volumes)和PredRNN++提取空間因素特征. 最后根據3個部分的影響程度采用參數矩陣方法進行融合,計算公式為:
(2)
圖3 空調蒸汽消耗量預測模型整體結構
時間特征體現的是歷史蒸汽消耗量對預測蒸汽消耗量的影響. 為提高模型的預測精度,將時間特征輸入分為平滑過程模式、趨勢性模式和周期性模式[8-9]. 不同模式的特征結合可以獲取時間序列的總體趨勢和局部變化,提取出時間特征XT. 設定平滑過程模式的周期為8.5 h,另外兩種模式的周期制定與平滑過程模式輸入數據量保持一致. 若預測某天某班次中某0.5 h的空調蒸汽量,平滑過程模式輸入預測班次前8.5 h的蒸汽瞬時消耗量,趨勢性模式輸入前17天該班次該時段的蒸汽瞬時消耗量,周期性模式輸入前17周該天該班次該時段的蒸汽瞬時消耗量.
GRU屬于循環(huán)神經網絡的一種,具有參數少更容易收斂的優(yōu)點[10]. GRU模型簡單,只有一個重置門和一個更新門,更新門決定要丟棄的信息和添加的新信息,重置門是另一個來決定要忘記多少過去的信息門. GRU的工作原理為:
(3)
圖4 GRU內部結構圖
外部因素特征包括室內溫濕度、室外溫濕度、露點溫度、生產班次、生產日期(工作日與非工作日).通過GRU對溫濕度和露點溫度進行時間序列分析,預測得到其在待預測班次的相應值,結合生產安排得到班次和日期信息,將全部特征作為第一層全連接層的輸入,然后鏈接一個激活函數ReLU;第二層全連接網絡用于維度映射,耦合出外部特征XE.
2.3 基于三維卷積與PredRNN++提取多空調聯動的空間特征
為增加超大空間恒溫恒濕空調系統(tǒng)的穩(wěn)定性和可靠性,車間環(huán)境采取多臺大型空調機組協(xié)同控制策略. 調控區(qū)域無間隔且相鄰區(qū)域間相互影響,存在同一生產設備分布在兩臺獨立空調設備調控區(qū)域之間的情況. 因此,對空調蒸汽消耗量的預測不能只根據時序相關性進行建模,還應考慮空調設備之間的動態(tài)聯動關系. 車間中空調設備和生產設備的分布如圖5所示.
圖5 生產車間空調設備和生產設備分布圖
為提取影響空調蒸汽消耗量的空間因素特征,采用基于三維卷積與PredRNN++方法來構建神經網絡模型. 首先構造一個三維卷積神經網絡[11-12],將空調歷史蒸汽消耗量數據轉化為三維圖像,通過三維卷積來細化參數間的影響關系,并將結果按第一維度展開作為PredRNN++過程的輸入. PredRNN++能夠自適應地捕獲短期和長期相關性,有強空間相關性和短期動態(tài)的建模能力,還解決了梯度消失問題[13]. 將PredRNN++過程的輸出送至全連接層,得到空間因素特征XS. 提取空間因素特征的模型框架如圖6所示.
圖6 基于三維卷積與PredRNN++的神經網絡模型框架
2.3.1 卷積提取過程
由于空調蒸汽的消耗量是一個連續(xù)動態(tài)過程,且與同一區(qū)域的其他空調機組蒸汽消耗量之間存在復雜的相互作用,用精確的數學模型來描述存在很大困難. 為了得到各參數之間的不確定關系,首先將9個關聯空調機蒸汽消耗量組成的原始向量乘以其轉置得到一個9×9的單通道矩陣,表達任意兩個機組消耗量的所有組合,9個原始參數被細化為9×9=81個參數. 假設S1~S9表示9個空調機組的蒸汽消耗量,設S=[S1,S2,…,S8,S9]T,則
(4)
再結合班次數據組成一個510×9×9(深度×長度×寬度)的三維矩陣.
而后采用卷積運算來提取特征.連續(xù)卷積過程的目的是為了細化參數,進一步確認其間的潛在關系,因而不需要添加池化層來簡化計算.3個連續(xù)的卷積過程如圖7所示.
圖7 連續(xù)卷積過程
第一層卷積使用6個大小為1×3×3的過濾器,設置其步幅為1,padding為0.其中,“1”為過濾器的深度,用以表示對9臺機組潛在關系的細化.以A11為例,第一次卷積的運算公式為:
(5)
(6)
(7)
卷積后得到通道數為6的510×3×3三維矩陣.將三維矩陣以第一維度展開,作為PredRNN++過程的輸入,來進一步提取空間特征.
2.3.2 PredRNN++過程
PredRNN++主要組成部分包括Casual LSTM(時空記憶單元的級聯操作)和GHU(梯度高速公路單元). 這兩種單元能夠建立很深的網絡進行學習,自適應地捕捉長期與短期特征. 其內部結構如圖8所示.
圖8 PredRNN++主要組成部分的內部結構圖
GHU直接通過高速公路相傳,不經歷漫長的記憶單元傳播,在反向傳播時易保留梯度,避免梯度消失. GHU的St命名為Switch Gate,可在轉換輸入Pt和隱藏狀態(tài)Zt之間進行自適應學習.其計算公式為:
Pt=tanh(Wpx*Xt+Wpz*Zt-1),St=σ(Wsx*Xt+Wsz*Zt-1),Zt=St⊙Pt+(1-St)⊙Zt-1.
(8)
Casual LSTM可在不增加層的基礎上增加非線性操作,使特征放大并能捕捉到短期動態(tài)變化和突發(fā)情況,同時也增加網絡從一種狀態(tài)到另一種狀態(tài)的深度.其計算公式為:
(9)
圖9 基于PredRNN++的多維矩陣處理過程
PredRNN++計算公式為:
(10)
從中央空調系統(tǒng)中獲取2019年1月1日零點至2021年6月1日零點生產車間空調機組產生的數據集. 生產車間共有9臺空調機組,共同維持生產環(huán)境的穩(wěn)定. 蒸汽消耗量采集間隔為1 min,每天共產生 1 440 條數據,每個生產班次平均為8.5 h. 模型輸入需統(tǒng)一平滑過程模式、趨勢性模式和周期性模式的數據量,若預測目標為周一早班中7:00—07:30蒸汽瞬時消耗量,平滑過程模式的輸入是前8.5 h的蒸汽消耗量,趨勢性模式的輸入是前17天早班中07:00—07:30的蒸汽瞬時消耗量,周期性模式的輸入是前17個周一早班中07:00—07:30的蒸汽瞬時消耗量. 因此從2019年1月1日開始劃分數據集,以18周為一個單位,訓練集選自前17周數據,驗證集選自第18周數據,以此得到空調蒸汽預測模型.
在數據采集過程中,傳感器故障會導致某些數據存儲失敗,造成單值缺失和連讀多值缺失的情況. 單值缺失采用上下平均值填補法對其進行處理;多值缺失中缺失特征較少,故采用樣條插值法進行處理.
模型從預測精度和能源損耗兩方面進行綜合評價. 模型預測精度的評價指標選用均方根誤差(root-mean-square error,RMSE)、平均絕對誤差(mean absolute error,MAE)、平均絕對百分比誤差(mean absolute percentage error,MAPE),計算公式為:
(11)
車間生產的能源損耗[14-15]主要由用電量、蒸汽消耗、冷量構成,其中耗電量=冷量/COP. COP(coefficient of performance)為空調的性能系數. 電力折標煤系數為0.123,蒸汽折標煤系數為0.094,平均能耗折標(average standard energy consumption,ASEC)計算公式為:
(12)
式中,ASEC為平均折損能耗,其單位為千克標準煤(kgce);Q1為用電量;Q2為冷量的耗電量;S為蒸汽用量;H為空調運行時長.
本文實驗的運行環(huán)境為python3.8.3和Matlab,使用python庫keras、scikit-learn、tensorflow來搭建本文模型和部分對比模型. 使用Matlab設計工具APP構建部分機器學習對比模型. 在空間因素特征提取中. 經過三維卷積操作之后,進入PredRNN++部分,其中Casual LSTM與GHU中設置stride=1、padding=same,選取 16/32/128/256調整batch size,最終確定batch size=32時有最小損失. 在時間因素特征提取和外部因素提取中,GRU神經元個數選取64/128/256/512進行調整,最終確定神經元數分別為512和256. 3種因素由全連接層處理后輸出的神經單元個數為16. 最后根據參數矩陣進行特征融合輸出預測結果.
本文選用SVM、RNN+GRU、LightGBM、多元線性回歸4種對比模型. 文獻[7]中的SVM模型[16-17]目前在制造企業(yè)中應用廣泛,以此對比預測性能的提升;選用RNN+GRU[18-20]組合模型用以驗證提取空間特征的必要性;選取文獻[5]中的機器學習模型[21-25]用以驗證本文模型更符合實際需求. 所有模型的預測結果如圖10所示,誤差結果如表2所示.
圖10 模型預測結果
表2 模型誤差結果
由圖10和表2可知,SVM模型的預測曲線中存在間隔性“鋸齒”,在該時刻的預測結果與實際結果差距很大,存在不穩(wěn)定性. 相較于SVM模型,本文模型RMSE值降低了63.04%、MAE值降低了60.25%、MAPE值降低了56.46%,運行時間也有所縮短,說明本文模型的預測精度、效率和穩(wěn)定性都優(yōu)于SVM模型. 相較于RNN+GRU模型,本文模型雖運行時間略增,但RMSE值降低了8.05%、MAE值降低了5.76%、MAPE值降低了7.25%,證明空間特征對模型的影響程度是不可忽略的. LightGBM模型雖運行時間有所減少,但其誤差值遠遠高于本文模型. 多元線性回歸模型預測精度和運行效率都不及本文模型. 綜上,本文的混合深度學習模型更貼合實際,可實現在復雜環(huán)境中對空調蒸汽的準確實時預測.
將本文模型應用于空調管控系統(tǒng)中,以此減少空調的運行時間和電量損耗,并減少不必要的蒸汽消耗. 現用模型(SVM模型)ASEC值為534.48 kgce,本文模型ASEC值為213.33 kgce,本文模型相較于現用模型ASEC降低了60.09%.
為解決企業(yè)生產車間多空調能耗與生產任務匹配、氣候環(huán)境匹配的精準供能問題,實現多臺大型空調機組的蒸汽預測,提出了一種基于GRU和3DConv-PredRNN++的混合深度學習預測模型. 首先通過分析空調機理得出蒸汽消耗量與機組的8種工作方式相關,而機組的工作方式受到時間因素、空間因素和外部因素影響,因此需要提取3部分特征來構建預測模型. 為進一步提升模型的預測精度,將時間特征因素和空間特征因素以3種不同模式進行輸入,以此獲取蒸汽消耗量序列的總體趨勢和局部變化. 時間因素特征通過GRU提取,空間因素特征利用三維卷積和PredRNN++提取,通過GRU提取時間序列外部因素特征,再結合其余特征輸入全連接層,最后通過參數矩陣融合構建蒸汽消耗模型. 本文模型的RMSE值為107.3 kg,MAE值為80.1 kg,MAPE值為6.4%. 與多種模型對比,驗證了本文模型預測精度的優(yōu)越性,證明了進行空間特征提取參與模型預測的必要性. 與現用SVM模型相比,本文模型的ASEC降低了60.09%.
隨著企業(yè)生產鏈的不斷運轉,中央空調系統(tǒng)會繼續(xù)產生大量數據,需要不斷補充數據集對模型進行校正,進一步提升模型的預測精度. 后續(xù)將進一步對中央空調開機臺數進行預測,并制定策略控制每臺空調的開啟,減少能源浪費,實現企業(yè)節(jié)能降耗的目標.