劉軍杰 王書銘 姜 威
(華能松原熱電有限公司,吉林 松原 138000)
集中供暖系統(tǒng)是一個能源服務(wù)系統(tǒng),與個人家庭供暖不同,集中供暖系統(tǒng)需要在全境投資建設(shè)一個分配網(wǎng)絡(luò)。智能監(jiān)測和管理集中供熱系統(tǒng)的節(jié)能是一項復(fù)雜的多學(xué)科技術(shù),對提高供熱網(wǎng)絡(luò)的性能具有重要作用。
由于集中供熱系統(tǒng)具有時變、時延和非線性的特點,換熱器溫控系統(tǒng)的二次回水溫度必須根據(jù)實際情況確定,因此建立一個模型,根據(jù)實際運行情況預(yù)測換熱器的二次回水溫度非常重要。研究人員提出了多種方法來提高預(yù)測精度,但這些統(tǒng)計模型只對穩(wěn)定的數(shù)據(jù)有效,而熱負(fù)荷時間序列往往是不穩(wěn)定的。神經(jīng)網(wǎng)絡(luò)算法也被廣泛用于預(yù)測二級水溫。在文獻(xiàn)中,徑向基函數(shù)(RBF)預(yù)測模型被用來預(yù)測二次回水溫度,使用一次給水溫度、一次給水流量、二次給水溫度、二次給水流量和室外溫度為輸入數(shù)據(jù)。
BP 神經(jīng)網(wǎng)絡(luò)是應(yīng)用最廣泛的人工神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)模型。它是一個多層次的前饋型網(wǎng)絡(luò),包括非線性的正態(tài)變異單位。它的學(xué)習(xí)機制可以充分利用信號前后和誤差后向修正,持續(xù)迭代學(xué)習(xí),形成完整的智能網(wǎng)絡(luò)模型,可以處理多種類型的非線性信息[1]。簡單地說,BP 神經(jīng)網(wǎng)絡(luò)是一種通過誤差反轉(zhuǎn)進(jìn)行學(xué)習(xí)和訓(xùn)練的方法。在BP 神經(jīng)網(wǎng)絡(luò)中,如果有適當(dāng)?shù)牟蓸訑?shù)據(jù)樣本,則會啟動網(wǎng)絡(luò)的學(xué)習(xí)功能,在隱藏層的每步后,都會在輸入層獲得相應(yīng)的輸出值,與實際值進(jìn)行比較,并計算出誤差,然后根據(jù)逆向比較逐步調(diào)整各隱蔽層的初始參數(shù),最后返回隱藏層。通過擴散前向傳播和逆向修正,使輸入數(shù)據(jù)對網(wǎng)絡(luò)的反應(yīng)比準(zhǔn)確度快,最后使誤差與環(huán)境需求相匹配。神經(jīng)網(wǎng)絡(luò)訓(xùn)練的成功機制與人類的學(xué)習(xí)機制有共同之處,下文概括了BP神經(jīng)網(wǎng)絡(luò)的基本特點。
第一,自適應(yīng)性。自適應(yīng)性指的是如果外部的環(huán)境有所改變,例如信號的傳遞中有新的數(shù)據(jù)被加入,那么在該網(wǎng)絡(luò)中,每個層次都會對其進(jìn)行主動調(diào)節(jié),從而對其層與層之間的聯(lián)系進(jìn)行修改,然后對比新的輸出值與外界的真實情況。再通過傳輸誤差的信號在反誤差調(diào)整過程中進(jìn)一步調(diào)整權(quán)重,直到對外部輸入做出的預(yù)測幾乎等于期望的輸出值[2]。
第二,非線性。人類大腦是一個非常龐大的、對各種非線性信息進(jìn)行分析和處理的系統(tǒng)。復(fù)雜的、非線性的關(guān)系在某種層面上一直存在于人類大腦內(nèi)的神經(jīng)元和人工神經(jīng)元的活躍或被抑制狀態(tài)中。在比較廣泛的范疇中,輸入的數(shù)據(jù)信息與被預(yù)測的輸出值依靠BP 神經(jīng)網(wǎng)絡(luò)形成了各式非線性連接。
第三,容錯性。由于神經(jīng)網(wǎng)絡(luò)具有存儲分布式信息的能力,其較高的容錯性使其有可能適當(dāng)恢復(fù)遭受局部破壞的輸入信息,雖然質(zhì)量有所下降,性能適度下降,但不會造成較大偏差,是評估神經(jīng)網(wǎng)絡(luò)適用性的一個重要因素。
第四,計算并行性。并行性是神經(jīng)網(wǎng)絡(luò)的一種固有特性。因為各神經(jīng)元之間互不依賴,因此就算是在同一層上,神經(jīng)元也可以實現(xiàn)并行運算,把不同層的信息傳遞給下一層次。該特性極大地提高了BP 網(wǎng)絡(luò)的運算效率。
第五,輸入、輸出映射。在該基礎(chǔ)上,基于BP 神經(jīng)網(wǎng)絡(luò)的導(dǎo)向,選擇具有惟一特征的每類信號作為一個獨立的訓(xùn)練集合,使其在給定的參數(shù)條件下,能夠在給定的時間內(nèi)對其進(jìn)行多種類型的訓(xùn)練,使其具有較好的穩(wěn)定性。
BP 神經(jīng)網(wǎng)絡(luò)包括一個輸入層、一個輸出層以及大于等于1 的中間層。一個擁有3 層的BP 神經(jīng)網(wǎng)絡(luò),一頭一尾的2 層稱為輸入層、輸出層,中間的各層稱為隱含層。在BP 神經(jīng)網(wǎng)絡(luò)中,每層神經(jīng)元的數(shù)量和輸入信號的維數(shù)相等。其中,在輸入層中,神經(jīng)元數(shù)目等于維數(shù),而在隱藏層中,其層數(shù)和神經(jīng)元數(shù)目隨實際情況的變化而具有不一致性。輸出層與輸入層相同,輸出層的神經(jīng)元數(shù)等于輸出信號的維數(shù),可以微調(diào)的S 型生長曲線是每個神經(jīng)元的激活函數(shù)。
在誤差較大的情況下,誤差的反向傳播階段就會啟動,誤差以被設(shè)定的一種形式分別通過輸出層、隱藏層反向傳播到輸入層,通過各層神經(jīng)元節(jié)點傳播誤差。誤差的信號在每個節(jié)點被提取出來,每層節(jié)點間連接節(jié)點的權(quán)重通過誤差信號來進(jìn)行調(diào)整。在該迭代分布的適應(yīng)過程下,輸入信號的識別效率不斷獲得提升,誤差最終滿足設(shè)定的要求或者在設(shè)定的合理區(qū)間內(nèi),此時學(xué)習(xí)和訓(xùn)練已經(jīng)完成了[3]。
采集的氣象數(shù)據(jù)為1h 間隔的室外溫度、風(fēng)力、相對濕度和空氣質(zhì)量指數(shù)(AQI),采集的交換數(shù)據(jù)為1min 間隔的一次網(wǎng)進(jìn)水溫度、一次網(wǎng)回水溫度、二次網(wǎng)進(jìn)水溫度、二次網(wǎng)交換回水溫度。每個小時的每個溫度參數(shù)的平均值、最大值和最小值被用來計算變頻站的數(shù)據(jù)。在集中供熱系統(tǒng)中,該文計算了平均一次網(wǎng)水溫、最高一次網(wǎng)水溫、最低一次網(wǎng)水溫、平均一次網(wǎng)回水溫度、最高一次網(wǎng)回水溫度、最低一次網(wǎng)回水溫度、最低一次網(wǎng)回水溫度、平均二級網(wǎng)水溫、最高二級網(wǎng)水溫以及最小二次系統(tǒng)水溫,換熱站的任何一個小時數(shù)據(jù)的變化,如外界空氣溫度、相對濕度、風(fēng)和空氣質(zhì)量等都會改變二次輸出水溫,但由于這些因素對二次輸出水溫的影響不同,因此用皮爾遜系數(shù)來分析這些變量之間的相關(guān)性[4]。
其中,當(dāng)r接近0 時,意味著2 個變量之間的線性相關(guān)關(guān)系較弱。各影響因素與水溫的二次方之間的皮爾遜相關(guān)系數(shù)如圖1所示。
圖1 皮爾遜相關(guān)系數(shù)示意圖
圖1 為各個影響因素與二次回水溫度的相關(guān)系數(shù)柱狀圖??梢钥闯?,氣象數(shù)據(jù)中的相對濕度、AQI與二次回水溫度的相關(guān)性較小。
根據(jù)相關(guān)性分析,在函數(shù)集Set1、Set2 和Set3 中為每個模型生成3 套預(yù)測函數(shù),輸入神經(jīng)元的數(shù)量為5、10 和11,輸出神經(jīng)元為1[5]。
RNN 模型是專門為處理順序數(shù)據(jù)或時間序列而設(shè)計的,RNN 模型的結(jié)構(gòu)如圖2所示。
圖2 RNN 結(jié)構(gòu)圖
給定一個輸入時間序列x={x1,x2,....,xt},RNN 使用公式(2)和公式(3)生成一組隱藏狀態(tài)h={h1,h2,....,ht}和輸出集合y={y1,y2,...,yt},迭代產(chǎn)生。
式中:Whx、Whh、Wyh為權(quán)重矩陣;向量bh、by為偏差。
開發(fā)的DNN 模型由4 層組成,如圖3所示。
圖3 DNNs 結(jié)構(gòu)圖
在全連接層中,使用了一個丟棄函數(shù)來解決匹配問題。在這里,神經(jīng)元在一個給定的訓(xùn)練迭代中隨機產(chǎn)生。
得到的LSTM 模型的2 個隱藏層的神經(jīng)元數(shù)量為50 和100,LSTM 的結(jié)構(gòu)如圖4所示。
圖4 LSTM 網(wǎng)絡(luò)結(jié)構(gòu)圖
LSTM 的存儲單元有3 個門,即輸入門、遺忘門及輸出門,單個LSTM 單元的操作如公式(4)~公式(9)所示。
預(yù)測換熱站二次回水溫度的程序如下:1)將原始數(shù)據(jù),包括氣象數(shù)據(jù)和換熱站主網(wǎng)的二次網(wǎng)數(shù)據(jù)裝入存儲器。2)對數(shù)據(jù)進(jìn)行預(yù)處理,并將數(shù)據(jù)歸一化到[0,1]的范圍內(nèi)。3)根據(jù)第1 節(jié)第四個特征“計算并行性”的相關(guān)分析結(jié)果確定3 組預(yù)報要素,將要素集分為訓(xùn)練集、驗證集和測試集,并計算各預(yù)測模型對不同癥狀集的預(yù)測性能[7]。二次水溫預(yù)測過程如圖5所示。
圖5 二次回水溫度預(yù)測流程圖
驗證試驗在一臺Windows10 計算機上進(jìn)行,使用Python 編程語言、一臺熱交換器2017—2018年夏季的當(dāng)?shù)靥鞖鈹?shù)據(jù)。第一步,安裝PyCharm 模擬軟件并導(dǎo)入必要的庫;第二和第三步,使用Panda 庫的read_csv 函數(shù)讀取原始數(shù)據(jù)文件,并使用numpy 庫;將數(shù)據(jù)分成8 ∶1 的訓(xùn)練集、驗證集和測試集;通過一對一合并和交叉驗證,最終確定模型。第四步,在測試集中用不同的預(yù)測模型對模型的性能進(jìn)行測試。該測試集由過去2 天的48 組真實數(shù)據(jù)組成[8]。在測試過程中,除了不同的預(yù)測模型,所有可能影響預(yù)測準(zhǔn)確性的因素都沒有改變。
為了評估預(yù)測模型的性能,使用3 種標(biāo)準(zhǔn)誤差指標(biāo)分析預(yù)測性能,即均方根誤差(RMSE)、絕對平均百分比誤差(MAPE)和平均百分比誤差(MPE)。
試驗中使用的測試集共包括48h 的數(shù)據(jù),橫軸為小時,縱軸為二次水溫(℃)。
RNN 預(yù)測結(jié)果如圖6所示,二次側(cè)出口水溫的DNN模型預(yù)測結(jié)果如圖7所示,LSTM 模型對二次側(cè)出水溫度的預(yù)測結(jié)果如圖8所示。
圖6 RNN 預(yù)測結(jié)果
圖7 DNNs 預(yù)測結(jié)果
圖8 LSTM 預(yù)測結(jié)果
Set3 提供了比Set1 和Set2 更好的預(yù)測結(jié)果,但2 個變體的二次輸出水溫的預(yù)測結(jié)果都不理想,DNN 的預(yù)測結(jié)果也是如此。因此,單個預(yù)測模型在Set3 數(shù)據(jù)庫中提供了最好的預(yù)測結(jié)果。詳細(xì)的試驗結(jié)果見表1~表3[9]。表1 顯示了Set1 中每個預(yù)測模型的性能指數(shù),表2 顯示了Set2 中每個預(yù)測模型的性能指數(shù),表3 顯示了Set3 中每個預(yù)測模型的性能指數(shù),最后一列顯示了每個預(yù)測模型的執(zhí)行時間。
表1 各模型在Set1 上的性能指標(biāo)
表2 各模型在Set2 上的性能指標(biāo)
表3 各模型在Set3 上的性能指標(biāo)
數(shù)據(jù)集Set1 只包括5 個影響二次輸出水溫的因素,即與一次供水、室外空氣溫度和風(fēng)有關(guān)的因素。如表3所示,在Set3 數(shù)據(jù)集中,每個模型的MPE都是正的,RNN 模型有最好的預(yù)測,執(zhí)行時間最短,運行效率最高[10]。
具有負(fù)值的模型預(yù)測的實際回水管溫度太高,會造成能源損失。從表3 可以看出,所有模型的MPE值都是正的,這意味著模型預(yù)測的二次回水溫度在實際值內(nèi),因此可以節(jié)約能源。
目前,BP 神經(jīng)網(wǎng)絡(luò)技術(shù)在世界各大領(lǐng)域均有較廣泛的應(yīng)用,因此對相關(guān)課題的研究具有較大的現(xiàn)實意義。該文以供熱系統(tǒng)為主要研究對象,根據(jù)實際現(xiàn)場的測量數(shù)據(jù)集,通過相關(guān)分析確定了3 組預(yù)測特征,并建立了RNN、DNN 和LSTM 共3 種預(yù)測模型來預(yù)測變電站的二次回水溫度。