盧 巖
(山東聊建現代建設有限公司,山東 聊城 252000)
新技術的不斷出現,社會經濟的不斷提高,使得人們對于建筑的質量提出了越來越多的要求,不僅僅關于建筑質量問題,同時對于建筑智慧程度也有更多的要求[1]。隨著越來越多物聯網技術的使用,各種傳感器、監(jiān)控等使用逐漸增多,使得建筑自身的能耗越來越高[2]。如何在滿足建筑智能、智慧化的同時,有效控制、預測建筑能耗的使用,對當前社會的經濟發(fā)展,具有重要的意義[3]。
智慧建筑的發(fā)展,更注重用戶的居住體驗、環(huán)境的建立優(yōu)化等方面,通過大數據技術的發(fā)展,可以有效對智慧建筑內的人員、環(huán)境、設備、能耗等方面形成海量的數據積累[4]。這些數據可以幫助人們對建筑的運行狀態(tài)等有更深的了解,有效實現各類數據子系統(tǒng)和數據島之間的連接,方便研究人員通過算法來對其規(guī)律等進行總結和整理[5]。對于建筑的運維人員來說,準確預測建筑能耗,可以有效降低其運行成本,并能積極響應國家電力部門的號召,具有重要的市場應用價值[6]。
為了有效提高對于建筑能耗預測的準確程度,本文提出了一種基于循環(huán)特征和深度學習算法的預測方法。該方法基于建筑能耗的循環(huán)特征,利用頻譜分析的方法提取建筑日周期特征,并獲得殘余能耗數據,通過深度學習網絡模型,進行能耗模型預測構建。最終通過實際建筑對該方法進行驗證,證明其有效性。
建筑能耗的預測方案如圖1所示[7]。
圖1 建筑能耗預測方案
整個預測方法的計算流程如下:
(1)根據建筑能耗的數據,利用頻譜分析技術,提取其具有循環(huán)特征的數據部分,根據該特征數據來確定整個建筑能耗中的穩(wěn)定時間序列部分。
(2)對原始數據進行處理,刪除掉其中的穩(wěn)定序列部分數據,從而提取其能耗殘余數據部分,并對其進行數據轉換,使其成為深度學習算法的訓練數據集。
(3)將步驟2中獲得的訓練數據集用于構建系統(tǒng)集成預測模型,從而可以用于建筑殘余能耗部分預測。
(4)將預測得到的殘余能耗數據與循環(huán)特征中的穩(wěn)定數據進行集合,實現對于整個建筑的能耗預測。
建筑能耗數據是一維時間序列數據,可以等效為復雜信號數據的波形數據[8]。通過頻譜分析的方法,可以將其轉化成多個簡單波形的疊加,并提取其循環(huán)周期特性[9]。利用傅里葉級數進行數據變換,對其進行波形分解,將數據中存在的循環(huán)特征部分進行提取[10]。
該方法已經在多個領域被證實有效,尤其是在電力預測、信號交通預測、故障檢修等方面,均取得了不錯的成績,從而可以用于建筑能耗信息中的潛在數據特征挖掘工作[11]。利用該方法,可以將整個建筑中的日循環(huán)特征數據進行提取,具體步驟為:
(1)對于建筑能耗,設其為周期為T的數據系列f(t),通過傅里葉級數變換,可以得到建筑能耗的級數表示式為
(1)
將其轉換成三角函數多項式的形式為
(2)
式中:系數b0,bk,ck表示形式為
(3)
(4)
(5)
為了準確獲得建筑能耗的周期性特性,需要對獲得到的能耗數據進行平均處理,從而可以獲得該建筑的每日的平均能耗情況[12]。其表達式為
(6)
式中:pt為每天在t時刻的能耗平均值;vjt代表在第j天的t時刻時候的能耗情況;D表示建筑能耗統(tǒng)計的總天數。
利用頻譜函數對上述日平均消耗情況進行處理,提取器日消耗的循環(huán)特性,從而得到前文所需要的穩(wěn)定消耗部分[13]。計算過程為
(7)
式中:N為該建筑每天收集到的能耗數量值。為了進一步達到獲取循環(huán)特征的目的,需要對于式(7)中的系數利用最小二乘法進行處理,使其可以被化簡,從而得到整個能耗的循環(huán)特性。
(2)通過在原始數據中減掉循環(huán)特性部分的數據,即可獲得該建筑的能耗殘余情況。從而可以表示為
(8)
式中:xjt為在第j天的t時刻時候的能耗殘余特征情況。能耗的殘余特征情況可以有效反映出該建筑的獨特性和數據隨機性[14]。將能耗殘余數據進行組合處理,從而可以獲得該數據的一維系列{x1,x2,…,xn},將其進一步轉換成深度學習網絡的數據訓練集(X0,y)。
本文采用的深度學習的置信網絡模型(deep belief network and extreme learning machine,簡稱DEEM)含有多個網絡層,利用深度置信網絡的特征提取能力,將各層網絡中的數據提取出多個特征數據[15]。再將其與目標能耗有機結合,最終形成深度學習需要的多個數據訓練集,并利用極限學習的方法來生成系統(tǒng)的能耗預測模型。
具體的模型建立過程如下:
(1)將原始數據中獲得的殘余能耗訓練數據輸入到深度置信網絡模型中,通過逐層殘余能耗數據提取,獲得其數據特征,該數據與目標能耗殘余構成新的訓練數據集。
通過第i層構建的數據集為(Xi,y),其中Xi的表達式為
Xi=gi(Xi-1,Wi,αi,βi)
(9)
式中:gi為激活函數;Xi-1為上一層的輸出;Wi,αi,βi為第i層與第i-1層之間的連接關系。
(10)
式中:f=1,2,…,N;λ為加權向量。表示為
(11)
(12)
(13)
與傳統(tǒng)的深度學習相比,本文采用的模型充分利用了原始能耗數據的特征,并多次運用深度學習模型中的各層提取得到的特征數據,使預測結果更準確。
為了評估模型的預測性能優(yōu)劣,選擇常用的MAE(mean absolute error,表示平均絕對誤差)、MAPE(mean absolute percentage error,表示平均絕對百分比誤差)、RMSE(root mean square error,表示均方根誤差)和r(pearson correlation coefficient,表示皮爾遜相關系數)指標作為評判指標。各指標的表達式為
(14)
(15)
(16)
(17)
為了驗證本文設計的建筑能耗預測模型的準確性,選擇真實建筑作為驗證對象,選擇其能耗數據用于實驗預測。
選擇的實驗建筑為網絡上數據公開的百貨商場,并進行能耗情況預測。每個實驗中的能耗數據均包括原始數據和能耗殘余兩部分,并將其中的70%的數據用作樣本訓練,剩余的30%作為測試數據。模型數據輸入個數設置為10,并將本模型與其他幾種當前流行的回歸模型做對比,主要選擇的對比模型包括套索回歸、多項式回歸、嶺回歸等。
為了驗證頻譜函數挖掘的循環(huán)特征性能,需要采用貝葉斯準則(bayesian information criterion,簡稱BIC)來驗證和評價該頻譜函數的表現效果。BIC值越低意味著模型的性能越好,其表示式為
(18)
(19)
整個模型中,對于最優(yōu)循環(huán)特征的尋找,通過不斷增加循環(huán)分量,使得BIC值最低。提取此時的能耗情況,進行特征提取。
選擇幾種主流的學習方法作為本文學習方法的對比,主要包括DBN(deep belief networks,表示深度置信網絡)、ELM(extreme machine learning,表示極限學習機)、SVR(support vector regression,表示支持向量回歸)等。并進一步將本文獲取的循環(huán)特征與上述三種方法結合,進行能耗預測,與本文模型進行數據比較。
2.2.1 循環(huán)特征對比
為了獲得合適的循環(huán)分量,將循環(huán)分量的個數從1增加至30,并比較BIC值,取數值最小的循環(huán)分量,使得循環(huán)特征更明顯,且不存在過擬合的現象。圖2給出了BIC值與循環(huán)分量的關系曲線,圖中可以看到,當頻譜函數的循環(huán)分量選擇25時BIC值最低,因此將循環(huán)分量個數設置為25。
圖2 不同循環(huán)分量個數的BIC值
圖3顯示了該建筑的循環(huán)能耗特征,通過頻譜圖可以看到,該百貨大樓具有24小時的循環(huán)周期,且能耗每隔3~4 h出現明顯的子能耗。這兩個循環(huán)周期組合后形成了該建筑的循環(huán)能耗特征分量。
圖3 循環(huán)特征頻譜分析
圖4描述了該商場能耗的500個原始數據,將該能耗中的穩(wěn)定能耗部分從原始數據中去除后,可以獲得殘余能耗曲線數據情況。該商場的殘余能耗數據情況如圖5所示。
圖4 商場能耗的原始數據
圖5 商場殘余能耗的原始數據
為了比較分析本文模型的優(yōu)勢,選擇對比模型的參數設置為:
(1)設置套索回歸模型的懲罰系數為 1,維數選擇為26;
(2)設置嶺回歸模型的懲罰系數為 0.01,維數選擇為26;
(3)設置多項式回歸模型的最高維數為 10。
使用上述三個模型進行建模,并選擇 ELM模型作為其參與能耗的預測模型。
每種方法分別做了10次殘余能耗預測實驗,并根據前文標準進行分析比較。計算結果如表1所示,給出了不同模型的預測評價結果。
表1 不同循環(huán)特征模型的預測性能結果
從表1中可以看到,在循環(huán)特性的數據提取上,相對于對比模型中的套索回歸、嶺回歸和多項式回歸,本文選擇的頻譜分析方法在性能上有比較大的優(yōu)勢,所有的評價指標中MAE指標、RMSE指標和MAPE指標均小于其他模型,證明本文模型的精確程度,同時在r指標上,頻譜分析的模型比其他模型的結果更大,也同樣可以證明該模型的預測精確性。
其他模型在能耗預測方面也有較好的性能,但是在這三種模型的對比方面,多項式回歸模型的性能更好,比其他模型的預測精度更高。
2.2.2 學習方法對比
為了表示該模型的優(yōu)越性,利用其他數據學習方法與本文算法進行對比。
選擇DBN、ELM和SVR三種模型的參數以使得其獲得最好的性能,參數選擇為:
(1)選擇DBN的結構中,共含有2個隱層,每個隱層中均含有一定數量的節(jié)點,選擇節(jié)點數量為650個,對于回歸函數部分,設置其隱節(jié)點的數量為35,以獲得更好的預測結果;
(2)對于ELM,設定其隱節(jié)點數量為60;
(3)對于SVR,選擇RBF函數為內核函數,設置懲罰系數為0.5,內核系數設置為0.6。
不同模型的預測結果如表2所示,表2中給出不同預測模型的評價情況(其中,“模型+CF”表示該模型的預測是基于循環(huán)特征,CF為利用頻譜分析方法提取建筑能耗的循環(huán)特征)。
表2 不同預測模型的預測結果
從表2中可以看到,對比本文所采用的建筑原始數據、能耗混合數據以及循環(huán)特征-殘余能耗數據,比較基于SVR、ELM、DBN 和本文所采用DEEM模型的能耗預測結果,從而可以證明本文方法的效果。
而且,循環(huán)特征結合能耗殘余數據的預測模型,其預測結果也會由于基于原始數據和能耗混合數據的預測。在本文的預測結果評價指標上,DEEM+CF模型準確率優(yōu)于DEEM模型21.77%,DBN+CF模型準確率優(yōu)于DBN模型23.32%,ELM+CF模型準確率優(yōu)于ELM模型25.17%,SVR+CF模型準確率優(yōu)于SVR模型27.48%。
同時,對于循環(huán)特征結合能耗殘余數據預測中,本文使用的DEEM+CF方法也優(yōu)于DBN+CF、ELM+CF 和 SVR+CF模型。在本文的預測結果評價指標上,DEEM+CF的預測精度均是最高,優(yōu)于DBN+CF模型3.48%,優(yōu)于ELM+CF模型6.54%、由于SVR+CF模型10.22%。而且,根據標準差的對比情況,本文采用DEEM+CF模型預測穩(wěn)定性很高,優(yōu)于DBN、ELM模型。
根據前文的實驗結果可以發(fā)現,對于智能建筑的能耗問題,通過頻譜分析,確認其具有明顯的日循環(huán)特性。經過頻譜分析后,去除周期特征得到的殘余能耗數據隨機性更明顯。
基于循環(huán)特征和深度學習算法的建筑能耗預測模型比基于原始數據的訓練模型預測準確度更高,而且預測穩(wěn)定性也更高。
相比其他預測模型,基于循環(huán)特征和深度學習的方法可以精準的對于建筑能耗進行預測,相比于其他模型和數據算法等,本文的方法更有效。
為了有效處理智能建筑的能耗預測問題,本文提出了基于循環(huán)特征和深度學習算法的預測模型。利用頻譜分析的方式,得到建筑的殘余能耗,并將其作為訓練數據,用于能耗的預測。將本文的算法與其他算法做比較,無論是與其他回歸模型進行對比還是與其他學習方法進行對比,本文的方法在預測的準確性和穩(wěn)定性方面都遠遠優(yōu)于其他??梢宰C明本文算法的有效性,為建筑能耗的預測提供了一種新的分析預測方法和手段。