尹鵬飛 李晉宏
(北方工業(yè)大學(xué)計(jì)算機(jī)學(xué)院知識(shí)工程研究所 北京 100144)
隨著時(shí)代的飛速發(fā)展,世界各國(guó)經(jīng)濟(jì)實(shí)力不斷增強(qiáng),越來(lái)越多的摩天高樓如雨后春筍般拔地而起,隨之而來(lái)的是樓宇的供能問(wèn)題。據(jù)研究調(diào)查顯示,在美國(guó),商業(yè)和住宅建筑占其總能源使用量的40%[1],而暖通空調(diào)所消耗的能量占整棟樓宇的50%。所以如何節(jié)能成為了各國(guó)都急需解決的問(wèn)題[2]。很多國(guó)內(nèi)外的機(jī)構(gòu)都開(kāi)始致力于節(jié)能控制的研究,國(guó)內(nèi)許琪[3]等在研究樓宇的自動(dòng)控制系統(tǒng),還有馬漢曠[4]在研究樓宇空調(diào)的混合控制系統(tǒng)。國(guó)外的專家們也在進(jìn)行著節(jié)約能量和優(yōu)化控制策略的研究,Kelvin K.L.Wong[5]等基于一棟醫(yī)院大樓住院廳空氣流量的測(cè)量,在滿足室內(nèi)熱舒適性(溫度和風(fēng)速等)前提下提出了使用分層空調(diào)的設(shè)計(jì)理念。國(guó)外一個(gè)研究機(jī)構(gòu)做了一個(gè)調(diào)查[6],探究室內(nèi)用戶的活動(dòng)和行為對(duì)節(jié)能潛力的影響,討論適當(dāng)?shù)幕顒?dòng)識(shí)別技術(shù)和方法,從而根據(jù)用戶活動(dòng)對(duì)節(jié)能建筑做出指導(dǎo)。
在此之前的關(guān)于樓宇空調(diào)的運(yùn)行方案都是偏向于控制的[7],或是研究能耗的模型[8],解釋模型中空調(diào)負(fù)荷與能耗估值之間的關(guān)聯(lián),或是在能量管理方面去實(shí)時(shí)優(yōu)化控制系統(tǒng),晉欣橋等基于系統(tǒng)的運(yùn)行特性、室內(nèi)熱舒適性和室內(nèi)空氣品質(zhì),提出了一個(gè)系統(tǒng)的在線能量?jī)?yōu)化管理和控制方案[9],采用了基于物理模型的在線仿真器來(lái)預(yù)測(cè)系統(tǒng)的響應(yīng)變化,以基因遺傳算法來(lái)優(yōu)化下位控制器的參數(shù)值,從而優(yōu)化系統(tǒng)控制。這些研究都是在探索怎么去控制一些設(shè)備,具體到某些水泵、開(kāi)關(guān)、機(jī)組、控制器等等,而本文將利用數(shù)據(jù)挖掘技術(shù)來(lái)對(duì)這些控制數(shù)據(jù)進(jìn)行處理分析,從數(shù)據(jù)本身出發(fā),通過(guò)建模挖掘出數(shù)據(jù)的規(guī)律,得到最佳參考日和主要的控制參數(shù),不涉及操作設(shè)備。
參考日,最簡(jiǎn)單的方法就是找歷史上情況最相近的一天,對(duì)于樓宇空調(diào)數(shù)據(jù)來(lái)說(shuō),最相近的狀況就是天氣狀況相同的時(shí)候,天氣狀況相似才有可能產(chǎn)生類似的空調(diào)數(shù)據(jù)。歷史數(shù)據(jù)中天氣狀況都有記錄,而對(duì)于未來(lái)的某天想要求得參考日的話,本身只能提供當(dāng)天的天氣預(yù)報(bào)參數(shù)??紤]通過(guò)計(jì)算距離來(lái)判斷歷史數(shù)據(jù)和待選日的相近程度,距離小,則表示這兩天的天氣狀況相似,反之,則不同。
首先,可以把歷史天氣狀況處理成一個(gè)能反應(yīng)當(dāng)天天氣狀況的向量,如:
(t(溫度),h(濕度),s(風(fēng)速),d(風(fēng)向),i(光照),r(輻射))
天氣預(yù)報(bào)的參數(shù)只有最高溫度、最低溫度、風(fēng)力、風(fēng)向、天氣現(xiàn)象這些值,也處理成一個(gè)向量,如:
(t_max(最高溫),t_min(最低溫),s(風(fēng)速),d(風(fēng)向),a(天氣現(xiàn)象))
這樣就生成了一種方案:通過(guò)計(jì)算天氣預(yù)報(bào)向量和各歷史天氣向量的距離,選出距離最小的歷史某天作為參考日。
距離計(jì)算方法最為經(jīng)典的就是K-means 聚類算法[10~11],應(yīng)用廣泛,算法簡(jiǎn)單,直接計(jì)算距離來(lái)判定當(dāng)前點(diǎn)跟周圍點(diǎn)的相近程度。
還有一個(gè)也是基于距離計(jì)算分類的,經(jīng)典的KNN 算法,通過(guò)測(cè)量不同特征值之間的距離進(jìn)行分類,KNN應(yīng)用也很廣泛[12~13]。
基本思想:如果一個(gè)樣本在特征空間中的k 個(gè)最相似的樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別。
K 通常是不大于20 的整數(shù),在KNN 算法中,所選擇的鄰居都是已經(jīng)正確分類的對(duì)象,而此算法的結(jié)果很大程度取決于k的選擇。
在KNN 中,通過(guò)計(jì)算對(duì)象間距離來(lái)作為各個(gè)對(duì)象之間的非相似性指標(biāo),一般使用歐式距離或曼哈頓距離。
樓宇空調(diào)的調(diào)控要落實(shí)到調(diào)控?cái)?shù)據(jù)上,影響特征也比較多。因?yàn)榭刂茀?shù)具有時(shí)間序列特性,即當(dāng)前的運(yùn)行狀況受前一段時(shí)間控制情況的影響,所以應(yīng)建立時(shí)間序列模型。通過(guò)對(duì)某公司的暖通空調(diào)機(jī)房實(shí)地考察、試驗(yàn),得到機(jī)房中最為重要的控制參數(shù)。
基于深度學(xué)習(xí)的RNN 模型,是一個(gè)隱層神經(jīng)單元循環(huán)鏈接的深度神經(jīng)網(wǎng)絡(luò),其內(nèi)部的狀態(tài)可以很好的對(duì)動(dòng)態(tài)時(shí)序行為建模。RNN 應(yīng)用范圍很廣,有基于其時(shí)間序列特性的預(yù)測(cè)[14],也有在語(yǔ)音識(shí)別方面的應(yīng)用[15]等等。
RNN 中,神經(jīng)元的輸出可以在下一個(gè)時(shí)間戳直接作用到自身,即第i層神經(jīng)元在m時(shí)刻的輸入,不僅有(i-1)層神經(jīng)元在該時(shí)刻的輸出外,還包括其自身在(m-1)時(shí)刻的輸出。將RNN 在時(shí)間上展開(kāi),得到如圖1的結(jié)構(gòu)。
圖1 RNN展開(kāi)結(jié)構(gòu)
假設(shè)當(dāng)前時(shí)刻為t 時(shí),輸入為xt,隱層狀態(tài)為st,st不僅和當(dāng)前時(shí)刻的輸入有關(guān),也和上一個(gè)時(shí)刻的隱層狀態(tài)相關(guān)。一般使用函數(shù)為
其中f 為非線性函數(shù),一般為logistic 或tanh,U 為輸入和隱含層之間的權(quán)值矩陣,W 為上一時(shí)刻隱含層和當(dāng)前時(shí)刻隱含層之間的權(quán)值矩陣,b 為偏置向量。
設(shè)計(jì)最佳參考日模型,但只基于天氣狀況找參考日,雖然考慮了最重要的天氣狀況,但是天氣是實(shí)時(shí)變化的,選出來(lái)的參考日有局限性,并不滿足實(shí)際的情況。
結(jié)合歷史的機(jī)房數(shù)據(jù)變化情況,可以對(duì)每天的機(jī)房運(yùn)行參數(shù)做一個(gè)評(píng)分排序,因?yàn)榫退闾鞖鉅顩r相同,但每天的具體運(yùn)行情況還是不一樣的。不能預(yù)測(cè)突變的狀況,所以應(yīng)考慮其是否在平穩(wěn)運(yùn)行,用方差來(lái)判定其運(yùn)行狀況。
最佳參考日模型設(shè)計(jì)步驟:
1)首先把歷史數(shù)據(jù)的氣象站數(shù)據(jù)處理成一個(gè)向量(t(溫度),h(濕度),s(風(fēng)速),d(風(fēng)向),i(光照),r(輻射));
2)再把這個(gè)向量作為距離的度量進(jìn)行K-means 聚類,K-means 聚類方法也常用于處理用電數(shù)據(jù)分析[16];
3)接著把要預(yù)測(cè)的未來(lái)天氣狀況也處理成一個(gè)向量(t_max(最高溫),t_min(最低溫),s(風(fēng)速),d(風(fēng)向),a(天氣現(xiàn)象));
4)對(duì)天氣預(yù)報(bào)向量使用KNN 分類算法,看其屬于哪個(gè)聚類簇;
5)把該聚類簇中的所有歷史數(shù)據(jù)全部取出來(lái),計(jì)算其機(jī)房各個(gè)參數(shù)的方差,同時(shí)給重要的控制參數(shù)分配較大的權(quán)重(供水溫度、回水溫度、瞬時(shí)流量、瞬時(shí)熱量、機(jī)組開(kāi)啟臺(tái)數(shù)、功率值),該天的評(píng)分值為各個(gè)機(jī)房參數(shù)得分之和;
6)根據(jù)評(píng)分倒序排序,最小得分的說(shuō)明其運(yùn)行狀況比較平穩(wěn),取其最小得分的那天即為最佳參考日。
選用基于深度學(xué)習(xí)的RNN 預(yù)測(cè)模型,RNN 由于其特性,所以應(yīng)用也很廣泛,如應(yīng)用于氣象數(shù)據(jù)預(yù)測(cè)[17],當(dāng)然也有其應(yīng)用最廣的語(yǔ)音識(shí)別研究等[18]。
預(yù)測(cè)模型設(shè)計(jì)步驟:
1)由于特征較多,采用PCA 降維,將一些不重要的特征省去;
2)將歷史的機(jī)房數(shù)據(jù)、氣象數(shù)據(jù)、室內(nèi)數(shù)據(jù)處理成時(shí)序向量;
3)將歷史數(shù)據(jù)的3/5 進(jìn)行RNN 建模訓(xùn)練,1/5用作交叉驗(yàn)證集,1/5 用作測(cè)試集,輸入數(shù)據(jù)為機(jī)房、氣象、室內(nèi)三類向量,輸出為相對(duì)應(yīng)時(shí)刻的后20min的機(jī)房調(diào)控?cái)?shù)據(jù);
4)實(shí)際訓(xùn)練模型中有可能存在過(guò)擬合問(wèn)題,采用Dropout 方法來(lái)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行正則化,隨機(jī)隱去隱層中某些神經(jīng)元及其權(quán)重鏈接,限制模型的更新,本文Dropout定為0.1;
5)測(cè)試時(shí),輸入前一個(gè)時(shí)間段的機(jī)房、氣象、室內(nèi)向量,輸出為接下來(lái)20min 的機(jī)房控制參數(shù),用RMSE和MAE評(píng)價(jià)預(yù)測(cè)結(jié)果。
數(shù)據(jù)集選用的是某公司的站點(diǎn)數(shù)據(jù),數(shù)據(jù)來(lái)源是某地的樓宇空調(diào)運(yùn)行數(shù)據(jù)。數(shù)據(jù)包括氣象站數(shù)據(jù)、室內(nèi)溫度數(shù)據(jù)、機(jī)房數(shù)據(jù),數(shù)據(jù)均是每五分鐘采集一次,從2016年7月1日至2016年9月30日。
原始數(shù)據(jù)如表1~3所示(部分)。
表1 氣象站數(shù)據(jù)
表2 室內(nèi)溫度數(shù)據(jù)
表3 機(jī)房數(shù)據(jù)
最佳參考日模型預(yù)測(cè)結(jié)果展示:
如天氣預(yù)報(bào)向量為F(32,22,1,5(風(fēng)向),12(表示一種天氣現(xiàn)象)),通過(guò)K-means 聚類后再KNN 分類,這個(gè)天氣預(yù)報(bào)向量屬于第6 類,共包含23 個(gè)歷史天氣數(shù)據(jù)點(diǎn),對(duì)其機(jī)房數(shù)據(jù)進(jìn)行評(píng)分,按評(píng)分從低到高排序(分值越低說(shuō)明越穩(wěn)定),如圖2。
圖2 評(píng)分排序表
由上圖可以得出,對(duì)于天氣預(yù)報(bào)向量F 來(lái)說(shuō),最佳參考日為8 月15 日,當(dāng)天的天氣狀況為小雨,機(jī)房的運(yùn)行狀況比較平穩(wěn),可以把當(dāng)天的運(yùn)行參數(shù)作為最佳的參考數(shù)值。
深度學(xué)習(xí)預(yù)測(cè)模型評(píng)價(jià)指標(biāo):因研究的是回歸類的問(wèn)題(預(yù)測(cè)下一個(gè)時(shí)間段的控制參數(shù)實(shí)數(shù)值),所以評(píng)價(jià)指標(biāo)使用RMSE、MAE,RMSE 和MAE 的計(jì)算公式如下:
預(yù)測(cè)結(jié)果真實(shí)控制數(shù)據(jù)和預(yù)測(cè)控制數(shù)據(jù)對(duì)比如圖3。
圖3 預(yù)測(cè)參數(shù)的對(duì)比
第一組是供水溫度,第二組是回水溫度,第三組是瞬時(shí)熱量,第四組是瞬時(shí)流量,第五組是功率,第六組是機(jī)組運(yùn)行數(shù)量。由上圖可以看出,模型預(yù)測(cè)的參數(shù)與真實(shí)值相差較小,說(shuō)明模型構(gòu)建的較好,可以更加精確地預(yù)測(cè)未來(lái)某段時(shí)間的重要控制參數(shù)。
本文構(gòu)建了基于距離的最佳參考日模型和基于深度學(xué)習(xí)的控制參數(shù)預(yù)測(cè)模型,最佳參考日模型通過(guò)對(duì)一類中的待選參考日進(jìn)行評(píng)分排序,得到了更加接近實(shí)際狀況的參考日,對(duì)未來(lái)的運(yùn)行情況有一個(gè)更好的參照標(biāo)準(zhǔn);基于深度學(xué)習(xí)的控制參數(shù)預(yù)測(cè)模型通過(guò)對(duì)歷史數(shù)據(jù)使用RNN 建模,能夠較精確地得到接下來(lái)某個(gè)時(shí)間段的主要控制參數(shù),對(duì)未來(lái)的運(yùn)行狀況能夠提供決策作用,通過(guò)與實(shí)際的運(yùn)行參數(shù)相比較,證明預(yù)測(cè)得到的運(yùn)行參數(shù)與真實(shí)狀況相近,這樣,既能得到整天的宏觀參考日,又能得到某個(gè)時(shí)間段的微觀控制參數(shù),對(duì)樓宇空調(diào)有重要的決策意義。