徐 超 于忠清 李勁華
(青島大學數(shù)據(jù)科學與軟件工程學院 山東 青島 223800)
建筑是能耗占比最大的領域,我國建筑能耗占比超過了全社會生產(chǎn)所需能耗的1/3[1]。采暖、通風和空調(diào)(HVAC)系統(tǒng)能耗占商業(yè)建筑能耗一半以上,是建筑能源使用的主要來源。準確的空調(diào)運行狀態(tài)和能耗預測是降低總體能耗的關鍵。目前關于預測暖通空調(diào)系統(tǒng)的能源使用的研究較為廣泛,其中使用的方法也層出不窮,包括仿真、優(yōu)化和基于第一原理的方法。Wei等[2]研究了控制設置與能源消耗以及設施室內(nèi)空氣質(zhì)量(IAQ)指標之間的關系;文獻[3-4]開發(fā)了中央電廠暖通空調(diào)系統(tǒng)的冷凍機和冰蓄熱罐的自適應和預測神經(jīng)網(wǎng)絡模型;Deng等[5]利用深度神經(jīng)網(wǎng)絡(DNN)和粒子群優(yōu)化算法(PSO)對暖通空調(diào)中的能耗模型、室內(nèi)溫度模型和室內(nèi)濕度模型三種模型進行了建模和優(yōu)化。
近年來,神經(jīng)網(wǎng)絡模糊推理系統(tǒng)(ANFIS)作為一種更可靠的方法,逐漸被引入到能源管理領域,其獨特的建模方法被用來建模具有更高復雜性的非線性關系。除了能源管理領域,ANFIS算法在機械工程、環(huán)境工程、空間分析和計算機圖形學等方面的應用均表明了其建模方法的優(yōu)越性[6]。與傳統(tǒng)的BP神經(jīng)網(wǎng)絡和淺層神經(jīng)網(wǎng)絡相比,該神經(jīng)網(wǎng)絡采用模糊推理系統(tǒng)來滿足數(shù)據(jù)輸入與輸出之間的函數(shù)映射。
本文研究一種對于暖通空調(diào)系統(tǒng)中空氣處理單元(AHU)狀態(tài)和能耗預測的方法。首先,利用提升樹(boosting-tree)方法[7]對采集到的AHU實測數(shù)據(jù)進行參數(shù)重要性分析,對實測數(shù)據(jù)進行降維。通過相關分析[8],確定每個參數(shù)對系統(tǒng)狀態(tài)影響最大的時間增量,將其作為分類學習算法的輸入;然后,利用蟻群優(yōu)化后的模糊神經(jīng)網(wǎng)絡對相關變量與室內(nèi)溫度和總能耗之間的非線性關系進行建模;在算法驗證階段,利用平均絕對誤差(MAE)、絕對誤差標準差(SDAE)、平均絕對百分比誤差(MAPE)和絕對百分比誤差標準差(SDAPE)四種指標[9]對ANFIS算法的建模能力進行評價。
Jang[10]于1993年在其文獻中首次提出自適應神經(jīng)模糊推理系統(tǒng)(ANFIS),其由自適應神經(jīng)網(wǎng)絡和模糊邏輯組合形成。自適應神經(jīng)網(wǎng)絡是由節(jié)點和定向鏈路組成的網(wǎng)絡結(jié)構(gòu),整體的輸入輸出行為由節(jié)點連接的可修改參數(shù)集合的值決定。模糊推理是利用模糊集理論將給定的輸入映射到輸出數(shù)據(jù)集的過程,這種輸入-輸出的映射關系由一組具有適當隸屬函數(shù)的模糊IF-THEN規(guī)則組成:
規(guī)則1:如果x是A1,y是B1,那么f1=p1x+q1y+r1。
規(guī)則2:如果x是A2,y是B2,那么f1=p2x+q2y+r2。
其中:A1、A2是x劃分的兩個模糊集合;B1、B2是y劃分的兩個模糊集合;{p,q,r}是網(wǎng)絡第四層的結(jié)論參數(shù);m是規(guī)則的條數(shù)。
在建立預測模型的學習過程中,函數(shù)信號先一直向前遍歷,直到第四層,然后通過最小二乘法來估計結(jié)論參數(shù)(后向參數(shù));然后,在后向遍歷中,錯誤率反向傳播,采用蟻群算法來尋找和優(yōu)化前提參數(shù)。它具備了神經(jīng)網(wǎng)絡對非線性系統(tǒng)建模的功能,同時又利用模糊邏輯作為決策工具,解決了神經(jīng)網(wǎng)絡決策過程中的不確定性。
ANFIS網(wǎng)絡體系結(jié)構(gòu)一般分為5層,為了便于理解,本文只介紹兩個輸入v、d和一個輸出f下的網(wǎng)絡體系結(jié)構(gòu),基本架構(gòu)如圖1所示。
圖1 ANFIS基本結(jié)構(gòu)
第一層:模糊化層。該層的每個輸入節(jié)點i都是一個生成隸屬度的自適應平方節(jié)點,平方函數(shù)用式(1)和式(2)表示。
O1,i=μV,i(v)j=1,2
(1)
O1,j=μD,j(d)j=1,2
(2)
式中:v和d是系統(tǒng)的輸入;O1,i和O1,j表示輸出函數(shù);μV,i和μD,j表示隸屬函數(shù)。如果選擇三角隸屬函數(shù),則μV,i(v)由式(3)給出。
(3)
式中:{ai,bi,ci}是三角隸屬函數(shù)的參數(shù),也是系統(tǒng)的前提參數(shù)。
第二層:計算激勵強度層。輸出通過所有輸入信號的乘積來計算,用式(4)表示。
O2,i=wi=μV,i(v)·μD,j(d)i=1,2
(4)
式中:wi是規(guī)則的激勵強度。一般來說,任何執(zhí)行模糊T-范數(shù)運算符都可以作為這一層的節(jié)點函數(shù)。
(5)
第四層:規(guī)則輸出層。該層提供輸出值y,這是規(guī)則推理的結(jié)果,輸出見式(6)。
(6)
式中:pi、qi和ri是結(jié)果(或后向)參數(shù)。
第五層:最終輸出層。該層匯總了來自第四層的所有輸入,并將模糊分類結(jié)果轉(zhuǎn)換為明晰的值。這一層計算所有傳入信號的總和(式(7))。
(7)
在眾多的應用場景中,ANFIS始終存在著收斂速度慢、反向傳播搜索空間大、擬合不充分、預測精度不高等缺點,這就需要技術人員采用合適的進化算法來優(yōu)化其網(wǎng)絡訓練過程。本文采用蟻群算法優(yōu)化ANFIS內(nèi)部參數(shù),既能保證算法的收斂速度和性能的穩(wěn)定性,又能避免參數(shù)陷入局部最優(yōu),大大增強了訓練過程的準確性和魯棒性。
蟻群優(yōu)化算法(ACO)[11]是由Dorigo針對模擬退火(AS)的各種改進算法進行總結(jié)的基礎上提出的一個用于求解旅行商(TSP)等NP難問題的啟發(fā)式方法。算法的靈感來自于自然界蟻群的覓食行為,這些螞蟻會在地面上留下信息素,以便為其他蟻群成員標出一些有利的路徑,指引后面螞蟻的覓食行進方向,蟻群優(yōu)化算法就是利用類似的機制來解決尋優(yōu)問題[12-13]。
蟻群優(yōu)化算法的主要過程如下:在每次迭代時,所有在迭代中建立連接的m只螞蟻都會更新信息素值,也就是說,在旅行商每次經(jīng)過的每條路徑上面都會產(chǎn)生信息素的變化,如連接城市i和j的邊的信息素τij更新方法如式(8)所示。
τij(n+1)=(1-ρ)·τij(n)+Δτij
(8)
(9)
式中:Q為常數(shù);Lk為螞蟻k構(gòu)造的行程長度。
螞蟻在構(gòu)建解的過程中,通過隨機機制選擇下面要訪問的城市。當螞蟻k在城市i中,并構(gòu)造了部分解sp時,其前往城市j的概率為:
(10)
式中:N(sp)為可行分量的集合,即邊(i,l),其中l(wèi)為螞蟻k尚未訪問過的城市。參數(shù)α和β控制信息素相對于啟發(fā)式信息ηij的相對重要性,由式(11)給出。
(11)
式中:dij為城市i與j之間的距離。
與一般神經(jīng)網(wǎng)絡特性一樣,ANFIS訓練過程實際上就是找到一組近(最)優(yōu)的參數(shù)組合,從而使得系統(tǒng)預測值與實際值誤差最小。如果參數(shù)選擇不當,會導致整個算法收斂性能低下,訓練周期過長。本文利用蟻群優(yōu)化算法和最小二乘法對ANFIS的前提參數(shù)和結(jié)論參數(shù)進行尋優(yōu)。
將ANFIS中待優(yōu)化的前提參數(shù){ai,bi,ci}用其自身的最值(Wmin,Wmax)界定,并等分成div份,每份中的元素用集合Iai、Ibi、Ici表示。每只螞蟻從集合Iai的第j個元素Iaij出發(fā),在Ibi和Ici集合中尋找一個元素Ibik、Icil作為路徑。在螞蟻進行搜索時,每個集合中的元素選擇是相互獨立的,每只螞蟻從第一個元素出發(fā),根據(jù)所有參數(shù)集合中元素的信息素選擇一個元素。當螞蟻在所有集合中都尋找到了一個元素后,就到達了食物源,各參數(shù)的元素組合{Iaij,Ibik,Icil}也就形成了此次尋找食物的路徑。之后將選擇的路徑元素代入網(wǎng)絡中,輸出此次路徑選擇的結(jié)果和誤差,根據(jù)誤差大小進一步調(diào)節(jié)各元素信息素,重復此過程,直到滿足迭代停止條件。
ACO-ANFIS算法的具體流程如下:
(1) 將輸入向量根據(jù)各自的隸屬度函數(shù)進行模糊化處理,將所得的向量作為系統(tǒng)的輸入。
(3) 啟動螞蟻。每只螞蟻從集合Iai的第j元素Iaij出發(fā),按式(10)確定螞蟻行進路徑的概率p,直到所有螞蟻都到達食物源。
(12)
式中:T和P分別表示實際值和預測值。
(5) 根據(jù)式(8)更新路徑上的信息素,顯然,步驟(4)得到的Fiti越小,該路徑上的信息素增加越多。
(6) 若迭代次數(shù)Nc>Nmax,則循環(huán)結(jié)束,輸出最優(yōu)的一組前提參數(shù)集合。否則轉(zhuǎn)至步驟(3)更新最優(yōu)解。
(7) 將前一步所得到的最優(yōu)參數(shù)解作為ANFIS的前提參數(shù),借助ANFIS算法進一步訓練網(wǎng)絡,直到滿足誤差精度要求。
用蟻群優(yōu)化算法和最小二乘法優(yōu)化ANFIS的前提參數(shù)和結(jié)論參數(shù),找到兩類參數(shù)的近最優(yōu)解,既能保證算法的收斂穩(wěn)定性,又能避免參數(shù)陷入局部最優(yōu)。這種方法兼具ANFIS的非線性映射能力和蟻群優(yōu)化算法的全局搜索尋優(yōu)能力,大大增強了訓練過程的準確性和魯棒性。ACO-ANFIS算法流程如圖2所示。
圖2 ACO-ANFIS算法流程
本文中所使用的數(shù)據(jù)是從本市某大型醫(yī)院暖通空調(diào)空氣處理單元運行機組收集的,采集數(shù)據(jù)中包含系統(tǒng)運行狀態(tài)下各設備的特征數(shù)據(jù)和外部氣象數(shù)據(jù),數(shù)據(jù)傳感器每隔15 min進行一次當前時刻的數(shù)據(jù)采集。AHU系統(tǒng)基本原理如圖3所示,其中供/回氣格柵用于建筑物內(nèi)的空氣循環(huán),冷卻管和加熱管用于循環(huán)水的冷熱交換。
圖3 AHU基本原理
在建模階段,將收集到的數(shù)據(jù)經(jīng)預處理和隨機采樣后,分為訓練集(數(shù)據(jù)集80%)和測試集(數(shù)據(jù)集20%),并由此建立了暖通空調(diào)系統(tǒng)能耗預測模型。數(shù)據(jù)集說明在表1中列出。
表1 數(shù)據(jù)集說明
在建立預測模型之前,需要對采集的數(shù)據(jù)進行參數(shù)選擇以確保所得模型的可理解性、可伸縮性和準確性。表2列出了建模所需的17個模型候選參數(shù)。參數(shù)選擇的方法是對與預測模型輸出有關的模型參數(shù)進行重要性排序,從而找出與模型輸出關系最密切的模型變量并達到數(shù)據(jù)降維的目的,常用的參數(shù)選擇算法有包裝器(Wrapper)、增強樹(Boosting-Tree)和相關性分析算法等,本文采用Boosting-Tree算法來進行參數(shù)選擇和降維。表3和表4顯示了通過增強樹算法分析得出的與系統(tǒng)狀態(tài)和能耗相關性最大的幾組參數(shù)描述及其對應的等級和特征重要度,將重要度大于40的變量作為系統(tǒng)的最終輸入。式(13)給出了參數(shù)的特征重要度計算方法,特征i的全局重要度通過特征i在單棵樹中的重要度的平均值來衡量。
表2 模型候選參數(shù)
表3 能耗預測模型所選擇輸入?yún)?shù)的特征重要度
表4 狀態(tài)模型所選擇輸入?yún)?shù)的特征重要度
(13)
特征i在單棵樹中的重要度如下:
(14)
由于暖通空調(diào)系統(tǒng)狀態(tài)是動態(tài)的,系統(tǒng)當前的狀態(tài)和能耗受系統(tǒng)參數(shù)的過去值影響很大,設計中通過對模型候選參數(shù)的相關分析,確定了系統(tǒng)狀態(tài)和能耗與在不同時間步長下系統(tǒng)輸入過去值的關系。采用增強樹等相關性分析算法確定每個參數(shù)的時滯(即確定與系統(tǒng)能耗關系最大的幾組不同時間步長的輸入?yún)?shù)),并確定對系統(tǒng)狀態(tài)影響最大的時間增量。表5和表6分別列出了能耗預測模型和室內(nèi)溫度預測模型最終所選擇的帶時滯輸入?yún)?shù)描述。
表5 t+T時刻能耗預測模型參數(shù)描述
表6 t+T時刻室內(nèi)溫度預測模型參數(shù)描述
本文所構(gòu)建的能耗和狀態(tài)模型如式(15)和式(16)所示。
y(t+T)=f1(y(t),y(t-T),T(t),x1(t+T),
x2(t+T),v3(t-T),v3(t),
v4(t-T),v4(t),u1(t),u2(t))
(15)
T(t+T)=f2(T(t),T(t-T),x1(t+T),
x2(t+T),v5(t),v6(t),v7(t),
v8(t),u3(t),u4(t))
(16)
式中:y(t+T)表示暖通空調(diào)系統(tǒng)能耗;T(t+T)表示室內(nèi)溫度。
在實際實驗過程中可以發(fā)現(xiàn),利用ACO-ANFIS方法進行曲線擬合時只需60~80次即可保證曲線收斂,而未經(jīng)優(yōu)化的ANFIS收斂周期相對要長得多,甚至存在不收斂的狀況。圖4中分別給出了ANFIS、ACO-ANFIS訓練過程中室內(nèi)溫度和能耗的誤差曲線。可以看出,相對于原始ANFIS算法而言,ACO-ANFIS算法的收斂過程更快,所需要的迭代次數(shù)更少,進一步驗證了ACO-ANFIS方法在與同類非線性系統(tǒng)數(shù)據(jù)擬合算法中的優(yōu)越性,且擬合精度高的特點也從誤差曲線中得以體現(xiàn)。
圖4 室內(nèi)溫度和能耗的訓練誤差曲線
為了評估訓練后的ACO-ANFIS算法構(gòu)建的預測模型性能,利用式(17)-式(20)中定義的四個指標來進行評價:平均絕對誤差(MAE)、絕對誤差標準差(SDAE)、平均絕對百分比誤差(MAPE)和絕對百分比誤差標準差(SDAPE)。
(17)
(18)
(19)
(20)
表7 不同預測方法效果對比
圖5和圖6對比了測試數(shù)據(jù)集中的100個數(shù)據(jù)實例的室內(nèi)溫度和能耗的預測值和實際值,可以看出,ACO-ANFIS算法能夠成功地識別能耗、室內(nèi)溫度、可控變量和不可控變量之間的非線性關系。通過ACO-ANFIS預測模型得到的預測值更加接近具體能耗的實測值,其預測性能超過傳統(tǒng)ANFIS方法。
圖5 室內(nèi)溫度實際值和預測值對比
圖6 能耗的實際值和預測值對比
本文研究一種ACO-ANFIS非線性預測方法,并將該方法應用于建筑能耗預測領域。首先,增強樹和相關分析算法確定神經(jīng)網(wǎng)絡訓練的輸入;其次,利用蟻群優(yōu)化算法和最小二乘法對訓練過程中的前提參數(shù)和結(jié)論參數(shù)進行尋優(yōu),通過反向傳播誤差對參數(shù)組進行了一步優(yōu)化,建立系統(tǒng)參數(shù)與狀態(tài)、能耗之間的非線性模型;最后,利用四種指標對模型預測能力進行評價,從驗證結(jié)果來看,ACO-ANFIS算法對于空調(diào)等非線性系統(tǒng)的建模能力更強,預測精度也明顯高于其他方法。
在實際應用中,有些復雜的建筑往往需要考慮更多變的因素,如時變性、隨機性和地域氣候性等,這就需要更多的優(yōu)化算法混合來進一步提升ANFIS的預測能力。