吳盼紅, 段培永, 丁緒東, 尹春杰, 姬曉娃, 邱 鐘
1(山東建筑大學(xué) 信息與電氣工程學(xué)院,濟(jì)南 250101)
2(山東省智能建筑技術(shù)重點(diǎn)實(shí)驗(yàn)室,濟(jì)南 250101)
3(山東師范大學(xué) 信息科學(xué)與工程學(xué)院,濟(jì)南 250358)
建筑作為能源消耗的主要領(lǐng)域,在2015年消耗總量高達(dá)8.57億噸標(biāo)準(zhǔn)煤,占全國(guó)能源消費(fèi)總量的19.93%,其中公共建筑能耗占建筑總能耗的34%[1]. 由于社會(huì)經(jīng)濟(jì)的發(fā)展,公共建筑數(shù)量不斷增加,促使建筑能耗占全國(guó)總能耗的比例也越來(lái)越大. 目前,隨著我國(guó)節(jié)能政策的實(shí)施,構(gòu)建快速、準(zhǔn)確的建筑電負(fù)荷預(yù)測(cè)模型,合理分配能源顯得十分重要.
近年來(lái),國(guó)內(nèi)外學(xué)者對(duì)建筑電能耗預(yù)測(cè)方法進(jìn)行了廣泛的研究,主要包括回歸預(yù)測(cè)法、神經(jīng)網(wǎng)絡(luò)法和支持向量機(jī)等. 李婉華等建立基于時(shí)間序列的隨機(jī)森林用電負(fù)荷預(yù)測(cè)模型,降低了預(yù)測(cè)誤差[2]; 黎祚等使用k-means聚類(lèi)、BP或RBF結(jié)合的方法建立負(fù)荷預(yù)測(cè)模型[3,4],上述兩種方法均取得較好結(jié)果,但其方法需獲得大量建筑能耗數(shù)據(jù). Chae等采用人工神經(jīng)網(wǎng)絡(luò)建立短期建筑能耗預(yù)測(cè)模型,可提前預(yù)測(cè)一天的用電量及日常高峰用電量[5],但其易陷入局部最優(yōu);王義軍等采用PSO-SVM神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)短期電力負(fù)荷,提高了預(yù)測(cè)精度,但結(jié)果易受核函數(shù)的影響[6]. 李明海等研究了一種基于GM-BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型預(yù)測(cè)校園能耗,預(yù)測(cè)精度和擬合性有所提高,但模型訓(xùn)練時(shí)間較長(zhǎng)且收斂性不足[7]; Zhang Y等研究了一種基于PSO-RBF神經(jīng)網(wǎng)絡(luò)的建筑能耗預(yù)測(cè)模型,提高了預(yù)測(cè)精度,但其需要的訓(xùn)練樣本較多,運(yùn)算量大[8].
基于聚類(lèi)的超閉球小腦模型關(guān)節(jié)控制器HCMAC(Hyperball Cerebellar Model Articulation Controller)神經(jīng)網(wǎng)絡(luò)是在CMAC神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上學(xué)習(xí)而來(lái)的[9],具有局部泛化能力強(qiáng),模型結(jié)構(gòu)簡(jiǎn)單,收斂速度快,易于軟硬件實(shí)現(xiàn)等優(yōu)點(diǎn). 將其應(yīng)用于建筑電負(fù)荷預(yù)測(cè)的關(guān)鍵在于聚類(lèi)中心即網(wǎng)絡(luò)節(jié)點(diǎn)的獲取,現(xiàn)有聚類(lèi)算法采用的終止條件以及模糊聚類(lèi)方法,可能導(dǎo)致聚類(lèi)結(jié)果不能到達(dá)最優(yōu)結(jié)果. 因此,文章采用遺傳算法(Genetic Algorithm,GA)與蟻群聚類(lèi)算法(Ant Colony Clustering Algo-rithm,ACCA)相結(jié)合的方法來(lái)確定聚類(lèi)中心以及聚類(lèi)數(shù)目,建立基于遺傳算法與蟻群聚類(lèi)算法的超閉球小腦模型關(guān)節(jié)控制器GIHCMAC(Genetic Algorithm Ant Colony Clustering Algorithm based IHCMAC)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,實(shí)現(xiàn)辦公建筑電負(fù)荷的準(zhǔn)確預(yù)測(cè).
1.1.1 IHCMAC神經(jīng)網(wǎng)絡(luò)
IHCMAC神經(jīng)網(wǎng)絡(luò)[10]輸入空間的量化不再使用等網(wǎng)格劃分的傳統(tǒng)方法,而是采用模糊C均值聚類(lèi)算法(FCM)[11],降低了高維數(shù)據(jù)處理的復(fù)雜性. 首先對(duì)輸入進(jìn)行歸一化處理得到m維的輸入空間=[0,n]1×[0,n]2×···×[0,n]m,然后用FCM聚類(lèi)算法對(duì)輸入空間xˉ進(jìn)行聚類(lèi),得到L個(gè)聚類(lèi)中心值,即網(wǎng)絡(luò)節(jié)點(diǎn)p=[p1,p2,···,pL],每個(gè)節(jié)點(diǎn)都是一個(gè)m維向量pi=[pi1,pi2,···,pim],i=1,2,···,L. 定義一個(gè)中心為xk,半徑為的超閉球,當(dāng)超閉球內(nèi)的節(jié)點(diǎn)被激活時(shí),IHCMAC神經(jīng)網(wǎng)絡(luò)可由式(1)表示為:
權(quán)值訓(xùn)練算法采用改進(jìn)的C-L算法,由式(2)表示為:
式中,α,β為常數(shù); ek-1為估計(jì)誤差,當(dāng)0<α<2、β>0時(shí),算法收斂,對(duì)于不同樣本,只需局部調(diào)整權(quán)系數(shù)即可[11].
1.1.2 蟻群聚類(lèi)算法
蟻群算法[12]是1991年由意大利學(xué)者DorGIo M提出的一種模仿螞蟻群體行為的仿生優(yōu)化算法,2004年Shelokar將蟻群算法運(yùn)用于聚類(lèi)分析中,提出基于蟻群覓食原理的聚類(lèi)算法(Ant Colony Clustering Algorithm,ACCA)[13]. 螞蟻覓食時(shí)會(huì)釋放隨時(shí)間推移而揮發(fā)的信息素,當(dāng)某一路徑上走過(guò)的螞蟻數(shù)量越多,該路徑上的信息素強(qiáng)度就會(huì)增加,從而吸引更多的螞蟻,這一過(guò)程也稱(chēng)為正反饋. 通過(guò)這種正反饋機(jī)制,螞蟻?zhàn)罱K可以找到從蟻穴到食物源的最短路徑[14]. 蟻群算法就是利用這種原理來(lái)求解最優(yōu)解的.
1.1.3 遺傳算法改進(jìn)蟻群聚類(lèi)
IHCMAC神經(jīng)網(wǎng)絡(luò)算法采用FCM聚類(lèi)的方式確定網(wǎng)絡(luò)節(jié)點(diǎn),雖然解決了高維數(shù)據(jù)處理過(guò)程中的維數(shù)災(zāi)難問(wèn)題,但不能反映輸入數(shù)據(jù)的整體特征. 聚類(lèi)終止條件是人為確定的,并且由聚類(lèi)準(zhǔn)則函數(shù)收斂速度判斷聚類(lèi)數(shù)目的缺陷,增加了運(yùn)算量,而且對(duì)訓(xùn)練模型的精度有著較大的影響.
蟻群聚類(lèi)算法雖然可以較好的彌補(bǔ)IHCMAC算法的缺陷,但其依賴(lài)于初始聚類(lèi)中心的選擇,且易陷入局部最優(yōu)的問(wèn)題,使聚類(lèi)效果不夠理想,直接影響了預(yù)測(cè)模型的學(xué)習(xí)精度. 遺傳算法是一種比較常用的隨機(jī)搜索算法,能在很大程度上減少陷入局部最優(yōu)的情況. 因此,文章采用遺傳算法改進(jìn)蟻群聚類(lèi)[15,16],首先,蟻群算法快速地完成初始路徑的選擇,得到各個(gè)樣本到其對(duì)應(yīng)的聚類(lèi)中心的總偏離誤差F,作為遺傳算法的初始種群進(jìn)行全局搜索,得到最佳聚類(lèi)中心. 具體步驟如下:
(1) 初始化. 設(shè)定各參數(shù)σ、α、β,蟻群數(shù)A,聚類(lèi)數(shù)K,最大迭代次數(shù)t_max,閾值P0,變異率pls.
(2) 構(gòu)造每只螞蟻的解,計(jì)算轉(zhuǎn)移概率P. 若P>P0,則將樣本Xi分配到類(lèi)mk中; 否則,將樣本Xi隨機(jī)分配到類(lèi)mk中.
(3) 根據(jù)式(4)和式(3)計(jì)算新的k個(gè)聚類(lèi)中心和適應(yīng)度值F,同時(shí)更新信息素矩陣.
式中,mj為聚類(lèi)中心,J為該聚類(lèi)中所有數(shù)據(jù)對(duì)象的個(gè)數(shù),i=1,2,…,n位樣本數(shù)據(jù)個(gè)數(shù),j=1,2,…,k為聚類(lèi)數(shù)目.
(4) 比較A只螞蟻求的目標(biāo)函數(shù)值的大小,選出最小的記為此次迭代的最優(yōu)值,確定最佳路徑.
(5) 根據(jù)最佳路徑產(chǎn)生n維隨機(jī)數(shù)組rp,若rp(i)≤pls,則對(duì)最佳路徑進(jìn)行變異,產(chǎn)生新的聚類(lèi)中心,并計(jì)算新路徑下的適應(yīng)度值F_temp. 若F_temp<F,則新路徑為最佳路徑; 否則轉(zhuǎn)步驟(3).
(6) 若滿(mǎn)足結(jié)束條件t>t_max,則輸出全局最優(yōu)解;否則迭代次數(shù)t=t+1,轉(zhuǎn)步驟(2).
文章采用遺傳算法優(yōu)化蟻群聚類(lèi)算法,改進(jìn)了IHCMAC算法中確定神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)的方式,最終得到GIHCMAC (GA ACCA Improvement Hyperball CMAC)神經(jīng)網(wǎng)絡(luò)算法.
以位于濰坊市某一辦公建筑為研究對(duì)象,獲取實(shí)測(cè)數(shù)據(jù). 每5 min采集一次,采集2018年10月8日到14日一周的用電數(shù)據(jù),共2016組作為訓(xùn)練數(shù)據(jù),分為1008組學(xué)習(xí)樣本和1008組測(cè)試樣本,其中2018年10月8日8:00-11:00的數(shù)據(jù)如表1所示. 模型的輸入為前兩個(gè)時(shí)刻的數(shù)據(jù)Pt-2,Pt-1,輸出為Pt. 模型的流程圖如圖1所示,將輸入數(shù)據(jù)進(jìn)行歸一化和滑動(dòng)平均濾波處理,利用遺傳算法優(yōu)化蟻群聚類(lèi)算法來(lái)確定網(wǎng)絡(luò)節(jié)點(diǎn),構(gòu)建GIHCMAC神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,最后輸出模型誤差值及建筑電負(fù)荷預(yù)測(cè)值.
表1 樣本部分?jǐn)?shù)據(jù)
圖1 GIHCMAC神經(jīng)網(wǎng)絡(luò)建筑負(fù)荷預(yù)測(cè)流
2.1.1 數(shù)據(jù)濾波去噪
實(shí)際數(shù)據(jù)在采集過(guò)程中,會(huì)因?yàn)槭艿酵饨缙渌蛩氐挠绊懏a(chǎn)生干擾數(shù)據(jù). 因此需要對(duì)數(shù)據(jù)進(jìn)行濾波處理,去除噪聲. 滑動(dòng)平均濾波法原理簡(jiǎn)單,通常去噪效果比較好[17]. 設(shè)原始數(shù)據(jù)序列為fi(i=1,2,…,N),N為樣本數(shù),在固定窗口M中,每采集一個(gè)新數(shù)據(jù)放入序列列尾,則丟掉原始數(shù)據(jù)序列列首的一個(gè)舊數(shù)據(jù),并進(jìn)行平均運(yùn)算,得到新的濾波數(shù)據(jù),其一般表達(dá)式為:
式中,i=n+1,n+2,…,N-n,M=2n+1.
2.1.2 數(shù)據(jù)歸一化
在進(jìn)行建筑能耗預(yù)測(cè)仿真之前,需要將所有數(shù)據(jù)進(jìn)行歸一化處理,即把所有建筑能耗數(shù)據(jù)都轉(zhuǎn)化為[-1,1]之間的數(shù)值,使所有數(shù)據(jù)都在統(tǒng)一的尺度內(nèi),防止不同數(shù)量級(jí)引發(fā)建模病態(tài)問(wèn)題.
以MATLAB R2014a為實(shí)驗(yàn)平臺(tái)對(duì)模型進(jìn)行仿真,編寫(xiě)IHCMAC[18]、KHCMAC[19]、IKHCMAC[20]及文中建立的GIHCMAC神經(jīng)網(wǎng)絡(luò)模型程序,以均方根誤差RMSE作為訓(xùn)練模型的評(píng)價(jià)指標(biāo),泛化誤差GMSE作為測(cè)試模型的評(píng)價(jià)指標(biāo),分別由式(7)、式(8)表示為:
根據(jù)上述仿真實(shí)驗(yàn),通過(guò)聚類(lèi)得到神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)150個(gè),用學(xué)習(xí)樣本對(duì)三種預(yù)測(cè)模型進(jìn)行訓(xùn)練,實(shí)驗(yàn)參數(shù)設(shè)定:蟻群規(guī)模A=100,最大迭代次數(shù)t_max=100,σ=0.7,α=0.5,β=0.2,P0=0.9,pls=0.1. 表2列出了4種模型的性能評(píng)價(jià)參數(shù),圖2為四種模型的學(xué)習(xí)誤差與泛化誤差曲線(xiàn)圖,圖3為建筑電負(fù)荷400組數(shù)據(jù)實(shí)際值與預(yù)測(cè)值的對(duì)比曲線(xiàn)圖. 根據(jù)仿真結(jié)果表明,IHCMAC神經(jīng)網(wǎng)絡(luò)模型的迭代次數(shù)為25次,較KHCMAC神經(jīng)網(wǎng)絡(luò)模型和IKHCMAC神經(jīng)網(wǎng)絡(luò)模型收斂速度較快;而GIHCMAC神經(jīng)網(wǎng)絡(luò)模型因在蟻群聚類(lèi)算法的基礎(chǔ)上加入了局部尋優(yōu)閾值pls (變異率),減少運(yùn)算次數(shù),加快了收斂速度,所以其迭代次數(shù)降為9,較IHCMAC神經(jīng)網(wǎng)絡(luò)模型降低了64%. IHCMAC模型的訓(xùn)練誤差為0.0092,較小于KHCMAC、IKHCMAC兩種模型的訓(xùn)練誤差,而GIHCAMC模型的訓(xùn)練誤差為0.0053,較IHCMAC模型降低了42.39%,其具有更好的學(xué)習(xí)精度. IHCMAC模型的泛化誤差為0.0022,較小于KHCMAC、IKHCMAC兩種模型的泛化誤差,而GIHCMAC模型的泛化誤差為0.0015,較IHCMAC模型降低了31.82%,其泛化能力更強(qiáng). KHCMAC模型的迭代時(shí)間為3.75 s,低于其它三種模型. GIHCMAC模型的迭代時(shí)間為5.16 s,雖然后者的迭代時(shí)間略大于前者,但是后者的誤差較小,證明在保證預(yù)測(cè)精度的前提下其實(shí)時(shí)性相對(duì)較 好. 由表3可以看出基于遺傳算法改進(jìn)的蟻群聚類(lèi)的聚類(lèi)效果方面優(yōu)于蟻群聚類(lèi)算法.
表2 4種模型性能參數(shù)
文章針對(duì)蟻群聚類(lèi)算法與遺傳算法的特點(diǎn),將兩者相結(jié)合,彌補(bǔ)蟻群聚類(lèi)算法易陷入局部最優(yōu)的缺陷,實(shí)現(xiàn)對(duì)IHCMAC神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)選擇的優(yōu)化,建立基于GIHCMAC神經(jīng)網(wǎng)絡(luò)的辦公建筑電負(fù)荷預(yù)測(cè)模型. 通過(guò)此模型,得知前兩個(gè)時(shí)刻的電負(fù)荷值,則可以預(yù)測(cè)得到后一時(shí)刻的電負(fù)荷值. 實(shí)驗(yàn)表明,該算法與IHCMAC神經(jīng)網(wǎng)絡(luò)方法、KHCMAC神經(jīng)網(wǎng)絡(luò)方法、IKHCMAC神經(jīng)網(wǎng)絡(luò)方法相比,收斂速度快,學(xué)習(xí)精度高,泛化能力強(qiáng).
表3 改進(jìn)前后聚類(lèi)效果對(duì)比
圖2 4種模型的學(xué)習(xí)誤差與泛化誤差曲線(xiàn)
圖3 實(shí)際電負(fù)荷與模型預(yù)測(cè)值對(duì)比曲線(xiàn)