高學(xué)金,付龍曉,武翠霞,王 普
(1.北京工業(yè)大學(xué)信息學(xué)部,北京 100124; 2.數(shù)字社區(qū)教育部工程研究中心,北京 100124;3.城市軌道交通北京實(shí)驗(yàn)室,北京 100124; 4.計(jì)算智能與智能系統(tǒng)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100124)
地鐵已成為解決城市道路交通阻塞和居民乘車難問題的最有效的途徑,并能夠減少城市污染,改善地面交通狀況,帶來顯著的社會(huì)效益和經(jīng)濟(jì)效益[1]。然而隨著我國能源問題的嚴(yán)重,地鐵運(yùn)營成本不斷增大,地鐵站空調(diào)系統(tǒng)是整個(gè)地鐵系統(tǒng)的能耗大戶,約占總用電量的30%~50%[2],因此地鐵站空調(diào)系統(tǒng)的節(jié)能意義重大。空調(diào)系統(tǒng)能耗的準(zhǔn)確預(yù)測(cè)是實(shí)現(xiàn)節(jié)能運(yùn)行的前提,空調(diào)能耗預(yù)測(cè)的方法有回歸分析、指數(shù)平滑法、灰色預(yù)測(cè)和人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)等[3-5],然而由于空調(diào)系統(tǒng)中影響能耗的因素眾多[6],如送風(fēng)溫度、回風(fēng)溫度、冷機(jī)的出水溫度、室外溫濕度時(shí)刻表、當(dāng)前時(shí)刻的站內(nèi)環(huán)境溫濕度和能耗值等,每個(gè)影響因素之間相互耦合,且空調(diào)系統(tǒng)能耗變化具有非線性和時(shí)變性,預(yù)測(cè)模型的精度達(dá)不到令人滿意的程度。
支持向量機(jī)[7](Support Vector Machine, SVM)是在統(tǒng)計(jì)學(xué)上發(fā)展起來的一種算法,而最小二乘支持向量機(jī)(Least Squares Support Vector Machines, LS-SVM)使用求解一組線性方程代替標(biāo)準(zhǔn)的QP問題,從而大大減少了學(xué)習(xí)過程的計(jì)算時(shí)間[8],其已經(jīng)廣泛地應(yīng)用于空調(diào)系統(tǒng)能耗的預(yù)測(cè)。但是由于LS-SVM參數(shù)選擇帶有隨機(jī)性,給系統(tǒng)性能帶來很大的影響,針對(duì)參數(shù)選取問題一些學(xué)者在進(jìn)一步的研究中引進(jìn)了一些智能算法來改進(jìn)模型的性能。
蟻群算法、教學(xué)算法和粒子群優(yōu)化算法等[9-10]在LS-SVM的參數(shù)尋優(yōu)中逐漸被應(yīng)用。葉永偉等人[11]利用網(wǎng)格搜索算法和交叉驗(yàn)證方法尋找最小二乘支持向量機(jī)的最優(yōu)參數(shù)組合,與常規(guī)最小二乘支持向量機(jī)進(jìn)行比較預(yù)測(cè)精度有所提高,推廣能力較強(qiáng),但是搜索時(shí)間較長;呂游等人[12]直接采用文獻(xiàn)[11]提出的方法對(duì)參數(shù)進(jìn)行優(yōu)化,未對(duì)優(yōu)化方法進(jìn)行改進(jìn)提升,但驗(yàn)證了網(wǎng)格搜索算法優(yōu)化LS-SVM參數(shù)的推廣性能;張廣明等人[13]考慮目標(biāo)函數(shù)的變化極值點(diǎn)對(duì)預(yù)測(cè)誤差的影響,采用改進(jìn)的粒子群算法優(yōu)化最小二乘支持向量機(jī)的參數(shù),預(yù)測(cè)模型取得較高的預(yù)測(cè)精度,但是預(yù)測(cè)時(shí)間較長;戟鋼等人[9]采用精英策略,同時(shí)引入粒子歷史最優(yōu)信息改進(jìn)引力搜索算法,將改進(jìn)后的算法應(yīng)用到最小二乘支持向量機(jī)的參數(shù)尋優(yōu)機(jī)制,并與遺傳算法、粒子群算法等進(jìn)行比較,優(yōu)化后的預(yù)測(cè)模型預(yù)測(cè)精度更高,但是計(jì)算過程復(fù)雜,粒子迭代次數(shù)增多。
最小二乘支持向量機(jī)建模的精度主要取決于核函數(shù)的構(gòu)造及其參數(shù)的選擇。傳統(tǒng)的參數(shù)選擇方法不僅受數(shù)據(jù)規(guī)模的限制,而且優(yōu)化方法相當(dāng)耗時(shí),很難精確找到最優(yōu)參數(shù)。綜合精度和速度這2方面性能指標(biāo),搜索者優(yōu)化算法(Seeker Optimization Algorithm, SOA)具有相對(duì)優(yōu)勢(shì)[14]。該算法是一種基于種群的啟發(fā)式隨機(jī)搜索算法,目前應(yīng)用在典型函數(shù)的優(yōu)化、電力系統(tǒng)無功優(yōu)化[15]、圖像分割[16]、IIR數(shù)字濾波器優(yōu)化設(shè)計(jì)[17]和SVM參數(shù)優(yōu)化[18]等方面。隨著近幾年的發(fā)展,又被稱為人群搜索算法。但是人群搜索存在計(jì)算時(shí)間長的問題,從搜索步長和搜索方向這2個(gè)方面進(jìn)行改進(jìn),可以解決此問題。
本文對(duì)SOA算法主要有2個(gè)方面的改進(jìn):1)用高斯隸屬函數(shù)代替線性隸屬函數(shù),加快收斂過程;2)方向更新中,預(yù)動(dòng)方向采用個(gè)體最優(yōu)適應(yīng)度值和當(dāng)前個(gè)體的適應(yīng)度值比較得出,提高了計(jì)算速度。本文最后將ISOA(Improved Seeker Optimization Algorithm)應(yīng)用于LS-SVM的參數(shù)尋優(yōu),并基于地鐵實(shí)訓(xùn)平臺(tái)的數(shù)據(jù),建立空調(diào)系統(tǒng)的能耗預(yù)測(cè)模型,為地鐵站空調(diào)系統(tǒng)的節(jié)能運(yùn)行提供依據(jù)。
支持向量機(jī)做回歸是通過一個(gè)非線性映射函數(shù)φ(·),將輸入數(shù)據(jù)映射到一個(gè)高維空間,進(jìn)行線性回歸,此時(shí)在高維空間的線性回歸就相當(dāng)于低維空間的非線性回歸。
最小二乘支持向量機(jī)的算法如下:設(shè)訓(xùn)練樣本集合D={(xi,yi)},i=1,2,…,N,其中xi∈R為訓(xùn)練樣本的輸入數(shù)據(jù),yi∈R為與之對(duì)應(yīng)的輸出數(shù)據(jù),xi與yi之間對(duì)應(yīng)的回歸函數(shù)可以定義為:
yi=ωφ(xi)+b
(1)
式中,ω為權(quán)值矢量,b為偏置。根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,最優(yōu)化問題就轉(zhuǎn)化為尋找使下面風(fēng)險(xiǎn)函數(shù)最小的y:
(2)
其中,γ為懲罰系數(shù),ei為誤差,約束條件為yi=ωTφ(xi)+b+ei,i=1,2,…,N。利用拉格朗日乘子法,引入Lagrange乘子αi,如下:
(3)
公式兩邊分別對(duì)ω、b、ei、αi求偏導(dǎo)數(shù),得:
(4)
(5)
(6)
(7)
消去中間變量ω和ei,則求解的最優(yōu)化問題轉(zhuǎn)化為求解線性方程組:
(8)
(9)
人群搜索算法[19](Seeker Optimization Algorithm, SOA)模擬人的隨機(jī)搜索行為,將人的智能搜索行為直接應(yīng)用于對(duì)優(yōu)化問題的搜索。優(yōu)化搜索計(jì)算中:在連續(xù)空間的搜索過程中,最優(yōu)解可能存在于較優(yōu)解的領(lǐng)域內(nèi)。因此,當(dāng)搜尋者所處位置較優(yōu)時(shí),應(yīng)該在較小領(lǐng)域內(nèi)搜索;當(dāng)搜索者所處位置較差時(shí),應(yīng)該在較大領(lǐng)域內(nèi)搜索。SOA利用能有效描述自然語言和不確定性推理的模糊邏輯來對(duì)上述搜索規(guī)則進(jìn)行建模,并確定搜索步長。其通過社會(huì)學(xué)習(xí)和認(rèn)知學(xué)習(xí),分別獲取社會(huì)經(jīng)驗(yàn)和認(rèn)知經(jīng)驗(yàn),并結(jié)合智能群體的自組織聚集行為、以自我為中心的利己主義行為和人的預(yù)動(dòng)行為,確定個(gè)體搜索方向。
SOA的模糊系統(tǒng)將目標(biāo)函數(shù)值按遞減的順序排列,將排列得到的序號(hào)值1到s的自然數(shù)作為模糊推理的輸入,采用線性隸屬度函數(shù)模糊輸出,如式(10):
(10)
式中,ui為第i個(gè)種群目標(biāo)函數(shù)的線性隸屬度,s為種群個(gè)數(shù),Ii為第i個(gè)種群目標(biāo)函數(shù)降序排列后的序號(hào),umax和umin分別為最大和最小的隸屬度值。
式(10)使隸屬度值直接與目標(biāo)函數(shù)值成正比,即在最佳位置(目標(biāo)函數(shù)值最小,排列序號(hào)最大s)有最大的隸屬度值,在最差的位置有最小的隸屬度值,在其他位置umin
為了模擬人的搜索行為隨機(jī)性,由不確定性推理可得,第i個(gè)種群中第j維搜索空間目標(biāo)函數(shù)值的隸屬度uij,如式(11):
uij=rand(ui,1) j=1,2,…,D
(11)
函數(shù)rand(ui,1)為均勻、隨機(jī)地分布于區(qū)間[ui,1]上的實(shí)數(shù)。再根據(jù)不確定推理可得搜索步長:
(12)
其中,αij為第i個(gè)種群中第j維搜索空間的搜索步長;δij為高斯隸屬函數(shù)參數(shù);xmin和xmax分別為同一種群中的最小適應(yīng)度值和最大適應(yīng)度值時(shí)的位置;ω為慣性權(quán)值,范圍為[0.1,0.9];t為當(dāng)前迭代次數(shù),Tmax為最大迭代次數(shù)。
(13)
綜合以上3個(gè)方向,取它們的隨機(jī)加權(quán)幾何平均作為搜索方向,如式(14):
(14)
在搜索方向和步長確定后,即可對(duì)每一個(gè)個(gè)體進(jìn)行位置更新:
(15)
1)確定搜索步長。
相比于線性隸屬函數(shù)來說,采用式(16)和式(17)的高斯隸屬函數(shù)表示搜索步長的模糊變量可以很好地將第i個(gè)搜尋個(gè)體的適應(yīng)度值非線性地模糊到[0.0111,0.95]之間,避免了由線性隸屬函數(shù)模糊的步長不準(zhǔn)確性,可以快速收斂,并且減小計(jì)算量。
(16)
uij=ui+rand·(1-ui), j=1,…,D
(17)
(18)
因此步長計(jì)算公式為:
(19)
(20)
(21)
(22)
預(yù)動(dòng)方向采用個(gè)體最優(yōu)適應(yīng)度值和當(dāng)前個(gè)體的適應(yīng)度值比較得出,可以很好地代表當(dāng)前個(gè)體的預(yù)動(dòng)行為,同時(shí)減小計(jì)算量,提高計(jì)算速度。
(23)
(24)
空調(diào)能耗存在的影響因素眾多,本文采用LS-SVM方法對(duì)空調(diào)能耗進(jìn)行建模。本文選擇徑向基核(RBF)函數(shù),與其他4種核函數(shù)(線性內(nèi)核、多項(xiàng)式內(nèi)核、徑向基內(nèi)核(RBF)、sigmoid核)相比[21],RBF核函數(shù)適用范圍廣,無論是小樣本還是大樣本,高維還是低維等情況,RBF核函數(shù)都適用,并且需要確定的參數(shù)少,算法復(fù)雜度相對(duì)較低。
考慮到LS-SVM算法的正則化參數(shù)和核參數(shù)對(duì)模型擬合精度及泛化能力有較大影響,采用ISOA對(duì)LS-SVM的參數(shù)C和σ進(jìn)行優(yōu)化選擇,目的是進(jìn)一步提高LS-SVM的學(xué)習(xí)能力和計(jì)算速度。
優(yōu)化問題的目標(biāo)函數(shù)選取如式(25):
(25)
綜上所述,建模主要步驟總結(jié)如下:
1)數(shù)據(jù)預(yù)處理。對(duì)所采集的數(shù)據(jù)進(jìn)行相關(guān)性分析,選擇輸入輸出向量,構(gòu)造訓(xùn)練集數(shù)據(jù)。
2)數(shù)據(jù)歸一化。
3)初始化參數(shù)。初始化種群規(guī)模、最大迭代次數(shù)、最小適應(yīng)度值;確定初始的經(jīng)驗(yàn)梯度方向、搜索步長、高斯核參數(shù)以及利己方向、利他方向和預(yù)動(dòng)方向;確定正則化參數(shù)C及核參數(shù)σ的尋優(yōu)范圍并隨機(jī)產(chǎn)生初始種群;令迭代次數(shù)t=0。
4)最優(yōu)模型參數(shù)確定:
①建模?;谟?xùn)練樣本集和搜索位置參數(shù),建立LS-SVM模型。
③判斷終止條件。如果迭代次數(shù)t大于最大迭代次數(shù)或者適應(yīng)度值小于最小適應(yīng)度值,則輸出最優(yōu)參數(shù)C*和σ*;否則進(jìn)入下一步,計(jì)算搜索方向和位置,并進(jìn)行位置更新。
④確定搜索步長如式(16)~式(19)所示。
⑤確定搜索方向如式(20)~式(24)所示。
⑥位置更新。在確定出的搜索方向和步長后,即可對(duì)每一個(gè)個(gè)體進(jìn)行位置更新,公式如式(15),令t=t+1,更新完畢,則返回第①步建模。
5)基于最優(yōu)參數(shù)C*和σ*,按式(5)求解b、α,建立LS-SVM的空調(diào)能耗模型。
SOA-LS-SVM的建模流程如圖1所示。
圖1 建立預(yù)測(cè)模型流程圖
利用北京某高校地鐵實(shí)訓(xùn)平臺(tái)的實(shí)際數(shù)據(jù)來驗(yàn)證本文所建立的ISOA-LS-SVM地鐵站通風(fēng)空調(diào)系統(tǒng)能耗預(yù)測(cè)模型的準(zhǔn)確性。實(shí)際通風(fēng)空調(diào)系統(tǒng)如圖2所示。
圖2 通風(fēng)空調(diào)系統(tǒng)實(shí)際圖
地鐵實(shí)訓(xùn)平臺(tái)由風(fēng)系統(tǒng)和水系統(tǒng)組成,通風(fēng)系統(tǒng)的主要設(shè)備包括組合式空調(diào)機(jī)組2臺(tái),組合式空調(diào)機(jī)組內(nèi)包含風(fēng)機(jī)1臺(tái),額定功率3 kw,8排表冷器1個(gè),板式初效過濾器1個(gè),風(fēng)閥1個(gè)。水系統(tǒng)主要設(shè)備包括冷水機(jī)組2臺(tái),一用一備,額定功率8.81 kw;冷凍水泵3臺(tái),一用兩備,額定功率3 kw;冷卻水泵2臺(tái),一用一備,額定功率5 kw;冷卻塔1臺(tái),額定功率1.5 kw。
數(shù)據(jù)采集系統(tǒng)由西門子PLC200和DUT4000數(shù)據(jù)采集模塊共同完成。采樣間隔為10 s,一次采集18個(gè)變量進(jìn)行監(jiān)控,表1為18個(gè)變量的名稱。
表1 數(shù)據(jù)采集的監(jiān)控變量
為了驗(yàn)證本文提出的基于ISOA-LS-SVM地鐵站通風(fēng)空調(diào)系統(tǒng)能耗預(yù)測(cè)模型的準(zhǔn)確性和實(shí)用性,將本文所提算法與使用高斯隸屬函數(shù)的SOA優(yōu)化LS-SVM(GSOA-LS-SVM)、SOA優(yōu)化LS-SVM(SOA-LS-SVM)、粒子群優(yōu)化LS-SVM(PSO-LS-SVM)和傳統(tǒng)的網(wǎng)格搜索優(yōu)化LS-SVM作對(duì)比。以實(shí)訓(xùn)平臺(tái)采集的數(shù)據(jù)作為模型的學(xué)習(xí)訓(xùn)練樣本和測(cè)試樣本。
本實(shí)驗(yàn)的時(shí)間為2016年空調(diào)季的7月9日至8月12日,實(shí)際實(shí)驗(yàn)時(shí)間共35天,每天早8:00~晚19:00。將樣本間隔為30 min,共840組數(shù)據(jù)。再將每組建模數(shù)據(jù)的輸入與輸出間隔半個(gè)小時(shí),則實(shí)際數(shù)據(jù)可以組成839個(gè)樣本。為了得到驗(yàn)證建模方法的有效數(shù)據(jù),回風(fēng)溫度設(shè)定值范圍為[25,29]℃,送風(fēng)溫度設(shè)定值范圍為[13,20]℃,步長取0.5℃。
對(duì)送回風(fēng)溫度每小時(shí)進(jìn)行交叉組合設(shè)置,進(jìn)行實(shí)際實(shí)驗(yàn)并及時(shí)導(dǎo)出實(shí)驗(yàn)數(shù)據(jù)。
具體方案為:將實(shí)際采得的839個(gè)數(shù)據(jù)的5/6作為建模訓(xùn)練樣本,1/6的數(shù)據(jù)作為模型測(cè)試樣本,進(jìn)行ISOA-LS-SVM系統(tǒng)建模算法驗(yàn)證。其中優(yōu)化算法中的初始參數(shù)在表2中說明。
表2 優(yōu)化算法參數(shù)說明
4種算法建立的預(yù)測(cè)效果如圖3~圖7所示,經(jīng)過4種算法的建模比較,不論使用哪種優(yōu)化算法,都可以使LS-SVM進(jìn)行很好的擬合和預(yù)測(cè)。
但是每種優(yōu)化算法的性能卻不同,從圖8(a)中可以看出,PSO迭代次數(shù)最多,SOA迭代的次數(shù)次之,ISOA和GSOA的迭代次數(shù)最少并且預(yù)測(cè)誤差最小,精度最高。因此本文從測(cè)試的平均相對(duì)誤差、測(cè)試的均方根誤差、運(yùn)行時(shí)間、迭代次數(shù)和優(yōu)化后的參數(shù)值這幾個(gè)方面對(duì)4種優(yōu)化方法進(jìn)行評(píng)判。詳細(xì)的性能指標(biāo)如表3所示。
表3 ISOA-LS-SVM建模性能指標(biāo)
圖3 ISOA-LS-SVM訓(xùn)練對(duì)比圖
圖4 ISOA-LS-SVM測(cè)試效果對(duì)比圖
圖5 PSO-LS-SVM測(cè)試效果對(duì)比圖
圖6 SOA-LS-SVM測(cè)試效果對(duì)比圖
圖7 GSOA-LS-SVM測(cè)試效果對(duì)比圖
(a) 適應(yīng)度變化曲線
(b) 懲罰系數(shù)的優(yōu)化曲線
(c) 核參數(shù)的優(yōu)化曲線圖8 優(yōu)化曲線
表3中的MAPE為測(cè)試的平均相對(duì)誤差,MSE為測(cè)試的均方根誤差。從表3中可以明顯看出基于網(wǎng)格搜索算法優(yōu)化的LS-SVM的空調(diào)能耗建模方法預(yù)測(cè)誤差1.06%,但是建模的過程耗時(shí)396.77 s,同時(shí)暴露出LS-SVM針對(duì)數(shù)據(jù)量較大時(shí)的缺點(diǎn),計(jì)算精確但是耗時(shí)較長;PSO-LS-SVM的預(yù)測(cè)誤差0.93%,較傳統(tǒng)的LS-SVM不僅在預(yù)測(cè)精度上有所提升,而且在速度也有提升,但是耗時(shí)較長,達(dá)到了275.99 s。SOA-LS-SVM的預(yù)測(cè)誤差為0.855%,預(yù)測(cè)精度和速度相對(duì)于前2種方法都有所提升,并且迭代次數(shù)較PSO減少了許多,只是速度相對(duì)于PSO來說提升的不高,這是因?yàn)樵赟OA中每次迭代計(jì)算過程中搜索向量的計(jì)算量較大。相比于使用性隸屬函數(shù),使用高斯隸屬函數(shù)的SOA,性能更好一些,迭代次數(shù)僅為4步,而本文提出的ISOA相對(duì)于前面4種優(yōu)化算法,不僅在精度上更勝一籌,而且在計(jì)算速度上遠(yuǎn)遠(yuǎn)超過前面4種算法。
因此本文提出的ISOA-LS-SVM模型能很好地反映地鐵站空調(diào)系統(tǒng)的能耗特性,同時(shí)該模型參數(shù)根據(jù)人群搜索算法進(jìn)行調(diào)整,提高模型的精度。實(shí)驗(yàn)結(jié)果表明ISOA-LS-SVM能耗模型具有較好的預(yù)測(cè)能力和建模速度。
本文針對(duì)建立地鐵站空調(diào)系統(tǒng)能耗預(yù)測(cè)模型的問題,提出了ISOA-LS-SVM建模的方法。改進(jìn)的人群搜索算法計(jì)算速度快、迭代次數(shù)少,能夠更好地實(shí)現(xiàn)在線建模。改進(jìn)后的人群搜索算法優(yōu)化LS-SVM參數(shù),提高了建模擬合精度。該算法應(yīng)用到地鐵實(shí)訓(xùn)平臺(tái),與其他優(yōu)化算法相比建模速度和擬合精度都有所提高,為空調(diào)系統(tǒng)預(yù)測(cè)模型的建立提供了新思路,提升了空調(diào)系統(tǒng)節(jié)能的空間。