田 瑋,魏 來(lái),李占勇,孟慶新,宋繼田,楊 松(. 天津市輕工與食品工程機(jī)械裝備集成設(shè)計(jì)與在線監(jiān)控重點(diǎn)實(shí)驗(yàn)室,天津科技大學(xué)機(jī)械工程學(xué)院,天津 300;. 天津科技大學(xué)后勤集團(tuán),天津 300)
基于機(jī)器學(xué)習(xí)的建筑能耗模型適用性研究
田 瑋1,魏 來(lái)1,李占勇1,孟慶新2,宋繼田1,楊 松1
(1. 天津市輕工與食品工程機(jī)械裝備集成設(shè)計(jì)與在線監(jiān)控重點(diǎn)實(shí)驗(yàn)室,天津科技大學(xué)機(jī)械工程學(xué)院,天津 300222;2. 天津科技大學(xué)后勤集團(tuán),天津 300222)
為進(jìn)一步分析不同機(jī)器學(xué)習(xí)方法用于建筑能耗模型的適用性,重點(diǎn)比較了6種常用機(jī)器學(xué)習(xí)方法用于預(yù)測(cè)辦公建筑能耗時(shí)的準(zhǔn)確性,包括線性回歸、高斯過(guò)程、多元自適應(yīng)回歸樣條法、自助多元自適應(yīng)回歸樣條法、隨機(jī)森林和支持向量機(jī).結(jié)果表明:多元自適應(yīng)回歸樣條法、自助多元自適應(yīng)回歸樣條法和隨機(jī)森林法適用于取暖能耗的模型建立;對(duì)于制冷能耗預(yù)測(cè),自助多元自適應(yīng)回歸樣條法的計(jì)算精度最高.同時(shí)發(fā)現(xiàn)制冷能耗與取暖能耗相比,由于存在更加復(fù)雜的非線性關(guān)系,其預(yù)測(cè)難度更大.研究結(jié)果不僅可用于在建筑節(jié)能分析中確定最佳機(jī)器學(xué)習(xí)方法,而且所得機(jī)器學(xué)習(xí)方法可用于城市建筑能耗模型的建立.
建筑節(jié)能;能耗模型;機(jī)器學(xué)習(xí);模型精度
2013年我國(guó)建筑能耗約占全國(guó)能源消費(fèi)總量的19.5%,[1].因此,為了實(shí)現(xiàn)經(jīng)濟(jì)可持續(xù)發(fā)展,推進(jìn)生態(tài)文明建設(shè),我國(guó)正在大力推進(jìn)建筑節(jié)能工作[2-3].建立可靠的能耗模型是建筑節(jié)能研究中的重要任務(wù)之一.這是因?yàn)闇?zhǔn)確的建筑能耗模型不僅可用于單體新建建筑和既有建筑的節(jié)能改造,而且對(duì)制定區(qū)域性的節(jié)能政策有直接指導(dǎo)作用.建筑能耗模型通常是基于熱平衡原理的動(dòng)態(tài)建筑能耗模擬,常用的程序包括DEST、EnergyPlus、eQUEST等.這類模型的特點(diǎn)是可以分析不同節(jié)能方案對(duì)于能耗的影響,確定最優(yōu)節(jié)能措施;其缺點(diǎn)是計(jì)算耗時(shí),建模所需時(shí)間較長(zhǎng).特別是在建筑能耗不確定性分析、敏感性分析、最優(yōu)化設(shè)計(jì)、參數(shù)化分析、區(qū)域建筑能耗評(píng)估時(shí),往往需要大量的模擬計(jì)算[4],根據(jù)動(dòng)態(tài)能耗模擬的建筑能耗模型,不能適用于這些場(chǎng)合.一種新的處理方法,是建立有特定參數(shù)的機(jī)器學(xué)習(xí)模型,在對(duì)其可靠性進(jìn)行有效評(píng)估后,用于需要大量計(jì)算的建筑能耗分析中.特定參數(shù)指建筑能耗研究中最關(guān)注的分析變量,并不考慮其他無(wú)關(guān)的因素.
國(guó)內(nèi)外學(xué)者已經(jīng)對(duì)基于機(jī)器學(xué)習(xí)方法的建筑能耗模型進(jìn)行了很多研究[4-8]:Tian等[7]利用多元自適應(yīng)回歸樣條法得到了英國(guó)倫敦中學(xué)建筑的能耗模型;Capozzoli等[5]利用多元線性回歸和分類回歸樹模型探討了意大利北部80所學(xué)校的能耗特點(diǎn);Le等[6]根據(jù)支持向量機(jī)算法,研究了建筑中遮陽(yáng)控制的相關(guān)計(jì)算;Tian等[8]基于高斯過(guò)程和主成分回歸等機(jī)器學(xué)習(xí)算法,分析了美國(guó)佐治亞理工學(xué)院校園建筑的能耗特點(diǎn).目前,還缺少系統(tǒng)地比較這些不同機(jī)器學(xué)習(xí)算法性能的研究.導(dǎo)致的問(wèn)題是,在建筑能耗分析中對(duì)機(jī)器學(xué)習(xí)方法的選擇沒(méi)有明確的標(biāo)準(zhǔn).
因此,本研究選取典型的辦公建筑,比較6種常用機(jī)器學(xué)習(xí)方法用于能耗預(yù)測(cè)時(shí)的適用性,包括線性回歸、高斯過(guò)程、多元自適應(yīng)回歸樣條法、自助多元自適應(yīng)回歸樣條法、隨機(jī)森林和支持向量機(jī).為了提供更可靠的分析,在我國(guó)5個(gè)不同氣候分區(qū)中分別選擇1個(gè)城市,比較6種能耗模型在這5個(gè)城市中的預(yù)測(cè)精度.研究結(jié)果為在節(jié)能改造中選取可靠的機(jī)器學(xué)習(xí)方法提供了依據(jù),同時(shí)可用于城市規(guī)模的建筑能耗預(yù)測(cè)研究.
1.1 氣象數(shù)據(jù)
建筑所在地區(qū)的氣候狀況對(duì)建筑熱性能有非常顯著的影響.研究中采用的全部氣象數(shù)據(jù)來(lái)自于由中國(guó)氣象局氣象信息中心和清華大學(xué)建筑技術(shù)科學(xué)系共同編制的《中國(guó)建筑熱環(huán)境分析專用氣象數(shù)據(jù)集》[9],包括氣溫、太陽(yáng)輻照、相對(duì)濕度等.從建筑熱工設(shè)計(jì)的角度,以最冷月和最熱月的平均氣溫為主要分區(qū)指標(biāo),將全國(guó)分為嚴(yán)寒、寒冷、夏熱冬冷、夏熱冬暖和溫和5個(gè)地區(qū).在5個(gè)不同氣候分區(qū)中分別選擇1個(gè)城市,選定為哈爾濱、北京、上海、廣州和昆明,利用其氣象數(shù)據(jù)進(jìn)行建模.5個(gè)城市的月平均氣溫變化情況見(jiàn)圖1.
1.2 建筑動(dòng)態(tài)能耗模型建立
研究選定的典型辦公建筑根據(jù)《公共建筑節(jié)能設(shè)計(jì)標(biāo)準(zhǔn)》[10]確定主要參數(shù).表1列出不同氣候分區(qū)中外圍護(hù)結(jié)構(gòu)的熱工性能參數(shù).照明功率密度和電器設(shè)備功率峰值為10,W/m2和15,W/m2,人員密度設(shè)定為5,m2/人.內(nèi)部得熱(包括人員、照明和設(shè)備)的時(shí)刻表也參照《公共建筑節(jié)能設(shè)計(jì)標(biāo)準(zhǔn)》.暖通系統(tǒng)使用風(fēng)機(jī)盤管系統(tǒng)提供建筑內(nèi)部的通風(fēng)、取暖和制冷,風(fēng)機(jī)盤管系統(tǒng)在工作日的運(yùn)行時(shí)間為8:00—18:00,取暖溫度和制冷溫度分別設(shè)定為20,℃和26,℃.建筑熱性能評(píng)估采用的指標(biāo)是單位建筑面積的年取暖和制冷能耗(單位:kW·h/m2).
圖1 5個(gè)城市的月平均氣溫Fig. 1 Average temperature by month in five cities
表1 5個(gè)城市的外圍護(hù)結(jié)構(gòu)熱工性能參數(shù)Tab. 1Thermal properties of building envelope in five cities
表2列出了本研究中輸入變量的變化范圍,重點(diǎn)分析建筑外形改變導(dǎo)致的建筑能耗變化.辦公建筑設(shè)定為矩形,所以第1個(gè)變量為矩形的長(zhǎng)寬比;第2到第5個(gè)變量表示4個(gè)不同朝向建筑外墻的窗墻比;第6個(gè)變量是不同的樓層數(shù),從1層到10層變化;第7個(gè)變量是建筑朝向變化,0.表示建筑朝向正北,然后其角度沿順時(shí)針?lè)较蜻f增;最后一個(gè)變量表示建筑單層面積的變化,從1,000,m2到5,000,m2增加.動(dòng)態(tài)能耗模擬模型基于美國(guó)能源部開(kāi)發(fā)的能耗模擬軟件EnergyPlus[11].EnergyPlus程序經(jīng)過(guò)了嚴(yán)格的驗(yàn)證,并已經(jīng)得到廣泛應(yīng)用[4,7-8].
表2 建筑能耗模型中的變量Tab. 2 Variables used in building energy models
2.1 機(jī)器學(xué)習(xí)方法
機(jī)器學(xué)習(xí)主要是研究人工智能領(lǐng)域中不同的計(jì)算機(jī)算法,目的是分析數(shù)據(jù)的特點(diǎn)以獲取新知識(shí)或發(fā)現(xiàn)新規(guī)律等[12].這種方法已經(jīng)廣泛用于不同的學(xué)科,在建筑能耗領(lǐng)域,主要是分析建筑能耗的特點(diǎn),以建立可靠的建筑能耗預(yù)測(cè)模型.
本研究選取常見(jiàn)的6種機(jī)器學(xué)習(xí)方法(表3).第1種方法是采用線形回歸方法(linear regression)建立線形模型(linear model,LM).其余5種方法是基于非參數(shù)回歸方法,包括高斯過(guò)程(Gaussian process,GP)、多元自適應(yīng)回歸樣條法(multivariate adaptive regression splines,MAS)、自助多元自適應(yīng)回歸樣條法(bagging MARS,BMS)、隨機(jī)森林(random forest,RF)和支持向量機(jī)(support vector machine,SVM).高斯過(guò)程模型基于高斯隨機(jī)過(guò)程和貝葉斯理論,適于處理小樣本、非線性、多維數(shù)據(jù)等復(fù)雜問(wèn)題,在機(jī)器學(xué)習(xí)領(lǐng)域得到廣泛應(yīng)用.多元自適應(yīng)回歸樣條法是基于回歸基函數(shù)的,其建模包括前向過(guò)程和后向過(guò)程兩個(gè)主要步驟,前向過(guò)程加入基函數(shù)以提高模型擬合效果,后向過(guò)程則刪除不必要項(xiàng)以避免模型過(guò)擬.自助多元自適應(yīng)回歸樣條法是上一類模型的集成學(xué)習(xí)方法,通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行自助法抽樣,產(chǎn)生很多新的訓(xùn)練集,利用多元自適應(yīng)回歸樣條法生成相應(yīng)的很多模型,最后使用平均所有模型預(yù)測(cè)的方法得到最終結(jié)果.這種自助法的主要優(yōu)點(diǎn)是避免了單一模型預(yù)測(cè)時(shí)的不穩(wěn)定性.隨機(jī)森林法也屬于集成學(xué)習(xí)方法,其基于分類回歸樹法,通過(guò)自助法隨機(jī)選擇向量產(chǎn)生大量的樹模型,最后也是通過(guò)平均這些模型得到預(yù)測(cè)值.這種方法的優(yōu)點(diǎn)是適用于變量數(shù)目非常大的場(chǎng)合,也可用于有相關(guān)自變量的問(wèn)題.支持向量機(jī)基于核函數(shù)的小樣本統(tǒng)計(jì)理論,確定不同類別之間的最優(yōu)超平面,所以這種方法只是利用了有限的樣本,可以避免過(guò)度擬合的問(wèn)題,其中根據(jù)不同數(shù)據(jù)集的特點(diǎn),核函數(shù)的選擇多樣包括線性、多項(xiàng)式、徑向基等.關(guān)于6種方法的更多信息可以閱讀文獻(xiàn)[12-13].
表3 6種機(jī)器學(xué)習(xí)方法Tab. 3 Six machine learning methods
需要強(qiáng)調(diào)的是,除了簡(jiǎn)單的線性模型外,大多數(shù)機(jī)器學(xué)習(xí)方法都可以調(diào)整至少1個(gè)參數(shù),以提高模型的預(yù)測(cè)效果.例如隨機(jī)森林法中樹節(jié)點(diǎn)預(yù)選的變量個(gè)數(shù),多元自適應(yīng)回歸樣條法中剪枝個(gè)數(shù)和交互作用級(jí)數(shù)等都可以變化.在本文給定的機(jī)器學(xué)習(xí)方法中,每個(gè)可變化參數(shù)均有10個(gè)可能值,采用交叉驗(yàn)證法確定每個(gè)可能值時(shí)的模型預(yù)測(cè)效果,預(yù)測(cè)效果用均方根誤差(root mean square error,RMSE)和決定系數(shù)(coefficient of determination,簡(jiǎn)寫為R2)表示.
交叉驗(yàn)證法的基本思想是,將數(shù)據(jù)集等分為k組,首先選取第1組作為測(cè)試集,其余k-1組數(shù)據(jù)作為訓(xùn)練集以得到模型,所得模型利用第1組測(cè)試集評(píng)估模型預(yù)測(cè)效果;然后,選定第2組為測(cè)試集,其余k-1組為訓(xùn)練集;這個(gè)過(guò)程重復(fù)k遍,得到k個(gè)模型的預(yù)測(cè)效果值,取平均后得到這個(gè)模型的最終預(yù)測(cè)值.本研究中取k為10的情況,稱為10折交叉驗(yàn)證法,也是機(jī)器學(xué)習(xí)方法中最常用的選擇[13].
均方根誤差和決定系數(shù)是表達(dá)模型精度的常用統(tǒng)計(jì)量[12].均方根誤差可視作模型的平均誤差,其優(yōu)點(diǎn)是與輸出變量有相同的單位.均方根誤差越小,表明模型預(yù)測(cè)效果越好.決定系數(shù)是模型中變量可以解釋的方差與總方差的比值,所以決定系數(shù)越大,表明模型精度越高.決定系數(shù)的取值位于0和1之間.
2.2 計(jì)算步驟
(1)確定機(jī)器學(xué)習(xí)方法中的變量及其變化范圍(表2).由于本研究是使變量在其變化范圍內(nèi)分布盡可能均勻,所以可取均勻分布.
(2)利用拉丁超立方(Latin hyper-cube)方法得到不同變量的組合,通常抽樣次數(shù)至少為變量的10倍,本次研究選取100次以保證計(jì)算結(jié)果收斂.拉丁超立方抽樣方法是一種在計(jì)算機(jī)仿真不確定性分析領(lǐng)域得到廣泛使用的方法,其主要特點(diǎn)是保證抽樣后的數(shù)據(jù)在空間內(nèi)保持均勻性,并且不同變量可指定為不同的概率密度函數(shù).
(3)利用R語(yǔ)言計(jì)算環(huán)境[14]生成EnergyPlus能耗模擬模型.R語(yǔ)言是免費(fèi)的數(shù)據(jù)分析和可視化軟件,具有非常強(qiáng)大的統(tǒng)計(jì)分析功能[14].由于本次研究分為5個(gè)城市,每個(gè)城市需要建立100個(gè)模型,總共需500個(gè)能耗模型,不可能手動(dòng)完成,所以利用R語(yǔ)言的文本編輯功能,自動(dòng)完成能耗模型的生成.
(4)運(yùn)行500個(gè)EnergyPlus模型,并用R語(yǔ)言收集計(jì)算結(jié)果.
(5)基于交叉驗(yàn)證方法選擇機(jī)器學(xué)習(xí)方法中的參數(shù),以確定其最優(yōu)模型.最后,分析比較這些不同模型的建筑能耗預(yù)測(cè)效果.本文中的所有統(tǒng)計(jì)計(jì)算均在R語(yǔ)言環(huán)境[14]中完成.
3.1 取暖能耗模型的比較
圖2為在5個(gè)城市中6種機(jī)器學(xué)習(xí)方法用于建立取暖能耗模型時(shí)的準(zhǔn)確性對(duì)比.圖2(a)是根據(jù)均方根誤差進(jìn)行評(píng)估.通過(guò)交叉驗(yàn)證法得到的均方根誤差越小,表明模型的預(yù)測(cè)精度越高.可以看出,根據(jù)自助多元自適應(yīng)回歸樣條法建立的取暖能耗模型,在哈爾濱、上海和廣州具有最高的準(zhǔn)確度,而隨機(jī)森林法在北京有最好的預(yù)測(cè)精度,多元自適應(yīng)回歸樣條法更適合昆明地區(qū).高斯過(guò)程和支持向量機(jī)有類似的精度,但與上述3種模型相比誤差較大.線性模型在這6種模型中預(yù)測(cè)精度最差.綜上所述,自助多元自適應(yīng)回歸樣條法的模型在不同地區(qū)均有很好的效果,可以作為最優(yōu)選擇,多元自適應(yīng)回歸樣條法和隨機(jī)森林法作為輔助模型,以進(jìn)一步確證取暖模型的預(yù)測(cè)效果.
圖2(b)是依據(jù)決定系數(shù)所得的計(jì)算結(jié)果,可得出類似的結(jié)論.通過(guò)交叉驗(yàn)證法得到的決定系數(shù)越大,表明模型精度越高.3種最好的模型是自助多元自適應(yīng)回歸樣條法、多元自適應(yīng)回歸樣條法和隨機(jī)森林法.
圖25 個(gè)氣候分區(qū)中辦公建筑取暖能耗模型準(zhǔn)確度對(duì)比Fig. 2Comparison of heating energy predicting accuracy by six machine learning methods in five cities
本文所采用的算法,不僅可以計(jì)算出不同能耗模型精度的點(diǎn)估計(jì),而且能得到這些模型的不確定性分布.圖3為將不同機(jī)器算法用于北京地區(qū)的采暖能耗模型的不確定性分布,圖中圓點(diǎn)代表模型精度的中位數(shù),變化區(qū)間表示95%,的可能變化范圍.由圖3可見(jiàn),根據(jù)圖2得到的3種性能較優(yōu)的模型,包括多元自適應(yīng)回歸樣條法、多元自適應(yīng)回歸樣條法和隨機(jī)森林法,不僅點(diǎn)估計(jì)值要好于其他3種性能較差的模型,而且其不確定性較小,進(jìn)一步表明這3種模型非常適用于建立我國(guó)不同區(qū)域建筑的取暖能耗模型.
圖3 北京地區(qū)6種機(jī)器學(xué)習(xí)方法的采暖能耗模型不確定性比較Fig. 3 Uncertainty of six machine learning approaches for predicting heating energy use in Beijing
3.2 制冷能耗模型的比較
圖4給出在5個(gè)不同氣候分區(qū)城市中6種機(jī)器學(xué)習(xí)方法用于預(yù)測(cè)制冷能耗時(shí)的精度對(duì)比.
圖4 5個(gè)氣候分區(qū)中辦公建筑制冷能耗模型準(zhǔn)確度對(duì)比Fig. 4 Comparison of cooling energy predicting accuracy by six machine learning methods in five cities
6種方法預(yù)測(cè)制冷能耗時(shí)的均方根誤差情況見(jiàn)圖4(a),除了昆明外,其他4個(gè)城市中預(yù)測(cè)精度最高的都是基于自助多元自適應(yīng)回歸樣條法所建立的模型.位于昆明的辦公建筑,精度最好的是依據(jù)多元自適應(yīng)回歸樣條法建立的模型,但與自助多元自適應(yīng)回歸樣條法相比,誤差相差較小.圖4(b)為根據(jù)決定系數(shù)計(jì)算出的6種模型的準(zhǔn)確度對(duì)比,與圖4(a)得出的結(jié)論類似,自助多元自適應(yīng)回歸樣條法是計(jì)算精度最好的機(jī)器學(xué)習(xí)方法.
由圖4也可看出,基于高斯過(guò)程、隨機(jī)森林和支持向量機(jī)的非參數(shù)回歸模型,與簡(jiǎn)單的線性模型相比,預(yù)測(cè)精度相差較小,表明線性模型的預(yù)測(cè)能力并不一定低于復(fù)雜的非參數(shù)模型,這與Tian等[8]根據(jù)校園建筑能耗的研究結(jié)果一致.另外,由于線性模型具有更好的解釋變量重要性及易于使用的優(yōu)點(diǎn),在建筑能耗研究中仍然具有重要的作用.
通過(guò)對(duì)比圖2和圖4可看出,取暖的決定系數(shù)要大于制冷的決定系數(shù).特別是對(duì)于3種性能較優(yōu)的模型(自助多元自適應(yīng)回歸樣條法、多元自適應(yīng)回歸樣條法和隨機(jī)森林法),取暖模型的決定系數(shù)接近于1.這表明相比辦公建筑中的取暖能耗,建筑外形與制冷能耗之間的相互關(guān)系要更加復(fù)雜,導(dǎo)致采用機(jī)器學(xué)習(xí)算法預(yù)測(cè)制冷能耗更加困難.由圖2(b)和圖4(b)還可發(fā)現(xiàn),線性模型與本研究中表現(xiàn)最好的自助多元自適應(yīng)回歸樣條法相比,取暖模型決定系數(shù)的提高比制冷模型要更加明顯.這也表明辦公建筑用于制冷時(shí)能耗變化的非線性關(guān)系要更加復(fù)雜.
圖5給出廣州地區(qū)6種機(jī)器學(xué)習(xí)方法用于制冷預(yù)測(cè)時(shí)模型精度95%,的變化區(qū)間.雖然不同機(jī)器學(xué)習(xí)方法的精度具有很多的相互重疊區(qū)域,但是多元自適應(yīng)回歸樣條法及其自助法(自助多元自適應(yīng)回歸樣條法)的性能明顯優(yōu)于其他4種機(jī)器學(xué)習(xí)方法.
圖5 廣州地區(qū)6種機(jī)器學(xué)習(xí)方法的制冷能耗模型不確定性比較Fig. 5Uncertainty of six machine learning approaches for predicting cooling energy use in Guangzhou
根據(jù)研究得到性能最佳的機(jī)器學(xué)習(xí)模型,由于其計(jì)算速度快,一次模型運(yùn)算時(shí)間小于1,s,非常適合于需要大量計(jì)算的能耗統(tǒng)計(jì)分析.例如,貝葉斯反演計(jì)算經(jīng)常需要上萬(wàn)次的模型計(jì)算,使用工程EnergyPlus模型,對(duì)于復(fù)雜建筑的1次模型計(jì)算通常至少需要1,min,因此貝葉斯方法很難直接用于建筑能耗反演分析中,但采用本文得到的機(jī)器學(xué)習(xí)模型,則可方便快捷地應(yīng)用貝葉斯方法進(jìn)行模型反演分析.
(1)機(jī)器學(xué)習(xí)方法適用于建立建筑的取暖和制冷能耗模型,建立的模型計(jì)算速度快,適用于需要大量模型計(jì)算的研究中,如不確定性和敏感性分析、貝葉斯分析和最優(yōu)化計(jì)算等.
(2)自助多元自適應(yīng)回歸樣條法、多元自適應(yīng)回歸樣條法和隨機(jī)森林法這3種方法適于我國(guó)不同氣候分區(qū)中建筑取暖能耗模型的預(yù)測(cè)中,計(jì)算精度高,而且誤差區(qū)間較小.自助多元自適應(yīng)回歸樣條法在不同氣候分區(qū)的制冷能耗模型中有最好的計(jì)算精度.綜合考慮取暖和制冷能耗,自助多元自適應(yīng)回歸樣條法有最好的模型預(yù)測(cè)效果.需要說(shuō)明的是,對(duì)其他類型的建筑,需要更多的研究確定此機(jī)器學(xué)習(xí)方法的適用性.
(3)與取暖能耗模型相比,制冷能耗與其影響因素之間有更加復(fù)雜的非線性關(guān)系,其模型預(yù)測(cè)要更困難.
[1] 清華大學(xué)建筑節(jié)能研究中心. 中國(guó)建筑節(jié)能年度發(fā)展研究報(bào)告:2015[M]. 北京:中國(guó)建筑工業(yè)出版社,2015.
[2] 張智超,李振亮,李亞,等. 鏈牽引式外遮陽(yáng)百葉窗結(jié)構(gòu)設(shè)計(jì)及其性能分析[J]. 天津科技大學(xué)學(xué)報(bào),2013,28(6):52-55.
[3] 謝繼紅,喬木,陳東,等. 利用工質(zhì)設(shè)計(jì)實(shí)現(xiàn)制冷熱泵近卡諾循環(huán)的分析[J]. 天津科技大學(xué)學(xué)報(bào),2006,21(1):79-83.
[4] Tian W. A review of sensitivity analysis methods in building energy analysis[J]. Renewable and Sustainable Energy Reviews,2013,20:411-420.
[5] Capozzoli A,Grassi D,Causone F. Estimation models of heating energy consumption in schools for local authorities planning[J]. Energy and Buildings,2015,105:302-313.
[6] Le K,Bourdais R,Gueguen H. From hybrid model predictive control to logical control for shading system:A support vector machine approach[J]. Energy and Buildings,2014,84:352-359.
[7] Tian W,Choudhary R. A probabilistic energy model for non-domestic building sectors applied to analysis of school buildings in greater London[J]. Energy and Buildings,2012,54:1-11.
[8] Tian W,Choudhary R,Augenbroe G,et al. Importance analysis and meta-model construction with correlated variables in evaluation of thermal performance of campus buildings[J]. Building and Environment,2015,92:61-74.
[9] 中國(guó)氣象局氣象信息中心氣象資料室,清華大學(xué)建筑技術(shù)科學(xué)系. 中國(guó)建筑熱環(huán)境分析專用氣象數(shù)據(jù)集[M]. 北京:中國(guó)建筑工業(yè)出版社,2005.
[10] 中華人民共和國(guó)建設(shè)部,中華人民共和國(guó)國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局. GB 50189—2005 公共建筑節(jié)能設(shè)計(jì)標(biāo)準(zhǔn)[S]. 北京:中國(guó)建筑工業(yè)出版社,2005.
[11] U. S. Department of Energy. EnergyPlus V8.3[R]. Washington:U. S. Department of Energy,2015.
[12] Hastie T,Tibshirani R,F(xiàn)riedman J. The Elements of Statistical Learning:Data Mining,Inference,and Prediction[M]. 2nd ed. New York:Springer-Verlag,2009.
[13] Kuhn M,Johnson K. Applied Predictive Modeling[M]. New York:Springer-Verlag,2013.
[14] R Development Core Team. R:A language and environment for statistical computing[EB/OL]. [2015-10-14]. http://www.R-project.org/.
責(zé)任編輯:常濤
Building Energy Models Based on Machine Learning Methods
TIAN Wei1,WEI Lai1,LI Zhanyong1,MENG Qingxin2,SONG Jitian1,YANG Song1
(1.Tianjin Key Laboratory of Integrated Design and On-line Monitoring for the Light Industry and Food Engineering Machinery and Equipment,College of Mechanical Engineering,Tianjin University of Science & Technology,Tianjin 300222,China;2.Logistics Group,Tianjin University of Science & Technology,Tianjin 300222,China)
This paper focuses on a comparison of predicting accuracy of six different machine learning approaches for estimating energy use in office buildings,including linear regression,GP(Gaussian process),MARS(multivariate adaptive regression splines),bagging MARS,RF(random forest) and SVM(support vector machine).The results indicate that three methods(Bagging MARS,MARS,and RF)have better accuracy in predicting heating energy,whereas the bagging MARS performs best in estimating cooling energy.It is also found out that the prediction of cooling energy is more difficult than that of heating energy in office buildings.These conclusions can be used to provide some reference for machine learning method choosing in building energy assessment.Moreover,the models obtained from this research can also be used to create a building stock model at urban scales.
building energy saving;energy model;machine learning;model accuracy
TU17
A
1672-6510(2016)03-0054-06
10.13364/j.issn.1672-6510.20150158
2015-10-14;
2015-12-07
天津市應(yīng)用基礎(chǔ)與前沿技術(shù)研究計(jì)劃資助項(xiàng)目(14JCYBJC42600);教育部留學(xué)回國(guó)人員科研啟動(dòng)基金資助項(xiàng)目
田 瑋(1975—),男,山西太谷人,教授,weitian@tust.edu.cn.
數(shù)字出版日期:2016-03-02;數(shù)字出版網(wǎng)址:http://www.cnki.net/kcms/detail/12.1355.N.20160302.1741.002.html.