周璇 王馨瑤 閆軍威 雷尚鵬 梁列全
基于機(jī)器學(xué)習(xí)的建筑復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài)異常檢測
周璇1王馨瑤1閆軍威1雷尚鵬1梁列全2
(1. 華南理工大學(xué) 機(jī)械與汽車工程學(xué)院,廣東 廣州 510640;2. 廣東財(cái)經(jīng)大學(xué) 信息學(xué)院,廣東 廣州 510320)
建筑復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài)的異常檢測研究對建筑安全穩(wěn)定、高效節(jié)能運(yùn)行具有重要意義,但是由于受到建筑外部環(huán)境因素繁多、內(nèi)部人行為的不確定性、設(shè)備運(yùn)行數(shù)據(jù)復(fù)雜等多方面因素的影響,其異常運(yùn)行狀態(tài)的檢測存在信息特征提取困難、運(yùn)行異常狀態(tài)難以界定等問題。本研究在運(yùn)行參數(shù)分類的基礎(chǔ)上,利用信息熵對不確定性的定量化描述與無監(jiān)督學(xué)習(xí)的適應(yīng)性,提出基于信息熵并融合-均值聚類與自組織映射模型的復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài)二次聚類異常檢測方法。針對夏熱冬暖地區(qū)某大型辦公建筑中央空調(diào)系統(tǒng)的實(shí)際監(jiān)測數(shù)據(jù),通過-均值聚類對外部參數(shù)進(jìn)行初次聚類并劃分一次工況、計(jì)算各工況下子系統(tǒng)運(yùn)行參數(shù)的信息熵、自組織映射模型二次聚類判定異常運(yùn)行狀態(tài)等步驟,實(shí)現(xiàn)建筑復(fù)雜用能系統(tǒng)的運(yùn)行狀態(tài)異常檢測。結(jié)果表明,本研究提出的方法在單主機(jī)運(yùn)行工況下的平均類內(nèi)異常檢測正確率(簡稱類內(nèi)異常檢測率)為97.45%,雙主機(jī)運(yùn)行工況下的類內(nèi)異常檢測率為96.70%。此外,本研究針對不同工況中類數(shù)量與類內(nèi)異常率相關(guān)指標(biāo)之間的關(guān)系展開進(jìn)一步的討論與分析,得出結(jié)論:單、雙主機(jī)的類內(nèi)異常檢測率隨著其所在類內(nèi)運(yùn)行狀態(tài)總數(shù)的減少而升高。本研究為建筑能源大數(shù)據(jù)背景下的復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài)異常檢測提供了新的系統(tǒng)化思路與方法。
復(fù)雜用能系統(tǒng);信息熵;-均值聚類;自組織映射模型;異常檢測
建筑節(jié)能減排是我國實(shí)現(xiàn)“30.60”“碳達(dá)峰”與“碳中和”目標(biāo)的重要途徑。建筑能耗占我國當(dāng)前總能耗的40%[1],建筑運(yùn)行過程中,不當(dāng)?shù)目刂撇呗曰虿缓侠淼挠媚苄袨榭赡軐?dǎo)致16%的住宅建筑能源浪費(fèi)[2]、15%~30%的辦公建筑能源浪費(fèi)[3]。有效檢測建筑復(fù)雜用能系統(tǒng)的異常運(yùn)行狀態(tài)是實(shí)現(xiàn)建筑安全、高效、節(jié)能運(yùn)行的關(guān)鍵。
建筑復(fù)雜用能系統(tǒng)是指滿足建筑正常運(yùn)行、維護(hù)等需求所使用的電氣、通風(fēng)、空調(diào)等多臺(tái)設(shè)備聯(lián)鎖工作構(gòu)成的復(fù)雜系統(tǒng),其運(yùn)行狀態(tài)受到室外環(huán)境參數(shù)、室內(nèi)人員數(shù)量、室內(nèi)人員用能習(xí)慣等多方面因素影響,需要多個(gè)相互耦合、相互約束的運(yùn)行參數(shù)進(jìn)行表征[4]。此類復(fù)雜系統(tǒng)主要以消耗電力能耗為主,且涉及多個(gè)設(shè)備的運(yùn)行參數(shù),參數(shù)的度量單位、采集周期可能各不相同,造成參數(shù)的量化尺度存在多樣性。并且,此類復(fù)雜設(shè)備能耗受人行為的隨機(jī)性影響較大,其異常狀態(tài)多數(shù)情況下僅表現(xiàn)為能耗或部分運(yùn)行參數(shù)與正常值的偏離,難以對異常運(yùn)行狀態(tài)進(jìn)行量化。現(xiàn)有復(fù)雜用能系統(tǒng)異常運(yùn)行狀態(tài)的檢測大多依賴運(yùn)維人員的經(jīng)驗(yàn),機(jī)器學(xué)習(xí)理論的提出與建筑能源管理系統(tǒng)的建設(shè)大大推動(dòng)了建筑復(fù)雜用能系統(tǒng)異常運(yùn)行狀態(tài)檢測技術(shù)的快速發(fā)展。
建筑能源管理系統(tǒng)指通過各種傳感器采集建筑運(yùn)行的分類分項(xiàng)能耗、設(shè)備運(yùn)行參數(shù)和環(huán)境參數(shù)等大量數(shù)據(jù),實(shí)現(xiàn)建筑能源可視化、運(yùn)行狀態(tài)在線監(jiān)測與分析等功能的系統(tǒng),為建筑管理者提供了建筑節(jié)能監(jiān)管的有效平臺(tái)[5]。截至2017年,我國有33個(gè)省市已建成大型公共建筑的能耗實(shí)時(shí)監(jiān)測系統(tǒng)[6],為開展復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài)異常檢測工作提供了有效的數(shù)據(jù)支撐。
本研究述及的建筑復(fù)雜用能系統(tǒng)的運(yùn)行狀態(tài)采用多個(gè)參數(shù)表征,其異常運(yùn)行狀態(tài)定義為:在滿足建筑正常使用需求的前提下,表征系統(tǒng)運(yùn)行狀態(tài)的能耗及其各參數(shù)與歷史數(shù)據(jù)存在明顯差異的狀態(tài)。
20世紀(jì),經(jīng)驗(yàn)規(guī)則方法、模擬建模方法在建筑運(yùn)行狀態(tài)異常檢測領(lǐng)域占據(jù)主導(dǎo)地位[7]。經(jīng)驗(yàn)規(guī)則方法[8-9]大多是根據(jù)專家經(jīng)驗(yàn)設(shè)定異常檢測的閾值或歷史數(shù)據(jù)提取異常特征。該方法建立在先驗(yàn)知識(shí)的基礎(chǔ)上,需要人為介入,具有較高的異常識(shí)別率,但識(shí)別、診斷、處理的效率較低,系統(tǒng)難以及時(shí)反饋。模擬建模方法則通過軟件模擬建筑內(nèi)復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài),利用模擬結(jié)果進(jìn)行定性或定量的異常檢測,其優(yōu)點(diǎn)在于剖析全面、異常因果清晰,但建模過程復(fù)雜,耗時(shí)長,局限性較大[10-11]。隨著數(shù)據(jù)量的增加,機(jī)器學(xué)習(xí)方法逐漸應(yīng)用于建筑復(fù)雜用能設(shè)備運(yùn)行狀態(tài)異常檢測,并在近十年內(nèi)發(fā)展迅猛。該方法針對異常檢測的目標(biāo)進(jìn)行問題規(guī)劃,在大量數(shù)據(jù)的基礎(chǔ)上,提取時(shí)間或空間維度的模式特征,進(jìn)而區(qū)分正常模式與異常模式[12]。
表1所示文獻(xiàn)大多將建筑復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài)的異常檢測流程分為3步:第1步是數(shù)據(jù)降維特征選擇,高維數(shù)據(jù)經(jīng)降維處理后選擇或合成有效變量,提取數(shù)據(jù)的有效特征;第2步是模式劃分與基準(zhǔn)建立,選擇正常運(yùn)行數(shù)據(jù)的有效變量表征方法,將模式進(jìn)行劃分,并建立相應(yīng)的異常檢測基準(zhǔn);第3步是異常狀態(tài)檢測,選擇合適的分類器對運(yùn)行數(shù)據(jù)進(jìn)行異常標(biāo)記,實(shí)現(xiàn)異常狀態(tài)檢測。建筑復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài)異常檢測的現(xiàn)有研究以知識(shí)發(fā)現(xiàn)為主,旨在為設(shè)備安全、節(jié)能運(yùn)行與控制提供保障,仍處于初期探索階段。
表1 多變量建筑復(fù)雜用能系統(tǒng)的異常檢測相關(guān)文獻(xiàn)比較
針對復(fù)雜用能系統(tǒng)運(yùn)行數(shù)據(jù)存在數(shù)據(jù)維度差別較大、異常狀態(tài)難以界定、異常狀態(tài)等級難以劃分、特征提取困難等問題,本研究擬在建筑能源管理系統(tǒng)(BEMS)采集數(shù)據(jù)的基礎(chǔ)上,提取復(fù)雜系統(tǒng)監(jiān)測參數(shù)的信息熵特征,采用-均值聚類算法劃分復(fù)雜運(yùn)行工況,建立各工況下系統(tǒng)運(yùn)行狀態(tài)信息熵向量的二次聚類自組織映射模型,最終通過夏熱冬暖地區(qū)某建筑中央空調(diào)系統(tǒng)的運(yùn)行數(shù)據(jù)驗(yàn)證方法的準(zhǔn)確性。
本研究提出的建筑復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài)異常檢測方法流程如圖1所示,主要流程分為3個(gè)步驟:
圖1 BEMS異常檢測流程
1)數(shù)據(jù)降維與特征選擇
為解決運(yùn)行參數(shù)種類多、關(guān)聯(lián)復(fù)雜的問題,將監(jiān)測參數(shù)細(xì)分為4類參數(shù),包括環(huán)境參數(shù)、設(shè)備參數(shù)、運(yùn)行參數(shù)和其他參數(shù),并采用Z-SCORE方法對數(shù)據(jù)標(biāo)準(zhǔn)化,以解決不同數(shù)據(jù)量綱差異的問題。
2)模式劃分與基準(zhǔn)建立
考慮建筑復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài)受外界環(huán)境條件和室內(nèi)人行為影響,模式劃分以環(huán)境參數(shù)和設(shè)備參數(shù)為基礎(chǔ),結(jié)合Silhouette指標(biāo)和-均值聚類算法對設(shè)備運(yùn)行工況進(jìn)行分類。
3)異常狀態(tài)檢測
異常狀態(tài)的檢測本質(zhì)上是規(guī)律提取的過程,自組織映射算法通過對輸入樣本與目標(biāo)值之間的相近神經(jīng)元進(jìn)行調(diào)整,達(dá)到利用信息關(guān)聯(lián)性自適應(yīng)調(diào)整網(wǎng)絡(luò)的目標(biāo)。本研究通過信息熵與自組織映射模型的結(jié)合,實(shí)現(xiàn)異常類別的分離與檢測,并對結(jié)果進(jìn)行分析與討論。
BEMS采集的復(fù)雜用能系統(tǒng)運(yùn)行數(shù)據(jù)大多為高維數(shù)據(jù),存在特征參數(shù)之間具有強(qiáng)相關(guān)性、數(shù)據(jù)集可能存在的屬性冗余等問題,易造成建模過程復(fù)雜,擬討論在保留原始特征參數(shù)信息基礎(chǔ)上的高維問題的低維表征方法。常用的方法有信息熵、相關(guān)性分析、序列分解等。
信息熵作為一種對系統(tǒng)復(fù)雜程度和無序性進(jìn)行度量的指標(biāo),具有量化不確定信息的特性,在異常狀態(tài)特征提取、異常檢測領(lǐng)域[23]、故障程度判別[24]等領(lǐng)域,取得了較好的識(shí)別和診斷效果。本研究利用信息熵提取復(fù)雜用能系統(tǒng)多維監(jiān)測參數(shù)特征。信息熵值的大小與系統(tǒng)信息的不確定程度呈正相關(guān)性[23],熵值越大,系統(tǒng)混亂程度越高,熵值越小,系統(tǒng)穩(wěn)定程度越高。
考慮到復(fù)雜設(shè)備運(yùn)行狀態(tài)受建筑外部參數(shù)與內(nèi)部參數(shù)影響,不同運(yùn)行工況下的差異較大,為提高異常檢測精度,擬對系統(tǒng)運(yùn)行工況進(jìn)行劃分,以降低同一工況狀態(tài)之間的差異性。機(jī)器學(xué)習(xí)算法中常用于工況劃分的方法包括-均值聚類、決策樹等。
-均值聚類算法通過度量數(shù)據(jù)集中的距離差異性,實(shí)現(xiàn)類間分離,具有響應(yīng)速度快、可靠性高的優(yōu)點(diǎn)[25],多用于異常檢測[26]、故障診斷[27]等工作的前期數(shù)據(jù)處理與工況劃分。本研究采用-均值聚類算法對復(fù)雜用能系統(tǒng)工況影響較大的外部參數(shù)進(jìn)行初步聚類,得到不同氣象參數(shù)及人行為影響下的不同工況,再結(jié)合設(shè)備運(yùn)行參數(shù)實(shí)現(xiàn)工況的二次劃分。
3)比較樣本與類中心的距離,并將該樣本分至最小距離類別,重復(fù)計(jì)算所有樣本點(diǎn);
5)若類中心所處的位置再次改變且未達(dá)到計(jì)算閾值,則重復(fù)進(jìn)行步驟2)-4)。
建筑復(fù)雜用能系統(tǒng)的運(yùn)行狀態(tài)受外界噪聲干擾與不確定人行為的影響,其異常狀態(tài)檢測的準(zhǔn)確性依賴于模型對數(shù)據(jù)抽象特征的提取能力。由于復(fù)雜設(shè)備運(yùn)行參數(shù)繁多,且異常運(yùn)行狀態(tài)并無統(tǒng)一定義,現(xiàn)有研究大多采用神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等模型實(shí)現(xiàn)異常狀態(tài)的分類檢測。
自組織映射(SOM)算法可以實(shí)現(xiàn)無規(guī)律的數(shù)據(jù)處理與聚類,具有分類能力強(qiáng)、分類泛化性能好、過程可視化等特點(diǎn),在電力設(shè)備數(shù)據(jù)挖掘[28]、異常檢測[29]等領(lǐng)域已得到廣泛應(yīng)用。本研究擬采用SOM模型對不同工況的信息熵特征進(jìn)行二次聚類,以區(qū)分異常運(yùn)行狀態(tài)。SOM算法訓(xùn)練過程中獲勝神經(jīng)元及其臨近范圍的其他神經(jīng)元均將進(jìn)行權(quán)值調(diào)整[30],確保算法的學(xué)習(xí)效果,結(jié)構(gòu)見圖2。
圖2 自組織映射算法原理結(jié)構(gòu)
本研究以某夏熱冬暖地區(qū)辦公建筑的中央空調(diào)系統(tǒng)為對象,驗(yàn)證所提出方法的有效性。設(shè)備配置信息見表2。
表2 設(shè)備配置信息
該建筑面積為87 000 ㎡,2015年建成了建筑能耗監(jiān)管與空調(diào)節(jié)能控制系統(tǒng),可采集建筑分類分項(xiàng)能耗數(shù)據(jù)與空調(diào)系統(tǒng)運(yùn)行數(shù)據(jù)。本研究利用系統(tǒng)采集的2017年1月1日至2018年12月31日的數(shù)據(jù)集驗(yàn)證復(fù)雜設(shè)備運(yùn)行狀態(tài)異常檢測方法的有效性,數(shù)據(jù)集共105 535條數(shù)據(jù),采集周期為150 s。
3.2.1監(jiān)測參數(shù)分類
監(jiān)測參數(shù)種類繁雜,且參數(shù)之間相互耦合,參數(shù)大小存在較大差異。根據(jù)國家標(biāo)準(zhǔn)[31]與相關(guān)文獻(xiàn)[32],將建筑復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài)監(jiān)測數(shù)據(jù)分為外部參數(shù)和內(nèi)部參數(shù)兩大類,其中外部參數(shù)指系統(tǒng)外界環(huán)境參數(shù)、室內(nèi)人數(shù),以及人行為等參數(shù);內(nèi)部參數(shù)指系統(tǒng)內(nèi)部參數(shù),如設(shè)備數(shù)量、設(shè)備運(yùn)行狀態(tài)等。進(jìn)一步細(xì)分為環(huán)境參數(shù)、其他參數(shù)、設(shè)備參數(shù)、運(yùn)行參數(shù)4類,監(jiān)測參數(shù)耦合關(guān)系如圖3所示。
圖3 復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài)監(jiān)測參數(shù)耦合關(guān)系
本研究的對象為中央空調(diào)系統(tǒng),系統(tǒng)監(jiān)測參數(shù)如表3所示,參數(shù)說明如下:
1)環(huán)境參數(shù),主要包括溫度、相對濕度、光照強(qiáng)度等外界環(huán)境參數(shù),其中,干球溫度和相對濕度直接影響室內(nèi)環(huán)境熱舒適性和中央空調(diào)系統(tǒng)的能耗與運(yùn)行狀態(tài)。因此,本研究采用室外干球溫度和相對濕度作為外部環(huán)境參數(shù);
2)設(shè)備參數(shù),主要指設(shè)備型號(hào)與設(shè)備數(shù)量等設(shè)備配置,如中央空調(diào)系統(tǒng)制冷主機(jī)設(shè)備數(shù)量等。該參數(shù)決定設(shè)備之間的匹配程度,對系統(tǒng)運(yùn)行能耗和能效影響較大。本研究采用的設(shè)備參數(shù)包括4類設(shè)備類別,24臺(tái)設(shè)備,設(shè)備明細(xì)見表3;
表3 動(dòng)態(tài)監(jiān)測參數(shù)分類及數(shù)量
3)運(yùn)行參數(shù),主要指反映設(shè)備運(yùn)行狀態(tài)的運(yùn)行參數(shù),其中制冷主機(jī)運(yùn)行參數(shù)包括冷凍水供回水溫度、冷卻水進(jìn)出口溫度等共15項(xiàng)參數(shù),冷凍水泵、冷卻水泵、冷卻塔風(fēng)機(jī)運(yùn)行參數(shù)包括頻率、實(shí)時(shí)功率兩項(xiàng)參數(shù),這些參數(shù)直接反映了設(shè)備的運(yùn)行狀態(tài)以及能耗特征;
4)其他參數(shù),主要指影響建筑運(yùn)行能耗的人行為相關(guān)參數(shù),如室內(nèi)人數(shù)、室內(nèi)人員行為等參數(shù),該參數(shù)直接影響復(fù)雜用能系統(tǒng)能耗,但存在較大的波動(dòng)性與不確定性,難以直接獲取。冷凍水供回水壓差傳感器安裝于總管處,受管網(wǎng)沿程阻力、末端開啟程度影響。本研究參照文獻(xiàn)[33]通過總管冷凍水供回水壓差間接表征人行為因素對建筑運(yùn)行的影響。
3.2.2數(shù)據(jù)標(biāo)準(zhǔn)化
上述監(jiān)測參數(shù)存在量綱與數(shù)量級的差異,需要采用適當(dāng)?shù)臉?biāo)準(zhǔn)化方法將原始數(shù)據(jù)映射到相同標(biāo)準(zhǔn)下進(jìn)行建模處理,常用數(shù)據(jù)標(biāo)準(zhǔn)化方法有Z-SCORE方法,如式(2)所示:
3.3.1基于Silhouette的聚類簇確定
建筑復(fù)雜用能系統(tǒng)運(yùn)行狀態(tài)受外部因素影響較大,首先采用-均值聚類方法對外部參數(shù)進(jìn)行聚類,劃分出不同氣象條件及人行為因素影響下的設(shè)備運(yùn)行工況。-均值聚類算法的難點(diǎn)在于確定聚類簇?cái)?shù),本研究采用Silhouette指標(biāo)確定聚類簇?cái)?shù),指標(biāo)數(shù)值越大,表明聚類效果越好,即簇內(nèi)相關(guān)性和簇間差異性顯著,該指標(biāo)計(jì)算公式為
如圖5所示,通過外部參數(shù)聚類的方法得到的Ⅰ-Ⅴ類設(shè)備運(yùn)行工況劃分,由于外部參數(shù)直接受到環(huán)境以及人行為的影響,因此聚類出來的不同工況反映了不同外部條件下主機(jī)的負(fù)荷狀態(tài)。第Ⅳ類設(shè)備運(yùn)行工況內(nèi)部聯(lián)系最為緊密,取值范圍最為集中,處于均值附近區(qū)間,符合建筑所處的夏熱冬暖氣候區(qū)空調(diào)季溫高濕重的特點(diǎn)。第Ⅴ類設(shè)備運(yùn)行工況中,溫度、濕度、壓差三者的變化呈現(xiàn)出離散程度高、幅度范圍較大的數(shù)據(jù)特性,明顯區(qū)分于第Ⅰ類至第Ⅳ類數(shù)據(jù),因此確定第Ⅴ類設(shè)備運(yùn)行工況屬于外部環(huán)境參數(shù)變化異常的運(yùn)行工況,需要運(yùn)維人員特別關(guān)注。
圖4 聚類范圍內(nèi)的Silhouette指標(biāo)值變化
圖5 外部參數(shù)聚類結(jié)果
3.3.2設(shè)備運(yùn)行工況劃分結(jié)果分析
設(shè)備運(yùn)行工況與外部參數(shù)密切相關(guān),而中央空調(diào)系統(tǒng)在實(shí)際運(yùn)行中,存在著制冷主機(jī)運(yùn)行數(shù)量的多重匹配問題。本節(jié)結(jié)合制冷主機(jī)運(yùn)行數(shù)量的不同,將設(shè)備運(yùn)行工況進(jìn)一步劃分為單主機(jī)運(yùn)行與多主機(jī)運(yùn)行,最終得到10類系統(tǒng)運(yùn)行工況,結(jié)果見圖6。
圖6 建筑中不同主機(jī)運(yùn)行數(shù)量下的設(shè)備運(yùn)行工況數(shù)據(jù)分布
本文研究對象的冷源系統(tǒng)主機(jī)采用“三用一備”形式,現(xiàn)有運(yùn)行情況表明常見運(yùn)行工況為單主機(jī)和雙主機(jī)運(yùn)行工況。三主機(jī)運(yùn)行工況僅發(fā)生在緊急會(huì)議等臨時(shí)性需求需要迅速降低冷凍水出水溫度時(shí)。三主機(jī)運(yùn)行工況的數(shù)據(jù)記錄為65條,僅占總體數(shù)量0.062%,4臺(tái)冷水機(jī)組全部開啟的運(yùn)行工況未出現(xiàn)??紤]三主機(jī)運(yùn)行工況發(fā)生概率極低,且數(shù)據(jù)量過少難以實(shí)現(xiàn)精準(zhǔn)建模,本研究舍棄此類數(shù)據(jù),剩余數(shù)據(jù)總量為105 470條。其中單主機(jī)運(yùn)行數(shù)據(jù)68 398條,占比64.85%;雙主機(jī)運(yùn)行數(shù)據(jù)37 072條,占比35.15%。不同數(shù)量主機(jī)運(yùn)行下的設(shè)備運(yùn)行工況數(shù)據(jù)分布如圖6所示。針對不同運(yùn)行主機(jī)數(shù)量的各設(shè)備運(yùn)行數(shù)據(jù)采用Z-SCORE方法處理,得到各工況下的無量綱數(shù)據(jù),見表4。
表4 各工況下的數(shù)據(jù)分布
3.4.1子系統(tǒng)信息熵計(jì)算與分析
中央空調(diào)系統(tǒng)由多個(gè)子系統(tǒng)構(gòu)成,本節(jié)考慮實(shí)際將子系統(tǒng)分為4類,分別為制冷主機(jī)類、冷凍水泵類、冷卻水泵類、冷卻塔類。結(jié)合第2.1節(jié)信息熵計(jì)算過程,針對不同子系統(tǒng)、不同運(yùn)行工況下分別進(jìn)行信息熵特征計(jì)算,過程如下:
4)各子系統(tǒng)信息熵值計(jì)算與整合。設(shè)備參數(shù)共由4類設(shè)備構(gòu)成,由于不同設(shè)備間參數(shù)數(shù)量、變化范圍不同,通過每一類設(shè)備的運(yùn)行參數(shù)進(jìn)行信息熵值的求解,最終得到各子系統(tǒng)10種工況運(yùn)行狀態(tài)的表征向量。
表5 各工況下子系統(tǒng)運(yùn)行參數(shù)的信息熵取值范圍
根據(jù)第2.1節(jié)可知,制冷主機(jī)類信息熵值普遍高于其他類型子系統(tǒng),符合制冷主機(jī)類設(shè)備采集參數(shù)繁多、狀態(tài)向量構(gòu)成復(fù)雜的特點(diǎn)。整體來看,各類子系統(tǒng)信息熵區(qū)間長度較原始數(shù)據(jù)更為集中,但仍存在取值范圍交叉的現(xiàn)象,需要進(jìn)一步利用SOM模型進(jìn)行異常檢測。
3.4.2基于SOM算法的異常運(yùn)行狀態(tài)分類
SOM模型用于提取各子系統(tǒng)中信息熵構(gòu)成的數(shù)值矩陣中隱含的類別信息,將10種系統(tǒng)運(yùn)行工況的運(yùn)行狀態(tài)表征向量分別構(gòu)建SOM模型,并將其可視化以便于異常類區(qū)分,具體步驟如下:
圖7(a)示出了不同工況下多數(shù)類神經(jīng)元與少數(shù)類神經(jīng)元的數(shù)量差距,藍(lán)色空間占據(jù)越多,說明該情況的出現(xiàn)頻率越高,反之,白色空間體現(xiàn)了少數(shù)類的異常情況。圖7(b)展現(xiàn)了神經(jīng)元之間的連接關(guān)系。無論單、雙主機(jī)運(yùn)行,各子系統(tǒng)工況下少數(shù)類神經(jīng)元與多數(shù)類神經(jīng)元之間連接顏色較深,表示模型在映射到二維平面的過程中,少數(shù)類神經(jīng)元與多數(shù)類神經(jīng)元的權(quán)向量差異較大,符合異常數(shù)據(jù)特性。圖7顯示單主機(jī)運(yùn)行工況中,各系統(tǒng)工況的多數(shù)類與少數(shù)類間的數(shù)量差別較為明顯,少數(shù)類易于辨識(shí)。但圖8的多數(shù)類中出現(xiàn)了第Ⅱ類、第Ⅴ類少數(shù)類不唯一的現(xiàn)象,原因?yàn)橐陨蟽深惞r下的數(shù)據(jù)量相對其他工況較少,存在樣本量的局限性,可以通過結(jié)合神經(jīng)元間權(quán)值相似度進(jìn)行判定,如第Ⅱ類4號(hào)神經(jīng)元與其他神經(jīng)元權(quán)值差別較大,第Ⅴ類2號(hào)神經(jīng)元權(quán)值差別較大,因此以上兩類的少數(shù)類分別為4號(hào)和2號(hào)神經(jīng)元。
圖7 單主機(jī)SOM二次運(yùn)行狀態(tài)分類結(jié)果
圖8 雙主機(jī)SOM二次運(yùn)行狀態(tài)分類結(jié)果
SOM模型分類結(jié)果中的少數(shù)類判定為異常運(yùn)行狀態(tài),通過將模型判定結(jié)果與BEMS報(bào)警記錄、現(xiàn)場檢修記錄、實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行人工逐一比對,檢驗(yàn)異常檢測結(jié)果的正確性,驗(yàn)證結(jié)果見表6。
表6 少數(shù)類異常檢測結(jié)果
結(jié)合表6可得,SOM模型二次分類所得少數(shù)類單、雙主機(jī)工況平均類內(nèi)異常檢測率為97.07%,單臺(tái)機(jī)運(yùn)行工況下平均類內(nèi)異常檢測率為97.45%,雙臺(tái)機(jī)運(yùn)行工況下平均類內(nèi)異常檢測率為96.70%,均達(dá)到較高的類內(nèi)異常檢測率。單臺(tái)主機(jī)與雙臺(tái)主機(jī)的第Ⅴ類工況類內(nèi)異常檢測率均達(dá)到100%,得出第Ⅴ類工況為異常運(yùn)行工況的結(jié)論,證明異常數(shù)據(jù)在數(shù)據(jù)分布上與正常數(shù)據(jù)具有明顯差異性,解釋了該工況下數(shù)據(jù)量少、數(shù)據(jù)變化區(qū)間大的產(chǎn)生原因,驗(yàn)證了-均值聚類工況劃分以優(yōu)化類內(nèi)異常檢測率的必要性。
為深入探究異常檢測率的影響因素,分析了單、雙主機(jī)運(yùn)行工況下的類內(nèi)異常檢測率與與類內(nèi)運(yùn)行狀態(tài)向量總數(shù)、少數(shù)類占總數(shù)比例的關(guān)系,如圖9、圖10所示。
圖9 單臺(tái)主機(jī)運(yùn)行工況少數(shù)類內(nèi)異常檢測率的變化
圖10 雙臺(tái)主機(jī)運(yùn)行工況少數(shù)類內(nèi)異常檢測率的變化
由圖9(a)、10(a)可見,單、雙主機(jī)少數(shù)類內(nèi)異常檢測率隨著其所在類內(nèi)運(yùn)行狀態(tài)向量總數(shù)的減少而升高。
由圖9(b)可知,對于單主機(jī)運(yùn)行工況,少數(shù)類內(nèi)異常檢測率隨其數(shù)量在總量中所占的比例的降低而增加,這是由于少數(shù)類占總數(shù)比例低,異常特征提取效率提升,能夠被準(zhǔn)確地以最低的數(shù)量成本辨識(shí)。而對比雙主機(jī)運(yùn)行工況,由于雙主機(jī)運(yùn)行可完全滿足建筑冷量需求,少數(shù)類內(nèi)在總量中所占的比例較為穩(wěn)定。其中,系統(tǒng)第Ⅴ類工況下運(yùn)行狀態(tài)向量總數(shù)量僅為 9 條,因此呈現(xiàn)出少數(shù)類占總數(shù)比例較大的現(xiàn)象。對于雙主機(jī)運(yùn)行工況,少數(shù)類內(nèi)異常檢測率隨著少數(shù)類占比的增加而增加。
本研究提出了一種基于信息熵和二次聚類的建筑復(fù)雜用能系統(tǒng)異常運(yùn)行狀態(tài)檢測方法,并采用夏熱冬暖地區(qū)某辦公建筑中央空調(diào)系統(tǒng)數(shù)據(jù)進(jìn)行方法驗(yàn)證,得出主要結(jié)論如下:
(1)經(jīng)過-均值聚類算法劃分運(yùn)行工況后,采用信息熵與SOM模型進(jìn)行異常特征提取,聚類的效果良好,各工況平均類內(nèi)異常檢測率達(dá)97.07%,部分運(yùn)行工況下的類內(nèi)異常檢測率可達(dá)100%;
(2)制冷主機(jī)運(yùn)行數(shù)量的不同導(dǎo)致類內(nèi)異常檢測率存在一定差異,單主機(jī)運(yùn)行過程異常特征檢測較為準(zhǔn)確,各工況平均類內(nèi)異常檢測率為97.45%;
(3)不同系統(tǒng)工況下,類內(nèi)異常檢測率隨其所在類運(yùn)行狀態(tài)向量的減少而逐漸增加,在系統(tǒng)工況的少數(shù)類內(nèi)異常檢測率較高,受外部參數(shù)影響較為明顯。
本研究提出的基于二次聚類的復(fù)雜用能系統(tǒng)異常檢測方法,嘗試解決復(fù)雜用能系統(tǒng)異常運(yùn)行狀態(tài)檢測過程中存在的設(shè)備運(yùn)行狀態(tài)耦合、特征提取困難、異常狀態(tài)難以界定等問題。后續(xù)工作將在此基礎(chǔ)上,嘗試識(shí)別具體故障類型,并提出對應(yīng)的措施,為建筑安全運(yùn)行與節(jié)能減排提供有效解決方案。
[1] 中國建筑節(jié)能協(xié)會(huì).中國建筑能耗研究報(bào)告2020[J].建筑節(jié)能(中英文),2021,49(2):1-6.
China Building Energy Conservation Association.China building energy consumption annual report 2020[J].Journal of BEE,2021,49(2):1-6.
[2] XU C,CHEN H. A hybrid data mining approach for anomaly detection and evaluation in residential buildings energy data[J].Energy and Buildings,2020,215:109864/1-13.
[3] KATIPAMULA S,BRAMBLEY M R. Review article:methods for fault detection,diagnostics,and prognostics for building systems—a review[J].HVAC&R Research,2005,11(1):3-25.
[4] 苗露. 基于監(jiān)測數(shù)據(jù)的建筑復(fù)雜用能設(shè)備運(yùn)行性能預(yù)測與分析研究[D].天津:天津大學(xué),2014.
[5] BUTTERWORTH H.Handbook of energy efficiency in buildings[M].Amsterdam:Elsevier,2019:597-673.
[6] 丁洪濤,劉海柱,殷帥. 我國公共建筑節(jié)能監(jiān)管平臺(tái)建設(shè)現(xiàn)狀及趨勢研究[J].建設(shè)科技,2017(23):10-11.
DING Hongtao,LIU Haizhu,Yin Shuai. Research on the current situation and trend of public building energy conservation supervision platform construction in China[J].Construction Science and Technology,2017(23):10-11.
[7] LEE K P,WU B H,PENG S L. Deep-learning-based fault detection and diagnosis of air-handling units[J].Building and Environment,2019,157:24-33.
[8] GUNAY B,SHEN W,YANG C. Characterization of a building’s operation using automation data:a review and case study[J].Building and Environment,2017,118:196-210.
[9] SUN L L,WU J H,JIA H Q,et al. Research on fault detection method for heat pump air conditioning system under cold weather[J].Chinese Journal of Chemical Engineering,2017,25(12):1812-1819.
[10] VERBERT K,BABUSKA R,de SCHUTTER B. Combining knowledge and historical data for system-level fault diagnosis of HVAC systems[J].Engineering Applications of Artificial Intelligence,2017,59:260-273.
[11] LIANG Y X,MENG Q L,CHANG S. Fault diagnosis and energy consumption analysis for variable air volume air conditioning system: a case study[J].Procedia Engineering,2017,205:834-841.
[12] LI Y F,O'NEIL Z. An innovative fault impact analysis framework for enhancing building operations[J].Energy and Buildings,2019,199:311-331.
[13] LIU J H,LIU J Y,CHEN H X,et al. Abnormal energy identification of variable refrigerant flow air-conditioning systems based on data mining techniques[J].Applied Thermal Engineering,2019,150:398-411.
[14] GUO Y B,TAN Z H,CHEN H X,et al. Deep learning-based fault diagnosis of variable refrigerant flow air-conditioning system for building energy saving[J].Applied Energy,2018,225:732-745.
[15] PAN Y,ZHANG L M.Data-driven estimation of building energy consumption with multi-source heterogeneous data[J].Applied Energy,2020,268:114965/1-15.
[16] PE?A M,BISCARRI F,GUERRERO J I,et al. Rule-based system to detect energy efficiency anomalies in smart buildings,a data mining approach[J].Expert Systems with Applications,2016, 56: 242-255.
[17] FAN C,XIAO F,ZHAO Y,et al. Analytical investigation of autoencoder-based methods for unsupervised anomaly detection in building energy data[J].Applied Energy,2018,211:1123-1135.
[18] LUO X J,F(xiàn)ONG K F,SUN Y J. Development of clustering-based sensor fault detection and diagnosis strategy for chilled water system[J].Energy and Buildings,2019,186: 17-36.
[19] LIU X,DING Y,TANG H,et al. A data mining-based framework for the identification of daily electricity usage patterns and anomaly detection in building electricity consumption data[J].Energy and Buildings,2021,231:110601/1-22.
[20] DU Z M,F(xiàn)AN B,JIN X Q,et al. Fault detection and diagnosis for buildings and HVAC systems using combined neural networks and subtractive clustering analysis[J].Building and Environment,2014,73: 1-11.
[21] SHI Z X,OBRIEN W. Development and implementation of automated fault detection and diagnostics for building systems:a review[J].Automation in Construction,2019,104:215-229.
[22] FAHIM M,F(xiàn)RAZ K,SILLITTI A. TSI:Time series to imaging based model for detecting anomalous energy consumption in smart buildings[J].Information Sciences,2020,523:1-13.
[23] BARUM H,BARRETT J,CLARK L O,et al. Entropy and information causality in general probabilistic theories[J].New Journal of Physics,2010(3) 1-32.
[24] AI Y T,GUAN J Y,F(xiàn)EI C W,et al. Fusion information entropy method of rolling bearing fault diagnosis based on-dimensional characteristic parameter distance[J].Mechanical Systems and Signal Processing,2017,88:123-136.
[25] 孫吉貴,劉杰,趙連宇. 聚類算法研究[J].軟件學(xué)報(bào),2008,19(1):48-61.
SUN Jigui,LIU Jie,ZHAO Lianyu,Clustering algorithms research[J].Journal of Software,2008,19(1):48-61.
[26] 賈凡,嚴(yán)妍,張家琪. 基于-means聚類特征消減的網(wǎng)絡(luò)異常檢測[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,58(2):137-142.
JIA Fan,YAN Yan,ZHANG Jiaqi.-means based feature reduction for network anomaly detection[J].Journal of Tsinghua University(Science and Technology),2018,58(2):137-142.
[27] QIN H Y,ZHOU H P,CAO J W.Imbalanced learning algorithm based intelligent abnormal electricity consumption detection[J].Neurocomputing,2020,402:112-123.
[28] GHADIRI S M E,MAZLUMI K. Adaptive protection scheme for microgrids based on SOM clustering technique[J].Applied Soft Computing,2020,88:106062.
[29] YAZDANI S,MONTAZERI G M. A novel gas turbine fault detection and identification strategy based on hybrid dimensionality reduction and uncertain rule-based fuzzy logic[J].Computers in Industry,2020,115:103131/1-14.
[30] 楊占華,楊燕. SOM神經(jīng)網(wǎng)絡(luò)算法的研究與進(jìn)展[J].計(jì)算機(jī)工程,2006, 32(16):201-202, 208.
YANG Zhanhua,YANG Yan. Research and development of self-organizing maps algorithm[J].Computer Engineering,2006,32(16):201-202,208.
[31] 中華人民共和國住房和城鄉(xiāng)建設(shè)部. 國家機(jī)關(guān)辦公建筑和大型公共建筑能耗監(jiān)測系統(tǒng)分項(xiàng)能耗數(shù)據(jù)采集技術(shù)導(dǎo)則[G/OL].(2008-06-24).https://www.mohurd.gov.cn/gongkai/fdzdgknr/tzgg/200807/20080702_174380.html.
[32] 胡振中,袁爽. 建筑能耗與環(huán)境監(jiān)測系統(tǒng)標(biāo)準(zhǔn)化數(shù)據(jù)提取技術(shù)[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,60(4):357-364.
HU Zhenzhong,YUAN Shuang.Standardized data extraction techniques for building utility consumption and environmental monitoring systems[J].Journal of Tsinghua University (Science and Technology),2020,60(4):357-364.
[33] YUN G Y,CHOI J,KIM J T. Energy performance of direct expansion air handling unit in office buildings[J].Energy and Buildings,2014,77:425-431.
Anomaly Detection of Complex Building Energy Consumption System Based on Machine Learning
ZHOU Xuan1WANG Xinyao1YAN Junwei1LEI Shangpeng1LIANG Liequan2
(1. School of Mechanical and Automotive Engineering,South China University of Technology,Guangzhou 510640,Guangdong, China;2. School of Information,Guangdong University of Finance and Economics,Guangzhou 510320,Guangdong,China)
The research on the anomaly detection of the operation state of complex energy consumption system is of great significance to the safe, stable, efficient and energy-saving operation of buildings. However, due to the influence of many factors, such as the variety of external environmental factors of buildings, the uncertainty of insider behavior, the complexity of equipment operation data and so on, the detection of abnormal operation state often meets some difficulties in information feature extraction, abnormal operation state definition and so on. Based on the classification of operation parameters and by using the quantitative description of uncertainty by information entropy and the adaptability of unsupervised learning, this paper proposed a secondary clustering anomaly detection method for the operation state of complex energy consumption system based on information entropy and by integrating-means and self-organizing mapping model. According to the actual monitoring data of the central air-conditioning system of a large office building in the hot summer and warm winter area, the external parameters were clustered for the first time through-means, and the steps such as dividing the primary working conditions, calculating the information entropy of the operating parameters of the subsystem under each working condition, and determining the abnormal operating state by secondary clustering of self-organizing mapping model were used to realize the abnormal detection of the operating state of the complex energy consumption system of the building. The results show that the average intra class anomaly detection accuracy of the method proposed in this study is 97.45% under the operation condition of single machine and 96.70% under the operation condition of two machines. In addition, this study further discussed and analyzed the relationship between the number of classes and the relevant indicators of in class anomaly rate under different working conditions. It concludes that the in class anomaly detection rate of single and dual hosts increases with the decrease of the total number of operating states in their class. This study provides a new systematic idea and method for the abnormal operation state detection of complex energy consumption system under the background of building energy big data.
complex energy consumption system;information entropy;-means;self-organizing maps model;anomaly detection
Supported by the Natural Science Foundation of Guangdong Province (2018A030313352,2017A030316162)
TK01;TU831
1000-565X(2022)07-0144-11
10.12141/j.issn.1000-565X.210422
2021-06-25
廣東省自然科學(xué)基金資助項(xiàng)目(2018A030313352,2017A030316162)
周璇(1976-),女,副研究員,主要從事節(jié)能技術(shù)、數(shù)據(jù)挖掘等研究。E-mail: zhouxuan@scut.edu.cn