李稚春 陳嵐峰
【摘要】本文提出了一種新的基于一階差分法的異常數(shù)據(jù)檢測(cè)算法,可以用來(lái)發(fā)現(xiàn)建筑能耗平臺(tái)的實(shí)時(shí)異常數(shù)據(jù),詳細(xì)討論了方法論原則和準(zhǔn)則。仿真結(jié)果表明,針對(duì)建筑能耗監(jiān)測(cè)過程中的累積能耗異常數(shù)據(jù)可以通過我們的方法進(jìn)行識(shí)別并予以處理,有效的保證了數(shù)據(jù)質(zhì)量。
【關(guān)鍵詞】能耗數(shù)據(jù);異常數(shù)據(jù);一階差分法
1.引言
目前,建筑能耗監(jiān)測(cè)被普遍認(rèn)為是實(shí)現(xiàn)公共建筑節(jié)能量化考評(píng)的前提和基礎(chǔ),也是公共建筑節(jié)能的迫切要求。截至2013年底,全國(guó)范圍內(nèi)已實(shí)現(xiàn)對(duì)5 000余棟大型公共建筑進(jìn)行實(shí)時(shí)能耗動(dòng)態(tài)監(jiān)測(cè),累計(jì)支持210所高等院校開展節(jié)約型校園建設(shè)試點(diǎn)。然而,通過實(shí)際工程調(diào)研結(jié)果表明,現(xiàn)有的建筑能耗監(jiān)測(cè)系統(tǒng)存在著嚴(yán)重的數(shù)據(jù)質(zhì)量問題。因此,進(jìn)一步提高建筑能耗監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)質(zhì)量,就成了現(xiàn)有建筑能耗監(jiān)測(cè)工作急需解決的技術(shù)問題。在監(jiān)測(cè)系統(tǒng)運(yùn)行過程中,仍然會(huì)產(chǎn)生部分因現(xiàn)場(chǎng)電磁干擾、信號(hào)傳輸擾動(dòng)或數(shù)據(jù)傳輸故障等引起的異常數(shù)據(jù),圖1是某建筑能耗監(jiān)測(cè)系統(tǒng)顯示的三相有功功率監(jiān)測(cè)界面,如圖1所示,用綠色方框選中的點(diǎn)為一個(gè)異常數(shù)據(jù)點(diǎn)。
圖1 能耗監(jiān)測(cè)系統(tǒng)中的異常值
2.異常能耗數(shù)據(jù)辨識(shí)
異常數(shù)據(jù)是指數(shù)據(jù)采樣過程中有明顯錯(cuò)誤,偏大或者偏小的個(gè)別數(shù)據(jù),如圖2所示的A、B兩點(diǎn)。異常數(shù)據(jù)的出現(xiàn)會(huì)導(dǎo)致后期的數(shù)據(jù)處理過程中誤差增大,甚至無(wú)法計(jì)算,因此必須將其剔除。例如,對(duì)于具有非負(fù)遞增特性的能耗累積量而言,如果出現(xiàn)圖2中A點(diǎn)的情形,A點(diǎn)的數(shù)值減去上一個(gè)采樣時(shí)刻的數(shù)值將會(huì)出現(xiàn)負(fù)數(shù),A點(diǎn)后面的數(shù)值減去A點(diǎn)的數(shù)值也會(huì)產(chǎn)生一個(gè)錯(cuò)誤的數(shù)據(jù)。同理,B點(diǎn)的數(shù)據(jù)也會(huì)造成相應(yīng)的影響。
圖2 數(shù)據(jù)中的異常點(diǎn)
對(duì)于非時(shí)變系統(tǒng)測(cè)量過程中產(chǎn)生的異常數(shù)據(jù),可以通過反復(fù)測(cè)量的方法降低異常數(shù)據(jù)出現(xiàn)的概率;對(duì)于時(shí)變系統(tǒng),首先是通過已采集到的數(shù)據(jù)變化趨勢(shì)對(duì)異常數(shù)據(jù)進(jìn)行識(shí)別,然后補(bǔ)上一個(gè)合理的預(yù)測(cè)值。異常數(shù)據(jù)的識(shí)別需要根據(jù)儀表精度和測(cè)量過程而定,具體問題具體分析。較為常用的剔除異常數(shù)據(jù)的方法包括一階差分法,多項(xiàng)式逼近法和最小二乘法。建筑能耗監(jiān)測(cè)過程中的能耗數(shù)據(jù)多為一維統(tǒng)計(jì)數(shù)據(jù),變化趨勢(shì)相對(duì)比較簡(jiǎn)單,本文采用一階差分法對(duì)異常數(shù)據(jù)進(jìn)行識(shí)別和剔除。
圖3 相鄰點(diǎn)數(shù)據(jù)變化
圖4 一階差分法流程圖
3.一階差分法理論基礎(chǔ)
當(dāng)系統(tǒng)的采樣頻率滿足奈奎斯特采樣定理時(shí),在相鄰兩個(gè)采樣時(shí)間點(diǎn)獲得的數(shù)據(jù)差值相差不大,如圖3所示。即:
(1)
由此可知,可以利用和的數(shù)值對(duì)當(dāng)前時(shí)刻的采樣值進(jìn)行預(yù)估,即:
(2)
將(1)帶入(2)可得:
(3)
其中,是t時(shí)刻的采樣值,是t時(shí)刻的預(yù)測(cè)值,為t時(shí)刻前1個(gè)時(shí)刻對(duì)應(yīng)的采樣點(diǎn)數(shù)值,為t時(shí)刻前2個(gè)時(shí)刻對(duì)應(yīng)的采樣點(diǎn)數(shù)值。
判定準(zhǔn)則:設(shè)t時(shí)刻的采樣值為,預(yù)測(cè)值為,對(duì)于給定的一個(gè)誤差限,當(dāng)時(shí),則判定該時(shí)刻采樣值是異常數(shù)據(jù),予以剔除,同時(shí)將預(yù)測(cè)值取代采樣值。
由異常數(shù)據(jù)判定準(zhǔn)則可知,一階差分法的關(guān)鍵是選擇合適的誤差限和預(yù)測(cè)的算法,式(3)給出了一階差分法的預(yù)測(cè)算法,而誤差限的大小則由系統(tǒng)的采樣頻率和被測(cè)物理量的變化特性共同決定。但在實(shí)際應(yīng)用過程中,有兩種情況需要注意。
圖5 異常點(diǎn)處理
(1)起始點(diǎn)的選取
存在一種極端的可能,即起始點(diǎn)恰恰就是受干擾產(chǎn)生的異常點(diǎn)。為避免這種情況的出現(xiàn),從一開始就必須選取能夠滿足一階差分預(yù)測(cè)關(guān)系的3個(gè)連續(xù)點(diǎn),滿足公式(4):
(4)
這時(shí)選取的3個(gè)點(diǎn),、、,才可以作為正確的起始點(diǎn)被引用。找到起始點(diǎn)之后,可以沿時(shí)間軸負(fù)方向()對(duì)以前的數(shù)據(jù)進(jìn)行識(shí)別及修正,沿時(shí)間軸正方向()對(duì)實(shí)時(shí)數(shù)據(jù)進(jìn)行識(shí)別及修正,分別如式(5)和式(6)所示。如果最初的3個(gè)點(diǎn),、、就是滿足(4)關(guān)系的3個(gè)點(diǎn),則直接選用和作為起點(diǎn),對(duì)方向進(jìn)行判別。
(5)
(6)
(2)連續(xù)異常點(diǎn)
當(dāng)系統(tǒng)連續(xù)檢測(cè)出若干個(gè)異常數(shù)據(jù)點(diǎn),并用預(yù)測(cè)值進(jìn)行替換之后,為避免造成數(shù)據(jù)偏離正確的趨勢(shì),必須重新選擇新的起始點(diǎn),即和的值。對(duì)于一階差分法而言,經(jīng)驗(yàn)證明,在連續(xù)剔除并替換兩個(gè)異常數(shù)據(jù)點(diǎn)之后,應(yīng)選擇新的起始點(diǎn)作為和。但是,在實(shí)際測(cè)量過程中,有的時(shí)候會(huì)出現(xiàn)連續(xù)兩個(gè)以上的異常點(diǎn)。從而導(dǎo)致所選的初始值和發(fā)生畸變,進(jìn)而產(chǎn)生錯(cuò)誤的預(yù)測(cè)值。為此,當(dāng)連續(xù)代替兩個(gè)異常數(shù)據(jù)之后,對(duì)以后的點(diǎn),均要用公式(7)進(jìn)行再次判斷。
(7)
其中,K為常數(shù)項(xiàng),取值是具體情況而定。如果滿足式(7)的關(guān)系,則保留該值,否則認(rèn)為該點(diǎn)是異常點(diǎn),予以剔除,并用預(yù)測(cè)值替換。一旦找到滿足(7)的數(shù)據(jù)點(diǎn),就自動(dòng)選取新的起點(diǎn),然后重復(fù)上述過程。如果一直找不到這個(gè)點(diǎn),當(dāng)連續(xù)處理的點(diǎn)數(shù)已達(dá)到6個(gè),也會(huì)自動(dòng)的選擇新的起點(diǎn),再次重復(fù)上述的過程。
4.算法實(shí)現(xiàn)及驗(yàn)證
一階差分法的算法實(shí)現(xiàn)過程不是很復(fù)雜,如圖4所示。其中,采樣數(shù)據(jù)為x(N),數(shù)據(jù)個(gè)數(shù)為N,t為采樣數(shù)據(jù)的計(jì)數(shù)變量,數(shù)據(jù)類型為整型變量。為查找起始點(diǎn),設(shè)變量t起始值為3,依據(jù)式(4)進(jìn)行判斷從x(N)中找到合適的起始點(diǎn)。找到起始點(diǎn)之后,對(duì)后面的數(shù)據(jù)進(jìn)行異常數(shù)據(jù)檢測(cè)和替換,直到采樣數(shù)據(jù)結(jié)束。對(duì)于起始點(diǎn)之前的數(shù)據(jù)可以依據(jù)算法進(jìn)行反推,也可以舍棄。異常值檢測(cè)和替換的算法流程如圖5所示,其中IK為連續(xù)處理異常點(diǎn)的計(jì)數(shù)變量,數(shù)據(jù)類型為整形變量,為數(shù)據(jù)的上界,即數(shù)據(jù)的極值,該參數(shù)的選取應(yīng)根據(jù)不同的信息數(shù)據(jù)區(qū)別對(duì)待??梢岳迷O(shè)備的額定工作參數(shù)計(jì)算,一般取5倍的誤差限作為數(shù)據(jù)的上界。若測(cè)量值與預(yù)測(cè)值之差小于誤差限,則保留測(cè)量值;若差值大于,則判定為異常點(diǎn),進(jìn)而通過預(yù)測(cè)值代替測(cè)量值;若差值在于之間,則通過對(duì)IK計(jì)數(shù)大小進(jìn)行判斷是否替換,以此防止數(shù)據(jù)變化趨勢(shì)的偏離。
圖6 含有異常值的風(fēng)機(jī)累計(jì)電量
圖6所示的是建筑能耗監(jiān)測(cè)系統(tǒng)中風(fēng)機(jī)的日累計(jì)電量監(jiān)測(cè)原始數(shù)據(jù),圖7所示的是通過一階差分法對(duì)原始數(shù)據(jù)中異常數(shù)據(jù)進(jìn)行剔除和替換后的結(jié)果。從圖中可以看出,3個(gè)采集點(diǎn)因干擾讀數(shù)為零,偏離正常變化趨勢(shì)了正常的變化趨勢(shì),通過一階差分法將異常值識(shí)別并剔除,處理后的數(shù)據(jù)反應(yīng)了該支路的真實(shí)的累計(jì)電量信息。
圖7 處理后的風(fēng)機(jī)累計(jì)電量
5.結(jié)論
本文提出了一種基于一階差分法的建筑能耗監(jiān)測(cè)系統(tǒng)異常能耗數(shù)據(jù)診斷方法,可以直接嵌入在現(xiàn)有的建筑能耗監(jiān)測(cè)平臺(tái)中,特別是大型公共建筑。通過該方法可以有效地識(shí)別能耗數(shù)據(jù)中不合理的數(shù)據(jù)點(diǎn),并進(jìn)行剔除和替換,為后期的能耗數(shù)據(jù)處理提供了保障。