印四華,楊海東,徐康康,朱成就,王亞利,金 熹
(廣東工業(yè)大學(xué)機電工程學(xué)院,廣州 510006)
高耗能機器的生產(chǎn)條件復(fù)雜,且長期滿負(fù)荷運行,能耗異常的概率很高。典型的高能耗機器主要包括液壓機、工業(yè)窯爐等[1]。在生產(chǎn)過程中,這些高能耗機器的能耗數(shù)據(jù)具有階躍式、交變性和周期性的特點。機器的異常能耗通常伴隨著大量的能量損失和能源效率的降低,甚至?xí)?dǎo)致停機和不可估量的安全事故,從而影響整個生產(chǎn)線的正常生產(chǎn)。隨著時間的推移,機器的磨損程度會逐漸增加,從而導(dǎo)致機器的能耗增加[2]。早期發(fā)現(xiàn)異常能耗是優(yōu)化能效的關(guān)鍵。中國宣布的目標(biāo)是到2030年達到碳排放的峰值,并到2060 年進一步實現(xiàn)碳中和。工業(yè)排放在國家排放清單中發(fā)揮著主導(dǎo)作用,而能源密集型工業(yè)中與能源相關(guān)的排放需要更快地達到峰值[3]。解決減少排放的問題需要努力優(yōu)化能耗行為。隨著不斷上漲的電價,以及對溫室氣體效應(yīng)的擔(dān)憂,人們越來越關(guān)注能效問題[4]。因此,開發(fā)一種可靠、快速和自動的能耗異常檢測技術(shù)具有重要意義。有了這些新方法,生產(chǎn)企業(yè)可以對高能耗機器進行監(jiān)控和處理,避免能源損失,優(yōu)化能源效率。
異常檢測主要用于檢測數(shù)據(jù)集中偏離正常模式的異常數(shù)據(jù),是數(shù)據(jù)挖掘領(lǐng)域中最受歡迎的研究領(lǐng)域之一。被廣泛應(yīng)用于能耗、機械設(shè)備中的故障、網(wǎng)絡(luò)入侵檢測等領(lǐng)域[5]。所研究的能耗數(shù)據(jù)屬于一種時間序列數(shù)據(jù)。而時間序列異常檢測是計算機科學(xué)的研究熱點,它已成為制造和能源領(lǐng)域的重要問題[6]。時間序列數(shù)據(jù)異常檢測方法主要包括:基于距離的異常檢測、基于預(yù)測的異常檢測、基于聚類的異常檢測等方法[7]。關(guān)于基于距離的異常檢測方法,Huo 等[8]提出了一種基于距離的時間序列數(shù)據(jù)在線異常檢測算法。該方法采用K-均值和時空權(quán)衡機制來降低時間復(fù)雜度,具有良好的有效性和通用性。對于基于預(yù)測的異常檢測方法,需要大量的數(shù)據(jù)訓(xùn)練來建立模型。因此,當(dāng)數(shù)據(jù)和模型本身存在問題時,該方法的檢測性能就會很差[9]。對于基于聚類的異常檢測方法,“聚類算法”是指將原始數(shù)據(jù)分類為相應(yīng)的近似類,使類之間的相似性低,類內(nèi)相似性高。李熙等[10]采用K-means 聚類方法對牽引能耗模式進行了識別,然后提出了一種針對牽引能耗時間序列的異常分析方法。Li 等[11]采用模糊C-Means 聚類的擴展版本對數(shù)據(jù)集進行了聚類,在此基礎(chǔ)上提出了一種基于聚類的異常檢測方法。其目的是檢測多元時間序列中的振幅異常和形狀異常。一些學(xué)者也提出了其他的異常檢測方法。Liang 等[12]提出了一種基于約束超圖的方法,該方法利用子序列上的約束來檢測異常,其目的是用于工業(yè)時間序列異常檢測。
傳統(tǒng)的異常檢測方法分為基于局部的異常檢測方法和基于全局的異常檢測方法。由于缺乏適當(dāng)?shù)膬?yōu)化,它們的檢測效率低,適應(yīng)性差。綜上所述,現(xiàn)有的異常檢測方法各有不足:(1)局部異常檢測方法假設(shè)異常數(shù)據(jù)可以在局部明顯顯示,可以通過一維時間信號分析進行檢測,然而,這種方法過于注重局部的小變化,導(dǎo)致誤報率較高,可擴展性差;(2)全局異常檢測方法的前提是某些異常數(shù)據(jù)不能在局部清楚地顯示,因此需要在全局范圍內(nèi)進行檢測,但因忽視局部輕微異常,漏報率高。傳統(tǒng)的異常檢測方法不能準(zhǔn)確地檢測具有階躍式和交變性特征的能耗數(shù)據(jù),存在漏報率、誤報率高等缺點。本文致力于解決階躍式和交變性能耗數(shù)據(jù)的異常檢測所面臨的挑戰(zhàn)。所提出的方法可以提供節(jié)能決策的依據(jù),其目的是指導(dǎo)能源管理工程師實現(xiàn)能效優(yōu)化。
典型的高能耗機器主要包括液壓機和工業(yè)窯爐等。在生產(chǎn)過程中,這些機器的能耗數(shù)據(jù)具有階躍式、交變性和周期性等特點。該能耗數(shù)據(jù)的一個正常周期可分為3 個階段:空載前進、負(fù)載前進和空載后退。在一個周期中的一個特定位置,數(shù)據(jù)通常會有一個跳躍式的增加。該位置位于空載前進數(shù)據(jù)段的末端,同時也就是爬升數(shù)據(jù)段的前端。該數(shù)據(jù)通常是由正常預(yù)操作引起的。如圖1中的第3個周期所示。
圖1 階躍式和交變性能耗數(shù)據(jù)中的點異常特征
各種不確定的工況通常會導(dǎo)致能耗數(shù)據(jù)異常,從而降低機器的能源效率。在能耗數(shù)據(jù)的時間序列中,經(jīng)常會出現(xiàn)瞬態(tài)低功率和瞬態(tài)高功率等異常能耗數(shù)據(jù)。這主要是由于不穩(wěn)定的電流/電壓負(fù)載、傳感器損壞和異常通信造成的。數(shù)據(jù)的瞬時增加通常發(fā)生在空載后退數(shù)據(jù)段中,它通常是由短時誤操作造成的。一種典型的異常能耗數(shù)據(jù)通常發(fā)生在空載前進數(shù)據(jù)段中。也就是說,數(shù)據(jù)在正常預(yù)操作前就會瞬間增加,稱之為瞬時阻塞。它通常是由于高能耗機器運行過程中硬質(zhì)材料堵塞引起的,也可能是由加工坯料中的材料異常引起的。個別能耗數(shù)據(jù)偏離正常范圍較大,但鄰域內(nèi)數(shù)據(jù)正常,這稱為點異常,如圖1所示。
本文將雨流(RF)計數(shù)方法與局部離群因子(LOF)算法相結(jié)合,提出了一種基于雨流計數(shù)的局部離群因子(RF-LOF)的異常檢測方法。該方法能夠正確檢測能耗數(shù)據(jù)的點異常。
本研究采用雨流計數(shù)法對能耗數(shù)據(jù)時間序列進行預(yù)處理,其目的是刪除爬坡和下坡位置的干擾數(shù)據(jù)。利用雨流計數(shù)法的數(shù)據(jù)壓縮環(huán)節(jié),將長度M的能耗數(shù)據(jù)處理成由局部極大值和極小值組成的峰谷序列。點Xi被識別為非峰谷點,如果:
式中:Xi為現(xiàn)場采集的能耗數(shù)據(jù)點,對于數(shù)據(jù)段的端點,它直接被認(rèn)為是峰谷點。
在本研究中,使用高斯混合模型聚類算法將雨流計數(shù)法處理后的數(shù)據(jù)劃分為兩個子空間。對于經(jīng)過雨流計數(shù)法處理后的能耗數(shù)據(jù),假定它的空間概率分布可以近似地用多個高斯分布概率函數(shù)表示。根據(jù)高斯混合模型聚類的理論,能耗數(shù)據(jù)x服從高斯分布:
能耗數(shù)據(jù)x的高斯混合模型的表達式為:
根據(jù)貝葉斯定理,能耗數(shù)據(jù)xj屬于i類的后驗概率為:
式中:1 ≤i≤k。
給每個能耗數(shù)據(jù)分類都分配一個系數(shù)。那么,能耗數(shù)據(jù)xj的分類公式為:
在上述方程中,分別對∑和μ求導(dǎo),并且令導(dǎo)數(shù)為0。計算得到的均值向量和協(xié)方差矩陣分別為:
式中:λ為拉格朗日乘子。
在上述方程中,對αi進行求導(dǎo),并且令導(dǎo)數(shù)為0。計算得到的混合系數(shù)為:
局部離群因子算法屬于一種基于密度的方法。該方法為每個數(shù)據(jù)分配一個局部離群因子,并根據(jù)局部離群值確定離群值。
2.3.1K-近鄰可達距離
從點q到點o的K-近鄰可達距離可表示為:
式中:d(q,o)為點q到點o之間的歐氏距離。
2.3.2 局部可達性密度
點q的局部可達密度可以表示為:
該公式表示從點q的K-近鄰鄰域中的所有點到點q的平均可達距離的倒數(shù)。局部可達密度代表一個密度,密度越高,就越有可能屬于同一簇,當(dāng)密度越低,就越有可能是離群點。
2.3.3 局部異常因子
點q的局部異常因子LOF(q)表示為:
采用局部異常因子LOF(q)作為判斷點q是否異常的指標(biāo),當(dāng)LOF(q)值接近1 時,表明q點是正常點,當(dāng)LOF(q)值遠(yuǎn)大于1時,這表明q點更有可能是異常點。
在點異常檢測過程中,所涉及的特征值的范圍是不同的,因此需要對其進行歸一化。本文對向量進行L2范數(shù)歸一化處理,建立一個從c到c′的映射,使得c′的L2范數(shù)為1,也就是:
為了判斷某個能耗數(shù)據(jù)是否是點異常,本節(jié)提出了點異常的閾值δ如下:
式中:α為根據(jù)實際情況設(shè)定的點異常系數(shù),如果LOF>δ,那么將該點判斷為點異常。
所提出的基于RF-LOF的點異常檢測算法的綜合框架如表1所示。
表1 基于RF-LOF的點異常檢測算法
為了驗證所提出的基于雨流計數(shù)的異常檢測方法的性能,本文采用了鋁型材擠壓機的實時能耗數(shù)據(jù)。這些數(shù)據(jù)來自華南某大型鋁型材擠壓制造企業(yè)的能源管理系統(tǒng),采集頻率為1 Hz。此外,為了商業(yè)保密,對數(shù)據(jù)進行了加密處理。能耗監(jiān)測和控制終端如圖2 所示。實驗是在64 位,3.60G Hz 英特爾?核心TMi7 計算機上運行的,微軟Windows10 和8 GB 內(nèi)存。該方法是在MATLAB R2018a中執(zhí)行的。
圖2 鋁型材擠壓機能耗監(jiān)測與優(yōu)化平臺
在仿真實驗中,利用6 個周期的鋁型材擠壓機的能耗數(shù)據(jù)對點異常進行了檢測。每個周期的長度為100 s。采用橢圓標(biāo)記了6個點異常,如圖3(a)所示。點線表示整個周期的點異常閾值δ。若LOF值高于此點線,則判定對應(yīng)點為點異常。仿真結(jié)果表明,本文提出的點異常檢測方法(RF-LOF)是有效的。能自動準(zhǔn)確判斷該點是否為點異常,因此能夠滿足實際應(yīng)用的要求。
在這里,使用所提出的方法(RF-LOF)和LOF方法進行比較實驗。利用LOF方法直接對5 個周期的能耗數(shù)據(jù)進行點異常檢測,仿真結(jié)果如圖3(d)所示。明顯觀察到異常數(shù)據(jù)不能用LOF方法明確區(qū)分,正常數(shù)據(jù)點出現(xiàn)了一些誤判,這是因為沒有考慮能耗數(shù)據(jù)階躍特性的影響。相反,基于RF-LOF的方法使點異常檢測更加合理和可行。
本文中仿真所涉及的參數(shù)設(shè)置如表2 所示。初始簇中心數(shù)n設(shè)置為2。然后,高斯混合模型聚類算法可以正確地將“負(fù)載前進”和“空載前進和空載后退”分為兩類。
為了分析該方法中的k值對檢測結(jié)果的影響,對鋁型材擠壓機的連續(xù)能耗數(shù)據(jù)進行了采樣和驗證。分別利用k的不同值獲得計算時間和檢測率,如表3 所示。本文將檢測率定義為檢測到的異常數(shù)據(jù)與異常數(shù)據(jù)總數(shù)的比值。當(dāng)k=6~10 時,檢測結(jié)果良好,當(dāng)k=8 時,檢測結(jié)果最好。此外,當(dāng)k≥11 時,所提出的檢測算法不能收斂,這主要是由于空載前進和空載后退的數(shù)據(jù)段較短。在計算時間方面,當(dāng)處理500 個能耗數(shù)據(jù)時,該方法的整個檢測過程可以在0.3 s 內(nèi)完成,這表明所提出的基于RF-LOF的點異常檢測方法適用于在線使用。
表3 不同k值的計算時間和檢測率
在這里,采用來自機器狀態(tài)嚴(yán)重惡化的鋁型材擠壓機的能耗數(shù)據(jù)進行了仿真實驗,結(jié)果如圖4 所示。在本實驗中,計算得到的LOF值的時間序列在較大的范圍內(nèi)波動,這意味著點異常檢測結(jié)果的變化更劇烈。我們將點異常的閾值系數(shù)α提高到1.85,其目的是為了自動而準(zhǔn)確地判斷能耗數(shù)據(jù)是否為點異常。
圖4 惡化能耗數(shù)據(jù)的點異常檢測結(jié)果
在此,采用所提出的方法對正常能耗數(shù)據(jù)進行了異常檢測,如圖5 所示。在模擬實驗中,沒有發(fā)生誤檢測。雨流計數(shù)法將連續(xù)上升或者連續(xù)下降的3 個以上的點的中間的點刪除。據(jù)此,可以及時發(fā)現(xiàn)不符合交變性特征的數(shù)據(jù)段,并且能夠在時間維度上精確定位它們。如圖5(b)所示,所提方法有助于及時發(fā)現(xiàn)傳感器的潛在異常。
圖5 正常能耗數(shù)據(jù)的點異常檢測結(jié)果
在華南某大型鋁型材擠壓制造企業(yè)的800 USt擠壓車間中,初步測試了所提出的點異常檢測方法,于2021年9—12月進行了對比實驗。首先,在9月份對能源管理系統(tǒng)中的異常能耗進行檢測。然后,組織能源管理專家對能耗異常的原因進行討論和分析,其目的是制定節(jié)能策略。所采取的能效優(yōu)化措施主要包括3個方面:(1)相關(guān)的設(shè)備維護、保養(yǎng)和更換;(2)加強生產(chǎn)工人的技能培訓(xùn),其目的是提高生產(chǎn)技能、減少誤操作;(3)加強對生產(chǎn)材料的質(zhì)量檢測與篩選。最后,在10月份,再次對異常能耗進行了檢測,以驗證所采取措施的結(jié)果。結(jié)果如表4所示。
表4 實驗月異常能耗的檢測結(jié)果
在2021年9月,所提出的檢測模型檢測出了288個點異常。其中35個點異常是由短時誤操作引起的。75個點異常是由瞬時阻塞引起的。剩下的178 個點異??赡苁怯捎趦x表損壞和異常通信造成的。在9 月底,現(xiàn)場工程師對數(shù)據(jù)采集系統(tǒng)的傳感器和通信線路進行了檢查確認(rèn)。并更換了相應(yīng)的元器件。根據(jù)10月份的異常檢測結(jié)果,知道瞬態(tài)低功率和瞬態(tài)高功率的次數(shù)都大大減少了??梢钥闯?,采取的措施達到了預(yù)期的目的。這樣就實現(xiàn)了能耗的精確測量,避免了數(shù)據(jù)采集系統(tǒng)帶來的數(shù)據(jù)不確定性。然后,培訓(xùn)生產(chǎn)工人的技能,旨在提高他們的操作技能和節(jié)能意識。結(jié)果表明,這大大減少了短時誤操作的次數(shù)。技能培訓(xùn)可以減少不必要的能源損失,并優(yōu)化能源效率。最后,對鋁型材擠壓機進行了主動維護,并且對鋁錠進行了嚴(yán)格的質(zhì)量檢測與篩選。其目的是消除瞬時阻塞所導(dǎo)致的能耗損失。研究結(jié)果表明,在9月底采取的這些措施取得了良好的節(jié)能效果。短時誤操作和瞬時阻塞的次數(shù)都大大減少了。截至10 月底的統(tǒng)計數(shù)據(jù)表明,所提出的方法將機器的能源效率提高了2.9%。
考慮到能耗數(shù)據(jù)的階躍式和交變性特征,本文提出了一種基于雨流計數(shù)的局部離群因子算法,其目的是應(yīng)用于能耗數(shù)據(jù)中的點異常檢測。實際生產(chǎn)數(shù)據(jù)的仿真實驗表明,本研究提出的異常檢測方法是有效的,具有較高的檢測精度和檢測效率,適合在線使用。雨流計數(shù)法可以處理爬坡和下坡數(shù)據(jù),以減少它們對異常檢測的影響。該方法的處理結(jié)果有利于及時發(fā)現(xiàn)異常的交變性數(shù)據(jù)。混合高斯模型可以正確地將一個周期的能耗數(shù)據(jù)劃分成兩個子空間,并且具有很好的魯棒性。局部離群因子算法可以準(zhǔn)確地發(fā)現(xiàn)子空間的點異常,這也是一種有效的異常特征提取方法。實踐證明,該方法還可以完成實際生產(chǎn)環(huán)境中能耗的異常檢測任務(wù),幫助能源管理工程師實時優(yōu)化能效。