亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于時序異常檢測的動力電池安全預(yù)警

        2024-01-09 04:00:18張安勤王小慧
        計(jì)算機(jī)應(yīng)用 2023年12期
        關(guān)鍵詞:解碼器集上編碼器

        張安勤,王小慧*

        基于時序異常檢測的動力電池安全預(yù)警

        張安勤1,2,王小慧1*

        (1.上海電力大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,上海 201306; 2.汕頭大學(xué)地方政府發(fā)展研究所,廣東 汕頭 515063)(?通信作者電子郵箱y21208007@mail.shiep.edu.cn)

        電動汽車由于電池內(nèi)部異常情況無法得到及時預(yù)測與預(yù)警,易導(dǎo)致事故發(fā)生,給駕駛員和乘客的生命和財(cái)產(chǎn)安全帶來嚴(yán)重威脅。針對上述問題,提出基于Transformer和對比學(xué)習(xí)的編碼器解碼器(CT-ED)模型用于多元時間序列異常檢測。首先,通過數(shù)據(jù)增強(qiáng)構(gòu)造一個實(shí)例的不同視圖,并利用對比學(xué)習(xí)捕獲數(shù)據(jù)的局部不變特征;其次,基于Transformer對數(shù)據(jù)從時間依賴和特征依賴兩方面進(jìn)行編碼;最后,通過解碼器重構(gòu)數(shù)據(jù),計(jì)算重構(gòu)誤差作為異常得分,對實(shí)際工況下的機(jī)器進(jìn)行異常檢測。在SWaT、SMAP和MSL這3個公開數(shù)據(jù)集和電動汽車動力電池(EV)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,所提模型的F1值對比次優(yōu)模型分別提升6.5%、1.8%、0.9%和7.1%。以上結(jié)果表明CT-ED適用于不同實(shí)際工況下的異常檢測,平衡了異常檢測的精確率和召回率。

        時間序列;異常檢測;對比學(xué)習(xí);多頭注意力;自動編碼器

        0 引言

        由于溫室效應(yīng),新能源汽車逐漸取代燃油汽車成為綠色出行的工具。電池作為汽車最主要的構(gòu)成部分存在老化和濫用而導(dǎo)致爆炸的危險[1]。駕駛?cè)说牟涣剂?xí)慣可能會損害電動汽車動力電池的性能,因此需要對整車數(shù)據(jù)進(jìn)行監(jiān)控,對異常情況進(jìn)行及時預(yù)警。

        對于電池故障預(yù)警,研究人員基于實(shí)驗(yàn)室電池故障數(shù)據(jù)形成了初步的理論體系和解決方案。然而在電動汽車實(shí)際應(yīng)用過程中運(yùn)行工況的變化復(fù)雜,實(shí)驗(yàn)條件下所建立的風(fēng)險報(bào)警機(jī)制難以應(yīng)對實(shí)車工況下多因素耦合的故障現(xiàn)象[1]。并且傳統(tǒng)電池診斷的方法大都需要進(jìn)行特征工程,依賴人工設(shè)計(jì)的特征提取方法,需要有專業(yè)知識,同時每個方法都是針對具體故障,泛化能力及魯棒性較差。

        近年來,深度學(xué)習(xí)和大數(shù)據(jù)技術(shù)在醫(yī)學(xué)、交通、自然語言領(lǐng)域均得到廣泛應(yīng)用,在新能源汽車領(lǐng)域也展現(xiàn)出良好的應(yīng)用前景。深度學(xué)習(xí)主要是數(shù)據(jù)驅(qū)動進(jìn)行特征提取,根據(jù)大量樣本的學(xué)習(xí)得到深層的、數(shù)據(jù)集特定的特征表示,對數(shù)據(jù)集的表達(dá)更高效和準(zhǔn)確,所提取的抽象特征魯棒性更強(qiáng),泛化能力更好。其中,多元時間序列異常檢測技術(shù)通過監(jiān)測物聯(lián)網(wǎng)運(yùn)營產(chǎn)生的大量高維傳感器數(shù)據(jù),檢測數(shù)據(jù)是否含有不符合預(yù)期趨勢的行為,及時發(fā)現(xiàn)機(jī)器的故障并修理[2],避免了故障機(jī)器持續(xù)運(yùn)行而產(chǎn)生更大的損耗,推動了現(xiàn)代工業(yè)和智慧城市的發(fā)展。電動汽車在實(shí)際運(yùn)行中,也產(chǎn)生了大量多維時間序列,因此可以將時間序列異常檢測領(lǐng)域的技術(shù)和大數(shù)據(jù)背景下的動力電池故障預(yù)警結(jié)合起來,監(jiān)測電動汽車在行駛狀態(tài)下的動力電池?cái)?shù)據(jù),對異常情況進(jìn)行及時預(yù)警。

        實(shí)際工況下的時間序列異常檢測通常存在如下挑戰(zhàn):1)數(shù)據(jù)通常是沒有標(biāo)簽的,并且異常類型繁多;2)傳感器在運(yùn)行過程中和數(shù)據(jù)傳輸?shù)较到y(tǒng)中都會產(chǎn)生噪聲,可能導(dǎo)致模型產(chǎn)生錯誤報(bào)警;3)現(xiàn)有的異常檢測方法大都需要人工設(shè)定閾值。大量研究使用無監(jiān)督模型重構(gòu)數(shù)據(jù),利用重構(gòu)誤差作為異常指標(biāo)判斷數(shù)據(jù),通常訓(xùn)練數(shù)據(jù)為不包含異常的正常數(shù)據(jù),因此模型可以學(xué)習(xí)到傳感器的正常行為模式,對異常數(shù)據(jù)進(jìn)行重構(gòu)時可能產(chǎn)生較大誤差,從而檢測到異常情況。傳感器的正常行為模式通常是不變的,若數(shù)據(jù)分布產(chǎn)生變化,可以參考文獻(xiàn)[3]中使用遷移學(xué)習(xí)訓(xùn)練新的模型,實(shí)現(xiàn)模型的動態(tài)更新。經(jīng)典的無監(jiān)督模型,比如基于聚類的K均值算法忽視了數(shù)據(jù)的時間依賴,而能捕獲時間相關(guān)性的基于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)[4]的相關(guān)模型缺少對特征之間依賴關(guān)系的捕獲[5]。由于交通路況的復(fù)雜和駕駛?cè)说鸟{駛習(xí)慣不同,電動汽車行駛狀態(tài)下的動力電池?cái)?shù)據(jù)相較于其他多元時間序列的動態(tài)性更強(qiáng)。

        基于以上思考,本文提出了基于Transformer[6]和對比學(xué)習(xí)[7]的編碼器解碼器結(jié)構(gòu)。對比學(xué)習(xí)作為自監(jiān)督學(xué)習(xí)通過縮小不同形式相同數(shù)據(jù)來源的編碼距離學(xué)習(xí)數(shù)據(jù)的一般特征,Transformer在自然語言處理和圖像中均取得了廣泛應(yīng)用,它通過多頭注意力機(jī)制和位置編碼函數(shù)捕獲數(shù)據(jù)的時間依賴和數(shù)據(jù)之間的相關(guān)性。利用以上技術(shù),針對數(shù)據(jù)缺少異常標(biāo)簽、含有時間依賴和特征依賴、動態(tài)性較強(qiáng)的3個特點(diǎn)進(jìn)行建模,并對幾種不同的閾值調(diào)整方法進(jìn)行了對比。

        本文的主要工作如下:

        1)提出一種新的基于Transformer和對比學(xué)習(xí)的編碼器解碼器(Contrastive Transformer Encoder Decoder, CT-ED)模型用于多元時間序列異常檢測,對原始數(shù)據(jù)進(jìn)行頻域數(shù)據(jù)增強(qiáng)構(gòu)建一個實(shí)例的不同視圖,利用對比學(xué)習(xí)增強(qiáng)模型捕獲動態(tài)時間序列中不變特征的能力并對比了不同數(shù)據(jù)增強(qiáng)方式的性能。

        2)結(jié)合Transformer和SENet(Squeeze and Excitation Network)[8]對數(shù)據(jù)進(jìn)行時間依賴和特征相關(guān)性兩方面的編碼,使模型編碼表示更加全面。使用一次性解碼重構(gòu)數(shù)據(jù),利用重構(gòu)偏差作為異常得分。

        3)在3個公共數(shù)據(jù)集和電動汽車動力電池(Electric Vehicle power battery, EV)數(shù)據(jù)集上進(jìn)行大量實(shí)驗(yàn),評估CT-ED的性能,實(shí)驗(yàn)結(jié)果表明,CT-ED的性能優(yōu)于其他基線模型。

        1 相關(guān)工作

        1.1 多元時間序列異常檢測

        傳統(tǒng)的多元時間序列異常檢測采用統(tǒng)計(jì)學(xué)方法或者經(jīng)典機(jī)器學(xué)習(xí)方法對數(shù)據(jù)分布建模。這些方法通常效率較高,但不能有效捕捉數(shù)據(jù)的時間依賴性。

        最近基于深度學(xué)習(xí)的方法在多元時間序列異常檢測方面取得了顯著的進(jìn)步。根據(jù)所使用的技術(shù)可以分為基于時間的方法、基于相關(guān)性的方法和綜合方法。

        基于時間的方法 大部分依賴RNN相關(guān)模型,比如長短期記憶(Long Short-Term Memory, LSTM)網(wǎng)絡(luò)和門控循環(huán)單元(Gated Recurrent Unit, GRU)。文獻(xiàn)[4]中提出了長短期記憶非參數(shù)動態(tài)閾值(LSTM-Nonparametric Dynamic Thresholding, LSTM-NDT)算法,利用LSTM構(gòu)造編碼器解碼器結(jié)構(gòu),并基于預(yù)測誤差提出自動閾值調(diào)整方法檢測異常。文獻(xiàn)[9-11]中采用不同的方式組合LSTM和變分自動編碼器(Variational Auto-Encoder, VAE),增加了重構(gòu)數(shù)據(jù)的多樣性。文獻(xiàn)[12]中提出了多變量異常檢測生成對抗網(wǎng)絡(luò)(Multivariate-Anomaly Detection with Generative Adversarial Networks, MAD-GAN),采用了生成式對抗網(wǎng)絡(luò)(Generative Adversarial Networks, GAN)框架,利用LSTM作為生成器和鑒別器捕獲時間依賴;然而在原始GAN的結(jié)構(gòu)中,隨機(jī)采樣的向量重構(gòu)的數(shù)據(jù)和需要檢測的時間序列片段在隱空間(Latent Space)可能是不對應(yīng)的,因此在檢測階段需要迭代尋找對應(yīng)的向量,比較耗時。文獻(xiàn)[13]中提出了隨機(jī)遞歸神經(jīng)網(wǎng)絡(luò)OmniAnomaly,將GRU和VAE進(jìn)行有效融合,利用相對熵(Kullback-Leibler Divergence,KL散度)學(xué)習(xí)數(shù)據(jù)在隱空間的分布,可以有效地重構(gòu)數(shù)據(jù)。

        基于相關(guān)性的方法 文獻(xiàn)[14]中提出了多尺度卷積循環(huán)編碼器解碼器(Multi-Scale Convolutional Recurrent Encoder-Decoder, MSCRED)網(wǎng)絡(luò),構(gòu)造不同窗口大小的多元時間序列相關(guān)性矩陣,通過LSTM變體獲得數(shù)據(jù)的時間依賴和特征相關(guān)性,但該模型不適用于維度較少或者相關(guān)性較低的數(shù)據(jù)。文獻(xiàn)[15]中提出的圖偏差網(wǎng)絡(luò)(Graph Deviation Network, GDN)和文獻(xiàn)[16]中提出的多元時間序列異常檢測圖注意力網(wǎng)絡(luò)(Multivariate Time-series Anomaly Detection via Graph ATtention network, MTAD-GAT),通過圖注意力機(jī)制學(xué)習(xí)傳感器和相關(guān)傳感器之間的關(guān)系。

        綜合方法 文獻(xiàn)[17]中提出的無監(jiān)督異常檢測(Unsupervised Anomaly Detection,USAD)模型參考GAN的思想,提出了一種同步對抗式訓(xùn)練策略放大正常和異常數(shù)據(jù)之間的差異,可以適應(yīng)訓(xùn)練數(shù)據(jù)中含有少量的異常樣本的情況,僅使用全連接層構(gòu)成編碼器和解碼器。Transformer在自然語言領(lǐng)域的廣泛應(yīng)用證實(shí)了它在序列數(shù)據(jù)上的優(yōu)越性,因此也有不少基于Transformer的異常檢測模型,比如:文獻(xiàn)[2]中提出的基于Transformer的異常檢測(Transformer-based Anomaly Detection, TranAD)模型在Transformer基礎(chǔ)上通過同步對抗式訓(xùn)練和自調(diào)節(jié)技術(shù)提高性能,不依賴RNN模型,具有很高的效率。文獻(xiàn)[18]中提出多尺度基于Transformer的殘差變分自動編碼器(Multiscale Transformer-based Residual VAE, MTRVAE)在VAE的基礎(chǔ)上,使用Transformer的自注意力機(jī)制捕獲序列之間的潛在相關(guān)性,并通過改進(jìn)的位置編碼和上采樣算法捕獲多尺度時間信息,通過殘差連接抵抗KL散度消失問題。文獻(xiàn)[5]中提出對比自動編碼器(Contrastive AutoEncoder for Anomaly Detection,CAE-AD)模型,通過多粒度對比方法捕獲數(shù)據(jù)的時間相關(guān)性和局部不變特征。

        1.2 Transformer

        Transformer主要由多頭自注意力機(jī)制和前饋層通過殘差連接組成,模型結(jié)構(gòu)是自動編碼器。一段時間序列長度為、特征維度為的時序數(shù)據(jù),通過不同的線性映射后得到、、,注意力計(jì)算如式(1)所示:

        其中:是數(shù)據(jù)在滑動窗口中的位置,是一個時間戳中不同特征的位置,model是模型的特征維度。

        2 動力電池異常檢測模型

        2.1 問題定義

        對每個時間序列片段進(jìn)行重構(gòu)得到異常分?jǐn)?shù),當(dāng)異常分?jǐn)?shù)超過某個閾值時,判斷該時間點(diǎn)為異常。

        2.2 模型框架

        CT-ED模型整體框架如圖1所示。首先,針對數(shù)據(jù)的動態(tài)性,通過頻域增強(qiáng)創(chuàng)建一個實(shí)例的不同視圖作為一對正例,利用對比學(xué)習(xí)捕獲數(shù)據(jù)的局部不變特征;其次,針對數(shù)據(jù)的時間依賴和特征依賴,通過多尺度卷積學(xué)習(xí)時間片段中不同范圍的特征、編碼器的時間模塊和特征模塊捕獲卷積結(jié)果在時間維度和特征維度上的相關(guān)性;最后,模型的解碼器結(jié)合編碼器輸出對數(shù)據(jù)進(jìn)行重構(gòu)。

        圖1 CT-ED模型整體框架

        2.3 頻域數(shù)據(jù)增強(qiáng)

        在信號處理中,時序數(shù)據(jù)可以從時域和頻域兩個角度分析。有時,時域上復(fù)雜的信號從頻域角度看會比較簡單,因此對于時間序列的數(shù)據(jù)增強(qiáng)方式也可以從時域和頻域兩個角度進(jìn)行。模型CAE-AD[5]將數(shù)據(jù)通過注意力機(jī)制映射后,從時域和頻域兩個角度進(jìn)行數(shù)據(jù)增強(qiáng)。由于傳感器數(shù)據(jù)本身含有噪聲以及電動汽車行駛時隨機(jī)性較大,并且經(jīng)過實(shí)驗(yàn)發(fā)現(xiàn)如果對數(shù)據(jù)分別進(jìn)行時域和頻域增強(qiáng),模型訓(xùn)練會極不穩(wěn)定。本文的模型選擇在原始數(shù)據(jù)上進(jìn)行頻域增強(qiáng)和原數(shù)據(jù)構(gòu)成一對實(shí)例的不同視圖,另外在3.7節(jié)對比了不同數(shù)據(jù)增強(qiáng)方式的性能。首先將輸入數(shù)據(jù)進(jìn)行式(3)的二維傅里葉變換:

        2.4 編碼器

        圖2是CT-ED模型編碼器的細(xì)節(jié),主要由數(shù)據(jù)嵌入模塊、特征模塊和時間模塊三部分組成。

        圖2 CT-ED模型編碼器的細(xì)節(jié)

        2.4.1數(shù)據(jù)嵌入模塊

        不同大小的一維卷積在時間維度上滑動捕獲不同范圍的特征,單一大小的卷積核得到的結(jié)果可能遺失信息,因此融合不同大小卷積核的結(jié)果,可以獲得更強(qiáng)健的表示。在編碼器中,首先通過多尺度卷積對數(shù)據(jù)進(jìn)行映射。模型自動學(xué)習(xí)3種卷積核的權(quán)重,通過式(5)的softmax后與各自的卷積結(jié)果相乘后融合。如式(6)所示,數(shù)據(jù)卷積融合后添加位置信息:

        其中w是模型學(xué)習(xí)到的權(quán)重,通過softmax后歸一化。

        其中:Conv()是一維卷積操作,是通過與原始Transformer相同的位置編碼函數(shù)得到的位置信息矩陣。

        2.4.2時間模塊和特征模塊

        多元時間序列包含時間依賴和特征依賴,因此需要從兩個角度捕獲數(shù)據(jù)特征。在時間依賴方面,沿用Transformer的Encoder部分作為模型中時間編碼模塊;在特征依賴方面,如圖3所示,將每個特征序列全局池化后通過兩層非線性激活得到特征注意力,特征注意力和對應(yīng)的特征序列相乘后進(jìn)行殘差相加,對數(shù)據(jù)進(jìn)行調(diào)整。時間模塊和特征模塊作為一個整體,可進(jìn)行多次迭代。最終得到CT-ED模型的Encoder編碼表示。

        圖3 模型編碼器中的特征模塊

        2.4.3對比損失

        2.5 解碼器

        原始Transformer的解碼器需要迭代解碼,后面的輸出依賴前面一個時間步的預(yù)測結(jié)果,導(dǎo)致推理變慢[19]。如圖4所示,模型的解碼器對Transformer的Decoder的改進(jìn),結(jié)合GRU進(jìn)行數(shù)據(jù)重構(gòu)。

        圖4 模型解碼器

        將解碼器輸入decoder通過式(6)的多尺度數(shù)據(jù)嵌入后進(jìn)行不同的線性映射得到111。通過掩碼多頭注意力機(jī)制輸出,如式(9)所示;將模型編碼器輸出的兩個編碼表示加權(quán)相加得到,如式(10)所示:

        其中:MultiHeadAtt()代表多頭注意力,F(xiàn)()是由兩層全連接和激活函數(shù)組成的前饋層。最后訓(xùn)練階段的總體損失計(jì)算公式如式(12)所示:

        2.6 異常檢測

        經(jīng)過實(shí)驗(yàn)發(fā)現(xiàn)計(jì)算窗口內(nèi)最后一步時間的重構(gòu)誤差比計(jì)算窗口的平均誤差效果更好,因此利用單步重構(gòu)誤差作為異常得分。當(dāng)該窗口的異常得分大于設(shè)定的閾值時,判定為異常。對于不同的數(shù)據(jù)集定義初始閾值并逐步尋找最優(yōu)閾值需要消耗人力,因此采用文獻(xiàn)[20]中的自動閾值調(diào)整方法。該方法基于極值理論中不通過原始數(shù)據(jù)分布推斷極端事件的分布的思想,目標(biāo)是給定一系列觀測值和異常發(fā)生的概率,計(jì)算閾值Z,使(>Z)<。首先初始化一個閾值,通常為數(shù)據(jù)的百分?jǐn)?shù),篩選超過初始閾值的時間點(diǎn)作為新的峰值數(shù)據(jù),通過極大似然估計(jì)與廣義帕累托分布進(jìn)行擬合,其次通過這個分布自動調(diào)整閾值。對于誤報(bào)警,采用文獻(xiàn)[4]中的剪枝方法對正常波動進(jìn)行處理。當(dāng)檢測到異常值時,與異常時間點(diǎn)之前的正常時間點(diǎn)序列的最大值進(jìn)行比較,若比值小于(為一個超參數(shù),根據(jù)實(shí)驗(yàn)獲得),則判定為正常波動。

        3 實(shí)驗(yàn)與結(jié)果分析

        本文實(shí)驗(yàn)的對比模型包括MAD-GAN[12]、OmniAnomaly[13]、USAD[17]、GDN[15]和TranAD(Transformer-based Anomaly Detection model)[2]。

        實(shí)驗(yàn)使用PyTorch-1.11.0,隨機(jī)梯度下降優(yōu)化器(Stochastic Gradient Descent, SGD)訓(xùn)練所有模型。

        3.1 實(shí)驗(yàn)指標(biāo)

        通過精確率(Precision, P),召回率(Recall, R)和F1值測評模型效果。

        其中:是被正確檢測的異常時間點(diǎn)數(shù),是被誤判為異常的正常時間點(diǎn)數(shù),是被誤判為正常的異常時間點(diǎn)數(shù)。

        3.2 數(shù)據(jù)集

        安全水處理數(shù)據(jù)集(Secure Water Treatment, SWaT)[21]。一共包括連續(xù)11 d數(shù)據(jù),7 d為正常操作,4 d為階段性受到攻擊,共41次攻擊。參考文獻(xiàn)[22]中的18個連續(xù)值屬性作為特征。

        土壤濕度主動被動衛(wèi)星(Soil Moisture Active Passive satellite, SMAP)/火星漫游車(Mars Science Laboratory rover, MSL)數(shù)據(jù)集[4]。真實(shí)航天器遙測數(shù)據(jù)和異常。數(shù)據(jù)集由多個小數(shù)據(jù)集組成,變量主要是離散型變量。其中SMAP選擇P-1、S-1、E-1:9(除了6),MSL選擇C-1、D-16、M-1:5、T-12:13、P-11。兩個數(shù)據(jù)集都包含點(diǎn)異常和上下文異常兩種類型。

        電動汽車動力電池(EV)數(shù)據(jù)集。電動汽車在行駛狀態(tài)下的動力電池傳感器數(shù)據(jù),包含電流電壓溫度極值等,來自新能源汽車國家大數(shù)據(jù)聯(lián)盟和數(shù)字汽車大賽。

        EV數(shù)據(jù)集和其他3個公開數(shù)據(jù)集都是多元時間序列,圖5顯示了EV數(shù)據(jù)集的電流時間序列和SMAP數(shù)據(jù)集的遙測值,其中灰色部分是異常時間點(diǎn)??梢钥吹紼V數(shù)據(jù)集在時間維度上的表現(xiàn)和SMAP類似,因此在3個公開數(shù)據(jù)集上有效的模型也可以用于EV數(shù)據(jù)集的異常檢測。表1統(tǒng)計(jì)了數(shù)據(jù)集的大小和異常率等信息。

        圖5 EV和SMAP數(shù)據(jù)集的時間序列

        表1數(shù)據(jù)集統(tǒng)計(jì)信息

        Tab.1 Statistics of datasets

        3.3 實(shí)驗(yàn)結(jié)果

        表2展示了CT-ED和其他模型在不同數(shù)據(jù)集上的精確率(P)、召回率(R)和F1值,其中相較于次優(yōu)模型,CT-ED的F1值在SWaT、SMAP、MSL和EV數(shù)據(jù)集上分別提升了6.5%、1.8%、0.9%和7.1%。CT-ED在所有數(shù)據(jù)集上的F1都取得了最優(yōu)成績。CT-ED在不同數(shù)據(jù)集上的F1平均值達(dá)到0.884 1,說明了模型廣泛的適用性。

        SMAP數(shù)據(jù)集大部分是點(diǎn)異常,MSL數(shù)據(jù)集大部分是上下文異常。OmniAnomaly在SMAP數(shù)據(jù)集取得次優(yōu)的成績,在MSL數(shù)據(jù)集表現(xiàn)最差,可能由于模型學(xué)習(xí)數(shù)據(jù)的正常分布,因此能夠識別與正常分布差別較大的點(diǎn)異常,但忽視了符合正常數(shù)據(jù)分布的上下文異常。相反,MAD-GAN可以有效檢測MSL數(shù)據(jù)集異常,在SMAP數(shù)據(jù)集上表現(xiàn)較差,可能因?yàn)閷故接?xùn)練放大了生成數(shù)據(jù)和真實(shí)數(shù)據(jù)的差別,將數(shù)據(jù)中的噪聲或其他正常狀態(tài)下的窗口數(shù)據(jù)也檢測為異常,導(dǎo)致精度較低。

        USAD和TranAD在SMAP和MSL數(shù)據(jù)集上的表現(xiàn)比較平均,其中TranAD在MSL數(shù)據(jù)集的F1達(dá)到了次優(yōu),可能是其中的多頭注意力能有效捕獲特征相關(guān)性,因此在變量更多的MSL數(shù)據(jù)集上表現(xiàn)優(yōu)于USAD。另外,GDN在兩個數(shù)據(jù)集上也表現(xiàn)得比較平均,說明基于多元數(shù)據(jù)之間相關(guān)性建模,可以有效地識別不同類型的異常。

        CT-ED在SMAP和MSL數(shù)據(jù)集上的F1值都達(dá)到了0.950 0以上,說明模型適用于不同類型的異常。編碼器中的多尺度卷積有效地學(xué)習(xí)窗口內(nèi)的局部特征和全局特征,能有效檢測小范圍的點(diǎn)異常和整體的上下文異常。SWaT數(shù)據(jù)集與SMAP數(shù)據(jù)集和MSL數(shù)據(jù)集類似,但數(shù)據(jù)量更大,大部分模型在該數(shù)據(jù)集上表現(xiàn)相對較差,而CT-ED的F1相較次優(yōu)模型提升了6.5%,驗(yàn)證了它能適應(yīng)不同規(guī)模的數(shù)據(jù)集。

        表2CT-ED在不同數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果

        Tab.2 Experimental results of CT-ED on different datasets

        注:加粗和下畫線分別表示最優(yōu)和次優(yōu)值。

        EV數(shù)據(jù)集相較于其他數(shù)據(jù)集,由于工況的變化和駕駛?cè)瞬煌男袨榱?xí)慣,數(shù)據(jù)的隨機(jī)性更強(qiáng)。大部分模型在該數(shù)據(jù)集上表現(xiàn)不佳,F(xiàn)1值在[0.3,0.7];OmniAnomaly在編碼時添加了高斯噪聲,在EV數(shù)據(jù)集上取得次優(yōu)的成績并遠(yuǎn)優(yōu)于其他模型。類似地,CT-ED在頻域增強(qiáng)時也對數(shù)據(jù)添加了高斯噪聲,增強(qiáng)了模型對抗數(shù)據(jù)噪聲能力和重構(gòu)數(shù)據(jù)多樣性的能力。另外在CT-ED訓(xùn)練階段,通過對同一實(shí)例不同視圖的對比學(xué)習(xí),模型能夠獲得數(shù)據(jù)的一般特征,以及從時間和特征兩個角度進(jìn)行編碼,使模型能夠適應(yīng)不同維度的數(shù)據(jù)。

        3.4 訓(xùn)練過程分析

        異常檢測需要時刻監(jiān)測設(shè)備狀態(tài),設(shè)置時間步為1,對于EV數(shù)據(jù)集,產(chǎn)生的訓(xùn)練時間序列片段數(shù)為343 626,測試片段數(shù)為33 811。對于由多個子集構(gòu)成的數(shù)據(jù)集SMAP和MSL,每個子集構(gòu)造的時間序列片段范圍為[2 000,8 000]。由于數(shù)據(jù)集較小,SMAP和MSL數(shù)據(jù)集通常在1~5輪訓(xùn)練達(dá)到最優(yōu)F1值,EV和SWaT數(shù)據(jù)集在10~20輪訓(xùn)練達(dá)到最優(yōu)F1值。

        以EV數(shù)據(jù)集為例,觀察模型訓(xùn)練過程中的損失值和模型指標(biāo)之間的關(guān)系。如圖6所示,MSELoss為重構(gòu)損失,ConLoss為對比損失,隨著訓(xùn)練召回率下降,精確率上升,F(xiàn)1在18輪達(dá)到最優(yōu)值,后續(xù)損失值繼續(xù)下降,模型的整體性能卻下降了。說明了無監(jiān)督異常檢測不同于有監(jiān)督學(xué)習(xí),可以通過監(jiān)測訓(xùn)練過程中的損失值判斷模型的性能,這是大部分無監(jiān)督異常檢測都存在的問題。

        閾值的選擇對異常檢測任務(wù)十分重要,對比不同的自動閾值選擇方法的性能,在一個模型產(chǎn)生的異常分?jǐn)?shù)上進(jìn)行實(shí)驗(yàn)。POT為本文采用的自動閾值選擇方法;EWMA是對異常分?jǐn)?shù)進(jìn)行平滑處理后選擇均值加方差作為閾值;均方是不對異常分?jǐn)?shù)做處理,直接使用均值加方差作為閾值;NDT是文獻(xiàn)[4]中的閾值選擇方法。表3顯示了在相同模型上,通過均方和EWMA計(jì)算閾值效果很差。NDT的F1值最高,但召回率較低;POT相對平衡了召回率和精確率;而POT+剪枝可以在POT的基礎(chǔ)上減少錯誤報(bào)警,提高精確率。因此對異常檢測任務(wù)來說,POT閾值加上適當(dāng)?shù)募糁Ω鼉?yōu)。

        圖6 EV數(shù)據(jù)集上的訓(xùn)練過程

        表3相同模型在不同閾值選擇方法下的實(shí)驗(yàn)結(jié)果

        Tab.3 Experimental results of same model with different threshold selection methods

        3.5 單變量對比實(shí)驗(yàn)

        EV數(shù)據(jù)集中含有多個變量,選擇其中的電壓、電流和絕緣電阻單變量時間序列進(jìn)行實(shí)驗(yàn)。表4顯示了CT-ED的變量實(shí)驗(yàn)結(jié)果,單變量情況下,最優(yōu)F1為電流時間序列的0.695 4。單變量相較于多元變量缺少相關(guān)性信息,需要更大的窗口提供更多時間信息,但仍然達(dá)不到多元變量可以提供的信息量。

        表4CT-ED的變量實(shí)驗(yàn)結(jié)果

        Tab.4 Variate experimental results of CT-ED

        表5顯示了不同模型在EV數(shù)據(jù)集電流時間序列上的表現(xiàn)。TranAD和OmniAnomaly都取得較優(yōu)F1值,但對于異常檢測任務(wù),檢測的異常數(shù)更為重要,召回率反映了異常被檢測的概率,CT-ED在多元數(shù)據(jù)上,同等F1值下具有更高的召回率。

        表5不同模型在電流單變量時間序列上的實(shí)驗(yàn)結(jié)果

        Tab.5 Experimental results of different models on current univariate time series

        3.6 參數(shù)敏感度

        本節(jié)研究不同參數(shù)對CT-ED性能的影響。模型的主要參數(shù)包括編碼器的窗口大小、解碼器的窗口大小和批大小。本節(jié)的所有實(shí)驗(yàn)均在EV數(shù)據(jù)集上進(jìn)行。

        在對比學(xué)習(xí)中,批大?。╞atchsize)越大,模型效果越好。如圖7所示,其中b為批大小,d為解碼器的窗口大小。可見在大部分情況下,小批次的實(shí)驗(yàn)結(jié)果更好,這和對比學(xué)習(xí)的結(jié)論相悖,可能是因?yàn)閿?shù)據(jù)的動態(tài)性較強(qiáng),一批數(shù)據(jù)中每個窗口的差異較大,因此噪聲較大的小批次訓(xùn)練更適合動態(tài)性強(qiáng)的EV數(shù)據(jù)集。

        圖7 不同參數(shù)下CT-ED在EV數(shù)據(jù)集上的F1值

        編碼器的輸入作為重構(gòu)數(shù)據(jù)的歷史信息,不同長度會產(chǎn)生不同的效果。從圖7可見,模型的性能比較不穩(wěn)定,沒有隨著編碼器窗口大小變化趨勢而變化的規(guī)律,但是在窗口為6時取得最好成績。說明了不同于一些長序列任務(wù),由于數(shù)據(jù)隨機(jī)性大,冗余的歷史信息反而會使模型性能降低。

        解碼器輸入進(jìn)行重構(gòu)后在訓(xùn)練階段計(jì)算重構(gòu)損失直接影響模型的參數(shù),因此需要選擇合適的解碼器窗口大小。對比解碼器窗口大小為3和6的結(jié)果,可以看到在大部分情況下,窗口為6的實(shí)驗(yàn)結(jié)果更優(yōu)。

        3.7 消融實(shí)驗(yàn)

        為了研究模型主要模塊的效果,刪除了一些主要模塊,觀察模型在EV數(shù)據(jù)集上的結(jié)果變化。

        CT-ED-WO-Conv:將編碼器的多尺度卷積替換為卷積核為3的單一卷積映射。

        CT-ED-WO-Contrastive:刪除頻域增強(qiáng)和訓(xùn)練時的對比損失,通過單個編碼器解碼器結(jié)構(gòu)進(jìn)行訓(xùn)練和檢測。

        CT-ED-WO-Feature:刪除編碼器中的特征注意力模塊。

        CT-ED-WO-Time:刪除編碼器中時間注意力模塊。

        如表6所示,CT-ED在EV數(shù)據(jù)集上性能最佳。

        表6 CT-ED在EV數(shù)據(jù)集上的消融實(shí)驗(yàn)結(jié)果

        其中:CT-ED-WO-Time性能下降最明顯,說明了在對時間序列數(shù)據(jù)建模時,捕獲它的時間依賴的重要性;CT-ED-WO-Conv精度有明顯下降,說明多尺度卷積有效提取不同范圍特征,提高異常檢測精度;CT-ED-WO-Contrastive性能也明顯下降,說明對比學(xué)習(xí)有利于模型獲取數(shù)據(jù)的一般特征;CT-ED-WO-Feature性能下降最少,但編碼器中的特征注意力模塊仍然是整個模型中不可或缺的一部分。

        在相同的參數(shù)和輪次下,對比不同時間序列數(shù)據(jù)增強(qiáng)方式,結(jié)果如表7所示。其中:FFT是頻域增強(qiáng),移動窗口是將窗口數(shù)據(jù)往前移,噪聲是指對原始序列直接添加高斯噪聲。3個數(shù)據(jù)增強(qiáng)方式在性能上沒有明顯差別。

        表7 不同數(shù)據(jù)增強(qiáng)方式的結(jié)果對比

        4 結(jié)語

        目前動力電池的相關(guān)研究大部分需要專業(yè)知識,并且使用實(shí)驗(yàn)數(shù)據(jù)進(jìn)行建模,不能很好地適應(yīng)實(shí)際工況。本文針對電動汽車行駛狀態(tài)下的動力電池?cái)?shù)據(jù),將相對成熟的時間序列異常檢測領(lǐng)域的技術(shù)改進(jìn)后應(yīng)用于動力電池安全預(yù)警。

        本文提出了一個適用于不同數(shù)據(jù)集的多元時間序列異常檢測模型。通過頻域數(shù)據(jù)增強(qiáng)產(chǎn)生一個實(shí)例的不同視圖,利用對比學(xué)習(xí)捕獲動態(tài)數(shù)據(jù)的一般特征;另外,模型在時間和特征兩個角度進(jìn)行編碼,使編碼更加全面。

        對于關(guān)系人身安全的動力電池安全預(yù)警任務(wù),目前的實(shí)驗(yàn)結(jié)果并不是很理想,F(xiàn)1值僅達(dá)到0.742 8。但本文模型無須特征工程或其他預(yù)備知識,并且模型可以識別不同于正常模式的異常行為而無須事先知道異常類型。CT-ED較其他模型在EV數(shù)據(jù)集上性能有了大幅提升,驗(yàn)證了通過深度學(xué)習(xí)進(jìn)行新能源汽車安全監(jiān)測的可行性。

        模型的精確率較低,本文嘗試對部分異常值剪枝以減少誤報(bào)警,但效果不明顯,而且模型目前只針對一輛車的運(yùn)行狀態(tài)進(jìn)行建模。在未來的工作中,將提高模型的運(yùn)算效率,選擇合適的閾值調(diào)整方法和誤報(bào)警處理方法;另外,將融合遷移學(xué)習(xí)修改模型使模型可以適應(yīng)不同狀態(tài)和不同車輛的電動汽車數(shù)據(jù)。

        [1] 王震坡,李曉宇,袁昌貴,等. 大數(shù)據(jù)下電動汽車動力電池故障診斷技術(shù)挑戰(zhàn)與發(fā)展趨勢[J]. 機(jī)械工程學(xué)報(bào), 2021, 57(14):52-63.(WANG Z P, LI X Y, YUAN G C, et al. Challenge and prospects for fault diagnosis of power battery system for electrical vehicles based on big-data[J]. Journal of Mechanical Engineering, 2021, 57(14):52-63.)

        [2] TULI S, CASALE G, JENNINGS N R. TranAD: deep transformer networks for anomaly detection in multivariate time series data[J]. Proceedings of the VLDB Endowment, 2022, 5(16):1201-1214.

        [3] 毛文濤,施華東,張艷娜,等. 軸承在線早期故障檢測的無監(jiān)督張量深度遷移學(xué)習(xí)方法[J/OL]. 控制與決策(2022-11-27)[2023-03-04].https://kns.cnki.net/kcms/detail/detail.aspx?doi=10.13195/j.kzyjc.2022.1101.(MAO W T, SHI H D, ZHANG Y N, et al. Research on unsupervised tensor-based deep transfer learning for online early fault detection of bearing[J/OL]. Control and Decision (2022-11-27)[2023-03-04].https://kns.cnki.net/kcms/detail/detail.aspx?doi=10.13195/j.kzyjc.2022.1101.)

        [4] HUNDMAN K, CONSTANTINOU V, LAPORTE C, et al. Detecting spacecraft anomalies using LSTMs and nonparametric dynamic thresholding [C]// Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2018: 387-395.

        [5] ZHOU H, YU K, ZHANG X, et al. Contrastive autoencoder for anomaly detection in multivariate time series[J]. Information Sciences, 2022, 610: 266-280.

        [6] VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need [C]// Proceedings of the 31st International Conference on Neural Information Processing Systems. Red Hook, NY: Curran Associates Inc., 2017: 6000-6010.

        [7] CHEN T, KORNBLITH S, NOROUZI M, et al. A simple framework for contrastive learning of visual representations[C]// Proceedings of the 37th International Conference on Machine Learning. New York: JMLR.org, 2020: 1597-1607.

        [8] HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]// Proceedings of the 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2018: 7132-7141.

        [9] LIN S, CLARK R, BIRKE R, et al. Anomaly detection for time series using VAE-LSTM hybrid model [C]// Proceedings of the 2020 IEEE International Conference on Acoustics, Speech, and Signal Processing. Piscataway: IEEE, 2020: 4322-4326.

        [10] XU H, CHEN W, ZHAO N, et al. Unsupervised anomaly detection via variational auto-encoder for seasonal KPIs in Web applications[C]// Proceedings of the 2018 World Wide Web Conference. Republic and Canton of Geneva: International World Wide Web Conferences Steering Committee, 2018: 187-196.

        [11] PARK D, HOSHI Y, KEMP C C. A multimodal anomaly detector for robot-assisted feeding using an LSTM-based variational autoencoder[J]. IEEE Robotics and Automation Letters, 2018, 3(3): 1544-1551.

        [12] LI D, CHEN D, JIN B, et al. MAD-GAN: multivariate anomaly detection for time series data with generative adversarial networks[C]// Proceedings of the 2019 International Conference on Artificial Neural Networks, LNCS 11730. Cham: Springer, 2019: 703-716.

        [13] SU Y, ZHAO Y, NIU C, et al. Robust anomaly detection for multivariate time series through stochastic recurrent neural network[C]// Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2019: 2828-2837.

        [14] ZHANG C, SONG D,CHEN Y, et al. A deep neural network for unsupervised anomaly detection and diagnosis in multivariate time series data[C]// Proceedings of the 33rd AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 1409-1416.

        [15] DENG A, HOOI B. Graph neural network-based anomaly detection in multivariate time series [C]// Proceedings of the 35th AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2021: 44027-4035.

        [16] ZHAO H, WANG Y, DUAN J, et al. Multivariate time-series anomaly detection via graph attention network [C]// Proceedings of the 2020 IEEE International Conference on Data Mining. Piscataway: IEEE, 2020: 841-850.

        [17] AUDIBERT J, MICHIARDI P, GUYARD F, et al. USAD: unsupervised anomaly detection on multivariate time series[C]// Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2020: 3395-3404.

        [18] WANG X, PI D, ZHANG X, et al. Variational Transformer-based anomaly detection approach for multivariate time series[J]. Measurement, 2022, 191: No.110791.

        [19] ZHOU H, ZHANG S, PENG J, et al. Informer: beyond efficient transformer for long sequence time-series forecasting[C]// Proceedings of the 35th AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2021: 11106-11115.

        [20] SIFFER A, FOUQUE P A, TERMIER A, et al. Anomaly detection in streams with extreme value theory [C]// Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2017: 1067-1075.

        [21] MATHUR A P, TIPPENHAUER N O. SWaT: a water treatment testbed for research and training on ICS security [C]// Proceedings of the 2016 International Workshop on Cyber-Physical Systems for Smart Water Networks. Piscataway: IEEE, 2016: 31-36.

        [22] AHMED C M, ZHOU J, MATHUR A P. Noise matters: using sensor and process noise fingerprint to detect stealthy cyber attacks and authenticate sensors in CPS[C]// Proceedings of the 34th Annual Computer Security Applications Conference. New York: ACM, 2018: 566-581.

        Power battery safety warning based on time series anomaly detection

        ZHANG Anqin1,2, WANG Xiaohui1*

        (1,,201306,;2,515063,)

        Abnormal situations inside the vehicle battery cannot be predicted and warned in time, which leads to electric vehicle accidents and brings serious threats to drivers and passengers’ life and property safety. Aiming at the above problem, a Contrastive Transformer Encoder Decoder (CT-ED) model was proposed for multivariate time series anomaly detection. Firstly, different views of an instance were constructed through data augmentation, and the local invariant features of the data were captured by contrastive learning. Then, based on Transformer, the data were encoded from two perspectives of time dependence and feature dependence. Finally, the data were reconstructed by the decoder, and the reconstruction error was calculated as the anomaly score to detect anomalies of the machine under the actual operating conditions. Experimental results on SWaT, SMAP, MSL three public datasets and Electric Vehicle power battery (EV) dataset show that compared to the suboptimal model, the F1-scores of the proposed model increase by 6.5%, 1.8%, 0.9%, and 7.1% respectively.The above results prove that CT-ED is suitable for anomaly detection under different operating conditions, and balancing the precision and recall of anomaly detection.

        time series; anomaly detection; contrastive learning; multi-head attention; autoencoder

        This work is partially supported by Open Fund Project of Guangdong Province Key Research Base of Humanities and Social Sciences — Local Government Development Research Institute of Shantou University (07422002).

        ZHANG Anqin, born in 1974, Ph. D., associate professor. Her research interests include data mining, ubiquitous computing.

        WANG Xiaohui, born in 1998, M. S. candidate. Her research interests include data mining, anomaly detection.

        TP183; TP206

        A

        1001-9081(2023)12-3799-07

        10.11772/j.issn.1001-9081.2022111796

        2022?12?06;

        2023?03?16;

        2023?03?23。

        廣東省人文社會科學(xué)重點(diǎn)研究基地—汕頭大學(xué)地方政府發(fā)展研究所開放基金課題(07422002)。

        張安勤(1974—),女,安徽六安人,副教授,博士,主要研究方向:數(shù)據(jù)挖掘、普適計(jì)算;王小慧(1998—),女,浙江臺州人,碩士研究生,主要研究方向:數(shù)據(jù)挖掘、異常檢測。

        猜你喜歡
        解碼器集上編碼器
        科學(xué)解碼器(一)
        科學(xué)解碼器(二)
        科學(xué)解碼器(三)
        Cookie-Cutter集上的Gibbs測度
        鏈完備偏序集上廣義向量均衡問題解映射的保序性
        線圣AudioQuest 發(fā)布第三代Dragonfly Cobalt藍(lán)蜻蜓解碼器
        基于FPGA的同步機(jī)軸角編碼器
        復(fù)扇形指標(biāo)集上的分布混沌
        基于PRBS檢測的8B/IOB編碼器設(shè)計(jì)
        JESD204B接口協(xié)議中的8B10B編碼器設(shè)計(jì)
        電子器件(2015年5期)2015-12-29 08:42:24
        国产毛多水多高潮高清| 亚洲一区二区三区偷拍自拍| 亚洲女人毛茸茸的视频| 亚洲av无码偷拍在线观看| 欧美在线 | 亚洲| 啪啪无码人妻丰满熟妇| 国内专区一区二区三区| 美女视频在线观看亚洲色图| 国产女人高潮叫床免费视频| 国产一区曰韩二区欧美三区| 91青青草免费在线视频| 中国亚洲一区二区视频| 亚洲av无码专区在线播放中文 | 日韩亚洲精选一区二区三区 | 亚洲午夜无码毛片av久久| 免费国产裸体美女视频全黄| 国产亚洲精品福利在线| 日韩女优一区二区在线观看| 色哟哟最新在线观看入口| 丰满女人又爽又紧又丰满| 久久精品国产只有精品96 | 欧美性爱一区二区三区无a| 日本久久视频在线观看 | 开心五月骚婷婷综合网| 亚洲国产精品无码久久98| 丰满岳乱妇在线观看中字无码| 熟女少妇丰满一区二区| 一区二区三区国产在线视频 | 国产精品毛片大尺度激情| 亚洲人成在久久综合网站| 粉嫩虎白女毛片人体| 国产a级精精彩大片免费看| 久久国产精品免费一区二区三区| 十八禁无遮挡99精品国产| 国产乱子伦精品免费无码专区 | 婷婷成人基地| 在线不卡中文字幕福利| 国内久久婷婷六月综合欲色啪| 欧美日韩精品| 禁止免费无码网站| 青青草原综合久久大伊人精品|