摘" 要: 傳統(tǒng)的聚類異常數(shù)據(jù)檢測算法在處理高維度、大數(shù)據(jù)量且異常值分布雜亂的機電設(shè)備環(huán)境參數(shù)時,存在聚類效果差和檢測效率低的問題。為此,在原有異常檢測算法的基礎(chǔ)上提出一種基于先驗聚類的機電設(shè)備環(huán)境參數(shù)異常檢測算法。該算法改用歷史數(shù)據(jù)構(gòu)建先驗聚類,確保聚類構(gòu)建不會受太多異常環(huán)境參數(shù)所影響;在選取聚類中心時引入密集度的概念,以確保聚類中心的可靠性,并在選取聚類中心過程中去除已選聚類中心周圍的數(shù)據(jù)點,防止選取的聚類中心集中在某一區(qū)域,以此提升聚類效果。進行異常檢測時,依次將待檢測數(shù)據(jù)放入先驗聚類中進行匹配,一旦測試數(shù)據(jù)無法匹配任何一個已知聚類,則將其標(biāo)記為異常數(shù)據(jù)。實驗結(jié)果表明:所提算法在機電設(shè)備環(huán)境參數(shù)的異常檢測方面具有檢測率高、誤報率低的特點,在2 000例數(shù)據(jù)異常檢測中,其檢測準(zhǔn)確率達(dá)到了97.5%,優(yōu)于DBSCAN算法的97%以及基礎(chǔ)K?means算法的86%;同時,誤檢率低至0.010 6,優(yōu)于DBSCAN算法的0.023 9和基礎(chǔ)K?means算法的0.022 8。改進后的模型較基礎(chǔ)K?means算法和DBSCAN算法在機電設(shè)備環(huán)境參數(shù)異常檢測中檢測效果更佳,在機電設(shè)備環(huán)境異常數(shù)據(jù)檢測上具有良好的性能。
關(guān)鍵詞: 機電設(shè)備; 環(huán)境參數(shù); 異常數(shù)據(jù)檢測; 先驗聚類;" K?means算法; 密集度; 聚類匹配
中圖分類號: TN915.08?34; TP301" " " " " " " " 文獻(xiàn)標(biāo)識碼: A" " " " " " " " " " "文章編號: 1004?373X(2025)06?0078?07
Prior clustering based environmental parameter anomaly detection algorithm of electromechanical equipment
XING Peng, LI Xine
(State Key Laboratory of Electronic Measurement Technology, North University of China, Taiyuan 030051, China)
Abstract: The traditional clustering anomaly data detection algorithm has the problem of poor clustering effect and low detection efficiency when dealing with the environmental parameters of electromechanical equipment with high dimension, large data amount and chaotic distribution of outliers. Therefore, on the basis of the traditional anomaly detection algorithm, a prior clustering based environmental parameter anomaly detection algorithm of electromechanical equipment is proposed. In this algorithm, the historical data is used to construct prior clustering to ensure that the cluster construction cannot be affected by too many abnormal environmental parameters. The concept of density is introduced to ensure the reliability of cluster centers when selecting cluster centers, and the data points around the selected cluster centers are removed in the process of selecting cluster centers to prevent the selected cluster centers from being concentrated in a certain area, so as to improve the clustering effect. In the process of anomaly detection, the data to be detected are put into the prior clustering for matching. Once the testing data cannot match any of the known clusters, it is marked as abnormal data. The experimental results show that the proposed algorithm has the characteristics of high detection rate and low 1 positive rate in the abnormal detection of electromechanical equipment environmental parameters. In the abnormal detection of 2 000 cases of data, the detection accuracy rate can reach 97.5%, which is better than 97% of DBSCAN algorithm and 86% of basic K?means algorithm. Its 1 detection rate is as low as 0.010 6, which is better than 0.023 9 of DBSCAN algorithm and 0.022 8 of basic K?means algorithm. In comparison with basic K?means algorithm and DBSCAN algorithm, the improved model has better detection effect in the environmental parameters anomaly detection of electromechanical equipment, and has good performance in the detection of environmental abnormal data of electromechanical equipment.
Keywords: electromechanical equipment; environmental parameters; anomaly data detection; priori clustering; K?means algorithm; degree of density; cluster matching
0" 引" 言
隨著微電子、MEMS技術(shù)及無線通信技術(shù)的不斷發(fā)展,無線傳感器網(wǎng)絡(luò)(WSN)憑借其節(jié)點微型化、低成本及靈活部署的優(yōu)勢,目前已廣泛應(yīng)用于機電設(shè)備的環(huán)境參數(shù)檢測中[1]。傳感器節(jié)點往往通過機械固定、物理貼附等方式附著于機電設(shè)備之上,承擔(dān)著關(guān)鍵環(huán)境參數(shù)的實時采集與傳輸任務(wù)[2]。然而,一旦傳感器或其所在環(huán)境中設(shè)備遭遇故障,或是周邊環(huán)境突變,節(jié)點將不可避免地產(chǎn)生異常數(shù)據(jù),若未能及時甄別與處理,不僅會威脅設(shè)備安全,還會造成顯著的經(jīng)濟損失[3]。同時,由于數(shù)據(jù)信息的多維性和復(fù)雜性,簡單的異常檢測手段無法迅速準(zhǔn)確地將異常數(shù)據(jù)檢測出來。因此,如何構(gòu)建異常數(shù)據(jù)檢測算法來高效識別并剔除海量數(shù)據(jù)中的異常信息,對于確保機電設(shè)備環(huán)境穩(wěn)定以及發(fā)生故障時的迅速處理至關(guān)重要。
目前國內(nèi)外關(guān)于傳感器數(shù)據(jù)異常檢測算法已取得豐富成果,主要分為以下四類:基于分類的方法[4?5]、基于機器學(xué)習(xí)的方法[6?7]、基于統(tǒng)計的方法[8]以及基于聚類的方法[9?12]。其中基于聚類的異常檢測算法對輸入數(shù)據(jù)進行分簇,通過識別那些不能很好地融入到任何聚類的數(shù)據(jù)點來進行異常檢測,能夠較好地應(yīng)用于傳感器異常數(shù)據(jù)的檢測,且聚類分析的異常值檢測速度較快,每個待檢測數(shù)據(jù)需進行比較,聚類數(shù)一般較小,在近幾年的異常檢測中應(yīng)用較為廣泛。
文獻(xiàn)[9]使用改進K?means聚類算法對無線傳感器數(shù)據(jù)進行異常檢測,但數(shù)據(jù)維度較低,沒有深入探究高維度下的無線傳感器數(shù)據(jù)異常檢測。文獻(xiàn)[10]改進了算法中選取聚類中心的規(guī)則,在選取聚類中心時挑選密集度中相距最遠(yuǎn)的數(shù)據(jù)作為聚類核心,雖規(guī)避了初始聚類中心選取到離散點的可能,但可能導(dǎo)致聚類中心僅僅分布在相距較遠(yuǎn)的兩簇密集區(qū)內(nèi),導(dǎo)致聚類中心分布不均勻。文獻(xiàn)[11]使用DBSCAN算法進行異常數(shù)據(jù)檢測,選取合適的鄰域半徑和最小樣本數(shù),具有良好的異常數(shù)據(jù)檢測效果;然而該算法在聚類間差距較大時,聚類質(zhì)量較差。文獻(xiàn)[12]在迭代聚類中心時通過使用改進閾值的收斂方式,從而降低了聚類迭代次數(shù)以及算法聚類收斂迭代層數(shù);然而該算法并未關(guān)注初始聚類中心對聚類結(jié)果的影響,可能存在聚類結(jié)果較差的情況。
針對以上算法中的缺點,本文提出一種基于先驗聚類的機電設(shè)備環(huán)境參數(shù)異常檢測算法,改進了聚類算法中初始聚類核心的選取方法,保證了聚類結(jié)果的準(zhǔn)確性。在異常數(shù)據(jù)檢測策略中,本文算法首先通過部分先驗數(shù)據(jù)構(gòu)建標(biāo)準(zhǔn)聚類結(jié)果,然后根據(jù)標(biāo)準(zhǔn)聚類結(jié)果對含錯誤數(shù)據(jù)的傳感器數(shù)據(jù)進行異常檢測。實驗結(jié)果表明,該算法較以往算法檢測率有一定提升,誤檢率也較低。
1" 數(shù)據(jù)模型及算法原理
1.1" 機電設(shè)備存儲環(huán)境多維數(shù)據(jù)模型
在機電設(shè)備網(wǎng)絡(luò)監(jiān)測環(huán)境中,往往通過機械固定、物理貼附等方式將傳感器節(jié)點貼附在機電設(shè)備機身,并按照固定采樣周期采集多維環(huán)境參數(shù)(如溫度、濕度、光照度、電壓、加速度等),再通過無線傳輸?shù)姆绞絺鬏數(shù)接脩魴z測端并進行異常檢測。機電設(shè)備環(huán)境參數(shù)監(jiān)測模型如圖1所示。
某一時間段內(nèi)單個傳感器節(jié)點的m維數(shù)據(jù)檢測模型可表示為:
式中:[t1,t2,…,tn]代表不同的采樣時刻;[d1,d2,…,dm]表示數(shù)據(jù)的維度。為方便使用,后續(xù)以[xi]表示[ti]時的m維數(shù)據(jù)集合。
1.2" 傳統(tǒng)K?means異常檢測算法原理及缺陷
K?means算法又稱K均值算法[13],可以根據(jù)數(shù)據(jù)之間的相關(guān)性將數(shù)據(jù)分成若干個聚類,并且使相同聚類的數(shù)據(jù)體現(xiàn)高相關(guān)性,不同聚類的數(shù)據(jù)體現(xiàn)高差異性。當(dāng)數(shù)據(jù)點與所屬聚類的聚類中心之間的距離遠(yuǎn)大于聚類內(nèi)數(shù)據(jù)到聚類中心的平均距離時,將其視為異常值。
傳統(tǒng)K?means算法的具體流程如下。
算法1:基礎(chǔ)K?means異常檢測算法
輸入:數(shù)據(jù)樣本集X={[x1,x2,…,xn]},聚類數(shù)目為K。
Step1:對樣本集X進行預(yù)處理,得到預(yù)處理樣本集[X′]=
{[x1,x2,…,xn]},從[X′]中隨機選取K個樣本視為初始聚類核心。
Step2:For i=1,2,[…],n
Do計算數(shù)據(jù)[xi]與K個聚類中心的歐氏距離值并求最小值,將[xi]放入距離值最小的聚類中心所在的聚類中,索引號記入IDX。
End
Step3:計算每個聚類內(nèi)數(shù)據(jù)的平均值,并將其作為新的聚類中心,判斷新的聚類中心是否滿足聚類收斂函數(shù)。聚類收斂函數(shù)如下:
式中:[ci]為循環(huán)前的聚類中心;[c'i]為新的聚類中心;[rTh]為聚類中心的收斂閾值。新的聚類中心滿足該函數(shù)則循環(huán)Step3,反之退出并輸出聚類中心c={[c1,c2,…,cK]}以及數(shù)據(jù)聚類索引IDX。
Step4:For i=1,2,…,n
Do計算數(shù)據(jù)[xi]聚類中心[cj]的歐氏距離,使用拉伊達(dá)準(zhǔn)則判斷數(shù)據(jù)是否異常,拉伊達(dá)準(zhǔn)則如下:
式中:[d-]為聚類中所有點到該聚類中心距離的平均值;s為標(biāo)準(zhǔn)差。s的求解公式為:
當(dāng)被測數(shù)據(jù)滿足上述拉伊達(dá)準(zhǔn)則公式時,將該數(shù)據(jù)點視為異常數(shù)據(jù),放入異常值集合U中。
End
Step5:輸出異常值集合U。
輸出:異常值集合U。
然而,傳統(tǒng)的K?means異常檢測算法仍然存在以下缺陷。
1) 聚類算法的聚類效果高度依賴于初始的聚類中心,傳統(tǒng)的聚類算法通過隨機挑選的方法進行初始聚類中心的選取,如果初始聚類中心選擇不佳,算法可能會找到一個局部最優(yōu)解,而不是全局最優(yōu)解,從而導(dǎo)致聚類結(jié)果不夠理想,影響異常檢測效果。
2) 數(shù)據(jù)中的離群點會嚴(yán)重影響聚類的準(zhǔn)確性,它們與其他數(shù)據(jù)點的分布明顯不同。如果將這些離群點選為初始聚類中心,那么算法可能會試圖將其他所有數(shù)據(jù)點都?xì)w到這些離群點附近,從而導(dǎo)致聚類效果差,影響異常檢測效果。
3) 傳統(tǒng)K?means異常檢測算法使用無監(jiān)督的策略,當(dāng)檢測數(shù)據(jù)中錯誤數(shù)據(jù)占比較小時,傳統(tǒng)K?means異常檢測算法可以很輕松地將錯誤數(shù)據(jù)檢測出來;但是,當(dāng)檢測數(shù)據(jù)中的錯誤數(shù)據(jù)占比較大時,基礎(chǔ)K?means異常檢測算法基于內(nèi)含大量錯誤數(shù)據(jù)構(gòu)建的聚類結(jié)果往往效果較差,從而導(dǎo)致異常數(shù)據(jù)檢測算法的檢測結(jié)果準(zhǔn)確率下降。
2" 基于先驗聚類的機電設(shè)備環(huán)境參數(shù)異常檢測算法
本文依據(jù)機電設(shè)備存儲環(huán)境多維數(shù)據(jù)模型,提出了一種基于先驗聚類的機電設(shè)備存儲環(huán)境參數(shù)異常檢測算法。該算法主要分為兩個階段:第一階段對大量標(biāo)定數(shù)據(jù)進行聚類分析,構(gòu)建先驗聚類結(jié)果;第二階段依據(jù)求得的先驗聚類結(jié)果,輸入待檢測數(shù)據(jù)進行異常檢測,輸出異常檢測結(jié)果。
本文基于傳統(tǒng)檢測算法對聚類生成過程中的缺陷進行了以下改進。
1) 使用標(biāo)定數(shù)據(jù)生成聚類
為解決使用測試數(shù)據(jù)進行聚類構(gòu)建以及異常值檢測時測試數(shù)據(jù)中異常數(shù)據(jù)占比較大造成的影響,改用標(biāo)注過的大量正確數(shù)據(jù)構(gòu)建標(biāo)準(zhǔn)的先驗聚類結(jié)果。
2) 改進聚類中心的選取規(guī)則
根據(jù)密集度公式[13]挑選密集數(shù)據(jù)點,形成密集集,避免聚類中心選取到離群點。在密集集中選取密集度最大的數(shù)據(jù)對象作為聚類中心并將鄰近部分?jǐn)?shù)據(jù)點剔除(防止聚類中心重復(fù)選取某一區(qū)域),形成新的密集集。
重復(fù)以上步驟直至選取完K個聚類中心。
2.1" 構(gòu)建先驗聚類結(jié)果
通過使用改進的聚類中心選取規(guī)則對標(biāo)定過的歷史數(shù)據(jù)進行聚類分析,在選取聚類中心前計算各數(shù)據(jù)點的密集值,去除離群點,將其他數(shù)據(jù)的集合視為密集集并在密集集中選取聚類中心;之后將其他數(shù)據(jù)按照歐氏距離分配給最近的聚類中心從而形成聚類,構(gòu)建先驗聚類結(jié)果。
先驗聚類結(jié)果構(gòu)建算法具體流程如下。
算法2:先驗聚類結(jié)果構(gòu)建算法
輸入:先驗數(shù)據(jù)樣本集X={[x1,x2,…,xn]},聚類數(shù)目為K,數(shù)據(jù)
刪減量為m。
Step1:根據(jù)不同維度數(shù)據(jù)對聚類結(jié)果影響程度的差異性[14],
對樣本集X進行預(yù)處理,得到預(yù)處理樣本集[X′]={[x1,x2,…,xn]}。
計算鄰域半徑R,公式為:
Step2:創(chuàng)建密集度矩陣Mn×1,用于存儲每個數(shù)據(jù)點的密集度。
For i=1,2,…,n
Do對數(shù)據(jù)[xi]進行以下計算:以[xi]為圓心,R為半徑,尋找所有
在上述圓內(nèi)的數(shù)據(jù)(即滿足[dxi,xj≤R]的點),構(gòu)成[xi]的鄰
域集合G([xi]),計算數(shù)據(jù)點[xi]與G([xi])內(nèi)其他所有數(shù)據(jù)點的歐氏
距離,計算[xi]的密集度并儲存到密集度矩陣的第i行中,點[xi]
在其鄰域集合G([xi])下的密集度公式如下:
式中:R為鄰域半徑;k為G([xi])中的數(shù)據(jù)數(shù)量。
End
Step3:根據(jù)Step2中求得的密集度矩陣,計算數(shù)據(jù)集X內(nèi)所有
數(shù)據(jù)的平均密集度。平均密集度計算公式為:
將所有數(shù)據(jù)的密集度與平均密集度做比較,密集度大于平
均密集度的數(shù)據(jù)保留,將其他數(shù)據(jù)剔除,形成密集集D。
Step4:For i=1,2,…,K
Do計算密集集中所有數(shù)據(jù)的密集度,求得集中的最大密集
度,并將最大密集度對應(yīng)的數(shù)據(jù)作為第i個聚類中心[ci]。
尋找該聚類中心鄰域半徑R內(nèi)的所有數(shù)據(jù),將該聚類中心及
其鄰域半徑內(nèi)最近的m個數(shù)據(jù)剔除,形成新的密集集[D′],并
替換原有密集集。
End
Step5:根據(jù)Step4生成的聚類中心c={[c1,c2,…,cK]}以及樣本集
X進行以下運算。
For i=1,2,…,n
Do計算數(shù)據(jù)[xi]與K個聚類中心的歐氏距離值并求最小值,將
[xi]放入距離值最小的聚類中心所在的聚類中,索引號記入IDX。
End
Step6:計算每個聚類內(nèi)數(shù)據(jù)的平均值,并將其作為新的聚類
中心,判斷新的聚類中心是否滿足聚類收斂函數(shù)。聚類收
斂函數(shù)如下:
式中:[ci]為循環(huán)前的聚類中心;[c'i]為新的聚類中心;[rTh]為聚類
中心的收斂閾值。新的聚類中心滿足該函數(shù)則回到Step5,
反之退出并輸出聚類中心c={[c1,c2,…,cK]}以及數(shù)據(jù)聚類索引
IDX。
輸出:先驗聚類結(jié)果,聚類中心c={[c1,c2,…,cK]}及數(shù)據(jù)聚類索
引IDX。
2.2" 異常數(shù)據(jù)檢測算法
對本階段基于算法2獲得的先驗聚類結(jié)果進行待檢測數(shù)據(jù)的異常檢測,使用拉伊達(dá)準(zhǔn)則依次檢測待測數(shù)據(jù)是否屬于某個聚類,若被檢測數(shù)據(jù)不屬于任何一個聚類,則將其視為異常值。
異常數(shù)據(jù)檢測算法的具體步驟如下。
算法3:異常數(shù)據(jù)檢測算法
輸入:聚類中心c={[c1,c2,…,cK]},數(shù)據(jù)聚類索引IDX,待檢測
樣本集X={[x1,x2,…,xn]}。
Step1:首先對待測樣本集X進行預(yù)處理,得到預(yù)處理樣本集
[X′]={[x1,x2,…,xn]}。
Step2:根據(jù)聚類中心c={[c1,c2,…,cK]}及數(shù)據(jù)聚類索引IDX計
算每個聚類內(nèi)數(shù)據(jù)與其聚類中心的平均距離[d-]和標(biāo)準(zhǔn)差s。
Step3:For i=1,2,…,n
Do選取樣本[xi] for j=1,2,…,K
Do計算[xi]與聚類中心[cj]的歐氏距離[Xabn],若[Xabn≤0],
則[Aabn+1]。
end for
if [Aabn=5],則視[xi]為正確數(shù)據(jù)。
else,視[xi]為錯誤數(shù)據(jù),輸出該數(shù)據(jù)信息(值、序列號)。
End" For
Step4:輸出異常值集合U。
輸出:異常值集合U。
基于先驗聚類的異常數(shù)據(jù)檢測算法總體流程如圖2所示。
3" 實驗分析
3.1" 數(shù)據(jù)來源
本文實驗選取與機電設(shè)備儲存環(huán)境參數(shù)相似的因特爾伯克利研究實驗室(IBRL)環(huán)境參數(shù)作為實驗數(shù)據(jù)。數(shù)據(jù)包括54個傳感器每31 s測量一次的時間、事件序列號、溫度、濕度、光照度和電壓測量值。
在進行實驗前,首先對先驗數(shù)據(jù)進行標(biāo)定處理,刪除部分重復(fù)值和空值,從中選取對機電設(shè)備運行、存儲過程影響較大的溫度、濕度、電壓測量值三項數(shù)據(jù)作為實驗對象;然后選取2024年2月28日傳感器1~5的2 000個實測數(shù)據(jù)進行先驗聚類結(jié)果的求解,并從上述數(shù)據(jù)的鄰近時間內(nèi)選取傳感器1~5的2 000個實測數(shù)據(jù)作為檢測數(shù)據(jù),在檢測數(shù)據(jù)的基礎(chǔ)上隨機替換10%的異常數(shù)據(jù)作為最終測試數(shù)據(jù)。
3.2" 實驗驗證
實驗分別使用本文算法、傳統(tǒng)K?means異常檢測算法以及DBSCAN異常檢測算法進行對比。本文算法單獨使用2 000例歷史數(shù)據(jù)進行先驗聚類結(jié)果求解,三種算法均使用內(nèi)含錯誤數(shù)據(jù)的2 000例鄰近時間實測數(shù)據(jù)進行異常環(huán)境數(shù)據(jù)檢測效果測試。
本文算法首先選取2 000例標(biāo)定數(shù)據(jù)中的溫度、濕度、電壓三項測量值作為先驗聚類數(shù)據(jù)的來源,根據(jù)傳感器節(jié)點的數(shù)量選取聚類數(shù)為5,依據(jù)改進的初始聚類中心選取算法選擇初始聚類中心。先驗聚類結(jié)果如圖3所示。
依據(jù)數(shù)據(jù)量的不同,分別基于先驗聚類結(jié)果進行4組實驗,異常數(shù)據(jù)檢測的結(jié)果如圖4~圖7所示,其中異常數(shù)據(jù)標(biāo)注為叉號。
由圖4~圖7可知,正常數(shù)據(jù)集中分布在中心區(qū)域,而異常數(shù)據(jù)分布則較為分散。
為驗證本文算法的性能,分別以檢測率(True Positive Rate, TPR)和誤檢率(False" Positive Rate, FPR)[15]兩個指標(biāo)對算法性能進行驗證,公式如下:
式中:TN(真陰性)表示實際錯誤且被正確檢測為錯誤的數(shù)據(jù);FP(假陽性)表示實際錯誤但被錯誤檢測為正確的數(shù)據(jù);FN(假陰性)表示實際正確但被錯誤檢測為錯誤的數(shù)據(jù);TP(真陽性)表示實際正確且被正確檢測為正確的數(shù)據(jù)。
表1展示了本文算法、傳統(tǒng)K?means算法、DBSCAN異常檢測算法在檢測率與誤檢率方面的性能對比。
如表1所示,隨著傳感器測試數(shù)據(jù)量的逐步增長,三種算法均展現(xiàn)出了檢測率上升與誤檢率下降的正向態(tài)勢;然而,本文算法異常數(shù)據(jù)的檢測率更高、誤檢率更低,在機電設(shè)備環(huán)境參數(shù)異常數(shù)據(jù)檢測中表現(xiàn)出了高于其他兩種算法的優(yōu)良性能。
4" 結(jié)" 語
本文提出了一種基于先驗聚類的機電設(shè)備環(huán)境參數(shù)異常檢測算法。首先輸入先驗數(shù)據(jù),根據(jù)改進后的聚類中心選取規(guī)則選取合適的聚類中心,從而進行先驗聚類結(jié)果的求解;然后根據(jù)先驗聚類的聚類中心和聚類內(nèi)數(shù)據(jù),輸入待檢測數(shù)據(jù)并依次判斷待檢測數(shù)據(jù)是否可以分配到某個聚類中,當(dāng)數(shù)據(jù)不能分配到任何聚類時,視其為異常數(shù)據(jù),從而完成機電設(shè)備環(huán)境參數(shù)的異常檢測。
實驗結(jié)果表明,本文算法在機電設(shè)備環(huán)境參數(shù)的異常檢測中較原有異常檢測算法具有檢測準(zhǔn)確率高、誤檢率低的特點,在機電設(shè)備環(huán)境異常數(shù)據(jù)檢測上表現(xiàn)了良好的性能。
參考文獻(xiàn)
[1] CHANDER B, KUMARAVELAN G. Outlier detection strategies for WSNs: a survey [J]. Journal of King Saud University?computer and information sciences, 2021(6): 5684?5707.
[2] 孫嘉徽,劉山尖,顧勝健,等.基于船舶振動環(huán)境應(yīng)力的機電設(shè)備全壽命仿真與試驗技術(shù)[J].機電設(shè)備,2023,40(5):15?19.
[3] 車麗娜,任秀麗.基于滑動窗口和置信度的無線傳感器網(wǎng)絡(luò)異常檢測算法[J].傳感技術(shù)學(xué)報,2023,36(11):1801?1807.
[4] 陳雪芳.基于AL?SVM算法的無線傳感器網(wǎng)絡(luò)入侵檢測研究[J].沈陽工程學(xué)院學(xué)報(自然科學(xué)版),2021,17(4):68?73.
[5] Anon. A novel clustering approach and adaptive SVM classifier for intrusion detection in WSN: a data mining concept [J]. Sustainable computing: informatics and systems, 2020, 23: 120?135.
[6] ABHALE A B, MANIVANNAN S S. Supervised machine learning classification algorithmic approach for finding anomaly type of intrusion detection in wireless sensor network [J]. Optical memory and neural networks, 2020, 29(3): 244?256.
[7] POORNIMA A G I, PARAMASIVAN B. Anomaly detection in wireless sensor network using machine learning algorithm [J]. Computer communications, 2020, 151: 331?337.
[8] SAMPARTHI V S K, VERMA H K. Outlier detection of data in wireless sensor networks using kernel density estimation [J]. International journal of computer applications, 2011, 5(6): 924?1302.
[9] 費歡,李光輝.基于K?means聚類的WSN異常數(shù)據(jù)檢測算法[J].計算機工程,2015,41(7):124?128.
[10] 蔣華,季豐,王慧嬌,等.改進Kmeans算法的海洋數(shù)據(jù)異常檢測[J].計算機工程與設(shè)計,2018,39(10):3132?3136.
[11] 雷萌,郭鵬,劉博嵩.基于自適應(yīng)DBSCAN算法的風(fēng)電機組異常數(shù)據(jù)識別研究[J].動力工程學(xué)報,2021,41(10):859?865.
[12] 常榮,徐敏.基于改進K?Means和DNN算法的電力數(shù)據(jù)異常檢測[J].南京理工大學(xué)學(xué)報,2023,47(6):790?796.
[13] 劉紅達(dá),王福順,孫小華,等.一種基于改進差分進化的K?Means聚類算法研究[J].現(xiàn)代電子技術(shù),2024,47(18):156?162.
[14] 費歡,肖甫,李光輝,等.基于多模態(tài)數(shù)據(jù)流的無線傳感器網(wǎng)絡(luò)異常檢測方法[J].計算機學(xué)報,2017,40(8):1829?1842.
[15] 鄭俊華,魏晉宏.基于特征補全的無線傳感器網(wǎng)絡(luò)異常數(shù)據(jù)流檢測[J].傳感技術(shù)學(xué)報,2024,37(6):1061?1066.
[16] 吳蕊,張安勤,田秀霞,等.基于改進K?means的電力數(shù)據(jù)異常檢測算法[J].華東師范大學(xué)學(xué)報(自然科學(xué)版),2020(4):79?87.
[17] 王尊祥,王金剛,鐘建峰.常用機電設(shè)備關(guān)鍵部件紅外熱成像信號特征研究及應(yīng)用[J].中國特種設(shè)備安全,2024,40(7):67?72.
[18] 特木爾朝魯,張亞萍.基于卷積神經(jīng)網(wǎng)絡(luò)的無線傳感器網(wǎng)絡(luò)鏈路異常檢測算法[J].吉林大學(xué)學(xué)報(工學(xué)版),2024,54(8):2295?2300.
[19] 馬正武.基于GPRS網(wǎng)絡(luò)的惡劣環(huán)境煤礦機電設(shè)備動態(tài)信息實時采集系統(tǒng)[J].電子設(shè)計工程,2024,32(20):149?152.
[20] 賈宇翔,張益,成亮,等.基于圖像特征的鐵路車輛制動組件異常檢測[J].電子設(shè)計工程,2024,32(7):182?185.
作者簡介:邢" 鵬(2000—),男,山西大同人,在讀碩士研究生,研究方向為無線傳感器網(wǎng)絡(luò)。
李新娥(1971—),女,山西大同人,博士研究生,教授,研究方向為測試計量技術(shù)及儀器。
收稿日期:2024?09?27" " " " " "修回日期:2024?10?31