亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于AE-OCSVM模型的電力大數(shù)據(jù)異常值檢測方法

        2024-12-14 00:00:00劉陽
        今日自動化 2024年11期
        關(guān)鍵詞:大數(shù)據(jù)模型

        [關(guān)鍵詞]AE-OCSVM 模型;電力;大數(shù)據(jù);異常值檢測方法

        [中圖分類號]TP311.13 [文獻標志碼]A [文章編號]2095–6487(2024)11–0124–03

        在過去的幾十年中,異常值檢測技術(shù)已從簡單的統(tǒng)計測試發(fā)展到復(fù)雜的機器學(xué)習(xí)方法。簡單統(tǒng)計方法主要有3sigma 準則、四分位算法、Z-score 等。復(fù)雜的機器學(xué)習(xí)方法主要為K-Means 聚類、孤立森林、隨機森林、DBSCAN 等。文獻[1] 基于改進的K-Means和DNN(深度神經(jīng)網(wǎng)路)對數(shù)據(jù)進行檢測,對大數(shù)據(jù)的異常情況進行檢測與修正;文獻[2] 融合異常檢測與區(qū)域分割的高效K-Means 聚類算法提高算法執(zhí)行效率;文獻[3] 對K-Means 聚類進行了相應(yīng)的改進,提高了異常值檢測效率;文獻[4] 結(jié)合SVM 和孤立森林算法進行檢測,可快速有效地識別出異常值;文獻[5] 結(jié)合孤立森林算法和改進X-Means 保障了數(shù)據(jù)的穩(wěn)定性;文獻[6] 使用DBSCAN 算法進行檢測,提高了準確率、適用性和魯棒性。然而目前異常值檢測依然面臨著一系列挑戰(zhàn),因此,文章提出一種AEOCSVM(深度自動編碼一類支持向量機)組合算法對異常值進行檢測,以適應(yīng)高維大數(shù)據(jù)的情況。該方法首先用深度自動編碼對輸入空間降維和特征表示,然后基于支持向量和余量的OC-SVM 進行異常預(yù)測。對9 種不同的算法進行分析對比,結(jié)果顯示,能夠有效提高預(yù)測準確性和精確度。

        1"AE-OCSVM

        2.2評價指標分析

        準確度指總樣本中準確預(yù)測的百分比。雖然準確率可判斷整體準確率,但在樣本不平衡的情況下,其并不是衡量結(jié)果的好指標。例如,在樣本集中,有90個正樣本和10 個負樣本,樣本嚴重失衡。在這種情況下,只需要將所有樣本預(yù)測為正樣本,就可以獲得90% 的準確率,但這完全沒有意義。對于新數(shù)據(jù),根本沒有準確性。因此,在樣本不平衡的情況下,所獲得的高精度沒有任何意義,并且精確度將無效。因此,需要找到新的指標評估該模型的優(yōu)缺點。

        精確度指預(yù)測結(jié)果,即在所有預(yù)測為正的樣本中,樣本實際為正的概率。精確度和準確度看起來很相似,但概念完全不同。精確度表示正樣本結(jié)果中預(yù)測的準確性,準確度表示整個預(yù)測的準確性,包括正樣本和負樣本。

        召回率是針對原始樣本的,這意味著在實際為正的樣本中被預(yù)測為正樣本的概率。

        Precision 和Recall 可用P-R 圖表示。為確定P-R曲線上最佳閾值點,希望準確率和召回率高,但事實上這兩個指標相互矛盾,無法達到雙高。因此,選擇正確的閾值點需要根據(jù)實際問題的要求,例如,如果想要高精度,必須犧牲一些召回率;為了獲得高的召回率,必須犧牲一些精確度。但通常,可根據(jù)他們之間的平衡來定義一個新的指標,即F1 指數(shù)。F1 指數(shù)平衡了準確度和召回率,同時考慮了準確度和召回率。

        2.3結(jié)果對比分析

        在準確性方面,Isolation Forest 和OC-SVM 的準確性低于80%,Isolation Forest 算法模型測量的數(shù)據(jù)最低準確性為0.6184,比平均值0.7975 低近10個百分點。剩余算法模型的最高精度為PCA+GMM(TN=0),為0.8508,并且PCA+ KMeans、DBSCAN、DAGMM、LOF、AE-OCSVM、VAEGMM 在(0.8000,0.8500)的區(qū)間內(nèi)增加。在精度方面,OC-SVM 和DBSCAN 算法的精度特別突出,比其余算法模型高出約5 個百分點。DAGMM、VAEGMM 和AE-OCSVM與其余算法模型相比具有約1~2 個百分點的優(yōu)勢。召回數(shù)據(jù)的狀態(tài)和準確性相似,Isolation Forest 和OC-SVM 遠未達到平均水平,PCA GMM(TN=0)尤為突出,其值為0.9444。F1 指數(shù)是精度和召回率平衡的結(jié)果,Isolation Forest 和OC-SVM 的指數(shù)比其他算法低,其余算法的F1 指數(shù)在90% 左右略有波動。

        基于以上分析,Isolation Forest 的4 個指標相對較低,數(shù)據(jù)處理能力最差。OC-SVM 和DBSCAN 只具有更高的精度,而準確度、召回率和F1 指數(shù)都低于平均值,但DBSCAN 的評估指標值高于OC-SVM,并且都適合于只注重準確度的試驗數(shù)據(jù)處理。除準確度一般外,PCA+GMM(TN=0)的準確度、召回率和F1 指數(shù)在所有模型中最高,數(shù)據(jù)處理能力最好。PCA+K-Means 的值都是平均值,其余數(shù)據(jù)模型的數(shù)據(jù)處理能力相對較強且相似。具體的選擇取決于試驗對象。9種不同算法分析見表1。

        3結(jié)束語

        針對電力數(shù)據(jù)維數(shù)較高,數(shù)量龐大,以及數(shù)據(jù)的多源異構(gòu)特點,文章引入深度自編碼模型(AE),提出了AE-OCSVM(深度自動編碼一類支持向量機)組合算法對異常值進行檢測。試驗結(jié)果表明,該方法取得了良好的檢測效果,準確率,精確率,召回率和F1指數(shù)4個指標在9個模型對比分析中具有突出優(yōu)勢,能夠處理電力高維大數(shù)據(jù)的異常值檢測情況。

        猜你喜歡
        大數(shù)據(jù)模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
        新聞世界(2016年10期)2016-10-11 20:13:53
        基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
        科技視界(2016年20期)2016-09-29 10:53:22
        數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
        中國記者(2016年6期)2016-08-26 12:36:20
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        一個相似模型的應(yīng)用
        av网站国产主播在线| 99热精品成人免费观看| 国产69口爆吞精在线视频喝尿| 亚洲精品色播一区二区| av天堂精品久久综合网| 香蕉人人超人人超碰超国产 | 91久久国产精品视频| 亚洲视频在线中文字幕乱码| A亚洲VA欧美VA国产综合| 蜜臀av性久久久久蜜臀aⅴ| 亚洲人成网线在线播放va蜜芽| 97se亚洲国产综合自在线| 精品国产亚洲一区二区三区演员表| 蜜臀一区二区av天堂| 黄片视频免费在线观看国产| 亚洲成av人片在线观看ww| 亚洲国产99精品国自产拍| 国产一区二区在线观看av| 亚洲 欧美 综合 在线 精品| 97se亚洲国产综合自在线 | 久久aⅴ人妻少妇嫩草影院| 最新精品国偷自产在线婷婷| 久久综合九色综合久久久| 人妻少妇-嫩草影院| 成熟人妻av无码专区| 91免费国产| av在线免费观看大全| 狠狠噜天天噜日日噜无码| 伊人网在线视频观看| 全程国语对白资源在线观看| 亚洲 欧美 综合 在线 精品| 男女性高爱潮免费观看| 精品国产爱在线观看| 一本色道久久综合亚洲| www插插插无码视频网站| 日韩欧美国产亚洲中文| 日韩亚洲在线观看视频| 少妇高潮无套内谢麻豆传| 激情综合欧美| 手机在线看片在线日韩av| 日本女u久久精品视频|