亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于變分自編碼器的異常小區(qū)檢測(cè)

        2020-12-23 06:00:42滕祖?zhèn)?/span>周杰華
        移動(dòng)通信 2020年12期
        關(guān)鍵詞:編碼器重構(gòu)準(zhǔn)確率

        滕祖?zhèn)ィ芙苋A

        (中國(guó)聯(lián)合網(wǎng)絡(luò)通信有限公司湖北分公司,湖北 武漢 430020)

        0 引言

        在智能運(yùn)維領(lǐng)域中,由于缺少異常樣本,有監(jiān)督方法的使用場(chǎng)景受限。因此,如何利用無(wú)監(jiān)督方法對(duì)海量KPI進(jìn)行異常檢測(cè)是智能運(yùn)維領(lǐng)域探索的方向之一。智能運(yùn)維就是采用機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等方法,來(lái)解決異常小區(qū)檢測(cè)、故障根因分析、容量預(yù)測(cè)等運(yùn)維領(lǐng)域中的關(guān)鍵問(wèn)題。其中異常小區(qū)檢測(cè)是在運(yùn)維領(lǐng)域中非常重要的一個(gè)環(huán)節(jié)。

        移動(dòng)網(wǎng)絡(luò)小區(qū)問(wèn)題類(lèi)型涉及多個(gè)方面,如無(wú)線覆蓋、干擾、容量等。傳統(tǒng)網(wǎng)優(yōu)一般采集PM、配置等數(shù)據(jù),再結(jié)合網(wǎng)優(yōu)工程師的專(zhuān)家知識(shí)和經(jīng)驗(yàn),對(duì)各項(xiàng)指標(biāo)分別設(shè)置閾值的方式,來(lái)發(fā)現(xiàn)網(wǎng)元是否存在高負(fù)荷、高干擾、覆蓋差等異常問(wèn)題。在網(wǎng)絡(luò)復(fù)雜化和業(yè)務(wù)多樣化的趨勢(shì)下,網(wǎng)元運(yùn)行指標(biāo)眾多,KPI數(shù)量一般達(dá)到30~60維度,傳統(tǒng)工作模式簡(jiǎn)單粗放,存在準(zhǔn)確率低、不能適應(yīng)網(wǎng)絡(luò)動(dòng)態(tài)調(diào)整的問(wèn)題。

        本文提出了一種基于變分自編碼器的異常小區(qū)檢測(cè)方法,其基本原理是利用異常小區(qū)的KPI數(shù)據(jù)在通過(guò)變分自編碼器編碼與解碼過(guò)程中所產(chǎn)生的較大波動(dòng)來(lái)實(shí)現(xiàn)異常檢測(cè)。一般說(shuō)來(lái),在機(jī)器學(xué)習(xí)中不平衡的訓(xùn)練樣本會(huì)導(dǎo)致訓(xùn)練模型側(cè)重樣本數(shù)目較多的類(lèi)別,而“輕視”樣本數(shù)目較少類(lèi)別。在異常小區(qū)檢測(cè)場(chǎng)景中,普遍存在的現(xiàn)象是正常樣本數(shù)量遠(yuǎn)遠(yuǎn)大于異常樣本數(shù)量,因此,當(dāng)把不平衡的正常樣本和異常樣本都輸入機(jī)器學(xué)習(xí)算法一起訓(xùn)練時(shí),采用無(wú)監(jiān)督方法就能把異常值檢測(cè)出來(lái)。實(shí)驗(yàn)結(jié)果表明,該方法在樣本不平衡的情況下,通過(guò)合理設(shè)置重構(gòu)誤差閾值,能夠準(zhǔn)確地檢測(cè)出異常小區(qū),其成果已應(yīng)用于實(shí)際網(wǎng)優(yōu)工作。

        1 基于變分自編碼器的異常小區(qū)檢測(cè)

        1.1 異常小區(qū)

        要進(jìn)行異常小區(qū)檢測(cè),首先要給出異常小區(qū)的定義:凡容量、覆蓋、干擾等相關(guān)KPI指標(biāo)取值超過(guò)期望值一定范圍的小區(qū)就定義為異常小區(qū)。例如:

        (a)容量類(lèi)異常小區(qū):凡是小區(qū)的最大連接用戶數(shù)超過(guò)100個(gè),或者下行業(yè)務(wù)流量超過(guò)10GB,或者下行PRB(Physical Resource Block,物理資源塊)利用率大于90%,就認(rèn)為是容量類(lèi)異常小區(qū);

        (b)覆蓋類(lèi)異常小區(qū):凡是上行平均DTX(Discontinuous Transmission,不連續(xù)發(fā)射)占比超過(guò)20%,或者下行平均DTX占比超過(guò)30%,就認(rèn)為是覆蓋類(lèi)異常小區(qū);

        (c)干擾類(lèi)異常小區(qū):凡是PUCCH干擾超過(guò)-105 dBm,或者PUSCH干擾超過(guò)-105 dBm,就認(rèn)為是干擾類(lèi)異常小區(qū)。

        本文只對(duì)異常小區(qū)進(jìn)行檢測(cè),不對(duì)造成異常的原因進(jìn)行分析。

        1.2 變分自編碼器

        變分自編碼器是一種用于特征提取的神經(jīng)網(wǎng)絡(luò)模型,其設(shè)計(jì)思路是通過(guò)對(duì)輸入數(shù)據(jù)進(jìn)行壓縮和解壓縮來(lái)重建輸入數(shù)據(jù),試圖讓輸出和輸入保持一樣。它在設(shè)計(jì)架構(gòu)上有Encoder(編碼器)和Decoder(解碼器)兩個(gè)結(jié)構(gòu),其中,編碼器將輸入數(shù)據(jù)轉(zhuǎn)化為隱含空間中更小更緊湊的編碼表達(dá),而解碼器則將這一編碼重新恢復(fù)為原始輸入數(shù)據(jù)。由于它的隱含空間被設(shè)計(jì)為連續(xù)的分布以便進(jìn)行隨機(jī)采樣和插值,因此可以具有類(lèi)似正則化防止過(guò)擬合的作用。

        變分自編碼器的處理過(guò)程如圖1所示:

        ①首先通過(guò)Encoder得到x的隱變量分布參數(shù)z_mean和z_log_var;

        ②然后從N(0,1)采樣得到取值很小的隨機(jī)數(shù)ε;

        ③接著把隨機(jī)數(shù)ε聯(lián)合隱變量分布參數(shù)z_mean和z_log_var得到隱變量z;

        ④最后利用Decoder將z重構(gòu)成原始輸入。

        圖1 變分自編碼器處理過(guò)程示意圖

        VAE(Variational auto-encoder,變分自編碼器)的參數(shù)通過(guò)兩個(gè)損失函數(shù)來(lái)進(jìn)行訓(xùn)練:一個(gè)是重構(gòu)損失(reconstruction loss),它是模型的輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的均方誤差。在確定重構(gòu)誤差閾值時(shí),通常參考重構(gòu)誤差的箱型圖分布的上限值,例如,把箱型圖的上限值設(shè)定為重構(gòu)誤差閾值。此時(shí),將重構(gòu)誤差大于等于重構(gòu)誤差閾值的小區(qū)判斷為異常小區(qū),將重構(gòu)誤差小于重構(gòu)誤差閾值的小區(qū)判斷為正常小區(qū);另一個(gè)是正則化損失(regularization loss),它有助于學(xué)習(xí)具有良好結(jié)構(gòu)的潛在空間,并可以降低在訓(xùn)練數(shù)據(jù)上的過(guò)擬合。

        1.3 基于變分自編碼器的異常小區(qū)檢測(cè)

        基于變分自編碼器的異常小區(qū)檢測(cè)流程分為三個(gè)主要階段:數(shù)據(jù)采集階段、模型訓(xùn)練階段以及異常檢測(cè)階段。

        (1)數(shù)據(jù)采集階段

        從OMC采集4G移動(dòng)網(wǎng)小區(qū)的25個(gè)KPI數(shù)據(jù),涉及容量、覆蓋、干擾等類(lèi)型,具體包括:RRC連接用戶數(shù),RRC最大連接用戶數(shù),RRC建立嘗試次數(shù),下行平均DTX占比,下行每TTI調(diào)度用戶數(shù),上行每TTI調(diào)度用戶數(shù),下行每TTI激活用戶數(shù),上行每TTI激活用戶數(shù),下行業(yè)務(wù)流量,下行信令流量,上行業(yè)務(wù)流量,上行信令流量,下行用戶速率,上行用戶速率,隨機(jī)接入成功率,隨機(jī)接入嘗試次數(shù),UE功率受限比例,上行平均DTX占比,上行PRB利用率,下行PRB利用率,CQI小于等于6占比,平均CQI,PUSCH干擾,PUCCH干擾等。

        (2)模型訓(xùn)練階段

        首先,對(duì)小區(qū)KPI數(shù)據(jù)進(jìn)行歸一化處理,以消除不同標(biāo)度對(duì)數(shù)據(jù)所帶來(lái)的影響。

        X_std=(X-X.min(axis=0))/(X.max(axis=0)-X.min(axis=0))

        X_scaled=X_std/(max-min)+min

        其中,

        X.min(axis=0):每列中的最小值組成的行向量

        X.max(axis=0):每列中的最大值組成的行向量

        max:要映射到的區(qū)間最大值,默認(rèn)是1

        min:要映射到的區(qū)間最小值,默認(rèn)是0

        X_std:標(biāo)準(zhǔn)化結(jié)果

        X_scaled:歸一化結(jié)果

        然后,設(shè)定變分自編碼器模型網(wǎng)絡(luò)結(jié)構(gòu),并進(jìn)行模型參數(shù)訓(xùn)練。

        (3)異常檢測(cè)階段

        變分自編碼器在對(duì)通過(guò)編碼器后的數(shù)據(jù)進(jìn)行解碼還原時(shí),會(huì)產(chǎn)生一定的誤差。如果原始輸入數(shù)據(jù)中存在異常,則生成的誤差相比于常規(guī)誤差有較大波動(dòng)。因此,異常小區(qū)檢測(cè)算法的具體步驟如下:

        首先,對(duì)小區(qū)KPI數(shù)據(jù)進(jìn)行歸一化處理,用以消除不同標(biāo)度對(duì)數(shù)據(jù)所帶來(lái)的影響。

        然后,利用變分自編碼器模型參數(shù)對(duì)歸一化后的數(shù)據(jù)進(jìn)行平方誤差的計(jì)算。如果輸入樣本為:X=(X1,X2,X3,…,XN),經(jīng)過(guò)VAE重建的結(jié)果為則重構(gòu)誤差MSE為如果重構(gòu)誤差MSE值超過(guò)了預(yù)先設(shè)定的閾值,則判定小區(qū)KPI數(shù)據(jù)中存在異常。

        1.4 準(zhǔn)確性驗(yàn)證

        采集武漢聯(lián)通4G網(wǎng)絡(luò)2019年4月18日—4月24日期間每隔1小時(shí)的25個(gè)KPI性能數(shù)據(jù),共得到43150個(gè)小區(qū)的24小時(shí)*25個(gè)KPI分布向量。下面根據(jù)上述小區(qū)的KPI分布向量來(lái)分析基于VAE的異常小區(qū)檢測(cè)方法的準(zhǔn)確性。

        隨機(jī)挑選某異常小區(qū)25個(gè)性能KPI數(shù)據(jù)在一天24小時(shí)內(nèi)的取值分布,發(fā)現(xiàn)具有高維度(25*24=600維)、局部異常的特點(diǎn),如圖2所示:

        圖2 異常小區(qū)性能KPI分布特征圖

        因此,根據(jù)小區(qū)KPI數(shù)據(jù)的特征和數(shù)量,變分自編碼器模型的編碼器采用典型的4層卷積神經(jīng)網(wǎng)絡(luò),解碼器采用若干卷積層,并采用重構(gòu)損失和正則化損失函數(shù)來(lái)進(jìn)行訓(xùn)練模型。然后,把43150個(gè)小區(qū)的24*25維KPI向量進(jìn)行歸一化,并按照8:2進(jìn)行拆分得到訓(xùn)練集和測(cè)試集,其中,訓(xùn)練集用于訓(xùn)練變分自編碼器模型,測(cè)試集用于評(píng)估模型檢測(cè)準(zhǔn)確性。

        在樣本不平衡的情況下,通過(guò)設(shè)定不同的重構(gòu)誤差門(mén)限,分別統(tǒng)計(jì)AE和VAE所檢測(cè)出的異常小區(qū)數(shù),驗(yàn)證檢測(cè)準(zhǔn)確率,如表1和表2所示。顯然,本文所用VAE方法檢測(cè)效果明顯優(yōu)于基于AE的異常小區(qū)檢測(cè)效果。根據(jù)表1和表2數(shù)據(jù)繪制AE和VAE的檢測(cè)準(zhǔn)確率對(duì)比效果圖,如圖3。

        表1 基于AE的異常小區(qū)檢測(cè)準(zhǔn)確率統(tǒng)計(jì)

        表2 基于VAE的異常小區(qū)檢測(cè)準(zhǔn)確率統(tǒng)計(jì)

        圖3 AE和VAE檢測(cè)準(zhǔn)確性對(duì)比

        從圖3可知:AE重構(gòu)誤差閾值越高,檢測(cè)準(zhǔn)確率呈上升趨勢(shì),但有少許波動(dòng),準(zhǔn)確率低于90%。而VAE重構(gòu)誤差閾值越高,檢測(cè)準(zhǔn)確率呈明顯上升趨勢(shì),特別是在VAE重構(gòu)門(mén)限達(dá)到9.00E-17后,VAE檢測(cè)準(zhǔn)確率持續(xù)高于90%,且檢測(cè)出的異常小區(qū)數(shù)最高能達(dá)到171個(gè)。兩者差異原因在于:AE模型容易過(guò)擬合,當(dāng)訓(xùn)練數(shù)據(jù)存在較多異常點(diǎn)的時(shí)候,可能模型的效果就不會(huì)特別好,也就是說(shuō)當(dāng)異常值占比較大的話,AE可能會(huì)過(guò)擬合(學(xué)習(xí)到異常模式)。而VAE學(xué)習(xí)到的是隱變量的分布(允許隱變量存在一定的噪聲和隨機(jī)性),因此可以具有類(lèi)似正則化防止過(guò)擬合的作用。

        2 結(jié)束語(yǔ)

        本文介紹了VAE模型以及基于VAE的異常小區(qū)檢測(cè)方法,在樣本不平衡的情況下,通過(guò)合理設(shè)置重構(gòu)誤差閾值,能準(zhǔn)確地檢測(cè)出異常小區(qū)。但該方法面臨一個(gè)問(wèn)題:需要設(shè)置重構(gòu)誤差閾值。因?yàn)闄z測(cè)異常是通過(guò)對(duì)比重構(gòu)后的結(jié)果與原始輸入的差距,而這個(gè)差距多少就算是異常需要人為定義,然而對(duì)于大量的不同類(lèi)型KPI,很難去統(tǒng)一設(shè)置閾值,這是采用VAE模型比較大的一個(gè)缺陷。

        猜你喜歡
        編碼器重構(gòu)準(zhǔn)確率
        長(zhǎng)城敘事的重構(gòu)
        攝影世界(2022年1期)2022-01-21 10:50:14
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
        2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
        北方大陸 重構(gòu)未來(lái)
        基于FPGA的同步機(jī)軸角編碼器
        高速公路車(chē)牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
        北京的重構(gòu)與再造
        商周刊(2017年6期)2017-08-22 03:42:36
        基于PRBS檢測(cè)的8B/IOB編碼器設(shè)計(jì)
        論中止行為及其對(duì)中止犯的重構(gòu)
        国产精品一区二区三区在线蜜桃 | 午夜香蕉av一区二区三区| 国产熟女自拍av网站| 国产99视频精品免视看7| 日韩成人极品在线内射3p蜜臀| 伊人久久亚洲综合影院首页| 国内精品国产三级国产avx| 国产人妻熟女高跟丝袜| 国产精品无码专区av在线播放| 久久免费大片| 狼人综合干伊人网在线观看| 激情综合五月开心婷婷| 麻豆精品久久久久久久99蜜桃| 色综合久久无码中文字幕app| 亚洲视频一区二区蜜桃| 亚洲视频网站大全免费看| 亚洲精品一区久久久久久| 91短视频在线观看免费 | 国产福利小视频在线观看| 风流少妇一区二区三区91| 婷婷色综合视频在线观看| 99久久99久久精品国产片果冻| 国产成人精品三上悠亚久久| 白白色免费视频一区二区在线 | 天堂√在线中文官网在线| 伊人22综合| 亚洲产在线精品亚洲第一页| 国产av无码专区亚洲av男同| 蜜臀av无码精品人妻色欲| www.亚洲天堂.com| 亚洲国产综合精品中久| 伊人久久大香线蕉综合影院首页| AV有码在线免费看| 国产麻豆一区二区三区在线播放 | 真人做爰试看120秒| 天堂√中文在线bt| 国产 无码 日韩| 白浆国产精品一区二区| 亚洲国产一区二区a毛片| 亚洲一区二区三区精品网| 国产精品熟女视频一区二区三区 |