亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于詞向量的基站退服告警預(yù)測(cè)方法及應(yīng)用

        2023-10-25 10:46:56王亞楠陳毅敏李佳袁
        無(wú)線互聯(lián)科技 2023年16期
        關(guān)鍵詞:語(yǔ)料庫(kù)運(yùn)維基站

        王亞楠,陳毅敏,李佳袁*

        (1.中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司,北京 100080;2.北京市第一中西醫(yī)結(jié)合醫(yī)院,北京 100026)

        0 引言

        以5 G為代表的新一代信息通信技術(shù),正成為引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的核心引擎。一方面,5 G網(wǎng)絡(luò)自身的發(fā)展雖融入了開(kāi)放化、智能化等特性,但越來(lái)越復(fù)雜的網(wǎng)絡(luò)同樣急需運(yùn)維模式的革新;另一方面,網(wǎng)絡(luò)智能化的程度也隨著業(yè)務(wù)層面的不斷創(chuàng)新而日益加深[1-3]。

        隨著無(wú)線通信技術(shù)的快速迭代和網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大,用戶對(duì)網(wǎng)絡(luò)質(zhì)量的要求越來(lái)越高,傳統(tǒng)被動(dòng)響應(yīng)式的基站告警處理方式已越來(lái)越不能滿足運(yùn)營(yíng)商對(duì)網(wǎng)絡(luò)告警,尤其是影響網(wǎng)絡(luò)質(zhì)量的重要告警的管理需求。

        為了減少基站退服事件的發(fā)生,降低基站退服時(shí)長(zhǎng),本文提出了一種基于詞向量的退服告警預(yù)測(cè)方法,通過(guò)對(duì)高隱患基站的精準(zhǔn)定位,為基站巡檢和隱患的提前排障做出有力指導(dǎo),從根本上實(shí)現(xiàn)了基站退服的主動(dòng)預(yù)防,提升了網(wǎng)絡(luò)運(yùn)維的效率和質(zhì)量。

        1 基于詞向量的基站退服告警預(yù)測(cè)模型構(gòu)建

        1.1 基站退服告警處理機(jī)制分析

        現(xiàn)階段的維護(hù)方式,導(dǎo)致基站或小區(qū)不可避免地在運(yùn)維實(shí)施期間停止服務(wù),極大地影響了客戶的感知和體驗(yàn),并有大量投訴隨之產(chǎn)生。

        退服處理中最主要的分析依據(jù)就是基站的告警數(shù)據(jù)。告警數(shù)據(jù)能夠及時(shí)反映當(dāng)前基站的運(yùn)行狀態(tài),而重要退服類告警的發(fā)生常常伴隨著次要告警、性能指標(biāo)波動(dòng)等,現(xiàn)有的分析方法僅依靠經(jīng)驗(yàn)粗粒度估計(jì)大面積退服發(fā)生的風(fēng)險(xiǎn),預(yù)測(cè)的準(zhǔn)確性不高,也難以為巡檢隱患排查、運(yùn)維資源針對(duì)性調(diào)度等提供科學(xué)依據(jù)。

        如何利用海量的歷史運(yùn)維數(shù)據(jù)挖掘退服規(guī)律,準(zhǔn)確預(yù)測(cè)退服基站,提前進(jìn)行故障隱患排查,已成為減少退服事件發(fā)生率、降低運(yùn)維成本、實(shí)現(xiàn)運(yùn)維思路從被動(dòng)處理向主動(dòng)預(yù)防轉(zhuǎn)變的關(guān)鍵。

        1.2 基站退服告警語(yǔ)料庫(kù)生成與Word2Vec模型構(gòu)建

        針對(duì)上述問(wèn)題,本文提出了一種基于詞向量的退服告警預(yù)測(cè)方法。該方法首先利用Word2Vec模型,對(duì)基站級(jí)別的故障、性能、動(dòng)環(huán)告警等數(shù)據(jù)進(jìn)行全面分析,重點(diǎn)探究基站歷史發(fā)生的退服告警及退服告警發(fā)生前后基站告警數(shù)據(jù)的變化情況,盡可能地挖掘次要告警和退服告警數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián)。

        Word2Vec是一種結(jié)構(gòu)特殊的神經(jīng)網(wǎng)絡(luò),其出發(fā)點(diǎn)是考慮了上下文相似的兩個(gè)詞,它們的詞向量也應(yīng)該是相似的,一舉解決了傳統(tǒng)的One-Hot編碼無(wú)法代表語(yǔ)義且維度過(guò)高的問(wèn)題。Word2Vec有兩大常用模型:以上下文詞匯預(yù)測(cè)當(dāng)前詞匯的CBOW(Continuous Bag-of-Word)模型以及以當(dāng)前詞匯預(yù)測(cè)其上下文詞匯的Skip-gram模型。模型結(jié)構(gòu)如圖1所示,以上下文窗口為3舉例說(shuō)明。

        圖1 Word2Vec常用模型原理

        本文所提出的方法以退服告警序列作為預(yù)測(cè)模型的特征輸入,并結(jié)合了兩種方法生成退服告警序列:

        (1)對(duì)每個(gè)基站的所有告警序列按時(shí)間排序,以每固定1~n天無(wú)任何告警發(fā)生的時(shí)間為間隔劃分所有告警序列,生成序列語(yǔ)料庫(kù),再將所有基站的語(yǔ)料庫(kù)合并。(2)對(duì)每個(gè)基站的所有告警序列按時(shí)間排序,以每一個(gè)退服告警的樣本為中心,取前面n1天的所有告警和后n2天的所有告警,按順序排列,作為一個(gè)告警組。將所有的告警組合并,形成告警類型編碼語(yǔ)料庫(kù)。

        對(duì)生成的告警序列語(yǔ)料庫(kù)使用Word2Vec模型,訓(xùn)練不同告警的上下文信息編碼模型。其參數(shù)如表1所示。

        表1 Word2Vec模型參數(shù)

        1.3 特征樣本生成

        特征樣本生成主要有以下3個(gè)步驟:

        1.3.1 特征數(shù)據(jù)生成

        在完成Word2Vec模型的訓(xùn)練后,輸入每個(gè)告警標(biāo)題,將其與模型訓(xùn)練得到的權(quán)重矩陣W相乘得到的對(duì)應(yīng)告警的詞向量。在生成的詞向量空間中,兩個(gè)向量夾角間的余弦值可以衡量?jī)蓚€(gè)個(gè)體之間差異的大小:

        (1)

        余弦值接近1,夾角趨于0,表明兩個(gè)向量越相似,余弦值接近于0,夾角趨于90°,表明兩個(gè)向量越不相似。因此,通過(guò)計(jì)算非退服告警向量與退服告警向量之間的余弦距離,可以得出其他次要告警i與退服告警j之間的相似度δij,其中負(fù)值統(tǒng)一置成0。最后,將告警i與J類退服類告警之間的相似度相加,得到告警i的編碼:

        (2)

        1.3.2 標(biāo)簽標(biāo)注

        根據(jù)需要預(yù)測(cè)的天數(shù)M(如3天),以該天數(shù)M為滾動(dòng)窗口,遍歷統(tǒng)計(jì)告警數(shù)據(jù),計(jì)算每個(gè)窗口期間基站是否發(fā)生了退服告警。如果發(fā)生退服告警則標(biāo)注為1,如果沒(méi)有發(fā)生退服告警則標(biāo)注為0。

        1.3.3 樣本生成

        將上述過(guò)程產(chǎn)生的特征數(shù)據(jù)和標(biāo)簽數(shù)據(jù)按基站與日期相關(guān)聯(lián),生成訓(xùn)練樣本,訓(xùn)練數(shù)據(jù)使用了試點(diǎn)地市1—10月共10個(gè)月的歷史告警數(shù)據(jù),并以同樣的方式生成預(yù)測(cè)樣本,只含輸入特征數(shù)據(jù),不含標(biāo)簽數(shù)據(jù)?;就朔婢A(yù)測(cè)樣本生成流程如圖2所示。

        圖2 基站退服告警預(yù)測(cè)樣本生成流程

        1.4 預(yù)測(cè)分類模型構(gòu)建

        本文使用基于XGBoost算法和LightGBM算法的二分類模型進(jìn)行退服告警預(yù)測(cè),二者都是基于梯度下降樹(shù)(Gradient Boosting Decision Tree,GBDT)的提升方法。使用XGBoost和LightGBM的二分類模型進(jìn)行退服告警預(yù)測(cè),具體算法流程如圖3所示。

        圖3 基于XGBoost和LightGBM模型的基站退服告警預(yù)測(cè)流程

        首先對(duì)樣本按照其所在周數(shù)進(jìn)行分組,采用Group-Kfold進(jìn)行交叉驗(yàn)證,將原始樣本分割成K個(gè)子樣本集,每一個(gè)單獨(dú)的子樣本集被保留作為驗(yàn)證模型的數(shù)據(jù),其他K-1個(gè)樣本集用來(lái)訓(xùn)練XGBoost和LightGBM模型,且保證同一周的樣本不會(huì)同時(shí)出現(xiàn)在訓(xùn)練集和測(cè)試集上。然后重復(fù)K次,使得每個(gè)子樣本集均被驗(yàn)證一次,同時(shí)生成K個(gè)模型。Group-Kfold通過(guò)避免同一周的樣本出現(xiàn)在訓(xùn)練集和測(cè)試集上,提高了模型的泛化能力。

        此外,為了解決數(shù)據(jù)集正負(fù)樣本比例嚴(yán)重失衡的問(wèn)題,采用Focalloss代替?zhèn)鹘y(tǒng)的交叉熵?fù)p失函數(shù)。二分類的交叉熵?fù)p失函數(shù)如下:

        (1-yi)log(1-pi)]

        (3)

        Focalloss通過(guò)引入?yún)?shù)α和γ對(duì)負(fù)樣本和易分樣本進(jìn)行懲罰,其函數(shù)形式如下:

        (4)

        其中,γ>0用于減少易分類樣本的損失,使得模型更關(guān)注于困難的、錯(cuò)分的樣本。例如γ= 2,對(duì)于正類樣本而言,預(yù)測(cè)結(jié)果為0.95,肯定是簡(jiǎn)單樣本,所以(1-0.95)γ就會(huì)很小,這時(shí)損失函數(shù)值就變得更小。而預(yù)測(cè)概率為0.3的樣本其損失相對(duì)很大。此外,加入平衡因子α,加大正樣本的權(quán)重,平衡正負(fù)樣本本身的比例不均。

        完成K個(gè)子模型的訓(xùn)練后,根據(jù)其在驗(yàn)證集上的精確率,計(jì)算各個(gè)模型的權(quán)重。預(yù)測(cè)時(shí),通過(guò)輸入對(duì)當(dāng)前基站過(guò)去一段時(shí)間的歷史告警數(shù)據(jù)、工參數(shù)據(jù),根據(jù)已訓(xùn)練得到的告警編碼、歷史退服特征、基站屬性特征,按時(shí)間窗進(jìn)行滑動(dòng)形成輸入樣本,輸入XGBoost和LightGBM的各個(gè)子模型,即可獲取未來(lái)一段時(shí)間內(nèi)退服告警發(fā)生的概率。最后,根據(jù)計(jì)算出的模型權(quán)值,融合子模型上的預(yù)測(cè)結(jié)果,得出最終的退服告警概率預(yù)測(cè)值,對(duì)未來(lái)一段時(shí)間內(nèi)(通常為1~3天)發(fā)生退服告警的概率進(jìn)行準(zhǔn)確預(yù)測(cè),為隱患提前排查和日常精準(zhǔn)巡檢提供依據(jù),提升基站排查效率,指導(dǎo)運(yùn)維人員的巡檢工作。

        2 基站退服告警預(yù)測(cè)應(yīng)用效果

        2.1 模型驗(yàn)證

        以陜西移動(dòng)部分基站為例,進(jìn)行基于詞向量的基站退服告警預(yù)測(cè)算法應(yīng)用。并通過(guò)f1分?jǐn)?shù)(f1-score)、準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)及混淆矩陣(Confusion)5個(gè)指標(biāo)對(duì)已經(jīng)訓(xùn)練好的退服告警預(yù)測(cè)模型,使用獨(dú)立的數(shù)據(jù)集做驗(yàn)證,輸出驗(yàn)證結(jié)果如表2所示。模型輸出的預(yù)測(cè)結(jié)果如表3所示。

        表2 退服告警預(yù)測(cè)模型輸出結(jié)果驗(yàn)證

        表3 退服告警預(yù)測(cè)模型輸出結(jié)果

        其中,date為預(yù)測(cè)周期的第一天,pred_probability為預(yù)測(cè)的退服告警發(fā)生概率,pred_label為是否發(fā)生退服告警(1為發(fā)生退服,0為未發(fā)生退服)。其中,pred_label 通過(guò)指定的分類閾值(如表3中取0.5),由pred_probability計(jì)算得到。

        2.2 試點(diǎn)地市應(yīng)用效果

        將訓(xùn)練好的基于詞向量的基站退服告警預(yù)測(cè)模型應(yīng)用于陜西省某地市試點(diǎn)基站進(jìn)行退服預(yù)測(cè),得到的試點(diǎn)地市模型輸出結(jié)果驗(yàn)證如表4所示。

        表4 試點(diǎn)地市退服告警預(yù)測(cè)模型輸出結(jié)果驗(yàn)證

        可見(jiàn),在試點(diǎn)地市應(yīng)用基站退服告警預(yù)測(cè)模型后,預(yù)測(cè)結(jié)果精確率達(dá)到96%,召回率約為12%~13%。本方法已經(jīng)在陜西省移動(dòng)公司進(jìn)行了試點(diǎn)應(yīng)用,通過(guò)對(duì)高隱患基站的精準(zhǔn)定位,為基站巡檢和隱患的提前排障做出有力指導(dǎo),10個(gè)地市在試點(diǎn)期內(nèi)平均退服基站預(yù)測(cè)準(zhǔn)確率大于88%。

        3 結(jié)語(yǔ)

        基于詞向量的基站退服告警預(yù)測(cè)方法,在試點(diǎn)省份預(yù)測(cè)基站未來(lái)一段時(shí)間內(nèi)發(fā)生重要退服告警的概率,準(zhǔn)確率大于88%,可明顯提升基站智能運(yùn)維的主動(dòng)性。同時(shí),及時(shí)發(fā)現(xiàn)設(shè)備或服務(wù)的相關(guān)告警信息,可以對(duì)退服故障進(jìn)行早排查、早修復(fù),從而可以有效地減少因退服故障而帶來(lái)的經(jīng)濟(jì)損失。本算法通過(guò)系統(tǒng)性引入AI技術(shù),對(duì)大量運(yùn)維數(shù)據(jù)進(jìn)行分析,構(gòu)建面向無(wú)線基站的重要故障預(yù)測(cè)工具,為網(wǎng)絡(luò)數(shù)智化轉(zhuǎn)型提供新的支持手段。

        猜你喜歡
        語(yǔ)料庫(kù)運(yùn)維基站
        《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
        運(yùn)維技術(shù)研發(fā)決策中ITSS運(yùn)維成熟度模型應(yīng)用初探
        風(fēng)電運(yùn)維困局
        能源(2018年8期)2018-09-21 07:57:24
        雜亂無(wú)章的光伏運(yùn)維 百億市場(chǎng)如何成長(zhǎng)
        能源(2017年11期)2017-12-13 08:12:25
        可惡的“偽基站”
        把課文的優(yōu)美表達(dá)存進(jìn)語(yǔ)料庫(kù)
        基于GSM基站ID的高速公路路徑識(shí)別系統(tǒng)
        基于ITIL的運(yùn)維管理創(chuàng)新實(shí)踐淺析
        小基站助力“提速降費(fèi)”
        基于JAVAEE的維吾爾中介語(yǔ)語(yǔ)料庫(kù)開(kāi)發(fā)與實(shí)現(xiàn)
        中文字幕亚洲无线码a| 成年女人vr免费视频| 精品人妻无码一区二区三区蜜桃一| 久久久久成人亚洲综合精品| 日韩精品有码中文字幕在线| 亚洲综合在线观看一区二区三区| 波多野42部无码喷潮在线| 国产成人av一区二区三区无码 | 夜夜未满十八勿进的爽爽影院| 欧美久久久久中文字幕| 亚洲一区二区三区亚洲| 久久综合99re88久久爱| 性一交一乱一伧国产女士spa| 亚洲AV无码永久在线观看| 麻豆av毛片在线观看| 天天做天天爱夜夜爽| 人成午夜免费大片| 欧美亚洲国产精品久久久久| 中文字幕人妻日韩精品| 成年女人粗暴毛片免费观看| 免费a级毛片在线观看| 一级午夜理论片日本中文在线| 蜜臀一区二区三区精品| a级毛片100部免费看| 久久尤物av天堂日日综合| 熟女免费观看一区二区| 成人亚洲精品777777| 杨幂AV污网站在线一区二区| 亚洲精彩视频一区二区| 国产亚洲超级97免费视频| av影片在线免费观看| 熟女体下毛毛黑森林| 一本一本久久久久a久久综合激情| 国产一区二区不卡av| 亚洲av综合av一区| 亚洲av无码成人yellow| 黄色三级国产在线观看| 亚洲国产精品无码久久一区二区| 五十路熟妇高熟无码视频| 日本在线免费精品视频| 亚洲最大中文字幕熟女|