摘要:針對通信網(wǎng)絡(luò)中告警難以預(yù)測、無法及時處理的問題,對原始告警信息進行處理,篩選出傳輸鏈路中斷、傳輸區(qū)域業(yè)務(wù)故障、設(shè)備板卡故障3 種主要告警類型數(shù)據(jù)作為數(shù)據(jù)集,利用稀疏貝葉斯學(xué)習(xí)和支持向量機兩種方法對故障進行預(yù)測分析對比。實驗結(jié)果表明,相較于支持向量機方法,稀疏貝葉斯學(xué)習(xí)方法的預(yù)測性能更好,精確率更高。該學(xué)習(xí)方法具有優(yōu)越的處理大規(guī)模數(shù)據(jù)和特征的能力,顯示出良好的可擴展性,可以使通信網(wǎng)絡(luò)策略和優(yōu)化過程更加客觀和科學(xué),有效提升網(wǎng)絡(luò)性能和穩(wěn)定性。
關(guān)鍵詞:通信網(wǎng);告警預(yù)測;電力;稀疏貝葉斯學(xué)習(xí)
中圖分類號:TN915.853 文獻標(biāo)識碼:A
0 引言
在通信網(wǎng)絡(luò)運營和維護過程中,告警預(yù)測對于確保網(wǎng)絡(luò)穩(wěn)定性和優(yōu)化運營效率具有至關(guān)重要的作用[1]。網(wǎng)絡(luò)告警是網(wǎng)絡(luò)元素異常狀態(tài)的直接反映,及時有效地預(yù)測和處理這些告警信息,可以大幅減少系統(tǒng)故障的發(fā)生概率,降低維護成本,提高用戶滿意度。然而,由于通信網(wǎng)絡(luò)的復(fù)雜性以及數(shù)據(jù)的大規(guī)模和高維度特性,傳統(tǒng)的告警預(yù)測方法面臨準(zhǔn)確性和效率的雙重挑戰(zhàn)。
稀疏貝葉斯方法因其在處理高維數(shù)據(jù)中顯示出的卓越性能而受到研究者的廣泛關(guān)注。這種方法通過引入先驗知識,能有效地識別數(shù)據(jù)的重要特征,從而實現(xiàn)對數(shù)據(jù)的稀疏表示和降維處理。在通信網(wǎng)絡(luò)告警預(yù)測的應(yīng)用中,稀疏貝葉斯方法不僅可以提高預(yù)測的準(zhǔn)確率,還能有效地處理數(shù)據(jù)噪聲和避免過擬合,對于實時和動態(tài)的網(wǎng)絡(luò)環(huán)境尤為重要[2-3]。
本文旨在探索基于稀疏貝葉斯學(xué)習(xí)(sparseBayesian learning,SBL)方法的通信網(wǎng)告警預(yù)測模型,通過對網(wǎng)絡(luò)歷史告警數(shù)據(jù)的深入分析,建立一個能夠準(zhǔn)確預(yù)測未來告警事件的數(shù)學(xué)模型,詳細介紹了稀疏貝葉斯學(xué)習(xí)方法的理論基礎(chǔ),以及如何將其應(yīng)用于通信網(wǎng)絡(luò)的告警預(yù)測中,旨在為網(wǎng)絡(luò)管理提供更為高效、準(zhǔn)確的決策支持工具。
1 相關(guān)技術(shù)介紹
1.1 告警預(yù)測方法
通信網(wǎng)告警是一個關(guān)鍵的監(jiān)控機制,用于提醒網(wǎng)絡(luò)管理人員關(guān)于網(wǎng)絡(luò)設(shè)備、服務(wù)和系統(tǒng)中的問題或異常狀態(tài)。告警系統(tǒng)能夠快速檢測異常并發(fā)出警告,識別網(wǎng)絡(luò)中的硬件故障、軟件問題或配置錯誤,以防這些問題對網(wǎng)絡(luò)造成更嚴重的影響。告警系統(tǒng)通過實時監(jiān)控來確保所有系統(tǒng)和服務(wù)的正常運作,并且跟蹤如延遲、帶寬利用率及數(shù)據(jù)丟包等性能指標(biāo),幫助運維團隊優(yōu)化網(wǎng)絡(luò)性能、處理性能瓶頸。此外,通過分析告警數(shù)據(jù),技術(shù)人員能夠識別潛在的問題趨勢和模式,采取預(yù)防性維護措施,以避免更嚴重的故障。作為網(wǎng)絡(luò)事件管理策略的一部分,告警系統(tǒng)還能歸類和排序各種網(wǎng)絡(luò)事件,確保優(yōu)先解決最緊急的問題。在網(wǎng)絡(luò)安全方面,它也能檢測潛在的安全威脅,如未授權(quán)訪問和病毒攻擊,及時通知安全團隊采取必要措施。
通信網(wǎng)告警預(yù)測利用大量歷史和實時數(shù)據(jù),結(jié)合先進的數(shù)據(jù)挖掘和機器學(xué)習(xí)技術(shù)(如隨機森林、支持向量機和神經(jīng)網(wǎng)絡(luò)等),識別可能導(dǎo)致網(wǎng)絡(luò)故障的模式和趨勢。這種預(yù)測技術(shù)可以實時監(jiān)控網(wǎng)絡(luò)狀態(tài),并在潛在故障發(fā)生之前提前發(fā)出警報,使網(wǎng)絡(luò)運維人員能夠迅速響應(yīng),從而減少服務(wù)中斷的影響,優(yōu)化維護計劃,降低運維成本。
1.2 稀疏貝葉斯學(xué)習(xí)
稀疏貝葉斯學(xué)習(xí)是一個強大的統(tǒng)計學(xué)習(xí)框架,用于在高維數(shù)據(jù)環(huán)境中實現(xiàn)特征選擇和模型簡化,同時還能提高分類的準(zhǔn)確度。它結(jié)合了貝葉斯推斷和稀疏性約束,提供了一種系統(tǒng)化的方法來處理復(fù)雜的機器學(xué)習(xí)和數(shù)據(jù)分析問題[4]。
假設(shè)有數(shù)據(jù)集{(xi,yi)} i=1N ,其中xi 為輸入特征,yi 為對應(yīng)的連續(xù)輸出目標(biāo),N 為樣本數(shù)量,i為索引變量。稀疏貝葉斯分類模型計算公式:
yn= f(xn)+òn。 ( 1)
式中,yn 為分類標(biāo)簽;f(xn)為通過核函數(shù)映射后的函數(shù)估計;òn 為加性噪聲,通常假設(shè)為高斯分布N(0,β-1),其中β 是噪聲精度的逆。
在稀疏貝葉斯方法中,f(x)的形式通常通過核技術(shù)來定義,這意味著函數(shù)f 可以表示為核函數(shù)的線性組合,具體計算公式:
式中,αi 為待求解的系數(shù);k(x,xi)是核函數(shù),通常選擇如高斯核、多項式核等,x 為新輸入的樣本。
為了引入稀疏性,可以對系數(shù)αi 施加一個適當(dāng)?shù)南∈柘闰灧植?,使得大部分的αi 被推斷為0,這意味著模型僅僅依賴于數(shù)據(jù)中的一個子集。
稀疏貝葉斯學(xué)習(xí)算法實現(xiàn)步驟如下。
步驟1:初始化。設(shè)置模型參數(shù)的初始值和稀疏先驗的初始參數(shù)。
步驟2:迭代優(yōu)化。使用期望最大化算法或變分推斷等方法,迭代地優(yōu)化模型參數(shù)和先驗參數(shù)。
步驟3:參數(shù)更新。在每次迭代中,根據(jù)貝葉斯公式更新參數(shù),逐步逼近稀疏解。
步驟4:收斂判定。若參數(shù)的變化量小于預(yù)設(shè)閾值,則算法收斂,輸出最終模型。
2 基于稀疏貝葉斯學(xué)習(xí)的告警預(yù)測方法
本文提出了一種基于稀疏貝葉斯學(xué)習(xí)方法的通信網(wǎng)告警預(yù)測方法,方法流程如圖1 所示。
其具體步驟如下。
步驟1:首先從已有的通信網(wǎng)絡(luò)中抽取一部分告警時間序列數(shù)據(jù)。這些數(shù)據(jù)通常包括時間戳、告警類型、告警嚴重性等信息,是構(gòu)建和訓(xùn)練預(yù)測模型的基礎(chǔ)。在這個過程中,通過選擇代表性強、數(shù)據(jù)完整性好的樣本,以確保模型能夠?qū)W習(xí)數(shù)據(jù)中的關(guān)鍵特征和模式。
步驟2:利用步驟1 中收集的數(shù)據(jù),構(gòu)建一個稀疏貝葉斯學(xué)習(xí)模型。該過程需要定義模型的先驗分布,分布應(yīng)該具有高度的稀疏性,以在模型中只保留對預(yù)測最有幫助的變量。例如,可以采用拉普拉斯先驗來增加模型的稀疏性。此外,還需要設(shè)定適當(dāng)?shù)某瑓?shù),如正則化參數(shù)和學(xué)習(xí)率等,這些超參數(shù)將直接影響模型的學(xué)習(xí)效果和預(yù)測能力。
步驟3:在模型構(gòu)建完成后,將其應(yīng)用于未參與訓(xùn)練的告警數(shù)據(jù)部分,進行模型的測試和驗證。通過對比模型預(yù)測結(jié)果與實際告警事件,評估模型的準(zhǔn)確性和精確率。評估指標(biāo)可以包括均方誤差、精確率、召回率等,通過指標(biāo)幫助工作人員了解模型在實際操作中的表現(xiàn)。此外,還可以進行交叉驗證等統(tǒng)計分析,確保模型的穩(wěn)定性和可靠性。
3 實驗結(jié)果與分析
本文選取某地區(qū)電力公司一周的告警記錄數(shù)據(jù),時間為2021 年4 月16 —22 日,共有318 562 條告警記錄。首先將這些原始數(shù)據(jù)進行清洗,并篩選出4 個關(guān)鍵屬性:設(shè)備名稱、設(shè)備位置、告警類型和告警發(fā)生時間,以更好地分析告警事件。根據(jù)篩選結(jié)果,選取告警中級別較高的3 種類型作為數(shù)據(jù)測試依據(jù),它們分別為傳輸鏈路中斷、傳輸區(qū)域業(yè)務(wù)故障和設(shè)備板卡故障。告警事件樣本提取情況如表1 所示。
如表2 所示,在3 種故障類型預(yù)測中,相較于支持向量機方法,本文所用稀疏貝葉斯學(xué)習(xí)方法在預(yù)測精確率方面有顯著提高,這主要體現(xiàn)在精確率指標(biāo)上。然而,在召回率指標(biāo)上,稀疏貝葉斯學(xué)習(xí)方法的優(yōu)勢不顯著。這一現(xiàn)象的原因可以歸結(jié)為兩種方法在訓(xùn)練過程中對模型參數(shù)的處理方式不同。支持向量機在訓(xùn)練過程中通過加入懲罰函數(shù)來最大化似然函數(shù),從而優(yōu)化模型。這種方法通過控制模型復(fù)雜度來避免過擬合,并沒有采取使大多數(shù)參數(shù)趨于零的方式。然而,稀疏貝葉斯學(xué)習(xí)方法則通過假設(shè)模型參數(shù)符合均值為零的高斯分布,在迭代優(yōu)化過程中使大部分參數(shù)逐漸趨于零,剔除無關(guān)或噪聲較大的特征及相應(yīng)的訓(xùn)練樣本。這種特征選擇機制有效減少了模型中不必要的核函數(shù),從而減少錯誤預(yù)測的數(shù)量,提高預(yù)測的精確率。由于稀疏貝葉斯學(xué)習(xí)方法通過零均值高斯分布使參數(shù)稀疏化,在減少負樣本的同時,也不可避免地減少了部分正樣本,因此導(dǎo)致召回率值未能顯著提高。
4 結(jié)論
本文探討了稀疏貝葉斯學(xué)習(xí)方法在通信網(wǎng)絡(luò)故障預(yù)測中的應(yīng)用效果,特別是與支持向量機方法相比,在精確率指標(biāo)上表現(xiàn)出顯著的提升。研究結(jié)果顯示,稀疏貝葉斯學(xué)習(xí)方法在精確率方面優(yōu)于支持向量機方法,這主要得益于其在模型訓(xùn)練過程中對參數(shù)的稀疏化處理。本文提出方法能夠為電網(wǎng)運行提供快速、準(zhǔn)確的故障預(yù)測,從而及時輔助運維人員響應(yīng)潛在問題并預(yù)防業(yè)務(wù)中斷。這種方法不僅可以優(yōu)化通信網(wǎng)絡(luò)資源分配,降低維護成本,還可以增強預(yù)測性維護策略的有效性,延長設(shè)備壽命,并降低突發(fā)故障引起的風(fēng)險。未來,需要進一步研究如何平衡精確率與召回率之間的關(guān)系,以持續(xù)優(yōu)化通信網(wǎng)絡(luò)故障預(yù)測模型的整體性能。
參考文獻
[1] 丁宏,周宏林. 基于機器學(xué)習(xí)的通信網(wǎng)告警關(guān)聯(lián)分析綜述[J]. 東方電氣評論,2021,35(1):77-84,88.
[2] 賈珺. 通信網(wǎng)告警相關(guān)性分析與故障預(yù)測研究[D]. 北京:北京郵電大學(xué),2021.
[3] 劉軍,王穎,張冰,等. 電力骨干通信網(wǎng)中告警預(yù)測方法研究[J]. 光通信研究,2019(5):9-13.
[4] 余白石,刁逸帆,錢良,等. 基于稀疏貝葉斯學(xué)習(xí)的水下電場測向方法[J]. 數(shù)字海洋與水下攻防,2023,6(5):575-582.