(西安郵電學院 通信與信息工程學院,西安710121)
近年來, 全球的移動通信網發(fā)展迅猛。2009年全球3G用戶達到6.5億,預計今年可以達到20億。截至今年6月底,中國在網3G用戶數(shù)達到2 520萬,其中TD用戶達1 046萬。未來,全球的移動通信網將由多種技術構成一個無縫的移動通信基礎設施。超3G移動通信網[1]的無線接入網絡(RAN)由不同技術、高度復雜和異構的多種網絡組成,其運行、維護和管理(OA&M)是一項艱巨的任務。同時,由于移動網絡運營商之間的競爭愈演愈烈,RAN的運行將是他們必須面對的嚴峻挑戰(zhàn)。自我管理系統(tǒng),即自我配置、自我保護、自愈和自我優(yōu)化,是應對高度競爭環(huán)境下這些網絡所固有的高復雜性的有效解決方案。盡管文獻[2-5]等對自愈(即自我診斷)進行了大量的研究,但對自我優(yōu)化或自動優(yōu)化方面的相關研究,現(xiàn)有文獻資料幾乎很少涉及。因此,本文在給出無線網絡自動優(yōu)化系統(tǒng)結構的基礎上,提出一種通過對優(yōu)化專家的知識獲取,利用貝葉斯概率模型建立無線網絡自動優(yōu)化模型的方法和過程。
無線網絡優(yōu)化的重點,一是提升用戶感知的網絡性能指標,主要包括掉話、切換、覆蓋、干擾等;二是提高網絡資源的利用率,解決網絡容量和網絡資源的均衡問題。隨著對網絡深度優(yōu)化要求的提高,目前所采用的基于路測和信令分析工具的主流優(yōu)化方式已無法滿足要求,基于OMC-R網絡統(tǒng)計數(shù)據(jù)的自動網絡優(yōu)化技術應運而生。
無線網絡自動優(yōu)化包括3項工作:一是發(fā)現(xiàn)問題,二是分析問題,三是解決問題。
首先,對網絡進行性能評估,找出關鍵性能指標(KPI)不滿足優(yōu)化目標指標要求的問題小區(qū)。問題小區(qū)是指一個小區(qū)的一個或多個KPI不滿足指標要求,從而影響服務質量。不同運營商,不同技術網絡,可能會使用不同的方法,或采用不同的KPI性能指標作為優(yōu)化目標。對于運營商而言,最嚴重的問題莫過于小區(qū)經歷了大量的掉話,因為掉話對用戶服務具有極大的負面影響。因此,掉話率是評估小區(qū)質量的最好指標之一,可以用來識別問題小區(qū)。
其次,一旦確定了問題小區(qū),就應對每個問題小區(qū)問題產生的原因進行分析。一個原因或故障是一個小區(qū)中存在的邏輯錯誤或物理缺陷,如參數(shù)配置錯誤、硬件故障等,從而導致KPI不滿足指標要求。癥狀是一個KPI或告警,如干擾造成的切換數(shù)量,根據(jù)癥狀統(tǒng)計值可以找出問題的原因。分析問題是最復雜和最耗時的工作,目前主要是由優(yōu)化專家們借助一些輔助工具手動完成的。
最后,根據(jù)問題的原因,制定并實施優(yōu)化方案,解決問題小區(qū)存在的問題。優(yōu)化的效果可以通過對優(yōu)化后的網絡性能進行重新評估來衡量。
自動優(yōu)化的過程可概括為首先定義約束條件,然后構建模型,最后設計收斂算法。
為了實現(xiàn)無線網絡的自動優(yōu)化,圖1給出了自動優(yōu)化系統(tǒng)的體系結構。
模型定義子系統(tǒng)負責構建系統(tǒng)所需的優(yōu)化模型。建立優(yōu)化模型既可依據(jù)優(yōu)化專家的專業(yè)知識,亦可根據(jù)OMC-R提供的網絡統(tǒng)計數(shù)據(jù)。模型參數(shù)可以采用兩種方式來確定:一是專家提供(基于知識的模型),二是來自訓練數(shù)據(jù)(基于數(shù)據(jù)的模型)。目前,在移動通信網絡中,缺少歷史優(yōu)化實例。在現(xiàn)有文獻資料中,也缺少無線網絡RAN優(yōu)化的記錄。因此,在大多數(shù)情況下,網絡優(yōu)化專家的知識和經驗就成為建立優(yōu)化模型唯一的信息來源。下一部分將提出一種獲取知識的過程,根據(jù)優(yōu)化專家無線網絡優(yōu)化的知識和經驗建立概率模型。該過程的主要優(yōu)點是,優(yōu)化專家可以使用其專業(yè)語言傳遞其專業(yè)知識,無需了解概率模型,也可很容易地建立模型。
自動優(yōu)化子系統(tǒng),首先通過網絡性能分析,找出基于KPI的問題小區(qū),然后,利用優(yōu)化模型進行推理,找出問題的原因。對于給定的KPI值,采用優(yōu)化模型和貝葉斯規(guī)則,計算出問題可能原因的概率。輸入是癥狀,即來自OMC-R的問題小區(qū)的KPI和告警;輸出是問題小區(qū)問題的原因和一系列優(yōu)化方案。優(yōu)化方案按有效性排序(有效性=優(yōu)化方案的可能性/優(yōu)化方案的成本),按順序實施,直到問題解決。優(yōu)化方案的實施可以是從一個遠程終端修改配置參數(shù),也可以是派遣人員到現(xiàn)場更換設備故障件,甚至可以是自動地執(zhí)行軟件相關的優(yōu)化方案。一般來說,運營商更希望只提供優(yōu)化方案,而把最后的決定權留給優(yōu)化專家。最后,生成優(yōu)化報告,包括原因、優(yōu)化方案及其實施過程和結果。
圖1 自動優(yōu)化系統(tǒng)平臺Fig.1 Automatic optimization system platform
自動優(yōu)化子系統(tǒng)可獨立于OMC-R工作,也可以集成或嵌入到OMC-R,以發(fā)揮其最大效能,從而實現(xiàn)自我優(yōu)化。自我優(yōu)化將提供對問題分析所需OMC-R統(tǒng)計數(shù)據(jù)的直接訪問,以及運營商優(yōu)化系統(tǒng)的直接進入,對多廠商網絡和多技術網絡更有利。因此,所有有關的自動優(yōu)化的案例,可自動轉到自我優(yōu)化系統(tǒng)。如果自我優(yōu)化系統(tǒng)找到了解決方案,就清除該案件,生成報告并存檔;否則,可以將該案件轉交專家做進一步分析。最后的分析結果可納入專家系統(tǒng)的知識庫。
自動優(yōu)化子系統(tǒng)包括優(yōu)化模型和推理機制兩部分,其中優(yōu)化模型是如何確定問題原因的知識,模型的組成元素是原因和癥狀,推理機制是根據(jù)癥狀值分析問題原因的算法。
構建優(yōu)化模型包括兩個階段。首先,確定定性模型,即對于給定的技術(GSM、CDMA、3G和多技術網絡等)給出優(yōu)化的癥狀和原因。原因可以模型化為具有兩種狀態(tài)的離散隨機變量:{出現(xiàn),不出現(xiàn)}。癥狀可以概括為KPI和告警兩種類型,KPI本質上是連續(xù)的,可以模型化為連續(xù)或離散隨機變量。離散化的KPI可能有任意多個離散狀態(tài),分別表示該KPI的連續(xù)范圍內的一個子集,如{正常,高,很高}。告警也可以模型化為具有兩種狀態(tài)的離散隨機變量:{無,有}。其次,確定定量模型,即模型的參數(shù)。在一個離散模型中,參數(shù)就是離散化KPI的閾值和概率。
一旦確定了定性和定量模型,就可以利用推理機制來計算每個可能原因的概率。對于給定癥狀值{S1,S2,…,SNS},應用貝葉斯規(guī)則,得到原因Ci的概率如下:
(1)
式中,P(Ci)為原因Ci的先驗概率,P(Sj|Ci)是給定原因癥狀的概率。
上式假設兩個條件:原因不能同時發(fā)生;對于給定的原因,癥狀間相互獨立。以上假設適用于無線網絡RAN,即使不適用,這種模型已經被證明能提供很好的結果[6]。
假設一個實例為問題小區(qū)的癥狀值和問題的實際原因組成的集合,那么這樣的實例既可用于訓練系統(tǒng),即計算模型的參數(shù),亦可用于測試系統(tǒng),即計算優(yōu)化的準確率(在測試集合中實例正確分類的百分比)。
模型的參數(shù)是閾值和概率。一方面,閾值是連續(xù)癥狀離散化的區(qū)間,即tj,k是癥狀Sj的第k個閾值,分成狀態(tài)sj,k和sj,k+1;另一方面,根據(jù)式(1),概率如下:
(1)原因的先驗概率:P(Ci),i=1,2,3,…,NC;
(2)給定原因癥狀的條件概率:P(Sj=sj,k|Ci),i=1,2,3,…,NC;j=1,2,3,…,NS,它是給定原因Ci在狀態(tài)sj,k下癥狀Sj的概率。
知識獲取的過程就是根據(jù)優(yōu)化專家的知識構建概率模型的過程,包括兩個階段:第一階段,知識收集,即獲得專家知識;第二階段,構建模型,即根據(jù)先前獲得的專家知識確定概率模型。
知識收集的過程包括以下6個步驟。表1和表2分別匯總了優(yōu)化專家應提供的定性信息和定量信息。
表1 定性信息Table 1 Qualitative information
表2 定量信息Table 2 Quantitative information
(1)問題分類
問題類型就是RAN可能遭受的各種問題,如“高掉話率”或“擁塞”。對每個問題類型,建立一種不同的模型。
(2)定義變量
應該有原因和癥狀數(shù)據(jù)庫,優(yōu)化專家可以從數(shù)據(jù)庫中選擇一個變量,或定義一個新變量,然后將其納入到數(shù)據(jù)庫。首先,優(yōu)化專家指定問題類型的可能原因{C1,C2,…,CNC},即無線網絡中問題的原因,據(jù)此建立優(yōu)化模型(如“高掉話率”)。建議包括一個叫做“其它原因”的原因,以涵蓋在已定義原因中沒有明確界定的問題的其它可能原因。其次,要求專家列舉癥狀{S1,S2,…,SNS},這可能有助于確定先前定義的原因。每個癥狀Si的狀態(tài)si,j也應作出具體的規(guī)定。
(3)定義關系
(4)確定閾值
對于每個連續(xù)的癥狀Si,確定每個定義區(qū)間范圍(即閾值)tj,k。
(5 )確定概率
(6)將癥狀映射到數(shù)據(jù)庫(OMC-R)
將模型中癥狀映射到OMC-R中的數(shù)據(jù),每個癥狀應該與OMC-R中的一個參數(shù)(KPI、計數(shù)器等)或一組參數(shù)相關聯(lián)。
根據(jù)式(1),建立模型所需的概率為原因的先驗概率P(Ci)和給定原因下癥狀的概率P(Sj|Ci)。因此,優(yōu)化專家所提供的數(shù)據(jù)(表1和表2)應轉化為式(1)所需的概率。優(yōu)化專家所給出的概率PCi直接作為原因的概率P(Ci)??紤]到該模型假設原因是互斥的,所以原因的概率之和應為1。有兩種方式處理該約束條件:一是由專家檢查其給出的概率是否正確;二是允許給出的概率不符合約束條件,然后采用下列方法自動修正:
(1)如果概率之和大于1,那么就對每個概率進行歸一化處理;
(2)如果概率之和小于1,那么就添加一個稱為“其它”的原因CNC+1,表示專家未考慮到的問題的所有其它原因,其概率等于1減去原來原因的概率之和。
對于癥狀的概率P(Sj=sj,k|Ci),Sj對于相關原因的條件概率已經由專家明確給出:
(2)
對于所有非相關原因,癥狀的條件概率都是相同的,即:
(3)
知識獲取所建立的優(yōu)化概率模型,是一種基于知識的模型,需要經過靈敏度分析和實際網絡使用來驗證其有效性。
根據(jù)文獻[8]中靈敏度分析顯示,基于知識的模型對閾值的界定不準確尤其敏感。實驗也證明,當訓練實例數(shù)目有限或缺乏時,基于知識的模型是最好的選擇。反之,當擁有一個大型的訓練實例數(shù)據(jù)庫時,基于數(shù)據(jù)的模型應該是首選。
由于缺乏且很難得到訓練實例,所以在大多數(shù)情況下,基于知識的模型是3G和B3G無線網絡RAN的唯一選擇。建立基于知識的模型需要很長時間,特別是參數(shù)必須在實際網絡中反復測試調整。對現(xiàn)行網絡而言,可行的方法是先從基于知識的模型開始。每解決一個問題,就將相關的癥狀和實際原因保存到數(shù)據(jù)庫,這樣,訓練實例數(shù)據(jù)庫將會不斷擴展,不久即可使用基于數(shù)據(jù)的模型。
無論對于當前還是未來的移動通信無線網絡(包括GSM、CDMA、WLAN、3G、B3G網絡等),實現(xiàn)自我優(yōu)化是必由之路。本文從理論上研究了移動通信無線網絡的自動優(yōu)化,給出了無線網絡RAN自動優(yōu)化的系統(tǒng)體系結構,提出了一種從優(yōu)化專家進行知識獲取建立系統(tǒng)所需優(yōu)化模型的方法和過程。理論分析表明該方法和過程的可行性,對于自我優(yōu)化系統(tǒng)的實現(xiàn)具有一定的理論指導意義和實際應用價值。未來的進一步研究工作,一是選擇一種現(xiàn)行網絡驗證優(yōu)化概率模型的實際有效性,二是研究如何實現(xiàn)基于知識的優(yōu)化模型和基于數(shù)據(jù)的優(yōu)化模型在同一個自我優(yōu)化系統(tǒng)的有機結合。
參考文獻:
[1] Jamalipour A, Wada T, Yamazato T. A tutorial on multiple access technologies for beyond 3G mobile networks[J]. IEEE Communications Magazine, 2005, 43(2): 110-117.
[2] Barco R, Wille V, Díez V. System for automated diagnosis in cellular networks based on performance indicators[J]. European Transactions on Telecommunications, 2005, 16(5): 399-409.
[3] Wietgrefe H.Investigation and practical assessment of alarm correlation methods for the use in GSM access networks [C]//Proceedings of the IEEE/IFIP network operations and management symposium.Florence,Italy:IEEE,2002:391-403.
[4] Laiho J, Raivio K, Lehtimki P, et al. Advanced analysis methods for 3G cellular networks[J]. IEEE Transactions on Wireless Communication, 2005, 4(3): 930-942.
[6] Rish I.An Empirical Study of the Naive Bayes Classifier[R]//IJCAI-01 Workshop on Empirical Methods in Artificial Intelligence Technical Reports.[S.l.]:IJCAI-01 Workshop:2001:41-46.
[7] Renooij S, Witteman C. Talking probabilities: Communicating probabilistic information with words and numbers[J]. International Journal of Approximate Reasoning, 1999, 22(3): 169-194.
[8] Barco Raquel,Lázaro Pedro,Wille Volker,et al. Knowledge acquisition for diagnosis model in wireless networks[J]. Expert Systems with Applications, 2009, 36(3):4745-4752.