亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于典型因果推斷算法的無線網(wǎng)絡(luò)性能優(yōu)化

        2016-09-29 17:40:26郝志峰陳薇蔡瑞初黃瑞慧溫雯王麗娟
        計(jì)算機(jī)應(yīng)用 2016年8期

        郝志峰 陳薇 蔡瑞初 黃瑞慧 溫雯 王麗娟

        摘要:現(xiàn)有的無線網(wǎng)絡(luò)性能優(yōu)化方法主要基于指標(biāo)間的相關(guān)關(guān)系分析,無法有效指導(dǎo)網(wǎng)絡(luò)優(yōu)化等干預(yù)行為。為此,提出典型因果推斷(CCI)算法,并將其應(yīng)用于無線網(wǎng)絡(luò)性能優(yōu)化。首先,針對(duì)無線網(wǎng)絡(luò)性能由大量相關(guān)指標(biāo)體現(xiàn)這一特性,采用典型相關(guān)分析(CCA)方法,提取指標(biāo)中蘊(yùn)含的原子事件;然后再采用因果推斷方法,構(gòu)建原子事件間的因果關(guān)系網(wǎng)絡(luò)。通過上述兩個(gè)階段反復(fù)迭代,確定原子事件間的因果關(guān)系網(wǎng)絡(luò),為無線網(wǎng)絡(luò)性能優(yōu)化提出一個(gè)較為可靠和有效的依據(jù)。最后通過模擬實(shí)驗(yàn)驗(yàn)證了CCI算法的有效性,在某城市3萬多個(gè)移動(dòng)基站數(shù)據(jù)上發(fā)現(xiàn)了一批有意義的無線網(wǎng)絡(luò)指標(biāo)間的因果關(guān)系。

        關(guān)鍵詞:典型相關(guān)分析;因果推斷;線性非高斯非循環(huán)模型;無線網(wǎng)絡(luò)性能優(yōu)化

        中圖分類號(hào):TP181

        文獻(xiàn)標(biāo)志碼:A

        0引言

        隨著信息技術(shù)的不斷發(fā)展,無線通信網(wǎng)絡(luò)逐漸普及,用戶對(duì)網(wǎng)絡(luò)服務(wù)質(zhì)量的要求也越來越高,市場(chǎng)競(jìng)爭(zhēng)也越來越激烈,如何對(duì)無線網(wǎng)絡(luò)性能進(jìn)行優(yōu)化,并在網(wǎng)絡(luò)出現(xiàn)問題之前進(jìn)行有效的預(yù)警,是當(dāng)前電信營運(yùn)商和設(shè)備供應(yīng)商非常關(guān)注的問題,同時(shí)也受到越來越多用戶的重視。目前,無線網(wǎng)絡(luò)性能的問題可以通過撥打測(cè)試、用戶反映和網(wǎng)絡(luò)指標(biāo)等分析出來,其中,網(wǎng)絡(luò)指標(biāo)比較客觀、全面地反映了無線網(wǎng)絡(luò)性能的好壞程度。盧昶[1]對(duì)網(wǎng)絡(luò)優(yōu)化主要是通過分析全球移動(dòng)通信系統(tǒng)(Global System for Mobile communication, GSM)中采集到的運(yùn)行數(shù)據(jù)和指標(biāo),來找出移動(dòng)通信系統(tǒng)中存在的問題;劉臣巍[2]對(duì)無線網(wǎng)絡(luò)中移動(dòng)交換中心(Mobile Switching Center, MSC)、基站控制器(Base Station Controller, BSC)分別進(jìn)行了優(yōu)化,用追蹤選擇錯(cuò)誤(Error of Selection, EOS)代碼的方式來解決網(wǎng)絡(luò)問題,通過分析網(wǎng)絡(luò)中性能指標(biāo)來判斷網(wǎng)絡(luò)中可以優(yōu)化的部分;劉占軍[3]結(jié)合GSM運(yùn)行原理與成都聯(lián)通GSM的實(shí)際情況,針對(duì)性地提出了切合實(shí)際的網(wǎng)絡(luò)優(yōu)化方案。針對(duì)無線網(wǎng)絡(luò)優(yōu)化問題,當(dāng)前主要是通過參數(shù)采集統(tǒng)計(jì)分析,信令跟蹤[4]、路測(cè)信息采集分析等方法對(duì)整個(gè)無線網(wǎng)絡(luò)進(jìn)行綜合分析,以得出無線網(wǎng)絡(luò)性能的優(yōu)化方案[5]。

        最近的GSM研究[6-7]提出了一些新的無線網(wǎng)絡(luò)性能優(yōu)化技術(shù),例如,基于關(guān)鍵業(yè)績指標(biāo)(Key Performance Indication, KPI)的GSM優(yōu)化與數(shù)據(jù)挖掘分析方法[8-9]。目前這類分析方法主要停留在統(tǒng)計(jì)相關(guān)性方面,有時(shí)還需要對(duì)信令進(jìn)行跟蹤,這無疑會(huì)在一定程度上造成分析不全面、不必要的工作量增加等問題。雖然統(tǒng)計(jì)數(shù)據(jù)分析方法[10]主要是針對(duì)統(tǒng)計(jì)的各項(xiàng)數(shù)據(jù)指標(biāo)實(shí)施分析,應(yīng)用Matlab等數(shù)學(xué)工具軟件進(jìn)行數(shù)據(jù)排序以展現(xiàn)數(shù)據(jù)之間的相互關(guān)聯(lián),從而發(fā)現(xiàn)其中的問題,但是,利用統(tǒng)計(jì)的方法只能看到數(shù)據(jù)之間的相關(guān)關(guān)系,而無法提出優(yōu)化干預(yù)措施,找出真正影響無線網(wǎng)絡(luò)性能的源頭。Cai等[11]提出的貝葉斯半監(jiān)督算法(BAyesian Semi-SUpervised Method, BASSUM)也證明了相關(guān)關(guān)系不能指導(dǎo)干預(yù)的情況。因果推斷是挖掘數(shù)據(jù)間蘊(yùn)含的因果性的一種有效的方法。因果網(wǎng)絡(luò)是一種對(duì)可觀測(cè)數(shù)據(jù)進(jìn)行強(qiáng)有力推理的工具,可以方便地表示以及分析確定性和概率性的事物,對(duì)干預(yù)行為效果進(jìn)行預(yù)測(cè),有助于提出干預(yù)措施。根據(jù)算法模型基礎(chǔ)的不同,主流因果推斷算法可分為兩類:以IC(Inductive Causality)類算法為代表的全局結(jié)構(gòu)推斷方法[12]和以Hoyer等[13]提出的不對(duì)稱性度量方法為代表的局部結(jié)構(gòu)推斷方法。在高維數(shù)據(jù)因果推斷方面代表性工作包括Xie等[14]的遞歸分解結(jié)構(gòu)學(xué)習(xí)策略、Han等[15]的重合分解策略、Tsamardinos等[16]的最大最小爬山法和Cai等[11]的半監(jiān)督策略等。針對(duì)IC類算法在高維數(shù)據(jù)上的可靠性問題,Cai等[17]還基于V-結(jié)構(gòu)間的沖突關(guān)系,提出了V-結(jié)構(gòu)篩選和融合算法,有效提升了IC類算法的可靠性。局部因果關(guān)系模型的代表性工作則包括:基于噪聲不對(duì)稱性的加性噪聲模型(Additive Noise Model, ANM)方法[13]和線性非高斯非循環(huán)模型(Linear Non-Gaussian Acyclic Model, LiNGAM)方法[18-19],基于數(shù)據(jù)分布不對(duì)稱性的信息幾何因果推斷(Information-Geometric Causal Inference, IGCI)[20-21]和綜合多種不對(duì)稱性度量的后非線性(Post-Nonlinear, PNL)方法[22]等。這些局部結(jié)構(gòu)學(xué)習(xí)方法突破了全局結(jié)構(gòu)推斷方法的發(fā)現(xiàn)能力限制,能夠區(qū)分任意兩個(gè)變量間的因果方向,如x→y→z, x←y←z, x←y→z等IC類方法無法判定的因果關(guān)系。

        實(shí)際中的無線網(wǎng)絡(luò)性能指標(biāo)維數(shù)較大,指標(biāo)之間相關(guān)性強(qiáng),原子事件指標(biāo)由大量指標(biāo)體現(xiàn),若直接對(duì)其進(jìn)行因果推斷,則網(wǎng)絡(luò)指標(biāo)內(nèi)部的因果關(guān)系將變得毫無意義。Cai等[17,23]也通過研究發(fā)現(xiàn),雖然有高維因果推斷算法應(yīng)用于高維數(shù)據(jù)的因果推斷,但是仍存在因大量因果關(guān)系集中在原子事件指標(biāo)內(nèi)部,如果直接對(duì)網(wǎng)絡(luò)指標(biāo)進(jìn)行因果推斷,原子事件指標(biāo)內(nèi)部的指標(biāo)之間的因果關(guān)系也將變得無意義。

        針對(duì)上面的分析可以得出無線網(wǎng)絡(luò)性能指標(biāo)優(yōu)化面臨以下兩個(gè)挑戰(zhàn):1)相關(guān)關(guān)系不能指導(dǎo)干預(yù);2)直接對(duì)網(wǎng)絡(luò)指標(biāo)進(jìn)行因果推斷無法找到有意義的指標(biāo)內(nèi)部的直接因果關(guān)系。因此,本文提出典型因果推斷(Canonical Causal Inference, CCI)算法,用于分析無線網(wǎng)絡(luò)性能。該算法采用典型相關(guān)分析(Canonical Correlation Analysis, CCA)方法[24]提取無線網(wǎng)絡(luò)的指標(biāo)中蘊(yùn)含的原子指標(biāo),并對(duì)其進(jìn)行因果推斷,經(jīng)過不斷地迭代上面提取原子事件指標(biāo)和因果推斷兩個(gè)過程,得到原子指標(biāo)間的因果網(wǎng)絡(luò)圖。通過學(xué)習(xí)到的原子指標(biāo)因果網(wǎng)絡(luò)圖,可以對(duì)無線網(wǎng)絡(luò)性能進(jìn)行全面分析,同時(shí)能對(duì)干預(yù)效果作前期預(yù)測(cè),及時(shí)對(duì)可能發(fā)生故障或影響的網(wǎng)絡(luò)指標(biāo)進(jìn)行維護(hù)或維修。

        1相關(guān)工作

        1.1無線網(wǎng)絡(luò)性能分析

        無線網(wǎng)絡(luò)性能的好壞主要通過網(wǎng)絡(luò)指標(biāo)來體現(xiàn)。網(wǎng)絡(luò)指標(biāo)主要包括:信令信道可用率、信令信道擁塞率、信道掉話率、話音信道可用率、話音信道擁塞率、話音信道掉話率、切換成功率、雙頻切換成功率、無線信道利用率、上下行語音質(zhì)量等。對(duì)無線網(wǎng)絡(luò)性能進(jìn)行分析,很大程度上就是對(duì)無線網(wǎng)絡(luò)運(yùn)行指標(biāo)的分析,從全網(wǎng)到小區(qū),每個(gè)時(shí)段,進(jìn)行整體到局部的分析,通過分析,進(jìn)而找到提高無線網(wǎng)絡(luò)性能的方法。

        1.2典型相關(guān)分析

        典型相關(guān)分析(CCA)是一種用于分析兩組隨機(jī)變量集之間相互依賴關(guān)系的多元統(tǒng)計(jì)分析方法,是一種很有價(jià)值的多元數(shù)據(jù)處理方法。其基本思想是:分別在兩組指標(biāo)中提取有代表性的兩個(gè)綜合指標(biāo)U和V(U和V分別為兩個(gè)指標(biāo)組中各個(gè)指標(biāo)的線性組合),利用這兩個(gè)綜合指標(biāo)之間的相關(guān)關(guān)系來反映兩組指標(biāo)之間的整體相關(guān)性。其目的是識(shí)別并量化兩組指標(biāo)之間的聯(lián)系,將兩組指標(biāo)的相關(guān)關(guān)系分析,轉(zhuǎn)化為一組指標(biāo)的線性組合與另一組指標(biāo)線性組合之間的相關(guān)關(guān)系分析。其數(shù)學(xué)定義如下:

        總的來說,LiNGAM算法依賴于獨(dú)立成分分析(Independent Component Analysis, ICA)方法。ICA算法是一種混合信號(hào)的分離算法。LiNGAM算法首先通過ICA算法從觀察數(shù)據(jù)中得到分離矩陣,再依據(jù)LiNGAM模型的假設(shè)對(duì)該分離矩陣進(jìn)行處理得到因果順序,最后采用最小二乘法求得系數(shù)矩陣;同時(shí),該算法還利用剪枝算法對(duì)LiNGAM初步推斷得到的近似為全關(guān)聯(lián)的結(jié)構(gòu)進(jìn)行剪枝,得到與實(shí)際相符的較為稀疏的結(jié)構(gòu)。

        2利用CCI算法優(yōu)化無線網(wǎng)絡(luò)性能

        2.1問題定義

        2.1.1無線網(wǎng)絡(luò)指標(biāo)因果網(wǎng)絡(luò)圖

        無線網(wǎng)絡(luò)指標(biāo)是衡量無線網(wǎng)絡(luò)性能高低的一個(gè)主要標(biāo)準(zhǔn)。在無線網(wǎng)絡(luò)中,一個(gè)指標(biāo)可以由大量相關(guān)的子指標(biāo)進(jìn)行測(cè)量和表示。例如,原子指標(biāo)就是由大量指標(biāo)進(jìn)行體現(xiàn)的。因此,我們對(duì)原子指標(biāo)有如下定義:

        2.2利用CCI算法優(yōu)化無線網(wǎng)絡(luò)性能的過程

        利用CCI算法優(yōu)化無線網(wǎng)絡(luò)性能的基本流程為:

        輸入所有無線網(wǎng)絡(luò)指標(biāo)的數(shù)據(jù),該算法先對(duì)這些指標(biāo)進(jìn)行預(yù)處理,然后分為兩步:1)對(duì)評(píng)估同一主指標(biāo)的一組相關(guān)指標(biāo)Xti進(jìn)行組合,與其余指標(biāo)組成的一組指標(biāo)進(jìn)行典型相關(guān)分析,抽取原子指標(biāo)Xt,再對(duì)抽取出來的原子指標(biāo)集合用LiNGAM模型進(jìn)行因果網(wǎng)絡(luò)學(xué)習(xí),得到初步的原子指標(biāo)因果網(wǎng)絡(luò)圖;2)根據(jù)前面學(xué)習(xí)到的原子指標(biāo)因果網(wǎng)絡(luò)圖,即結(jié)合原子指標(biāo)之間的因果性,重新典型分析原子指標(biāo)與其他相關(guān)指標(biāo)的指標(biāo)集合,抽取出新的原子指標(biāo),并不斷迭代,直到學(xué)習(xí)到的因果網(wǎng)絡(luò)圖趨于穩(wěn)定狀態(tài)為止,最終得到完整的原子指標(biāo)因果網(wǎng)絡(luò)圖。根據(jù)原子指標(biāo)因果網(wǎng)絡(luò)圖中展現(xiàn)的原子指標(biāo)間的因果依賴關(guān)系,分析影響無線網(wǎng)絡(luò)性能的因素,從而得到無線網(wǎng)絡(luò)性能優(yōu)化的方案和干預(yù)措施。

        3CCI算法

        CCI算法是在CCA和LiNGAM算法的基礎(chǔ)上提出的,它與CCA和LiNGAM算法的不同主要體現(xiàn)如下:

        1)CCA是用于分析多元變量的相關(guān)性,而CCI算法則是采用CCA的主要思想來選擇變量,抽取原子事件,有助于分析原子指標(biāo)之間的因果關(guān)系,使原子指標(biāo)內(nèi)部指標(biāo)的因果依賴也變得有意義,同時(shí)提高推斷的準(zhǔn)確度。

        2)LiNGAM算法分析的數(shù)據(jù)是線性非高斯變量,而CCI算法則是用于分析多元變量典型相關(guān)分析而得到的典型變量,后者降低了變量的維度,同時(shí)降低了算法的時(shí)間復(fù)雜度。利用因果推斷算法,也有助于對(duì)采取干預(yù)行為的效果進(jìn)行預(yù)測(cè),實(shí)現(xiàn)性能問題出現(xiàn)前的預(yù)警,提出合理的無線網(wǎng)絡(luò)性能指標(biāo)優(yōu)化的干預(yù)方案。

        根據(jù)以上分析,給定一個(gè)數(shù)據(jù)集,可以通過以下步驟利用CCI算法進(jìn)行原子事件因果網(wǎng)絡(luò)圖學(xué)習(xí):

        步驟1

        抽取原子事件。

        對(duì)給定的數(shù)據(jù)集,首先利用相關(guān)專業(yè)知識(shí),將數(shù)據(jù)集中表示相同或相近類型的變量進(jìn)行分組,作為不同原子事件所對(duì)應(yīng)的變量集合;再對(duì)每一組中的變量進(jìn)行類似典型相關(guān)分析,抽取原子事件。與CCA不同的是,CCI算法的兩組相關(guān)分析的變量是由原先知識(shí)組合得到的變量集合,與數(shù)據(jù)集中其余的變量組合而成的變量集合進(jìn)行典型相關(guān)分析,找到一組wi和wj,使其滿足以下條件:

        例如,圖4中的原子事件為1,其相關(guān)變量組為A={11,1.2,1.3}。它是A和A在數(shù)據(jù)集中的補(bǔ)集 的典型相關(guān)變量,并且其滿足在兩個(gè)變量組方程為1的約束下,事件1和事件1′之間的相關(guān)系數(shù)最大。

        步驟2

        初步因果推斷。

        對(duì)抽取出來的原子事件,利用LiNGAM算法進(jìn)行因果結(jié)構(gòu)學(xué)習(xí),得到初步的原子事件因果網(wǎng)絡(luò)圖,獲得初步的原子事件間的因果性。LiNGAM算法分為估計(jì)與剪枝兩個(gè)階段。

        第一階段是估計(jì)階段,該階段能夠得出因果順序以及初步估計(jì)出整個(gè)因果結(jié)構(gòu)(即矩陣系數(shù))。由式(1)可推出: Wx=e,W=(I-B)。其中:I為單位矩陣,W稱為混合矩陣。

        第二階段是剪枝階段。剪枝算法是對(duì)LiNGAM初步推斷的近似為全關(guān)聯(lián)的結(jié)構(gòu)進(jìn)行剪枝,得到與實(shí)際相符的較為稀疏的結(jié)構(gòu)。LiNGAM模型的剪枝問題采取的剪枝算法分為兩類:一類是基于統(tǒng)計(jì)學(xué)與最優(yōu)化的相關(guān)理論,例如Resampling與Adaptive Lasso等;另一類是基于貝葉斯網(wǎng)絡(luò)判斷無向結(jié)構(gòu)的相關(guān)算法,此類算法核心點(diǎn)是條件獨(dú)立性測(cè)試,例如:PC算法[12],基于馬爾可夫毯的BASSUM算法中的剪枝策略[11],Mooij等[25]提出的殘差依賴最小化的方法等。

        例如,在圖4中的抽取原子事件的基礎(chǔ)上,進(jìn)行因果網(wǎng)絡(luò)推斷,得到圖5所示的原子事件因果網(wǎng)絡(luò)圖。

        步驟3

        重新抽取原子事件,不斷迭代,得到原子事件因果網(wǎng)絡(luò)圖。

        對(duì)每個(gè)原子指標(biāo),分別求其與子節(jié)點(diǎn)指標(biāo)滿足式(2)的典型相關(guān)變量,將與它的指標(biāo)集合線性相關(guān)的典型變量作為指標(biāo)集合的原子指標(biāo),對(duì)原子指標(biāo)進(jìn)行基于LiNGAM算法的因果網(wǎng)絡(luò)推斷,得到另一個(gè)原子指標(biāo)間的因果網(wǎng)絡(luò)圖。

        例如,在圖6的基礎(chǔ)上,事件1與事件2進(jìn)行典型相關(guān)分析,得到滿足式(2)的典型變量1-1和2-1,則將變量1-1作為事件1新的原子事件。

        其中:步驟3)是計(jì)算初始的原子指標(biāo);步驟5)是通過不斷迭代,保證最終的原子指標(biāo)因果網(wǎng)絡(luò)圖趨于穩(wěn)定狀態(tài),得到最終的原子指標(biāo)間的因果關(guān)系,Y′存儲(chǔ)了最終的原子指標(biāo)集合。

        4實(shí)驗(yàn)結(jié)果與分析

        為了對(duì)本文提出的算法進(jìn)行驗(yàn)證和分析,分別用虛擬數(shù)據(jù)和真實(shí)數(shù)據(jù)進(jìn)行了實(shí)驗(yàn)。

        4.1虛擬數(shù)據(jù)實(shí)驗(yàn)

        本文使用人工生成不同參數(shù)下的測(cè)試數(shù)據(jù)集,選取了典型偏相關(guān)(Canonical Partial Correlation, CPC)算法與本文算法進(jìn)行比較。虛擬數(shù)據(jù)的生成分兩階段實(shí)現(xiàn):

        1)生成原子指標(biāo)的因果網(wǎng)絡(luò)圖,其中單父親節(jié)點(diǎn)個(gè)數(shù)為雙父親節(jié)點(diǎn)個(gè)數(shù)的2倍,并依照該圖生成數(shù)據(jù)。

        2)生成指標(biāo)數(shù)據(jù):隨機(jī)生成每組指標(biāo)的個(gè)數(shù),每個(gè)指標(biāo)的數(shù)據(jù)依照函數(shù)X=Y×Q-1生成,其中:Q為每個(gè)函數(shù)的權(quán)值,即原子指標(biāo)與指標(biāo)集合的相關(guān)系數(shù),隨機(jī)取值于0~1;Y為原子指標(biāo)。在整個(gè)因果網(wǎng)絡(luò)生成階段,采用20維原子事件、50維指標(biāo)變量分別生成300、400、500、600、700、800樣本量的因果網(wǎng)絡(luò)圖,用來測(cè)試兩種算法在不同樣本量下的實(shí)驗(yàn)效果;采用25維原子事件和500樣本量分別生成30、40、50、80、100維指標(biāo)變量的因果網(wǎng)絡(luò)圖,用來測(cè)試兩種算法在不同指標(biāo)數(shù)下的實(shí)驗(yàn)效果;采用50維指標(biāo)變量500樣本量分別生成6、13、25、30、40維原子事件的因果網(wǎng)絡(luò)圖,用來測(cè)試兩種算法在樣本指標(biāo)變量抽取為不同原子事件下的實(shí)驗(yàn)效果。

        為了有效地評(píng)價(jià)該算法的性能,本文采用正確率(Precision)、召回率(Recall)和F1值對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)估。正確率是指所有通過典型因果推斷算法學(xué)習(xí)到的原子指標(biāo)關(guān)系中正確的邊數(shù)占原始因果圖中所有邊數(shù)的比例;召回率是指所有學(xué)習(xí)到的正確的邊數(shù)占整個(gè)數(shù)據(jù)(學(xué)習(xí)到的和未學(xué)習(xí)到的)中真正正確的邊數(shù)的比例。F1值通過以下公式來計(jì)算:

        正確率主要是用來衡量因果網(wǎng)絡(luò)圖中節(jié)點(diǎn)間本來不存在的邊被錯(cuò)誤添加的程度;召回率是用來衡量節(jié)點(diǎn)間存在的邊沒有被發(fā)現(xiàn)的程度;F1則綜合了前兩個(gè)評(píng)價(jià)參數(shù),用來評(píng)價(jià)本文方法的總體優(yōu)劣。

        在本節(jié)的實(shí)驗(yàn)中,用構(gòu)造出的虛擬數(shù)據(jù)網(wǎng)絡(luò)對(duì)CCI和CPC算法進(jìn)行對(duì)比實(shí)驗(yàn)。圖7表明,在25維原子事件50維指標(biāo)變量中,樣本數(shù)超過400之后,CCI算法的正確率、召回率和F1值都比CPC算法高。這說明在大量樣本量的情況下,CCI算法具有較高的穩(wěn)定性和準(zhǔn)確性。從圖8中可知,CCI算法在指標(biāo)維度逐漸增加的情況下三個(gè)評(píng)分參數(shù)都比CPC算法高。這體現(xiàn)了CCI算法在高維的適用性,以及算法抽取原子事件這一策略是十分可靠和有價(jià)值的。實(shí)際中無線網(wǎng)絡(luò)性能相關(guān)的指標(biāo)維數(shù)一般較高,CCI算法中提出的抽取原子事件能使性能優(yōu)化分析更加便捷。在同一指標(biāo)維度下,抽取的原子事件維數(shù)多少也會(huì)影響CCI在實(shí)際中應(yīng)用的正確率(如圖9所示)。雖然隨著原子事件維度的增加,CPC算法在三個(gè)評(píng)分上基本呈遞增趨勢(shì),但是在原子事件維度越少的情況下,CCI算法體現(xiàn)了很好的效果。這體現(xiàn)了CCI算法將較多相關(guān)指標(biāo)用原子事件表示這一方法的有效性。

        4.2CCI算法在實(shí)際數(shù)據(jù)中的應(yīng)用

        4.2.1數(shù)據(jù)集說明

        實(shí)驗(yàn)數(shù)據(jù)來源于某城市3萬多個(gè)移動(dòng)基站收集到的GSM性能指標(biāo)數(shù)據(jù)。其中包含了42個(gè)無線網(wǎng)絡(luò)性能指標(biāo)(如:業(yè)務(wù)信道(Traffic Channel, TCH)話務(wù)量、半速率話務(wù)量、分組數(shù)據(jù)信道(Packet Data Channel, PDCH)使用數(shù)占比、TCH可用率、PDCH總復(fù)用度等),總共有30406個(gè)樣本數(shù)據(jù)。由領(lǐng)域知識(shí)可知,該數(shù)據(jù)集可以提取出12個(gè)原子指標(biāo)。

        4.2.2數(shù)據(jù)預(yù)處理

        本文使用的指標(biāo)數(shù)據(jù)屬性包括TCH話務(wù)量、半速率話務(wù)量、PDCH使用數(shù)占比、TCH可用率、PDCH總復(fù)用度等,每個(gè)指標(biāo)對(duì)應(yīng)的數(shù)據(jù)都是經(jīng)過預(yù)處理之后,按照一定的方式作為輸入數(shù)據(jù);同時(shí),對(duì)指標(biāo)數(shù)據(jù)屬性根據(jù)領(lǐng)域知識(shí)和指標(biāo)間的相關(guān)性進(jìn)行歸類,可以結(jié)合為12個(gè)原子指標(biāo)。如:原子指標(biāo)“半速率話務(wù)比例”對(duì)應(yīng)的相關(guān)指標(biāo)為“TCH話務(wù)量、半速率話務(wù)量、PDCH使用數(shù)占比、TCH可用率”;原子指標(biāo)“增強(qiáng)型數(shù)據(jù)速率GSM演進(jìn)(Enhanced Data Rate for GSM Evolution, EDGE)技術(shù)和分組數(shù)據(jù)信道(PDCH)占比”對(duì)應(yīng)的相關(guān)指標(biāo)為“PDCH總復(fù)用度”等。由于采集數(shù)據(jù)過程中出現(xiàn)一些噪聲,所以對(duì)數(shù)據(jù)集中數(shù)據(jù)值的預(yù)處理方法為,將數(shù)據(jù)為“#DIV/0!”、“#N/A”及空值用“0”替換之后,對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化(均值為0,方差為1)。

        4.2.3實(shí)驗(yàn)結(jié)果分析

        1)使用本文的方法,對(duì)42個(gè)指標(biāo)30406個(gè)樣本數(shù)據(jù),共12個(gè)原子指標(biāo)的無線網(wǎng)絡(luò)性能指標(biāo)數(shù)據(jù)集中學(xué)習(xí)原子指標(biāo)因果網(wǎng)絡(luò),得出無線網(wǎng)絡(luò)性能優(yōu)化的方案。算法在重新抽取原子指標(biāo)過程總共迭代了2次,說明其收斂速度很快。這也證明了CCI算法抽取原子事件的方法具有高效性和有效性。通過算法學(xué)習(xí)和推斷之后最終得到的原子指標(biāo)因果網(wǎng)絡(luò)圖如圖10所示,圖中包含12個(gè)指標(biāo)節(jié)點(diǎn)、17條邊,每條邊表示指標(biāo)之間的因果依賴關(guān)系。

        2)廣東南方通信建設(shè)有限公司的專家結(jié)合其專業(yè)知識(shí),將實(shí)驗(yàn)生成的因果網(wǎng)絡(luò)圖跟實(shí)際情況下無線網(wǎng)絡(luò)的相關(guān)數(shù)據(jù)指標(biāo)間的關(guān)系進(jìn)行對(duì)比,指出本文方法有一定的指導(dǎo)性和啟發(fā)性。例如,“獨(dú)立專用控制信道 (Stand-Alone Dedicated Control Channel, SDCCH)擁塞率與SDCCH話務(wù)量在數(shù)據(jù)統(tǒng)計(jì)上呈現(xiàn)正相關(guān)關(guān)系,即SDCCH話務(wù)量增加時(shí),SDCCH擁塞率也隨著增長,進(jìn)而導(dǎo)致SDCCH掉話率提高”。這個(gè)專業(yè)性的結(jié)論跟因果網(wǎng)絡(luò)圖中顯示的“SDCCH擁塞率與SDCCH掉話率之間存在因果關(guān)系”的結(jié)果是相吻合的。學(xué)習(xí)到的原子指標(biāo)因果網(wǎng)絡(luò)圖經(jīng)由專家評(píng)測(cè),足以證明本文方法具有可行性。

        3)圖10表明,影響該城市GSM性能高低的源頭主要是“臨時(shí)數(shù)據(jù)快流(Temporary Block Flow, TBF)建立成功率”,這個(gè)性能指標(biāo)與“無線接入性” “EDGE流量占比”“EDGE PDCH占比”“半速率話務(wù)掉話比”這四個(gè)性能指標(biāo)之間存在因果關(guān)系。若發(fā)現(xiàn)“EDGE流量占比”這個(gè)指標(biāo)數(shù)據(jù)出現(xiàn)異常,那么可以考慮提高TBF建立的成功率。通過分析“TBF建立成功率”這個(gè)原子指標(biāo)內(nèi)部指標(biāo)的因果性,就可以很快設(shè)計(jì)出一套無線網(wǎng)絡(luò)優(yōu)化方案?;谝蚬麑?duì)干預(yù)行為效果預(yù)測(cè)的有效性,還可以提前對(duì)“EDGE流量占比”進(jìn)行預(yù)警,制定好解決“EDGE流量占比”突然增大的應(yīng)對(duì)方案,以消除其對(duì)無線網(wǎng)絡(luò)性能造成的影響。

        從圖10中還可以看出,原子指標(biāo)“半速率話務(wù)掉話比”受到原子指標(biāo)“EDGE PDCH占比”的影響,而原子指標(biāo)“EDGE PDCH占比”對(duì)應(yīng)的相關(guān)指標(biāo)為“PDCH總復(fù)用度”。根據(jù)專業(yè)知識(shí)可知,PDCH復(fù)用度是指有多少個(gè)用戶在同一時(shí)間共同使用同一PDCH,它反映了PDCH信道的復(fù)用程度。它的值等于并發(fā)的TCH數(shù)目占用的PDCH的數(shù)目,主要是通過激活數(shù)量多少來衡量。而“半速率話務(wù)掉話比”對(duì)應(yīng)的指標(biāo)有“TCH話務(wù)量、半速率話務(wù)量、PDCH使用數(shù)占比、TCH可用率”,這說明PDCH信道的復(fù)用程度大小變化可以造成這些指標(biāo)的變化,這個(gè)結(jié)論可以為無線網(wǎng)絡(luò)性能的優(yōu)化方案的制定提供指導(dǎo)性的作用。當(dāng)發(fā)現(xiàn)TCH話務(wù)量較大時(shí),可以對(duì)半速率比率進(jìn)行調(diào)整;同時(shí),還可以提前設(shè)置PDCH信道比率門限,根據(jù)TCH話務(wù)量等信息進(jìn)行動(dòng)態(tài)的評(píng)估和優(yōu)化。

        5結(jié)語

        本文從已有的無線網(wǎng)絡(luò)性能優(yōu)化的方法和難點(diǎn)入手,提出一種基于典型因果推斷(CCI)算法的無線網(wǎng)絡(luò)性能優(yōu)化方法,通過本文提出的算法學(xué)習(xí)到的結(jié)果對(duì)無線網(wǎng)絡(luò)性能進(jìn)行分析,得出了若干個(gè)有指導(dǎo)意義的結(jié)論。與現(xiàn)有的無線網(wǎng)絡(luò)性能分析方法相比,本文采用因果推斷方法,能解決相關(guān)關(guān)系無法指導(dǎo)干預(yù)的問題;同時(shí),本文方法將同類型的相關(guān)指標(biāo)進(jìn)行融合,抽取原子指標(biāo),再進(jìn)行因果網(wǎng)絡(luò)學(xué)習(xí),有助于解決無線網(wǎng)絡(luò)指標(biāo)數(shù)量多,與基于大量指標(biāo)不易體現(xiàn)原子指標(biāo)因果學(xué)習(xí)的結(jié)果,以及對(duì)原子指標(biāo)內(nèi)部指標(biāo)因果關(guān)系無意義的問題。同時(shí),采用LiNGAM因果推斷算法,其中運(yùn)用到的ICA算法可以消除指標(biāo)間的相關(guān)性,減少指標(biāo)相關(guān)性對(duì)因果推斷的影響,提高無線網(wǎng)絡(luò)的性能分析的準(zhǔn)確性,這種方法也為無線網(wǎng)絡(luò)優(yōu)化提供了新的思路。但是,本文中對(duì)指標(biāo)的初始組合是基于無線網(wǎng)絡(luò)指標(biāo)的領(lǐng)域知識(shí),難免會(huì)受到人為因素的影響,后期將對(duì)指標(biāo)組合的選擇展開進(jìn)一步的研究,發(fā)現(xiàn)潛在的影響無線網(wǎng)絡(luò)性能的指標(biāo)。

        參考文獻(xiàn):

        [1]盧昶.GSM網(wǎng)絡(luò)優(yōu)化綜合分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2008:2-4. (LU C. The design and implementation of GSM network optimizing analysis system [D]. Beijing: Beijing University of Posts and Telecommunications, 2008: 2-4.)

        [2]劉臣巍.GSM交換無線網(wǎng)絡(luò)優(yōu)化[D].長春:吉林大學(xué),2009:1-6. (LIU C W. GSM exchange wireless network optimization [D]. Changchun: Jilin University, 2009: 1-6.)

        [3]劉占軍.GSM移動(dòng)通信網(wǎng)絡(luò)優(yōu)化的研究與實(shí)現(xiàn)[D].成都:電子科技大學(xué),2009:1-3. (LIU Z J. The design and implementation of GSM mobile network [D]. Chengdu: University of Electronic Science and Technology of China, 2009: 1-3.)

        [4]白俊杰,何長艷. No.7信令網(wǎng)的網(wǎng)絡(luò)優(yōu)化[J].天津通信技術(shù),2004(4):52-53. (BAI J J, HE C Y. No.7 signaling network optimization [J]. Tianjin Communications Technology, 2004(4):52-53.)

        [5]吳寶棟,肖恒輝,陸南昌,等.無線網(wǎng)絡(luò)智能優(yōu)化系統(tǒng)及其應(yīng)用[J].移動(dòng)通信,2012(12):16-20. (WU B D, XIAO H H, LU N C, et al. Wireless network intelligent optimization system and its application [J]. Mobile Communications, 2012(12): 16-20.)

        [6]盧紀(jì)宇,白波.GSM無線網(wǎng)絡(luò)的優(yōu)化[J].電信技術(shù),2006(12):60-62. (LU J Y, BAI B. GSM wireless network optimization [J]. Telecommunications Technology, 2006(12):60-62.)

        [7]周文靜.無線網(wǎng)絡(luò)優(yōu)化方式新思路的探討[J].廣東通信技術(shù),2006,26(12):2-6. (ZHOU W J. Discussion on new ideas for wireless network optimization approaches [J]. Guangdong Communication Technology, 2006, 26(12): 60-62.)

        [8]AGRAWAL R, MANNILA H, SRIKANT R, et al. Fast discovery of association rules [M]// Advances in Knowledge Discovery and Data Mining. Menlo Park, CA: American Association for Artificial Intelligence, 1996: 307-328.

        [9]王華奎,李艷萍,張立毅,等.移動(dòng)通信原理與技術(shù)[M].北京:清華大學(xué)出版社,2009:1. (WANG H K, LI Y P, ZHANG L Y, et al. Mobile Communication Principle and Technology [M]. Beijing: Tsinghua University Press, 2009:1.)

        [10]劉穎.GSM無線網(wǎng)絡(luò)優(yōu)化研究[J].中國新技術(shù)新產(chǎn)品,2012(4):36-36. (LIU Y. GSM wireless network optimization research [J]. China New Technologies and Products, 2012(4): 36-36.)

        [11]CAI R, ZHANG Z, HAO Z. BASSUM: a Bayesian semi-supervised method for classification feature selection [J]. Pattern Recognition, 2011, 44(4): 811-820.

        [12]PEARL J. Causality: Models, Reasoning and Inference [M]. 2nd ed. Cambridge, UK: Cambridge University Press, 2009: 49-51.

        [13]HOYER P O, JANZING D, MOOIJ J M, et al. Nonlinear causal discovery with additive noise models [C]// Advances in Neural Information Processing Systems 21. Cambridge, MA: MIT Press, 2008: 689-696.

        http://machinelearning.wustl.edu/mlpapers/papers/NIPS2008_0266

        [14]XIE X, GENG Z. A recursive method for structural learning of directed acyclic graphs [J]. Journal of Machine Learning Research, 2008, 9: 459-483.

        [15]HAN L, SONG G, CONG G, et al. Overlapping decomposition for causal graphical modeling [C]// KDD 12: Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2012: 114-122.

        [16]TSAMARDINOS I, BROWN L E, ALIFERIS C F. The max-min hill-climbing Bayesian network structure learning algorithm [J]. Machine Learning, 2006, 65(1): 31-78.

        [17]CAI R, ZHANG Z, HAO Z. Causal gene identification using combinatorial V-structure search [J]. Neural Networks, 2013, 43: 63-71.

        [18]SHIMIZU S, HOYER P O, HYVRINEN A, et al. A linear non-Gaussian acyclic model for causal discovery [J]. Journal of Machine Learning Research, 2006, 7: 2003-2030.

        [19]SHIMIZU S, INAZUMI T, SOGAWA Y, et al. DirectLiNGAM: a direct method for learning a linear non-Gaussian structural equation model [J]. Journal of Machine Learning Research, 2011, 12: 1225-1248.

        [20]JANZING D, MOOIJ J, ZHANG K, et al. Information-geometric approach to inferring causal directions [J]. Artificial Intelligence, 2012, 182/183: 1-31.

        [21]JANZING D, STEUDEL B, SHAJARISALES N, et al. Justifying information-geometric causal inference [M]// Measures of Complexity. Berlin: Springer-Verlag, 2015: 253-265.

        [22]ZHANG K, HYVRINEN A. On the identifiability of the post-nonlinear causal model [C]// UAI 09: Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence. Arlington: AUAI Press, 2009: 647-655.

        [23]CAI R, ZHANG Z, HAO Z. SADA: a general framework to support robust causation discovery [C]// Proceedings of the 30th International Conference on Machine Learning. [S.l.]: JMLR: W&CP, 2013, 28: 208-216.

        http://jmlr.org/proceedings/papers/v28/cai13.html

        http://jmlr.org/proceedings/papers/v28/cai13.pdf

        [24]胡國定,張潤楚.多元數(shù)據(jù)分析方法:純代數(shù)處理[M].天津:南開大學(xué)出版社,1990:507-527. (HU G D, ZHANG R C. Multivariate Data Analysis Method: Pure Algebra Processing [M]. Tianjin: Nankai University Press, 1990: 507-527.)

        [25]MOOIJ J, JANZING D, PETERS J, et al. Regression by dependence minimization and its application to causal inference in additive noise models [C]// ICML 2009: Proceedings of the 26th Annual International Conference on Machine Learning. New York: ACM, 2009: 745-752.

        精品国产偷窥一区二区| 日本骚色老妇视频网站| 男人的天堂av你懂得| 夫妻免费无码v看片| 中文字幕一区二区三区人妻少妇| 性导航app精品视频| 美女偷拍一区二区三区| 色哟哟亚洲色精一区二区| 成人爽a毛片在线视频| 精品无码久久久久久久久粉色| 亚洲不卡毛片在线观看| 漂亮人妻洗澡被公强 日日躁| 久久综合精品国产一区二区三区无码| 欧美成人精品三级在线观看| 久久精品日韩免费视频| 好吊妞视频这里有精品| 久久99久久99精品免观看| 日韩在线观看网址| 亚洲午夜经典一区二区日韩 | 国产盗摄一区二区三区av| 神马影院午夜dy888| 看国产黄大片在线观看| 91精品欧美综合在线观看| 国产一区二区三区的区| 久久久久亚洲精品无码网址蜜桃| 国产91中文| 在线日韩中文字幕乱码视频| 亚洲一区二区三区内裤视| 99精品热这里只有精品| 爆乳无码AV国内| 日本免费一区二区三区在线播放| 国产精品多p对白交换绿帽| 乱伦一区二| 国产又湿又爽又猛的视频| 国产欧美精品一区二区三区四区 | 91久久精品国产91久久| 日韩精品中文字幕免费人妻| 天堂av在线美女免费| 国内a∨免费播放| 国产AV秘 无码一区二区三区 | 男人和女人高潮免费网站|