摘 要:網(wǎng)絡(luò)優(yōu)化是指通過對大量采集的網(wǎng)絡(luò)運行數(shù)據(jù)進(jìn)行分析、匯總、提煉,獲得網(wǎng)絡(luò)運行質(zhì)量的影響因子,從而針對實際情況作出相應(yīng)的決策,反饋調(diào)整系統(tǒng)參數(shù)或相關(guān)設(shè)備,讓網(wǎng)絡(luò)運行達(dá)到最佳狀態(tài),同時對網(wǎng)絡(luò)日后的運維和擴(kuò)容等提出有效的決策參考。網(wǎng)絡(luò)優(yōu)化的實質(zhì)是優(yōu)化網(wǎng)絡(luò)質(zhì)量、提高網(wǎng)絡(luò)品質(zhì),而網(wǎng)絡(luò)質(zhì)量不僅僅是單一因素作用的結(jié)果,而是受多種因素相互制約的,隨著應(yīng)用范圍的不斷增加,工作的不斷深入,其優(yōu)化技術(shù)也得到大幅提升,至使優(yōu)化領(lǐng)域不斷擴(kuò)展,優(yōu)化對象已突破現(xiàn)有的網(wǎng)絡(luò),擴(kuò)展?jié)B透到運營市場的商業(yè)預(yù)測,實施規(guī)劃,運行管理、維護(hù)擴(kuò)容等整個運營過程的各個層面。文章主要介紹K-均值聚類算法如何在無線局域網(wǎng)優(yōu)化及分析中的應(yīng)用。
關(guān)鍵詞:無線局域網(wǎng);聚類分析算法;網(wǎng)絡(luò)優(yōu)化
聚類(clustering)是將物理的抽象的對象集合,分成相似的對象類的過程。簇(cluster)是數(shù)據(jù)對象的集合,同一簇中的對象具有相似性,而不同簇中的對象則具有相異性。聚類分析(Cluster analysis,亦稱為群集分析)是一種重要的人類活動。早在孩童時代,通過不斷地改進(jìn)下意識的聚類模式來學(xué)習(xí)如何區(qū)分貓和狗,或動物和植物。通過自動聚類能夠識別對象空間中稠密和稀疏區(qū)域,從而發(fā)現(xiàn)全局分布模式和數(shù)據(jù)屬性之間有趣的相關(guān)。聚類分析已經(jīng)在許多領(lǐng)域受到廣泛應(yīng)用,包括機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘,模式識別,圖像分析以及生物信息。聚類是把相似的對象通過靜態(tài)分類的方法分成不同的組別或者更多的子集(subset),劃分的原則是在同一個簇中的對象之間具有較高的相似度,而不同簇中的對象差別較大。屬于一種無指導(dǎo)的學(xué)習(xí)方法。
針對現(xiàn)存在的一批聚類算法。尚未能提供相對標(biāo)準(zhǔn)統(tǒng)一的分類。因為類別可能交叉重疊,有可能出現(xiàn)體現(xiàn)多種特征的分類方法,一般劃分如下。劃分方法(partitioning methods):給定對象或數(shù)據(jù)元組的數(shù)據(jù)庫,劃分方法構(gòu)建數(shù)據(jù)的劃分,每個劃分表示一簇。層次方法(hierarchical methods):對預(yù)設(shè)數(shù)量的數(shù)據(jù)集進(jìn)行層次的分解。按照其分解方式可以將層次方法分類為凝聚的層次聚類和分裂的層次聚類兩種?;诿芏鹊姆椒ǎ╠ensity-based methods):以數(shù)據(jù)集在空間分布上的稠密程度為依據(jù)進(jìn)行聚類?;诰W(wǎng)格的方法(grid-based methods):將數(shù)據(jù)空間劃分成為有效單元的網(wǎng)絡(luò)結(jié)構(gòu)。基于模型的方法(model-based methods):給每一個聚類假定一個模型,然后去尋找能夠很好的滿足這個模型的數(shù)據(jù)集。
k-means算法,又叫做k-平均算法或者k-均值算法,應(yīng)用最廣泛的算法之一。它的特征是,取子集內(nèi)的樣本均值,當(dāng)作其代表點。利用迭代的思想,其數(shù)據(jù)集被劃分成不同的類別,這是它的主要思想。以致準(zhǔn)則函數(shù)性能最優(yōu)化,達(dá)到聚類性能評價最優(yōu)。產(chǎn)生的每個聚類特點是:類間獨立,類內(nèi)緊湊。它的另一特點是:適合于處理連續(xù)型屬性聚類,而不太適宜離散型屬性聚類處理。
在本文中運用了k均值聚類算法,利用Oracle來實現(xiàn)具體步驟。我們使用5個Oracle存儲過程來完成該算法。圖1是每個存儲過程的作用。
圖2是Oracle存儲過程結(jié)構(gòu)。USP_KMEANS_CLUSTER是聚類的綜合過程,它首先對數(shù)據(jù)進(jìn)行預(yù)處理,因此它最先調(diào)用的是USP_KMEANS_NORMALDATA或USP_KMEANS_STANDARDDATA,然后再去計算預(yù)處理后的數(shù)據(jù)的初始中心,這一步由過程USP_KMEANS_INITIALCENTER來實現(xiàn),再去判斷聚類中心點是否發(fā)生了變化,如果變化則再調(diào)用過程USP_KMEANS_MODIFYCENTER,直到聚類中心不再發(fā)生變化。
k-均值聚類算法可以高效的、可伸縮的處理大數(shù)據(jù)集,處理快速、操作簡單,算法嘗試找出使平方誤差函數(shù)值最小的k個劃分。若簇之間區(qū)別明顯,結(jié)果簇是密集的,效果較好。依據(jù)以上特點,適用于在無線局域網(wǎng)數(shù)據(jù)包被采集到以后進(jìn)行網(wǎng)絡(luò)優(yōu)化分析。
參考文獻(xiàn)
[1]張卓筠,高功應(yīng),王磊.WLAN與EPC網(wǎng)絡(luò)整合架構(gòu)研究[J].移動通信,2012,10:93-96.
[2]陳松喬,任勝兵,王國軍.現(xiàn)代軟件工程[M].北京:清華大學(xué)出版社,2008:210-350.
[3]George Fairbanks.恰如其分的軟件架構(gòu)[M].湖北:華中科技大學(xué)出版社,2013:340-395.
[4]陳吉平.構(gòu)建0racle高可用環(huán)境:企業(yè)級高可用數(shù)據(jù)庫架構(gòu)、實戰(zhàn)與經(jīng)驗總結(jié)[M].北京:電子工業(yè)出版社,2008:245-302.
作者簡介:魏煥新(1983-),男,湖南長沙人,碩士研究生,湖南機(jī)電職業(yè)技術(shù)學(xué)院信息工程學(xué)院,研究方向為計算機(jī)應(yīng)用技術(shù)。