廣西電網(wǎng)有限責(zé)任公司信息中心 萬義飛 梁彪 周迪貴
目前分流系統(tǒng)分流大數(shù)據(jù)信息效率較低,為此提出基于優(yōu)化聚類算法的大數(shù)據(jù)信息分流系統(tǒng)設(shè)計。根據(jù)博弈論,建立信道選擇模型;設(shè)計信道選擇步驟,選擇信息分流信道;采用優(yōu)化聚類算法,聚類大數(shù)據(jù)信息,生成混沌序列,分流大數(shù)據(jù)信息。實驗結(jié)果:設(shè)計系統(tǒng)相較此次實驗選擇系統(tǒng),平均信息分流效率更高。
大數(shù)據(jù)信息分流,是通過不同的網(wǎng)絡(luò),制定數(shù)據(jù)傳輸方案,增強網(wǎng)絡(luò)容量。國內(nèi)外十分重視大數(shù)據(jù)信息分流技術(shù),目前國外已經(jīng)研究出PBP、貪婪算法、DH算法、TH算法、TRH算法、快速交換算法等信息分流技術(shù);國內(nèi)雖然從整體上的研究成果上看,落后于國外研究成果,但是,也研究出FDLB算法、負(fù)載自適應(yīng)均衡算法、網(wǎng)絡(luò)入侵檢測算法等信息分流技術(shù)[1]。在國內(nèi)外研究基礎(chǔ)上,文獻(xiàn)[2]在系統(tǒng)中設(shè)計了信息特征采取及調(diào)度模塊,實現(xiàn)數(shù)據(jù)分流。將這一研究方法,應(yīng)用在大數(shù)據(jù)信息分流中,其信息分流效率較低,為此,引入優(yōu)化聚類算法,聚類大數(shù)據(jù)信息,加快信息分流效率,設(shè)計基于優(yōu)化聚類算法的大數(shù)據(jù)信息分流系統(tǒng)。
在當(dāng)前分流系統(tǒng)硬件設(shè)計基礎(chǔ)上,設(shè)計系統(tǒng)軟件??紤]系統(tǒng)主要功能,建立信道選擇模型,通過優(yōu)化聚類算法,聚類大數(shù)據(jù)信息,依據(jù)聚類結(jié)果,實現(xiàn)大數(shù)據(jù)信息分流。
大數(shù)據(jù)信息分流,需要先選擇信息分流信道,而信道的選擇是一個博弈的過程,因此采用博弈論,建立信道選擇模型,則有:
(1)式中, 表示大數(shù)據(jù)信息的移動設(shè)備選擇信道策略,其中,nb表示第 n臺移動設(shè)備,選擇的信道策略;nE表示設(shè)備在選擇策略過程中,所產(chǎn)生的能量消耗;N表示傳遞大數(shù)據(jù)信息的移動設(shè)備總數(shù)量。
從(1)式中可以看出,當(dāng)多個移動通信設(shè)備,在選擇信道傳輸大數(shù)據(jù)信息時,若存在空閑信道,則這些用戶都會考慮是否要轉(zhuǎn)移到空閑信道上,移動通信設(shè)備所產(chǎn)生的能量消耗,就會發(fā)生變化。但是,每一個信道上的用戶,都只能感知自身能量的消耗,并不了解總體上的消耗,產(chǎn)生的信道選擇博弈,屬于不對稱博弈。在這一博弈下,移動設(shè)備產(chǎn)生的能量消耗的負(fù)方程 nE- 為:
(2)式中, b-n表示除第 n個移動設(shè)備外,其他移動設(shè)備選擇的信道集合;Un表示效用方程。結(jié)合(1)式和(2)式,將信道選擇模型定義為策略博弈 Γ,則有:
(3)式中,n?表示策略博弈空間。綜合上述3個公式,即為此次設(shè)計建立的信道選擇模型。為了讓信道選擇效用達(dá)到最大,需要將移動設(shè)備產(chǎn)生的能量消耗控制在最小范圍內(nèi),因此,在此次計算中,-表示統(tǒng)一。
根據(jù)此次設(shè)計,建立的信道選擇模型,其選擇信息分流信道過程,如下式所示:
(4)式中, bn'表示第 n個移動設(shè)備,相較于 b-n信道選擇集,選擇的最佳信道;dn表示第 n個移動設(shè)備到基站的距離; Φ表示潛方程; Sn表示移動設(shè)備需要發(fā)送的信息量;表示大數(shù)據(jù)信息傳輸路徑損耗系數(shù)[3]。
從(4)式中可以看出,移動通信設(shè)備改變信道選擇策略后, Φ的變化與 nU的權(quán)值一致。基于此,設(shè)計的信道選擇分流過程如下:
第二步,所有移動設(shè)備選擇的信道策略均為bn;
第三步,在同一信道上,移動設(shè)備均要將大數(shù)據(jù)信息傳輸給用戶h,需要信道中的信頭采集所有移動設(shè)備大數(shù)據(jù)信息;
第四步,信頭通過信道,將采集到的大數(shù)據(jù)信息傳輸給基站。在這一過程中,每一個移動設(shè)備都會在信道bn上,產(chǎn)生能量消耗,根據(jù)(2)式計算設(shè)備消耗;
第五步,隨機選擇一個新的信道策略bn',再次根據(jù)(2)式計算設(shè)備消耗;
第七步,重復(fù)步驟5和步驟6,計算每一個移動設(shè)備,實現(xiàn)每一個移動設(shè)備傳輸大數(shù)據(jù)信息的信道選擇。
當(dāng)移動設(shè)備完成信道選擇后,需要在信道中搜索 D維大數(shù)據(jù)信息,為此,假設(shè)信道屬于一個種群,其中存在的大數(shù)據(jù)信息,為若干個粒子,則信道中,大數(shù)據(jù)信息高維映射矢量 χ,所對應(yīng)的函數(shù) fi(t)為:
在(5)式的作用下,數(shù)據(jù)聚類中心,會聚集信道中的大數(shù)據(jù)信息,此時,得到的聚類目標(biāo)函數(shù) A的表達(dá)式為:
(7)式中, Yn+1表示混沌序列;Yn表示 Yn+1中的子序列。依據(jù)(7)式產(chǎn)生的混沌序列,采用擾動的方式,提高粒子群的搜索能力,則得到的粒子擾動向量為:
(8)式中,id D∈ ,表示第 i個粒子的維度; g表示最高適應(yīng)度的搜索空間維度;表示任何維度中的粒子上限值;δ表示任何維度中的粒子下限值。此時,重新迭代計算粒子,得到的混沌序列 Y為:
(9)式中, m表示數(shù)據(jù)分流選擇的信道,md表示信道所處維度;mY表示信道中分流的大數(shù)據(jù)信息。
綜合上述計算過程,選擇大數(shù)據(jù)信息分流信道,依據(jù)選擇的信道,聚類大數(shù)據(jù)信息,將聚類的大數(shù)據(jù)信息,按照選擇的信道分流。
將云計算平臺下的大數(shù)據(jù)分流系統(tǒng),作為此次設(shè)計對比測試對象,在仿真平臺上,測試兩組系統(tǒng)的大數(shù)據(jù)信息分流算法,驗證此次設(shè)計的大數(shù)據(jù)信息分流系統(tǒng)。比較兩組系統(tǒng),分流大數(shù)據(jù)信息效率。
此次實驗,選擇ONE平臺作為兩組系統(tǒng)分流算法的運行平臺,在平臺上,設(shè)置的仿真參數(shù),如表1所示。
基于表1所示的ONE平臺仿真參數(shù),選擇宗教、文化、經(jīng)濟、政治、體育五種類型的大數(shù)據(jù)信息,每種信息10000條,作為此次系統(tǒng)測試實驗驗證對象。
表1 仿真參數(shù)Tab.1 Simulation parameters
采用兩組系統(tǒng),分別分流五種類型的大數(shù)據(jù)信息,計算兩組系統(tǒng)劃分每種類型大數(shù)據(jù)信息的分流效率η,其計算公式如下式所示:(10)式中, N表示分流的數(shù)據(jù)量; M表示每種類型大數(shù)據(jù)信息的總數(shù)量。根據(jù)(10)式所示的分流效率計算公 式,得到兩組系統(tǒng),分流五種類型大數(shù)據(jù)信息的分流效率,如表2所示。
表2 兩組系統(tǒng)信息分流效率對比表(%)Tab.2 Comparison table of information shunt efficiency between two groups of systems (%)
從表2中可以看出,云計算平臺下的大數(shù)據(jù)分流系統(tǒng)的平均信息分流效率為88.7%;設(shè)計系統(tǒng)的平均信息分流效率為97.7%,較云計算平臺下的大數(shù)據(jù)分流系統(tǒng)的平均信息分流效率高了9%。可見,此次設(shè)計系統(tǒng),具有較高的大數(shù)據(jù)信息分流效率。
綜上所述,此次設(shè)計,充分利用優(yōu)化聚類算法,聚類大數(shù)據(jù)信息,讓其可以根據(jù)選擇的分流信道,進(jìn)行信息分流。經(jīng)實驗驗證,此次設(shè)計的系統(tǒng),提高了信息分流效率。
引用
[1] 郭威,廖丹,王建永,等.雙鏈接無線網(wǎng)絡(luò)海量電力大數(shù)據(jù)合理分流方法[J].電子設(shè)計工程,2019,27(21):112-116.
[2] 解艷.云計算平臺下的大數(shù)據(jù)分流系統(tǒng)的設(shè)計研究[J].電子設(shè)計工程,2019,27(9):119-122.
[3] 趙旭,李艷梅,羅建,等.基于Docker容器動態(tài)遷移數(shù)據(jù)分流框架[J].西華師范大學(xué)學(xué)報(自然科學(xué)版),2019,40(2):210-216.