施艷昭
(安徽電子信息職業(yè)技術學院 經濟管理系,安徽 蚌埠 233000)
近年來,社會各界對于BP神經網絡組合模型十分關注,對此開展了很多研究和分析[1].為了能夠更好地挖掘與分析BP神經網絡組合模型,對于解析計算機網絡上傳數據算法有了更高的要求[2].針對有限空間的環(huán)境下,結合分治思想構建了STREAM算法.這種算法并未對數據變化進行充分的反映[3].構建的CLUSTREAM算法可以利用BP神經網絡組合模型,在計算機網絡上傳數據劃分為兩個階段:第一個階段是微計算機網絡上傳數據,第二階段為自適應宏計算機網絡上傳數據,以實現計算機網絡上傳數據[4].針對BP神經網絡組合模型的雙重特征,提出了可以通過投影計算機網絡上傳數據實現有效的解決[5].在上述幾種算法中,其依據的根本思想都是k-means計算機網絡上傳數據思想,這種思想的主要不足是無法實現對任意形式分布的計算機網絡上傳數據[6].
本文提出一種融合雙重BP神經網絡組合模型的Python解析計算機網絡上傳數據算法.整個算法的主要構成部分為:在線網格單元數據統(tǒng)計部分和自適應聚類演化部分.將數據空間進行網絡化處理,隨后對于在線部分對應的網格單元信息可通過近似技術來進行合理的統(tǒng)計與分析.而且,能夠依據改進之后的金字塔時間結構將潛在密集網格單元進行存儲,采取的是快照形式.進入到Python解析階段,則是利用深度優(yōu)先搜索方式來實施計算機網絡上傳數據,而且借助實驗對算法可行性進行了有效的分析.
以A={A1,A2,…,Ak}代表歐氏空間下對應的屬性集合,可將其k維數據空間表示為S=A1×A2×…×Ak,那么此時在某時刻t,在S上的BP神經網絡組合即可表示為X=
定義1 給定一個BP神經網絡組合模型X上的時間段[t-h,t],稱density(u)=count(u)/(|N|)為單元u的密度.其中:|N|為BP神經網絡組合總量,count(u)代表的則是在單元u中具有的數據點個數.
定義2 假定[t-h,t]表示的是在X上的某個時間段,其密度閾值為τ,ε表示其誤差因子,假如滿足density(u)≥τ-ε,那么可以證明此時該單元u為密集的;若density(u)>ε,則網格單元u是潛在密集的;若density(u)≤ε,則網格單元u是非密集的.
假如從開始至今所經過的總時間表示為Tc,那么此時在第0層具有的最小時間粒度則可表示為Tmin.如下所述即為改進金字塔的時間結構定義:①其最大層數表示為logα(Tc/Tmin),α一般的取值為2,4,8;②如果滿足條件((Tc/Tmin)modαi)=0and((Tc/Tmin)modαi+1)≠0,那此時將取i為時刻Tc時,對應的存儲快照層次;③在每層所可存儲的快照僅為最近的β個,其中β取值為大于α的正整數;④Tminαi表示的則是第i層對應的時間跨度.
對比未改進之前的金字塔時間結構,將其進行改進之后,對于參數存儲快照是可以結合用戶的精度需求來進行設置的,包括Tmin等參數,而且使得快照是不會出現冗余問題的,也不用進行刪除處理.
性質1 在改進后的金字塔時間結構下,假如將當前時間點以Tc表示,用戶指定時間跨度則以h表示,那么要求在Ts時刻,存在快照滿足Tc-Ts≤2h.
依據改進金字塔結構,能夠得到在第r個時刻產生的時間序列可表示為tr,t0代表的則是起始時刻點,那么X=Nt1∪Nt2∪…∪Nti∪…,表示的是BP神經網絡組合模型,其中:Nti為從時刻ti-1到ti的BP神經網絡分段.
因此,在對LGE進行刪除之前,對應的非密集單元具有的誤差水平應當能夠控制在ε以下,而且不會由于刪除而使得密集單元輸出的正確性受到影響.因此,當ε為給定的前提下,要求對潛在密集網格單元進行存儲,以此來實現對空間復雜度的有效降低.
為了更好地驗證本文算法的性能,對文中計算機網絡上傳數據精度進行了界定.如圖1、圖2所示,分別表示的是在真實數據集KDD-CUP-99,以及仿真數據集B300kC5D30S6的情況下,CMDBPNN以及CluStream具有的精度水平.由于Python解析計算機網絡上傳數據算法采用子空間計算機網絡上傳數據,面對雙重數據也能夠進行有效的處理,而且對于任意形式分布計算機網絡上傳數據的效果也是很好的.因此,對比CluStream,本文算法具有更好的精度水平,相關參數設置為τ=0.002,ε=0.05τ,h=10,l=5.
圖1 基于KDD-CUP-99的精度比較(數據流100組/秒)
圖2 基于仿真數據集的精度比較(數據流500組/秒)
利用真實數據集KDD-CUP-99,對算法具有的執(zhí)行效率進行分析,將CMDBPNN算法和CluStream展開對比,而且要求進行周期性的快照存貯,進行實驗時,則以快照存儲于內存中.結合圖3,盡管CMDBPNN算法的子空間計算機網絡上傳數據需要一定的時間耗費,然而,是不需要CluStream進行頻繁的聚合、增刪等操作的.因此,能夠得出,CMDBPNN與CluStream具有基本相同的執(zhí)行效率,相關參數設置為τ=0.005,ε=0.1τ,h=10,l=5.
實驗中還生成了B300kC5D30S6仿真數據集,以對算法內存占用情況進行有效的分析,在內存中主要是對數據結構SET進行存儲,而在硬盤中則進行快照存儲.結合圖4,能夠得出,該算法中所需的內存空間并不大,而且如果CMDBPNN呈現出了相對穩(wěn)定的分布,那么此時對應的內存狀態(tài)也是比較穩(wěn)定的.而且如果具有的密度閾值較大,那么此時其中的潛在密集網格也僅有少部分需要維護,因此內存占用較少,在實驗中相關參數設置如下:ε=0.05τ,h=10,l=5.
將得到的B300kC5D30S6數據集分別取不同的維數,15,20,25,30,35得到對應的仿真數據集,以分析BP神經網絡組合模型空間維度對算法的影響,參數設置為:τ=0.005,ε=0.1τ,h=10,l=6.
為測試CMDBPNN所含計算機網絡上傳數據維數的伸縮性,生成B300kC5D30S6,取其在4,5,6,7和8維數下的仿真數據集,并且分析τ=0.005,ε=0.1τ,h=10的情況下,當維數為4,5時,l=4,6,7;當維數為8時l=6的情況,結合圖3及圖4,能夠得出不管是空間維數還是計算機網絡上傳數據維數都具有較好的伸縮性.
圖3 對數據空間維數的伸縮性
圖4 對所含計算機網絡上傳數據維數的伸縮性
針對計算機網絡上傳數據問題,提出了融合雙重BP神經網絡組合模型的Python解析計算機網絡上傳數據算法.該算法對于雙重BP神經網絡組合模型的數據上傳問題能夠有效解決,任何形態(tài)分布的計算機網絡上傳數據都能夠實現.而且,對優(yōu)化之后的金字塔時間結構,對其中潛藏的網格單元來實施有效的存儲.最終結果表明:本文算法能夠使得計算機網絡上傳數據具有較高的實現效率.