江蘇瑞中數(shù)據(jù)股份有限公司 湯朝波
面對當(dāng)前電力大數(shù)據(jù)在分布式云儲存方面存在的問題,本文致力于解決這一問題,構(gòu)建了分布式云儲存的系統(tǒng)模型,并運用匹配濾波器的檢驗方法對電力大數(shù)據(jù)的特征進行預(yù)先處理,從而構(gòu)建了數(shù)據(jù)聚集樹,有效的減少了云存儲的冗余狀況,實現(xiàn)了電力大數(shù)據(jù)分布式云存儲的性能優(yōu)化。
云儲存是一種新興網(wǎng)絡(luò)存儲技術(shù),是在云計算的基礎(chǔ)上延伸與發(fā)展出來的。大量數(shù)據(jù)的管理、存儲成為云計算系統(tǒng)的運算、處理核心時,云計算系統(tǒng)為實現(xiàn)其良好的性能,就需要配置很多存儲設(shè)備,這樣就產(chǎn)生了云存儲系統(tǒng),即云存儲系統(tǒng)在本質(zhì)上是一個以數(shù)據(jù)的存儲、管理為核心的云計算系統(tǒng)。云儲存可以通過應(yīng)用軟件,使網(wǎng)絡(luò)中不同類型的、大量的存儲設(shè)備進行協(xié)同工作,并使這些不同類型的存儲設(shè)備共同向外提供業(yè)務(wù)訪問功能及數(shù)據(jù)存儲功能,云儲存之所以能實現(xiàn)這些作用,主要是通過分布式的文件系統(tǒng)、網(wǎng)絡(luò)技術(shù)和集群應(yīng)用等功能。云儲存是一種將資源、信息放置到云上,供人隨時、隨地的通過任何一個連接網(wǎng)絡(luò)的裝置,進行瀏覽、獲取、儲存信息的一種新興服務(wù)。
當(dāng)下,大數(shù)據(jù)在電力行業(yè)中還沒有得到一個統(tǒng)一的、明確的定義,大數(shù)據(jù)是擁有價值密度低、處理速度快、數(shù)據(jù)類型多、數(shù)據(jù)體量大這四大特點的數(shù)據(jù)集合,這一含義是目前行業(yè)中基本達成的共識。之后相關(guān)研究報告對這種數(shù)據(jù)集合做出了進一步的補充,即這種數(shù)據(jù)集合的內(nèi)容不能在一定的時間里通過使用傳統(tǒng)的數(shù)據(jù)庫軟件進行抓取、處理和管理。
近十幾年以來,我國電力行業(yè)的信息化獲得了快速地發(fā)展,以云儲存與物聯(lián)網(wǎng)為代表的IT技術(shù)被廣泛運用于電力行業(yè)的方方面面,電力數(shù)據(jù)資源也得到了迅速地增長,并朝著多源、異構(gòu)與PB級數(shù)據(jù)規(guī)??焖侔l(fā)展。電力大數(shù)據(jù)是在電力工業(yè)的能源變革與技術(shù)更新過程中的必然過程,但電力大數(shù)據(jù)并不僅僅局限于技術(shù)范疇之中,其涉及到電力系統(tǒng)在處于大數(shù)據(jù)時代背景下的技術(shù)路線、管理體制及發(fā)展理念等方面的變革,是在大數(shù)據(jù)時代背景下智能化的電力系統(tǒng)價值形態(tài)的提升。
本文通過進行仿真實驗,對構(gòu)建的大數(shù)據(jù)調(diào)度分布式云儲存的系統(tǒng)模型的性能進行檢驗,展示了算法在電力大數(shù)據(jù)分布式云儲存方面的優(yōu)越性能。
為了使電力大數(shù)據(jù)調(diào)度控制功能得到全面、整體的提高,需要對電力系統(tǒng)進行分布式云儲存設(shè)計,構(gòu)建電力調(diào)度云儲存分布式模型。電力調(diào)度系統(tǒng)模型是用G=(V,E)即連通無向圖進行表示,系統(tǒng)模型中的所有節(jié)點都有一個一樣的輸送半徑,無線傳感器節(jié)點網(wǎng)絡(luò)的邊(u,v)屬于E。在電力調(diào)度系統(tǒng)模型中,設(shè)置A包含于V,B包含于V,A交B等于φ,每一個調(diào)度傳輸集Si(i是不包括0的自然數(shù))應(yīng)該滿足下面的條件,Si交Sj等于φ,ULI=1Si等于V減去{sink}的差。
傳統(tǒng)方法所使用的是混合建立域間鏈接的方法,解決角色映射沖突與權(quán)限隱蔽提升的問題。而本文中所采用的是聯(lián)合特征下的信息增益提取的方式,本文引入了云存儲管理β,β是(0,0.5)的子集。在這個限定的范圍之內(nèi),采集數(shù)據(jù)集合,形成電力大數(shù)據(jù)調(diào)度生成階段,實現(xiàn)信息融合。當(dāng)R是A的子集、X是U的子集這一條件成立的情況之下,電力大數(shù)據(jù)調(diào)度信息狀態(tài)的函數(shù)表達公式是:h(t)=Σiai(t)ejθδ(t-i Ts)。在此公式之中,t是調(diào)度的響應(yīng)時間,ai是電力大數(shù)據(jù)信息系統(tǒng)中調(diào)度的個數(shù)。然后,再按照電力通信理論的中頻分復(fù)用,可以得到電力大數(shù)據(jù)的行為與頻率的關(guān)系,用多普勒公式可以表現(xiàn)為:yb=yow/zcosφ。在此公式中,z表示傳輸功率,yo表示電力調(diào)度通信的載波頻率(基站發(fā)射端),yb表示發(fā)射頻率的變化量(通信接收端)。
圖1 決策樹算法C4.5云存儲系統(tǒng)數(shù)據(jù)特征建模
在構(gòu)建上述系統(tǒng)模型的基礎(chǔ)之上,運用匹配濾波器的檢驗方法對電力大數(shù)據(jù)的特征進行預(yù)先處理,從而構(gòu)建了數(shù)據(jù)聚集樹(如圖1)并運用決策樹算法C4.5構(gòu)建了云存儲系統(tǒng)數(shù)據(jù)特征建模。
在本文的設(shè)置中,決策樹中的映射值{no,yes}代表的是云存儲系統(tǒng)冗余數(shù)據(jù)的跟蹤屬性值{0,1},在決策樹算法C4.5之下,冗余數(shù)據(jù)的主特征聚類特征參考值有164個種類,提取出來的有19個種類,利用算法對數(shù)據(jù)特征進行壓縮與降維,從而得到了調(diào)度時間減弱的函數(shù)公式:當(dāng)1≤k<n時,f(k)等于f(k-1)-1/n;當(dāng)k=n時,f(k)等于1。由這個函數(shù)公式可以得到云儲存主特征的有效行為概率公式是:DNI,J(tn+1)=[DNI,J(tn+1)+f(n)DNI,J()]÷2。在在此計算公式中,tn時刻與tn+1時刻的差距是一個更新的周期。在這種條件下,調(diào)度系統(tǒng)就成了一個非線性的、多層節(jié)點的映射器,可以將調(diào)度系統(tǒng)的重組規(guī)律公式是:u(t)等于e(t)加上TD[de(t)/dt]再加上(1/T1)ζ10e(t)dt的和再乘以Kp,在這個公式之中,e代表的是調(diào)度系數(shù),Kp代表的是調(diào)度通信效率。
運用匹配濾波器的檢驗方法對電力大數(shù)據(jù)的特征進行預(yù)先處理,可以得出濾波器函數(shù)公式,Hb(Z)等于(sinθ2+1)/cosθ2與G(z)與cosθ1(k)cosθ2z-1/sinθ2z-2+(sinθ2+1)z-1sinθ1(k)+1的乘積。其中,G(z)等于(1-sinθ2)/2與(1-z-2)/sinθ2z-2+(sinθ2+1)z-1sinθ1(k)+1的乘積。在這個公式之中,y(k)代表的是匹配濾波器的輸出,x(k)代表的是觀測序列,觀測序列是由背景噪音與信號構(gòu)成的。
在此基礎(chǔ)上,本文提出了以寬頻數(shù)據(jù)特征為基礎(chǔ)的大數(shù)據(jù)分布式云儲存的算法,并通過寬頻數(shù)據(jù)特征壓縮進行信息融合降維,從而實現(xiàn)資源調(diào)度,提高電力調(diào)度的效益。
本文在構(gòu)建大數(shù)據(jù)調(diào)度分布式云儲存系統(tǒng)模型的基礎(chǔ)上,利用決策樹算法C4.5分析云存儲系統(tǒng)數(shù)據(jù)特征。實驗表明,通過對本文中的云存儲系統(tǒng)模型進行信息融合降維,可以有效地減少數(shù)據(jù)冗余問題,提高電力系統(tǒng)的調(diào)度效益。