劉鑫,張瑜
(1.湖南鐵道職業(yè)技術(shù)學(xué)院,湖南 株洲 412001;2.中國能源建設(shè)集團(tuán)陜西省電力設(shè)計(jì)院有限公司,陜西 西安 710054)
電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征任務(wù)分層的大數(shù)據(jù)融合模型
劉鑫1,張瑜2
(1.湖南鐵道職業(yè)技術(shù)學(xué)院,湖南 株洲 412001;2.中國能源建設(shè)集團(tuán)陜西省電力設(shè)計(jì)院有限公司,陜西 西安 710054)
對(duì)嵌入式電力網(wǎng)絡(luò)系統(tǒng)中的大數(shù)據(jù)進(jìn)行融合模型設(shè)計(jì)提高對(duì)頻繁任務(wù)分層和數(shù)據(jù)挖掘能力。傳統(tǒng)的嵌入式電力網(wǎng)絡(luò)系統(tǒng)中的大數(shù)據(jù)融合處理采用非顯著特征數(shù)據(jù)挖掘算法,在嵌入式電力網(wǎng)絡(luò)系統(tǒng)中的大數(shù)據(jù)出現(xiàn)離群特征時(shí),數(shù)據(jù)融合性能不好。提出一種改進(jìn)的基于嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征頻繁任務(wù)分層的大數(shù)據(jù)融合模型。對(duì)嵌入式電力網(wǎng)絡(luò)系統(tǒng)中數(shù)據(jù)融合對(duì)象數(shù)據(jù)集提取二維分層空間特征,采用本征匹配方法進(jìn)行嵌入式電力網(wǎng)絡(luò)操作系統(tǒng)數(shù)據(jù)融合總體模型設(shè)計(jì),引入統(tǒng)計(jì)特征分層融合定位節(jié)點(diǎn)譜函數(shù)表示數(shù)據(jù)融合效率,計(jì)算樣本的密度特征,并抽取高密度區(qū)域的點(diǎn)集作為聚類中心,得到嵌入式電力網(wǎng)絡(luò)系統(tǒng)中閉頻繁項(xiàng)域適應(yīng)度函數(shù),實(shí)現(xiàn)融合模型改進(jìn)。仿真實(shí)驗(yàn)表明,采用該算法能有效提高對(duì)嵌入式電力網(wǎng)絡(luò)系統(tǒng)中大數(shù)據(jù)的分層融合性能,融合密度和精度提高,算法在數(shù)據(jù)監(jiān)測(cè)概率和任務(wù)運(yùn)行速度上優(yōu)越于傳統(tǒng)算法。
嵌入式電力網(wǎng)絡(luò)系統(tǒng);大數(shù)據(jù);數(shù)據(jù)挖掘;融合
在現(xiàn)代信息化社會(huì),數(shù)據(jù)存在于各個(gè)應(yīng)用研究領(lǐng)域中,表現(xiàn)形式諸如噪聲、信號(hào)、圖像和數(shù)字等,對(duì)數(shù)據(jù)的融合,本質(zhì)就是從海量無規(guī)則的信息中提取出有用的潛在的規(guī)則的信息,并結(jié)合后置分類處理和信號(hào)處理,實(shí)現(xiàn)對(duì)數(shù)據(jù)的合理有效應(yīng)用。嵌入式電力網(wǎng)絡(luò)系統(tǒng)中存在大量的關(guān)聯(lián)規(guī)則數(shù)據(jù),需要對(duì)其進(jìn)行數(shù)據(jù)融合和挖掘處理,提高數(shù)據(jù)的使用和關(guān)聯(lián)特征。大數(shù)據(jù)嵌入式關(guān)聯(lián)規(guī)則融合是數(shù)據(jù)融合中的一個(gè)重要課題,當(dāng)信息系統(tǒng)中的知識(shí)較多時(shí),會(huì)得到大量的決策規(guī)則,降低了決策的效率,因此,研究大數(shù)據(jù)嵌入式電力網(wǎng)絡(luò)系統(tǒng)中的大數(shù)據(jù)進(jìn)行融合模型,提高對(duì)頻繁任務(wù)分層和數(shù)據(jù)挖掘 能力[1]。
目前,國內(nèi)外學(xué)者已提出了很多嵌入式電力網(wǎng)絡(luò)系統(tǒng)中的大數(shù)據(jù)融合處理方法,美國Washington大學(xué)開發(fā)的GLUE[2]、德國Karlsruhe大學(xué)開發(fā)的FAOM[3]等,具有典型的大數(shù)據(jù)融合處理性能,采用粗糙集向量數(shù)據(jù)合并技術(shù)進(jìn)行數(shù)據(jù)集預(yù)處理,實(shí)現(xiàn)對(duì)冗余數(shù)據(jù)特征的提取功能,然而,傳統(tǒng)的模型設(shè)計(jì)中,采用不同的元數(shù)據(jù)規(guī)范決定了不同的學(xué)習(xí)資源本體描述語言,不能解決嵌入式電力網(wǎng)絡(luò)系統(tǒng)中大數(shù)據(jù)學(xué)習(xí)資源本體匹配問題。導(dǎo)致數(shù)據(jù)挖掘性能不好,針對(duì)這些問題,本文提出一種改進(jìn)的基于嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征頻繁任務(wù)分層的大數(shù)據(jù)融合模型。首先構(gòu)建了嵌入式任務(wù)分析大數(shù)據(jù)融合模型,在此基礎(chǔ)上進(jìn)行特征匹配和提取,采用統(tǒng)計(jì)特征頻繁項(xiàng)挖掘方法實(shí)現(xiàn)算法改進(jìn),仿真實(shí)驗(yàn)進(jìn)行了性能驗(yàn)證,展示了本文算法的優(yōu)越性能。
1.1 系統(tǒng)模型構(gòu)建及預(yù)備知識(shí)
嵌入式電力網(wǎng)絡(luò)操作系統(tǒng)作為一種新型的網(wǎng)絡(luò)操作系統(tǒng),在發(fā)展過程中產(chǎn)生復(fù)合型數(shù)據(jù)融合問題,大數(shù)據(jù)嵌入式電力網(wǎng)絡(luò)系統(tǒng)中的大數(shù)據(jù)進(jìn)行融合模型設(shè)計(jì)提高對(duì)頻繁任務(wù)分層和數(shù)據(jù)挖掘能力[4]。對(duì)數(shù)據(jù)融合對(duì)象數(shù)據(jù)集提取二維特征空間,采用本征匹配方法進(jìn)行嵌入式電力網(wǎng)絡(luò)操作系統(tǒng)數(shù)據(jù)融合總體模型設(shè)計(jì),如圖1所示,圖中實(shí)線流程代表數(shù)據(jù)狀態(tài)提取流程,虛線流程代表嵌入式閉頻繁項(xiàng)模型狀態(tài)提取模式流程。
圖1 電力網(wǎng)絡(luò)操作系統(tǒng)數(shù)據(jù)融合總體模型設(shè)計(jì)Fig.1 Design of the overall model of power network operating system data fusion
建立了管理系統(tǒng)大數(shù)據(jù)融合管理多域之間的聯(lián)系,統(tǒng)計(jì)特征分層高階擴(kuò)散模糊決策變換的性質(zhì)則說明了模糊決策域改變引起其在統(tǒng)計(jì)特征分層高階擴(kuò)散模糊決策變換域的變換[5]。統(tǒng)計(jì)特征分層高階擴(kuò)散模糊決策相關(guān)決策在它們之間表示為:
計(jì)算與評(píng)價(jià)2個(gè)模糊決策之間的模糊度,嵌入式分層融合統(tǒng)一的系統(tǒng)模糊決策結(jié)果定義為:
式中:c1為統(tǒng)計(jì)特征分層高階擴(kuò)散模糊決策模糊化原始輸數(shù)模糊因子;c2為統(tǒng)計(jì)特征分層高階擴(kuò)散模糊決策模糊化分析函數(shù)決策因子;H(φ)為統(tǒng)計(jì)特征分層高階擴(kuò)散模糊決策系統(tǒng)決策量,xy為公共模糊域。由此實(shí)現(xiàn)了決策數(shù)據(jù)模型狀態(tài)提取和總體模型構(gòu)建,為進(jìn)行大數(shù)據(jù)融合提供數(shù)據(jù)基礎(chǔ)。
1.2 嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征分層融合
在決策數(shù)據(jù)模型狀態(tài)提取過程中,將訓(xùn)練樣本輸入特征數(shù)據(jù)伴隨跟蹤狀態(tài)識(shí)別器,產(chǎn)生數(shù)據(jù)伴隨狀態(tài)序列集,導(dǎo)入數(shù)據(jù)特征伴隨狀態(tài)驗(yàn)證器進(jìn)行狀態(tài)識(shí)別驗(yàn)證,最后輸出,判斷是否作為有用特征。構(gòu)建嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征分層融合模型,如圖2所示。
圖2 嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征分層融合模型Fig.2 Layered statistical characteristic fusion model in the embedded power network system
根據(jù)嵌入式電力網(wǎng)絡(luò)系統(tǒng)閉頻繁項(xiàng)概率正則訓(xùn)練遷移法則,得到嵌入式電力網(wǎng)絡(luò)系統(tǒng)閉頻繁項(xiàng)網(wǎng)絡(luò)節(jié)點(diǎn)最近時(shí)刻獲得的數(shù)據(jù)集有效特征概率最大值1,假定xm+1決策屬性取值為dm+1=d1,得到擴(kuò)充的論域U′。則間隔時(shí)間越長的能獲得有效特征值的概率對(duì)當(dāng)前的影響越小,引入電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征分層融合定位節(jié)點(diǎn)間距的倒數(shù)表示網(wǎng)絡(luò)效率,即電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征分層融合節(jié)點(diǎn)i到定位節(jié)點(diǎn)j的間距為dij其效率定義如下:
電力網(wǎng)絡(luò)系統(tǒng)中任意兩個(gè)統(tǒng)計(jì)特征分層融合定位節(jié)點(diǎn)的平均距離代表了云計(jì)算非線性差分的輸出最小適應(yīng)度函數(shù)值,大數(shù)據(jù)在Javascript程序內(nèi)部經(jīng)過變量賦值、傳遞,字符編碼和過濾,實(shí)現(xiàn)參數(shù)進(jìn)入函數(shù)的過程。向量空間模型中的嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征分層大數(shù)據(jù)融合VC和VC′的關(guān)系結(jié)構(gòu)可用電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征分層融合活性度進(jìn)行表征為:
綜上所述,向量空間模型中的嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征分層大數(shù)據(jù)融合是由C和C′直接相連接的模糊概念以及實(shí)例組成,通過線性差分融合,進(jìn)行電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征分層融合,得到任務(wù)調(diào)度分配鏈路中的比例分值,有效反映出嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征分層大數(shù)據(jù)融合的結(jié)構(gòu)特征。
在上述進(jìn)行特征分解和分析的基礎(chǔ)上,進(jìn)行大數(shù)據(jù)融合處理改進(jìn)設(shè)計(jì),傳統(tǒng)的嵌入式電力網(wǎng)絡(luò)系統(tǒng)中的大數(shù)據(jù)融合處理采用非顯著特征數(shù)據(jù)挖掘算法,在嵌入式電力網(wǎng)絡(luò)系統(tǒng)中的大數(shù)據(jù)出現(xiàn)離群特征時(shí),數(shù)據(jù)融合性能不好。提出一種改進(jìn)的基于嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征頻繁任務(wù)分層的大數(shù)據(jù)融合模型。
在大數(shù)據(jù)環(huán)境下,嵌入式電力網(wǎng)絡(luò)系統(tǒng)中任務(wù)進(jìn)程管理處理機(jī)pi執(zhí)行任務(wù)nj所能獲得的直接回報(bào)DR(pi,nj)定義為:
通過非線性差分相點(diǎn)融合估計(jì),實(shí)現(xiàn)融合大數(shù)據(jù)環(huán)境下資源負(fù)荷的嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征分層大數(shù)據(jù)融合策略。在進(jìn)行時(shí)間跨度時(shí),在腳本注入模塊中已經(jīng)提到要插入標(biāo)簽或?qū)傩缘茸鳛闇y(cè)試腳本,以測(cè)試腳本為基礎(chǔ)的數(shù)據(jù)狀態(tài)方程,實(shí)現(xiàn)對(duì)時(shí)間跨度數(shù)據(jù)補(bǔ)齊,調(diào)用eval()等函數(shù),得到統(tǒng)計(jì)特征分層融合的調(diào)度函數(shù)為:
式中:X(f)為帶寬受限的嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征頻譜;YT′(f)為采樣的數(shù)據(jù)信息頻譜。得到滿足HSP的序列經(jīng)過IFFT之后得到統(tǒng)計(jì)大數(shù)據(jù)融合模型為:
式中:區(qū)間[xmin,j,xmax,j]為大數(shù)據(jù)融合編碼過濾時(shí)存在邏輯回溯變量區(qū)間,實(shí)現(xiàn)大數(shù)據(jù)環(huán)境下的統(tǒng)計(jì)特征分層融合算法設(shè)計(jì)。
定義2嵌入式電力網(wǎng)絡(luò)系統(tǒng)中閉頻繁項(xiàng)模型。給定信息系統(tǒng)S=(U,A,V,f),其中,U為非空有限論域,A為對(duì)論域中目標(biāo)進(jìn)行描述的屬性集,設(shè)Θ為識(shí)別框架,函數(shù)m:2Θ→[0,1],當(dāng)且僅當(dāng)滿足下列條件:
計(jì)算樣本的密度,并抽取高密度區(qū)域的點(diǎn)集作為聚類中心集合S,取其最大值si作為第一個(gè)聚類中心z1,通過上述對(duì)粗糙集向量數(shù)據(jù)合并處理技術(shù),數(shù)據(jù)集中粗糙集向量數(shù)據(jù)通過關(guān)聯(lián)度伴隨跟蹤,實(shí)現(xiàn)了基于嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征頻繁任務(wù)分層的大數(shù)據(jù)融合模型改進(jìn)設(shè)計(jì)。
為了測(cè)試本文算法在實(shí)現(xiàn)嵌入式大數(shù)據(jù)融合中的性能,進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)基于Hadoop平臺(tái),構(gòu)成JDkl.6,alGbps交換網(wǎng),設(shè)計(jì)嵌入式電力網(wǎng)絡(luò)系統(tǒng)結(jié)果,嵌入式電力網(wǎng)絡(luò)系統(tǒng)共有8個(gè)計(jì)算節(jié)點(diǎn),包括一個(gè)主節(jié)點(diǎn)(NameNode)和7個(gè)數(shù)據(jù)節(jié)點(diǎn)(DataNode),進(jìn)行任務(wù)分層設(shè)計(jì)。實(shí)驗(yàn)中,用D#T#C#的形式來描述實(shí)驗(yàn)數(shù)據(jù)集,其中D表示事務(wù)的長度,即維數(shù),T表示事務(wù)的數(shù)目,大數(shù)據(jù)信號(hào)采集來哦子3個(gè)傳感器,分別為c1,c2,c3,c1返回3種信號(hào),即c1值域?yàn)閂cl={1,2,3},c2值域?yàn)閂c2={1,2,3},c3值域?yàn)閂c3={1,2,3},得到各準(zhǔn)則下劃分D1的正域基于上述參數(shù)和仿真實(shí)驗(yàn)環(huán)境,進(jìn)行嵌入式電力網(wǎng)絡(luò)系統(tǒng)中任意大數(shù)據(jù)融合仿真,提取嵌入式電力網(wǎng)絡(luò)系統(tǒng)中大數(shù)據(jù)任務(wù)的統(tǒng)計(jì)特征,實(shí)現(xiàn)數(shù)據(jù)融合,通過仿真,研究大數(shù)據(jù)嵌入式電力網(wǎng)絡(luò)系統(tǒng)中的大數(shù)據(jù)進(jìn)行融合模型,提高對(duì)頻繁任務(wù)分層和數(shù)據(jù)挖掘能力。首先仿真實(shí)驗(yàn)得到嵌入式電力網(wǎng)絡(luò)系統(tǒng)中分層大數(shù)據(jù)融合前特征分析結(jié)果和融合后的結(jié)果如圖3和圖4所示。
圖3 嵌入式電力網(wǎng)絡(luò)系統(tǒng)中分層大數(shù)據(jù)融合前特征分析結(jié)果Fig.3 The analysis result of characteristics before the layered big data data fusion in the embedded power network system
圖4 嵌入式電力網(wǎng)絡(luò)系統(tǒng)中分層大數(shù)據(jù)融合后特征分析結(jié)果Fig.4 The analysis result of characteristics after the layered big data data fusion in the embedded power network system
分析上述結(jié)果可知,采用本文算法,能有效提高對(duì)嵌入式大數(shù)據(jù)的分層融合性能,隨著任務(wù)規(guī)模的指數(shù)上升,權(quán)重調(diào)整的影響越來越小,融合密度提高,為了定量對(duì)比算法性能,采用本文算法和經(jīng)典的顯著特征數(shù)據(jù)融合算法進(jìn)行對(duì)比,以嵌入式電力網(wǎng)絡(luò)系統(tǒng)中分層數(shù)據(jù)準(zhǔn)確檢測(cè)概率為測(cè)試指標(biāo),得到本文算法進(jìn)行大數(shù)據(jù)融合處理后的檢測(cè)概率比傳統(tǒng)算法提高39%,而計(jì)算機(jī)運(yùn)行時(shí)間縮短12%,展示了本文算法在計(jì)算精度和速度上有優(yōu)越性。
本文研究嵌入式電力網(wǎng)絡(luò)系統(tǒng)中的數(shù)據(jù)融合和準(zhǔn)確檢測(cè)問題,嵌入式電力網(wǎng)絡(luò)系統(tǒng)中存在大量的關(guān)聯(lián)規(guī)則數(shù)據(jù),需要對(duì)其進(jìn)行數(shù)據(jù)融合和挖掘處理,提高數(shù)據(jù)的使用和關(guān)聯(lián)特征提取性能,大數(shù)據(jù)嵌入式關(guān)聯(lián)規(guī)則融合是數(shù)據(jù)融合中的一個(gè)重要課題,當(dāng)信息系統(tǒng)中的知識(shí)較多時(shí),會(huì)得到大量的決策規(guī)則,降低了決策的效率,因此,研究大數(shù)據(jù)嵌入式電力網(wǎng)絡(luò)系統(tǒng)中的大數(shù)據(jù)進(jìn)行融合模型,提高對(duì)頻繁任務(wù)分層和數(shù)據(jù)挖掘能力。本文提出一種改進(jìn)的基于嵌入式電力網(wǎng)絡(luò)系統(tǒng)中統(tǒng)計(jì)特征頻繁任務(wù)分層的大數(shù)據(jù)融合模型。研究得出,采用本文算法,能有效提高對(duì)嵌入式電力網(wǎng)絡(luò)系統(tǒng)中大數(shù)據(jù)的分層融合性能,融合密度提高,本文算法在計(jì)算精度和速度上優(yōu)越于傳統(tǒng)算法。
[1]王慧娟,胡峰松,陳燦.數(shù)據(jù)網(wǎng)格環(huán)境下副本淘汰策略的研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2012(19):4147-4149,4164. WANG Huijuan,HU Fengsong,CHEN Can.A copy of the data grid environment selection strategy research[J]. Computer Engineering and Design,2012(19):41-47(in Chinese).
[2]匡桂娟,曾國蓀.一種基于時(shí)分復(fù)用的云資源管理方法[J].同濟(jì)大學(xué)學(xué)報(bào):自然科學(xué)版,2014,42(5):782-789. KUANG Guijuan,ZENG Guosun.A cloud resource management method based on time division multiplexing[J]. Journal of tongji university(natural science edition),2014,42(5):782-789(in Chinese).
[3]曾志,王晉,杜震洪,等.一種云格環(huán)境下可計(jì)算資源與服務(wù)高效調(diào)配機(jī)制[J].浙江大學(xué)學(xué)報(bào):理學(xué)版,2014,41(3):353-357. ZENG Zhi,WANG Jin,DU Zhenhong,et al.A cloud can compute resources,environment and service efficiently allocate mechanism[J].Journal of zhejiang university:science edition,2014,41(3):353-357(in Chinese).
[4]BALASANGAMESHWARA J,RAJU N.A hybrid policy mrfaulttolerantload balancing in grid computing environments[J].Journal of Network and Computer App-1ications,2012,35(1):412-22.
[5]劉建余,于立娟.短距離室外MIMO-OFDM數(shù)字傳輸系統(tǒng)研究[J].科學(xué)技術(shù)與工程,2013,13(3):744-748. LIU Jianyu,YU 1ijuan.Short outdoor MIMO-OFDM digital transmission system research[J].Science,technology and engineering,2013,13(3):744-748(in Chinese).
Fusion Model of the Hierarchical Big Data of Characteristics Task in Electric Power Network System
LIU Xin1,ZHANG Yu2
(1.Hunan Railway Professional Technology College,Zhuzhou 412001,Hunan,China;2.China Energy Construction Group of Shaanxi electric Power Design Institute Co.,Ltd,Xi’an 710054,Shaanxi,China)
The fusion model of the bid data of the embedded power network system is designed to enhance frequent tasks 1ayering and data mining ability.Since the dig data fusion processing in the traditional embedded electric power network system adopts non salient feature data mining algorithm,the fusion performance is not good when the big data wanders off. This paper proposes an improved method of the big data fusion model based on statistical characteristics of the 1ayered frequent tasks in the embedded electric power network system.The twodimensional 1ayered space feature is extracted for the objective data set,and the eigen matching is used for the overall model design.The statistical characteristics 1ayered fusion positioning node spectrum efficiency function is introduced to present data fusion ratio and the density characteristics of the sample is calculated and the the point set of high density area is extracted as the clustering center to obtain closed frequent itemset domain fitness function,and realize improvement of the fusion model.The simulation experiments show that the proposed algorithm can effectively improve the big data fusion performance of 1ayered embedded electric power network system,and the integration density and accuracy get improved,and the algorithm is superior to the traditional algorithm in the probability of data monitoring and tasks running speed.
2015-03-21。
劉 鑫(1982),男,碩士,講師、工程師,主要研究方向?yàn)樾畔⑾到y(tǒng)項(xiàng)目管理,軟件工程,大數(shù)據(jù)分析等。
(編輯 徐花榮)
1674-3814(2015)08-0036-04
TP393
A
KEY W0RDS:Embedded electric power network system;big data;data mining;fusion