李婷
( 四川大學(xué) 錦城學(xué)院, 四川 成都 611731)
隨著計(jì)算機(jī)信息技術(shù)的飛躍發(fā)展,人類進(jìn)入了大數(shù)據(jù)信息化時(shí)代, 在電網(wǎng)系統(tǒng)管理和設(shè)計(jì)中,需要構(gòu)建電網(wǎng)客戶關(guān)系信息系統(tǒng),實(shí)現(xiàn)對(duì)電網(wǎng)數(shù)據(jù)分析與客戶優(yōu)化對(duì)接,提高電網(wǎng)服務(wù)質(zhì)量。 在電網(wǎng)客戶關(guān)系系統(tǒng)中,存儲(chǔ)著海量大數(shù)據(jù)信息,需要進(jìn)行大數(shù)據(jù)資源優(yōu)化調(diào)度,提高電網(wǎng)客戶關(guān)系系統(tǒng)運(yùn)行的穩(wěn)定性。 研究電網(wǎng)客戶關(guān)系系統(tǒng)中的大數(shù)據(jù)資源優(yōu)化調(diào)度和管理方法具有重要意義[1]。
在電網(wǎng)客戶關(guān)系系統(tǒng)設(shè)計(jì)中,需要構(gòu)建大數(shù)據(jù)信息管理系統(tǒng)和數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)作為信息存儲(chǔ)和處理的重要工具和載體,在數(shù)據(jù)信息存儲(chǔ)、調(diào)度和信息檢索等領(lǐng)域中發(fā)揮著重要的作用,大型電網(wǎng)數(shù)據(jù)庫(kù)是將數(shù)據(jù)信息通過(guò)集成和融合處理,將大量網(wǎng)絡(luò)計(jì)算資源、存儲(chǔ)資源與軟件資源進(jìn)行統(tǒng)一管理,實(shí)現(xiàn)對(duì)信息資源的統(tǒng)一調(diào)度,最終為電力網(wǎng)絡(luò)的管理決策部門和電網(wǎng)用戶提供準(zhǔn)確的數(shù)據(jù)分析和服務(wù)[2-4]。傳統(tǒng)大數(shù)據(jù)資源的調(diào)度方法采用能量譜密度函數(shù)特征調(diào)度算法,由于電網(wǎng)與客戶關(guān)系數(shù)據(jù)信息受到外部非線性特征信息的干擾,對(duì)大數(shù)據(jù)資源的調(diào)度性能不好。 基于此,提出一種基于決策樹(shù)主特征提取大數(shù)據(jù)資源優(yōu)化調(diào)度方法,并應(yīng)用在電網(wǎng)客戶關(guān)系系統(tǒng)設(shè)計(jì)中。 首先,構(gòu)建電網(wǎng)客戶關(guān)系的決策樹(shù)控制模型和資源調(diào)度模型,對(duì)大數(shù)據(jù)資源調(diào)度任務(wù)節(jié)點(diǎn)進(jìn)行信息表征,提取主特征實(shí)現(xiàn)大數(shù)據(jù)資源優(yōu)化調(diào)度;其次,在構(gòu)建的電網(wǎng)客戶關(guān)系系統(tǒng)中進(jìn)行大數(shù)據(jù)資源的調(diào)度仿真,展示了本文算法在提高數(shù)據(jù)調(diào)度匹配準(zhǔn)確性和實(shí)時(shí)性方面的優(yōu)越性能。
構(gòu)建電網(wǎng)客戶關(guān)系系統(tǒng)大數(shù)據(jù)資源調(diào)度模型,為進(jìn)行系統(tǒng)設(shè)計(jì)和資源調(diào)度提供準(zhǔn)確的數(shù)據(jù)基礎(chǔ)。電網(wǎng)客戶關(guān)系大數(shù)據(jù)庫(kù)信息流的集合劃分機(jī)制是實(shí)現(xiàn)對(duì)電網(wǎng)客戶關(guān)系系統(tǒng)大數(shù)據(jù)分區(qū)訪問(wèn)的關(guān)鍵,在電網(wǎng)客戶關(guān)系系統(tǒng)網(wǎng)絡(luò)數(shù)據(jù)監(jiān)控過(guò)程中[5],整個(gè)電網(wǎng)客戶關(guān)系數(shù)據(jù)調(diào)度控制網(wǎng)絡(luò)模型用一個(gè)連通的無(wú)向圖G=( V,E)來(lái)表示,所有節(jié)點(diǎn)都有相同的傳輸半徑r。 引入C4.5決策樹(shù)模型進(jìn)行資源調(diào)度分配,得到?jīng)Q策樹(shù)模型如圖1所示。
圖1 C4.5決策樹(shù)電網(wǎng)客戶關(guān)系大數(shù)據(jù)資源分布模型Fig. 1 C4.5 decision tree power network customer relationship big data resource distribution model
圖1中, 電網(wǎng)資源樹(shù)與上層節(jié)點(diǎn)的最小競(jìng)爭(zhēng)窗口值以及平均子節(jié)點(diǎn)數(shù)目相關(guān),大數(shù)據(jù)調(diào)度標(biāo)簽生成階段( TagBlock),采集數(shù)據(jù)集合為S,當(dāng)X哿U,電網(wǎng)客戶關(guān)系數(shù)據(jù)調(diào)度大數(shù)據(jù)信息系統(tǒng)狀態(tài)響應(yīng)函數(shù)表達(dá)式為:
當(dāng)滿足調(diào)度最優(yōu)決策方案, 在決策樹(shù)中表現(xiàn)為映射值{No,Yes},采用主特征提取和建模方法,提取的主特征類型為19類。假設(shè)在數(shù)據(jù)資源調(diào)度中,所有的虛擬節(jié)點(diǎn)性能相同, 實(shí)現(xiàn)了電網(wǎng)客戶關(guān)系系統(tǒng)信息流的異步傳輸控制[6],此時(shí),電網(wǎng)客戶關(guān)系系統(tǒng)大數(shù)據(jù)信息流異步層最小競(jìng)爭(zhēng)異步遞進(jìn)值為:
對(duì)于性能權(quán)值為wi的存儲(chǔ)集合應(yīng)該具有( wi/wmin)n個(gè)虛擬節(jié)點(diǎn),電網(wǎng)客戶關(guān)系數(shù)據(jù)調(diào)度的時(shí)間減弱函數(shù)為:
在電網(wǎng)客戶關(guān)系系統(tǒng)中, 數(shù)據(jù)定位子空間中傳輸樹(shù)資源流量控制加權(quán)系數(shù)表示為:
式中:CW0min為數(shù)據(jù)資源調(diào)度傳輸樹(shù)中最底層根節(jié)點(diǎn)的預(yù)測(cè)初始化值;而CWlimin為第Dn步的數(shù)據(jù)資源傳輸控制值。由此可見(jiàn),資源分區(qū)訪問(wèn)特征的差異主要是由于層和層之間的平均子節(jié)點(diǎn)數(shù)目控制產(chǎn)生的。 設(shè)定χ調(diào)節(jié)系數(shù),對(duì)于每層的最小競(jìng)爭(zhēng)窗口值該調(diào)節(jié)系數(shù)為定值;A為層最小競(jìng)爭(zhēng)窗口的上限值,可以調(diào)節(jié)由于最小競(jìng)爭(zhēng)窗口過(guò)大而引起的流量預(yù)測(cè)偏差問(wèn)題,其取值為:
其中,
把電網(wǎng)客戶關(guān)系系統(tǒng)信息流量序列廣播為定位信息, 通過(guò)電網(wǎng)客戶關(guān)系系統(tǒng)大數(shù)據(jù)信息流集合劃分機(jī)制與模式匹配設(shè)計(jì), 實(shí)現(xiàn)電網(wǎng)客戶關(guān)系系統(tǒng)大數(shù)據(jù)資源調(diào)度模型總體設(shè)計(jì),為進(jìn)行下一步算法改進(jìn)設(shè)計(jì)提供準(zhǔn)確的數(shù)據(jù)基礎(chǔ)。
在1.1節(jié)進(jìn)行總體模型設(shè)計(jì)的基礎(chǔ)上,進(jìn)行大數(shù)據(jù)資源調(diào)度任務(wù)節(jié)點(diǎn)信息表征,電網(wǎng)路由節(jié)點(diǎn)的自相關(guān)變量與接收外部輸入數(shù)據(jù)緊密相關(guān),表現(xiàn)為網(wǎng)絡(luò)系統(tǒng)中的干擾信號(hào),C4.5決策樹(shù)下主特征序列模型為s1( t),s2( t),…,sp( t),采用聯(lián)合特征信息增益提取方法, 數(shù)據(jù)捕獲狀態(tài)空間為S={( k,n),0≤k≤K,0≤n≤N},把電網(wǎng)客戶信息的感知信息發(fā)送給調(diào)度者,用q( n)表示下一跳節(jié)點(diǎn)在時(shí)隙n時(shí)的隊(duì)列長(zhǎng)度,u( n)表示下一跳節(jié)點(diǎn)在n+做出的決策行動(dòng),u( n)=0。 在每個(gè)電網(wǎng)客戶關(guān)系網(wǎng)絡(luò)中通過(guò)節(jié)點(diǎn)周期性廣播方法廣播自己的信標(biāo)信息( beacon),該信息包含電網(wǎng)客戶ID、用電量和用電設(shè)備等信息,并在廣域的電網(wǎng)客戶關(guān)系系統(tǒng)大數(shù)據(jù)信息定位空間中進(jìn)行多層迭代,把拓?fù)錁?shù)結(jié)構(gòu)中的每一層節(jié)點(diǎn)攜帶的信息量進(jìn)行抽取對(duì)比,并對(duì)流量信息占用概率進(jìn)行特征匹配,得電網(wǎng)數(shù)據(jù)信息主特征量:
式中:tn+1時(shí)刻和tn時(shí)刻相差一個(gè)調(diào)度迭代周期,通過(guò)調(diào)度節(jié)點(diǎn)的任務(wù)信息表征,電網(wǎng)客戶關(guān)系數(shù)據(jù)調(diào)度系統(tǒng)相當(dāng)于一個(gè)多層節(jié)點(diǎn)的非線性映射器,其資源調(diào)度的規(guī)律為:
在最大獨(dú)立集的基礎(chǔ)上建立一棵根在云平臺(tái)多處理分叉樹(shù)的數(shù)據(jù)聚集樹(shù), 然后各個(gè)節(jié)點(diǎn)按主特征建模進(jìn)行數(shù)據(jù)聚集樹(shù)分層, 以此為基礎(chǔ)進(jìn)行數(shù)據(jù)調(diào)度。
在第1節(jié)進(jìn)行系統(tǒng)總體設(shè)計(jì)和任務(wù)信息表征的基礎(chǔ)上, 本文提出一種基于決策樹(shù)主特征提取大數(shù)據(jù)資源優(yōu)化調(diào)度方法, 并應(yīng)用在電網(wǎng)客戶關(guān)系系統(tǒng)設(shè)計(jì)中。
在決策樹(shù)模型中, 給定的定電網(wǎng)客戶關(guān)系大數(shù)據(jù)看作信息集合中的2條數(shù)據(jù)軌跡A,B。 對(duì)于軌跡A上的任意一點(diǎn)ai, 計(jì)算數(shù)據(jù)庫(kù)分區(qū)訪問(wèn)的輸出概率中第m個(gè)高斯分量的均值矢量:
其中,混合數(shù)M的大小決定了輸出概率的精度,假設(shè)電網(wǎng)客戶關(guān)系大數(shù)據(jù)資源定位信息在干擾和噪聲作用下軌跡A、B之間的空間有向距離則可以表示為:
式中:NA為A的數(shù)據(jù)信息流特征分割權(quán)向量。根據(jù)A、B之間的分區(qū)方位的協(xié)方差矩陣, 計(jì)算正交加權(quán)約束的主特征信干比,得到:
提取主特征實(shí)現(xiàn)大數(shù)據(jù)資源優(yōu)化調(diào)度, 電網(wǎng)客戶關(guān)系數(shù)據(jù)調(diào)度通信接收端檢測(cè)到異常數(shù)據(jù)對(duì)資源調(diào)度具有干擾作用,需要對(duì)其進(jìn)行濾波設(shè)計(jì),采用匹配濾波器檢測(cè)方法去除資源調(diào)度中的干擾性因素,得到濾波器的系統(tǒng)函數(shù)為:
通過(guò)上述處理,減少系統(tǒng)中的存儲(chǔ)數(shù)據(jù)冗余,提高電網(wǎng)客戶關(guān)系大數(shù)據(jù)調(diào)度效益。 在不同電網(wǎng)客戶關(guān)系系統(tǒng)定位信道中, 信道占用概率的準(zhǔn)確求解可以提高抗干擾能力,信道占用概率計(jì)算中,資源調(diào)度的通信信道滿足約束條件:
通過(guò)特征壓縮, 得到電網(wǎng)客戶關(guān)系大數(shù)據(jù)的聚類中心為:
通過(guò)特征壓縮,得到電網(wǎng)客戶關(guān)系大數(shù)據(jù)的,采用競(jìng)爭(zhēng)集來(lái)描述一個(gè)節(jié)點(diǎn)在傳送數(shù)據(jù)時(shí), 提取決策樹(shù)的主特征,進(jìn)行聯(lián)合特征識(shí)別,其檢驗(yàn)統(tǒng)計(jì)量為:
采用相位重加權(quán)方式,去掉路徑相移偏量,得到大數(shù)據(jù)資源調(diào)度特征響應(yīng)簡(jiǎn)化后的表達(dá)式為:
在電網(wǎng)客戶關(guān)系網(wǎng)格模型中, 各空閑時(shí)間片長(zhǎng)度分別記作x1,x2,…,xm+1,假定網(wǎng)絡(luò)結(jié)構(gòu)模型為某種幾何空間S,構(gòu)建模糊隸屬函數(shù),大數(shù)據(jù)資源多源節(jié)點(diǎn)中形成新的映射,在大數(shù)據(jù)資源調(diào)度網(wǎng)格模型中,對(duì)大數(shù)據(jù)資源調(diào)度任務(wù)所需的計(jì)算資源為:
式中:rect( t)=1,|t|≤1/2。通過(guò)求得式( 17)的極小值,實(shí)現(xiàn)對(duì)資源的優(yōu)化調(diào)度,綜上分析,實(shí)現(xiàn)了電網(wǎng)客戶關(guān)系系統(tǒng)大數(shù)據(jù)信息流集合劃分機(jī)制與模式匹配,為實(shí)現(xiàn)對(duì)電網(wǎng)客戶關(guān)系系統(tǒng)大數(shù)據(jù)庫(kù)構(gòu)建位和特征分析奠定基礎(chǔ)。
為了驗(yàn)證本文設(shè)計(jì)的大數(shù)據(jù)資源調(diào)度算法在提高數(shù)據(jù)調(diào)度匹配準(zhǔn)確性和實(shí)時(shí)性方面的優(yōu)越性能,進(jìn)行仿真實(shí)驗(yàn)。 實(shí)驗(yàn)硬件環(huán)境描述為:操作系統(tǒng)UNIX; 編程語(yǔ)言Matlab語(yǔ)言。 編程環(huán)境GCC( GNU Compiler Collection)。 實(shí)驗(yàn)中,采用某大型電網(wǎng)公司的客戶關(guān)系系統(tǒng)進(jìn)行系統(tǒng)仿真,采集原始數(shù)據(jù)作為實(shí)驗(yàn)樣本數(shù)據(jù),離散采樣率為fs=10f0Hz=10 kHz,帶寬B=1 kHz。 電網(wǎng)客戶數(shù)據(jù)特征提取計(jì)算過(guò)程中,全局迭代次數(shù)為500次,變量的維數(shù)n為30,算法獨(dú)立運(yùn)行30次。 進(jìn)行資源調(diào)度決策樹(shù)構(gòu)建,本體特征的權(quán)值向量W={ws,wt,wu}T。實(shí)驗(yàn)中,采用10個(gè)計(jì)算節(jié)點(diǎn)組建電網(wǎng)客戶資源大數(shù)據(jù)資源調(diào)度環(huán)境,網(wǎng)絡(luò)路由節(jié)點(diǎn)通信半徑為10 m,Sink節(jié)點(diǎn)位于該區(qū)域中心,節(jié)點(diǎn)通信輪次為134輪次,帶寬為1。 根據(jù)上述實(shí)驗(yàn)環(huán)境, 進(jìn)行電網(wǎng)客戶關(guān)系系統(tǒng)的大數(shù)據(jù)資源調(diào)度仿真,進(jìn)行數(shù)據(jù)信息時(shí)間采樣,得到采樣波形如圖2所示。
圖2 電網(wǎng)客戶關(guān)系數(shù)據(jù)采樣Fig. 2 Customer relationship data sampling in the power gird
由圖2可知, 原始的電網(wǎng)客戶關(guān)系數(shù)據(jù)不能規(guī)律性地反應(yīng)數(shù)據(jù)特征, 難以實(shí)現(xiàn)有效的資源調(diào)度。本文采用決策樹(shù)主特征提取方法面對(duì)上述數(shù)據(jù)資源進(jìn)行特征分析,得到主特征提取結(jié)果如圖3所示。
圖3 電網(wǎng)客戶關(guān)系資源數(shù)據(jù)主特征提取結(jié)果Fig.3 The main feature extraction results of the customer relationship resources in the power grid
由圖3可知, 采用本文方法進(jìn)行決策樹(shù)主特征提取,能有效準(zhǔn)確地反應(yīng)電網(wǎng)客戶關(guān)系系統(tǒng)中大數(shù)據(jù)的內(nèi)部特征細(xì)節(jié),為進(jìn)行資源優(yōu)化調(diào)度提供準(zhǔn)確的數(shù)據(jù)輸入。 以此為基礎(chǔ)進(jìn)行資源調(diào)度,為對(duì)比算法性能,采用本文算法和傳統(tǒng)算法,以資源調(diào)度的準(zhǔn)確匹配率為測(cè)試指標(biāo),得到仿真結(jié)果如圖4所示。
圖4 電網(wǎng)客戶關(guān)系數(shù)據(jù)資源調(diào)度匹配性能對(duì)比Fig. 4 The matching performance of the grid customer relationship data resource scheduling
由圖4可知,采用本文方法相比K-means算法和FRFT算法具有較高資源調(diào)度匹配率,性能優(yōu)越。
表1 資源調(diào)度匹配率對(duì)比Tab. 1 Resource scheduling matching rate
資源調(diào)配率對(duì)比如表1所示。 由表1可知,隨著迭代次數(shù)的增加, 本文算法的匹配率可到100%,而K-means算法和FRFT算法的匹配率只能達(dá)到96%。由此可知,本文方法的資源匹配率更高、性能更好。
在電網(wǎng)客戶關(guān)系系統(tǒng)中存儲(chǔ)著海量大數(shù)據(jù)信息,需要進(jìn)行大數(shù)據(jù)資源優(yōu)化調(diào)度,以提高電網(wǎng)客戶關(guān)系系統(tǒng)運(yùn)行的穩(wěn)定性。 傳統(tǒng)大數(shù)據(jù)資源調(diào)度方法采用能量譜密度函數(shù)特征調(diào)度算法,由于電網(wǎng)與客戶關(guān)系數(shù)據(jù)信息受到外部非線性特征信息的干擾,對(duì)大數(shù)據(jù)資源的調(diào)度性能不好。 提出一種基于決策樹(shù)主特征提取大數(shù)據(jù)資源優(yōu)化調(diào)度方法,并應(yīng)用在電網(wǎng)客戶關(guān)系系統(tǒng)設(shè)計(jì)中。 通過(guò)構(gòu)建電網(wǎng)客戶關(guān)系的決策樹(shù)控制模型和資源調(diào)度模型,對(duì)大數(shù)據(jù)資源調(diào)度任務(wù)節(jié)點(diǎn)進(jìn)行信息表征,提取主特征實(shí)現(xiàn)大數(shù)據(jù)資源優(yōu)化調(diào)度。 仿真結(jié)果表明,采用本文方法能實(shí)現(xiàn)對(duì)電網(wǎng)客戶關(guān)系系統(tǒng)中的大數(shù)據(jù)資源的優(yōu)化調(diào)度,提高數(shù)據(jù)匹配能力,從而提高系統(tǒng)可靠性和穩(wěn)定性。
[1] 魏理豪, 王甜, 陳飛, 等. 基于層次分析法的信息系統(tǒng)實(shí)用化評(píng)價(jià)研究[J]. 科技通報(bào), 2014, 30( 2): 142-148.WEI Lihao, WANG Tian, Chen Fei, et al. The information system based on analytic hierarchy process( ahp) practical evaluation studies[J]. Bulletin Science Technology, 2014,30( 2): 142-148( in Chinese).
[2] 朱繼萍, 戴君波. 中長(zhǎng)期電力負(fù)荷預(yù)測(cè)相關(guān)影響因素優(yōu)化選擇[J]. 計(jì)算機(jī)仿真, 2008, 25( 5): 225-228.ZHU Jiping, DAI Junbo. Related factors affecting medium and long term power load forecasting optimal selection[J].Computer Simulation,2008,25( 5):225-228( in Chinese).
[3] 陳靖, 路志英, 劉洪, 等. 基于改進(jìn)ANP的配電網(wǎng)綜合評(píng)估方法及應(yīng)用[J]. 電力科學(xué)與工程,2015,31( 5):21-31.CHEN Jing, LU Zhiying, LIU Hong, et al. Based on the improvement of the distribution network comprehensive evaluation method and application of ANP[J]. Electric Power Science and Engineering, 2015, 31( 5): 21-31( in Chinese).
[4] 楊杰, 鄭宇清, 呂曉燕, 等. 應(yīng)用電網(wǎng)雷害分布合理布置500 kV線路避雷器[J]. 高壓電器, 2013( 9): 91-95.YANG Jie, ZHENG Yuqing, L譈 Xiaoyan, et al. The distribution of reasonable application grid layout of 500 kV line lightning arrester[J]. High Voltage Electric Equipment,2013( 9): 91-95( in Chinese).
[5] 吳小辰, 趙勇, 蘇寅生, 等. 南方電網(wǎng)受端系統(tǒng)動(dòng)態(tài)無(wú)功綜合調(diào)用技術(shù)[J]. 南方電網(wǎng)技術(shù), 2015, 9( 2): 25-29.WU Xiaochen, ZHAO Yong, SU Yinsheng, et al. By the end of the southern power grid system dynamic reactive power integrated call technology[J]. Journal of Southern Power Grid Technology, 2015,9( 2): 25-29( in Chinese).
[6] 吳小辰, 樊紀(jì)元. 電網(wǎng)客戶關(guān)系數(shù)據(jù)調(diào)度中心統(tǒng)一數(shù)據(jù)平臺(tái)的設(shè)計(jì)[J]. 電力系統(tǒng)自動(dòng)化, 2006, 30( 22): 89-92.WU Xiaochen, FAN Jiyuan. Customer relationship data grid dispatching center unified data platform design[J].Automation of Electric Power Systems, 2006, 30( 22): 89-92( in Chinese).