阮玉生 屈慧潔
1. 廣西博聯(lián)信息通信技術(shù)有限責任公司 廣西 南寧 530023 2. 廣西教育學院 數(shù)學與信息科學學院 廣西 南寧 530023
基于我國當下電力產(chǎn)業(yè)建設工作實施的不斷完善,相關(guān)配電網(wǎng)負荷數(shù)據(jù)動態(tài)挖掘軟件的設計研究成為配電網(wǎng)及有關(guān)單位的焦點關(guān)注話題,并在市場的不斷建設與發(fā)展中成為高價值研究問題[1]。為了實現(xiàn)軟件更多的功能,應在實施數(shù)據(jù)挖掘行為過程中,對行為進行條件給定,并在支撐性數(shù)據(jù)較為充足的條件下,引進多種計算算法,對挖掘行為進行實現(xiàn)。但由于數(shù)據(jù)挖掘行為的發(fā)生通常伴隨著海量數(shù)據(jù)的干擾,因此挖掘過程中所涉及的數(shù)據(jù)量相對龐大[2]?;诖?,本文引入模糊軟聚類方法,開展對配電網(wǎng)負荷數(shù)據(jù)動態(tài)挖掘軟件設計研究。
在對配電網(wǎng)環(huán)境當中負荷數(shù)據(jù)進行挖掘時,首先需要完成對本文基于模糊軟聚類的配電網(wǎng)負荷數(shù)據(jù)動態(tài)挖掘軟件的挖掘規(guī)則制定,以此完成對海量負荷數(shù)據(jù)集當中所有頻繁事務的尋找。由于配電網(wǎng)的特殊性,在進行配電網(wǎng)負荷數(shù)據(jù)挖掘時,需要經(jīng)歷多次配電網(wǎng)負荷數(shù)據(jù)庫。初次挖掘是對候選集進行挖掘,在這一階段當中,可將生成的單項頻繁項集作為挖掘結(jié)果[3]。后續(xù)的挖掘均是對原本復雜程度較高的挖掘?qū)ο筮M行進一步的優(yōu)化,以此緩解本文挖掘軟件的運行壓力。根據(jù)上述挖掘軟件的挖掘需要,制定基于模糊軟聚類的數(shù)據(jù)動態(tài)挖掘規(guī)則為:
規(guī)則一:將選取的待挖掘?qū)ο髽颖具M行分塊處理,并將處理后的結(jié)果引入到集群的每個節(jié)點當中。通過模糊軟聚類對每個待挖掘數(shù)據(jù)節(jié)點的支持度進行計算。再完成對軟件中map程序上的相關(guān)操作執(zhí)行,以此獲取到配電網(wǎng)環(huán)境當中各個需要進行挖掘的文件中所有的數(shù)據(jù)集,并在mapper程序當中輸入一個已知的數(shù)據(jù)記錄,并利用combiner完成對本地相關(guān)數(shù)據(jù)集記錄的兼容。
規(guī)則二:在mapper程序當中輸入另外一個已知的配電網(wǎng)負荷數(shù)據(jù)記錄信息,并將其與規(guī)則一當中的符合數(shù)據(jù)進行比對,將其中存在的相同數(shù)據(jù)統(tǒng)一發(fā)送到一個節(jié)點當中,開始頻繁挖掘。
規(guī)則三:綜合上述兩點規(guī)則,完成對所有節(jié)點的分配,將不同配電網(wǎng)負荷數(shù)據(jù)值數(shù)據(jù)信息統(tǒng)一到不同數(shù)據(jù)節(jié)點當中。再結(jié)合模糊軟聚類當中的默認對關(guān)鍵數(shù)值排序的功能,將挖掘價值更高的負荷數(shù)據(jù)進行匯總,得到最終的挖掘?qū)ο蟆?/p>
為保證本文基于模糊軟聚類的配電網(wǎng)負荷數(shù)據(jù)動態(tài)挖掘軟件的運行效率,針對挖掘價值較低的挖掘?qū)ο筮M行篩選,以此提高軟件的應用效果。根據(jù)上述制定的挖掘規(guī)則,在配電網(wǎng)環(huán)境當中對負荷數(shù)據(jù)進行挖掘,根據(jù)配電網(wǎng)負荷數(shù)據(jù)挖掘?qū)ο蟮幕咎卣鱗4]。假設W為配電網(wǎng)負荷數(shù)據(jù)集Y當中的頻繁m項挖掘?qū)ο螅瑒tW的所有m-1項的子集也可以稱之為使其頻繁m-1的項目集。因此,進一步分析得出,Wm為數(shù)據(jù)Y當中的頻繁m項候選集,則頻繁m-1挖掘?qū)ο蠹螸m-1中包括的m-1項目子集的個數(shù)一定為m。根據(jù)挖掘?qū)ο蟮男再|(zhì),本文提出進一步篩選挖掘?qū)ο蟮膫€數(shù)算法為:利用Lm-1產(chǎn)生的Cm之前先對Lm-1進行一次裁剪,統(tǒng)計與之相關(guān)的項目弧線出現(xiàn)次數(shù)[5]。為了實現(xiàn)對高挖掘價值和低挖掘價值的挖掘?qū)ο髤^(qū)分,用 Lm-1對其中某一要素的執(zhí)行連接求得挖掘?qū)ο螽斨袧撛诘念l繁項目集,即挖掘價值更高的挖掘?qū)ο蟆?/p>
在篩選出需要進行挖掘的配電網(wǎng)負荷數(shù)據(jù)挖掘?qū)ο蠛?,結(jié)合編程思想,對挖掘?qū)ο笾械臄?shù)據(jù)進行重過濾,將挖掘?qū)ο竺恳活悇e下的特征出現(xiàn)概率進行計算,其計算公式為:
公式(1)中,K表示為挖掘?qū)ο笾忻總€數(shù)據(jù)類別出現(xiàn)的概率;iλ表示為特征數(shù)據(jù);m表示為配電網(wǎng)環(huán)境中的數(shù)據(jù);n表示為配電網(wǎng)中所有特征數(shù)據(jù)個數(shù)。為避免在挖掘的過程中出現(xiàn)挖掘數(shù)據(jù)在重要數(shù)據(jù)集百分比中占比降低,還需要對挖掘?qū)ο髾?quán)重集合進行合理分配,其分配公式為:
公式(2)中,M表示為配電網(wǎng)環(huán)境中每個挖掘?qū)ο髾?quán)重分配數(shù)值;Q表示為挖掘?qū)ο笤谂潆娋W(wǎng)環(huán)境當中具體出現(xiàn)的次數(shù);d表示為模糊軟聚類算法系數(shù)。根據(jù)上述公式實現(xiàn)對挖掘?qū)ο髾?quán)重分配,確定最終挖掘結(jié)果的準確性,以此提高本文基于模糊軟聚類的配電網(wǎng)負荷數(shù)據(jù)動態(tài)挖掘軟件的應用價值。
本文通過上述論述,完成對基于模糊軟聚類的配電網(wǎng)負荷數(shù)據(jù)動態(tài)挖掘軟件設計,為進一步驗證該軟件在實際應用中的優(yōu)勢,開展下述對比實驗。首先選擇電力市場當中某一配電網(wǎng)企業(yè)作為實驗背景條件,選擇該企業(yè)歷史配電網(wǎng)負荷數(shù)據(jù)共15950組,將該組數(shù)據(jù)作為兩種挖掘軟件的挖掘?qū)ο?,設置兩種挖掘軟件的運行時間分別為100ms、500ms、1000ms、2000ms和3000ms,在確保兩種挖掘軟件均在相同的運行環(huán)境下,完成對比實驗,將得出的挖掘結(jié)果進行記錄,并繪制成如表1所示的實驗結(jié)果對比表。
表1 兩種挖掘軟件實驗結(jié)果對比表
由表1中的兩組數(shù)據(jù)結(jié)果可以看出,本文挖掘軟件數(shù)據(jù)挖掘量明顯多于傳統(tǒng)挖掘軟件數(shù)據(jù)挖掘量,在相同配電網(wǎng)絡負荷數(shù)據(jù)集當中,挖掘出的數(shù)據(jù)量越多,則說明挖掘的利用價值越高。因此,通過對比實驗證明,本文提出的基于模糊軟聚類的配電網(wǎng)負荷數(shù)據(jù)動態(tài)挖掘軟件設計在實際應用中具有更高的挖掘效率,滿足配電網(wǎng)對海量數(shù)據(jù)的挖掘需要,充分發(fā)揮配電網(wǎng)數(shù)據(jù)的利用價值。
為了滿足電力市場的發(fā)展需求,本文基于模糊軟聚類技術(shù)的應用,提出一種針對配電網(wǎng)負荷數(shù)據(jù)的動態(tài)挖掘軟件設計方法,此軟件主要服務于配電站,可解決配電站在市場中的穩(wěn)定運行。為了確保本文設計軟件投入市場后具備一定可行性,本文提出對此軟件的對比實驗,并通過將本文設計的軟件與傳統(tǒng)軟件進行對比的方式,驗證本文提出的軟件設計方法在應用中的可操作性更強,具有更加實際的社會應用價值,可滿足電力市場內(nèi)配電網(wǎng)在市場的穩(wěn)定運行需求。