傅軍棟,楊 姚,羅善江
(華東交通大學電氣與電子工程學院,江西 南昌 330013)
智能小區(qū)居民用電負荷特征權(quán)重分析
傅軍棟,楊 姚,羅善江
(華東交通大學電氣與電子工程學院,江西 南昌 330013)
以往對智能小區(qū)居民用電行為聚類分析時,存在著負荷特征選擇與權(quán)重計算描述不足的問題。為了提高居民用電行為聚類分析的準確率,降低聚類分析運行時間,提出一種基于 ReliefF 算法建立的以峰時耗電率、日負荷峰值時刻、谷時耗電率、日負荷周期數(shù)、日最小負荷率等特征的數(shù)據(jù)模型。該模型可以對海量居民用電行為數(shù)據(jù)進行處理,并通過 k-means算法對其進行聚類分析。實驗數(shù)據(jù)來源為已建成的智能小區(qū),結(jié)果準確率達 94.61%,證明了基于 ReliefF 算法建立的特征數(shù)據(jù)模型在居民用電行為類分析中是有效的。
用電行為;聚類分析;負荷特征;數(shù)據(jù)模型
隨著我國智能小區(qū)的不斷建設(shè)和發(fā)展,人們積累了大量居民用電數(shù)據(jù)[1]。雖然用電數(shù)據(jù)看似十分雜亂,但實際上卻隱藏著居民用電行為方式,且數(shù)據(jù)之間還存在一定的關(guān)聯(lián)性。若對散亂的海量數(shù)據(jù)進行挖掘并研究居民用電行為類型,將同類居民用電負荷平均分配給 A、B、C 三相,則可以使低壓配電網(wǎng)三相電流接近,從而降低三相不平衡產(chǎn)生的零序電流對線路、變壓器等造成的不利影響[2]。同時,也可以簡單、有效地針對不同類型用戶制定不同服務(wù)[3],幫助電網(wǎng)削峰填谷[4]、節(jié)能減排。
聚類分析憑借處理數(shù)據(jù)在全局范圍內(nèi)分布特征的高效能力,正逐漸應(yīng)用在電力用戶分類領(lǐng)域[5]。文獻[6]以電力用戶負荷、行業(yè)及現(xiàn)行電價為基礎(chǔ),對用戶進行聚類分析。文獻[7]根據(jù)工業(yè)、農(nóng)業(yè)、市政的用電行業(yè)特征進行聚類分析。上述文獻以及其他用電行為分類的文獻[8-11]均未涉及居民用電行為分類。文獻[12]基于聚類算法首次對智能小區(qū)用戶用電行為進行研究,直接選擇了峰時耗電率、負荷率、谷電系數(shù)、平段的用電量百分比等4個負荷特征進行聚類分析,得出5類典型用戶類型,但作者沒有對各種負荷特征進行分析選擇及權(quán)重計算,忽略了不同負荷特征對聚類產(chǎn)生的影響。
智能小區(qū)居民用電數(shù)據(jù)集中負荷特征向量多,存在冗余特征,冗余特征會增加特征模型的復(fù)雜度,影響算法的運算效率[13],如果先通過特征分析選擇及權(quán)重計算,便可以降低特征維度,從而提高模型的精確度和降低算法運行時間。本文首次基于ReliefF 算法對居民用電負荷進行特征選擇及權(quán)重計算,建立以峰時耗電率、日負荷峰值時刻、谷時耗電率、日負荷周期數(shù)[14]、日最小負荷率等 5 種特征為特征的數(shù)據(jù)模型,并結(jié)合 k-means 算法結(jié)果的準確率來反應(yīng)模型的有效性。
本文的主要貢獻為:第一,提出在多種負荷特征情況下,對居民用電行為進行聚類分析時需對負荷特征進行分析選擇及權(quán)重計算;第二,首次將ReliefF 算法應(yīng)用到居民用電行為聚類分析中;第三,建立了峰時耗電率、日負荷峰值時刻、谷時耗電率、日負荷周期數(shù)、日最小負荷率等5種特征為特征的負荷特征數(shù)據(jù)模型,并對每一種特征進行分類準確率測試。
智能小區(qū)用智能電表及智能插座采集小區(qū)居民用電數(shù)據(jù)[15],數(shù)據(jù)既可存放在家庭智能網(wǎng)關(guān)給家庭用電進行自我調(diào)整,又可通過智能網(wǎng)關(guān)傳送到小區(qū)主站供值班人員分析決策?;谟秒姅?shù)據(jù)集,提出以下可能影響聚類分析的特征:
(1) 日最小負荷率,最小負荷/日最大負荷。
(2) 日峰谷差,日最大負荷-日最小負荷。
(3) 日峰谷差率,(日最大負荷-日最小負荷)/日最大負荷。
(4) 日負荷率,用戶平均負荷/最大負荷。
(5) 峰時耗電率,高峰時段用電量/總的用電量。
(6) 谷時耗電率,低谷時段用電量/總的用電量。
(7) 平段的用電量百分比,平段用電量/總的用電量。
(8) 日負荷峰值時刻 Tmax[14]。
2.1 基于 ReliefF 算法建立模型
本文基于 ReliefF 算法建立負荷特征數(shù)據(jù)模型。ReliefF 算法是通過對 Kira 提出的 Relief算法改進而來。Relief算法運行效率高,對數(shù)據(jù)類型沒有要求,對特征間的關(guān)系不敏感,但只局限于兩類數(shù)據(jù)的分類問題,而 ReliefF 算法是可以處理多類問題和回歸問題,并補充了數(shù)據(jù)缺失情況下的處理辦法,是公認的效果最好的 fillter 特征評估算法[13]。因此本文選用 ReliefF 算法建立特征數(shù)據(jù)模型,具體步驟如下。
輸入:從實驗數(shù)據(jù)源中隨機選取4類典型特征的家庭用戶的正常用電數(shù)據(jù)共 4 800 條作為輸入數(shù)據(jù)集 D,根據(jù)樣本數(shù)量和特征數(shù)設(shè)定迭代次數(shù) m=80和最近鄰近樣本個數(shù) k=8,特征的類別數(shù) s=9。
步驟 1 置用電數(shù)據(jù)集 D 所有樣本的各個特征權(quán)重為 0,即:W(a)=0,a=1, 2,L , s。
步驟 2 從用電數(shù)據(jù)集D 中隨機選擇一個樣本R。
步驟 3 利用編寫的 GetRandSamples 函數(shù)從 D中找出與 R 同類的 k=8 個最鄰近從 R 不同類樣本集中找出 k=8 個最鄰近
步驟4 根據(jù)式(2)更新每一個特征a 的權(quán)值W(a)。
步驟 6 步驟 2~步驟 5 重復(fù) m=80 次,輸出每個特征的平均權(quán)重 W(a)。
2.2 模型評價
k-means 算法是最常用且最著名的聚類算法之一,最主要的優(yōu)點是計算簡單、聚類結(jié)果穩(wěn)定,因此本文基于 k-means 聚類分析結(jié)果的準確率判斷模型的有效性。具體步驟如下所述。
步驟1 對數(shù)據(jù)集D中4類典型用戶的實際用戶類型進行編號:A 類型編號為 1,B 類型編號為 2,C 類型編號為 3,D 類型編號為 4。
步驟2 從用電數(shù)據(jù)集D中選擇需要聚類分析的特征向量構(gòu)成數(shù)據(jù)集 X,如單獨對特征 2聚類分析,數(shù)據(jù)集D 中特征2的列向量就構(gòu)成了數(shù)據(jù)集X,再隨機從數(shù)據(jù)集X中選擇k個樣本點作為初始的聚類中心,由于本文選取的是 4 類典型用戶,因此 k=4。
步驟3 調(diào)用 Matlab 中 k-means 函數(shù)聚類分析。數(shù)據(jù)類為 4 類,距離計算方式“Distance”選擇“city”,“Options”選項選擇“Opts”,聚類分析得出居民用電行為類型。
步驟4 將步驟3聚類分析得出的居民用電行為類型與步驟1居民用電實際類型比較判斷,得出對數(shù)據(jù)集X的特征進行聚類分析結(jié)果的準確率。
步驟 5 輸出每次聚類分析結(jié)果的準確率,并通過準確率來評價模型是否有效。
3.1 數(shù)據(jù)來源
數(shù)據(jù)來源于南昌市某智能小區(qū) 2013 年 4~6 月份用戶每天的用電數(shù)據(jù)。每個家庭用戶每天的數(shù)據(jù)包括日最小負荷率、日峰谷差、日峰谷差率、日負荷率、峰時耗電率、谷時耗電率、平段用電百分比、日負荷峰值時刻、日負荷周期數(shù)等9個負荷特征列向量并將列向量數(shù)據(jù)進行標準歸一化處理,以及 24個(由于現(xiàn)場原因每 1 h 采集一次)行向量,以此建立最初用電特征數(shù)據(jù)維度模型。
建立初始特征數(shù)據(jù)維度模型,特征名稱及簡要說明如表1。
表1 特征說明Table 1 feature instruction
從實驗數(shù)據(jù)源中隨機選取 4 類典型特征[16]的家庭用戶用電數(shù)據(jù)作為測試數(shù)據(jù)源,4類典型特征的家庭為:A類:空置房用戶;B類:老人家庭用戶;C類:上班族家庭用戶;D類:老人+上班族家庭用戶。將4類用戶的日負荷曲線標準化后的日負荷曲線如圖1。
圖1 4 類典型特征家庭用戶日負荷曲線Fig. 1 Four kinds of typical characteristics of home users daily load curve
3.2 實驗結(jié)果驗證與分析
實驗一:基于 ReliefF 算法對初始負荷特征權(quán)重計算。
由于算法在運行過程中會選擇隨機樣本 R,隨機數(shù)的不同將導致結(jié)果權(quán)重有一定的出入,因此,本實驗采用平均方法,將主程序運行 40次,然后將結(jié)果匯總求出每種權(quán)重的平均值。9個特征權(quán)重的大小分布如圖2所示。
圖2 各個特征權(quán)重分布圖Fig. 2 Each feature weight distribution
每個特征權(quán)重的平均值從大到小排序如表2。
表2 特征權(quán)重平均值Table 2 Feature of average weight
由表2 得:特征 5 >特征 8 >特征 6 >特征 9 >特征 1 >特征 4 >特征 3 >特征 7 >特征 2。
從上面的特征權(quán)重可以看出,特征5是最主要的特征,說明峰時耗電率是影響不同居民用電日負荷曲線相似度的關(guān)鍵特征,其次是負荷峰值時刻、谷時耗電率、日負荷周期數(shù)、日最小負荷率,以下特征日負荷率、日峰谷差率、平段用電百分比、日峰谷差權(quán)重大小接近。
實驗二:基于 k-means 算法測試每一個特征聚類結(jié)果的準確率。
聚類 k值選 4,反復(fù)聚類 5次,取 5次聚類結(jié)果的平均準確率作為評價 k-means 算法的準確率。分析的結(jié)果如表3。
實驗三:基于 ReliefF 和 k-means 對特征權(quán)重分析。
單從分類正確率來看,k-means 算法已經(jīng)可以對居民用電行為進行分類做出較高準確的判斷,但考 慮 ReliefF 算 法對 權(quán) 重 的 影 響 及 海 量 數(shù) 據(jù) 對k-means 算法運行時間的影響,故實驗三將結(jié)合ReliefF 算法和 k-means 算法對數(shù)據(jù)集進行分析。
表3 k-means聚類結(jié)果Table 3 k-means clustering results
(1) 單獨對各個特征的數(shù)據(jù)進行聚類分析,詳細結(jié)果如表4。
表4 單獨對各個特征分析結(jié)果Table 4 Analysis result of each feature
將表4用柱狀圖3的形式顯示出來,更直觀。
由圖3可直觀地得出:各類準確率中,特征5最高,特征 2 最低,這與 ReliefF 權(quán)重分析的結(jié)果一致,但由于 ReliefF 算法有部分特征權(quán)重接近,所以也區(qū)分不明顯,這說明特征權(quán)重對分類是有影響的,并且從表4可以看出,單獨從一個特征判定其類型是不可靠的。
圖3 各個特征分析結(jié)果Fig. 3 Each feature analysis results
(2) 將特征種類按照權(quán)重從大到小的順序排列并結(jié)合相應(yīng)特征聚類分析,記錄每次運行的時間,結(jié)果如表5。
從表5可以看出:第一,選擇權(quán)重排名前5的特征聚類分析,其分析結(jié)果準確率幾乎達到選擇所有特征的準確率;第二,選擇權(quán)重排名前8特征聚類分析,雖然其分析結(jié)果準確率比選擇權(quán)重排名前5的高,但對聚類算法而言,選擇5個特征向量時的運算速率比選擇8個特征向量運行速率快。當面對海量數(shù)據(jù)時,上述優(yōu)勢會更明顯。第三:當選擇所有特征時,準確率卻低于選擇 8種特征的準確值,說明基于數(shù)據(jù)集的所有特征聚類分析通常得不到最優(yōu)結(jié)果。因此可以得出結(jié)論:居民用電行為聚類分析時,選擇以峰時耗電率、日負荷峰值時刻、谷時耗電率、日負荷周期數(shù)、日最小負荷率等5個特征建立的最終特征模型更有效。
表5 ReliefF 和 k-means結(jié)合分析結(jié)果Table 5 Result of the analysis of ReliefF and k-means
本文首先基于 ReliefF 算法對居民用電負荷特征進行特征選擇和權(quán)重分析,再結(jié)合 k-means 算法對居民用電行為進行聚類分析,同時以峰時耗電率、日負荷峰值時刻、谷時耗電率、日負荷周期數(shù)、日最小負荷率為特征建立特征模型。實驗結(jié)果表明,模型的建立在居民用電行為聚類分析時是有效的。
[1]林弘宇, 田世明. 智能電網(wǎng)條件下的智能小區(qū)關(guān)鍵技術(shù)[J]. 電網(wǎng)技術(shù), 2011, 35(12): 1-7. LIN Hongyu, TIAN Shiming. Research on key technologies for smart residential community[J]. Power System Technology, 2011, 35(12): 1-7.
[2]傅軍棟, 喻勇, 黃來福. 不平衡負載的一種更加經(jīng)濟的 補償 方法 [J]. 電 力系 統(tǒng)保 護與 控制, 2015, 43(2): 126-132. FU Jundong, YU Yong, HUANG Laifu. A more economical compensation method for unbalanced load[J]. Power System Protection and Control, 2015, 43(2): 126-132.
[3]張素香. 智能小區(qū)的商業(yè)智能[J]. 北京郵電大學學報, 2012, 35(5): 94-97. ZHANG Suxiang. Business intelligence in the smart community[J]. Journal of Beijing University of Posts and Telecommunications, 2012, 35(5): 94-97.
[4]湯慶峰, 劉念, 張建華. 計及廣義需求側(cè)資源的用戶側(cè)自動響應(yīng)機理與關(guān)鍵問題[J]. 電力系統(tǒng)保護與控制, 2014, 42(24): 138-147. TANG Qingfeng, LIU Nian, ZHANG Jianhua. Theory and key problems for automated demand response of userside considering generalized demand side resources[J]. Power System Protection and Control, 2014, 42(24): 138-147.
[5]張東霞, 苗新, 劉麗平, 等. 智能電網(wǎng)大數(shù)據(jù)技術(shù)發(fā)展研究[J]. 中國電機工程學報, 2015, 35(1): 2-12. ZHANG Dongxia, MIAO Xin, LIU Liping, et al. Research on development strategy for smart grid big data[J]. Proceedings of the CSEE, 2015, 35(1): 2-12.
[6]馮曉蒲, 張鐵峰. 基于實際負荷曲線的電力用戶分類技術(shù)研究[J]. 電力科學與工程, 2010, 26(9): 18-22. FENG Xiaopu, ZHANG Tiefeng. Research on electricity users classification technology based on actual load curve[J]. Electric Power Science and Engineering, 2010, 26(9): 18-22.
[7]李培強, 李欣然, 陳輝華, 等. 基于模糊聚類的電力負荷特性的分類與綜合 [J]. 中國電機工程學報, 2005, 25(24): 73-78. LI Peiqiang, LI Xinran, CHEN Huihua, et al. The characteristics classification and synthesis of power load based on fuzzy clustering[J]. Proceedings of the CSEE, 2005, 25(24): 73-78.
[8]黎祚, 周步祥, 林楠. 基于模糊聚類與改進 BP 算法的日負荷特性曲線分類與短期負荷預(yù)測[J]. 電力系統(tǒng)保護與控制, 2012, 40(3): 56-60. LI Zuo, ZHOU Buxiang, LIN Nan. Classification of daily load characteristics curve and forecasting of short-term load based on fuzzy clustering and improved BP algorithm[J]. Power System Protection and Control, 2012, 40(3): 56-60.
[9]劉莉, 王剛, 翟登輝. k-means 聚類算法在負荷曲線分類中的應(yīng)用[J]. 電力系統(tǒng)保護與控制, 2011, 39(23): 65-68. LIU Li, WANG Gang, ZHAI Denghui. Application of k-means clustering algorithm in load curve classification[J]. Power System Protection and Control, 2011, 39(23): 65-68.
[10]朱曉清. 電力負荷的分類方法及其應(yīng)用[D]. 廣州: 華南理工大學, 2012. ZHU Xiaoqing. Load classification method and its application[D]. Guangzhou: South China University of Technology, 2012.
[11]黃宇騰, 侯芳, 周勤, 等. 一種面向需求側(cè)管理的用戶負 荷形態(tài)組 合分析方法 [J]. 電力系統(tǒng) 保護與 控制, 2013, 41(13): 20-25. HUANG Yuteng, HOU Fang, ZHOU Qin, et al. A new combinational electrical load analysis method for demand side management[J]. Power System Protection and Control, 2013, 41(13): 20-25.
[12]張素香, 劉建明, 趙丙鎮(zhèn), 等. 基于云計算的居民用電行 為 分 析 模 型 研 究 [J]. 電 網(wǎng) 技 術(shù) , 2013, 37(6): 1542-1546. ZHANG Suxiang, LIU Jianming, ZHAO Bingzhen, et al. Cloud computing-based analysis on residential electricity consumption behavior[J]. Power System Technology, 2013, 37(6): 1542-1546.
[13]陳曉琳. 采用 ReliefF 特征加權(quán)的 NIC 算法研究[D]. 鄭州: 鄭州大學, 2014. CHEN Xiaolin. A feature weighted NIC algorithm based on ReliefF[D]. Zhengzhou: Zhengzhou University, 2014.
[14]孫璞玉, 李家睿, 王承民, 等. 基于負荷特征向量的負荷 分 類 與 預(yù) 測 方 法 研 究 及 其 應(yīng) 用 [J]. 電 氣 應(yīng) 用 , 2013(增刊 1): 234-238. SUN Puyu, LI Jiarui, WANG Chengmin, et al. Study and its application of the load classification and prediction method based on load characteristic vector[J]. Electrotechnical Application, 2013(S1): 234-238.
[15]謝江宏, 王進平, 上官明霞. 一種智能小區(qū)用戶用電模式的探索與研究[J]. 華東電力, 2013, 41(1): 157-159. XIE Jianghong, WANG Jinping, SHANGGUAN Mingxia. The study of a power consumption model directing at the intelligent community[J]. East China Electric Power, 2013, 41(1): 157-159.
(編輯 周金梅)
Residential electricity load features weighting analysis in smart community
FU Jundong, YANG Yao, LUO Shanjiang
(School of Electrical Engineering, East China Jiaotong Uinversity, Nanchang 330013, China)
In order to solve the described insufficient problem of load feature selection and weight calculation in the past clustering analysis of residential electricity behavior, enhance the accuracy of clustering analysis in residential electricity behavior and reduce the time of clustering analysis operation, a data model based on ReliefF algorithm is proposed. The data model is characterized by electricity consumption rate during peak hour, the peak load time, the valley of the power, daily load cycles, the minimum load rate feature, and so on. The massive data of residential electricity behavior can be processed by the model, and clustering analysis of the model is made through k-means algorithm. Experimental data is obtained from a built-up smart community, and the result accuracy reaches to 94.61%, showing the proposed model based on ReliefF algorithm in clustering analysis of residential electricity behavior is effective.
electricity consumption behavior; clustering analysis; load characteristic; data model
10.7667/PSPC151714
2015-09-24
傅軍棟(1972 -),男,副教授,研究生導師,主要從事電力系統(tǒng)、建筑電氣及智能化研究。E-mail: 8755915@qq.com