曾順奇,吳杰康,李 欣,蔡志宏
(1.廣東電網有限責任公司廣州供電局,廣東 廣州 510000;2.廣東工業(yè)大學自動化學院,廣東 廣州 510006)
近年來,隨著中國城鄉(xiāng)經濟建設迅猛發(fā)展,用電負荷激增,有些小用戶發(fā)展成為大功率用戶,超過了線路本身預留的空間,導致臺區(qū)電壓在用電高峰出現(xiàn)欠壓現(xiàn)象[1]。配電網網架結構的相對滯后和迅速增長的用電需求之間的矛盾越來越突出[2],導致臺區(qū)電壓波動較大,嚴重影響用戶用電體驗并降低配電網供電可靠性,給供電公司帶來了嚴峻的考驗。針對以上問題,業(yè)界學者開展了針對性研究,例如:從原理上對低壓問題產生的原因深入分析,得到電壓偏低的原理[3];構建多指標的臺區(qū)低電壓成因識別指標體系,建立基于支持向量機多分類器的臺區(qū)低壓成因識別模型[2];通過人工排查、登記、數據預測和定期分析低電壓,動態(tài)識別低電壓[4];采用改進粒子群優(yōu)化(particle swarm optimization, PSO)算法優(yōu)化電容配置,改善負荷接入配電網對電網造成的沖擊[5]。
以上文獻從低電壓成因以及治理方案進行相關研究,但是充分利用大數據技術識別臺區(qū)電壓與用戶用電行為之間關系相關研究較少。因此,提出一種新的方法辨識臺區(qū)電壓與用戶的關系:通過智能電能表提供的海量用電數據,首先,利用插值法對數據采樣過程中產生的缺值進行補全;然后,對其進行數據特征提取,通過主成分分析法(principal component analysis, PCA)進行數據降維,大大減少計算量,提高辨識的時效性和聚類的收斂性;最后,采用模糊C均值(fuzzy C-means, FCM)算法對用戶進行分類,按照周期內用戶用電有功值分為大、中、小3個等級用戶,并結合皮爾遜相關系數分析各個等級用戶在峰-谷-平區(qū)間對臺區(qū)電壓的影響水平,進而確定不同負荷等級用戶與配電臺區(qū)電壓之間的關系。
配電網終端由變壓器、配電箱和配有智能電能表的用戶端組成。一般每一個智能電能表箱都有三相進線,由智能電能表箱分出A、B、C三相連接各個用戶,一個智能電能表箱下可能存在單相用戶,也有三相用戶,這里只討論單相下的所有用戶。相與相之間電壓互不影響,每一相只受該相所接用戶的用電情況影響,具體的臺戶拓撲結構如圖1所示。
圖2為臺戶等值電路,圖中Μ3點為變壓器A相低壓側電壓。通常低壓側的電壓與用戶用電功率、高壓側擋位和負荷功率有關。高壓側的擋位分別為±5%和0。由潮流計算可得Μ3點的電壓:
圖2 臺戶等值電路
VM3=VM1-ΔV
(1)
(2)
下面主要研究在臺戶關系中,不同用戶的用電行為對應的峰-谷-平區(qū)間與導致變壓器低壓側電壓發(fā)生偏移二者之間的關系。
一個臺區(qū)下某一臺變壓器中一條單相線路連接了不同用電等級的用戶,其中某一些用戶的用電行為在峰-谷-平期影響變壓器低壓側電壓,使其產生波動。研究用戶用電與臺區(qū)變壓器低壓側電壓波動之間的關系是基于臺區(qū)和用戶的歷史數據。用戶有功功率數據由智能電能表獲取,采集終端的時間分辨率為15 min,采集時長為7 d,共有672個用戶側有功功率數據點。從用電采集系統(tǒng)歷史數據中獲取并構建臺區(qū)用戶有功功率的數據矩陣X∈RN×D:
(3)
式中:X為N個用戶在采集區(qū)間內D個采樣點所組成的矩陣;xi,tj為臺區(qū)用戶i在tj時刻的有功功率測量值;N為臺區(qū)下的用戶總數;D為采樣時段內臺區(qū)用戶有功功率的采樣點數,即臺區(qū)用戶原始有功功率數據集的特征維度。X的列向量Xtj為臺區(qū)用戶在tj時刻的有功測量向量;X的行向量Xi為單個臺區(qū)用戶i在采集時段內的有功測量向量,其單位為kW。
假設以上N個用戶均屬于同一個臺區(qū)下某個變壓器的A相,按照D=96×7獲取A相電壓數據,構成變壓器低壓側電壓時間序列矩陣:
V=[vt1,vt2,…,vtD]
(4)
式中:V為變壓器低壓側A相在采集周期內的電壓向量;vtD為該相D時刻的測量電壓值。
智能電能表采集數據時間跨度大,用戶的原件安裝、調試可能存在差異,加之停電或者采集失敗等因素,往往容易導致采集到的電力數據出現(xiàn)缺失現(xiàn)象。由于同一用戶有功數據與時間呈線性關系,可采用相鄰點(tt-1,xi,t-1)與(tt+1,xi,t+1)估計中間點的值。假設xi,t=f(t)呈線性關系,通過已知的兩點代入線性方程估算缺值xi,t。
應用皮爾遜相關系數分析負載與臺區(qū)間電壓的關系?,F(xiàn)有臺區(qū)D個時間點的電壓數據:V=[v1,v2,…,vD]。由RN×D通過皮爾遜相關系數計算公式計算各個用戶與臺區(qū)電壓之間的關聯(lián)程度。
皮爾遜相關系數計算式為
(5)
式中:Ε(·)為該向量的期望值;cov(·)為兩個向量的協(xié)方差;ρ(V,Xi)取值范圍為[-1,1],小于0時為負相關,大于0時為正相關,當且僅當V與Xi有嚴格線性關系時取±1。
表1為基于皮爾遜相關系數的相關強度估計,通過表1相關系數范圍判斷變量之間的相關強度。
表1 基于皮爾遜相關系數的相關強度估計
在采集設備覆蓋率和采集成功率較高的臺區(qū),采集的有功數據往往分布較為集中,但是采集數據大多精度不高而且存在噪聲或者冗余。因此,不能簡單使用加權平均法或者求和的方法進行用戶等級區(qū)分。需要對采集到的數據特征進行進一步挖掘??梢圆捎肞CA方法進行數據的特征提取和降維處理。經過降維處理后的數據,仍保留原始數據的分布特性。高維數據在數據分析中計算量大,時效性能不好,利用模糊聚類算法對用戶等級分類時可能會出現(xiàn)維度災難、計算量大、計算時間長等問題。通過PCA法緩解這些問題,盡可能解釋變量具有相關性的高維數據集。通過計算數據的協(xié)方差矩陣cov(X),尋找一個能反映出原有數據特征95%的特征矩陣,將原始高維空間過渡到低維空間,實際將數據映射到一個低維子空間,降維成一個線性無關的低維數據集。PCA具體分析過程可參考文獻[10]。
PCA數據降維的具體步驟如下:
1)對原始數據矩陣X進行轉置處理得到XT,得到的矩陣行表示每一個用戶tj時刻的特征,共有D維特征。對XT零均值處理得到矩陣X′為
(6)
2)使用線性變換得到協(xié)方差矩陣為
(7)
3)通過求解|λI-R|=0得到特征值λ。最后計算特征值的累計貢獻率[10]:
(8)
式中,βi為累計大于95%特征值組成成分(λ1,λ2,…,λk)。對數據進行分析后得到k值。同時得到特征值對應的特征矩陣UD×D=[u1,u2,…,uD 1]。提取前k個特征值對應的特征向量組成降維矩陣UD×k。降維矩陣Zn×k可表示為
Zn×k=Xn×DUD×k=
(9)
式中,Zn×k為用k維的數據表示原始D維數據。
Zn×k不僅降低了數據的冗余度,對提高用戶分類速度有很大的作用。
在臺區(qū)電壓與用戶用電關系辨識中,不同用電等級的用戶與臺區(qū)電壓具有不同的關聯(lián)程度。假設有數據集X,把數據分為c類,對應就有c個類中心C1,C2,…,Cc。把每個樣本j按照預設的類簇歸類,得到用電等級分別為大、中、小3個等級的用戶。根據皮爾遜相關系數的物理含義,對不同等級的用戶分析其峰-谷-平期間對臺區(qū)電壓波動的影響,得出哪些用戶在特定的用電期間與臺區(qū)電壓波動有較強的關聯(lián)性。
模糊聚類是在傳統(tǒng)k均值硬聚類的基礎上加上隸屬度模糊概念的一種聚類分析方法。假設每個樣本j屬于某一類i存在隸屬度uij的關系,由此構建FCM目標函數及其約束條件:
(10)
(11)
式中:m為一個隸屬度的因子;n為所有樣本個數。
式(11)為約束條件,說明一個樣本屬于所有類的隸屬度之和恒為1。
采用模糊聚類分析的方法,選取聚類中心個數c,把所有用戶分為3類:大用戶、中等用戶及小用戶。構建數據集的聚類中心:Ci={ci,1,ci,2,…,ci,k}(i=1,2,3),其中ci,k為第i個聚類中心第k維的聚類中心特征值。
采用模糊聚類分析方法,通過迭代計算,確定模糊C-均值聚類矩陣的最優(yōu)聚類中心,確定用戶所屬類簇。具體迭代步驟如下:
1)初始化:確定類別數C、隸屬度因子m、迭代停止誤差ε以及最大迭代次數(LOOP)。
2)初始化聚類中心P。
3)計算初始距離矩陣D。
4)按式(12)更新用戶與聚類中心的隸屬度。
(12)
式中,d(·)為樣本點到樣本中心的距離函數。若樣本距離中心距離為0,隸屬度設為1,即完全屬于該中心,否則按照推導式子確定隸屬度。
5)更新聚類中心。
(13)
6)重新計算距離矩陣,并計算目標函數值。
(14)
7)若達到最大迭代次數或者前后兩次J的絕對差小于預設誤差ε則結束,否則轉步驟4。具體的模糊聚類迭代流程如圖3所示。
圖3 模糊聚類流程
以廣州某小區(qū)為實例,利用其配電系統(tǒng)用戶用電歷史數據,選取其所屬臺區(qū)某個變壓器低壓側A相下91戶在6月21日至6月27日間的歷史用電有功數據,分辨率為15 min,共672個有功功率初值,相應地選取該變壓器低壓側A相672個電壓值。由于用電數據在采集過程中有缺值,利用插值法對空值進行估算補全。
采用PCA對數據進行降維處理。經過多次數據仿真估算,驗證了當采用63維PCA特征數據可以表達原始數據95%的特征貢獻度,而且可以將聚類分析聚類結果偏差控制在1%以內。因此,選擇把原始數據維度降為63維度,這樣既可保持數據原始特征,又可以減少聚類整體計算時間。
維度選取為
(15)
式中:Sk,fron為前k個特征值組成的面積;Sall為所有特征值組成的總面積;ηk,ctb為前k個特征值特征貢獻度。特征貢獻度如圖4所示。
圖4 PCA的降維貢獻度
采用插值法補全原始數據,共91戶,672維特征值。采用模糊C-均值聚類結果如圖5所示。由于用戶之間存在用電行為相似度較高,其數據特征不明顯,同一個用戶在3個聚類中心隸屬度比較時容易陷入某兩個中心最優(yōu)解,如圖6所示。聚類迭代進行到第8代至第10代,目標函數在第8代陷入早熟、收斂,如圖7所示。
圖5 基于插值法的模糊聚類結果
圖6 基于插值法的模糊聚類隸屬度
圖7 基于插值法的模糊聚類迭代次數
采用原始數據進行聚類的方法只能得到兩類用戶,幾乎不能分辨出第3類用戶。只有在用戶數據量足夠多才能分辨出第3類用戶,但此時存在數據量冗余度高、計算量大、計算時間長等問題。
采用皮爾遜相關系數聚類方法,對用戶用電與臺區(qū)電壓的關聯(lián)程度進行聚類,能夠區(qū)分出用戶對于臺區(qū)電壓影響程度。
但是,皮爾遜相關系數僅僅反映的是某一戶與臺區(qū)的關聯(lián)程度。由于數據具有高維特性,可能是某一些維度對此造成了較大的影響,并不能區(qū)分該用戶等級,不能體現(xiàn)整體性,只能作為部分參考對象。皮爾遜相關系數仿真結果如圖8至圖9所示。
圖8 基于皮爾遜法的模糊聚類結果
圖9 基于皮爾遜法的模糊聚類迭代次數
考慮到數據維數較高、數據特征不突出容易陷入局部最優(yōu)、聚類計算量大等原因,運用PCA法可以解決上述問題。采用PCA法可以提取原數據95%特征貢獻度,用63維數據表示原始數據672維特征。
仿真結果說明,運用PCA法,迭代次數在35次左右,收斂時間一般可以控制在0.568 0~0.589 1 s。對比加權后從小到大排序,采用PCA聚類得到的用戶等級,聚類偏差在4%左右,對應上面按照95%特征貢獻度,負荷誤差可接受范圍整體誤差在1%左右。PCA法仿真結果如圖10至圖12所示。
圖10 基于PCA法的模糊聚類結果
圖11 基于PCA法的模糊聚類隸屬度
圖12 基于PCA法的模糊聚類迭代次數
采用PCA法,確定大、中、小等級用戶數目分別是28、33、30;相對誤差率約為1%。而采用皮爾遜相關系數法,確定大、中、小等級用戶的數目分別是33、15、43。
相對誤差率計算式為
(16)
式中:ηre為聚類用戶等級相對誤差率;ncls為聚類類簇包含用戶數;nset為實際應分類簇用戶數;nz為總的用戶數;ηpca為PCA特征貢獻率。
表2為不同聚類方法的比較結果。從表2可見:1)采用基于插值法的模糊聚類,因用戶之間數值相似度較高,發(fā)現(xiàn)某些粒子只能陷于某一個或者兩個聚類中心之間,容易陷入早熟,聚類效果不好,小數據容易陷入早熟,大量數據聚類消耗時間長;2)采用基于皮爾遜相關系數的模糊聚類,聚類花費時間短,分類效果好,但是只能反映相關程度,體現(xiàn)某一個粒子與聚類中心的整體關聯(lián)程度,不能體現(xiàn)各個時間點聯(lián)系緊密程度,且對于用戶等級的分類誤差率較高,皮爾遜特征值聚類不適合用于用戶等級分類,只適用于用戶對于變壓器低壓側電壓影響度辨識;3)采用基于PCA法的模糊聚類,提取特征值聚類收斂時間短,分類效果好,相對誤差率達1%,適合用于用戶等級分類。
表2 不同聚類方法的比較
綜上,在臺區(qū)電壓與用戶用電關系辨識中,結合PCA特征值聚類法與皮爾遜相關系數,能找出既具有等級分化且有較高影響因子的用戶,此類用戶即是供電管理部門需要重點關注的對象。
4.3.1 峰-谷-平荷期大用戶用電行為分析
由用戶聚類結果與皮爾遜相關系數,從大用戶類簇中選取第85號、第86號用戶,影響因子分別為-0.215 3和0.107 6。該用戶的峰-谷-平負荷曲線如圖13所示,第85號用戶15:00 — 16:00處于用電低谷區(qū)間,此時變壓器低壓端電壓基本保持在238 V以上;16:15以后用電功率逐漸到達峰值,變壓器電壓逐漸下降到235 V,該用戶高峰區(qū)間一直持續(xù)到20:15,變壓器低壓側電壓保持235 V,電壓波動范圍3~4 V;22:15 — 00:00用電功率處于平荷區(qū),此時變壓器電壓穩(wěn)定在238 V。綜合皮爾遜相關系數表與功率-電壓仿真圖,該用戶的用電行為與變壓器電壓波動具有較強關系。大用戶用電負荷曲線如圖13所示。
圖13 大用戶在峰-谷-平期用電負荷特性
4.3.2 峰-谷-平荷期小用戶用電行為分析
對于小用戶,選取第26戶為分析對象,皮爾遜相關系數為0.14且為小用戶中相關系數最大的用戶,對其進行關聯(lián)性分析:結果顯示該用戶在17:15 —18:45處于用電低谷區(qū),對比同時間段的第85號大用戶用電功率正處于高峰,電壓處于較低235 V;該用戶在22:00 — 22:30處于用電高峰,但此區(qū)間變壓器電壓呈現(xiàn)上升趨勢。綜合皮爾遜系數及臺戶功率-電壓仿真圖,第26號小用戶并不如第85號大用戶與變壓器電壓波動具有較強的相關性,小用戶用電負荷曲線如圖14所示。
圖14 小用戶在峰-谷-平期用電負荷特性
在小用戶類簇當中,依據皮爾遜相關系數選取用電行為相近的戶號:5、7、18、26、27、37,這些都屬于該臺區(qū)下A相小用戶。其皮爾遜相關系數保持在0.1左右,重新計算以上用戶連成一片用電區(qū)域與變壓器電壓之間的皮爾遜系數為-0.203 2。由負荷曲線與電壓曲線圖15可知,在這一片用戶中,15:00—16:00保持在用電低谷區(qū),此時變壓器電壓保持240 V;18:00—18:45逐漸達到用電峰值,變壓器電壓同步下降到235 V;22:45—23:15為該片區(qū)域用電平荷期,變壓器電壓同時保持238 V。結合皮爾遜相關系數與該片區(qū)域峰-谷-平期有功功率、變壓器電壓的變化趨勢,該區(qū)域用戶用電行為與變壓器電壓波動具有較強的相關性。多用戶用電負荷曲線如圖15所示。
圖15 多用戶在峰-谷-平期用電負荷特性
提出了一種基于PCA改進模糊聚類的臺區(qū)電壓與用戶用電關系辨識方法,并分析了用戶在用電峰-谷-平荷用電區(qū)間用電行為與臺區(qū)電壓之間的關系。通過對廣州某個小區(qū)連續(xù)7天的數據進行仿真,結果表明:
1)皮爾遜相關系數達到-0.2以上且聚類為大用戶,其用電高峰區(qū)間導致電壓下降1.282%,在該相下對于變壓器電壓波動具有較強的相關性。
2)對于單個小用戶,其用電特征為:單區(qū)段用電功率小,用電間歇時間長,相關系數較低。但是,某一相下存在一片用電行為高度相似的小用戶,該片區(qū)域在同一時間段相關系數達到-0.2以上,其用電規(guī)律同樣對變壓器電壓波動造成一定的影響,需要引起重視。
3)單個小用戶的用電特性:區(qū)間功率小,用電間歇長,在臺區(qū)電壓與用戶用電之間影響因子較弱。若非存在多個用電行為相似的皮爾遜系數用戶,其用電行為與變壓器電壓波動可忽略。