國網白銀供電公司 賈黎亮 李春華 李強仁 郭庭哲
在泛在電力物聯網建設背景下,借助“大云物移智鏈邊”等新興技術實現與同期線損線路異常診斷業(yè)務的快速融合,分解線損關鍵影響因素,針對線損管理難度日益增加、數據應用不足等影響同期線損精益管理等問題開展積極數據探索和挖掘實踐,發(fā)揮電力大數據價值,為電網安全穩(wěn)定運行、線路科學降損及精益管理提供有效的支撐。
通過調整電網運行方式、控制無功功率、調整電壓等措施有效解決異常問題,助力電網高效經濟運行[1]。數據存儲部分選擇使用大數據平臺的Hive(數據倉庫)進行數據存儲;數據計算處理部分,考慮數據量級較大,選擇使用基于Hadoop+Spark分布式框架的大數據平臺;數據挖掘分析部分,一是數據準備及數據處理,二是根據運行參數生成對應數據特征統(tǒng)計量,三是對數據特征統(tǒng)計量按照線損分類后進一步處理得到最終分析數據[2]。
基于業(yè)務需求中的分析理解,本次分析電力內部數據取自同期線損、用采等電力信息系統(tǒng),數據周期為2018年7月至2019年6月,數據記錄總數約15.1萬條;可信度方面,運行參數數據均來源于用電信息采集系統(tǒng),雖有一定的采集異常數據但不影響后續(xù)數據分析。完整度方面,電壓、功率、電量數據均存在一定的缺失情況,但缺失數量占數據總量的比例很低,在經過填補處理后不影響后續(xù)對數據的分析[3]。
電壓數據處理:首先對線路電壓數據進行統(tǒng)計,確認線路的有數據天數,是否缺相等情況,然后根據統(tǒng)計結果刪除電壓缺失數量大于15個的數據,使用平滑填補缺失值,電壓數據與其對應變比相乘;其次使用填補后數據統(tǒng)計線路是三相四線制或三相三線制,為向線電壓轉換做準備;最后使用填補后數據和線制統(tǒng)計結果,將所有電壓數據轉換為對應的線電壓數據。
功率數據處理:統(tǒng)計有功、無功功率數據缺失情況后,刪除缺失超過15的數據,對其他存在缺失的數據平滑填補。填補后數據與相關倍率相乘得到處理后功率數據;匹配線損數據:將電壓、有功功率、無功功率、電量數據按照元件編號、計量點編號、日期,分別與線損數據匹配[4],得到電壓與線損、有功功率與線損、無功功率與線損、電量與線損數據寬表。
用于描述數據特征的統(tǒng)計量主要分為集中趨勢統(tǒng)計量、離散趨勢統(tǒng)計量和分布形狀統(tǒng)計量。其中,集中趨勢統(tǒng)計量包括平均數、中位數、眾數,離散趨勢統(tǒng)計量包括極差、方差或標準差、變異系數,分布形狀統(tǒng)計量包括峰度、偏度。
電壓分析:電壓數據分為三相,每一項由15分鐘采集一次得到的96點電壓數據組成。結合業(yè)務實際,不同電壓等級存在不同數值的電壓上下限限制,需要統(tǒng)計電壓數據位于電壓限制之外的數據比例(表1),同時需要生成基于數據特征統(tǒng)計量的數據用以描述電壓數據。集中趨勢統(tǒng)計量中的眾數,由于存在同一線路、同一線損情況下,眾數結果數量不統(tǒng)一,無法比較的問題,所以選擇平均數、中位數兩個特征。離散趨勢統(tǒng)計量中的方差或標準差、變異系數在計算時都需要平均數,由于所有平均數不在同一水平,缺乏比較意義,所以選擇極差及能夠避開平均值的一階差分(即后一個數據減前一個數據的差的集合)均值用以衡量數據的離散趨勢[5]。分布形狀統(tǒng)計量因不存在實際業(yè)務意義,不進行計算。綜上所述,計算字段包括各相的電壓偏高、偏低、正常比例、平均數、中位數、極差、一階差分均值。為對比線路在線損異常和線損正常時的運行參數,需要將特征計算結果進行進一步處理。對各項中位數再次求中位數,其他數據求平均數。
功率分析。功率數據分為有功功率和無功功率,均由每15分鐘采集一次得到的96點功率數據組成,不分相。因功率數據與單相電壓數據相似,均存在眾數結果不統(tǒng)一、平均數不是同一數值、分布形狀統(tǒng)計量沒有實際意義的問題,所以功率數據分為有功功率和無功功率兩部分,計算字段均為平均數、中位數、極差、一階差分均值。為對比線路在線損異常和線損正常時的運行參數,需要將特征計算結果進行進一步處理。對各項中位數再次求中位數,其他數據求平均數。
表1 電壓閾值
表2 電壓特征計算部分結果
表3 線路不同線損電壓數據特征部分計算結果
表4 有功功率特征計算部分結果
表5 無功功率特征計算部分結果
表6 線路不同線損有功功率數據特征部分計算結果
表7 線路不同線損無功功率數據特征部分計算結果
表8 線路不同線損電量數據特征部分計算結果
表9 分析結果
電量分析及分析結論。電量數據分為正向電量和反向電量,每條線路每天生成正向電量和反向電量各一個。因電量數據每天只有一個,無法計算日電量的離散趨勢特征,所以直接計算電量的平均數和中位數(表8)。數據寬表合成。將電壓、功率等數據計算得到的數據特征進行整合,形成數據寬表,為下一步得到分析結論提供數據支持。比較同一線路不同線損情況下,電壓、功率等運行參數的特征,得到運行參數的異同點。根據異同點提出相應的建議(表9)。
在實際業(yè)務中,線路負載率、電壓、有功功率、無功功率、線路長度等因素均會影響線路線損,但這些因素如何綜合影響線損、影響程度如何目前均未得到合理的分析,本文基于各位專家學者的基礎上進行進一步的研究。解決線路線損異常診斷、并且面對不同的異常線損,提出了相應的降損措施。