陶媛穎
(河南理工大學(xué))
電力作為現(xiàn)代社會的生命線之一,對于維持社會運轉(zhuǎn)和經(jīng)濟發(fā)展至關(guān)重要。低壓配電網(wǎng)的線損高低和電力竊漏現(xiàn)象一直是供電公司關(guān)注的重點問題。線損不僅影響電力系統(tǒng)的經(jīng)濟性,線損過高還可能導(dǎo)致電能資源的浪費。而電力竊漏則對電力公司的經(jīng)濟利益和電力系統(tǒng)的穩(wěn)定性構(gòu)成威脅。
傳統(tǒng)的線損和竊電問題的解決方法往往基于經(jīng)驗法則和簡單的統(tǒng)計方法,這些方法難以應(yīng)對電力系統(tǒng)日益復(fù)雜和多變的特點。因此,盡管電力行業(yè)在數(shù)據(jù)采集方面取得了巨大進步,但在低壓配電網(wǎng)線損的準(zhǔn)確評估和竊電行為的有效識別仍然存在許多挑戰(zhàn)。隨著終端設(shè)備智能電表不斷普及,以及用電信息采集系統(tǒng)的應(yīng)用,能實時、高頻的采集數(shù)據(jù),數(shù)據(jù)的多樣性和復(fù)雜性增加了數(shù)據(jù)分析的難度。其次,電力竊漏行為往往具有隱蔽性,竊電者采取各種手段來規(guī)避監(jiān)測,使得竊電識別變得復(fù)雜且具有挑戰(zhàn)性。再者,傳統(tǒng)的線損預(yù)測方法通?;诤唵蔚哪P?,難以反映電力系統(tǒng)的真實情況。針對用電數(shù)據(jù)規(guī)模大、維度高、來源類型多等問題,基于大數(shù)據(jù)和機器學(xué)習(xí)的研究方法不斷出現(xiàn),本文就采用多元線性回歸模型構(gòu)建線損預(yù)測模型,采用支持向量機建立竊電診斷模型。
為了進行低壓配電網(wǎng)線損預(yù)測與竊電診斷的研究,本文研究采用了一系列數(shù)據(jù)處理方法和機器學(xué)習(xí)技術(shù),以下將詳細介紹研究的方法與數(shù)據(jù)處理流程。
研究從用電信息采集系統(tǒng)采集到的的全量數(shù)據(jù),包括電量、電流、電壓、功率因數(shù)等電力參數(shù)。數(shù)據(jù)采集是研究的首要步驟,以獲取高質(zhì)量的數(shù)據(jù)用于后續(xù)分析。
本文采用某地區(qū)2019 年期間連續(xù)180 天共300 個用戶的全量數(shù)據(jù),收集每日線損數(shù)據(jù),并在300 個用戶中選擇50 個作為竊電用戶。由于采集到的用戶數(shù)據(jù)會由于外力影響或者通信故障等在傳輸過程或者存儲過程中產(chǎn)生誤差,采集到的原始數(shù)據(jù)通常包含各種問題,如缺失值、異常值和噪聲。因此,進行了數(shù)據(jù)清洗和預(yù)處理,以確保數(shù)據(jù)的質(zhì)量。在缺失值處理方面,研究使用插值和平均值填充的方法,以保持數(shù)據(jù)的完整性。對于異常值的檢測,采用了統(tǒng)計方法和基于規(guī)則的檢測算法,識別并剔除了異常數(shù)據(jù)點。此外,研究使用濾波技術(shù)來降低數(shù)據(jù)中的高頻噪聲,以獲得更平滑的數(shù)據(jù)序列。最后,為了統(tǒng)一不同數(shù)據(jù)源的格式,進行了數(shù)據(jù)格式標(biāo)準(zhǔn)化,包括時間戳格式的統(tǒng)一、電力參數(shù)單位的轉(zhuǎn)換以及數(shù)據(jù)字段的重新命名。
數(shù)據(jù)清洗和預(yù)處理之后,研究進行了特征提取的工作,將原始數(shù)據(jù)轉(zhuǎn)化為可用于建模的特征。特征提取是建模分析的關(guān)鍵步驟,研究考慮了多種特征類別:首先提取了與電力參數(shù)相關(guān)的特征,包括平均電流、平均電壓、功率因數(shù)等,這些特征反映了電力系統(tǒng)的基本運行狀態(tài)。其次,考慮了時間特征,包括季節(jié)性、周期性和趨勢性特征,以捕捉電力系統(tǒng)數(shù)據(jù)的時間動態(tài)性。另外,由于我國低壓電壓等級為380/220V,研究還關(guān)注了低壓配電網(wǎng)的拓撲結(jié)構(gòu),提取了與拓撲結(jié)構(gòu)相關(guān)的特征,如相、線、戶關(guān)系。最后,負荷分布對低壓配電網(wǎng)的線損和竊電行為具有影響,因此研究抽取了負荷特征,包括負荷曲線的形狀和波動性等。
特征提取之后,研究得到了一個包含多個特征的數(shù)據(jù)集,將用于后續(xù)的模型訓(xùn)練和分析。
數(shù)據(jù)準(zhǔn)備完成后,研究開始構(gòu)建線損預(yù)測模型和竊電診斷模型。目前有多種機器學(xué)習(xí)算法,包括支持向量機、神經(jīng)網(wǎng)絡(luò)和決策樹等,本文采用多元線性回歸模型構(gòu)建線損預(yù)測模型,支持向量機構(gòu)建竊電診斷模型。模型訓(xùn)練過程包括以下步驟:首先,研究將數(shù)據(jù)集劃分為訓(xùn)練集和測試集,通常采用70%的數(shù)據(jù)用于訓(xùn)練,30%的數(shù)據(jù)用于測試。其次,研究嘗試了不同的機器學(xué)習(xí)算法,并通過交叉驗證等方法來選擇最佳的模型。然后,使用訓(xùn)練集的數(shù)據(jù),研究對選定的模型進行訓(xùn)練,并調(diào)整模型參數(shù)以獲得最佳性能。最后,研究使用測試集的數(shù)據(jù)來評估模型的性能,常用的評估指標(biāo)包括均方根誤差、準(zhǔn)確率、召回率等。
線損預(yù)測是電力系統(tǒng)運營管理中的一個重要任務(wù),它旨在估計電力系統(tǒng)中的電能損失。線損不僅會導(dǎo)致電力資源的浪費,還會降低電力系統(tǒng)的效率和可靠性。為了解決這一問題,研究將介紹一種基于機器學(xué)習(xí)的線損預(yù)測模型,該模型利用歷史數(shù)據(jù)和特征工程來估計低壓配電網(wǎng)中的線損。
線損預(yù)測模型的建立首先涉及特征工程,即從原始數(shù)據(jù)中提取有用的特征來描述電力系統(tǒng)的運行狀態(tài)。這些特征將用于訓(xùn)練和評估預(yù)測模型。在特征工程中,研究考慮了以下幾類特征:
電力參數(shù)特征:包括平均電流、平均電壓、功率因數(shù)等電力參數(shù)的統(tǒng)計特征。這些特征反映了電力系統(tǒng)的基本運行狀態(tài)。
時間特征:包括季節(jié)性、周期性和趨勢性特征,用于捕捉電力系統(tǒng)數(shù)據(jù)的時間動態(tài)性。例如,研究可以計算每日電能消耗的均值和方差,以反映每日負荷的波動情況。
拓撲結(jié)構(gòu)特征:考慮低壓配電網(wǎng)的拓撲結(jié)構(gòu)對線損的影響,由于對于低壓采用分臺區(qū)管理,提取低壓臺區(qū)的相線戶關(guān)系。
負荷特征:考慮了負荷分布對線損的影響,提取了負荷曲線的形狀和波動性等特征。
這些特征的提取需要結(jié)合領(lǐng)域知識和數(shù)據(jù)分析技巧,以確保特征能夠充分反映低壓配電網(wǎng)的特點。在特征工程完成后,研究選擇了一個適用于線損預(yù)測的機器學(xué)習(xí)模型。這里研究選擇了一個常用的回歸模型,多元線性回歸(Multiple Linear Regression)作為示例。該模型的基本形式如下:
式中,Y是線損的預(yù)測值,β0是截距,β1,β2…βn是特征的系數(shù),X1,X2…Xn是特征的值,ε是誤差項。
在模型的訓(xùn)練過程中,研究使用歷史數(shù)據(jù)集來估計模型的系數(shù)β,使得模型能夠最好地擬合訓(xùn)練數(shù)據(jù)。一旦模型訓(xùn)練完成,就可以將新的特征值輸入模型,以預(yù)測線損的值。
為了訓(xùn)練和評估線損預(yù)測模型,研究將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。通常,研究使用70%的數(shù)據(jù)作為訓(xùn)練集,用于模型的訓(xùn)練和參數(shù)估計,而將剩余的30%作為測試集,用于評估模型的性能。在訓(xùn)練集上,研究使用多元線性回歸模型進行訓(xùn)練,估計模型的系數(shù)β。訓(xùn)練的目標(biāo)是最小化預(yù)測值與實際線損值之間的誤差,通常使用最小二乘法來估計系數(shù)。在模型訓(xùn)練完成后,研究使用測試集來評估模型的性能。評估指標(biāo)包括均方根誤差(RMSE)、平均絕對誤差(MAE)和決定系數(shù)(R-squared),這些指標(biāo)用于衡量模型的擬合優(yōu)度和預(yù)測準(zhǔn)確性,算法基本流程如圖1所示。
圖1 基于多元線性回歸的低壓配電網(wǎng)線損預(yù)測算法流程
竊電是電力系統(tǒng)面臨的一項重要問題,它導(dǎo)致了巨額損失和資源浪費。為了有效地診斷竊電行為,研究引入了一種基于機器學(xué)習(xí)的竊電診斷模型,該模型利用電力系統(tǒng)的數(shù)據(jù)和特征工程來檢測潛在的竊電行為。
竊電診斷模型的構(gòu)建始于特征工程,其中研究從原始電力系統(tǒng)數(shù)據(jù)中提取相關(guān)特征以描述電力消費模式。這些特征將成為模型的輸入,用于訓(xùn)練和評估。
在特征工程中,研究考慮了以下幾類特征:
日平均電壓不平衡率:正常用戶電壓波動較小。如果電壓異常,則可能是用戶的功耗異常。
日平均電流不平衡率:計量電流隨用戶接入負載不規(guī)則變化,但正常情況下用戶相線電流和零線電流基本相同。用戶可以通過比較相線和中性線電流進行監(jiān)控。
月平均日凍結(jié)電量:如果某個用戶發(fā)生竊電,該用戶的用電量信息與其他用戶相比不正常。為了消除負載容量的影響,采用用戶申報的容量作為參考值,將功率數(shù)據(jù)轉(zhuǎn)換為單位值。
三相有功功率不平衡率:根據(jù)三相有功功率與這段時間從電表側(cè)收集到的總有功功率進行比較,計算兩者之間的不平衡率。表達式為:
這些特征的提取需要結(jié)合領(lǐng)域知識和數(shù)據(jù)分析技巧,以確保能夠有效地檢測竊電行為。
竊電診斷模型的核心是機器學(xué)習(xí)模型,它能夠從歷史數(shù)據(jù)中學(xué)習(xí)竊電行為的模式,并根據(jù)新的數(shù)據(jù)來進行診斷。研究選擇了一個常用的分類模型,支持向量機(Support Vector Machine,SVM),通過構(gòu)建一個分離超平面來區(qū)分正常用電行為和竊電行為。支持向量機可分為線性可分和線性不可分。由于竊電采集到的數(shù)據(jù)是復(fù)雜無序的,屬于非線性不可分割,要轉(zhuǎn)化為線性問題,在線性可分的條件下,找到完全分離兩個樣本的最優(yōu)超平面,表達式為:
m為支持向量機的數(shù)量,K(x,xi)為核函數(shù),本文的樣本特征不多,選取徑向基核函數(shù)(RBF)。
為了訓(xùn)練和評估竊電診斷模型,研究需要將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。通常,研究將70%的數(shù)據(jù)用于訓(xùn)練模型,而將30%的數(shù)據(jù)用于評估模型性能。在訓(xùn)練集上,研究使用支持向量機模型進行訓(xùn)練。訓(xùn)練的目標(biāo)是找到一個最佳的分離超平面,以最大程度地分隔正常用電行為和竊電行為。訓(xùn)練過程中,模型將學(xué)習(xí)如何根據(jù)輸入的特征對電力消費進行分類。訓(xùn)練完成后,研究使用測試集來評估模型的性能。評估指標(biāo)包括準(zhǔn)確率、召回率、F1 分數(shù)等,用于衡量模型的分類準(zhǔn)確性和竊電診斷的效果。此外,研究還可以繪制ROC 曲線和AUC 值,評估模型在不同閾值下的性能表現(xiàn)。算法基本流程如圖2所示。
圖2 基于支持向量機的竊電診斷算法流程
首先,回顧一下線損預(yù)測模型的實驗數(shù)據(jù)集。研究使用了包括電流、電壓、功率因數(shù)等多個電力參數(shù)的數(shù)據(jù),以及與時間、拓撲結(jié)構(gòu)和負荷相關(guān)的特征。數(shù)據(jù)集包含了歷史電力系統(tǒng)運行數(shù)據(jù),用于訓(xùn)練和測試線損預(yù)測模型。
研究使用了均方根誤差(RMSE)、平均絕對誤差(MAE)和決定系數(shù)(R-squared)等指標(biāo)來評估線損預(yù)測模型的性能。
表1 模型在測試集上的性能指標(biāo)
從上表可以看出,線損預(yù)測模型在測試集上表現(xiàn)出色。RMSE 和MAE 的值都很小,表明模型的預(yù)測誤差較低。同時,R-squared接近1,說明模型能夠很好地擬合測試數(shù)據(jù),預(yù)測性能較好。因此,線損預(yù)測模型的應(yīng)用具有重要的應(yīng)用價值。通過準(zhǔn)確預(yù)測線損,供電公司能及時發(fā)現(xiàn)線損異常情況并采取措施來降低線損,幫助電力公司降低經(jīng)濟成本。
研究使用了一個包含正常用電和竊電行為樣本的數(shù)據(jù)集進行實驗。數(shù)據(jù)集包括了某地區(qū)2019 年期間300 個用戶的電力參數(shù)(如電流、電壓、功率因數(shù))以及與時間、負荷相關(guān)的特征。以下是數(shù)據(jù)集的基本統(tǒng)計信息。
總樣本數(shù):300。正常用電樣本數(shù):250。竊電行為樣本數(shù):50。
數(shù)據(jù)集的不平衡性反映了竊電行為相對較少的情況,這也是竊電診斷模型需要克服的挑戰(zhàn)之一。竊電診斷模型的性能評估主要基于分類模型的指標(biāo),包括準(zhǔn)確率、召回率、F1分數(shù)等。
表2 測試集上的性能指標(biāo)
從上表可以看出,竊電診斷模型在測試集上表現(xiàn)出色。準(zhǔn)確率接近1,表明模型能夠準(zhǔn)確分類正常用電和竊電行為。召回率和F1 分數(shù)也表現(xiàn)良好,說明模型在竊電行為的診斷方面具有高度的敏感性和準(zhǔn)確性。因此,竊電診斷模型的應(yīng)用對電力系統(tǒng)安全和經(jīng)濟性具有重要價值。通過該模型能夠及時發(fā)現(xiàn)竊電行為,有助于電力公司減少損失,減少非法用電對系統(tǒng)造成的影響。
線損預(yù)測模型和竊電診斷模型的實驗結(jié)果表明,基于機器學(xué)習(xí)的方法在電力系統(tǒng)管理中具有廣泛的應(yīng)用前景。這兩個模型在測試數(shù)據(jù)上都表現(xiàn)出色,具有高度的準(zhǔn)確性和敏感性。
本文研究探討了基于海量數(shù)據(jù)的電網(wǎng)線損預(yù)測與竊電診斷研究。通過建立線損預(yù)測模型和竊電診斷模型,展示了機器學(xué)習(xí)在電力系統(tǒng)管理中的巨大潛力。線損預(yù)測模型的實驗結(jié)果表明,研究能夠準(zhǔn)確預(yù)測電網(wǎng)中的線損,從而提高電力系統(tǒng)的效率和可持續(xù)性。竊電診斷模型的實驗結(jié)果則突顯了其在檢測竊電行為方面的高效性。通過高準(zhǔn)確率和召回率,模型能夠及時發(fā)現(xiàn)竊電行為,維護電力系統(tǒng)的安全和公平。綜合而言,這些研究成果為電力系統(tǒng)管理提供了有力的工具和方法。未來,研究將繼續(xù)改進模型性能,探索更多的特征和算法,以滿足不斷發(fā)展的電力系統(tǒng)需求,推動電力行業(yè)的創(chuàng)新和進步。希望這些研究能夠為電力領(lǐng)域的專業(yè)人士和決策者提供有益的參考和啟發(fā)。