楊 濤,孫志達(dá),唐 明,吳棟萁,王 劍,李海波,雷 一
(1.國網(wǎng)浙江省電力公司電力科學(xué)研究院,杭州 310014;2.清華四川能源互聯(lián)網(wǎng)研究院,成都 610200)
精確的戶變關(guān)系是電網(wǎng)公司實(shí)現(xiàn)營銷精細(xì)化、降損增效的基礎(chǔ),也是保證線損準(zhǔn)確計(jì)算的前提。電力系統(tǒng)配電網(wǎng)環(huán)節(jié)的用戶供電檔案和臺(tái)區(qū)供電關(guān)系錯(cuò)亂,會(huì)導(dǎo)致臺(tái)區(qū)線損率分析、故障定位等一系列應(yīng)用無法有效開展。目前電網(wǎng)公司梳理臺(tái)區(qū)戶變關(guān)系的主要方式依舊是人工巡查或借助臺(tái)區(qū)貫通儀等專用設(shè)備[1-4]來識(shí)別臺(tái)區(qū)信息,由于載波信號(hào)仍可耦合到其他變壓器產(chǎn)生跨臺(tái)區(qū)通信等難題,使得臺(tái)區(qū)識(shí)別準(zhǔn)確度較低,此外需要在線路上加裝采集器等硬件,全面部署受成本條件限制。
部分學(xué)者利用智能電表量測(cè)數(shù)據(jù)開展戶變關(guān)系研究。文獻(xiàn)[5]基于用戶電壓數(shù)據(jù)與變壓器低壓測(cè)量數(shù)據(jù)的相似度,利用灰色關(guān)聯(lián)方法識(shí)別用戶所屬臺(tái)區(qū)及相別。文獻(xiàn)[6]利用電壓時(shí)空相關(guān)性,對(duì)用戶所屬臺(tái)區(qū)進(jìn)行分類判別。文獻(xiàn)[7]提出基于臺(tái)區(qū)相線相位差異的統(tǒng)計(jì)特征判定用戶臺(tái)區(qū)歸屬。上述研究指出相同戶變關(guān)系的電壓數(shù)據(jù)在時(shí)空上的相關(guān)性,表明通過數(shù)據(jù)層面識(shí)別戶變關(guān)系的可行性,但在適用性方面還需繼續(xù)研究。此外,上述研究所使用的電壓數(shù)據(jù)在維度上和體量上各不相同,但總體數(shù)據(jù)樣本不大,如何利用積累的海量電壓數(shù)據(jù),挖掘有用信息以準(zhǔn)確識(shí)別戶變關(guān)系還未見相關(guān)報(bào)道。
隨著數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展,人工智能神經(jīng)網(wǎng)絡(luò)算法被廣泛用于模式識(shí)別、聚類和分類等場(chǎng)景,其中BP(反向傳播)神經(jīng)網(wǎng)絡(luò)具有極強(qiáng)的函數(shù)逼近與模式分類能力,廣泛用于負(fù)荷預(yù)測(cè)、負(fù)荷分類[8-10]等領(lǐng)域。文獻(xiàn)[11]采用并行集成BP 算法對(duì)海量負(fù)荷數(shù)據(jù)進(jìn)行高效分類;文獻(xiàn)[12]采用BP 算法將臺(tái)區(qū)樣本分類,解決了臺(tái)區(qū)線損率數(shù)值分散的問題;文獻(xiàn)[13]提出一種基于模糊聚類與改進(jìn)BP 算法的負(fù)荷特性曲線分類方法;文獻(xiàn)[14]選取隱藏層節(jié)點(diǎn)數(shù)為6 的前向BP神經(jīng)網(wǎng)絡(luò)作為跨臺(tái)區(qū)用戶識(shí)別模型進(jìn)行識(shí)別。然而傳統(tǒng)BP 算法使用梯度下降方法優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù)最小化損失函數(shù)loss,雖然實(shí)現(xiàn)簡(jiǎn)單,但是容易收斂到局部最小值點(diǎn),并且在處理高維度數(shù)據(jù)集時(shí)速度慢、效率低。同時(shí),由于多隱含層、多節(jié)點(diǎn)BP 算法的復(fù)雜性,構(gòu)建BP 算法的計(jì)算過程需要耗費(fèi)大量時(shí)間,BP 算法的運(yùn)行效率較低,一般采用優(yōu)化算法對(duì)傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),例如MOBP,VLBP,CGBP,LMBP[15],IGRA-BABP[16],MPSO-BP[17],IFOA-BP[18],主要集中在學(xué)習(xí)參數(shù)的選取、網(wǎng)絡(luò)結(jié)構(gòu)、收斂性方面的改進(jìn),總體上取得了一定的效果,但仍存在計(jì)算復(fù)雜、增加較多額外計(jì)算量的問題。
Adam(自適應(yīng)矩估計(jì))優(yōu)化算法通過計(jì)算梯度的一階矩估計(jì)和二階矩估計(jì)為不同的參數(shù)設(shè)計(jì)獨(dú)立的自適應(yīng)性學(xué)習(xí)率[19],Adam 算法有很高的計(jì)算效率和較低的內(nèi)存需求。同時(shí),針對(duì)電壓數(shù)據(jù)全正的特性,可以進(jìn)一步采用零均值化優(yōu)化[20],使網(wǎng)絡(luò)參數(shù)的更新方向不再僅決定于梯度的符號(hào),可在一定程度上加速神經(jīng)網(wǎng)絡(luò)迭代收斂速度,從而提高效率。
TensorFlow[21]是目前使用廣泛的深度學(xué)習(xí)框架之一,可簡(jiǎn)化深層神經(jīng)網(wǎng)絡(luò)的構(gòu)造過程,在一個(gè)非均勻分布的計(jì)算環(huán)境下加速學(xué)習(xí)過程,有助于大規(guī)模求逆問題和局部差分求解。TensorFlow采用數(shù)據(jù)流圖來表示和組織計(jì)算,在TensorFlow 框架上部署B(yǎng)P 可顯著加速求解過程,提高運(yùn)行效率。
本文提出一種基于TensorFlow 框架的改進(jìn)BP 戶變關(guān)系識(shí)別方法,旨在從電壓數(shù)據(jù)層面挖掘潛在的戶變關(guān)系。通過基于形態(tài)相似指標(biāo)的K-means 算法對(duì)歷史用戶電壓數(shù)據(jù)形態(tài)聚類,將各類簇與其所對(duì)應(yīng)的變壓器相別匹配,添加類別標(biāo)簽構(gòu)建BP 的電壓數(shù)據(jù)訓(xùn)練樣本;在TensorFlow框架上實(shí)現(xiàn)零均值優(yōu)化和Adam 優(yōu)化對(duì)BP 改進(jìn),通過對(duì)部分訓(xùn)練樣本學(xué)習(xí),進(jìn)而對(duì)當(dāng)前的用戶日電壓曲線進(jìn)行分類,識(shí)別所屬變壓器和相別。
典型的低壓配電系統(tǒng)變壓器和用戶連接關(guān)系如圖1 所示。10 kV 等級(jí)線路經(jīng)過接入的10/0.4 kV 配電變壓器降壓到380 V,配電變壓器的低壓出口相分別連接到各個(gè)用戶,三相負(fù)荷總體平衡,一個(gè)供電臺(tái)區(qū)根據(jù)負(fù)荷的大小可能有多個(gè)配電變壓器供電。
由圖1 可知,戶變關(guān)系由用戶和變壓器的連接關(guān)系唯一確定。圖2 為相同戶變關(guān)系的變壓器-用戶連接等效電路圖,設(shè)變壓器出口相電壓為u0,則用戶n 的電壓un可表示為:
圖1 變壓器和用戶連接關(guān)系示意圖
圖2 同一變壓器出口相線上等效電路
式中:Z0為變壓器至用戶的線路阻抗(R0和X0分別為電阻和電抗);Zn為用戶等效阻抗(Rn和Xn分別為等效電阻和等效電抗)。
相對(duì)于高壓和特高壓輸電線路,低壓配電線路的電抗參數(shù)遠(yuǎn)小于電阻參數(shù),即R0?X0,Rn?Xn,故式(1)可進(jìn)一步表示成:
根據(jù)式(2),同一變壓器出口相線上各用戶之間的電壓近似線性關(guān)系,具有相同的變化趨勢(shì)。
圖3 展示了某小區(qū)2 個(gè)供電臺(tái)區(qū)A 相10 個(gè)用戶電壓數(shù)據(jù),數(shù)據(jù)采集間隔為30 min,可以明顯看到同一供電臺(tái)區(qū)、同一相線上的電壓數(shù)據(jù)變化趨勢(shì)相同,而不同臺(tái)區(qū)間電壓數(shù)據(jù)變化趨勢(shì)沒有較強(qiáng)的相關(guān)性。因此,通過分析電壓數(shù)據(jù)的變化趨勢(shì)、形態(tài)相似性等特征,可以挖掘出對(duì)應(yīng)的戶變從屬關(guān)系。
圖3 電壓數(shù)據(jù)的時(shí)間相關(guān)性
BP 算法具有較強(qiáng)的模式識(shí)別能力,但需要大量訓(xùn)練樣本的支持。為了能對(duì)各個(gè)變壓器所連接的所有用戶進(jìn)行區(qū)分,首先對(duì)部分歷史數(shù)據(jù)聚類,由聚類結(jié)果匹配變壓器相序,從而構(gòu)建出BP算法的訓(xùn)練樣本。
聚類算法大多以ED(歐式距離)為相似性指標(biāo)對(duì)數(shù)據(jù)向量進(jìn)行聚類[22-25]。然而,隨著配電線路長度不同,變壓器與用戶間的阻抗大小不同,變壓器出口電壓值與用戶電壓數(shù)據(jù)存在偏差,而電壓數(shù)值的高低變化和增減趨勢(shì)卻十分一致。提出一種基于Spearman 形態(tài)相似性指標(biāo)的K-means聚類算法,對(duì)用戶歷史日電壓數(shù)據(jù)進(jìn)行形態(tài)相似性聚類,并對(duì)類簇匹配變壓器及相別,為分類算法提供訓(xùn)練樣本。
Spearman 相關(guān)系數(shù)是統(tǒng)計(jì)學(xué)中利用單調(diào)方程評(píng)價(jià)兩個(gè)統(tǒng)計(jì)變量的相關(guān)性指標(biāo),表示兩個(gè)獨(dú)立變量的相關(guān)方向,Spearman 系數(shù)表明獨(dú)立變量X 和依賴變量Y 的相關(guān)方向。若當(dāng)X 增加時(shí),Y趨向于增加,則Spearman 系數(shù)為正;若當(dāng)X 增加時(shí),Y 趨向于減少,則Spearman 系數(shù)為負(fù)。Spearman 系數(shù)為零,表明當(dāng)X 變化時(shí)Y 沒有任何趨向性。當(dāng)X 和Y 越接近完全的單調(diào)相關(guān)時(shí),Spearman 系數(shù)的絕對(duì)值會(huì)增大;X 和Y 完全單調(diào)相關(guān)時(shí),Spearman 系數(shù)的絕對(duì)值為1。其計(jì)算公式為:
式中:ρ 表示任意兩向量間的Spearman 系數(shù);D為向量維度;dt為兩向量中元素排序差分集合。
K-means 聚類具有對(duì)少量數(shù)據(jù)聚類收斂速度快、聚類復(fù)雜度低及可擴(kuò)展性好的優(yōu)點(diǎn),通常以ED 作為樣本間相似性評(píng)價(jià)指標(biāo)來進(jìn)行簇中心初始化、簇劃分、簇中心點(diǎn)更新與收斂判斷。本文將處于同時(shí)刻具有相同上升或下降趨勢(shì)的用戶日電壓曲線分為同一類別,以Spearman 互相關(guān)系數(shù)作為相似性評(píng)價(jià)指標(biāo),代替ED 對(duì)用戶歷史電壓曲線進(jìn)行聚類,具體步驟如下:
(1)步驟1:簇中心初始化。為防止初始類簇中心隨機(jī)選取存在偏差,將各變壓器出口電壓曲線作為初始類中心M={M1,M2,…,MK}。
(2)步驟2:簇劃分。按照式(3)計(jì)算每個(gè)用戶日電壓曲線與類中心的Spearman 互相關(guān)系數(shù),并將各對(duì)象分配給相似性更高的類中心,形成K個(gè)類簇。
(3)步驟3:簇中心點(diǎn)更新。按照式(4)計(jì)算各類簇中每個(gè)電壓曲線與其所在類內(nèi)所有數(shù)據(jù)向量的相似度之和,選取與類內(nèi)其他所有數(shù)據(jù)向量相似度最高的電壓曲線作為類簇中心。
注:ρ∑為某一電壓曲線與其所在類所有數(shù)據(jù)向量相似度之和;N 為該類向量個(gè)數(shù)。
(4)重復(fù)步驟2、步驟3,直到類簇中心不在發(fā)生變化或達(dá)到最大迭代次數(shù)時(shí)結(jié)束。
TensorFlow 是谷歌公司于2015 年11 月開源的深度學(xué)習(xí)框架,同時(shí)也是目前廣泛應(yīng)用的跨平臺(tái)框架,它既是一個(gè)實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法的接口,也是執(zhí)行機(jī)器學(xué)習(xí)算法的框架。該框架具有快速、靈活、易于開發(fā)等特點(diǎn),適合大規(guī)模數(shù)據(jù)應(yīng)用。
TensorFlow 計(jì)算圖示例如圖4 所示,Tensor-Flow 以計(jì)算圖作為框架的基本計(jì)算節(jié)點(diǎn),計(jì)算圖描述了網(wǎng)絡(luò)數(shù)據(jù)的計(jì)算流程,并負(fù)責(zé)維護(hù)和更新節(jié)點(diǎn)狀態(tài)。
圖4 TensorFlow 計(jì)算圖模型
考慮到工程實(shí)用性與編寫程序的簡(jiǎn)易性,本文在TensorFlow 框架上對(duì)BP 算法加以改進(jìn),通過對(duì)歷史形態(tài)相似性聚類樣本學(xué)習(xí),進(jìn)而實(shí)現(xiàn)對(duì)臺(tái)戶關(guān)系的辨識(shí)。
BP 模型結(jié)構(gòu)包含輸入層、隱藏層和輸出層,其典型結(jié)構(gòu)如圖5 所示。
圖5 BP 典型結(jié)構(gòu)
BP 訓(xùn)練流程由前向傳播和反向傳播兩個(gè)過程組成,前向傳播將輸入數(shù)據(jù)X={x1,x2,…,xn}通過各層網(wǎng)絡(luò)計(jì)算得到一個(gè)輸出值(預(yù)測(cè)值)Y={y1,y2,…,yn},其計(jì)算公式為:
式中:W={w11,w12,…,wij}為各個(gè)節(jié)點(diǎn)的連接權(quán)值矩陣;b={b1,b2,…,bj}為偏置矩陣;g 為激活函數(shù),一般取Sigmod。
反向傳播過程利用損失函數(shù)loss 計(jì)算輸出值Y 與目標(biāo)值Y_之間的損失值J,當(dāng)J=loss(Y,Y_)時(shí),根據(jù)神經(jīng)網(wǎng)絡(luò)的具體目的選擇網(wǎng)絡(luò)優(yōu)化函數(shù)作為模型優(yōu)化器,優(yōu)化器根據(jù)損失值來更新網(wǎng)絡(luò)參數(shù)W 和b,使模型參數(shù)向著損失值減小的方向更新?;赥ensorFlow 的神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程如圖6 所示。
圖6 TensorFlow 神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程
3.3.1 零均值化
鑒于輸入電壓數(shù)據(jù)具有全正的特性,可通過對(duì)輸入數(shù)據(jù)進(jìn)行零均值化處理,得到以0 為中心的標(biāo)準(zhǔn)化輸入數(shù)據(jù),進(jìn)而加速網(wǎng)絡(luò)收斂速度。零均值化過程如下:
(2)采用boardcast 方法相減,也就是先將Vmean擴(kuò)充到與V 相同規(guī)模,再進(jìn)行數(shù)據(jù)相減,按照公式(7)計(jì)算。
式中:V,Vmean,Vcent分別表示輸入日電壓向量矩陣、平均值、零均值矩陣。
3.3.2 Adam 優(yōu)化方法
傳統(tǒng)BP 使用各參數(shù)的梯度負(fù)值乘以固定學(xué)習(xí)率來優(yōu)化網(wǎng)絡(luò)參數(shù),這種方法實(shí)現(xiàn)簡(jiǎn)單,但是容易收斂到局部最小值點(diǎn),并且在處理大型數(shù)據(jù)集時(shí)速度較慢。本文使用Adam 優(yōu)化方法作為改進(jìn)BP 的優(yōu)化器。Adam 方法利用梯度的一階矩估計(jì)和二階矩估計(jì)動(dòng)態(tài)調(diào)整每個(gè)參數(shù)的更新步長,計(jì)算公式見式(8)—(10)。
式中:gt表示第t 時(shí)間步的梯度值;μ 為指數(shù)衰減率,控制梯度權(quán)重分配,一般取0.9;v 為指數(shù)衰減率,控制梯度平放權(quán)重分配,一般取0.999;分別是對(duì)梯度的一階矩估計(jì)和二階矩估計(jì);是對(duì)mt,nt的校正。
最終網(wǎng)絡(luò)參數(shù)更新公式為:
基于TensorFlow 框架的改進(jìn)BP 戶變關(guān)系識(shí)別算法流程如圖7 所示,主要步驟如下:
圖7 戶變關(guān)系識(shí)別流程
(1)用戶日電壓數(shù)據(jù)預(yù)處理:刪除包含空缺值的用戶日電壓數(shù)據(jù),并按照式(12)對(duì)各條曲線進(jìn)行歸一化處理。
式中:vt,,vmin,vmax分別表示日電壓曲線任意時(shí)刻t 的電壓值、t 時(shí)刻歸一化后電壓值、日最小電壓值和日最大電壓值。
(2)歷史用戶日電壓曲線聚類:對(duì)部分歷史日電壓數(shù)據(jù)進(jìn)行K-means 聚類,以Spearman 系數(shù)為相似性指標(biāo)代替ED,聚類數(shù)K 值選擇所有變壓器的總相別數(shù),初始聚類中心選擇各變壓器相別出口日電壓曲線,防止初始聚類中心由于隨機(jī)選取導(dǎo)致的聚類效果變差。
(3)日電壓類別匹配:將聚類結(jié)果與各變壓器相別按照形態(tài)相似度進(jìn)行匹配,將匹配結(jié)果的類簇作為BP 的日電壓曲線訓(xùn)練樣本。
(4)零均值化處理:對(duì)日電壓數(shù)據(jù)按照式(6)和式(7)進(jìn)行零均值化處理。
(5)Adam 方法優(yōu)化的BP 對(duì)訓(xùn)練樣本進(jìn)行學(xué)習(xí),通過正向傳播和反向傳播過程不斷調(diào)整網(wǎng)絡(luò)參數(shù)。
(6)通過BP 正向傳播過程對(duì)輸入的用戶日電壓曲線進(jìn)行變壓器相別類型識(shí)別。
本文算例在TensorFlow 1.12 上實(shí)現(xiàn),實(shí)驗(yàn)數(shù)據(jù)為模擬10 類用戶日電壓數(shù)據(jù)和某試驗(yàn)區(qū)實(shí)際10 個(gè)變壓器各3 個(gè)相別的總共446 個(gè)用戶電壓數(shù)據(jù),通過國網(wǎng)用戶信息采集系統(tǒng)每15 min 同步讀取智能電表的電壓數(shù)據(jù),日電壓曲線采樣96個(gè)數(shù)據(jù)點(diǎn)。
由于用戶電壓隨所連接變壓器出口電壓的高低而波動(dòng),具有一定的隨機(jī)性,所以模擬數(shù)據(jù)不是簡(jiǎn)單的單峰和雙峰曲線,而是[0,1]之間變化隨機(jī)的96 維數(shù)據(jù),并在各類模擬日電壓數(shù)據(jù)中添加10%的噪聲曲線,防止神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程的“過擬合”現(xiàn)象。算例模擬數(shù)據(jù)和實(shí)際數(shù)據(jù)的基本信息如表1 所示。
表1 算例數(shù)據(jù)基本信息
模擬數(shù)據(jù)集是隨機(jī)生成的10 類具有趨勢(shì)差異性的96 維日電壓曲線,每種類型的日電壓曲線為200 條,并在其中添加10%的噪聲曲線。假設(shè)訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)的比例為1:1,分別設(shè)置聚類相似性指標(biāo)為ED 或Spearman 相關(guān)系數(shù)、分類算法為傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)或改進(jìn)BP 神經(jīng)網(wǎng)絡(luò),得到不同類型的組合。對(duì)比各種情況下模擬用戶日電壓曲線的識(shí)別正確率如表2 所示,采用“Kmeans(Spearman)+改進(jìn)BP 算法”對(duì)模擬曲線的識(shí)別結(jié)果如圖8 所示(此處僅例舉4 種類型日電壓曲線),所列出實(shí)驗(yàn)結(jié)果均為5 次實(shí)驗(yàn)取平均值。
表2 模擬用戶日電壓曲線分類結(jié)果
可以看出,基于Spearman 相關(guān)系數(shù)和改進(jìn)BP 的訓(xùn)練迭代次數(shù)明顯少于傳統(tǒng)BP,同時(shí)提高了BP 分類精度。由4 臺(tái)變壓器A 相別識(shí)別結(jié)果可以看出,同一供電臺(tái)區(qū)和相別的電壓曲線具有較高的形態(tài)相似性,且由圖8(d)可知,同類型的電壓曲線之間距離相差較遠(yuǎn),但在微觀波動(dòng)上具有同升同降的特點(diǎn)。
圖8 模擬用戶日電壓曲線辨識(shí)結(jié)果
為測(cè)試本文所提“K-means(Spearman)+改進(jìn)BP 算法”的穩(wěn)定性,通過10 次實(shí)驗(yàn)記錄各類型電壓曲線數(shù)量,并與“K-means(ED)+傳統(tǒng)BP 算法”10 次實(shí)驗(yàn)的識(shí)別結(jié)果進(jìn)行對(duì)比。由圖9 可知,基于形態(tài)相似樣本提取的改進(jìn)BP 算法對(duì)于電壓曲線的類型辨識(shí)更穩(wěn)定。
圖9 算法穩(wěn)定性對(duì)比
K-means 聚類提取訓(xùn)練樣本的電壓曲線條數(shù)取總電壓條數(shù)的30%,并保證每個(gè)臺(tái)區(qū)的不同相別均能覆蓋至少100 條電壓曲線。在TensorFlow中訓(xùn)練BP 后,對(duì)剩下的70%數(shù)據(jù)進(jìn)行分類,由于實(shí)際數(shù)據(jù)已知所屬類別標(biāo)簽,因此,采用識(shí)別精度可客觀評(píng)價(jià)算法分類性能。與模擬數(shù)據(jù)分類的4 種算法對(duì)比類似,實(shí)際用戶日電壓曲線的識(shí)別精度率如表3 所示,所列出實(shí)驗(yàn)結(jié)果均為5 次實(shí)驗(yàn)取的平均值。
表3 實(shí)際用戶日電壓曲線識(shí)別結(jié)果
可以看出,本算法針對(duì)實(shí)際日電壓數(shù)據(jù)的迭代次數(shù)、識(shí)別精度均優(yōu)于模擬數(shù)據(jù)的識(shí)別效果,這是由于模擬數(shù)據(jù)的同臺(tái)區(qū)電壓數(shù)據(jù)之間加入了較大幅度的噪聲數(shù)據(jù),而實(shí)際的同臺(tái)區(qū)用戶電壓數(shù)據(jù)之間趨勢(shì)差異性較弱。采用“K-means(Spearman)+改進(jìn)BP 算法”對(duì)實(shí)際用戶電壓曲線的識(shí)別結(jié)果見圖10(僅例舉4 種類型臺(tái)區(qū)用戶日電壓曲線),可以看出,結(jié)合形態(tài)相似性聚類提取訓(xùn)練樣本的改進(jìn)BP 算法對(duì)同臺(tái)區(qū)同相別的用戶電壓數(shù)據(jù)具有顯著的識(shí)別效果,識(shí)別出的用戶電壓曲線形態(tài)趨勢(shì)保持高度一致,總體識(shí)別效果良好。
圖10 用戶日電壓曲線戶變關(guān)系識(shí)別結(jié)果
為了分析改進(jìn)BP 的計(jì)算效率,分別對(duì)比了無優(yōu)化、僅采用零均值優(yōu)化、僅采用Adam 優(yōu)化、結(jié)合零均值和Adam 優(yōu)化4 種方式在不同數(shù)據(jù)體量下的計(jì)算時(shí)間。采用實(shí)際的電壓數(shù)據(jù),按數(shù)據(jù)總量20%為間隔分5 組,每種優(yōu)化方法各測(cè)試5次,取計(jì)算時(shí)間平均值。圖11 為BP 優(yōu)化方法的計(jì)算效率對(duì)比。
圖11 BP 計(jì)算效率對(duì)比
由圖11 可知:當(dāng)數(shù)據(jù)量較小時(shí)(小于40%),Adam 優(yōu)化的效果不佳,零均值優(yōu)化的效果較好,總體上優(yōu)化后計(jì)算時(shí)間與無優(yōu)化的計(jì)算時(shí)間沒有明顯改變;隨著數(shù)據(jù)量增大(大于80%),無論是零均值優(yōu)化還是Adam 改進(jìn)后的BP,計(jì)算時(shí)間增長速度都較無優(yōu)化的BP 慢,結(jié)合零均值和Adam 優(yōu)化后的BP 計(jì)算耗時(shí)最短。這是由于BP網(wǎng)絡(luò)的迭代速度是限制計(jì)算效率提升的關(guān)鍵因素,在小數(shù)據(jù)量時(shí),BP 迭代次數(shù)較少,而Adam動(dòng)態(tài)調(diào)節(jié)參數(shù)迭代步長,增加了網(wǎng)絡(luò)參數(shù)大量計(jì)算步驟,由此帶來了額外的計(jì)算耗時(shí);零均值優(yōu)化則在數(shù)據(jù)預(yù)處理階段增加額外的計(jì)算耗時(shí)。當(dāng)數(shù)據(jù)量增大時(shí),BP 網(wǎng)絡(luò)的迭代次數(shù)顯著增加,Adam 優(yōu)化和零均值優(yōu)化帶來的額外計(jì)算耗時(shí)幾乎不變,優(yōu)化后的BP 網(wǎng)絡(luò)收斂速度更快,迭代次數(shù)顯著減小,因此優(yōu)化后的BP 計(jì)算效率顯著提升。
本文提出一種基于TensorFlow 框架的改進(jìn)BP 戶變關(guān)系識(shí)別方法,模擬數(shù)據(jù)和實(shí)際電壓數(shù)據(jù)測(cè)試表明:基于形態(tài)趨勢(shì)相似性對(duì)用戶日電壓曲線歸類,相比于以距離為相似性指標(biāo)劃分類別更適用于戶變關(guān)系識(shí)別,可有效提高訓(xùn)練樣本質(zhì)量,保證戶變識(shí)別算法的穩(wěn)定性;結(jié)合TensorFlow 框架,采用零均值化和Adam 優(yōu)化方法對(duì)BP 網(wǎng)絡(luò)進(jìn)行優(yōu)化,有效提高了網(wǎng)絡(luò)的收斂速度。
隨著智能電表對(duì)電壓采樣頻次的提高,用戶日電壓曲線的數(shù)據(jù)維度會(huì)越來越高,本文算法的數(shù)據(jù)維度僅為96 維,針對(duì)144 維、288 維等高維電壓數(shù)據(jù)的識(shí)別效果還需進(jìn)一步驗(yàn)證。