唐 捷,蔡永智,李其霖,劉斯亮,張勇軍,羿應(yīng)棋,黃向敏
(1. 廣東電網(wǎng)有限責(zé)任公司,廣東省 廣州市 510060;2. 廣東電網(wǎng)有限責(zé)任公司計(jì)量中心,廣東省 廣州市 510080;3. 智慧能源工程技術(shù)研究中心,華南理工大學(xué)電力學(xué)院,廣東省 廣州市 510641)
低壓配電臺(tái)區(qū)作為直面用戶供電的最后環(huán)節(jié),其運(yùn)維管理的智能化、精益化水平將直接影響客戶用電滿意度[1-2]。由于低壓臺(tái)區(qū)面廣、量大、變動(dòng)多,供電企業(yè)難以準(zhǔn)確掌握低壓用戶的供電相序信息,導(dǎo)致臺(tái)區(qū)線損異常、三相不平衡、低電壓等運(yùn)維管理問題難以有效解決[3-5],成為客戶投訴的焦點(diǎn)。因此,開展低壓用戶相序識(shí)別方法研究具有重要的工程意義和社會(huì)價(jià)值[6-7]。
針對(duì)此問題的解決方法主要包括人工排查法、信號(hào)辨識(shí)法與數(shù)據(jù)挖掘法。其中,人工排查法是指依靠電力員工現(xiàn)場(chǎng)使用相關(guān)識(shí)別設(shè)備進(jìn)行勘察,是目前電網(wǎng)公司獲取低壓用戶相序信息的主要方法,但其效率低下,且需要消耗大量的人力物力,經(jīng)濟(jì)效益極低。信號(hào)辨識(shí)法通過注入脈沖電流或載波電壓信號(hào),根據(jù)信號(hào)的收發(fā)情況辨識(shí)用戶供電相序[8-10]。其原理簡單、識(shí)別準(zhǔn)確,但需要額外加裝監(jiān)測(cè)終端或模塊,投資高、運(yùn)維壓力大,且信號(hào)發(fā)生電路可靠性差,在雷擊、浪涌環(huán)境下易損壞。
隨著高級(jí)量測(cè)體系逐漸建成與完善,智能電表多類型、高頻次、準(zhǔn)同步數(shù)據(jù)得以自動(dòng)采集獲?。?1]。由于電表電氣量是臺(tái)區(qū)潮流分布的關(guān)鍵狀態(tài)量,具備反映臺(tái)區(qū)網(wǎng)絡(luò)拓?fù)潢P(guān)系的特征。為此,大量學(xué)者開展數(shù)據(jù)挖掘法研究,主要可分為關(guān)聯(lián)分析法、模型擬合法和特征學(xué)習(xí)法三大類。
關(guān)聯(lián)分析法利用同相用戶電壓時(shí)序變化具有相關(guān)性的機(jī)理特征,通過設(shè)置相關(guān)系數(shù)閾值判據(jù),實(shí)現(xiàn)臺(tái)區(qū)相序關(guān)系自動(dòng)識(shí)別。文獻(xiàn)[12-13]通過比較電表與配電變壓器電壓時(shí)序的相關(guān)性,確定用戶相序關(guān)系。一般來說,關(guān)聯(lián)分析法依賴相關(guān)系數(shù)閾值設(shè)置,在不同臺(tái)區(qū)應(yīng)用時(shí)適應(yīng)性較弱。
模型擬合法通過最小化實(shí)際量測(cè)值與系統(tǒng)狀態(tài)誤差,擬合用戶相序關(guān)系。文獻(xiàn)[14-15]通過最小化臺(tái)區(qū)各相總功率及其下屬電表功率總和的偏差值,擬合各電表的相序歸屬關(guān)系。但是,除了線損外,實(shí)際臺(tái)區(qū)中還存在竊漏電等情況,導(dǎo)致臺(tái)區(qū)首末端功率偏差較大,將顯著影響識(shí)別準(zhǔn)確率。
特征學(xué)習(xí)法從數(shù)據(jù)本身出發(fā),通過挖掘臺(tái)區(qū)運(yùn)行數(shù)據(jù)與其拓?fù)浣Y(jié)構(gòu)的內(nèi)在關(guān)系,實(shí)現(xiàn)用戶相序關(guān)系自動(dòng)識(shí)別,其主要包括監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)算法。其中,以聚類為典型代表的無監(jiān)督學(xué)習(xí)算法不依賴正確的數(shù)據(jù)標(biāo)簽,實(shí)用性強(qiáng),近年來被廣泛應(yīng)用到相序識(shí)別問題中。文獻(xiàn)[16]提出了以皮爾遜相關(guān)系數(shù)、L1/L2范數(shù)為相似性量度指標(biāo)的K-means 聚類算法對(duì)用戶電壓曲線進(jìn)行分類,進(jìn)而實(shí)現(xiàn)用戶相序識(shí)別。文獻(xiàn)[17]提出了一種帶約束的K-means 聚類算法進(jìn)行用戶相序識(shí)別。
在相序識(shí)別問題中,盡管三相表在數(shù)據(jù)采集過程中已標(biāo)定了相序,但由于接線不規(guī)范等問題廣泛存在標(biāo)定相序與真實(shí)相序不一致情況。若在相序識(shí)別過程中忽略三相表,將影響單相表相序識(shí)別的準(zhǔn)確率,進(jìn)而影響線損精益化管理、三相不平衡或低電壓等問題的精確治理。此外,當(dāng)三相表位于配變分支出線首端時(shí),由于其與配變母線電氣距離較近,在母線三相電壓不平衡度較小的情況下將導(dǎo)致三相表的三相電壓變化具有較高相似性,直接采用基于相似性量度的聚類方法會(huì)將其識(shí)別為同相電表,進(jìn)而影響識(shí)別準(zhǔn)確率。
針對(duì)當(dāng)前相序識(shí)別研究中較少考慮三相表的問題,本文提出了基于三相表特征約束聚類的低壓臺(tái)區(qū)用戶相序識(shí)別方法。首先,理論推導(dǎo)了用戶電壓的時(shí)序變化特性與關(guān)聯(lián)機(jī)理,為后續(xù)相序識(shí)別分析提供先驗(yàn)知識(shí);然后,對(duì)用戶電壓時(shí)序進(jìn)行特征標(biāo)準(zhǔn)化與降維處理,提出基于背景知識(shí)的嵌有快速收斂機(jī)制且考慮三相表特征約束的K-Medoids 半監(jiān)督聚類算法(CFK-Medoids)開展臺(tái)區(qū)相序識(shí)別。最后,通過實(shí)際數(shù)據(jù)計(jì)算分析,驗(yàn)證了所提方法的有效性與適用性。
本章通過推導(dǎo)低壓臺(tái)區(qū)節(jié)點(diǎn)電壓的計(jì)算公式,從理論上分析用戶電壓的時(shí)序特性。為了更好地掌握用戶電壓的時(shí)序特性,本文根據(jù)實(shí)際情況,在理論推導(dǎo)過程中進(jìn)行了相關(guān)簡化,包括:1)用戶下戶線一般較短,忽略其電壓損耗;2)臺(tái)區(qū)無功負(fù)荷較低,忽略電壓降落中的無功分量。圖1 給出了低壓臺(tái)區(qū)某一相線示意圖。
圖1 低壓臺(tái)區(qū)某一相線示意圖Fig.1 Schematic diagram of a certain phase line in lowvoltage distribution-station area
通過分析式(1)和式(2)可知,可總結(jié)用戶電壓時(shí)序特性及其與相序關(guān)聯(lián)關(guān)系:電表電壓受所在相配電變壓器低壓母線電壓、所在相線上游各支路傳輸功率總和以及上游各支路阻抗共同影響。對(duì)于同相電表而言,其電壓差異主要受后兩者影響。當(dāng)2 個(gè)同相電表處于同一出線,且兩者間的距離短、阻抗小、傳送功率較低時(shí)(即電氣距離較近),兩者電壓變化具有相似性。但隨著兩者電氣距離逐漸增大,其電壓變化相似性逐漸減弱。而對(duì)于異相電表而言,其電壓差異還受臺(tái)區(qū)三相電壓不平衡度影響,則異相電表電壓變化相似性明顯較低。基于上述分析,可總結(jié)以下先驗(yàn)知識(shí),為后續(xù)相序識(shí)別提供支撐。
先驗(yàn)知識(shí)1:同相且電氣距離相近的電表電壓變化相似性高,同相且電氣距離較遠(yuǎn)或異相電表電壓變化相似性低。因此,基于電壓相似性量度的聚類算法將有助于區(qū)分電表相序。
先驗(yàn)知識(shí)2:受負(fù)荷、線徑、線路長度等因素影響,同相電表電壓變化亦存在相似性較低情況。因此,聚類時(shí)應(yīng)充分考慮各聚類簇的簇內(nèi)緊湊度與簇間分離度。
先驗(yàn)知識(shí)3:在單相表相序識(shí)別時(shí)若不考慮三相表,由于三相表數(shù)據(jù)缺失,將導(dǎo)致同相電表群的電壓關(guān)聯(lián)性下降,進(jìn)而影響單相表識(shí)別準(zhǔn)確率。因此,相序識(shí)別時(shí)應(yīng)考慮三相表的影響。
為了有效挖掘不同用戶電壓時(shí)序變化特征的差異,進(jìn)而提高聚類效果,本章采用Z-Score 與t分布的隨機(jī)近鄰嵌入(t-SNE)算法對(duì)用戶電壓時(shí)序特征進(jìn)行標(biāo)準(zhǔn)化與降維處理。
特征降維指的是在保留原始數(shù)據(jù)主特征的前提下,將原始高維數(shù)據(jù)集壓縮至低維數(shù)據(jù)集的過程,其通過主特征提取,能夠減少原始序列噪聲對(duì)后續(xù)聚類準(zhǔn)確性的影響。特征降維方法主要可分為線性降維與非線性降維兩大類。其中,非線性降維對(duì)原始序列分布特性保真能力較好。t-SNE算法是一種基于概率分布嵌入的非線性降維算法,降維效果好,應(yīng)用較為廣泛[18-19]。
t-SNE 算法的基本思想為:基于高斯分布函數(shù)將高維數(shù)據(jù)點(diǎn)之間的歐氏距離轉(zhuǎn)化為聯(lián)合概率,構(gòu)建高維空間的概率分布;再基于t分布函數(shù)計(jì)算低維空間數(shù)據(jù)點(diǎn)之間的歐氏距離,并將其轉(zhuǎn)化為聯(lián)合概率,構(gòu)建低維空間的概率分布;最后計(jì)算高、低維概率分布之間的Kullback-Leibler(KL)散度,其值越低,表明高、低維空間的概率分布越相似,將其作為目標(biāo)函數(shù),使用梯度下降法進(jìn)行迭代求解,直至尋找到使KL 散度最小的原始數(shù)據(jù)集的低維表示,即可得到降維后的數(shù)據(jù)集。
t-SNE 算法的具體步驟如下。
基于高斯分布函數(shù)計(jì)算高維空間數(shù)據(jù)之間的相似性概率pi|j與pj|i:
式中:xi和xj分別為高維空間中的任意2 個(gè)向量;δi和δj分別為以xi和xj為高斯分布中心的高斯模型方差。
聚類分析是指基于某種相似性量度,將具有相似特征的樣本聚為一簇,使得簇內(nèi)樣本的特征差異較小,而類間樣本的特征差異較大。常用的聚類算法包括劃分、層次、網(wǎng)格、密度、模型聚類等。
劃分聚類計(jì)算復(fù)雜度低,對(duì)高維數(shù)據(jù)集的運(yùn)算相對(duì)高效,但需預(yù)設(shè)聚類數(shù);層次聚類采用樹狀結(jié)構(gòu)進(jìn)行逐層聚合,無須預(yù)設(shè)聚類數(shù)即可發(fā)現(xiàn)類的層次關(guān)系,但計(jì)算復(fù)雜度高,離群值點(diǎn)影響較大;網(wǎng)格聚類利用屬性空間的多維網(wǎng)格數(shù)據(jù)結(jié)構(gòu),將空間進(jìn)行塊劃分,其聚類的質(zhì)量和準(zhǔn)確性較低;密度聚類基于數(shù)據(jù)的分布密度,通過連接高密度區(qū)域?qū)崿F(xiàn)聚類,其無須預(yù)設(shè)聚類數(shù),但對(duì)參數(shù)的設(shè)置敏感且數(shù)據(jù)樣本越大收斂時(shí)間越長;模型聚類通過模型假定,尋找數(shù)據(jù)對(duì)假定模型的最佳擬合來實(shí)現(xiàn)聚類,當(dāng)數(shù)據(jù)的概率分布數(shù)較多且數(shù)據(jù)量較少時(shí)執(zhí)行效率不高。
基于先驗(yàn)知識(shí)1,采用基于電壓相似性量度的聚類算法有助于區(qū)分電表相序。結(jié)合3.1 節(jié)分析,由于本文研究問題的聚類場(chǎng)景數(shù)相對(duì)固定,可考慮采用對(duì)數(shù)據(jù)具有高效處理能力的劃分聚類算法進(jìn)行分析[20-22]。
基于先驗(yàn)知識(shí)2,聚類分析時(shí)應(yīng)充分考慮各聚類簇的簇內(nèi)緊湊度與簇間分離度,不能簡單地將聚類數(shù)設(shè)定為臺(tái)區(qū)相序數(shù)。因此,通過特定指標(biāo)評(píng)估聚類結(jié)果的優(yōu)劣,進(jìn)而判斷聚類數(shù)的設(shè)定是否合理。聚類有效性評(píng)估指標(biāo)包括2 類:一類是外部評(píng)價(jià)指標(biāo),其將聚類結(jié)果與參考模型進(jìn)行比對(duì),判斷聚類效果的優(yōu)劣;另一類是內(nèi)部評(píng)價(jià)指標(biāo),針對(duì)聚類結(jié)果的數(shù)據(jù)分布情況,從緊致性、分離性和連通性等方面對(duì)聚類結(jié)果進(jìn)行評(píng)價(jià)。內(nèi)部評(píng)價(jià)指標(biāo)不依賴于參考模型,更適合本文研究的問題,因此本文選取內(nèi)部評(píng)價(jià)指標(biāo)作為聚類有效性評(píng)價(jià)指標(biāo)。戴維森堡丁指數(shù)(Davies-Bouldin index,DBI)是最為常用的聚類有效性內(nèi)部評(píng)價(jià)指標(biāo)[23],其計(jì)算公式如下:
式中:mi和mj分別為聚類簇Ci和Cj的電表個(gè)數(shù);μi和μj分別為聚類收斂后聚類簇Ci和Cj的聚類中心電壓特征向量;d(·)為距離函數(shù),一般采用歐氏距離作為距離量度。
基于先驗(yàn)知識(shí)3,相序識(shí)別時(shí)應(yīng)充分考慮三相表影響。目前大多數(shù)文獻(xiàn)主要針對(duì)單相表開展相序識(shí)別,尚未考慮三相表對(duì)相序識(shí)別的影響[14-17]。在實(shí)際情況中,臺(tái)區(qū)既包含單相表也包含三相表。盡管目前三相表相序可直接獲取,但由于現(xiàn)場(chǎng)施工、管理不規(guī)范等問題,導(dǎo)致三相表存在錯(cuò)相接線,即其相序信息并非對(duì)應(yīng)系統(tǒng)真實(shí)的供電相序。因此,在對(duì)臺(tái)區(qū)用戶開展相序識(shí)別時(shí),若僅考慮單相表相序識(shí)別,一方面無法辨識(shí)三相表錯(cuò)相接線問題,進(jìn)而導(dǎo)致臺(tái)區(qū)三相不平衡,影響線損分析的準(zhǔn)確性;另一方面,當(dāng)臺(tái)區(qū)三相表比例較高時(shí),將影響單相表相序識(shí)別的準(zhǔn)確性。
當(dāng)考慮三相表開展相序識(shí)別時(shí),還需引入描述三相表特征的背景知識(shí),即同一塊三相表所等效的三塊單相表應(yīng)歸屬于不同相序。因此,本節(jié)在聚類算法中引入了Cannot-link 成對(duì)約束,其規(guī)定了成對(duì)實(shí)例必須在不同簇中,符合三相表特征。文獻(xiàn)[24-25]將Must-link 和Cannot-link 成對(duì)約束引入Kmeans 聚類算法中,提出帶約束的K-means 聚類算法,在三相電表數(shù)量占比較高的臺(tái)區(qū)上展現(xiàn)出了一定效果。然而,K-means 算法對(duì)數(shù)據(jù)噪聲和離群點(diǎn)較為敏感,這類異常數(shù)據(jù)易使聚類中心偏離理想位置,導(dǎo)致算法準(zhǔn)確率下降。
綜上所述,本文采用K-Medoids 算法替代Kmeans 算法,并引入快速收斂機(jī)制,提出了CFKMedoids 聚類算法開展低壓臺(tái)區(qū)用戶相序識(shí)別。其中,快速收斂機(jī)制將聚類中心點(diǎn)的替換范圍限制在簇內(nèi)部,即在每個(gè)簇中尋找到一個(gè)新的中心點(diǎn),這個(gè)中心點(diǎn)與簇中其他對(duì)象之間的距離總和最小。該方法只需要計(jì)算一次簇內(nèi)的距離矩陣,避免了傳統(tǒng)KMedoids 算法每次迭代中的全局最優(yōu)搜索過程,顯著提升了算法收斂速度,并且其與傳統(tǒng)算法計(jì)算所得的聚類中心偏差不大,在精度范圍內(nèi)能夠有效提升算法計(jì)算效率[26]。算法計(jì)算流程圖如附錄A 圖A1 所示,具體步驟可描述如下:
步驟1:輸入目標(biāo)臺(tái)區(qū)用戶原始電壓時(shí)序X=[X1,X2,…,Xi,…,Xn],其中Xi=[xi1,xi2,…,xiT]T,對(duì)X進(jìn)行Z-Score 標(biāo)準(zhǔn)化和t-SNE 降維,得到用戶電壓特征向量Y。
步驟2:依次設(shè)定聚類數(shù)K=1,2,…,M,采用CFK-Medoids 進(jìn)行聚類計(jì)算。
步驟3:根據(jù)式(11)計(jì)算各用戶電表電壓特征向量在特征空間中的相對(duì)距離系數(shù)vj,升序排列并選擇前K個(gè)用戶電表的電壓特征向量作為初始聚類中心η1(1),η2(1),…,ηK(1),也稱為代表對(duì)象,其余數(shù)據(jù)稱為非代表對(duì)象。
步驟4:基于歐氏距離分別計(jì)算各電表電壓特征向量到K個(gè)聚類中心的距離,基于最小距離原則,將各電表分配給距離其最近的聚類中心所屬的簇。
步驟5:檢驗(yàn)各聚類簇中的電表元素是否違反Cannot-link 約束。若是,則將該電表分配到其次近的簇中,并再次檢驗(yàn)直至滿足約束。
步驟8:若S′i(N)小于Si(N),則令Si(N)=S′i(N),且令yi為新的聚類中心。
步驟9:重復(fù)步驟6、7,直至遍歷所有的非代表對(duì)象。
步驟10:重復(fù)步驟3 至步驟8,直至K個(gè)聚類中心不再發(fā)生變化。
步驟11:基于當(dāng)前聚類結(jié)果計(jì)算DBI,重復(fù)步驟2 至步驟11,直至完成各聚類數(shù)設(shè)定情況下的聚類分析。
步驟12:選取λDBI最小值對(duì)應(yīng)K作為最佳聚類數(shù),分別計(jì)算K個(gè)聚類簇的聚類中心與配電變壓器低壓側(cè)母線三相電壓時(shí)序的歐氏距離,歐氏距離最小的即為當(dāng)前聚類的相序。
本文選取中國廣東省某地市3 個(gè)臺(tái)區(qū)實(shí)際數(shù)據(jù)作為分析樣本,對(duì)所提方法的有效性進(jìn)行驗(yàn)證。3 個(gè)實(shí)際臺(tái)區(qū)的基礎(chǔ)參數(shù)如表1 所示。
表1 實(shí)際臺(tái)區(qū)基礎(chǔ)參數(shù)Table 1 Basic parameter of real distribution-station area
各臺(tái)區(qū)數(shù)據(jù)集均由配電變壓器低壓側(cè)母線及所有用戶智能電表電壓時(shí)序數(shù)據(jù)組成。其中,臺(tái)區(qū)1電壓時(shí)序數(shù)據(jù)長度為3 d,頻次為15 min/次,共計(jì)288 個(gè)時(shí)刻;臺(tái)區(qū)2 電壓時(shí)序數(shù)據(jù)長度為2 d,頻次為15 min/次,共計(jì)192 個(gè)時(shí)刻;臺(tái)區(qū)3 電壓時(shí)序數(shù)據(jù)長度為12 d,頻次為60 min/次,共計(jì)288 個(gè)時(shí)刻。
本文算例中3 個(gè)臺(tái)區(qū)的所有電表均已通過人工現(xiàn)場(chǎng)勘察結(jié)合相關(guān)識(shí)別設(shè)備檢測(cè)獲取其正確相位標(biāo)簽,本文所提算法的識(shí)別準(zhǔn)確率均是以人工現(xiàn)場(chǎng)識(shí)別結(jié)果為基準(zhǔn)計(jì)算得出的。
為驗(yàn)證所提方法的準(zhǔn)確性,本文設(shè)置了多種方法對(duì)照:1)方法1 為基于主成分分析(principal component analysis,PCA)降維的CFK-Medoids 聚類方法;2)方法2 為基于t-SNE 降維的平衡迭代規(guī)約 層 次 聚 類(balanced iterative reducing and clustering using hierarchies,BIRCH)方法[27];3)方法3 為基于t-SNE 降維的快速K 中心點(diǎn)聚類(fast KMedoids,FK-Medoids)方法,其考慮聚類的快速收斂機(jī)制,但不考慮三相表特征約束;4)方法4 為本文所提方法;5)方法5 為基于t-SNE 降維的約束K 中心點(diǎn)聚類(constrained K-Medoids,CK-Medoids)方法,其考慮三相表特征約束,但不考慮聚類的快速收斂機(jī)制。
為體現(xiàn)t-SNE 降維的有效性,本節(jié)分別采用方法1與方法4在臺(tái)區(qū)1至3中進(jìn)行了仿真計(jì)算。附錄A圖A2 至圖A4 給出了方法1 在臺(tái)區(qū)1 至3 中的可視化識(shí)別結(jié)果,圖2 至圖4 給出了方法4 在臺(tái)區(qū)1 至3中的可視化識(shí)別結(jié)果。表2 給出了方法1、方法4 在臺(tái)區(qū)1 至3 中的相序識(shí)別準(zhǔn)確率。
表2 方法1 和方法4 的相序識(shí)別準(zhǔn)確率對(duì)比Table 2 Comparison of phase sequence identification accuracy between method 1 and method 4
圖2 方法4 在臺(tái)區(qū)1 中的可視化識(shí)別結(jié)果Fig.2 Visual identification result of method 4 in distribution-station area 1
對(duì)比圖2 至圖4 與附錄A 圖A2 至圖A4 可知,方法4 下各聚類簇在低維特征空間中的分布差異度更為顯著,即相較于PCA 降維方法,t-SNE 算法能夠更為有效地保留原始序列的主要特征,更好地將高維空間中的數(shù)據(jù)分布特性在低維空間中表示,進(jìn)而有助于提高相序識(shí)別的準(zhǔn)確率。
圖4 方法4 在臺(tái)區(qū)3 中的可視化識(shí)別結(jié)果Fig.4 Visual identification result of method 4 in distribution-station area 3
為體現(xiàn)考慮三相表特征約束的必要性,本節(jié)分別采用方法2、3 與4 在臺(tái)區(qū)1、2 中進(jìn)行仿真計(jì)算。其中,方法2、3 均未考慮三相表特征約束。附錄A圖A5 和圖A6 給出了方法2 在臺(tái)區(qū)1、2 中的可視化識(shí)別結(jié)果,附錄A 圖A7 和圖A8 給出了方法3 在臺(tái)區(qū)1、2 中的可視化識(shí)別結(jié)果。表3 給出了方法2 至4在臺(tái)區(qū)1、2 中的識(shí)別準(zhǔn)確率。
表3 方法2 至4 的相序識(shí)別準(zhǔn)確率對(duì)比Table 3 Comparison of phase sequence identification accuracy of methods 2-4
分析表3 可知,在臺(tái)區(qū)1 中,相較于方法4,方法2、3 的識(shí)別準(zhǔn)確率較低。其中相序識(shí)別錯(cuò)誤的電表均為三相表,具體表現(xiàn)為A、C 相電表被錯(cuò)誤識(shí)別為B 相,違反了來自同一三相表中的3 個(gè)單相表不能連接到同一相序的背景知識(shí)。這是由于臺(tái)區(qū)1 中三相表分布在靠近配電變壓器低壓側(cè)分支出線首端,其電氣距離相近,導(dǎo)致其等效三塊單相表的電壓時(shí)序變化較為相似,進(jìn)而聚類時(shí)會(huì)將其聚為一類。而方法4 通過引入三相表特征約束,識(shí)別準(zhǔn)確率均可達(dá)100%。此外,在臺(tái)區(qū)2 中,由圖3 和表3 結(jié)果可知,方法4 通過添加Cannot-link 約束,識(shí)別準(zhǔn)確率較方法2、3 分別提升了11.49%、9.77%,說明三相表特征約束的考慮能夠有效提升識(shí)別準(zhǔn)確率。
從水的實(shí)際用途進(jìn)行歸類,水的使用大致可以分為自然使用和人為使用,自然使用主要包括生活飲用水、家禽用水和家庭用水,相關(guān)用水權(quán)利是一種絕對(duì)權(quán)利。人為使用主要體現(xiàn)為水用來進(jìn)行發(fā)電、生產(chǎn)和休閑,相關(guān)用水權(quán)利通常不是絕對(duì)權(quán)利。如果自然使用和人為使用存在沖突,如何合理分配水權(quán)呢?通常,人們認(rèn)為自然使用優(yōu)于人為使用。問題是,當(dāng)水資源能夠滿足自然使用需求,但是無法滿足各種人為使用需求時(shí),如何在用水需求相互競(jìng)爭的用水人之間分配有限的水資源?
圖3 方法4 在臺(tái)區(qū)2 中的可視化識(shí)別結(jié)果Fig.3 Visual identification result of method 4 in distribution-station area 2
為進(jìn)一步說明考慮三相表的必要性,采用方法2、4 在臺(tái)區(qū)3 進(jìn)行仿真計(jì)算。其中,方法2 假定三相表相序標(biāo)定,僅考慮單相表相序識(shí)別。附錄A 圖A9給出了三相表未參與情況下方法2 在臺(tái)區(qū)3 上的可視化識(shí)別結(jié)果。通過統(tǒng)計(jì)可知,未考慮三相表時(shí),方法2 在臺(tái)區(qū)3 上的單相表相序識(shí)別準(zhǔn)確率僅有57.14%,相較于方法4,相序識(shí)別準(zhǔn)確率下降了42.86%。結(jié)合附錄A 圖A9 可知,由于臺(tái)區(qū)3 屬于城鄉(xiāng)結(jié)合部類型臺(tái)區(qū),其三相表報(bào)裝占比高,若因三相表相序標(biāo)定而不考慮參與相序識(shí)別,則會(huì)顯著降低同相電表群的電壓關(guān)聯(lián)特性,導(dǎo)致特征空間中聚類可行性差,易導(dǎo)致聚類錯(cuò)誤,進(jìn)而劣化識(shí)別準(zhǔn)確率。
此外,通過考慮三相表及其特征約束,本文所提方法能夠有效辨識(shí)三相表不規(guī)范接線問題,如附錄A 表A1 至表A3 所示。三相表不規(guī)范接線的有效辨識(shí)能夠?yàn)榕_(tái)區(qū)線損精益化管理、三相不平衡與低電壓問題精準(zhǔn)治理提供支撐。
為驗(yàn)證本文所提CFK-Medoids 聚類算法中初始聚類中心選取方法以及快速收斂機(jī)制的有效性,采用方法4、5 在臺(tái)區(qū)1 至3 中進(jìn)行了仿真計(jì)算。其中方法5 采用隨機(jī)初始化聚類中心點(diǎn)、全局尋優(yōu)更新中心點(diǎn)的方式。表4 給出了方法4、5 的計(jì)算時(shí)間。
表4 方法4、5 的計(jì)算時(shí)間對(duì)比Table 4 Comparison of calculation time between methods 4,5
分析表4 可知,相較于方法5,方法4 在臺(tái)區(qū)1 至3 的計(jì)算時(shí)間分別減少了約53.3%、53%與90.2%,說明了聚類快速收斂機(jī)制的引入能夠顯著提升計(jì)算時(shí)效,且隨著臺(tái)區(qū)用戶規(guī)模增加,提升效果更為顯著。附錄A 圖A10 給出了方法4 在各臺(tái)區(qū)應(yīng)用的迭代收斂過程,其中縱坐標(biāo)表示前后兩輪迭代各聚類中心點(diǎn)的歐氏距離,當(dāng)該值為0 時(shí),說明各中心點(diǎn)不再變化,算法收斂,從圖中可以看到在各臺(tái)區(qū)中算法的收斂次數(shù)均不高于5 次,收斂速度快。需要說明的是,方法4、5 在臺(tái)區(qū)1 至3 中的相序識(shí)別準(zhǔn)確率均為100%。因此,聚類快速收斂機(jī)制能夠有效兼顧相序識(shí)別的準(zhǔn)確性與時(shí)效性。
針對(duì)當(dāng)前低壓臺(tái)區(qū)用戶供電相序識(shí)別因缺乏考慮三相表導(dǎo)致識(shí)別不準(zhǔn)確問題,本文提出了基于三相表特征約束聚類的低壓臺(tái)區(qū)用戶相序識(shí)別方法,得到以下結(jié)論。
1)所提方法能夠保留原始數(shù)據(jù)在低維空間中的差異特征,有效提高了相序識(shí)別準(zhǔn)確率。
2)當(dāng)臺(tái)區(qū)三相表占比較高時(shí),若不考慮三相表及其特征約束,將顯著降低相序識(shí)別準(zhǔn)確率。通過引入三相表特征約束,能夠顯著提升相序識(shí)別準(zhǔn)確率,且能夠有效辨識(shí)三相表不規(guī)范接線問題,進(jìn)而為臺(tái)區(qū)線損精益化管理、三相不平衡與低電壓等問題的精準(zhǔn)治理提供支撐。
3)當(dāng)臺(tái)區(qū)三相表占比較高、用戶規(guī)模較大時(shí),采用聚類快速收斂機(jī)制能夠在保證識(shí)別準(zhǔn)確率的前提下,顯著提升相序識(shí)別的時(shí)效性。
本文所提相序識(shí)別方法依賴實(shí)際臺(tái)區(qū)數(shù)據(jù)質(zhì)量,下一階段將針對(duì)計(jì)及數(shù)據(jù)質(zhì)量問題的魯棒相序識(shí)別方法展開研究。
本文受到廣東電網(wǎng)有限責(zé)任公司科技項(xiàng)目(GDKJXM20190385)支持,特此感謝!
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。