于建林 張虎林
(甘肅藍(lán)野建設(shè)監(jiān)理有限公司,甘肅 蘭州 743000)
輸電線路的線損由2 個(gè)部分構(gòu)成,其一是線路實(shí)際電能損耗,其二是計(jì)量誤差。線路實(shí)際損耗可通過理論計(jì)算來確認(rèn),如計(jì)算地線損耗、電暈損耗和電阻損耗[1]。計(jì)量誤差來自比值誤差、粗大數(shù)據(jù)誤差和相角誤差等。然而,線路實(shí)際損耗的影響因素較復(fù)雜,部分損耗難以通過理論方法進(jìn)行計(jì)算,例如地形變化、線路老化、導(dǎo)線相序差異以及天氣因素等可造成一定的線損,但相關(guān)數(shù)據(jù)難以統(tǒng)計(jì)。理論計(jì)算方法能夠較準(zhǔn)確地反映出新投用線路的線損,隨著時(shí)間的延長,理論線損與實(shí)際線損的偏差會(huì)有所增大,根據(jù)現(xiàn)有的研究成果,該偏差可達(dá)5%~10%。因此,應(yīng)該改進(jìn)現(xiàn)有的線損計(jì)算方法。
2.1.1 數(shù)據(jù)知識(shí)融合
電阻、電暈和地線造成的損耗是線路實(shí)際電能損耗的主要來源,因此線損理論計(jì)算結(jié)果決定了線損的平均趨勢(shì)。非理論影響因素具有一定的隨機(jī)性,導(dǎo)致線損在理論計(jì)算平均趨勢(shì)的基礎(chǔ)上發(fā)生隨機(jī)波動(dòng)。數(shù)據(jù)知識(shí)融合要求在線損計(jì)算中合并理論影響因素和非理論影響因素,利用大數(shù)據(jù)生成隨時(shí)間變化的數(shù)據(jù)特征,融合過程如圖1所示。
圖1 數(shù)據(jù)知識(shí)融合路徑
2.1.2 BOA-GBDT 線損計(jì)算模型
梯度提升樹(Gradient Boosting Decision Tree,GBDT)屬于機(jī)器學(xué)習(xí)方法,由多個(gè)決策樹集成而來,用于數(shù)據(jù)分類或者回歸,可將GBDT 作為輸電線路線損計(jì)算的建?;A(chǔ)。貝葉斯優(yōu)化算法(Bayesian Optimization Algorithm,BOA)可用于優(yōu)化線損計(jì)算模型中的參數(shù)。該文研究融合了BOA 算法和GBDT 算法,構(gòu)建了BOAGBDT 算法模型,將經(jīng)過融合的輸電線路運(yùn)行數(shù)據(jù)作為BOA-GBDT 模型的輸入?yún)?shù),再經(jīng)過訓(xùn)練、優(yōu)化,形成更精確的線損計(jì)算模型,其實(shí)施過程如圖2所示。
圖2 BOA-GBDT 模型
2.2.1 數(shù)據(jù)來源
線路桿塔數(shù)據(jù)、氣象數(shù)據(jù)、電能數(shù)據(jù)以及潮流數(shù)據(jù)等構(gòu)成了輸電線路的主要運(yùn)行數(shù)據(jù),部分?jǐn)?shù)據(jù)與時(shí)間存在緊密的聯(lián)系,因此稱為時(shí)序數(shù)據(jù),典型的如電能數(shù)據(jù)。將輸電系統(tǒng)的真實(shí)運(yùn)行數(shù)據(jù)作為模型訓(xùn)練的數(shù)據(jù)來源,顯然,不同類型的數(shù)據(jù)在結(jié)構(gòu)上存在差異,需要進(jìn)行預(yù)處理,以便提高模型訓(xùn)練的效率。
2.2.2 數(shù)據(jù)預(yù)處理
2.2.2.1 提取日電量數(shù)據(jù)
電流互感器能夠計(jì)量輸電線路中的正反向有功電能,計(jì)量維度可精確到每條線路,計(jì)數(shù)方式為累計(jì)計(jì)數(shù),因此不能直接讀取每日的電量,可根據(jù)公式(1)提取日電量數(shù)據(jù)。
式中:Mt-1為電流互感器在第t-1日的累計(jì)計(jì)量值;Mt為在第t日的累計(jì)計(jì)量值;Vt為第t日的日電量;β為電流互感器的倍率值記。
2.2.2.2 數(shù)據(jù)顆粒度同化
電流互感器數(shù)據(jù)按日計(jì)量,潮流數(shù)據(jù)每分鐘計(jì)量一次,氣象數(shù)據(jù)每小時(shí)采集一次,由此會(huì)造成數(shù)據(jù)的時(shí)間粒度不統(tǒng)一,需要對(duì)其進(jìn)行時(shí)間顆粒度同化。3種數(shù)據(jù)的最大時(shí)間粒度為日,因此潮流數(shù)據(jù)和氣象數(shù)據(jù)也要轉(zhuǎn)化為按日采集。潮流數(shù)據(jù)按日采集的方法為求取當(dāng)日所有數(shù)據(jù)的平均值。氣象數(shù)據(jù)涵蓋溫度、氣壓、降水量和風(fēng)力等,其數(shù)據(jù)顆粒度同化的方式有所差異[2]。例如溫度數(shù)據(jù)可取當(dāng)日的極值,在高溫天取最高溫度,在嚴(yán)寒日取最低溫度。再如,風(fēng)力數(shù)據(jù)可取當(dāng)日的平均值。
2.2.2.3 異常線損數(shù)據(jù)清洗
原始數(shù)據(jù)中有可能存在粗大數(shù)值,能夠干擾模型訓(xùn)練的效果,因此需要進(jìn)行數(shù)據(jù)清洗,剔除不合理的數(shù)據(jù)點(diǎn)。判斷粗大誤差時(shí)采用拉依達(dá)準(zhǔn)則,其原理為求得線損數(shù)據(jù)的標(biāo)準(zhǔn)差,設(shè)置合理的數(shù)據(jù)偏差范圍(標(biāo)準(zhǔn)差3 倍以內(nèi)),將超過合理范圍的數(shù)據(jù)視作粗大誤差,具體實(shí)施過程如下。
假設(shè)線損數(shù)據(jù)為等精度的獨(dú)立有限測(cè)量序列,將其記為Y,則有Y={y(k)|k=1,2,...,n}。該測(cè)量序列的算數(shù)平均值和殘余誤差分別為yavg、gk,標(biāo)準(zhǔn)差σ的計(jì)算方法與yavg、gk有關(guān),具體如公式(2)~公式(4)所示。
式中:gk為線損數(shù)據(jù)y(k)的剩余誤差。
如果|gk|>3σ,說明數(shù)據(jù)y(k)超過合理范圍,屬于粗大誤差。
2.2.3 輸電線路線損非理論影響因素特征提取
線損非理論影響因素缺乏理論模型,難以直接計(jì)算,因此引入大數(shù)據(jù)方法對(duì)其進(jìn)行分析,提取非理論影響因素的數(shù)據(jù)特征是進(jìn)行模型訓(xùn)練的前提[3]。根據(jù)數(shù)據(jù)知識(shí)融合的路徑,線損歷史數(shù)據(jù)、輸電線路桿塔數(shù)據(jù)、潮流數(shù)據(jù)以及氣象數(shù)據(jù)具有不同的特征提取方式。
2.2.3.1 提取線損歷史數(shù)據(jù)的EWMA 特征
指數(shù)加權(quán)移動(dòng)平均值特征(Exponentially Weighted Moving Average,EWMA)能反映中短期時(shí)間序列的發(fā)展趨勢(shì),通常而言,近期的歷史數(shù)據(jù)在趨勢(shì)預(yù)測(cè)中具有更強(qiáng)的參考價(jià)值,因此對(duì)其設(shè)置更高的權(quán)重。更早的歷史數(shù)據(jù)對(duì)未來的預(yù)測(cè)效果相對(duì)較差,因此降低其權(quán)重,以提高趨勢(shì)預(yù)測(cè)的準(zhǔn)確性,EWMA 特征提取方法如下。
假設(shè)任一輸電線路的日線損數(shù)據(jù)序列集合為L,其中存在n個(gè)序列樣本,lj為集合L中的一個(gè)元素,則有j∈[0,n]。將該線路在第i天的線損EWMA 特征記為ei,則ei的計(jì)算方法如公式(5)所示。
式中:α為平滑參數(shù)記,并且α∈(0,1];li為線路在第i天的線損數(shù)據(jù);li-1為線路在第i-1 天的線損數(shù)據(jù);en為線路在第n天的EWMA 特征。
參數(shù)α的取值根據(jù)公式(6)進(jìn)行計(jì)算。
2.2.3.2 提取時(shí)序數(shù)據(jù)的曲線特征
輸電線路相關(guān)的時(shí)序數(shù)據(jù)主要包括潮流數(shù)據(jù)和氣象數(shù)據(jù),用于精確描述輸電線路的工況。時(shí)序數(shù)據(jù)具體又可細(xì)分為有功功率、無功功率、降雨量、環(huán)境溫度、輸電電壓、輸電電流以及風(fēng)速等。曲線特征包括多種數(shù)據(jù)指標(biāo),其平均值反映時(shí)序數(shù)據(jù)的平均趨勢(shì),最大值和最小值描述了時(shí)序數(shù)據(jù)的極值,平均差值體現(xiàn)出不同時(shí)序數(shù)據(jù)的變化趨勢(shì)[4]。將時(shí)序數(shù)據(jù)的線損影響量記為V,觀察時(shí)窗記為w(7 天為一個(gè)觀察時(shí)窗),vw i表示時(shí)序影響因素在時(shí)窗w內(nèi)的第i天所引起的線損時(shí)序影響數(shù)據(jù),特征曲線的平均值和平均差值分別記為Vmean、Vmean_diff,則有公式(7)、公式(8)。
式中:vw i-1為時(shí)序影響因素在時(shí)窗內(nèi)第i-1 天的線損時(shí)序影響數(shù)據(jù)。
2.2.3.3 提取輸電線路桿塔特征
桿塔特征屬于線路本體信息,與之類似的信息包括輸電線路的電壓等級(jí)、相序和線路的投運(yùn)時(shí)間等,線路特征集中體現(xiàn)于線路本體信息中的固定信息。數(shù)值類信息是每基桿塔的基本信息,不同桿塔的數(shù)值類信息存在一定差異,對(duì)線損計(jì)算的應(yīng)用價(jià)值相對(duì)較低。因此將桿塔特征作為線路的本體信息,桿塔特征按照如下方法進(jìn)行提取:1)桿塔的數(shù)值型信息并不統(tǒng)一,如桿塔線路的呼稱高,針對(duì)此類信息,將平均值作為桿塔特征的描述方式。2)對(duì)桿塔的類別型信息,可利用獨(dú)熱編碼進(jìn)行構(gòu)造。將桿塔的某一種類別信息記為K,其狀態(tài)集合為Nk,假設(shè)K為第i條輸電線路的第j個(gè)桿塔的類別信息,K當(dāng)前處于l 狀態(tài),此時(shí)對(duì)K進(jìn)行獨(dú)熱編碼,則有Kij=[0,0,...,1,...,0][5]。對(duì)線路中每個(gè)桿塔的對(duì)應(yīng)狀態(tài)進(jìn)行求和,即可獲取該條線路針對(duì)類別信息K的桿塔特征,如公式(9)所示。
式中:將輸電線路i上的桿塔數(shù)量記為Ntower。按照以上方法,假設(shè)某條高壓交流輸電線路中設(shè)計(jì)有4 個(gè)桿塔,高壓線采用三相三線制,則相序存在6 種可能,對(duì)4 個(gè)桿塔的相序進(jìn)行獨(dú)熱編碼,得到的結(jié)果見表1,此時(shí)可求得該條線路的相序特征,結(jié)果為[2,2,0,0,0,0]。
表1 線路桿塔相序特征獨(dú)熱編碼示例
2.2.3.4 構(gòu)建GBDT 線損計(jì)算模型
GBDT 線損計(jì)算模型以輸電線路的理論計(jì)算線損和非理論影響量的特征為基礎(chǔ),構(gòu)建基于數(shù)據(jù)知識(shí)融合的GBDT 模型,根據(jù)梯度提升樹算法的實(shí)現(xiàn)原理,線損計(jì)算模型的數(shù)學(xué)表達(dá)式如公式(10)所示。
式中:Zi為該集合中的一個(gè)元素,i=1,2,...,N;γ為模型損失函數(shù)的參數(shù);f0(Zi)為初始模型;T為模型的迭代次數(shù);Rjt為樹模型中的葉子節(jié)點(diǎn);J為葉子節(jié)點(diǎn)的總數(shù),則j=1,2,...,J;I為指示函數(shù),I的取值為1 或者0,如果Zi屬于葉子節(jié)點(diǎn)Rjt,則I=1,否則I=0。
2.2.3.5 BOA-GBDT 線損計(jì)算模型構(gòu)建方法
采用BOA 算法優(yōu)化上一步建立的GBDT 線損計(jì)算模型,以離散隨機(jī)采樣的方式在區(qū)間[1,7]內(nèi)搜索回歸樹的深度,葉子數(shù)量的區(qū)間為[2,128],學(xué)習(xí)率的區(qū)間為[0.001,0.5]。利用BOA 算法實(shí)現(xiàn)模型優(yōu)化的步驟為選擇初始參數(shù)組合樣本集、計(jì)算樣本損失函數(shù)的高斯過程、新樣本采樣、更新樣本損失函數(shù)的高斯過程、判斷是否達(dá)到迭代次數(shù)直到輸出最優(yōu)樣本[6]。
以國內(nèi)某城市的真實(shí)線路運(yùn)行數(shù)據(jù)為模型訓(xùn)練和效果測(cè)試的數(shù)據(jù)源,訓(xùn)練數(shù)據(jù)的采集時(shí)間為2023年1月10日至2023年4月19日,共計(jì)100 天。從2023年4月20日開始,再連續(xù)采集50 天的運(yùn)行數(shù)據(jù),用于模型檢驗(yàn)。
為了檢驗(yàn)該文所建立模型的效果,為其設(shè)置對(duì)照組,組1采用傳統(tǒng)的理論計(jì)算方法,組2 采用BOA-GBDT 線損計(jì)算模,分別評(píng)估2 種線損計(jì)算模型的精確度,將其作為性能對(duì)比的依據(jù)。精確度的計(jì)算方法如公式(11)所示。
式中:Vob為第i個(gè)樣本的實(shí)際線損;Vpre為模型計(jì)算線損;M為樣本總數(shù)量;Ermse為精確度。
相同數(shù)據(jù)下2 種模型的性能指標(biāo)測(cè)試結(jié)果見表2,從中可知,BOA-GBDT 線損計(jì)算模型精確度更好。
模型中不同影響量權(quán)重分配的合理性是評(píng)價(jià)其應(yīng)用價(jià)值的重要考量因素,不同影響量的權(quán)重的計(jì)算如公式(12)所示。
式中:vi為影響量;Imp(vi)為vi對(duì)應(yīng)的影響權(quán)重;vi.10·j為vi位于數(shù)據(jù)第10·j個(gè)百分位的數(shù)值;lossmean為日均統(tǒng)計(jì)殘損值;loss為函數(shù),用于統(tǒng)計(jì)線損的理論計(jì)算值;mean(x)為影響量x在訓(xùn)練時(shí)間內(nèi)的均值。
2 種模型的影響量權(quán)重計(jì)算結(jié)果見表3,從中可知,和傳統(tǒng)的理論計(jì)算模型相比,基于數(shù)據(jù)知識(shí)融合的BOA-GBDT 計(jì)算模型增加了環(huán)境溫度、風(fēng)速和線電壓溫度的權(quán)重,而這3 個(gè)影響量均為非理論影響量,說明該模型在線損計(jì)算中強(qiáng)化了對(duì)非理論影響考量,達(dá)到了設(shè)計(jì)目標(biāo)。
表2 2 種模型的測(cè)試結(jié)果
表3 2 種模型的影響量權(quán)重計(jì)算結(jié)果
現(xiàn)有的輸電線路線損計(jì)算方法存在一定缺陷,與實(shí)際損失偏差較大,主要原因在于未能充分統(tǒng)計(jì)各種非理論因素造成的線損。為了解決該問題,可廣泛收集輸電線路的基本數(shù)據(jù),包括氣象數(shù)據(jù)、潮流數(shù)據(jù)、桿塔數(shù)據(jù)以及各種理論線損數(shù)據(jù),實(shí)現(xiàn)知識(shí)數(shù)據(jù)的廣泛融合。再利用GBDT 算法和BOA 算法建立新的計(jì)算模型。經(jīng)過檢驗(yàn),基于數(shù)據(jù)知識(shí)融合的BOAGBDT 模型能夠達(dá)到預(yù)期效果,其線損計(jì)算精度明顯優(yōu)于傳統(tǒng)的理論計(jì)算方法。