趙昱翰
(貴州電網(wǎng)公司遵義供電局,貴州 遵義 563000)
在新發(fā)展階段,越來(lái)越多的先進(jìn)技術(shù)能夠被應(yīng)用到配電網(wǎng)運(yùn)行發(fā)展的過(guò)程中,以技術(shù)規(guī)范配電網(wǎng)相關(guān)工作的行為。將大數(shù)據(jù)技術(shù)用于支持配電網(wǎng)的穩(wěn)定運(yùn)行,能夠基于高效的數(shù)據(jù)處理和便利的數(shù)據(jù)傳遞途徑來(lái)發(fā)揮預(yù)警預(yù)測(cè)與分析的作用,對(duì)各類(lèi)安全風(fēng)險(xiǎn)對(duì)配電網(wǎng)運(yùn)行的影響,在提高配電網(wǎng)運(yùn)行穩(wěn)定性的同時(shí),也能夠更好地滿(mǎn)足市場(chǎng)對(duì)電能供應(yīng)的大量需求。
在配電網(wǎng)的運(yùn)行過(guò)程中,配電自動(dòng)化系統(tǒng),電網(wǎng)管理平臺(tái)等系統(tǒng)在運(yùn)行中會(huì)產(chǎn)生大量的數(shù)據(jù)信息。這些數(shù)據(jù)能夠呈現(xiàn)出以下幾方面的特點(diǎn):首先,基于當(dāng)前配電網(wǎng)自動(dòng)化和智能化發(fā)展的方向趨勢(shì),但應(yīng)用各類(lèi)信息化和物聯(lián)網(wǎng)技術(shù),開(kāi)展電力行業(yè)業(yè)務(wù)的過(guò)程中都會(huì)產(chǎn)生大量的數(shù)據(jù),且這些數(shù)據(jù)大多分布于不同的數(shù)據(jù)源,難以直接進(jìn)行集成和收集[1]。同時(shí),配電網(wǎng)運(yùn)行過(guò)程中的數(shù)據(jù)能夠體現(xiàn)出明顯的異構(gòu)性特點(diǎn),能夠具體分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)三種形式。結(jié)合以往的數(shù)據(jù)處理經(jīng)驗(yàn),發(fā)現(xiàn)配電網(wǎng)運(yùn)行過(guò)程中的可利用數(shù)據(jù)密度較低,單一的數(shù)據(jù)信息難以明確反映出信息背后蘊(yùn)含的規(guī)律特點(diǎn),因而容易對(duì)配電網(wǎng)的運(yùn)行決策造成阻礙。
在考慮配電網(wǎng)運(yùn)行中的數(shù)據(jù)量過(guò)于龐大這一特點(diǎn)的前提下,考慮將分布式系統(tǒng)用于大數(shù)據(jù)的處理分析當(dāng)中,實(shí)現(xiàn)對(duì)于這些數(shù)據(jù)的集中儲(chǔ)存與計(jì)算。以Hadoop這一分布式系統(tǒng)為例,該系統(tǒng)具有更便于擴(kuò)展和更高效的數(shù)據(jù)交互,在應(yīng)用中能夠體現(xiàn)出明顯的可靠性,因而能夠滿(mǎn)足處理大數(shù)據(jù)的要求。該分布式系統(tǒng)主要以符合配電網(wǎng)運(yùn)行情況的編程模型為基礎(chǔ),對(duì)大規(guī)模數(shù)據(jù)進(jìn)行并行處理。在這一過(guò)程中被處理的大規(guī)模數(shù)據(jù),應(yīng)能夠劃分為數(shù)據(jù)大小角的子數(shù)據(jù)集,且各個(gè)子數(shù)據(jù)集之間無(wú)須進(jìn)行額外的通信[2]。在這一前提下進(jìn)行大規(guī)模數(shù)據(jù)量的存儲(chǔ),應(yīng)選擇能夠儲(chǔ)存數(shù)據(jù)文件的有效工具,既能夠擁有充足的空間對(duì)冗余的數(shù)據(jù)進(jìn)行備份和存儲(chǔ)也能夠分類(lèi)存放,并能夠以周期性的方式接受從來(lái)源下的檢測(cè)信息和校驗(yàn)數(shù)據(jù),從而保障輸入數(shù)據(jù)的可靠性。
在大數(shù)據(jù)計(jì)算方面,主要依賴(lài)深度學(xué)習(xí)算法,以構(gòu)建深度學(xué)習(xí)模型的方式,基于非線(xiàn)性變化的原理角度來(lái)對(duì)數(shù)據(jù)進(jìn)行抽象化的處理,提取數(shù)據(jù)信息中蘊(yùn)含的規(guī)律和特點(diǎn)?,F(xiàn)階段能夠用于大數(shù)據(jù)計(jì)算的深度學(xué)習(xí)算法模型,以各種類(lèi)型的學(xué)習(xí)網(wǎng)絡(luò)為主。
數(shù)據(jù)預(yù)處理時(shí)配電網(wǎng)數(shù)據(jù)處理的首要環(huán)節(jié),為實(shí)現(xiàn)對(duì)于配電網(wǎng)運(yùn)行過(guò)程中產(chǎn)生的各項(xiàng)數(shù)據(jù)預(yù)處理,具體包括配電網(wǎng)運(yùn)行異常數(shù)據(jù)識(shí)別、數(shù)據(jù)選擇、數(shù)據(jù)變換、數(shù)據(jù)規(guī)約等預(yù)處理工作。在考慮大數(shù)據(jù)技術(shù)本身應(yīng)用特點(diǎn)的前提下,考慮配電網(wǎng)運(yùn)行中存在的大量文本,需要將這些數(shù)據(jù)信息轉(zhuǎn)化為能夠被系統(tǒng)程序認(rèn)可的數(shù)據(jù)形式。
具體而言,以配電網(wǎng)運(yùn)行的文本為例,在數(shù)據(jù)預(yù)處理過(guò)程中,從資產(chǎn)全生命周期管理、工作票和操作票、運(yùn)維日志、報(bào)告、國(guó)家/行業(yè)/企業(yè)標(biāo)準(zhǔn)等方面入手,考慮不同單位對(duì)配電網(wǎng)運(yùn)行產(chǎn)生的文本需求差異,應(yīng)用合適的數(shù)據(jù)處理方法[3]。例如,由于資產(chǎn)配置,信息等在現(xiàn)階段的企業(yè)單位管理中有著較為規(guī)范的書(shū)寫(xiě)和呈現(xiàn)形式,具有較強(qiáng)的結(jié)構(gòu)性,可以直接從語(yǔ)法規(guī)則的角度,在系統(tǒng)程序中,通過(guò)建立向量空間的方式,直接在結(jié)構(gòu)中填充相應(yīng)的文本內(nèi)容。假設(shè)ys為開(kāi)始年份,ds代表開(kāi)始日為該年第幾日,ms代表開(kāi)始分鐘數(shù)為該日的第幾分鐘,mr代表操作持續(xù)分鐘,則可以將文本信息的轉(zhuǎn)換過(guò)程表示為操作時(shí)間:[ys,ds,ms,mr]。
操作任務(wù)表示如下。
以保證配電網(wǎng)供電可靠性為主要目的,在配電網(wǎng)的運(yùn)行中發(fā)揮大數(shù)據(jù)技術(shù)的作用,主要可以從以下3個(gè)方面來(lái)減少配電網(wǎng)運(yùn)行中的安全隱患問(wèn)題。
對(duì)配電網(wǎng)噪聲數(shù)據(jù)識(shí)別與替補(bǔ)的分析,主要建立在明確配電網(wǎng)整體架構(gòu)的基礎(chǔ)上。配電網(wǎng)運(yùn)行造成主要來(lái)源于各種電氣設(shè)施設(shè)備,噪聲數(shù)據(jù)主要體現(xiàn)在發(fā)電側(cè)、輸電側(cè)與配電側(cè)、用電側(cè)3 個(gè)方面。在受到網(wǎng)絡(luò)或設(shè)備問(wèn)題影響的情況下,都會(huì)產(chǎn)生噪聲數(shù)據(jù),噪聲會(huì)對(duì)配電網(wǎng)的采集數(shù)據(jù)產(chǎn)生干擾,進(jìn)而影響數(shù)據(jù)的真實(shí)性和質(zhì)量[4]。在考慮配電網(wǎng)系統(tǒng)實(shí)際運(yùn)行需求的前提下,應(yīng)那個(gè)加強(qiáng)對(duì)噪聲數(shù)據(jù)的識(shí)別,并通過(guò)對(duì)噪聲數(shù)據(jù)的及時(shí)替換,保障配電網(wǎng)整體的運(yùn)行安全與效率效果。
基于這一前提,主要可以選擇應(yīng)用大數(shù)據(jù)中的聚類(lèi)算法和決策樹(shù)算法,以分階段的形式來(lái)對(duì)配電網(wǎng)的噪聲數(shù)據(jù)進(jìn)行識(shí)別。以聚類(lèi)算法為例,應(yīng)用該算法來(lái)對(duì)配電網(wǎng)的噪聲數(shù)據(jù)進(jìn)行識(shí)別,主要基于聚類(lèi)算法應(yīng)用流程(圖1)實(shí)現(xiàn)??紤]應(yīng)用該算法對(duì)噪聲數(shù)據(jù)進(jìn)行識(shí)別主要分為兩個(gè)階段,在第一階段,主要以規(guī)劃數(shù)據(jù)集的方式,當(dāng)配電網(wǎng)運(yùn)行過(guò)程中產(chǎn)生的大數(shù)據(jù)集受到噪聲污染而產(chǎn)生噪聲數(shù)據(jù)時(shí),以引入相關(guān)系數(shù)這一概念的方式,通過(guò)分析大數(shù)據(jù)集中兩個(gè)數(shù)據(jù)之間的相關(guān)系數(shù)方式,對(duì)兩個(gè)數(shù)據(jù)之間的相關(guān)度進(jìn)行分析。通常情況下,計(jì)算得到的系數(shù)值越大,則相對(duì)應(yīng)的兩個(gè)數(shù)據(jù)之間也具有更緊密的關(guān)系。在此基礎(chǔ)上,還需要依據(jù)計(jì)算的相關(guān)系數(shù)次數(shù)來(lái)計(jì)算其平均值,在將計(jì)算得到的平均相關(guān)系數(shù)按照降序方式排列后,選出平均相關(guān)系數(shù)高的數(shù)據(jù)作為初始聚類(lèi)中心。在聚類(lèi)結(jié)束后,需要將平均相關(guān)系數(shù)作為半徑,對(duì)聚集簇的密度進(jìn)行計(jì)算。
圖1 聚類(lèi)算法應(yīng)用流程
而在二階段的噪聲識(shí)別部分,主要發(fā)揮決策樹(shù)算法的作用。在獲得一階段的噪聲數(shù)據(jù)分析結(jié)果之后,基于對(duì)疑似噪聲數(shù)據(jù)簇進(jìn)行分類(lèi)的目的,在訓(xùn)練決策樹(shù)的過(guò)程中,以正常簇和噪聲簇?cái)?shù)據(jù)為標(biāo)準(zhǔn)依據(jù)[5]。在應(yīng)用該算法的過(guò)程中,需要引入信息熵和信息增益兩個(gè)概念來(lái)進(jìn)行數(shù)據(jù)信息的計(jì)算。其中,依據(jù)信息增益大小可以對(duì)信息熵進(jìn)行計(jì)算,當(dāng)信息熵的計(jì)算值越小時(shí),可以代表計(jì)算依據(jù)的集合樣本擁有更高的純度。
對(duì)于配電網(wǎng)噪聲數(shù)據(jù)的替補(bǔ),則主要基于距離分布權(quán)重,應(yīng)用KNN 替補(bǔ)方法來(lái)實(shí)現(xiàn)。該替補(bǔ)方法在實(shí)際應(yīng)用中,需要對(duì)目標(biāo)數(shù)據(jù)與正常簇中的所有數(shù)據(jù)的歐式距離進(jìn)行計(jì)算。在這一過(guò)程中,歐式距離的計(jì)算公式如下:
依據(jù)得到的計(jì)算結(jié)果,在所有的歐式距離值中,選擇最小的數(shù)據(jù)作為目標(biāo)數(shù)據(jù)的最近鄰。在此基礎(chǔ)上,當(dāng)計(jì)算得到的歐式距離值較大時(shí),則距離噪聲數(shù)據(jù)更近的數(shù)據(jù)在整體中占據(jù)的比重也更大。
用電行為分析也是配電網(wǎng)運(yùn)行中涉及的主要內(nèi)容,用戶(hù)產(chǎn)生的用電行為中包含大量的信息,且不同地區(qū)的用電行為能夠呈現(xiàn)出多樣化的特點(diǎn)。以重點(diǎn)識(shí)別異常用電數(shù)據(jù)為主要目的,對(duì)配電網(wǎng)中用電行為的分析,應(yīng)能夠在應(yīng)用聚類(lèi)算法的基礎(chǔ)上,結(jié)合DBSCAN 算法,發(fā)揮兩種算法的互補(bǔ)作用,從而提升用電行為分析結(jié)果的準(zhǔn)確性與科學(xué)性。
結(jié)合以上用電行為架構(gòu),對(duì)用戶(hù)用電行為進(jìn)行分析,最主要的就是能夠及時(shí)發(fā)現(xiàn)其中可能存在的竊電行為,進(jìn)而導(dǎo)致用電數(shù)據(jù)異常的情況。從大數(shù)據(jù)和應(yīng)用算法的角度來(lái)看,可以將離群點(diǎn)作為對(duì)用戶(hù)竊電行為進(jìn)行判斷的主要依據(jù)。在實(shí)際應(yīng)用該方法進(jìn)行用戶(hù)用電行為分析時(shí),在將配電網(wǎng)中的用戶(hù)用電量數(shù)據(jù)收集起來(lái)后,首先進(jìn)行聚類(lèi)分析,待形成離群點(diǎn)后,再依據(jù)k-means 算法來(lái)對(duì)這些離群點(diǎn)數(shù)據(jù)進(jìn)行進(jìn)一步處理,從而形成聚集簇。在此基礎(chǔ)上通過(guò)構(gòu)建結(jié)合兩種聚類(lèi)算法的互補(bǔ)模型方式,實(shí)現(xiàn)對(duì)用戶(hù)用電行為的分析。
具體而言,以DBSCAN 聚類(lèi)算法為例,該算法在實(shí)際應(yīng)用中,應(yīng)能夠手動(dòng)輸入樣本的鄰域距離以及某一樣本在鄰域距離下的鄰域中樣本個(gè)數(shù)最大值,以這種組合參數(shù)的方式來(lái)對(duì)空間中樣本周?chē)植嫉木o密程度進(jìn)行描述。
在構(gòu)建結(jié)合兩種聚類(lèi)算法的互補(bǔ)模型時(shí),需要首先應(yīng)用k-means 算法,對(duì)預(yù)處理后獲得的數(shù)據(jù)集進(jìn)行聚類(lèi)分析,從而形成k 個(gè)聚類(lèi)簇,然后再應(yīng)用DBSCAN聚類(lèi)算法對(duì)得到的數(shù)據(jù)集進(jìn)行聚類(lèi),在找出其中的N個(gè)離群數(shù)據(jù)集后,判斷其中是否包含離群點(diǎn)聚類(lèi)簇中的數(shù)據(jù)。如果其中含有離群數(shù)據(jù),則需要將該數(shù)據(jù)點(diǎn)從聚類(lèi)簇中劃分出去。
在配電網(wǎng)的運(yùn)行過(guò)程中,也可以應(yīng)用大數(shù)據(jù)來(lái)實(shí)現(xiàn)對(duì)配電網(wǎng)短期運(yùn)行負(fù)荷的預(yù)測(cè)分析?;诋?dāng)前市場(chǎng)對(duì)電網(wǎng)運(yùn)行規(guī)模以及電能供應(yīng)需求的不斷提升,以保障配電網(wǎng)運(yùn)行可靠性為主要目的,在應(yīng)用大數(shù)據(jù)技術(shù)時(shí),依據(jù)對(duì)歷史用電數(shù)值的總結(jié)分析,對(duì)未來(lái)一段時(shí)間配電網(wǎng)的復(fù)合數(shù)據(jù)指進(jìn)行預(yù)測(cè),以便能夠及時(shí)應(yīng)對(duì)可能出現(xiàn)的缺點(diǎn)或電能浪費(fèi)等情況。而基于對(duì)配電網(wǎng)運(yùn)行負(fù)荷進(jìn)行預(yù)測(cè)分析的需求,應(yīng)能夠考慮滿(mǎn)足復(fù)合預(yù)測(cè)飛機(jī)的實(shí)時(shí)性和準(zhǔn)確性。
基于這一目的,主要應(yīng)用聚類(lèi)分析和Elman 的方法來(lái)實(shí)現(xiàn)對(duì)配電網(wǎng)短期負(fù)荷的預(yù)測(cè)??紤]電力負(fù)荷預(yù)測(cè)會(huì)受到歷史數(shù)據(jù)值以及運(yùn)行環(huán)境下各項(xiàng)因素的影響,最重要的就是能夠確保用于預(yù)測(cè)負(fù)荷的歷史數(shù)據(jù)真實(shí)準(zhǔn)確。受到現(xiàn)階段配電網(wǎng)運(yùn)行中歷史數(shù)據(jù)數(shù)量較多且分類(lèi)困難的影響,在應(yīng)用聚類(lèi)算法的基礎(chǔ)上,引入均值函數(shù)的概念,依靠定義數(shù)據(jù)的均值函數(shù)來(lái)確定不同年份配電網(wǎng)的運(yùn)行負(fù)荷數(shù)據(jù)。同時(shí)也需要引入方差函數(shù)、反常函數(shù)以及平滑函數(shù),實(shí)現(xiàn)對(duì)異常數(shù)據(jù)的有效處理。用這一方法對(duì)配電網(wǎng)的短期負(fù)荷預(yù)測(cè)進(jìn)行分析的過(guò)程(數(shù)據(jù)預(yù)處理流程)如圖2 所示。
圖2 數(shù)據(jù)預(yù)處理流程
在實(shí)際進(jìn)行數(shù)據(jù)預(yù)處理時(shí),首先應(yīng)用均值函數(shù)E(x)和方差函數(shù)V(x),來(lái)對(duì)電力復(fù)合樣本數(shù)據(jù)的均值和方差進(jìn)行計(jì)算,然后再應(yīng)用反常函數(shù)p(x)找出其中疑似異常的數(shù)據(jù)信息。基于DBSCAN 算法來(lái)對(duì)配電網(wǎng)的原始數(shù)據(jù)集進(jìn)行聚類(lèi),將通過(guò)聚類(lèi)得到的異常數(shù)據(jù)與經(jīng)過(guò)函數(shù)得到的異常數(shù)據(jù)共同作為異常數(shù)據(jù)的主要范圍,則可以及時(shí)發(fā)現(xiàn)配電網(wǎng)實(shí)際運(yùn)行中可能存在的各種故障問(wèn)題。
而在應(yīng)用Elman 進(jìn)行短期負(fù)荷預(yù)測(cè)的過(guò)程中,可以引入動(dòng)態(tài)神經(jīng)元網(wǎng)絡(luò),從而更直觀(guān)形象的反映系統(tǒng)運(yùn)行過(guò)程中呈現(xiàn)的動(dòng)態(tài)特性。Elman 是一種前向神經(jīng)網(wǎng)絡(luò),是對(duì)以往神經(jīng)網(wǎng)絡(luò)算法功能的優(yōu)化與改進(jìn)。在實(shí)際該方法時(shí),需要借助經(jīng)過(guò)反常函數(shù)預(yù)處理過(guò)的數(shù)據(jù)集,作為Elman 神經(jīng)網(wǎng)絡(luò)的輸入。在對(duì)隱層和輸出層的輸出值、誤差值進(jìn)行計(jì)算之后,對(duì)各層間的權(quán)值和閾值進(jìn)行修改,從而得到全局誤差。在對(duì)這一得到的誤差值進(jìn)行對(duì)比分析之后,如果達(dá)到正常情況下的系統(tǒng)運(yùn)行標(biāo)準(zhǔn),則網(wǎng)絡(luò)訓(xùn)練過(guò)程結(jié)束。根據(jù)這一流程來(lái)反映配電網(wǎng)系統(tǒng)的運(yùn)行情況,也能夠及時(shí)發(fā)現(xiàn)配電網(wǎng)運(yùn)行中可能存在的缺電或超負(fù)荷情況。
綜上所述,將大數(shù)據(jù)技術(shù)應(yīng)用到配電網(wǎng)的運(yùn)行過(guò)程中,能夠從配電網(wǎng)的噪聲控制、用電行為分析以及短期運(yùn)行復(fù)合預(yù)測(cè)等角度,加強(qiáng)對(duì)于配電網(wǎng)的進(jìn)行管理與控制,從而有效提升供電可靠性。在實(shí)際應(yīng)用中應(yīng)能夠明確大數(shù)據(jù)技術(shù)的應(yīng)用原理與特點(diǎn),從數(shù)據(jù)預(yù)處理的角度,考慮大數(shù)據(jù)技術(shù)能夠滿(mǎn)足配電網(wǎng)供電可靠性要求的途徑和方法,以便能夠在保障配電網(wǎng)安全運(yùn)行的同時(shí),也能夠促進(jìn)電力行業(yè)的發(fā)展。