江疆,彭澤武,蘇華權(quán)
(廣東電網(wǎng)有限責(zé)任公司, 廣東, 廣州 510000)
電網(wǎng)智能化的發(fā)展,使得行業(yè)動(dòng)態(tài)、氣象信息、工商用戶等跨行業(yè)數(shù)據(jù)大量融合,并呈現(xiàn)高容量、快速性、多樣性等大數(shù)據(jù)特征[1]。同時(shí),跨行業(yè)數(shù)據(jù)為HMSD,存在大量非結(jié)構(gòu)化數(shù)據(jù),無(wú)法用傳統(tǒng)數(shù)據(jù)分析方法進(jìn)行準(zhǔn)確的不良數(shù)據(jù)分析,影響電網(wǎng)穩(wěn)定運(yùn)行和規(guī)劃,也降低了數(shù)據(jù)的安全性[2],限制電網(wǎng)智能化的發(fā)展。有學(xué)者認(rèn)為,電網(wǎng)智能化發(fā)展的目的是滿足應(yīng)用場(chǎng)景需求,所以從負(fù)荷預(yù)測(cè)、運(yùn)行狀態(tài)、電能質(zhì)量檢測(cè)角度出發(fā)[3],分析大數(shù)據(jù)下HMSD,可以提高不良數(shù)據(jù)的識(shí)別準(zhǔn)確性。也有學(xué)者認(rèn)為,大數(shù)據(jù)中的HMSD價(jià)值較低,且非結(jié)構(gòu)化數(shù)據(jù)比例較高[4],可以通過(guò)提取特征值的方式,提高HMSD的價(jià)值,并減少數(shù)據(jù)的處理量?;谏鲜霰尘埃疚睦肕etropolis接受準(zhǔn)則進(jìn)行特征值的分析,從應(yīng)用場(chǎng)景的角度分析HMSD,以提高不良數(shù)據(jù)的辨識(shí)準(zhǔn)確度。
電網(wǎng)大數(shù)據(jù)HMSD有兩方面特點(diǎn),一方面是海量、低價(jià)值和多樣性數(shù)據(jù),且非結(jié)構(gòu)化數(shù)據(jù)比例>50%;另一方面,數(shù)據(jù)多源性,且為動(dòng)態(tài)獲取方式,數(shù)據(jù)結(jié)構(gòu)如圖1所示。
圖1 HMSD數(shù)據(jù)描述
由圖1可知,HMSD數(shù)據(jù)的來(lái)源多樣,是跨行業(yè)數(shù)據(jù)的綜合,需要通過(guò)計(jì)算、觀察和測(cè)量等方式獲得[5]。HMSD數(shù)據(jù)的結(jié)構(gòu)以非結(jié)構(gòu)化、結(jié)構(gòu)化形式為主,且與EMS、PMS和GIS等數(shù)據(jù)源聯(lián)合,形成海量的大數(shù)據(jù)。HMSD要從應(yīng)用場(chǎng)景出發(fā),結(jié)合配電網(wǎng)負(fù)荷、電網(wǎng)運(yùn)行、電能質(zhì)量等角度分析,實(shí)現(xiàn)不良數(shù)據(jù)的高效檢出。
電網(wǎng)信息化、電力需求影響因素多樣化,使得大數(shù)據(jù)特征日益凸顯,傳統(tǒng)用電分析方法無(wú)法完全適用各種場(chǎng)景需求。遺傳算法、粒子群算法、支持向量等智能預(yù)測(cè)算法可以滿足體量大、類型多的電網(wǎng)大數(shù)據(jù)需求,實(shí)現(xiàn)電網(wǎng)負(fù)荷、電網(wǎng)運(yùn)行、電能質(zhì)量的預(yù)測(cè)分析。下面對(duì)電網(wǎng)應(yīng)用場(chǎng)景的參數(shù)進(jìn)行設(shè)定[6]。
(2) 假設(shè)N為HMSD中的任意數(shù)據(jù),i為數(shù)據(jù)來(lái)源的行業(yè),j為數(shù)據(jù)的結(jié)構(gòu)類型(結(jié)構(gòu)化數(shù)據(jù)=1,否則=0),k為數(shù)據(jù)的獲取方式(定性方法獲取=1,定量方法獲取=2,綜合獲取方式=0),l為數(shù)據(jù)安全監(jiān)測(cè)裝置(注:1~5等級(jí),數(shù)值越高等級(jí)越高),m為場(chǎng)景中智能信息采集裝置,那么信息采集項(xiàng)可以描述為Ni,j,k,l,m,i,j,k,l,m=(1,2,…,n),n為自然數(shù)。
(3) 適用場(chǎng)景為單位,將類似的行業(yè)來(lái)源、結(jié)構(gòu)類型、獲取方法、安全監(jiān)測(cè)等級(jí)和采集裝置的數(shù)據(jù)劃分到同一應(yīng)用場(chǎng)景中。
(4) 所有場(chǎng)景的信息均由電網(wǎng)智慧中心集中分析,在預(yù)測(cè)準(zhǔn)確性、預(yù)測(cè)時(shí)間和安全等級(jí)的條件約束下,對(duì)獲得的數(shù)據(jù)按照相關(guān)權(quán)重、閾值進(jìn)行排列。
(5) 任何場(chǎng)景中的數(shù)據(jù)采集時(shí)間、數(shù)據(jù)安全等級(jí)相同或類似[7]。
(6) 場(chǎng)景分析的穩(wěn)定性,要采用傅里葉級(jí)數(shù)的方法,減少設(shè)備、人員和其他非抗拒因素的干擾。
(1)
其中,P為場(chǎng)景分析描述的抗干擾能力,t為抗干擾測(cè)量時(shí)間,y為數(shù)據(jù)加密程度,z為傳輸距離,z為傳輸安全等級(jí),ξ為干擾系數(shù)。
不同場(chǎng)景采集的數(shù)據(jù)資料需要先進(jìn)行k-means處理,處理公式如式(2)
(2)
其中,S為聚類的范圍,即數(shù)據(jù)聚類的程度,其值越小說(shuō)明聚類效果越好,I為場(chǎng)景采集的數(shù)據(jù)信息,i為信息的編號(hào)。另外,S可以用相似度J代替,以此提高計(jì)算的效率。為了簡(jiǎn)化流程,可以利用某一數(shù)據(jù)出現(xiàn)的頻率進(jìn)行權(quán)重判斷,即依據(jù)以往歷史數(shù)據(jù),或者電網(wǎng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)頻率,判斷場(chǎng)景設(shè)備采集到的數(shù)據(jù)閾值,其計(jì)算公式如式(3)
(3)
其中,Gij為j設(shè)備采集i信息的次數(shù),Gi為i信息在電網(wǎng)數(shù)據(jù)庫(kù)中出現(xiàn)的次數(shù),Gj為j設(shè)備發(fā)送信息的頻率,wi為i信息的閾值。
電網(wǎng)進(jìn)行大數(shù)據(jù)跨行業(yè)融合場(chǎng)景分析前,要對(duì)各場(chǎng)景依據(jù)相關(guān)標(biāo)準(zhǔn)進(jìn)行歸類與判斷。本文采用退火模擬算法的Metropolis接受準(zhǔn)則[8],如果應(yīng)用場(chǎng)景符合電網(wǎng)實(shí)際需要,則采集相關(guān)數(shù)據(jù),否則將不接受該場(chǎng)景數(shù)據(jù),并將所有設(shè)備處于“休眠”狀態(tài)。Metropolis接受準(zhǔn)則判斷節(jié)約了電網(wǎng)硬件資源,也減少了跨行業(yè)數(shù)據(jù)量[9]。
假設(shè)應(yīng)用場(chǎng)景所處狀態(tài)為Ti,則對(duì)其進(jìn)行Metropolis接受準(zhǔn)則分析,判斷該狀態(tài)是否需要改變,即由i狀態(tài)向i+1狀態(tài)改變,其計(jì)算公式如式(4)
(4)
其中,exp()為期望函數(shù),判斷是否要進(jìn)行狀態(tài)改變,R(T)為應(yīng)用場(chǎng)景狀態(tài)改變的結(jié)果函數(shù)。如果R(T)的結(jié)果處于0~0.5,說(shuō)明狀態(tài)的改變程度較低,可以維持原有狀態(tài)。如果結(jié)果處于0.5~1之間,說(shuō)明應(yīng)用場(chǎng)景需要改變,或者被“激活”、處于“休眠”。
應(yīng)用場(chǎng)景與跨行業(yè)數(shù)據(jù)的擬合分為[10]:局部擬合Pc、整體擬合Pm,從不同方面反映兩者的擬合情況,也是不良數(shù)據(jù)計(jì)算的前提。Pc、Pm值越大,代表數(shù)據(jù)擬合度越好。由于2.1中的Metropolis接受準(zhǔn)則限制,要求兩個(gè)數(shù)據(jù)均為最優(yōu),才能成為計(jì)算數(shù)據(jù),所以其計(jì)算公式如式(5)、式(6)
(5)
(6)
其中,N1,1,0,1為Pc的初始值,N1,1,1,0為Pm的初始值,Rmin為整個(gè)融合數(shù)據(jù)的最小值,Rc為局部最小值,Rm為整體最小值,φc為局部擬合系數(shù),φm為整體擬合系數(shù)。
不良數(shù)據(jù)計(jì)算前要構(gòu)建相應(yīng)的數(shù)據(jù)序列,本文采用適度函數(shù)來(lái)明確跨行業(yè)大數(shù)據(jù)與應(yīng)用場(chǎng)景之間的關(guān)系[11]。適度函數(shù)在預(yù)設(shè)精度、閾值約束的條件下,進(jìn)行多次迭代分析,引導(dǎo)算子向正方向計(jì)算,降低局部極值,“假特征值”的出現(xiàn)率[12],提高不良數(shù)據(jù)計(jì)算的準(zhǔn)確性,具體公式如下。
(7)
基于上述的數(shù)學(xué)描述,需要進(jìn)行以下幾方面的計(jì)算:
(1) 設(shè)置初始應(yīng)用場(chǎng)景C={c1,c2,…,ci}值,數(shù)據(jù)擬合(局部擬合Pc、整體擬合Pm)和計(jì)算精準(zhǔn)度的閾值,HMSD的數(shù)據(jù)Ni,j,k,l,m值,以及初始的Metropolis接受準(zhǔn)則;
(2) 對(duì)擬合后的數(shù)據(jù)進(jìn)行梯度200次迭代測(cè)試[13];
(3) 依據(jù)Metropolis接受準(zhǔn)則、約束條件,驗(yàn)證計(jì)算結(jié)果,并將符合要求的結(jié)果納入到Total方案中,并計(jì)算整體方案的不良數(shù)據(jù)識(shí)別準(zhǔn)確度和計(jì)算時(shí)間[14];
(4) 判斷所有的數(shù)據(jù)i是否均被遍歷,則如果是則終止計(jì)算,否則轉(zhuǎn)入步驟(3);
(5) 最后輸出Total方案中的最小值,退出計(jì)算過(guò)程。
以2020年跨氣象、交通、電力行業(yè)、工商的大數(shù)據(jù)為例[15],分析風(fēng)力、太陽(yáng)能、水利等應(yīng)用場(chǎng)景下電網(wǎng)負(fù)荷、電網(wǎng)運(yùn)行、電能質(zhì)量數(shù)據(jù),確定其中不良數(shù)據(jù)的判別準(zhǔn)確率和時(shí)間。數(shù)據(jù)擬合(局部擬合Pc、整體擬合Pm)精度和計(jì)算精準(zhǔn)度設(shè)置為0.1,迭代次數(shù)200次,其中,數(shù)據(jù)采集裝置為電能表102,3個(gè),電壓表209,2個(gè),變壓器102個(gè),服務(wù)器6臺(tái),通信協(xié)議為TCP/IP、HTTP等,SQL數(shù)據(jù)庫(kù)4個(gè),拓普瑞電網(wǎng)檢測(cè)系統(tǒng)6.0,數(shù)據(jù)傳輸密碼為64 Bit,光纖、Wi-Fi、GPS通信,信息安全等級(jí)3級(jí),遵循2015年版《電網(wǎng)運(yùn)行準(zhǔn)則》(GB/T 31464),IP地址為192.168.1.102~192.168.1.202。
通過(guò)k-means聚類和Metropolis接受準(zhǔn)則,對(duì)跨行業(yè)數(shù)據(jù)、應(yīng)用場(chǎng)景數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,并進(jìn)行150次迭代分析,得到數(shù)據(jù)擬合結(jié)果,如圖2所示。
圖2 應(yīng)用場(chǎng)景與跨行業(yè)數(shù)據(jù)的擬合結(jié)果
由上圖可知,大數(shù)據(jù)局部擬合、應(yīng)用場(chǎng)景局部擬合較高,均>95%,而整體擬合較低,但是也>90%,說(shuō)明整體擬合較高,也符合k-means聚類和Metropolis接受準(zhǔn)則設(shè)置的閾值10%的要求。
電網(wǎng)大數(shù)據(jù)跨行業(yè)數(shù)據(jù)融合應(yīng)用場(chǎng)景分析的關(guān)鍵指標(biāo)是電網(wǎng)負(fù)荷判斷xi,電網(wǎng)運(yùn)行狀態(tài)判斷xj,電能質(zhì)量判斷xk,3個(gè)指標(biāo)中不良數(shù)據(jù)的辨識(shí)精準(zhǔn)度,直接決定整個(gè)模型有效性。通過(guò)MATLAB仿真分析可知,上述3項(xiàng)指標(biāo)中不良數(shù)據(jù)的識(shí)別精準(zhǔn)度均>95%,而初設(shè)閾值和《電網(wǎng)運(yùn)行準(zhǔn)則》中的要求為0.1,所以仿真結(jié)果較佳,結(jié)果如圖3所示。
圖3 不良數(shù)據(jù)的辨識(shí)精準(zhǔn)度
跨行業(yè)數(shù)據(jù)融合的特點(diǎn)是數(shù)據(jù)具有大數(shù)據(jù)特征,數(shù)據(jù)處理量大,處理復(fù)雜度高,所以不良數(shù)據(jù)的辨識(shí)時(shí)間是另一個(gè)驗(yàn)證指標(biāo)。結(jié)果顯示,電網(wǎng)負(fù)荷判斷xi,電網(wǎng)運(yùn)行狀態(tài)判斷xj,電能質(zhì)量判斷xk中不良數(shù)據(jù)的辨識(shí)時(shí)間均<7 s,電能質(zhì)量、負(fù)荷判斷中不良數(shù)據(jù)的辨識(shí)時(shí)間<4 s,主要是由于運(yùn)行的計(jì)算過(guò)程相對(duì)復(fù)雜。但是,整體的不良數(shù)據(jù)的辨識(shí)時(shí)間,均符合《電網(wǎng)運(yùn)行準(zhǔn)則》中的要求,結(jié)果如圖4所示。
圖4 不良數(shù)據(jù)的辨識(shí)時(shí)間
電網(wǎng)智能化的快速發(fā)展,使得跨行業(yè)數(shù)據(jù)融合越來(lái)越多,諸如,氣象、交通、電力行業(yè)、工商等[16],且數(shù)據(jù)量、復(fù)雜度等方面呈現(xiàn)大數(shù)據(jù)特征[17],使得傳統(tǒng)的分析方法無(wú)法滿足相關(guān)場(chǎng)景分析的要求,致使不良數(shù)據(jù)辨識(shí)準(zhǔn)確率大幅下降[18]。本文提出的一種基于k-means聚類和Metropolis接受準(zhǔn)則的分析方法,通過(guò)對(duì)跨行業(yè)數(shù)據(jù)、應(yīng)用場(chǎng)景數(shù)據(jù)標(biāo)準(zhǔn)化處理,得到精度為0.1的擬合數(shù)據(jù)。然后,利用遺傳算法和迭代計(jì)算,得到電網(wǎng)負(fù)荷判斷xi,電網(wǎng)運(yùn)行狀態(tài)判斷xj,電能質(zhì)量判斷xk等指標(biāo)的不良數(shù)據(jù)辨識(shí)率。MATLAB仿真結(jié)果顯示:3項(xiàng)指標(biāo)中不良數(shù)據(jù)的識(shí)別精準(zhǔn)度均>95%,而初設(shè)閾值和《電網(wǎng)運(yùn)行準(zhǔn)則》中的要求為0.1。同時(shí),3項(xiàng)指標(biāo)中不良數(shù)據(jù)的辨識(shí)時(shí)間均<7 s,且電能質(zhì)量、負(fù)荷判斷中不良數(shù)據(jù)的辨識(shí)時(shí)間<4 s,整體判斷結(jié)果較佳。