關(guān) 旭,王紫瑞,冀雯馨,郭一民
1(遼寧瀚石機(jī)械制造有限公司,阜新 123000)
2(遼寧省露天礦山裝備專業(yè)技術(shù)創(chuàng)新中心,阜新 123000)
3(遼寧工程技術(shù)大學(xué) 研究生院,葫蘆島 125105)
4(常熟理工學(xué)院 電子信息工程學(xué)院,蘇州 215500)
隨著我國經(jīng)濟(jì)的快速發(fā)展,以及國家開始重視對(duì)環(huán)境的保護(hù),節(jié)能減排和可持續(xù)發(fā)展的要求逐漸變高[1].從2015年開始,國家電網(wǎng)公司陸續(xù)發(fā)布了《國家電網(wǎng)公司大數(shù)據(jù)應(yīng)用指導(dǎo)意見》等,在服務(wù)政府、電網(wǎng)生產(chǎn)、經(jīng)營管理和優(yōu)質(zhì)服務(wù)等領(lǐng)域進(jìn)行大數(shù)據(jù)分析深入研究和應(yīng)用[2,3].在國外,由于用電行為分析的研究起步的較早,在2011年,美國的頂級(jí)期刊《科學(xué)》上開辟了一個(gè)名為《Dealing with data》的???此??闹黝}是圍繞在大數(shù)據(jù)問題而展開,用以表明大數(shù)據(jù)在現(xiàn)實(shí)的生產(chǎn)生活中有著重要的意義和指導(dǎo)[3].而電力行業(yè)是現(xiàn)代工業(yè)的基礎(chǔ),電力的生產(chǎn)和數(shù)據(jù)有著天然的聯(lián)系,在近些年這種聯(lián)系表現(xiàn)得尤為突出.如在文獻(xiàn)[4]中,提出了一種基于海量數(shù)據(jù)的用戶用電行為分析方法.在文獻(xiàn)[5]中,提出了一種用電行為分析的聚類優(yōu)化策略,在研究了用電行為特征優(yōu)化選擇策略的基礎(chǔ)上分析早期,采用特征優(yōu)化選擇策略提取負(fù)荷曲線的最優(yōu)特征集,對(duì)用戶用電數(shù)據(jù)進(jìn)行聚類,提出了聚類數(shù)的優(yōu)化策略.在文獻(xiàn)[6]中,提出了一種基于需求響應(yīng)的基本用電分接頭確定方法.首先介紹了分時(shí)電價(jià)和分層電價(jià)的聯(lián)合定價(jià).利用基本消費(fèi)和舒適消費(fèi)的不同價(jià)格彈性,建立了可計(jì)算的需求響應(yīng)模型,分析了聯(lián)合定價(jià)引起的需求和支出變化.然后以最大化需求減少為目標(biāo),建立一個(gè)優(yōu)化模型來確定基本消費(fèi)的層次.在文獻(xiàn)[7]中,針對(duì)連續(xù)(PCA)K-均值聚類問題,探討了穩(wěn)定性優(yōu)化在標(biāo)準(zhǔn)特征選擇過程中的作用.提出一種是基于稀疏PCA 方法,選擇以貪婪的方式最大化穩(wěn)定性的特征.
應(yīng)對(duì)非常之疫,需舉非常之力.電力企業(yè)既要保障人民群眾和疫情防控機(jī)構(gòu)的安全可靠用電,同時(shí)還要防止疫情在直接承擔(dān)保供一線的電力人員中蔓延.尤其是處于疫情核心區(qū)的電力企業(yè),其防控任務(wù)異常艱巨.本次主要選取居民用戶、超商用戶、工業(yè)用戶,雖然這并不是電網(wǎng)體系下包含的全部用戶,只是單獨(dú)列舉幾類,但這些是在疫情時(shí)期非常具有代表性的用戶.主要利用大數(shù)據(jù)技術(shù)對(duì)不同的用戶進(jìn)行用電行為分析,構(gòu)建不同的用戶體系的用電行為分析模型.針對(duì)特殊時(shí)期,特殊的“戰(zhàn)役”,分析不同用戶的用電行為,核心目標(biāo)是為國家電網(wǎng)進(jìn)行合理的電力分配提供數(shù)據(jù)支撐和技術(shù)支撐.
選取在某項(xiàng)流行病蔓延的2020年1月15日至3月31日期間,國家電網(wǎng)遼寧省某電力公司的內(nèi)部數(shù)據(jù),得到了每天每個(gè)測量點(diǎn)的功率曲線數(shù)據(jù)圖,其中覆蓋了基本數(shù)據(jù)測試點(diǎn)有6746 個(gè),其中包含了用電人數(shù)有120 萬戶.結(jié)合電力系統(tǒng)當(dāng)中的實(shí)際問題和實(shí)際業(yè)務(wù),用電行業(yè)(用電類別)和用電客戶的實(shí)際核準(zhǔn)不進(jìn)行考慮,對(duì)于已經(jīng)長時(shí)間沒有活動(dòng)的用戶也不考慮.數(shù)據(jù)預(yù)處理主要進(jìn)行以下5 個(gè)步驟:
1)測量基站處理
對(duì)在上文提到的電力數(shù)據(jù)進(jìn)行初步的數(shù)據(jù)挖掘,發(fā)現(xiàn)有部分電力數(shù)據(jù)雖然是在2020年1月15日之后開始記錄數(shù)據(jù),但是對(duì)于這些測量點(diǎn)需要進(jìn)行是否是新舊測量點(diǎn)進(jìn)行判斷,在1月15日之后開始進(jìn)行記錄,這部分?jǐn)?shù)據(jù)的參考價(jià)值是比較大.在1月15日之前有數(shù)據(jù)的定義為舊測量基站,則是舊的測量基站這部分?jǐn)?shù)據(jù)的參考價(jià)值略低于前者.
2)全為負(fù)電力數(shù)據(jù)處理
全部為負(fù)的電力數(shù)據(jù)需要進(jìn)行數(shù)據(jù)處理,通過咨詢電力系統(tǒng)工程師,這種數(shù)據(jù)大概率是智能電表的正負(fù)兩極互相接反,可以把這些數(shù)據(jù)上的負(fù)號(hào)去掉,并不影響數(shù)據(jù)的使用和試驗(yàn)結(jié)果,以及模型的構(gòu)建.
采用INPHO軟件的MATCH-AT模塊進(jìn)行空中三角測量。平差采用嚴(yán)密的光束法區(qū)域網(wǎng)平差。在MATCH-AT上導(dǎo)入影像數(shù)據(jù),建立金字塔影像,然后導(dǎo)入影像曝光點(diǎn)坐標(biāo)數(shù)據(jù)、數(shù)碼相機(jī)參數(shù)和控制點(diǎn)成果,通過自動(dòng)匹配相關(guān)影像產(chǎn)生自動(dòng)匹配點(diǎn),對(duì)于點(diǎn)位不足區(qū)域,人工添加加密點(diǎn)。
3)部分為負(fù)電力數(shù)據(jù)處理
對(duì)于部分是負(fù)的電力數(shù)據(jù)需要特別的數(shù)據(jù)處理,因?yàn)檫@部分?jǐn)?shù)據(jù)和全部負(fù)電力數(shù)據(jù)的情況是不一樣的.首先要計(jì)算這類數(shù)據(jù)當(dāng)中每一類的電力負(fù)荷,然后計(jì)算部分負(fù)電力數(shù)據(jù)的最小值,還要計(jì)算正電力負(fù)荷的最大值,則可以看出整體上最大值的絕對(duì)值應(yīng)該是大于最小值的絕對(duì)值,在這部分?jǐn)?shù)據(jù)計(jì)算中使用更為精確的最小值分布.
最終確定數(shù)據(jù)處理方案是將所有小于?0.05 的電力數(shù)據(jù)當(dāng)中的負(fù)號(hào)去掉,然后對(duì)在?0.05~0 區(qū)間的電力數(shù)據(jù)利用前后一周的同一個(gè)測量基站做平均值替換.
4)缺失值電力數(shù)據(jù)處理
對(duì)于缺失值的電力數(shù)據(jù)則需要對(duì)同一個(gè)測量點(diǎn),前一周和后一周的數(shù)據(jù),計(jì)算某一時(shí)刻的電力負(fù)荷平均值,若前后一周的數(shù)據(jù)還是缺失的情況,還需要繼續(xù)延長一周,即兩周的電力負(fù)荷的平均值.如果兩周數(shù)據(jù)還是缺失的情況,需要丟掉該點(diǎn)數(shù)據(jù),因?yàn)樵俅窝娱L日期的話,這個(gè)點(diǎn)的數(shù)據(jù)價(jià)值是非常小的在7~15 天的周期里可以說明該測量點(diǎn)的價(jià)值,時(shí)間無限制延長是沒有價(jià)值的.
5)異常值的數(shù)據(jù)處理
異常值的處理需要分為3 個(gè)步驟,分別是縱向判斷、橫向判斷,在滿足前兩個(gè)判斷條件下,需要進(jìn)行利用縱向數(shù)據(jù)進(jìn)行替換[8-10].
橫向判斷是不同測量基站,在同一時(shí)間點(diǎn)獲取的負(fù)荷值進(jìn)行比較.橫向判斷條件如下:設(shè)y(i,t)表示基站i,在當(dāng)前日期t時(shí)刻負(fù)荷功率,m表示t時(shí)刻m個(gè)基站的檢測序列,t時(shí)刻m個(gè)基站的檢測序列的平均值是(1,2,···,m),標(biāo)準(zhǔn)差是σj(1,2,······,m).
如果y(i,t)同時(shí)滿足橫向判斷和縱向判斷兩個(gè)條件,就可以認(rèn)為該基站測量數(shù)據(jù)異常,需要進(jìn)行數(shù)值替換,替換方法為:
用電行為實(shí)際上是對(duì)用戶的用電行為分類進(jìn)行評(píng)價(jià),對(duì)現(xiàn)有的分類進(jìn)行匹配,以實(shí)現(xiàn)用電行為分類結(jié)果的最優(yōu)解,實(shí)現(xiàn)用電行為的最優(yōu)化、電力損失最小化.
按照不同的分類規(guī)則,將電力用戶聚類類別分成居民用戶、超商用戶、其他用戶類比如表1所示;將電力用戶聚類類別分成居民用戶、超商用戶、工業(yè)用戶、其他用戶類比如表2所示;將電力用戶聚類類別分成居民用戶、超商用戶、工業(yè)用戶、辦公用戶、娛樂場所用戶、其他用戶類比如表3所示.
表1 電力數(shù)據(jù)聚類占比結(jié)果(聚類數(shù)3 個(gè))(%)
表2 電力數(shù)據(jù)聚類占比結(jié)果(聚類數(shù)4 個(gè))(%)
表3 電力數(shù)據(jù)聚類占比結(jié)果(聚類數(shù)6 個(gè))(%)
通過對(duì)于表格中的數(shù)據(jù)進(jìn)行對(duì)比,可以發(fā)現(xiàn),聚類個(gè)數(shù)為4 個(gè).即表2電力數(shù)據(jù)聚類結(jié)果分析可以發(fā)現(xiàn),在疫情防控期間不同時(shí)間段負(fù)荷占比權(quán)重較大,各個(gè)類別之間的特點(diǎn)是比較明顯的.因此,對(duì)居民用戶、超商用戶、工業(yè)用戶、其他用戶進(jìn)行比較較為科學(xué)完備.但其他用戶中涵蓋類型較多、用戶特征不明顯,故本文選取居民用戶、超商用戶、工業(yè)用戶進(jìn)行分析.
工業(yè)用電是當(dāng)前最消耗電力的行業(yè),其中高電力消耗的產(chǎn)業(yè)有鋼鐵產(chǎn)業(yè)、化工行業(yè)、汽車產(chǎn)業(yè)、紡織產(chǎn)業(yè)、造紙業(yè)、副食品加工等行業(yè),在這些產(chǎn)業(yè)當(dāng)中,既有重工業(yè)耗電還有輕工業(yè)耗電,涉及到的行業(yè)種類是非常多的,而且由于每個(gè)產(chǎn)業(yè)都有自身的產(chǎn)業(yè)結(jié)構(gòu),導(dǎo)致每個(gè)產(chǎn)業(yè)都有各自的用電特性,并且這些產(chǎn)業(yè)之間的用電特性差別巨大.
本文選取的遼寧某地區(qū),其工業(yè)覆蓋電機(jī)制造、制藥、電子信息、成衣制造等行業(yè).根據(jù)遼寧省人民政府辦公廳通知,疫情防控必需(醫(yī)療器械、藥品、防護(hù)品生產(chǎn)和銷售等行業(yè))不得停工停產(chǎn).其中一部分企業(yè)處于停產(chǎn)狀態(tài),但一些制造業(yè)緊急轉(zhuǎn)型防護(hù)和消毒用品,對(duì)用電負(fù)荷產(chǎn)生一定的影響.由于涉及企業(yè)比較多,因此必須通過K-means 聚類算法對(duì)不同的工業(yè)項(xiàng)目電力曲線進(jìn)行聚類分析,從而精準(zhǔn)地確定不同產(chǎn)業(yè)的用電規(guī)律,然后有針對(duì)地提供電力服務(wù),其中包括可靠供電、信息通知、地址服務(wù)、設(shè)備租賃、供電渠道等服務(wù).圖1是遼寧某地區(qū)疫情防控期間工業(yè)電力曲線圖.
圖1 工業(yè)電力曲線圖
在本文當(dāng)中得到的內(nèi)部數(shù)據(jù),需要在內(nèi)部數(shù)據(jù)當(dāng)中利用大數(shù)據(jù)技術(shù)挖掘并分析出用戶的用電行為.但是從數(shù)據(jù)當(dāng)中包含了多個(gè)特征,既有一些挖掘價(jià)值比較大的電力數(shù)據(jù),也還有些挖掘數(shù)據(jù)比較小的電力數(shù)據(jù).因此,從得到的電力數(shù)據(jù)當(dāng)中挖掘和選擇出價(jià)值比較大的特征是研究用戶用電行為的前提.因此本文用式(1)~式(4)來處理數(shù)據(jù)特征[11-13].
最高值耗電率ΨH:
其中,SH為耗電高峰用量,S是耗電總量.
最低值耗電率ΨL:
其中,SL為耗電低峰用量,S是耗電總量.
正常耗電率 ΨF:
其中,SF是在正常時(shí)的耗電用量,S是耗電總量.每日耗電量峰值時(shí)刻Tmax:
其中,Pd.Tmax是一天當(dāng)中的最大的運(yùn)行負(fù)荷量[14-19].
在內(nèi)部數(shù)據(jù)當(dāng)中,提取到用戶特征之后,不同的特征值之間可能會(huì)有不同的值域.值域相差如果比較大的話,對(duì)整體矩陣的影響較大,這種影響會(huì)減弱數(shù)值比較小的特征值的作用,所以需要對(duì)特征值進(jìn)行規(guī)范化的處理.首先,選取5 個(gè)特征值,將每個(gè)用戶設(shè)為一個(gè)向量矩陣X=[x1,x2,···,xn],然后需要對(duì)所有的元素進(jìn)行統(tǒng)一化處理
把每個(gè)特征值規(guī)范化到區(qū)間[0,1]內(nèi),進(jìn)一步得到標(biāo)準(zhǔn)化的特征矩陣Y=[y1,y2,…,yn].其中yi∈[0,1],i=0,1,2,…,n.
基于改進(jìn)的K-means 算法的執(zhí)行步驟如算法1.
算法1.基于改進(jìn)K-means 算法用戶行為分析算法.輸入:包含n 個(gè)數(shù)據(jù)對(duì)象的數(shù)據(jù)集S、聚類簇K 的數(shù)目、鄰域的半徑、最小的數(shù)據(jù)樣本數(shù)量Mins.輸出:滿足判斷條件,且函數(shù)收斂的K 個(gè)收斂結(jié)果.Step 1.計(jì)算數(shù)據(jù)集S 中數(shù)據(jù)對(duì)象之間的歐式距離.Step 2.計(jì)算每個(gè)數(shù)據(jù)值域所包含的樣本數(shù)據(jù)數(shù),如果等于最小樣本數(shù)Mins,需要將這個(gè)對(duì)象放到高密度的集合當(dāng)中.如果密度小于Mins 的數(shù)據(jù)就應(yīng)該從數(shù)據(jù)集合當(dāng)中刪除.Step 3.把高密度的數(shù)據(jù)區(qū)域集合中的最大數(shù)據(jù)當(dāng)作第一個(gè)數(shù)據(jù)聚類中心,把這個(gè)聚類中心加入到聚類中心集合,然后把第一個(gè)數(shù)據(jù)聚類中心從高密度區(qū)域中刪除.Step 4.計(jì)算聚類中心和集合當(dāng)中的剩余的所有樣本的歐式距離,找出權(quán)值最大的樣本點(diǎn),然后在把最新的樣本點(diǎn)加入到聚類中心集合當(dāng)中,然后在刪除原來的聚類中心.Step 5.對(duì)Step 4 反復(fù)迭代,直到找到K 個(gè)聚類中心,加入到最新的聚類中心集合當(dāng)中.Step 6.組后利用得到的K 個(gè)聚類中心,輸出結(jié)果.
在本試驗(yàn)中主要是利用改進(jìn)后的K-means 算法對(duì)遼寧某地區(qū)流行病疫情爆發(fā)期負(fù)荷曲線進(jìn)行聚類分析,利用改進(jìn)后的K-means 算法將內(nèi)部的電力數(shù)據(jù)主要分成了3 類.每個(gè)分類的曲線特征在形態(tài)上的特征都具有各自的特征,他們?nèi)咧g的峰值時(shí)也有著比較大的差異,第1 類的曲線特征和峰值明顯與第2 類特征和第3 類特征和峰值曲線不同.定義第1 類用戶為居民用戶,第2 類用戶為超商業(yè)用戶,第3 類用戶為工業(yè)用戶.
根據(jù)第1 類的用戶基本負(fù)荷曲線情況可以看出,曲線表現(xiàn)出近似于拋物線的態(tài)勢走向.這類用戶的用電高峰可以推斷出是在晚上的19 點(diǎn)-21 點(diǎn)左右開始,用電的低值大概是在凌晨2 點(diǎn)-6 點(diǎn)左右,用電最低值大概是在凌晨3 點(diǎn)左右,因?yàn)檫@個(gè)時(shí)間的居民用戶都在休息,能耗基本是低耗能的照明和不普及的大功率取暖設(shè)備.而在早上7 點(diǎn)開始出現(xiàn)用電高峰,整體趨勢呈現(xiàn)較明顯上揚(yáng)趨勢,此時(shí)是使用高耗能較多的熱水器、電磁爐等設(shè)備的時(shí)刻.然后上午11 點(diǎn)開始到下午14 點(diǎn)左右,用戶的用電量開始趨于平緩,從下午17 點(diǎn)開始用電量開始增多,用電曲線呈現(xiàn)明顯的上揚(yáng)趨勢,而在晚上21 點(diǎn)左右達(dá)到最高峰,此時(shí)居民用戶基本都在家庭中活動(dòng),熱水器、空調(diào)、電視、電腦等均在使用中.23 點(diǎn)開始用電量開始下滑,居民開始停止使用耗電設(shè)備,進(jìn)入休息狀態(tài).
根據(jù)第2 類的用戶基本負(fù)荷曲線情況可以看出,用電曲線頁表現(xiàn)出一高一平一低的態(tài)勢走向.對(duì)于第1 種用戶來說,第2 類用戶的負(fù)荷量是比較高的.這類用戶的用電高峰可以推斷出是在早上8 點(diǎn)30 分左右開始,用電的低值大概是在晚上22 點(diǎn)到第二天早上8 點(diǎn)左右,其中用電最低值大概是在凌晨0 點(diǎn)到早晨7 點(diǎn).而在早上8 點(diǎn)開始出現(xiàn)用電高峰,整體趨勢呈現(xiàn)明顯上揚(yáng)趨勢,然后上午8 點(diǎn)開始到晚上22 點(diǎn)左右,用戶的用電量開始趨于平緩,期間都可以算作此用戶用電的最高峰,而且此時(shí)的峰值明顯超過第1 類的用戶.從曲線分析上可以看出第2 類用戶的峰值消耗電量明顯高于第1 類用戶,其用電負(fù)荷在高峰時(shí)比第1 類高,低峰時(shí)也比第1 類高的情況.第2 類用戶在此特征下具備比較大的用電行為調(diào)控.
根據(jù)第3 類的用戶基本負(fù)荷曲線情況可以看出,曲線上揚(yáng)態(tài)勢走向,而且用電量也是非常高的,即使是在部分工業(yè)停工的條件下仍高于第1 類和第2 類用戶的用電負(fù)荷.曲線呈現(xiàn)出一高一低的態(tài)勢.這類用戶的用電高峰可以推斷出是在上午8 點(diǎn)到晚20 點(diǎn)左右,用電的低值大概是在晚20 點(diǎn)到第二天早8 點(diǎn)左右,整個(gè)時(shí)間段都為用電最低值.其中在中午11 點(diǎn)到下午13 點(diǎn),會(huì)有短暫的負(fù)荷下降,那是由于這個(gè)時(shí)間是午休,設(shè)備及工廠處于待機(jī)狀態(tài).下午13 點(diǎn)以后開始出現(xiàn)用電高峰,整體趨勢呈現(xiàn)明顯上揚(yáng)趨勢,整個(gè)峰值狀態(tài)可以持續(xù)到晚上20 點(diǎn)左右,用戶負(fù)荷高峰狀態(tài)平穩(wěn).晚上20 點(diǎn)以后,工人下班,廠區(qū)徹底處于待機(jī)狀態(tài),整個(gè)用戶設(shè)備和用電損耗都為最低.這種低谷狀態(tài)可以持續(xù)到第二天的工作開始時(shí)間.這種用電趨勢在工業(yè)用戶領(lǐng)域,尤其是在疫情防控期間,為了趕工期、多生產(chǎn)還是具有非常顯著特征的,如圖2.
圖2 內(nèi)部數(shù)據(jù)聚類曲線圖
一般情況下正常的居民用電的高峰負(fù)荷向低峰轉(zhuǎn)移的能力非常小和手段也是非常少的.可以通過提高夜晚的負(fù)荷能力來平衡高峰始端的負(fù)荷.居民用戶可以通過口號(hào)宣傳節(jié)能用電等方式,讓其自主的響應(yīng)降低峰值的手段和措施,可以通過縮短娛樂時(shí)間和縮短使用電器,包括電腦和電視等的時(shí)間,來降低高峰,讓全民都參與到節(jié)約用電,注重生活小處,例如隨手關(guān)燈、出門關(guān)燈等習(xí)慣.鼓勵(lì)居民參與調(diào)峰管理,提高居民的節(jié)約能源的意識(shí).超商業(yè)用戶的用電峰谷明確,在疫情條件下有些許波動(dòng),都在負(fù)荷范圍之內(nèi).工業(yè)用戶在疫情中呈現(xiàn)明顯的縮減,部分用戶并沒有啟動(dòng)高耗能設(shè)備,但其負(fù)荷趨勢仍然明顯,可以通過分時(shí)電價(jià),并根據(jù)疫情期間生產(chǎn)品和生產(chǎn)能力給予電價(jià)優(yōu)惠政策來調(diào)節(jié)用電行為.電價(jià)政策調(diào)控表見表4.
表4 電價(jià)政策調(diào)控表
通過分析不同用戶體系的用電行為,不同的用戶體系,但這并不是電網(wǎng)體系下包含的全部用戶,只是單獨(dú)列舉幾類有代表的用戶.在用電行為分析的中,其實(shí)質(zhì)是對(duì)電力數(shù)據(jù)的分析和處理過程,在分析和處理的過程中,主要包含:用電行為的分類、對(duì)用電行為分類進(jìn)行分類診斷、根據(jù)用電日期,進(jìn)行不同用戶的用電行為優(yōu)化和用電行為的相似度匹配技術(shù).利用大數(shù)據(jù)技術(shù)對(duì)不同的用戶進(jìn)行用電行為分析,構(gòu)建不同的用戶體系的用電行為分析模型.并且對(duì)與電價(jià)的傾斜政策,給出了詳細(xì)的數(shù)據(jù)支撐,并給出了具體措施建議.