亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于非線(xiàn)性獨(dú)立成分估計(jì)的分布式光伏竊電數(shù)據(jù)增強(qiáng)方法

        2022-02-10 12:50:02楊藝寧廖文龍楊德昌
        電力系統(tǒng)自動(dòng)化 2022年2期
        關(guān)鍵詞:檢測(cè)

        薛 陽(yáng),楊藝寧,廖文龍,楊德昌

        (1.中國(guó)電力科學(xué)研究院有限公司,北京市 100192;2.奧爾堡大學(xué)能源技術(shù)系,奧爾堡9220,丹麥;3.中國(guó)農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院,北京市 100083)

        0 引言

        為鼓勵(lì)和支持分布式光伏發(fā)電項(xiàng)目,國(guó)家頒布了相關(guān)的法律、法規(guī),對(duì)光伏上網(wǎng)電量進(jìn)行補(bǔ)貼[1]。在此背景下,存在部分用戶(hù)通過(guò)一些不正當(dāng)?shù)募夹g(shù)手段,惡意篡改分布式光伏的上網(wǎng)電量值,以騙取高額的補(bǔ)貼。這種竊電行為嚴(yán)重影響了新能源政策的實(shí)施,給電力公司和社會(huì)造成了巨大的經(jīng)濟(jì)損失。因此,開(kāi)展分布式光伏竊電的早期檢測(cè)研究對(duì)于推動(dòng)可再生能源發(fā)電行業(yè)的發(fā)展具有重要的意義[2]。

        現(xiàn)有的分布式光伏竊電檢測(cè)方法可以分成有監(jiān)督分類(lèi)和無(wú)監(jiān)督回歸2 種[3]。其中,無(wú)監(jiān)督回歸法是指通過(guò)對(duì)比光伏發(fā)電量的實(shí)際值和預(yù)測(cè)值之間的偏差來(lái)判定竊電現(xiàn)象,該方法適用于尚未構(gòu)建光伏竊電數(shù)據(jù)集時(shí)的檢測(cè),且存在難以設(shè)定閾值和檢測(cè)準(zhǔn)確率低的問(wèn)題[4-5]?;谟斜O(jiān)督分類(lèi)的分布式光伏竊電檢測(cè)方法主要包括:支持向量機(jī)(support vector machine,SVM)、多層感知機(jī)(multi-layer perceptron,MLP)、貝葉斯網(wǎng)絡(luò)和極限梯度提升樹(shù)(extreme gradient boosting,XGBoost)等傳統(tǒng)數(shù)據(jù)挖掘方法[6-9]以及深度神經(jīng)網(wǎng)絡(luò),如深度置信網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[10-12]。其中,傳統(tǒng)的數(shù)據(jù)挖掘方法的原理比較簡(jiǎn)單,對(duì)數(shù)據(jù)量的要求不高,且應(yīng)用范圍廣。但它們普遍存在特征提取能力低、檢測(cè)準(zhǔn)確率有限的問(wèn)題。相對(duì)而言,深度神經(jīng)網(wǎng)絡(luò)不僅具有強(qiáng)大的特征提取能力,而且能映射復(fù)雜的非線(xiàn)性關(guān)系,比傳統(tǒng)方法具有更高的檢測(cè)精度。

        數(shù)據(jù)集中包含足夠豐富的竊電樣本是確保深度神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)泛化能力的基礎(chǔ)。然而,由于用戶(hù)數(shù)量大、竊電方式隱蔽性強(qiáng)以及稽查資源有限等原因,導(dǎo)致反竊電工作難度大。在實(shí)際工程中,電力公司已掌握的竊電樣本數(shù)量有限,難以滿(mǎn)足深度神經(jīng)網(wǎng)絡(luò)對(duì)于數(shù)據(jù)量的要求[13]。因此,如何利用有限的竊電樣本進(jìn)行數(shù)據(jù)增強(qiáng),從而提升竊電檢測(cè)的準(zhǔn)確率,是當(dāng)前亟待解決的問(wèn)題。一些國(guó)內(nèi)外專(zhuān)家對(duì)此展開(kāi)了初步的研究,文獻(xiàn)[14]提出了基于合成少數(shù)類(lèi)過(guò)采樣技術(shù)(synthetic minority oversampling technique,SMOTE)的竊電曲線(xiàn)生成方法,將鄰近的樣本進(jìn)行交叉操作來(lái)生成新樣本。該方法雖然可以增加訓(xùn)練樣本的數(shù)量,但是無(wú)法兼顧數(shù)據(jù)的整體分布特征,對(duì)分類(lèi)器性能的提升較為有限。文獻(xiàn)[15]構(gòu)建了變分自動(dòng)編碼器(variational autoencoder,VAE),以服從先驗(yàn)分布的隨機(jī)噪聲作為解碼器的輸入?yún)?shù),獲得指定類(lèi)型的光伏功率曲線(xiàn),但其在增加樣本數(shù)量的同時(shí)也帶來(lái)了原樣本不具有的噪聲,導(dǎo)致新樣本的質(zhì)量不高。文獻(xiàn)[16]利用生成式對(duì)抗網(wǎng)絡(luò)(generative adversarial network,GAN)來(lái)模擬竊電功率曲線(xiàn),相對(duì)于傳統(tǒng)的過(guò)采樣方法具有更高的精度,但其存在調(diào)參難度大和訓(xùn)練過(guò)程不穩(wěn)定的問(wèn)題。

        非線(xiàn)性獨(dú)立成分估計(jì)(non-linear independent components estimation,NICE)是繼GAN 和VAE 之后,學(xué)術(shù)界廣為認(rèn)可的一種生成模型。相對(duì)于前兩者,NICE 具有準(zhǔn)確的隱變量推理和對(duì)數(shù)似然估計(jì),可用于學(xué)習(xí)復(fù)雜數(shù)據(jù)的潛在分布規(guī)律,并生成高質(zhì)量的新樣本[17]。目前,NICE 在圖像修復(fù)、數(shù)據(jù)生成和自然語(yǔ)言處理等領(lǐng)域取得了較好的應(yīng)用效果[18-19],但在分布式光伏竊電數(shù)據(jù)生成中的應(yīng)用仍然處于初級(jí)階段。理論分析上,NICE 可以通過(guò)無(wú)監(jiān)督學(xué)習(xí)得到竊電樣本的潛在規(guī)律,并生成符合相應(yīng)分布特征的新樣本,但在實(shí)際應(yīng)用時(shí),如何根據(jù)竊電樣本的數(shù)據(jù)特征,設(shè)計(jì)出一種可以生產(chǎn)高質(zhì)量樣本的網(wǎng)絡(luò)結(jié)構(gòu),是亟待研究的熱點(diǎn)問(wèn)題。

        在此背景下,本文提出了一種基于NICE 的分布式光伏竊電數(shù)據(jù)增強(qiáng)方法。通過(guò)無(wú)監(jiān)督學(xué)習(xí)能夠生成與測(cè)試集高度相似的竊電樣本,解碼器僅需要輸入高斯噪聲,便可生成任意多個(gè)竊電樣本數(shù)據(jù),從而為分類(lèi)器提供數(shù)據(jù)支撐。相對(duì)于VAE 和GAN 等深度生成模型,NICE 的訓(xùn)練過(guò)程具有較好的收斂性,通過(guò)準(zhǔn)確的隱變量推理和對(duì)數(shù)似然估計(jì),可充分挖掘出竊電樣本的潛在分布特征,生成更高質(zhì)量的新樣本。

        1 基于NICE 的竊電數(shù)據(jù)增強(qiáng)

        NICE 已經(jīng)在計(jì)算機(jī)視覺(jué)領(lǐng)域展現(xiàn)出了強(qiáng)大的數(shù)據(jù)生成能力。相對(duì)于VAE 只能近似推理竊電樣本的對(duì)數(shù)似然的下界和GAN 不涉及隱變量的計(jì)算,NICE 通過(guò)對(duì)竊電樣本進(jìn)行編碼得到隱變量,不僅可以實(shí)現(xiàn)精確推理,而且可以計(jì)算竊電樣本的準(zhǔn)確對(duì)數(shù)似然。NICE 直接計(jì)算竊電樣本的分布,可以生成服從潛在分布的竊電數(shù)據(jù)[20]。

        本文所提出的光伏竊電數(shù)據(jù)生成方法如圖1 所示。在編碼過(guò)程,NICE 通過(guò)學(xué)習(xí)多個(gè)可逆函數(shù)變換,將竊電樣本映射到隱變量空間;在解碼過(guò)程,對(duì)隱變量空間進(jìn)行采樣以獲得隨機(jī)噪聲,并利用反變換將其映射回竊電樣本空間,以獲得新的竊電樣本。因此,NICE 在訓(xùn)練時(shí)的輸入變量是真實(shí)樣本。訓(xùn)練完成以后,通過(guò)輸入隨機(jī)噪聲給解碼器,解碼器將產(chǎn)生新的樣本。

        圖1 光伏竊電數(shù)據(jù)生成方法Fig.1 Method for generating photovoltaic electricity theft data

        令x為竊電樣本,(fx)為從輸入數(shù)據(jù)空間到隱變量空間的映射,z為通過(guò)映射(fx)得到的隱變量。為了直接采樣且不丟失任何信息,要求(fx)具有可逆性質(zhì)。此外,(fx)還要保證z的分布pZ(z)在各個(gè)維度d上是獨(dú)立的,可以被分解成它們的乘積[21]:

        式中:∏為連續(xù)乘積算子;pZd(zd)為第d個(gè)維度的隱變量服從的分布;D為隱變量z和竊電樣本x的維度。

        在得到隱變量z的分布以后,便可對(duì)其進(jìn)行抽樣,再利用逆變換f-1(z)得到新的竊電樣本。通過(guò)變量代換法則,得到竊電樣本x服從的概率分布如下:

        式中:J為(fx)在竊電樣本x處的雅可比矩陣;det(·)為行列式。

        由于學(xué)習(xí)的目標(biāo)是通過(guò)優(yōu)化f(x)得出最大化樣本的概率分布,等價(jià)于最大化對(duì)數(shù)概率分布如下:

        由于z服從的分布在各個(gè)維度上都是獨(dú)立的,式(3)又可以表示為:

        基于以上推導(dǎo),可得到數(shù)據(jù)的損失函數(shù),關(guān)于可逆函數(shù)的推導(dǎo)過(guò)程見(jiàn)附錄A 第A1 章。

        2 基于數(shù)據(jù)增強(qiáng)的分布式光伏竊電檢測(cè)

        2.1 光伏竊電模型

        分布式光伏發(fā)電通過(guò)光伏陣列將太陽(yáng)能轉(zhuǎn)換成電能,經(jīng)過(guò)逆變器輸出交流電,一部分提供給本地負(fù)荷使用,另外一部分并網(wǎng)傳輸?shù)酵獠?。其中,關(guān)口電表用于記錄用戶(hù)從外網(wǎng)獲取的電量,而光伏計(jì)量表是記錄光伏電站發(fā)出的電量。不同于傳統(tǒng)的竊電方式,分布式光伏竊電主要通過(guò)篡改光伏計(jì)量表和關(guān)口電表來(lái)騙取高額補(bǔ)貼。目前,3 種典型的光伏竊電方式介紹如下[22]。

        1)光伏計(jì)量表升壓法(升流法)

        竊電者通過(guò)升壓變壓器來(lái)提升光伏計(jì)量表的測(cè)量電壓,或?qū)㈦娏靼l(fā)生器產(chǎn)生的工頻電流疊加在測(cè)量電流上,促使測(cè)量功率高于正常值,導(dǎo)致電表轉(zhuǎn)速加快,以多計(jì)量發(fā)電量騙取補(bǔ)貼。這種竊電方式的數(shù)學(xué)模型如下:

        式中:P′和P分別為測(cè)量功率和真實(shí)功率;U和I分別為光伏計(jì)量表的真實(shí)電壓和電流值;ΔU和ΔI分別為通過(guò)某種手段增加的電壓和電流值。

        2)市電整流逆變法

        竊電者將外網(wǎng)獲取的交流電整流成直流電,并聯(lián)在光伏發(fā)電系統(tǒng)的直流側(cè),再利用光伏逆變器將其轉(zhuǎn)化成交流電上網(wǎng)。該竊電方式的數(shù)學(xué)模型如下:

        式中:ΔP為從外網(wǎng)獲取的電量。

        3)市電改接法

        竊電者將光伏計(jì)量表用于記錄從外網(wǎng)獲取的電量,光伏計(jì)量表的數(shù)據(jù)實(shí)際上是用戶(hù)的耗電量,功率曲線(xiàn)和傳統(tǒng)的光伏輸出功率曲線(xiàn)差異較大,其數(shù)學(xué)模型可以表示如下:

        式中:Pi為第i種家用電器(如電燈、洗衣機(jī)和空調(diào)等)的耗電量;m為家用電器的數(shù)量。

        2.2 模型的輸入和輸出變量

        分布式光伏發(fā)電的輸出功率和氣象因素具有很強(qiáng)的相關(guān)性,早上和傍晚的光照強(qiáng)度相對(duì)較弱,對(duì)應(yīng)的輸出功率較小。對(duì)于市電改接法而言,其竊電功率曲線(xiàn)不隨氣象因素變化而變化,測(cè)量值和實(shí)際值的偏差較大。此外,前2 種典型的光伏竊電方式也存在測(cè)量值高于實(shí)際值的特征。因此,本文將各個(gè)采樣點(diǎn)預(yù)測(cè)值和測(cè)量值的偏差作為分類(lèi)器的輸入變量,其數(shù)學(xué)公式如下:

        式中:X為分類(lèi)器的輸入變量;ΔPn為第n次采樣時(shí)測(cè)量值和實(shí)際值的偏差;n為一天內(nèi)采樣的總次數(shù)。

        分類(lèi)器的輸出變量是分布式光伏發(fā)電的狀態(tài)類(lèi)型,包括正常、光伏計(jì)量表升壓法(升流法)竊電、市電整流逆變法竊電和市電改接法竊電。在訓(xùn)練分類(lèi)器時(shí),為便于計(jì)算損失函數(shù),利用獨(dú)熱編碼對(duì)其進(jìn)行預(yù)處理,如附錄A 表A1 所示。

        2.3 基于CNN 的光伏竊電檢測(cè)

        作為深度學(xué)習(xí)的代表算法之一,CNN 以其強(qiáng)大的特征提取能力被廣泛應(yīng)用于圖像分類(lèi)、故障診斷和序列預(yù)測(cè)等領(lǐng)域,并取得了顯著的效果[23-24]。相對(duì)于傳統(tǒng)的分類(lèi)方法,CNN 不僅可以映射更加復(fù)雜的非線(xiàn)性關(guān)系,而且具有優(yōu)良的泛化能力。因此,本文選擇CNN 作為分布式光伏竊電檢測(cè)的分類(lèi)器。

        CNN 由卷積層、池化層、平坦層、舍棄層和全連接層組成。其中,卷積層和池化層負(fù)責(zé)竊電樣本的特征提取模塊,平坦層作為池化層和全連接層之間的橋梁,起到格式變換的作用。舍棄層以一定概率令部分神經(jīng)元失效,以緩解過(guò)擬合。根據(jù)竊電樣本的數(shù)據(jù)特征,進(jìn)行多次試驗(yàn)求得合適的結(jié)構(gòu)和參數(shù),如附錄A 圖A1 所示。

        CNN 的輸入是分布式光伏發(fā)電預(yù)測(cè)值和測(cè)量值的偏差,以1 h 的采樣時(shí)間分辨率為例,說(shuō)明數(shù)據(jù)流的變化過(guò)程。首先,為便于處理數(shù)據(jù),在偏差向量的末端補(bǔ)充1 個(gè)0 元素,并利用Python 的Reshape 函數(shù)把1×25 的偏差向量重構(gòu)成5×5×1 的3 維張量,作為卷積層的輸入數(shù)據(jù)。然后,利用2 個(gè)卷積層和1 個(gè)最大池化層提取關(guān)鍵特征。濾波器的數(shù)量分別為16 和32,卷積核和池化窗口的尺寸均為2×2,池化層后面接有概率為0.25 的舍棄層。池化層后連接的是2 個(gè)神經(jīng)元數(shù)量分別為10 和4 的全連接層。除最后一層使用歸一化指數(shù)函數(shù)Softmax 激活函數(shù)以外,剩下的各層均使用線(xiàn)性整流函數(shù)ReLU。其中,損失函數(shù)為多分類(lèi)交叉熵,優(yōu)化器為Adadelta算法。

        2.4 基于數(shù)據(jù)增強(qiáng)的竊電檢測(cè)流程

        綜上所述,基于NICE 進(jìn)行數(shù)據(jù)增強(qiáng)的分布式光伏竊電檢測(cè)過(guò)程如附錄A 圖A2 所示。具體步驟如下。

        步驟1:數(shù)據(jù)預(yù)處理。首先,以歷史光伏功率和氣象因素作為自變量,短期光伏輸出功率作為因變量,訓(xùn)練一個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò)[25]。然后,利用這個(gè)訓(xùn)練好的循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)得到分布式光伏在各時(shí)刻的輸出功率預(yù)測(cè)值,并計(jì)算各時(shí)刻預(yù)測(cè)值和測(cè)量值的偏差,將其作為NICE 和CNN 的輸入變量,并對(duì)分布式光伏的竊電類(lèi)型進(jìn)行獨(dú)熱編碼,作為CNN 的輸出變量。由于數(shù)據(jù)差異過(guò)大會(huì)影響模型的精度,需要對(duì)導(dǎo)入的各時(shí)刻偏差數(shù)據(jù)進(jìn)行如下的歸一化處理:

        步驟2:NICE 訓(xùn)練。在編碼階段,利用多個(gè)可逆函數(shù)(這里使用多層感知機(jī))將各時(shí)刻偏差值的分布映射到高斯分布上。在解碼階段,以高斯噪聲作為輸入數(shù)據(jù),經(jīng)過(guò)多層感知機(jī)得到各時(shí)刻偏差的模擬值。進(jìn)一步計(jì)算損失函數(shù),并由反向傳播算法更新網(wǎng)絡(luò)的權(quán)重。當(dāng)達(dá)到設(shè)定的迭代次數(shù)時(shí),截取NICE 的解碼器生成新樣本,用于訓(xùn)練CNN。

        步驟3:CNN 訓(xùn)練。NICE 產(chǎn)生的樣本和原始的訓(xùn)練集一起用來(lái)訓(xùn)練CNN。在訓(xùn)練過(guò)程中,由卷積層和池化層提取輸入變量的特征,通過(guò)全連接層輸出樣本的標(biāo)簽,用于計(jì)算多分類(lèi)交叉熵?fù)p失函數(shù),最后利用反向傳播算法更新網(wǎng)絡(luò)的權(quán)重。

        步驟4:評(píng)估模型性能。對(duì)于多分類(lèi)問(wèn)題,僅以準(zhǔn)確率來(lái)評(píng)估模型的性能會(huì)過(guò)于單一,本文還選用宏平均F1 分?jǐn)?shù)(macro-averaged F1 score,Macro F1)和幾何平均(geometric mean,G-mean)來(lái)評(píng)估CNN 對(duì)于測(cè)試集的性能[26]。其中,Macro F1 和Gmean 都屬于正向指標(biāo),即數(shù)值越大效果越好。

        3 算例分析

        3.1 仿真算例

        3.1.1 數(shù)據(jù)和參數(shù)設(shè)置

        為充分測(cè)試所提方法的性能,采用源于美國(guó)可再生能源實(shí)驗(yàn)室的實(shí)際運(yùn)行數(shù)據(jù)來(lái)仿真和分析[27]。該數(shù)據(jù) 集包含2016 年1 月1 日 到2018 年12 月31日期間,每小時(shí)的光伏發(fā)電量以及對(duì)應(yīng)的氣象數(shù)據(jù)。利用皮爾遜相關(guān)系數(shù)來(lái)衡量各個(gè)因素與光伏發(fā)電量之間的相關(guān)性,以篩選出與光伏發(fā)電量相關(guān)性強(qiáng)的因素,作為循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入變量。

        利用2.1 節(jié)提出的3 種光伏竊電模型得到分布式光伏的竊電樣本。其中,各種狀態(tài)對(duì)應(yīng)的樣本數(shù)量如附錄A 表A2 所示。

        所提方法的運(yùn)行環(huán)境是開(kāi)源的Spyder 平臺(tái),深度學(xué)習(xí)框架是keras 2.2.4,計(jì)算機(jī)配置為:第10 代英特爾酷睿i5-10210U 型號(hào)的處理器,CPU 的基頻為1.6 GHz,最高頻為4.2 GHz,8 GB 的內(nèi)存容量。

        3.1.2 NICE 的性能

        NICE 的輸入變量是分布式光伏發(fā)電量的預(yù)測(cè)值和實(shí)際值之間的偏差。以一天24 個(gè)采樣點(diǎn)為例,利用文獻(xiàn)[28]的試探法找到一個(gè)合適的結(jié)構(gòu)和參數(shù),如附錄A 圖A3 所示。在NICE 中,構(gòu)建了4 個(gè)加性耦合層,利用MLP 來(lái)模擬可逆函數(shù),MLP 為5 層結(jié)構(gòu),每層的神經(jīng)元數(shù)量均為10 個(gè),激活函數(shù)為ReLU。優(yōu)化器為Adam 算法,總迭代次數(shù)為1 000 次。

        為了觀察NICE 的訓(xùn)練穩(wěn)定性,附錄A 圖A4 展示了損失函數(shù)隨迭代次數(shù)的變化情況。隨著迭代次數(shù)的增加,損失函數(shù)逐漸下降,當(dāng)訓(xùn)練次數(shù)大于400 次時(shí),損失函數(shù)的值趨于穩(wěn)定,這說(shuō)明NICE 已經(jīng)進(jìn)入收斂狀態(tài)。整個(gè)訓(xùn)練過(guò)程比較平穩(wěn),不存在類(lèi)似GAN 的損失函數(shù)劇烈波動(dòng)、難以收斂的問(wèn)題。

        當(dāng)訓(xùn)練完NICE 后,以816 個(gè)(各狀態(tài)生成204 個(gè),合計(jì)816 個(gè))維度為24 的高斯噪聲作為解碼器的輸入變量,得到816 個(gè)新的竊電樣本,即訓(xùn)練樣本擴(kuò)大了2 倍。然后,從測(cè)試集中選擇部分竊電樣本,用于驗(yàn)證NICE 產(chǎn)生的竊電樣本的有效性,如圖2 所示。

        圖2 第1 個(gè)數(shù)據(jù)集的測(cè)試樣本和生成樣本Fig.2 Test samples and generated samples of the 1st dataset

        從圖2 左邊一列可以看出,NICE 產(chǎn)生的3 種竊電樣本和測(cè)試集中的竊電樣本形狀非常接近,而測(cè)試集中的竊電樣本并沒(méi)有參與模型的訓(xùn)練過(guò)程,這說(shuō)明NICE 具有較強(qiáng)的泛化能力,產(chǎn)生的竊電樣本比較符合實(shí)際場(chǎng)景。

        除直接觀察竊電樣本的形狀以外,還可以進(jìn)一步從統(tǒng)計(jì)學(xué)角度(如累積分布函數(shù))上對(duì)NICE 的有效性進(jìn)行驗(yàn)證。從圖2 右邊一列可以看出,NICE 生成的竊電樣本和測(cè)試集的竊電樣本在累積概率分布上非常接近,這說(shuō)明NICE 在學(xué)習(xí)竊電樣本形狀的同時(shí),還能兼顧歷史數(shù)據(jù)的分布特征,生成竊電樣本的性能較好。

        3.1.3 不同數(shù)據(jù)增強(qiáng)方法的性能對(duì)比

        為說(shuō)明NICE 生成竊電樣本的有效性,以SMOTE、GAN 和VAE 等方法作為基準(zhǔn),將原始訓(xùn)練集的樣本擴(kuò)充至原來(lái)的2 倍,并對(duì)比CNN 在數(shù)據(jù)增強(qiáng)前、后的各項(xiàng)指標(biāo)值如表1 所示。

        表1 不同數(shù)據(jù)增強(qiáng)方法下的結(jié)果Table 1 Results of different data augmentation methods

        1)采用各種不同方法對(duì)原始訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,CNN 的檢測(cè)性能有了明顯提升。其中,利用SMOTE 對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,CNN 的準(zhǔn)確率、Macro F1 和G-mean 指標(biāo)比原始訓(xùn)練集分別提高了2.08%、2.04%和1.85%;利用VAE 對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,CNN 的準(zhǔn)確率、Macro F1 和Gmean 指標(biāo)比原始訓(xùn)練集分別提高了2.17%、2.18%和2.25%;利用GAN 對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,CNN 的準(zhǔn)確率、Macro F1 和G-mean 指標(biāo)比原始 訓(xùn)練集分別提高了2.54%、2.54% 和2.58%;利用NICE 對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,CNN 的準(zhǔn)確率、Macro F1 和G-mean 指標(biāo)比原始訓(xùn)練集分別提高了4.35%、4.36%和4.41%。

        2)對(duì)比SMOTE 和其他算法的各項(xiàng)指標(biāo)發(fā)現(xiàn),SMOTE 對(duì)于CNN 性能的提升效果弱于其他3 種生成網(wǎng)絡(luò)。這是因?yàn)镾MOTE 通過(guò)線(xiàn)性插值的方式生成新的竊電樣本,生成的新樣本和舊樣本具有較高的相似性,分類(lèi)器容易發(fā)生過(guò)擬合,導(dǎo)致模型的精度難以得到進(jìn)一步提升。

        3)相對(duì)而言,3 種生成網(wǎng)絡(luò)通過(guò)無(wú)監(jiān)督學(xué)習(xí)竊電樣本的分布特征,并基于抽樣生成的新樣本更具多樣性。因此,它們對(duì)于CNN 的提升效果優(yōu)于SMOTE。此外,由于VAE 只能近似推理竊電樣本的對(duì)數(shù)似然的下界和GAN 存在訓(xùn)練過(guò)程不穩(wěn)定等問(wèn)題,而NICE 可以通過(guò)編碼得到隱變量,準(zhǔn)確地計(jì)算竊電樣本的對(duì)數(shù)似然,導(dǎo)致NICE 對(duì)CNN 性能的提升效果最明顯。

        3.1.4 NICE 的適應(yīng)性分析

        為了測(cè)試NICE 生成的竊電樣本對(duì)于不同分類(lèi)器的適應(yīng)性,以常見(jiàn)的分類(lèi)器(SVM、MLP 和XGBoost)為基準(zhǔn),比較不同分類(lèi)器在數(shù)據(jù)增強(qiáng)前、后的性能。其中,各個(gè)分類(lèi)器的結(jié)構(gòu)和參數(shù)由試探法確定如下[28]。

        SVM 內(nèi)核為徑向基函數(shù),利用MATLAB2018a的fitcecoc 函數(shù)來(lái)完成對(duì)竊電樣本的擬合和檢測(cè)。對(duì)于MLP,輸入層的神經(jīng)元數(shù)量為24 個(gè),隱含層由3 層全連接層構(gòu)成,其神經(jīng)元數(shù)量均為10 個(gè),輸出層的神經(jīng)元數(shù)量為4 個(gè)。對(duì)于XGBoost,基學(xué)習(xí)器為gbtree,樹(shù)的最大深度為6,隨機(jī)采樣的比例為0.7,權(quán)重的L2 正則化項(xiàng)為2,gamma 值為0.1。分別采用數(shù)據(jù)增強(qiáng)前、后的樣本訓(xùn)練上述的各個(gè)基礎(chǔ)分類(lèi)器,并測(cè)試它們對(duì)測(cè)試集的性能,如表2 所示。

        表2 不同分類(lèi)器的檢測(cè)結(jié)果Table 2 Detection results of different classifiers

        1)準(zhǔn)確率表征的是模型正確挑選出正類(lèi)和負(fù)類(lèi)的概率,若分類(lèi)結(jié)果存在不平衡問(wèn)題,準(zhǔn)確率會(huì)受到較大的影響。因此,本文也選擇Macro F1 和Gmean 來(lái)評(píng)估模型的性能。由表2 可以看出,各種算法的準(zhǔn)確率、Macro F1 和G-mean 指標(biāo)的值相差不多,這說(shuō)明模型正確診斷各種竊電類(lèi)型的概率很接近。此外,G-mean 值都大于0,說(shuō)明模型對(duì)于每一種竊電類(lèi)型都不存在漏檢的現(xiàn)象。

        2)NICE 對(duì)原始的訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,各種分類(lèi)器的檢測(cè)性能有了顯著提升。其中,CNN 的準(zhǔn)確率、Macro F1 和G-mean 指標(biāo)比原始訓(xùn)練集分別提高了4.35%、4.36%和4.41%;MLP 的準(zhǔn)確率、Macro F1 和G-mean 指標(biāo)比原始訓(xùn)練集分別提高了3.99%、4.00%和4.09%;SVM 的準(zhǔn)確率、Macro F1和G-mean 指標(biāo)比原始訓(xùn)練集分別提高了3.26%、3.22% 和3.18%;XGBoost 的準(zhǔn)確率、Macro F1 和G-mean 指標(biāo)比原始訓(xùn)練集分別提高了2.17%、2.32%和2.78%。這說(shuō)明NICE 通過(guò)無(wú)監(jiān)督學(xué)習(xí)生成的新樣本可以有效提升分布式光伏竊電檢測(cè)的精度,對(duì)于不同的基礎(chǔ)分類(lèi)器具有適應(yīng)性。

        3.2 實(shí)際算例

        為進(jìn)一步說(shuō)明所提方法的有效性,在澳洲電網(wǎng)公司Ausgrid 提供的實(shí)際光伏數(shù)據(jù)集上進(jìn)行仿真和分析[29]。該數(shù)據(jù)集統(tǒng)計(jì)了300 個(gè)家庭從2012 年7 月1 日到2013 年6 月30 日的光伏發(fā)電量數(shù)據(jù),對(duì)應(yīng)的氣象數(shù)據(jù)來(lái)源于氣象局,時(shí)間分辨率均為30 min。利用預(yù)測(cè)法識(shí)別數(shù)據(jù)集中的竊電樣本[3,22],數(shù)據(jù)集中樣本對(duì)應(yīng)的標(biāo)簽分為0(正常樣本)或1(竊電樣本)2 類(lèi)。經(jīng)過(guò)數(shù)據(jù)清洗和篩選后,數(shù)據(jù)集中剩下1 000 個(gè)樣本,其中竊電樣本和正常樣本各占一半。80%的樣本用于訓(xùn)練模型,剩下的20%用于評(píng)估模型的性能。

        以1 000 個(gè)維度為16 的高斯噪聲作為解碼器的輸入變量,得到新的竊電樣本,并從測(cè)試集中選擇部分竊電樣本,用于驗(yàn)證NICE 的有效性,如圖3所示。

        圖3 第2 個(gè)數(shù)據(jù)集的測(cè)試樣本和生成樣本Fig.3 Test samples and generated samples of the 2nd dataset

        圖3(a)展示了實(shí)際的竊電樣本和NICE 生成的竊電樣本,發(fā)現(xiàn)它們的形狀和趨勢(shì)非常相似,這說(shuō)明NICE 可以很好地模擬竊電樣本的形狀特征。進(jìn)一步,圖3(b)對(duì)比了實(shí)際竊電樣本和新竊電樣本的自相關(guān)函數(shù),可以發(fā)現(xiàn)它們的自相關(guān)函數(shù)基本重合,說(shuō)明NICE 生成的新竊電樣本能夠很好地還原實(shí)際竊電樣本的時(shí)間相關(guān)性。此外,圖3(c)依次繪制了實(shí)際樣本和生成樣本的概率密度函數(shù)和累積分布函數(shù),可以發(fā)現(xiàn)生成的竊電樣本的概率分布和實(shí)際竊電樣本的概率分布基本一致,說(shuō)明NICE 能夠很好地捕獲竊電樣本的概率分布特征。

        為進(jìn)一步說(shuō)明NICE 生成竊電樣本的有效性,仍以SMOTE、GAN 和VAE 作為基準(zhǔn),將原始訓(xùn)練集的樣本擴(kuò)充至原來(lái)的2 倍,并統(tǒng)計(jì)CNN 對(duì)于測(cè)試集的準(zhǔn)確率,分析結(jié)果如圖4 所示(該數(shù)據(jù)集對(duì)應(yīng)的竊電檢測(cè)屬于二分類(lèi)問(wèn)題,無(wú)須統(tǒng)計(jì)Macro F1 和Gmean 指標(biāo))。

        圖4 不同數(shù)據(jù)增強(qiáng)方法下的準(zhǔn)確率Fig.4 Accuracy of different data augmentation methods

        從圖4 可以看出,各種不同的方法對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)都有利于提升CNN 的竊電檢測(cè)性能。其中,利用SMOTE 對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,CNN 的準(zhǔn)確率比原始訓(xùn)練集提高了1.15%;利用VAE 對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,CNN 的準(zhǔn)確率比原始訓(xùn)練集提高了2.60%;利用GAN 對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,CNN 的準(zhǔn)確率比原始訓(xùn)練集提高了4.36%;利用NICE 對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,CNN的準(zhǔn)確率比原始訓(xùn)練集提高了5.49%。與現(xiàn)有的數(shù)據(jù)增強(qiáng)方法相比,文中所提的NICE 對(duì)原始訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,CNN 性能的提升效果最顯著。

        為進(jìn)一步說(shuō)明NICE 對(duì)于不同分類(lèi)器的適應(yīng)性,仍以SVM、MLP 和XGBoost 為基準(zhǔn),比較不同分類(lèi)器在數(shù)據(jù)增強(qiáng)前、后的性能。利用NICE 將原始訓(xùn)練集的樣本擴(kuò)充至原來(lái)的2 倍,并統(tǒng)計(jì)各個(gè)分類(lèi)器對(duì)于測(cè)試集的準(zhǔn)確率如表3 所示。

        表3 不同分類(lèi)器的準(zhǔn)確率Table 3 Accuracy of different classifiers

        從表3 可以看出,NICE 對(duì)原始的訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,各種分類(lèi)器的準(zhǔn)確率都得到了一定程度的提升。其中,CNN 的準(zhǔn)確率比原始訓(xùn)練集提高了4.49%,MLP 的準(zhǔn)確率比原始訓(xùn)練集提高了2.95%,SVM 的準(zhǔn)確率比原始訓(xùn)練集提高了4.31%,XGBoost 的準(zhǔn)確率比原始訓(xùn)練集提高了3.22%,這說(shuō)明NICE 生成的竊電樣本有益于提升竊電檢測(cè)的準(zhǔn)確率,且對(duì)于不同的分類(lèi)器都有一定的提升效果。

        4 結(jié)語(yǔ)

        針對(duì)反竊電工作難度大且現(xiàn)有分布式光伏竊電樣本數(shù)量有限的問(wèn)題,本文提出了一種基于NICE的分布式光伏竊電數(shù)據(jù)增強(qiáng)方法。首先,結(jié)合竊電樣本的數(shù)據(jù)特征,對(duì)NICE 的原理和結(jié)構(gòu)進(jìn)行了介紹和分析。然后,提出了3 種典型光伏竊電模型。接著,針對(duì)竊電樣本的數(shù)據(jù)特征構(gòu)建了CNN 作為基礎(chǔ)分類(lèi)器,并介紹了模型的輸入變量和狀態(tài)編碼。最后,通過(guò)仿真算例和實(shí)際算例進(jìn)行了分析,得到以下結(jié)論:

        1)NICE 的訓(xùn)練過(guò)程較為平穩(wěn)、收斂速度快,具有較強(qiáng)的泛化能力,生成的竊電樣本具有與真實(shí)竊電樣本相似的形狀和分布特征;

        2)相對(duì)于SMOTE、VAE 和GAN 等已有的數(shù)據(jù)增強(qiáng)方法,NICE 對(duì)原始訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng)后,CNN 的準(zhǔn)確 率、Macro F1 和G-mean 值均為最大,說(shuō)明NICE 生成的新樣本對(duì)于檢測(cè)性能的提升效果最顯著;

        3)相對(duì)于原始訓(xùn)練集,經(jīng)NICE 處理后的增強(qiáng)訓(xùn)練集使得CNN、MLP、SVM 和XGBoost 等基礎(chǔ)分類(lèi)器的綜合檢測(cè)性能均取得了顯著的提升,說(shuō)明NICE 的應(yīng)用效果不受限于合作的基礎(chǔ)分類(lèi)器,具有一定的普適性。

        本文對(duì)深度學(xué)習(xí)技術(shù)在分布式光伏竊電數(shù)據(jù)增強(qiáng)中的應(yīng)用進(jìn)行了初步的研究,后續(xù)研究工作可以嘗試對(duì)生成模型進(jìn)行改進(jìn),以增強(qiáng)數(shù)據(jù)生成的性能效果。

        附錄見(jiàn)本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。

        猜你喜歡
        檢測(cè)
        QC 檢測(cè)
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        “幾何圖形”檢測(cè)題
        “角”檢測(cè)題
        “有理數(shù)的乘除法”檢測(cè)題
        “有理數(shù)”檢測(cè)題
        “角”檢測(cè)題
        “幾何圖形”檢測(cè)題
        日韩精品极品视频在线免费| 东京无码熟妇人妻av在线网址| 中文字幕无码精品亚洲资源网久久| 国产精品系列亚洲第一| 国产女主播在线免费看| 中文字幕一区二区三区视频| 午夜福利院电影| 手机看片福利盒子久久青| 国产一区二区三区免费小视频| 精品人妻一区二区三区在线观看| 内射欧美老妇wbb| 7878成人国产在线观看| 亚洲AV无码中文AV日韩A| 国产交换精品一区二区三区| 7777色鬼xxxx欧美色妇| 欧美婷婷六月丁香综合色| 国产强伦姧在线观看| 久久精品国产69国产精品亚洲 | 妺妺窝人体色www看人体| 久久天天躁狠狠躁夜夜96流白浆| 亚洲国产精品综合久久20| 成人黄色片久久久大全| 中文字幕日韩人妻在线视频| 久久日本三级韩国三级| 3亚洲日韩在线精品区| 免费一区二区三区女优视频| 秘书边打电话边被躁bd视频| 老男人久久青草AV高清| 一区二区三区精彩视频在线观看| 99久久精品费精品国产一区二| 色八区人妻在线视频免费| 欧美日韩中文亚洲另类春色| 日本国产一区在线观看| 久久亚洲欧美国产精品| 中文字幕亚洲欧美日韩在线不卡| 熟女人妻中文字幕一区 | 性欧美大战久久久久久久久| 国语精品视频在线观看不卡| 日本视频一中文有码中文| 超级碰碰色偷偷免费视频| 久久国产亚洲精品超碰热|