亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于變分自編碼高斯混合模型的發(fā)電企業(yè)串謀智能預(yù)警

        2022-02-28 06:30:12華回春張立峰
        電力系統(tǒng)自動(dòng)化 2022年4期
        關(guān)鍵詞:方法企業(yè)

        華回春,鄧 彬,劉 哲,張立峰

        (1. 新能源電力系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室(華北電力大學(xué)),河北省保定市 071003;2. 國(guó)網(wǎng)上海市電力公司,上海市 200437)

        0 引言

        在電力市場(chǎng)中,串謀是濫用市場(chǎng)力違規(guī)的主要表現(xiàn)形式之一[1]。通常,集中競(jìng)價(jià)中串謀企業(yè)通過平行報(bào)價(jià)和反向報(bào)價(jià)來(lái)獲取更多的利潤(rùn)[2]。傳統(tǒng)評(píng)估發(fā)電企業(yè)使用市場(chǎng)力進(jìn)行串謀的方法主要有場(chǎng)前指標(biāo)分析法[3-5]和事后檢查法[6-8]。目前,中國(guó)電力市場(chǎng)力高度集中,赫芬達(dá)爾-赫希曼指數(shù)(Herfindahl-Hirschman index,HHI)明顯高于1 800 閾值,串謀更為常見[9]。因此,需要加強(qiáng)電力市場(chǎng)信用監(jiān)管的頂層設(shè)計(jì),實(shí)時(shí)監(jiān)測(cè)發(fā)電企業(yè)的串謀行為,對(duì)信用風(fēng)險(xiǎn)提前做出預(yù)警。

        目前,發(fā)電企業(yè)串謀的研究大致可以分為2 類:一類是根據(jù)市場(chǎng)交易規(guī)則研究串謀發(fā)生的機(jī)理[10-12];另一類是根據(jù)市場(chǎng)交易數(shù)據(jù)構(gòu)建串謀指標(biāo)進(jìn)行預(yù)警[13-14]。前者使用博弈模型和回歸模型等對(duì)電力市場(chǎng)交易進(jìn)行建模,并通過企業(yè)的競(jìng)價(jià)策略來(lái)判斷串謀風(fēng)險(xiǎn)。文獻(xiàn)[15-16]還將強(qiáng)化學(xué)習(xí)應(yīng)用于串謀風(fēng)險(xiǎn)的評(píng)估中。但是,由于電力市場(chǎng)的信息披露機(jī)制還不完善,該類方法建模所需的保密數(shù)據(jù),如發(fā)電企業(yè)的邊際成本,難以獲得。后者則通過串謀指標(biāo)特征直接反映串謀成員的異常報(bào)價(jià)行為并由專家進(jìn)一步?jīng)Q策,更加適合監(jiān)管機(jī)構(gòu)進(jìn)行串謀預(yù)警。隨著電力市場(chǎng)逐步開放,市場(chǎng)交易規(guī)模不斷增大,傳統(tǒng)的專家決策已無(wú)法滿足工作需要。因此,需要提出能夠?qū)崟r(shí)甄別發(fā)電企業(yè)串謀指標(biāo)特征的智能預(yù)警模型,為相關(guān)監(jiān)管機(jī)構(gòu)提供有串謀嫌疑的企業(yè)名單。

        文獻(xiàn)[17]構(gòu)建了發(fā)電企業(yè)的指標(biāo)特征庫(kù),并采用模式識(shí)別來(lái)檢測(cè)違規(guī)行為,但該類方法不能自我更新,無(wú)法實(shí)時(shí)適應(yīng)市場(chǎng)的變化。文獻(xiàn)[18]將串謀視為二分類問題,采用有監(jiān)督學(xué)習(xí)算法訓(xùn)練分類器,從而區(qū)分串謀指標(biāo)特征。但在實(shí)際操作中,帶有標(biāo)注的數(shù)據(jù)非常少,因而難以訓(xùn)練出有良好泛化能力的有監(jiān)督學(xué)習(xí)模型,為此采用無(wú)監(jiān)督學(xué)習(xí)模型是一種更好的選擇。由于串謀實(shí)際上是電力市場(chǎng)中的異常行為,可以結(jié)合無(wú)監(jiān)督學(xué)習(xí)的異常檢測(cè)思想篩查出串謀的指標(biāo)特征。

        傳統(tǒng)的異常檢測(cè)方法有三大類,分別是基于誤差重構(gòu)的方法[19-22]、基于聚類分析的方法[23-24]以及基于分類的方法[25-27]。但是,傳統(tǒng)異常檢測(cè)方法難以處理電力市場(chǎng)交易的復(fù)雜高維數(shù)據(jù),而無(wú)監(jiān)督的深度聯(lián)合學(xué)習(xí)網(wǎng)絡(luò)在處理復(fù)雜數(shù)據(jù)的時(shí)候有優(yōu)勢(shì)。該網(wǎng)絡(luò)一般由2 個(gè)部分組成:表達(dá)網(wǎng)絡(luò)和估計(jì)網(wǎng)絡(luò)。在每一次迭代中,前者學(xué)習(xí)得到高維復(fù)雜數(shù)據(jù)的潛變量和特征,后者對(duì)其進(jìn)行密度估計(jì),將位于低密度區(qū)域的樣本視為異常樣本[28-29]??紤]到電力市場(chǎng)數(shù)據(jù)具有正負(fù)樣本不均衡(正常樣本遠(yuǎn)多于異常樣本)的特點(diǎn),因此提出了新的深度聯(lián)合網(wǎng)絡(luò)。該網(wǎng)絡(luò)在表達(dá)網(wǎng)絡(luò)中采用變分自編碼器(variational autoencoder,VAE)降維,可以學(xué)習(xí)得到具有一定噪聲的隱變量,保留更多的串謀樣本信息,而且在每一次迭代中,包含的正類樣本信息占比更多,對(duì)串謀樣本的識(shí)別幫助更大[30-31]。本文在構(gòu)建串謀指標(biāo)特征的基礎(chǔ)上,采用無(wú)監(jiān)督學(xué)習(xí)模型,即變分自編碼高斯混合模型(variational autoencoding Gaussian mixture model,VAEGMM),實(shí)現(xiàn)了發(fā)電企業(yè)串謀的智能預(yù)警。

        1 集中競(jìng)價(jià)中發(fā)電企業(yè)串謀預(yù)警指標(biāo)體系

        1.1 串謀預(yù)警指標(biāo)

        在集中競(jìng)價(jià)中,只有2 家或者2 家以上的發(fā)電企業(yè)才有可能產(chǎn)生串謀行為,所以串謀預(yù)警指標(biāo)需要充分反映任意2 家企業(yè)在競(jìng)價(jià)過程中的報(bào)價(jià)特點(diǎn)。根據(jù)市場(chǎng)內(nèi)常見的串謀形式,參考了現(xiàn)有的串謀指標(biāo),構(gòu)建了較為完善的指標(biāo)體系。它們的名稱、含義和具體計(jì)算公式如下[13-14]。

        式中:Si和Sj分別為市場(chǎng)中第i家和第j家發(fā)電企業(yè)在本次競(jìng)價(jià)中的申報(bào)電量;n為在本次競(jìng)價(jià)中參與的發(fā)電企業(yè)總數(shù)。

        該指標(biāo)衡量了2 家發(fā)電企業(yè)在本次競(jìng)價(jià)的市場(chǎng)力大小,指標(biāo)數(shù)值越大的2 家發(fā)電企業(yè)越有能力影響整個(gè)市場(chǎng)的價(jià)格,說明串謀的可能性越大。

        式中:ρia和ρja分別為第i家和第j家發(fā)電企業(yè)在本次競(jìng)價(jià)中的第a段報(bào)價(jià);為在本次競(jìng)價(jià)中所有發(fā)電企業(yè)第a段報(bào)價(jià)的均值。

        該指標(biāo)衡量了2 家發(fā)電企業(yè)在同一時(shí)間段、同比例地改變申報(bào)電價(jià)的可能性大小。數(shù)值越小,表明存在串謀的嫌疑越大。

        式中:Sia和Sja分別為第i家和第j家發(fā)電企業(yè)在本次競(jìng)價(jià)中的第a段申報(bào)電量;為在本次競(jìng)價(jià)中所有發(fā)電企業(yè)第a段申報(bào)電量的均值。

        該指標(biāo)衡量了2 家發(fā)電企業(yè)在同一時(shí)間段、同比例地改變申報(bào)電量的可能性大小。數(shù)值越小,說明存在串謀的嫌疑越大。

        式中:fi和fj分別為第i家和第j家發(fā)電企業(yè)在本次競(jìng)價(jià)中的報(bào)價(jià)曲線函數(shù);S′為2 家發(fā)電企業(yè)申報(bào)電量的較小值;s為積分變量。

        該指標(biāo)衡量了2 家發(fā)電企業(yè)在同一時(shí)間段、同比例地改變申報(bào)電量和電價(jià)的可能性大小。數(shù)值越小,說明存在串謀的嫌疑越大。

        該指標(biāo)衡量了當(dāng)前報(bào)價(jià)與歷史報(bào)價(jià)的偏差,偏差越大,說明它們的報(bào)價(jià)越有可能脫離自身的發(fā)電能力,存在與其他企業(yè)串通、抬高市場(chǎng)出清價(jià)格的嫌疑。

        該指標(biāo)衡量了當(dāng)前報(bào)價(jià)與市場(chǎng)整體報(bào)價(jià)水平的偏差。偏差越大,說明發(fā)電企業(yè)試圖報(bào)高價(jià)以抬高市場(chǎng)價(jià)格的可能性越大。

        上述指標(biāo)體系主要反映了串謀企業(yè)的市場(chǎng)力大小、平行報(bào)價(jià)和異常報(bào)價(jià)的行為特征。在供大于求的情況下,報(bào)價(jià)一致性、報(bào)量一致性和報(bào)價(jià)曲線差異面積比率指標(biāo)能夠反映發(fā)電企業(yè)通過平行報(bào)價(jià)來(lái)?yè)屨际袌?chǎng)份額的行為。在供求關(guān)系相對(duì)平衡的情況下,報(bào)價(jià)安全度均值和報(bào)價(jià)相對(duì)比均值這2 個(gè)指標(biāo)能夠反映發(fā)電企業(yè)通過物理縮減和經(jīng)濟(jì)縮減等異常報(bào)價(jià)行為制造市場(chǎng)供不應(yīng)求的情況,從而使其他成員獲得提價(jià)的空間。盡管參與市場(chǎng)的不同類型發(fā)電企業(yè)成本有較大差異,但是上述指標(biāo)體系依然有效。

        1.2 串謀指標(biāo)集測(cè)算方法

        同時(shí)對(duì)多場(chǎng)集中競(jìng)價(jià)進(jìn)行串謀預(yù)警時(shí),需要對(duì)不同場(chǎng)次的競(jìng)價(jià)數(shù)據(jù)進(jìn)行標(biāo)注再糅合,直接糅合可能會(huì)使無(wú)監(jiān)督學(xué)習(xí)模型無(wú)法正確判斷串謀行為。例如,場(chǎng)次A 和B 都發(fā)生了不同類型的串謀,那么場(chǎng)次A 和B 中正常企業(yè)的競(jìng)價(jià)數(shù)據(jù)會(huì)因?yàn)楦髯缘拇\類型而呈現(xiàn)出不同的數(shù)據(jù)特點(diǎn),直接糅合多場(chǎng)次數(shù)據(jù)會(huì)讓VAEGMM 認(rèn)為這些正常企業(yè)也存在串謀的嫌疑。因此,本文提出了新的標(biāo)注指標(biāo),具體定義如下。

        集中競(jìng)價(jià)場(chǎng)次x(7)ij,代表2 家發(fā)電企業(yè)集中競(jìng)價(jià)的場(chǎng)次,如式(7)所示。

        式中:l為第i家和第j家發(fā)電企業(yè)參與集中競(jìng)價(jià)的場(chǎng)次。

        該指標(biāo)的選取可按照時(shí)間周期選取,如周、月、年等,或者按照變量選取,如同水平電價(jià)、進(jìn)入市場(chǎng)的發(fā)電企業(yè)等。

        假設(shè)某地同一時(shí)期的電力市場(chǎng)一共有L場(chǎng)集中競(jìng)價(jià),參與某一場(chǎng)次競(jìng)價(jià)的發(fā)電企業(yè)有m家,那么串謀預(yù)警的指標(biāo)集計(jì)算過程如下。

        首先根據(jù)原始的報(bào)價(jià)數(shù)據(jù),計(jì)算某一場(chǎng)次競(jìng)價(jià)中2 家發(fā)電企業(yè)之間第k個(gè)指標(biāo)的數(shù)據(jù)矩陣R(k)如式(8)所示。

        將矩陣元素按照除對(duì)角線外的上三角形依次平鋪,得到列向量x(k),即為指標(biāo)集的一列指標(biāo)特征。

        然后,按照式(1)至式(7)分別計(jì)算出7 個(gè)指標(biāo)特征,按列組合即可得到某一場(chǎng)次l集中競(jìng)價(jià)的指標(biāo)集Xl。

        最后,將L場(chǎng)次的指標(biāo)集Xl按行組合得到用于網(wǎng)絡(luò)訓(xùn)練的指標(biāo)集X。

        值得注意的是,在訓(xùn)練模型前,需要對(duì)標(biāo)注指標(biāo)(集中競(jìng)價(jià)場(chǎng)次)進(jìn)行獨(dú)熱編碼來(lái)消除量綱[32],因此,指標(biāo)集X的維度會(huì)隨場(chǎng)次增加呈線性增長(zhǎng)。另外,指標(biāo)集X的每個(gè)樣本都是由任意2 家發(fā)電企業(yè)的競(jìng)價(jià)數(shù)據(jù)計(jì)算得到的指標(biāo)結(jié)果,且串謀行為是一種少數(shù)違法行為。因此,指標(biāo)集X具有維數(shù)高且正負(fù)樣本不均衡的數(shù)據(jù)特點(diǎn)(正常樣本遠(yuǎn)多于串謀樣本)。由于串謀樣本的指標(biāo)特征與大部分樣本的指標(biāo)特征相差較大,在樣本空間中,串謀樣本點(diǎn)表現(xiàn)為離群點(diǎn),即異常樣本點(diǎn)。針對(duì)此特點(diǎn),本文提出了一種新的深度聯(lián)合學(xué)習(xí)網(wǎng)絡(luò)來(lái)實(shí)時(shí)甄別指標(biāo)集X中的異常樣本。

        2 串謀預(yù)警模型建立

        2.1 網(wǎng)絡(luò)結(jié)構(gòu)

        如圖1 所示,VAEGMM 的網(wǎng)絡(luò)結(jié)構(gòu)由2 個(gè)部分網(wǎng)絡(luò)構(gòu)成:表達(dá)網(wǎng)絡(luò)和估計(jì)網(wǎng)絡(luò)。其中,表達(dá)網(wǎng)絡(luò)通過VAE 對(duì)網(wǎng)絡(luò)的輸入進(jìn)行降維,同時(shí)得到潛變量Zl和重構(gòu)概率Zr。然后,將這2 個(gè)特征整合起來(lái)作為估計(jì)網(wǎng)絡(luò)的輸入,使用高斯混合模型(Gaussian mixture model,GMM)計(jì)算得到每個(gè)樣本在低維空間的密度估計(jì)。圖2 中:X′為重構(gòu)樣本;Z=[Zl,Zr]為整合變量;μ(X)與σ(X)分別為均值和方差函數(shù);為整個(gè)網(wǎng)絡(luò)的輸出。

        圖1 VAEGMM 網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Network structure of VAEGMM

        2.2 表達(dá)網(wǎng)絡(luò)

        VAEGMM 的表達(dá)網(wǎng)絡(luò)使用VAE 對(duì)指標(biāo)集X的指標(biāo)特征進(jìn)行降維重組,形成一個(gè)更可辨的低維樣本空間。VAE 包含編碼器和解碼器2 個(gè)部分。

        如圖2 所示,編碼器的目標(biāo)是學(xué)習(xí)潛變量的近 似 后 驗(yàn) 分 布q(Zl|X)~N′(μ′(X),σ′(X)),其 中,N′(μ′(X),σ′(X))為分布函數(shù),μ′(X)與σ′(X)分別為重構(gòu)均值和方差函數(shù)。首先,μ′(X)與σ′(X)需要通過網(wǎng)絡(luò)學(xué)習(xí)得到;然后,從后驗(yàn)分布q(Zl|X)中采樣得到原始樣本的潛變量Zl。由于σ′(X)不為0,Zl帶有一定的噪聲,體現(xiàn)了潛在變量空間的可變性。也就是說在每一次迭代中,相較于其他降維,VAEGMM 所學(xué)習(xí)得到的潛變量都具有更加豐富的正類信息,從而有助于估計(jì)網(wǎng)絡(luò)將負(fù)類樣本從低密度區(qū)域中識(shí)別出來(lái)。

        圖2 VAE 編碼器Fig.2 Encoder of VAE

        如圖3 所示,解碼器通過近似后驗(yàn)分布p(X′|Z)采樣,對(duì)潛變量Zl進(jìn)行重建得到重構(gòu)樣本X′。其中,X′|Zl~N(μ(X),σ(X) ),N(μ(X),σ(X) ) 為 分布函數(shù),函數(shù)μ(X)與σ(X)也需要通過網(wǎng)絡(luò)學(xué)習(xí)得到。通過函數(shù)g(X,X′)的計(jì)算可以得到重構(gòu)樣本和輸入樣本的重構(gòu)概率Zr。該特征不同于普通降維網(wǎng)絡(luò)的重構(gòu)誤差,它不僅將重構(gòu)樣本與原始輸入之間的差異考慮在內(nèi),而且還考慮了由近似后驗(yàn)分布p(X′|Zl)的方差σ(X)來(lái)重建X′的可變性。該特征反映了不同樣本的方差靈敏度,靈敏度高的樣本能通過高方差重構(gòu)被視為正常樣本,從而降低重構(gòu)概率。

        圖3 VAE 解碼器Fig.3 Decoder of VAE

        2.3 估計(jì)網(wǎng)絡(luò)

        通過表達(dá)網(wǎng)絡(luò)的計(jì)算,VAEGMM 將原始變量的潛變量Zl和與重構(gòu)樣本的重建概率Zr整合起來(lái)饋入估計(jì)網(wǎng)絡(luò)中。由于大量隨機(jī)變量的累計(jì)分布收斂于高斯混合分布,VAEGMM 選取GMM 作為估計(jì)網(wǎng)絡(luò)。

        一般,通過GMM 的估計(jì),將擁有高能量的樣本視為異常樣本。網(wǎng)絡(luò)輸出π^ 是每個(gè)樣本服從于整個(gè)數(shù)據(jù)集近似樣本分布的可能性。它也是兩兩發(fā)電企業(yè)的競(jìng)價(jià)數(shù)據(jù)與市場(chǎng)總體水平的偏離程度,可認(rèn)為是串謀嫌疑度。

        2.4 聯(lián)合損失函數(shù)

        式 中:GELBO為 變 分 下 界(evidence lower bound,ELBO);GKL(q(Zl|X)||p(Zl|X) 為 KL(Kullback-Leibler)散度。

        式(18)中,等式等號(hào)右邊由GELBO和潛變量Zl的真實(shí)條件分布p(Zl|X)與近似后驗(yàn)分布q(Zl|X)的KL 散度2 個(gè)部分組成。由于后一項(xiàng)為正,那么網(wǎng)絡(luò)的優(yōu)化目標(biāo)簡(jiǎn)化成最大化變分下界GELBO。式(19)中,GELBO的前一項(xiàng)為重構(gòu)樣本的能量函數(shù),反映了與原始樣本的差異,在損失函數(shù)中使用兩者的距離代替;后一項(xiàng)為潛變量Zl的真實(shí)分布p(Zl)與近似后驗(yàn)分布q(Zl|X)的KL 散度。假設(shè)潛變量Zl,w的真實(shí)分布p(Zl,w)服從標(biāo)準(zhǔn)正態(tài)分布,則

        綜上,VAEGMM 網(wǎng)絡(luò)的聯(lián)合損失函數(shù)J的定義為:

        式中:λ1為估計(jì)網(wǎng)絡(luò)的樣本能量E(Z)在聯(lián)合損失函數(shù)J中的權(quán)重;L(Xw,X′w)為重構(gòu)損失函數(shù)。

        3 串謀預(yù)警步驟

        集中競(jìng)價(jià)發(fā)電企業(yè)串謀預(yù)警的具體步驟如下:

        步驟1:采用提出的串謀指標(biāo)體系和指標(biāo)集計(jì)算方法對(duì)原始數(shù)據(jù)進(jìn)行測(cè)算,得到指標(biāo)集X。

        步驟2:對(duì)X進(jìn)行歸一化處理,同時(shí)對(duì)指標(biāo)特征集中競(jìng)價(jià)場(chǎng)次進(jìn)行獨(dú)熱編碼處理,將數(shù)據(jù)集維度擴(kuò)增L維,消除量綱。

        步驟3:將X劃分成訓(xùn)練集、驗(yàn)證集和測(cè)試集。

        步驟4:采用VAEGMM 模型進(jìn)行訓(xùn)練,得到每個(gè)樣本在低維空間中的密度估計(jì)值π^,可認(rèn)為是串謀嫌疑度。

        步驟5:將π^ 逆映射回式(8)的矩陣當(dāng)中,通過橫縱坐標(biāo)獲得兩兩企業(yè)的串謀嫌疑度。倘若企業(yè)1 分別與企業(yè)2 和企業(yè)3 有串謀嫌疑,即可認(rèn)為企業(yè)1、2、3 為一個(gè)串謀聯(lián)盟。

        步驟6:將串謀嫌疑大的企業(yè)名單提交給相關(guān)監(jiān)管機(jī)構(gòu)進(jìn)一步調(diào)查,包括檢查交易申報(bào)的計(jì)算機(jī)MAC 地址與網(wǎng)絡(luò)IP 地址、問詢筆錄和核查賬簿等。

        4 實(shí)例計(jì)算與分析

        為了驗(yàn)證VAEGMM 用于串謀預(yù)警的有效性,采用某省電力市場(chǎng)集中競(jìng)價(jià)中4 場(chǎng)3 階段式報(bào)價(jià)數(shù)據(jù)作為原始數(shù)據(jù)。經(jīng)過串謀指標(biāo)集測(cè)算,數(shù)據(jù)集X包含3 797 個(gè)樣本,其中負(fù)類樣本(串謀樣本)有363 個(gè),占總體的9.56%,具有正負(fù)樣本不均衡的特點(diǎn)。X的特征為1.1 節(jié)中的7 個(gè)指標(biāo),其中第7 個(gè)競(jìng)價(jià)場(chǎng)次指標(biāo)經(jīng)過了獨(dú)熱編碼處理。

        表1 展示了指標(biāo)集X的10 個(gè)樣本,其中標(biāo)簽為1 表示串謀樣本,標(biāo)簽為0 表示正常樣本??梢钥吹剑? 個(gè)串謀樣本的第2 個(gè)指標(biāo)數(shù)值遠(yuǎn)小于正常樣本,表示這些串謀企業(yè)的報(bào)價(jià)一致性很高。顯然,這3 個(gè)樣本在樣本空間中遠(yuǎn)離正常樣本,被視為離群點(diǎn),也就是異常樣本。

        表1X部分?jǐn)?shù)據(jù)集Table 1 Part data set ofX

        4.1 網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)設(shè)置

        本次訓(xùn)練中,VAEGMM 的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)置如表2 所示。表2 中,F(xiàn)C 表示該神經(jīng)網(wǎng)絡(luò)層為全連接層;L2(0.001)表示權(quán)重為0.001 的L2 正則化;Sampling表示采樣層,從高斯分布N(Zmean,e0.5Zvarε)中采樣得到潛變量Zl,其中ε為服從N(0,1)的偽隨機(jī)數(shù),Zmean和Zvar分別為Z的均值和方差。

        表2 表達(dá)網(wǎng)絡(luò)設(shè)置Table 2 Settings of express network

        另外,為了考慮每個(gè)樣本降維前后的重構(gòu)概率,本算例采用表達(dá)網(wǎng)絡(luò)輸入和輸出之間的相對(duì)歐氏距離dE和相對(duì)余弦dC相似度,計(jì)算公式分別如式(22)和式(23)所示。

        表3 中,為了防止估計(jì)網(wǎng)絡(luò)發(fā)生過擬合現(xiàn)象,在第2 層中添加Dropout 層,即在每次迭代時(shí),該層神經(jīng)元節(jié)點(diǎn)以0.5 的概率關(guān)閉[33]。估計(jì)網(wǎng)絡(luò)通過softmax 激活函數(shù)輸出每個(gè)樣本在低維空間的密度估計(jì)π^,并由式(22)分離出異常樣本。最后,本次訓(xùn)練設(shè)置批量為512,優(yōu)化器為Adam,λ1=0.01,學(xué)習(xí)率為0.000 1,迭代次數(shù)為5 000。

        表3 估計(jì)網(wǎng)絡(luò)設(shè)置Table 3 Settings of estimation network

        4.2 串謀預(yù)警效果分析

        根據(jù)3.1 節(jié)中的網(wǎng)絡(luò)結(jié)構(gòu)和相關(guān)參數(shù)設(shè)置,該模型的訓(xùn)練集和驗(yàn)證集誤差如圖4 所示。在經(jīng)過2 500 次迭代后,訓(xùn)練誤差和驗(yàn)證誤差已經(jīng)下降到一個(gè)非常低的水平,并且在后續(xù)迭代中也保持穩(wěn)定,沒有出現(xiàn)過擬合現(xiàn)象。這表明VAEGMM 具有收斂快、精度高的優(yōu)點(diǎn)。

        圖4 VAEGMM 的訓(xùn)練誤差和驗(yàn)證誤差Fig.4 Training and validation error of VAEGMM

        為了體現(xiàn)VAEGMM 的串謀預(yù)警效率,與其他無(wú)監(jiān)督智能方法進(jìn)行了對(duì)比,包括基于樹模型的孤立森林、單類支持向量機(jī)(one class support vector machine,OC-SVM)方法、基于先降維再聚類思想的主成分分析(principal component analysis,PCA)和K 均值聚類(PCA+KMeans)方法、基于先聚類再進(jìn)行密度估計(jì)的主成分分析和GMM(PCA+GMM)方法、基于密度的噪聲應(yīng)用空間聚類(density-based spatial clustering of applications with noise,DBSCAN)方法、基于距離的局部異常因子(local outlier factor,LOF)方法、基于深度自編碼器(deep autoencoder,DA)和高斯混合模型的深度聯(lián)合(DAGMM)方法。為了計(jì)算準(zhǔn)確率,本文設(shè)置了閾值λ=0.8π^max,w來(lái) 判 斷 串 謀,即π^w>0.8 為 串 謀 樣本,否 則 為 正 常。其 中π^w和π^max,w分 別 為 第w個(gè) 樣本的網(wǎng)絡(luò)輸出及其最大值,采取的評(píng)價(jià)體系為:準(zhǔn)確率、召回率與F1指數(shù),定義如下。

        式中:αs和γus分別為正常樣本被正確或錯(cuò)誤預(yù)測(cè)的數(shù)目;αus和γs分別為異常樣本被正確或錯(cuò)誤預(yù)測(cè)的數(shù)目;Acc、ηSR、ηUR、Omean分別為準(zhǔn)確率、召回率、精確度、F1指數(shù)。

        表4 的結(jié)果表明,VAEGMM 在電力市場(chǎng)集中競(jìng)價(jià)的串謀預(yù)警準(zhǔn)確率高于孤立森林、OC-SVM 和PCA+Kmeans 方法,分別高出了22.16%、9%、3.36%。對(duì)于DBSCAN 方法,VAEGMM 的召回率更高,對(duì)正常樣本的識(shí)別更加敏感。雖然LOF 在本算例的表現(xiàn)很接近VAEGMM,但是LOF 對(duì)于復(fù)雜的高維數(shù)據(jù)處理比較困難。雖然PCA+GMM 方法的3 個(gè)指標(biāo)都優(yōu)于VAEGMM,但它并沒有識(shí)別出異常樣本(αus=0)。因?yàn)樵谡?fù)樣本不均衡的情況下,簡(jiǎn)單的線性降維模型PCA 會(huì)把異常樣本的信息當(dāng)作噪聲刪除,導(dǎo)致GMM 對(duì)異常樣本不敏感,無(wú)法分離出串謀樣本,反而只留下正類樣本的信息,能夠幫助GMM 識(shí)別出更多的正類樣本,具有高準(zhǔn)確率。因此,PCA+GMM 方法在實(shí)際應(yīng)用中沒有實(shí)用價(jià)值。 對(duì)比同樣是深度聯(lián)合網(wǎng)絡(luò)的DAGMM,VAEGMM 在3 個(gè)指標(biāo)的表現(xiàn)上都更優(yōu)異,分別高出1.27%、1.4%、0.78%,表明VAEGMM 的表達(dá)網(wǎng)絡(luò)比DAGMM 更加能夠?qū)W習(xí)得到有助于密度估計(jì)的低維表示。

        表4 不同方法的串謀預(yù)警效率Table 4 Early-warning efficiency of collusion with different methods

        綜上,深度聯(lián)合學(xué)習(xí)網(wǎng)絡(luò)VAEGMM 能夠高效地將串謀樣本識(shí)別出來(lái),與其他無(wú)監(jiān)督學(xué)習(xí)方法相比,更加契合電力市場(chǎng)的串謀數(shù)據(jù)特點(diǎn),具有更高的準(zhǔn)確率。

        4.3 與其他方法比較分析

        為了說明本文方法的優(yōu)越性,將從不同維度對(duì)各類發(fā)電企業(yè)的串謀預(yù)警方法進(jìn)行評(píng)價(jià)。

        如 表5 所 示,與 現(xiàn) 有 的 其 他 方 法[10-14,17-18]相 比,本文方法不需要很強(qiáng)的先驗(yàn)知識(shí),能夠根據(jù)市場(chǎng)的交易數(shù)據(jù)不斷自我更新,從而可以對(duì)串謀行為實(shí)時(shí)監(jiān)測(cè)。在信息披露機(jī)制不完善的情況下,本文方法只需要發(fā)電企業(yè)交易后的競(jìng)價(jià)數(shù)據(jù),不需要保密的機(jī)組數(shù)據(jù),也不需要標(biāo)注數(shù)據(jù),更加適合于第三方監(jiān)管機(jī)構(gòu)使用。

        表5 不同方法比較結(jié)果Table 5 Comparison results of different methods

        如表6 所示,經(jīng)同一實(shí)例數(shù)據(jù)計(jì)算,基于有監(jiān)督學(xué)習(xí)方法[13]的串謀預(yù)警準(zhǔn)確率達(dá)到91.04%,比本文方法高出了7.04%。但是在實(shí)際操作中,人工標(biāo)注的串謀樣本非常少,訓(xùn)練一個(gè)有監(jiān)督學(xué)習(xí)模型是不現(xiàn)實(shí)的。另外,若測(cè)試集中發(fā)電企業(yè)通過新的方式進(jìn)行串謀,有監(jiān)督學(xué)習(xí)模型則無(wú)法將該類樣本識(shí)別出來(lái)。因此,本文基于無(wú)監(jiān)督學(xué)習(xí)的串謀智能預(yù)警方法更加符合實(shí)際。

        表6 不同方法預(yù)警效果比較Table 6 Comparison of early-warning effects with different methods

        5 結(jié)語(yǔ)

        為了完善中國(guó)電力市場(chǎng)集中競(jìng)價(jià)的監(jiān)管體系,結(jié)合串謀指標(biāo)體系和智能算法,提出了一套電力市場(chǎng)發(fā)電企業(yè)之間的串謀智能預(yù)警方法,用于輔助專家決策。得到的主要結(jié)論如下:

        1)構(gòu)建了較為完善的發(fā)電企業(yè)串謀指標(biāo)體系,提出了集中競(jìng)價(jià)場(chǎng)次標(biāo)注指標(biāo),提升了方法的預(yù)警性能。

        2)由于電力市場(chǎng)串謀行為樣本數(shù)據(jù)的標(biāo)簽難以獲取,因此選擇了無(wú)監(jiān)督學(xué)習(xí)模型??紤]到指標(biāo)集具有高維度和正負(fù)樣本不均衡特點(diǎn),提出了深度聯(lián)合學(xué)習(xí)網(wǎng)絡(luò)VAEGMM,實(shí)現(xiàn)了電力市場(chǎng)發(fā)電企業(yè)串謀行為的智能預(yù)警。

        3)與其他方法相比較,VAEGMM 每次迭代都進(jìn)行1 次降維,最大化保留了原始數(shù)據(jù)信息,對(duì)數(shù)據(jù)空間的調(diào)整也更加靈活,在實(shí)際應(yīng)用中具有更高的準(zhǔn)確率。

        理論上,本文所提出的VAEGMM 是基于電力市場(chǎng)中的數(shù)據(jù)特點(diǎn)開發(fā)出來(lái)的。它既可以預(yù)警發(fā)電側(cè)的串謀行為,也可以適用于其他電力市場(chǎng)主體,這取決于串謀指標(biāo)體系如何構(gòu)建。因此,未來(lái)的研究可以著眼于VAEGMM 對(duì)其他電力市場(chǎng)主體的串謀預(yù)警研究。

        在本文審稿過程中,審稿專家與作者的討論見附錄A。

        附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。

        猜你喜歡
        方法企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        敢為人先的企業(yè)——超惠投不動(dòng)產(chǎn)
        學(xué)習(xí)方法
        可能是方法不對(duì)
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        国产在线丝袜精品一区免费| 精品亚洲成av人在线观看| 国产xxx69麻豆国语对白| 亚洲av无码乱码国产精品fc2| 亚洲高清视频在线播放| 国产伦奸在线播放免费| 成在线人免费视频播放| 国产精品白浆一区二区免费看| 娜娜麻豆国产电影| 日本丶国产丶欧美色综合| 亚洲综合久久一本久道| 91精品久久久老熟女91精品 | 极品少妇人妻一区二区三区| 国产精品久久久免费精品| 日本中文字幕一区二区高清在线| 欧美mv日韩mv国产网站 | 色综合久久中文综合网亚洲| 中文字幕被公侵犯的漂亮人妻| av无码天一区二区一三区| 青青青草视频手机在线| 国产精品亚洲专区无码不卡| 精品人妻人人做人人爽夜夜爽| 免青青草免费观看视频在线| av在线播放免费观看| 无码国产色欲xxxx视频| 国产激情视频白浆免费| 和少妇人妻邻居做爰完整版| 精品福利一区二区三区蜜桃| 极品粉嫩小泬无遮挡20p| 中文字幕第一页亚洲| 国产一区二区三区蜜桃av| 国产精品一区久久综合| 国产成人喷潮在线观看| 国产日韩欧美在线| 日本视频一区二区三区三州| 在厨房被c到高潮a毛片奶水| 男男性恋免费视频网站| 亚洲中文字幕av天堂| 漂亮人妻出轨中文字幕| 国产成人久久精品一区二区三区| 99热精品国产三级在线观看|