亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        電網(wǎng)總調(diào)調(diào)度信息披露不平衡性數(shù)據(jù)處理模型

        2022-09-14 08:19:58侯方迪高衛(wèi)東
        電子設(shè)計(jì)工程 2022年17期
        關(guān)鍵詞:決策樹數(shù)據(jù)處理調(diào)度

        侯方迪,高衛(wèi)東,張 勇,翟 哲,楊 凡,吳 亮

        (中國南方電網(wǎng)有限責(zé)任公司,廣東廣州 610106)

        電力供應(yīng)一直是電力企業(yè)的核心業(yè)務(wù),隨著電力設(shè)備的改造和升級(jí),對(duì)調(diào)度可靠性要求越來越高,通過傳統(tǒng)的電話下令模式進(jìn)行調(diào)度已經(jīng)無法滿足要求,通過移動(dòng)網(wǎng)絡(luò)及調(diào)度數(shù)據(jù)網(wǎng)實(shí)現(xiàn)配網(wǎng)調(diào)度成為當(dāng)下的主流方式[1]。然而,這種新興的調(diào)度模式興起時(shí)間較短,發(fā)展并不成熟,普遍存在披露的數(shù)據(jù)信息內(nèi)容雜亂,缺乏深層次統(tǒng)計(jì)和分析的問題。

        披露的數(shù)據(jù)信息內(nèi)容雜亂主要是由不平衡性數(shù)據(jù)造成的,因此必須對(duì)不平衡性數(shù)據(jù)進(jìn)行處理。關(guān)于不平衡性數(shù)據(jù)處理的研究有很多,如:文獻(xiàn)[2]基于KFDA-Boosting 算法的不平衡數(shù)據(jù)分類模型,提取樣本非線性特征并進(jìn)行集成學(xué)習(xí),有效地提高了數(shù)據(jù)分類處理算法的精度,去除了冗余信息;文獻(xiàn)[3]提出基于隨機(jī)森林算法的不平衡大數(shù)據(jù)動(dòng)態(tài)分類方法,通過隨機(jī)森林算法建立大數(shù)據(jù)動(dòng)態(tài)分類基本框架,利用決策樹模型實(shí)現(xiàn)不平衡數(shù)據(jù)分類;文獻(xiàn)[4]提出基于SMOTE 的不平衡數(shù)據(jù)分類算法,通過SMOTE算法根據(jù)少數(shù)類樣本間特征空間的相似性人工合成新樣本,解決了數(shù)據(jù)不平衡的問題,提高了數(shù)據(jù)處理的精度。

        基于前人的研究成果,為提高披露數(shù)據(jù)信息的完整性、規(guī)范性和有效性,該文構(gòu)建了一種電網(wǎng)總調(diào)調(diào)度信息披露不平衡性數(shù)據(jù)處理模型。該模型構(gòu)建分為3 個(gè)步驟,即數(shù)據(jù)預(yù)處理、數(shù)據(jù)特征提取以及數(shù)據(jù)分類。最后進(jìn)行不平衡性數(shù)據(jù)處理性能測(cè)試,證明了該模型的準(zhǔn)確性和有效性。

        1 基于分類器的不平衡性調(diào)度數(shù)據(jù)處理模型

        調(diào)度機(jī)構(gòu)信息披露對(duì)于促進(jìn)電力調(diào)度運(yùn)行的公開透明以及維護(hù)公平、有序的市場(chǎng)秩序發(fā)揮著不可替代的作用。然而,當(dāng)前的電網(wǎng)總調(diào)調(diào)度信息披露中,數(shù)據(jù)處理部分由于不平衡性數(shù)據(jù)的存在,導(dǎo)致處理效率差、準(zhǔn)確性低。不平衡性數(shù)據(jù)的典型特點(diǎn)就是數(shù)據(jù)中各類別所包含的樣本數(shù)量差異較大,導(dǎo)致在后期的分類中更容易識(shí)別包含樣本較多的類別,而包含樣本較少的類別的識(shí)別準(zhǔn)確性較低。面對(duì)電網(wǎng)總調(diào)調(diào)度信息披露不平衡性數(shù)據(jù),構(gòu)建了數(shù)據(jù)處理模型。

        1.1 不平衡性數(shù)據(jù)預(yù)處理

        不平衡性數(shù)據(jù)預(yù)處理對(duì)于提高數(shù)據(jù)處理模型的精度具有十分重要的意義,其主要包括數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化以及數(shù)據(jù)平衡化三部分。

        1.1.1 數(shù)據(jù)清洗

        電網(wǎng)總調(diào)調(diào)度披露的數(shù)據(jù)信息中,經(jīng)過采集、傳輸?shù)拳h(huán)節(jié),數(shù)據(jù)集中難免存在缺失、異常、噪聲等問題,數(shù)據(jù)清洗主要包括缺失填補(bǔ)、異常識(shí)別以及噪聲處理,其方法如表1 所示。

        表1 數(shù)據(jù)清洗方法

        1.1.2 數(shù)據(jù)標(biāo)準(zhǔn)化

        電網(wǎng)總調(diào)調(diào)度信息披露不平衡性數(shù)據(jù)來自不同的數(shù)據(jù)源,因此每種類型數(shù)據(jù)的量綱都不同,而不同的量綱導(dǎo)致數(shù)據(jù)彼此之間無法進(jìn)行比較和分析,因此需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理[5],主要包括Min-Max 標(biāo)準(zhǔn)化、正規(guī)化方法及l(fā)og 函數(shù)轉(zhuǎn)換法,分別如下所示:

        式中,x′為規(guī)范化后的大數(shù)據(jù);x為原始數(shù)據(jù);xmax為大數(shù)據(jù)集中最大值;xmin為大數(shù)據(jù)集中最小值;a為對(duì)應(yīng)特征均值;b為標(biāo)準(zhǔn)差。

        1.1.3 數(shù)據(jù)平衡化

        數(shù)據(jù)的不平衡性是導(dǎo)致電網(wǎng)總調(diào)調(diào)度數(shù)據(jù)信息處理精度不高的根本原因,因此對(duì)數(shù)據(jù)進(jìn)行平衡化處理是解決上述問題的關(guān)鍵。數(shù)據(jù)平衡化的關(guān)鍵在于增加少數(shù)類別的樣本數(shù)據(jù),使其與少數(shù)類別的樣本數(shù)據(jù)數(shù)量相同,以維持二者平衡[6]。采用SMOTE算法實(shí)現(xiàn)數(shù)據(jù)平衡化,其原理為在一些位置距離較近的少數(shù)類樣本中線性插入新的樣本,以達(dá)到數(shù)量平衡。

        SMOTE 算法數(shù)據(jù)平衡化原理如下:首先從少數(shù)類樣本點(diǎn)中隨機(jī)選取一個(gè)樣本點(diǎn),記為x1,然后尋找該樣本點(diǎn)的同類近鄰,記為{x1,x2,…,xn},一般情況下n取值為5~10,接著從{x1,x2,…,xn} 中隨機(jī)選擇一個(gè)樣本,記為x2,再然后計(jì)算x1和x2在對(duì)應(yīng)屬性j上的差值,記為:

        然后與[0,1]范圍內(nèi)的一個(gè)隨機(jī)數(shù)相乘,再與x1j相加,即可生成一個(gè)新的的屬性值f1j,即:

        利用SSR分子標(biāo)記技術(shù)進(jìn)行純度鑒定時(shí),有些與雜交種帶型有明顯差異的單株在種植鑒定時(shí)并不一定表現(xiàn)出表型性狀的差異,因此SSR分子標(biāo)記技術(shù)用于純度鑒定時(shí),可以有效鑒別出大田無法確定的表型以及難以鑒別的植株,因而分子鑒定和種植鑒定結(jié)果必然存在一定的差異,而種植鑒定是最符合生產(chǎn)實(shí)踐的純度鑒定方法,如何使分子鑒定結(jié)果更接近種植鑒定、更好地輔助種植鑒定結(jié)果還需進(jìn)一步研究。

        不斷重復(fù)上述過程,最后得到m個(gè)屬性值,將其組合在一起,產(chǎn)生一個(gè)新的少數(shù)類樣本,將這一新的少數(shù)類樣本加入到原始少數(shù)類樣本數(shù)據(jù)集中,即可完成數(shù)據(jù)平衡化處理[7-9]。

        1.2 數(shù)據(jù)特征提取

        不同類別的數(shù)據(jù)擁有不同的特征,如電網(wǎng)總調(diào)調(diào)度信息中的缺失數(shù)據(jù)、趨勢(shì)突變數(shù)據(jù)等。該文選用的特征提取方法為人工蜂群算法[10-12]。

        人工蜂群算法基本流程如下:

        步驟1:初始化種群,隨機(jī)生成S個(gè)可行解,記為xi,i=1,2,…,S;

        步驟2:計(jì)算種群中各蜜蜂的適應(yīng)值[13];

        步驟3:重復(fù)計(jì)算各蜜蜂的適應(yīng)值,得到蜂群新的解,記為vi,并計(jì)算適應(yīng)值;

        步驟4:雇傭蜂根據(jù)貪心策略選擇蜜源;

        步驟5:計(jì)算引領(lǐng)蜂找到蜜源xi的概率pi;判斷蜜源xi是否滿足被放棄的條件,若滿足,對(duì)應(yīng)的引領(lǐng)蜂角色變?yōu)閭刹旆?,并隨機(jī)產(chǎn)生一個(gè)新的蜜源代替舊的蜜源,否則繼續(xù)進(jìn)行下一步驟;

        步驟6:判斷算法是否滿足終止條件,若滿足,則終止,記錄最優(yōu)解,否則轉(zhuǎn)到步驟2[10-12]。

        1.3 不平衡性數(shù)據(jù)分類處理

        基于上述研究,構(gòu)建分類器并進(jìn)行訓(xùn)練,利用訓(xùn)練好的分類器進(jìn)行不平衡性數(shù)據(jù)分類處理[14]。決策樹是一種分類算法器,其構(gòu)建基本原理是通過遞歸的方式進(jìn)行屬性歸類,生成不同的決策樹,基本流程如圖1 所示。

        圖1 決策樹構(gòu)建基本流程

        將構(gòu)建的決策樹作為基分類器,構(gòu)成隨機(jī)森林,實(shí)現(xiàn)分類[15]。具體過程如下:首先利用Bagging 方法進(jìn)行放回抽樣,為每棵決策樹產(chǎn)生訓(xùn)練集,然后利用訓(xùn)練集訓(xùn)練決策樹[16]。訓(xùn)練完成后,將決策樹組合構(gòu)成隨機(jī)森林,最后將測(cè)試數(shù)據(jù)集輸入到隨機(jī)森林中,通過投票方式完成分類預(yù)測(cè)。

        2 仿真實(shí)驗(yàn)分析

        為了驗(yàn)證該文提出的電網(wǎng)總調(diào)調(diào)度信息披露不平衡性數(shù)據(jù)處理模型的有效性,在Eclipse 環(huán)境下的Weka 平臺(tái)進(jìn)行仿真實(shí)驗(yàn),并用文獻(xiàn)[2]、[3]、[4]提到的3 種算法作為對(duì)比項(xiàng),進(jìn)行對(duì)比分析。

        2.1 實(shí)驗(yàn)樣本

        以紅水河水庫日來水?dāng)?shù)據(jù)為例,選取2020.01.01-2020.03.31 的日來水?dāng)?shù)據(jù)作為不平衡性數(shù)據(jù)示例,仿真實(shí)驗(yàn)參數(shù)設(shè)置如表2 所示。

        表2 仿真實(shí)驗(yàn)參數(shù)設(shè)置

        2.2 實(shí)驗(yàn)結(jié)果

        分別采用文獻(xiàn)[2]、[3]算法及所提方法對(duì)實(shí)驗(yàn)數(shù)據(jù)中的不平衡性數(shù)據(jù)進(jìn)行分類處理,得到2020.01.01-2020.03.31的紅水河水庫日來水?dāng)?shù)據(jù)趨勢(shì)如圖2所示。

        分析圖2,該文模型對(duì)不平衡性數(shù)據(jù)的處理性能較好,按照日來水?dāng)?shù)據(jù)整體趨勢(shì)對(duì)不平衡性數(shù)據(jù)進(jìn)行處理,得到紅水河水庫日來水?dāng)?shù)據(jù)趨勢(shì)整體在2 200~2 800 m3/s 之間波動(dòng),而兩種文獻(xiàn)對(duì)比模型對(duì)數(shù)據(jù)的處理性能較差,不能很好地得到紅水河水庫日來水?dāng)?shù)據(jù)趨勢(shì)。

        圖2 不平衡數(shù)據(jù)處理后的紅水河水庫日來水?dāng)?shù)據(jù)趨勢(shì)

        經(jīng)不同方法對(duì)數(shù)據(jù)處理后,根據(jù)所得數(shù)據(jù)趨勢(shì)對(duì)2020.04.01-2020.04.31 的數(shù)據(jù)進(jìn)行預(yù)測(cè),得到紅水河水庫日來水?dāng)?shù)據(jù)預(yù)測(cè)結(jié)果如圖3 所示。

        分析圖3,該文模型預(yù)測(cè)值與實(shí)測(cè)值較為接近,說明該文模型能夠準(zhǔn)確處理不平衡性數(shù)據(jù),實(shí)現(xiàn)水庫日來水情況的預(yù)測(cè)。

        圖3 紅水河水庫日來水?dāng)?shù)據(jù)預(yù)測(cè)情況

        3 結(jié)束語

        綜上所述,隨著電力的需求范圍越來越廣泛,對(duì)電力調(diào)度的可靠性和效率性要求越來越高,因此,電網(wǎng)總調(diào)調(diào)度信息披露系統(tǒng)逐漸取代傳統(tǒng)的調(diào)度信息傳遞方式,提高了數(shù)據(jù)信息傳遞效率,然而披露系統(tǒng)的應(yīng)用,同時(shí)也使數(shù)據(jù)信息量劇增,導(dǎo)致數(shù)據(jù)信息內(nèi)容雜亂,缺乏深層次的統(tǒng)計(jì)和分析?;诖?,構(gòu)建一種電網(wǎng)總調(diào)調(diào)度信息披露不平衡性數(shù)據(jù)處理模型,該模型經(jīng)仿真實(shí)驗(yàn)測(cè)試,證明了其在不平衡性數(shù)據(jù)處理中的性能,提高了不平衡性數(shù)據(jù)處理的精度,規(guī)范了電網(wǎng)總調(diào)調(diào)度數(shù)據(jù)信息。

        猜你喜歡
        決策樹數(shù)據(jù)處理調(diào)度
        認(rèn)知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補(bǔ)與極大似然估計(jì)法*
        ILWT-EEMD數(shù)據(jù)處理的ELM滾動(dòng)軸承故障診斷
        《調(diào)度集中系統(tǒng)(CTC)/列車調(diào)度指揮系統(tǒng)(TDCS)維護(hù)手冊(cè)》正式出版
        一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
        一種基于負(fù)載均衡的Kubernetes調(diào)度改進(jìn)算法
        虛擬機(jī)實(shí)時(shí)遷移調(diào)度算法
        決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        基于決策樹的出租車乘客出行目的識(shí)別
        基于希爾伯特- 黃變換的去噪法在外測(cè)數(shù)據(jù)處理中的應(yīng)用
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        久久国产成人午夜av免费影院| 国产精品自产拍在线观看中文| 亚洲一道一本快点视频| 91九色熟女潮喷露脸合集| 超短裙老师在线观看一区| 中文字幕人妻在线少妇| 久久99精品久久水蜜桃| 国产农村乱子伦精品视频 | 久久精品一品道久久精品9| 日本在线观看一区二区视频| 日韩a级精品一区二区| 国产人妻人伦精品1国产盗摄| 无码毛片高潮一级一免费| 日本伦理视频一区二区| 国产麻花豆剧传媒精品mv在线| 国产一区二区精品久久| 国产精品福利小视频| 国产91在线精品观看| 日本熟妇人妻xxxx| 国产成人亚洲日韩欧美| 亚洲精品中文字幕无乱码麻豆| 日本一区二区三区啪啪| 亚洲蜜臀av一区二区三区漫画| 国产日产欧产精品精品蜜芽| 色综合久久精品亚洲国产| 亚洲一区爱区精品无码| 久久中文字幕日韩精品| 精品黑人一区二区三区久久hd| 天天爽夜夜爽夜夜爽精品视频| 亚洲学生妹高清av| 国产盗摄XXXX视频XXXX| 人妻精品久久一区二区三区 | 美女张开腿黄网站免费| 久久亚洲精品无码va大香大香| 视频二区精品中文字幕| av在线天堂国产一区| 777精品久无码人妻蜜桃| 藏春阁福利视频| 天堂av无码大芭蕉伊人av孕妇黑人 | 乌克兰少妇xxxx做受野外| av无码av在线a∨天堂app|