亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        相似歷史數(shù)據(jù)段高效查找方法研究*

        2022-04-07 03:43:16龐向坤張緒輝
        計算機與數(shù)字工程 2022年3期
        關(guān)鍵詞:符號信息方法

        龐向坤 高 嵩 張緒輝 顏 慶

        (國網(wǎng)山東省電力公司電力科學研究院 濟南 250002)

        1 引言

        隨著新能源發(fā)電規(guī)模不斷擴大,其間歇性、波動性等為電網(wǎng)穩(wěn)定運行帶來了日益嚴峻的挑戰(zhàn)。由于火電機組實發(fā)功率具有高度的可調(diào)節(jié)性,其對電網(wǎng)多類型機組協(xié)調(diào)及穩(wěn)定運行發(fā)揮日益突出的支撐作用。因此,提高火電機組的平穩(wěn)運行水平,在一定意義上說就是保障新能源消納,促進了電網(wǎng)多類型機組協(xié)調(diào)和穩(wěn)定運行。

        火電機組運行過程中,經(jīng)常出現(xiàn)運行異常導致機組降負荷情況發(fā)生,降低了火電機組負荷調(diào)節(jié)能力。關(guān)于火電機組運行異常監(jiān)控已經(jīng)有眾多的研究結(jié)果[1~5],但在發(fā)現(xiàn)生產(chǎn)異常后,及時找出發(fā)現(xiàn)異常根源,提高異常處理效率,則是保障機組恢復生產(chǎn)能力的重要環(huán)節(jié),目前相關(guān)研究結(jié)果較少。

        當前,火力發(fā)電生產(chǎn)過程的信息化和智能化建設(shè)不斷深入,海量生產(chǎn)過程數(shù)據(jù)被采集并存儲。鑒于歷史數(shù)據(jù)中包含有豐富的可用信息,因此,歷史數(shù)據(jù)挖掘得到的信息,既可以用于火力發(fā)電過程管理與優(yōu)化,也可以應用于火力發(fā)電過程監(jiān)控等,對于提高火力發(fā)電生產(chǎn)效益和安全性等具有重要的意義,如文獻[6~9]均從數(shù)據(jù)挖掘方法出發(fā),來分析生產(chǎn)過程異?;蚬收显?。但是由于歷史數(shù)據(jù)的維度急劇升高且受噪聲影響,查找歷史數(shù)據(jù)相似數(shù)據(jù)段主要面臨查詢效率不高和準確性較低的問題。

        為了提高歷史數(shù)據(jù)查詢效率和準確性,近年來研發(fā)的技術(shù)方法主要是通過簡化數(shù)據(jù)結(jié)構(gòu)保留主要特征,實現(xiàn)降低原始數(shù)據(jù)維度的目的。文獻[10]提出一種基于分段聚合近似(PAA)的時間序列早期分類方法,運用PAA 對時間序列樣本進行維數(shù)約簡。文獻[11]提出了符號聚合近似轉(zhuǎn)換(SAX)技術(shù),主要是基于分段聚合近似(PAA)技術(shù)進行數(shù)據(jù)化簡并離散化,將各個數(shù)據(jù)段用其均值表示,然后采用預設(shè)斷點將PAA 系數(shù)轉(zhuǎn)換為SAX 符號。文獻[12]定義了極值噪聲和轉(zhuǎn)折點,在此基礎(chǔ)上提出了基于轉(zhuǎn)折點的分段線性表示方法。文獻[13]提出了剪輯技術(shù)或定極限技術(shù),實現(xiàn)對數(shù)據(jù)的壓縮。文獻[14]提出基于形態(tài)特征的時間序列符號聚合近似方法,綜合考慮分段序列的均值和數(shù)據(jù)分布的形態(tài)特征,并且通過論域轉(zhuǎn)化對它們實現(xiàn)符號轉(zhuǎn)化。文獻[15]針對PAA 算法對每一區(qū)間都平均對待所存在的不足,提出一種基于小波熵的時間序列分段聚合近似表示(PAA_WE)方法。

        雖然上述方法均存在其應用場景,但是也存在一定的不足。例如,PAA技術(shù)雖然可以降低數(shù)據(jù)維度,但沒有考慮數(shù)據(jù)段的趨勢信息。在充分借鑒國內(nèi)外現(xiàn)有相似數(shù)據(jù)段查找方法的基礎(chǔ)上,本文采用了一種新型的數(shù)據(jù)表示方法,該方法將原歷史數(shù)據(jù)轉(zhuǎn)換為二進制表示形式,采用分段聚合近似(PAA)方法和擴展的剪輯技術(shù)合并了原歷史數(shù)據(jù)的趨勢和數(shù)值信息,實現(xiàn)了數(shù)據(jù)降維,提高了相似特征數(shù)據(jù)段查找效率和精度。

        2 所提方法

        本文以實現(xiàn)異常根源診斷為目的,充分利用所選取的目標數(shù)據(jù)集中各段數(shù)據(jù)的異常根源信息,當生產(chǎn)運行過程中異常狀況出現(xiàn)時,通過查找當前異常數(shù)據(jù)段在目標數(shù)據(jù)集中的相似數(shù)據(jù)段,以其中的異常數(shù)據(jù)段為參考,確定當前運行異常的出現(xiàn)的根源。

        2.1 時間序列的符號表示

        本文采用了一種數(shù)據(jù)的二進制表示方法[16],該方法是將給定的數(shù)據(jù)序列數(shù)據(jù)轉(zhuǎn)換成長度為2ω的布爾符號表示序列,此處ω表示數(shù)據(jù)序列PAA的分段數(shù)。在布爾符號表示過程中,每一個PAA子段采用兩位布爾數(shù)表示,其第一位布爾數(shù)值表示數(shù)據(jù)幅值信息,通過比較數(shù)據(jù)段前幅值與其均值得到;第二位布爾數(shù)值表示趨勢信息,通過比較數(shù)據(jù)段前數(shù)值與最近點的位置得到。對歷史運行數(shù)據(jù)X,以單步滑動窗口法得到X的子序列X[i],然后采用PAA 方法對X[i]進行分段,對每個子數(shù)據(jù)段按如下方式進行其趨勢和數(shù)值信息的符號轉(zhuǎn)換[16]:

        式(1)、(2)中,xˉk為時間序列X分段后第k子數(shù)據(jù)段的樣本均值,Xˉi為X[i]的均值;式(3)中,xˉk+1為時間序列X分段后第k+1 個子數(shù)據(jù)段的樣本均值,即xˉk+1=(xk+1+xk+2)/2。

        數(shù)據(jù)二進制符號表示后,對以相應結(jié)果進行融合,數(shù)據(jù)幅值信息均以二進制序列奇數(shù)位表示,趨勢信息均以二進制序列偶數(shù)位表示,X[i]對應的二進制序列以B[i]表示,B[i]={b(i·ω+1),b(i·ω+2),…,b(i·ω+ω)},具體轉(zhuǎn)換過程如圖1示例。

        圖1 數(shù)據(jù)序列轉(zhuǎn)換為二進制序列過程示意圖

        2.2 形成目標數(shù)據(jù)集

        完成二進制數(shù)據(jù)轉(zhuǎn)換后,得到BC和B[i] ,i∈[1,N-1],為了篩選出相關(guān)性較高的子數(shù)據(jù)段,可以指定相似性閾值ε,將BC和B[i]相似性大于閾值ε的子序列對應的X[i]提取出來,形成目標數(shù)據(jù)集。

        二進制數(shù)據(jù)序列BC和B[i]的相似性采用符號相似系數(shù)度量,在此,BC={bc(1),bc(2),…,bc(ω)},B[i]={b(i·ω+1),b(i·ω+2),…,b(i·ω+ω)},其符號相關(guān)系數(shù)計算公式如下:

        式(3)中,α和β分別是對數(shù)值信息和趨勢信息所加的權(quán)重,滿足0 <α,β<1。α和β的取值可根據(jù)需要查找的異常數(shù)據(jù)段的特征進行選擇。式(3)中,分子分別為二進制序列的奇數(shù)位和偶數(shù)位的漢明距離[17]。式(3)中,符號⊕表示布爾異或運算,且ρb的取值范圍為[0,1]。

        最后,將ρb(i)大于閾值ε的X[i]提取出來,設(shè)共有L組滿足條件,則組成的時間序列候選集,候選集Cs中的數(shù)據(jù)維數(shù)將遠小于,因此將大幅度縮小相似數(shù)據(jù)段查找范圍,使得查找速度大幅提高。為了避免單步滑窗提取X[i]所帶來的ρb(i)在X局部取過多較大值,造成候選數(shù)據(jù)集維數(shù)過高的問題,選取ρb(i)大于閾值ε時,應滿足任意兩個選定的相關(guān)系數(shù)ρb(i)和ρb(j)之間滿足 ||i-j>ω2。

        2.3 確定相似異常數(shù)據(jù)段

        采用二進制序列表示原數(shù)據(jù),必然造成式(3)中的相似性計算結(jié)果較為寬泛,因此需要對候選集中數(shù)據(jù)進一步與當前異常數(shù)據(jù)進行相似性分析。

        對Xl[i]={x(i·ω+1),x(i·ω+2),…,x(i·ω+ω)},其與的皮爾遜相關(guān)系數(shù)計算公式如下:

        對于式(6)中得到的計算結(jié)果,按從大到小的順序進行排序,相關(guān)系數(shù)越大則時間序列的相似程度越高,實現(xiàn)查找相似時間序列的目標。

        3 仿真案例

        為了驗證所述方法的準確性和高效性,分別構(gòu)造仿真案例予以說明。仿真過程中,采用MATLAB M語言實現(xiàn)該算法,使用的計算機中央處理器(CPU)為Intel 酷睿I5-4200M,主頻2.5GHz(最大睿頻3.1GHz),運行內(nèi)存為4GB,操作系統(tǒng)為Windows 7 64位旗艦版。

        3.1 準確性驗證仿真

        首先,構(gòu)造子數(shù)據(jù)段長度和幅值隨機的仿真數(shù)據(jù),所構(gòu)造數(shù)據(jù)的總長度為N=18000,數(shù)據(jù)趨勢如圖2 所示。將所構(gòu)造的仿真數(shù)據(jù)看作是歷史數(shù)據(jù)X,為了驗證算法的有效性,以圖2 中是紅色數(shù)據(jù)段作為當前異常數(shù)據(jù)段XC,具體如圖3所示,將兩段綠色數(shù)據(jù)段設(shè)定為與紅色數(shù)據(jù)段高度相似的數(shù)據(jù)段。

        圖2 所構(gòu)造的仿真數(shù)據(jù)趨勢曲線

        圖3 當前仿真數(shù)據(jù)圖

        將仿真數(shù)據(jù)X與當前異常數(shù)據(jù)段XC二進制符號轉(zhuǎn)換,根據(jù)式(2)和式(3)對每個子序列X[i]的數(shù)值信息和趨勢信息分別進行符號轉(zhuǎn)換后進行合并,得到BC和B[i]。根據(jù)式(3)計算每個序列對(BC,B[i])之間的相關(guān)系數(shù)ρb(i),設(shè)ε=0.7,按照該閾值篩選二進制子序列。依據(jù)所選的二進制子序列,提取仿真數(shù)據(jù)X對應的數(shù)據(jù)段形成候選集Cs。

        依據(jù)式(6)計算候選集Cs中每個子數(shù)據(jù)段與XC的皮爾遜相關(guān)系數(shù),且設(shè)定皮爾遜相關(guān)系數(shù)的閾值為0.99,選出最終相似的時間序列對,并按相似性數(shù)值進行降序排列。在此,選擇相似性最高的前三組作為最終選擇的數(shù)據(jù)段,結(jié)果如圖4 所示,其中圖4(a)為當前異常數(shù)據(jù)段XC本身,即圖2 中的紅色數(shù)據(jù)段,圖4(b)為圖4中的第二個綠色數(shù)據(jù)段,圖4(c)為圖4中的第一個綠色數(shù)據(jù)段。

        圖4 結(jié)果集中的時間序列對

        由本仿真案例所查找到的相似數(shù)據(jù)段和仿真數(shù)據(jù)段的設(shè)計結(jié)構(gòu)可知,本文所述的方法能夠準確查找出相似數(shù)據(jù)段。

        3.2 高效性仿真驗證

        為了驗證所述方法的高效性,在此通過構(gòu)造不同長度的仿真數(shù)據(jù),分別以本文所述方法和皮爾遜相關(guān)系數(shù)直接查找相似數(shù)據(jù)段方法做耗時對比驗證,結(jié)果如表1所示。

        表1 所提方法與皮爾森相關(guān)系數(shù)的效率比較

        通過對比仿真結(jié)果可知,在相同標準下,本文所述的方法在查詢速度上有大幅度提高。

        4 結(jié)語

        當前新能源大規(guī)模并網(wǎng)條件下,電網(wǎng)需要在多類型機組協(xié)調(diào)下運行,火電機組對電網(wǎng)多類型機組協(xié)調(diào)發(fā)揮至關(guān)重要的作用。在該背景下,本文研究了用以機組運行異常根源診斷的歷史數(shù)據(jù)相似數(shù)據(jù)段查找技術(shù)。通過計算當前異常數(shù)據(jù)段與原過程數(shù)據(jù)的二進制相似系數(shù),形成目標數(shù)據(jù)集,進而通過皮爾遜相關(guān)系數(shù)查找目標數(shù)據(jù)集中與當前異常數(shù)據(jù)段高度相似的異常數(shù)據(jù)段,實現(xiàn)相似數(shù)據(jù)段查找的目的。通過仿真表明,該方法具有良好的準確性和高效性,對提火電機組運行水平以支撐電網(wǎng)多類型機組協(xié)調(diào)運行具有一定的意義。

        猜你喜歡
        符號信息方法
        學符號,比多少
        幼兒園(2021年6期)2021-07-28 07:42:14
        “+”“-”符號的由來
        變符號
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        捕魚
        圖的有效符號邊控制數(shù)
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        男女射精视频在线观看网站| 国产精品短视频| 亚洲精品乱码久久久久久按摩高清 | 久久99精品国产麻豆不卡| 久久亚洲av永久无码精品| 国产无遮挡又黄又爽无VIP| 99久久婷婷国产精品网| 免费国产a国产片高清网站| 亚洲欧洲精品成人久久曰影片| 亚洲一区二区三区在线观看播放 | 婷婷丁香五月中文字幕| 欧美日韩国产另类在线观看| 麻豆国产精品伦理视频| 奇米影视色777四色在线首页| 樱花草在线播放免费中文| 毛片av在线播放亚洲av网站| 日本免费三级一区二区| 欧美成人猛片aaaaaaa| 亚洲av无码专区国产乱码不卡| 国产成人无精品久久久| 国产无卡视频在线观看| 无码人妻一区二区三区兔费| 久久综合给合久久狠狠狠97色69| 久久AⅤ无码精品色午麻豆| 国产精品自产拍在线18禁| 久久久久av无码免费网| 国产欧美日产久久| 男女男在线精品免费观看| 职场出轨的人妻中文字幕| 亚洲中文字幕无码爆乳| 亚洲国产成人精品激情资源9| 有码视频一区二区三区| 亚洲av成人网| 久久香蕉国产精品一区二区三| 国内精品熟女一区二区| 少妇性俱乐部纵欲狂欢少妇| 中国老妇女毛茸茸bbwbabes| 高清国产亚洲va精品| 午夜av天堂精品一区| 成人国内精品久久久久一区| 亚洲午夜精品久久久久久抢|