亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        并行傳輸程序中時序數(shù)據(jù)相似性檢測軟件設(shè)計

        2020-12-28 02:10:22李學(xué)威張瑞
        電腦知識與技術(shù) 2020年33期
        關(guān)鍵詞:相似性

        李學(xué)威 張瑞

        摘要:針對并行傳輸程序中時序數(shù)據(jù)相似性檢測受到網(wǎng)絡(luò)攻擊的影響,以提高時序數(shù)據(jù)相似性檢測性能為目的,提出了并行傳輸程序中時序數(shù)據(jù)相似性檢測軟件設(shè)計。結(jié)合時間序列相似性度量算法,分析了并行傳輸程序中時序數(shù)據(jù),通過對比不同度量方法的優(yōu)點,完成時序數(shù)據(jù)的相似性度量,在處理各塊時序數(shù)據(jù)的基礎(chǔ)上,以動態(tài)的方式生成聚類網(wǎng)格,并將時序數(shù)據(jù)逐個映射到相應(yīng)聚類網(wǎng)格上,完成時序數(shù)據(jù)的聚類,最后利用時序數(shù)據(jù)相似性檢測程序設(shè)計,實現(xiàn)了并行傳輸程序中時序數(shù)據(jù)相似性的檢測。實驗結(jié)果表明,提出的并行傳輸程序中時序數(shù)據(jù)相似性檢測軟件可以提高時序數(shù)據(jù)相似性檢測性能。

        關(guān)鍵詞:并行傳輸程序;時序數(shù)據(jù);相似性;檢測軟件

        中圖分類號:TP391 文獻標(biāo)識碼:A

        文章編號:1009-3044(2020)33-0071-03

        開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):

        時序數(shù)據(jù)是隨著時間的變化而形成的有序數(shù)據(jù)序列,時序數(shù)據(jù)集反映了數(shù)據(jù)隨著時間變化的過程狀態(tài),可以采用實際的數(shù)值或符號來定義[1]。隨著時代的變遷,并行傳輸程序中產(chǎn)生了大量的時序數(shù)據(jù),時序數(shù)據(jù)在不斷地累積過程中,如何分析和處理并行傳輸程序中的時序數(shù)據(jù)相似性已經(jīng)成為一種必要需求。并行傳輸程序中時序數(shù)據(jù)相似性檢測是指將對時間序列中單位數(shù)據(jù)點的數(shù)值進行度量,對超出閾值或者閾值范圍內(nèi)的時序數(shù)據(jù)點進行告警[2]。針對并行傳輸程序中時序數(shù)據(jù)的相似性檢測,傳統(tǒng)的檢測方法往往存在一定局限性,無法在相同的場景中進行相關(guān)技術(shù)知識的遷移和推廣。

        人們在日常生活中產(chǎn)生的社會、經(jīng)濟、政治、文化、食物、衣著、住房、交通等各種數(shù)據(jù),都是通過計算機軟件技術(shù)的字節(jié)數(shù)據(jù)進行傳輸和存儲的。在世界各地,各種活動都會產(chǎn)生大量的數(shù)據(jù)。爆炸式的過程數(shù)據(jù)增長、通用的數(shù)據(jù)標(biāo)準(zhǔn)以及龐大的時序數(shù)據(jù)信息庫,將人類社會帶人了真正的虛擬數(shù)據(jù)時代[3]。因此,如何找到一種通用性和兼容性好、且功能強大的數(shù)據(jù)分析工具,對并行傳輸程序中時序數(shù)據(jù)集進行統(tǒng)計分析,并從中提煉出更多有價值的時序數(shù)據(jù)信息,早就成了數(shù)據(jù)時代的必然要求[4]。如何并行傳輸程序中時序數(shù)據(jù)進一步系統(tǒng)化,形成更加有效的理論知識,為人類社會的生產(chǎn)和實踐乃至調(diào)度決策,提供相應(yīng)的數(shù)據(jù)支持和理論幫助,已經(jīng)成為數(shù)據(jù)時代的必然要求。時序數(shù)據(jù)相似性檢測軟件正是基于這一需求而產(chǎn)生的,它在人類社會各行各業(yè)中的作用也越來越重要[5]。

        基于以上背景,本文設(shè)計了并行傳輸程序中時序數(shù)據(jù)相似性檢測程序,從而提高時序數(shù)據(jù)相似性檢測性能。

        1 時序數(shù)據(jù)相似性檢測軟件設(shè)計

        1.1度量時序數(shù)據(jù)的相似性

        在度量時序數(shù)據(jù)相似性過程中,結(jié)合時間序列相似性度量算法,提出了基于支持增量數(shù)據(jù)的時序數(shù)據(jù)相似性度量算法。在并行傳輸程序中時序數(shù)據(jù)的分析中,計算時序數(shù)據(jù)相似性是一個重要且基本的問題,通常被應(yīng)用在時序數(shù)據(jù)的聚類、相似性搜索、分類和預(yù)測中,因此并行傳輸程序中時序數(shù)據(jù)相似性度量的好壞直接影響時序數(shù)據(jù)的分析結(jié)果[6]。時序數(shù)據(jù)相似性度量有以下幾種方法:

        1.1.1符號化距離

        把并行傳輸程序中的時序數(shù)據(jù)轉(zhuǎn)換為字符串的形式,然后對轉(zhuǎn)換后的字符串進行相似性度量,這是符號距離的主要思想。符號距離測量的著名方法是以歐幾里德距離為基礎(chǔ)的。首先將原始時間序列數(shù)據(jù)轉(zhuǎn)換為滿足標(biāo)準(zhǔn)高斯分布值的序列,然后利用SAX表示法將其轉(zhuǎn)換為字符串的形式。極大公共子串問題可視為時間序列數(shù)據(jù)的符號距離度量[7]。傳統(tǒng)的解決方法是采用動態(tài)規(guī)劃法,得到兩個字符串的最大公共子串,它的異構(gòu)性是O(m*n)。很明顯,這種方法對于解決較長的時間序列數(shù)據(jù)的相似度量是無效的。

        1.1.2 動態(tài)時間彎曲

        動態(tài)時間彎曲是一種廣泛使用的時間序列數(shù)據(jù)相似性度量方法,它既能對非均等時間序列數(shù)據(jù)的相似性進行度量,又能對異常時序數(shù)據(jù)進行相似性度量。其不利之處是時間效率低,長時間序列數(shù)據(jù)的相似度不高。

        由于動態(tài)時間彎曲的時間復(fù)雜度一般情況下為O(n2),因此對于比較長的兩個時間序列數(shù)據(jù),在計算過程中耗費的時間往往也是比較長的,不能滿足動態(tài)時間彎曲的實際需求。當(dāng)前,研究者們對如何提高動態(tài)時間彎曲的時間性能進行了比較深入的研究,其中,快速時間彎曲是經(jīng)典動態(tài)時間彎曲的一種近似方法,它綜合利用了約束和時序數(shù)據(jù)提取兩種方法來加快計算速度。該方法首先對原始時間序列數(shù)據(jù)進行抽象,即通過具體的算法對時間序列數(shù)據(jù)進行粗粒度處理,再對時間序列數(shù)據(jù)進行粗粒度計算[8]。在粗粒度條件下,得到的規(guī)則路徑經(jīng)過的方塊被進一步細化成細粒度的時間序列,并與之前的結(jié)果進行了比較。在此基礎(chǔ)上,利用動態(tài)時間彎曲縮小了時序數(shù)據(jù)的搜索空間,得到了動態(tài)彎曲距離。由于動態(tài)時間彎曲影響因素較多,算法的時間復(fù)雜度為線性時間復(fù)雜度。此外,還提出了一種滿足動態(tài)時間彎曲下要求的測距方法——快速計算相似度搜索法。

        1.1.3其他距離度量方法

        時序數(shù)據(jù)的長度往往超過了正常時序數(shù)據(jù)的維度,為了進一步提高時序數(shù)據(jù)的搜索效率,需要對時序數(shù)據(jù)特征進行變換,通過降維法來提高相似性搜索的效率;在建立時間序列模型的基礎(chǔ)上,計算一段時間序列數(shù)據(jù)產(chǎn)生另一段時間序列數(shù)據(jù)的相似度,得出相似度度量結(jié)果。

        1.2聚類時序數(shù)據(jù)

        并行傳輸程序中時序數(shù)據(jù)的聚類分為時序數(shù)據(jù)的在線處理和離線處理兩個過程,時序數(shù)據(jù)在線處理過程中,對各塊時序數(shù)據(jù)進行處理,以動態(tài)的方式生成聚類網(wǎng)格,并將時序數(shù)據(jù)逐個映射到相應(yīng)聚類網(wǎng)格上。采用密度門限將在線處理算法生成的聚類網(wǎng)格分為稠密聚類網(wǎng)格、過渡聚類網(wǎng)格和稀疏聚類網(wǎng)格[9]。對密集聚類網(wǎng)格、過渡聚類網(wǎng)格和稀疏聚類網(wǎng)格分別采用不同的處理方法得到時序數(shù)據(jù)聚類集,并將其存儲到時序數(shù)據(jù)庫中。離線時序數(shù)據(jù)處理過程中,根據(jù)不同用戶對時序數(shù)據(jù)的需求,抽取一定時間范圍內(nèi)的時序數(shù)據(jù)聚類集合,通過判斷兩個時序數(shù)據(jù)集合是否具有相似性,再對數(shù)據(jù)進行聚類,得到最終的聚類結(jié)果。

        傳統(tǒng)意義上的固定劃分網(wǎng)格方法不能適應(yīng)并行傳輸程序中時序數(shù)據(jù)的相似性特征,而且固定劃分網(wǎng)格一旦劃分就不可以發(fā)生改變。為了避免這一問題產(chǎn)生,本文在聚類時序數(shù)據(jù)時引入了動態(tài)生成網(wǎng)格方法,根據(jù)時序數(shù)據(jù)的特征生成相應(yīng)的網(wǎng)格[10]。

        當(dāng)時序數(shù)據(jù)塊內(nèi)有n個時序數(shù)據(jù)單元時,先采集時序數(shù)據(jù)塊內(nèi)部的時序數(shù)據(jù)單元特征,通過計算時序數(shù)據(jù)單元在每一個維度屬性的均值δj,確定網(wǎng)格單元內(nèi)每一個維度空間的劃分長度hi。時序數(shù)據(jù)每一個維度屬性的均值為:

        網(wǎng)格單元的處理方法有兩種,包括稠密網(wǎng)格處理及過渡網(wǎng)格和稀疏網(wǎng)格處理。稠密網(wǎng)格處理是以網(wǎng)格的中心點作為頂點,如果選取的任意兩個網(wǎng)格都是相鄰的,就為其中一個網(wǎng)格賦予一條邊,生成一個稠密且沒有方向的有權(quán)圖,通過利用深度優(yōu)先算法獲取有權(quán)圖的連通分支,從而得到一個稠密網(wǎng)格簇集合;過渡網(wǎng)格處理必須先計算稠密網(wǎng)格中的所有點距網(wǎng)格中心距離的標(biāo)準(zhǔn)差。令任意一個網(wǎng)格單元為gm,其標(biāo)準(zhǔn)差為:

        1.3 設(shè)計時序數(shù)據(jù)相似性檢測程序

        在完成并行傳輸程序中時序數(shù)據(jù)空間網(wǎng)格劃分的基礎(chǔ)上,采用二元正態(tài)密度核函數(shù),來計算時序數(shù)據(jù)在任意一個單元格的密度估計值,計算公式為:

        根據(jù)上述的計算過程,將并行傳輸程序中的異常區(qū)域看作是滿足一定條件的相鄰密度值相同,或者是近似單元格連成的區(qū)域,并行傳輸程序中異常區(qū)域的判斷為:

        其中,d (δ1)和d(δ2)分別表示并行傳輸程序中兩個相鄰單元格的密度估計值,ε表示并行傳輸程序中異常區(qū)域的判斷閾值。

        根據(jù)上述步驟檢測,獲得并行傳輸程序的異常區(qū)域之后,需要進一步檢測并行傳輸程序中異常區(qū)域的時序數(shù)據(jù)活動位置隨時間的變化情況,完成時序數(shù)據(jù)的檢測。假設(shè)Oi和ARi分別表示并行傳輸程序中任意一個時序數(shù)據(jù)和異常區(qū)域,將異常區(qū)域轉(zhuǎn)換為二進制序列,即:

        B=b1b2…bi…bn

        (8)

        由于并行傳輸程序中時序數(shù)據(jù)頻譜泄露或其他原因得到了一系列候選周期圖,為了避免并行傳輸程序存在不正確和虛假報警現(xiàn)象,通過引入自相關(guān)函數(shù)來檢驗得到的候選周期圖,確定并行傳輸程序中異常區(qū)域時序數(shù)據(jù)變化周期,并行傳輸程搜索空間,得到了動態(tài)彎曲距離。由于動態(tài)時間彎曲影響因素較多,算法的時間復(fù)雜度為線性時間復(fù)雜度。此外,還提出了一種滿足動態(tài)時間彎曲下要求的測距方法——快速計算相似度搜索法。

        1.1.3其他距離度量方法

        時序數(shù)據(jù)的長度往往超過了正常時序數(shù)據(jù)的維度,為了進一步提高時序數(shù)據(jù)的搜索效率,需要對時序數(shù)據(jù)特征進行變換,通過降維法來提高相似性搜索的效率;在建立時間序列模型的基礎(chǔ)上,計算一段時間序列數(shù)據(jù)產(chǎn)生另一段時間序列數(shù)據(jù)的相似度,得出相似度度量結(jié)果。

        1.2聚類時序數(shù)據(jù)

        并行傳輸程序中時序數(shù)據(jù)的聚類分為時序數(shù)據(jù)的在線處理和離線處理兩個過程,時序數(shù)據(jù)在線處理過程中,對各塊時序數(shù)據(jù)進行處理,以動態(tài)的方式生成聚類網(wǎng)格,并將時序數(shù)據(jù)逐個映射到相應(yīng)聚類網(wǎng)格上。采用密度門限將在線處理算法生成的聚類網(wǎng)格分為稠密聚類網(wǎng)格、過渡聚類網(wǎng)格和稀疏聚類網(wǎng)格[9]。對密集聚類網(wǎng)格、過渡聚類網(wǎng)格和稀疏聚類網(wǎng)格分別采用不同的處理方法得到時序數(shù)據(jù)聚類集,并將其存儲到時序數(shù)據(jù)庫中。離線時序數(shù)據(jù)處理過程中,根據(jù)不同用戶對時序數(shù)據(jù)的需求,抽取一定時間范圍內(nèi)的時序數(shù)據(jù)聚類集合,通過判斷兩個時序數(shù)據(jù)集合是否具有相似性,再對數(shù)據(jù)進行聚類,得到最終的聚類結(jié)果。

        傳統(tǒng)意義上的固定劃分網(wǎng)格方法不能適應(yīng)并行傳輸程序中時序數(shù)據(jù)的相似性特征,而且固定劃分網(wǎng)格一旦劃分就不可以發(fā)生改變。為了避免這一問題產(chǎn)生,本文在聚類時序數(shù)據(jù)時引入了動態(tài)生成網(wǎng)格方法,根據(jù)時序數(shù)據(jù)的特征生成相應(yīng)的網(wǎng)格[10]。

        當(dāng)時序數(shù)據(jù)塊內(nèi)有n個時序數(shù)據(jù)單元時,先采集時序數(shù)據(jù)塊內(nèi)部的時序數(shù)據(jù)單元特征,通過計算時序數(shù)據(jù)單元在每一個維度屬性的均值δj,確定網(wǎng)格單元內(nèi)每一個維度空間的劃分長度hi。時序數(shù)據(jù)每一個維度屬性的均值為:

        網(wǎng)格單元的處理方法有兩種,包括稠密網(wǎng)格處理及過渡網(wǎng)格和稀疏網(wǎng)格處理。稠密網(wǎng)格處理是以網(wǎng)格的中心點作為頂點,如果選取的任意兩個網(wǎng)格都是相鄰的,就為其中一個網(wǎng)格賦予一條邊,生成一個稠密且沒有方向的有權(quán)圖,通過利用深度優(yōu)先算法獲取有權(quán)圖的連通分支,從而得到一個稠密網(wǎng)格簇集合;過渡網(wǎng)格處理必須先計算稠密網(wǎng)格中的所有點距網(wǎng)格中心距離的標(biāo)準(zhǔn)差。令任意一個網(wǎng)格單元為gm,其標(biāo)準(zhǔn)差為:

        1.3 設(shè)計時序數(shù)據(jù)相似性檢測程序

        在完成并行傳輸程序中時序數(shù)據(jù)空間網(wǎng)格劃分的基礎(chǔ)上,采用二元正態(tài)密度核函數(shù),來計算時序數(shù)據(jù)在任意一個單元格的密度估計值,計算公式為:

        根據(jù)上述的計算過程,將并行傳輸程序中的異常區(qū)域看作是滿足一定條件的相鄰密度值相同,或者是近似單元格連成的區(qū)域,并行傳輸程序中異常區(qū)域的判斷為:

        其中,d (δ1)和d(δ2)分別表示并行傳輸程序中兩個相鄰單元格的密度估計值,ε表示并行傳輸程序中異常區(qū)域的判斷閾值。

        根據(jù)上述步驟檢測,獲得并行傳輸程序的異常區(qū)域之后,需要進一步檢測并行傳輸程序中異常區(qū)域的時序數(shù)據(jù)活動位置隨時間的變化情況,完成時序數(shù)據(jù)的檢測。假設(shè)Oi和ARi分別表示并行傳輸程序中任意一個時序數(shù)據(jù)和異常區(qū)域,將異常區(qū)域轉(zhuǎn)換為二進制序列,即:

        B=b1b2…bi…bn

        (8)

        由于并行傳輸程序中時序數(shù)據(jù)頻譜泄露或其他原因得到了一系列候選周期圖,為了避免并行傳輸程序存在不正確和虛假報警現(xiàn)象,通過引入自相關(guān)函數(shù)來檢驗得到的候選周期圖,確定并行傳輸程序中異常區(qū)域時序數(shù)據(jù)變化周期,并行傳輸程

        序中時序數(shù)據(jù)相似性檢測。

        2 實驗對比分析

        為了進一步驗證并行傳輸程序中時序數(shù)據(jù)相似性檢測軟件的可行性,采用傳統(tǒng)時序數(shù)據(jù)相似性檢測軟件做對比,對比測試注入不同比例的網(wǎng)絡(luò)攻擊時,兩種時序數(shù)據(jù)相似性檢測軟件的檢測準(zhǔn)確率,對比結(jié)果如表1所示。

        猜你喜歡
        相似性
        一類上三角算子矩陣的相似性與酉相似性
        基于基因表達譜相似性的四物湯重定位及抗乳腺癌有效成分群辨識
        淺析當(dāng)代中西方繪畫的相似性
        河北畫報(2020年8期)2020-10-27 02:54:20
        基于隱喻相似性研究[血]的慣用句
        低滲透黏土中氯離子彌散作用離心模擬相似性
        基于相似性評價的輻射輸運計算建模方法研究
        基于序貫相似性檢測的NCC目標(biāo)跟蹤快速匹配方法
        基于信號周期相似性和LZW編碼的數(shù)據(jù)壓縮方法
        電測與儀表(2014年6期)2014-04-04 11:59:52
        一種新的基于對稱性的字符串相似性處理算法
        一種相似性學(xué)習(xí)算法及其在人臉識別中的應(yīng)用
        計算機工程(2014年6期)2014-02-28 01:26:44
        欧美亚洲精品一区二区| 国产在线观看视频一区二区三区| 曰韩内射六十七十老熟女影视| 国产在线精品一区二区在线看| 成人动漫久久| 日韩人妖一区二区三区| 亚洲免费国产中文字幕久久久 | 国产办公室秘书无码精品99| 日本护士吞精囗交gif| 在线国产视频精品视频| 国产成人精品一区二三区在线观看| 99久久无码一区人妻| 亚洲欧美日韩人成在线播放 | 色中文字幕视频在线观看| 国内自拍速发福利免费在线观看| 国产精品网站在线观看免费传媒 | 人妻中文字幕一区二区二区| 日本一区二区免费在线看| 亚洲一区二区三区av无码| 国产女人成人精品视频| 熟女人妻一区二区在线观看| 成年人观看视频在线播放| 骚片av蜜桃精品一区| 国产精品一区二区av片| 日本美女性亚洲精品黄色| 成人欧美一区二区三区在线| 欧美巨大xxxx做受中文字幕| 无码三级国产三级在线电影| 激情五月开心五月麻豆| 欧洲熟妇色 欧美| 日韩中文在线视频| 在线观看亚洲视频一区二区| 男女猛烈拍拍拍无挡视频| 品色堂永远的免费论坛| 国产精品综合色区av| 青青手机在线观看视频| 少妇人妻偷人精品视频| 玩弄人妻奶水无码AV在线| 国产亚洲熟妇在线视频| 熟女性饥渴一区二区三区| 无夜精品久久久久久|