亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于微簇的橋梁監(jiān)測數(shù)據(jù)流異常識別研究

        2016-11-09 01:11:25吳運宏王戒躁閆光輝
        計算機應用與軟件 2016年9期
        關鍵詞:橋梁概念檢測

        吳運宏 舒 昕 王戒躁 閆光輝

        1(中鐵大橋局武漢橋梁特種技術有限公司 湖北 武漢 430073)2(橋梁結構健康與安全國家重點實驗室 湖北 武漢 430205)3(蘭州交通大學電子與信息工程學院 甘肅 蘭州 730070)

        ?

        基于微簇的橋梁監(jiān)測數(shù)據(jù)流異常識別研究

        吳運宏1,2舒昕1,2王戒躁1,2閆光輝3

        1(中鐵大橋局武漢橋梁特種技術有限公司湖北 武漢 430073)2(橋梁結構健康與安全國家重點實驗室湖北 武漢 430205)3(蘭州交通大學電子與信息工程學院甘肅 蘭州 730070)

        針對橋梁健康監(jiān)測系統(tǒng)中的數(shù)據(jù)流異常問題,提出一種基于微簇的數(shù)據(jù)流異常檢測框架。首先對原始采集信號進行數(shù)據(jù)合并、缺失值填補等預處理;由于監(jiān)測系統(tǒng)各傳感器測點數(shù)據(jù)間存在一定的關聯(lián),利用主成分分析法提取橋梁主要特征參數(shù),去除重疊信息;利用密度聚類算法把數(shù)據(jù)流轉換成微簇,進行微簇的實時生成,并根據(jù)微簇更新機制進行微簇維護,對數(shù)據(jù)流進行分類。通過對湖北某大橋監(jiān)測數(shù)據(jù)的實驗表明,該方法具有較好的異常識別能力,可以自適應概念漂移現(xiàn)象。

        橋梁健康監(jiān)測數(shù)據(jù)流異常識別多傳感器網(wǎng)絡主成分分析微簇

        0 引 言

        橋梁結構健康監(jiān)測系統(tǒng)通過多傳感器網(wǎng)絡采集橋梁重要部位數(shù)據(jù),對橋梁健康進行智能評估[1]。多傳感器網(wǎng)絡采集的流式數(shù)據(jù)連續(xù)到達、頻繁隨時間變化、數(shù)據(jù)量并不確定[2],根據(jù)數(shù)據(jù)的變化來判斷橋梁運營情況,是橋梁健康監(jiān)測中的一項重要研究內容。當橋梁結構出現(xiàn)損傷或產(chǎn)生其他干擾時,如傳感器損壞、監(jiān)測系統(tǒng)不完善或測試環(huán)境發(fā)生變化等,便會引起數(shù)據(jù)流分布不平穩(wěn),數(shù)據(jù)的走向和分布隨時間不斷變化,產(chǎn)生概念漂移現(xiàn)象[3]。因此,在復雜多變的環(huán)境中提高異常數(shù)據(jù)流的識別精度,正確判斷橋梁健康狀況,盡可能避免漏檢和誤檢成為橋梁監(jiān)測中研究的關鍵問題。

        針對數(shù)據(jù)流異常檢測問題,國內外學者做了大量的研究。Muthllkrishnan等人把離群點定義為異常,解決了基于時間序列的特殊數(shù)據(jù)流模型的異常檢測問題[4];Park等人建立了用戶活動的數(shù)據(jù)流,對用戶正常行為模式建模,采用基于數(shù)據(jù)流的聚類方法對用戶異常行為實現(xiàn)異常檢測[5];文獻[6]中利用K-means算法對大量原始數(shù)據(jù)進行聚類分析,對處理后得到的簇再用ID3決策樹進行訓練以消除因閾值帶來的問題,最后綜合兩種算法的權值實現(xiàn)分類,提高了預測的準確度。這些方法都能有效地處理海量數(shù)據(jù),不需要使用訓練數(shù)據(jù)線下訓練,空間復雜度較低。針對傳感器網(wǎng)絡中的數(shù)據(jù),許多學者也提出了相應的算法。Song等人為了把屬性集對聚類算法的影響降至最低,利用Apriori算法先計算屬性的頻繁項集,然后作為K-means聚類算法的屬性集合進行聚類,取得了較好的效果[7];李娜等基于信息熵理論提出了一種基于層次聚類的無監(jiān)督異常檢測算法[8]。肖政宏等人利用K鄰近算法對傳感器網(wǎng)絡節(jié)點進行分簇,簇內節(jié)點的異常檢測采用貝葉斯分類算法,簇頭節(jié)點的異常檢測則采用平均概率方法,該方案有較高的檢測率及較低的誤檢率[9];文獻[10]中研究了時間檢測的覆蓋空洞問題,設計了精確可認證的分布式覆蓋方案保證事件檢測的準確性。

        以上聚類算法部分基于單傳感器,部分不需要離線訓練模型階段。由于正常數(shù)據(jù)和異常數(shù)據(jù)特征差異較大,很容易就能將所有未知異常劃為一個簇,忽略了數(shù)據(jù)中的概念漂移。多傳感器網(wǎng)絡中,異常數(shù)據(jù)的評價不能以單個傳感器瞬時異常為標準進行處理,需要綜合評價;數(shù)據(jù)流分布隨時間不斷變化,要求算法能對數(shù)據(jù)進行增量式聚類及自適應識別。針對這些問題,本文在現(xiàn)有工作基礎上,提出一種把主成分分析與微簇思想相結合的數(shù)據(jù)流異常檢測框架:利用主成分分析法提取橋梁主要特征,對高維空間的屬性進行降維;對數(shù)據(jù)流用密度算法聚類時,引入微簇模型,把數(shù)據(jù)流轉化為微簇,提高處理效率,自適應分類。真實數(shù)據(jù)集上的實驗表明,該算法對傳感器數(shù)據(jù)流有較好的支持,能有效應對概念漂移,提高異常檢測的準確率。

        1 橋梁監(jiān)測數(shù)據(jù)流分析

        多傳感器網(wǎng)絡采集的數(shù)據(jù)不再像以前是靜態(tài)的、有限的、平穩(wěn)的、低速的數(shù)據(jù),而是無限產(chǎn)生的、類分布隨時間變化的、高速的、動態(tài)的、海量的數(shù)據(jù)[11],這種像水流一樣按順序產(chǎn)生的數(shù)據(jù),就叫數(shù)據(jù)流。在橋梁健康監(jiān)測數(shù)據(jù)流中,數(shù)據(jù)會隨著季節(jié)更替、橋梁行車環(huán)境、監(jiān)測系統(tǒng)自身因素(如傳感器溫漂)而發(fā)生改變,異常數(shù)據(jù)會因異常種類不同,如傳感器損壞、船撞等,包含的類標簽并不一樣,從而產(chǎn)生概念漂移。

        概念漂移就是數(shù)據(jù)流的走向和分布隨時間不斷變化,數(shù)據(jù)隱含內容改變而導致目標概念的改變[12],形式主要包括漸進式漂移和突變式漂移。如網(wǎng)絡入侵檢測中,會因入侵行為發(fā)生改變,而產(chǎn)生突變式的概念漂移;顧客的購物偏好會隨著季節(jié)的變化,產(chǎn)生漸進式的概念漂移。橋梁健康監(jiān)測中的多傳感器網(wǎng)絡數(shù)據(jù)流,既存在漸進式概念漂移,也存在突變式概念漂移[13]。

        假設有數(shù)據(jù)流模型S={s1,s2,…,sn,…},其中每段都由若干個連續(xù)的數(shù)據(jù)點組成。再設數(shù)據(jù)段Sm={sm,…,sp-t}是分布平穩(wěn)的,類標簽是m,表示概念M;數(shù)據(jù)段Sn={sp+t,…,sn}分布亦平穩(wěn),類標簽為n,表示概念N。

        如圖1所示,數(shù)據(jù)流S隱含的概念從M變化到N,在時間2t內進行,說明發(fā)生了概念漂移。當時間t取值較小時,可認為發(fā)生了突變式概念漂移,發(fā)生了很快的數(shù)據(jù)分布變化;反之,t較大時,概念漂移的發(fā)生是緩慢的,概念為N的數(shù)據(jù)組慢慢“滲透”到概念為M的數(shù)據(jù)組中,直至分布平穩(wěn)[14]。

        圖1 概念漂移示意圖

        實際應用中,引起概念漂移的因素是多種多樣的。人們并不關心到底發(fā)生了哪種漂移、概念漂移對數(shù)據(jù)流造成的影像有多大,而更加注重于漂移何時發(fā)生,如何對當前學習模型進行修正,使更新后的數(shù)據(jù)模型能夠適應新的數(shù)據(jù)分布。

        2 基于微簇的數(shù)據(jù)流異常檢測

        對于剛采集來的橋梁監(jiān)測數(shù)據(jù),采集初始時刻不同、不同屬性傳感器采集頻率不一樣,包含噪聲多,需要對數(shù)據(jù)進行缺失值填補、時間同步等預處理操作;根據(jù)胡順仁等人在分析橋梁監(jiān)測系統(tǒng)中各傳感器之間關聯(lián)度提出的觀點,不同傳感器采集的數(shù)據(jù)間存在千絲萬縷的聯(lián)系[15],反映信息時有一定重疊,需要把橋梁主要屬性提取出來以簡化和精煉數(shù)據(jù);對提取出來的橋梁主要特征數(shù)據(jù)用基于微簇的聚類算法對數(shù)據(jù)進行進一步分析,來判斷橋梁健康狀況,如圖2所示。

        圖2 橋梁監(jiān)測數(shù)據(jù)流異常識別流程

        2.1橋梁數(shù)據(jù)特征提取

        主成分分析PCA是一種有效的特征提取方法,其基本思想是把原來多個變量通過線性變換得到一組正交基,從而產(chǎn)生新的綜合變量,這些新變量的正交性為零[16]。該方法對相關性大的數(shù)據(jù)進行過濾,在保證原有數(shù)據(jù)信息丟失最少的情況下選擇有代表性的指標,盡量消除屬性間的相互影響,對多維空間變量進行降唯處理,達到壓縮和簡化數(shù)據(jù)的目的。

        已知有p維隨機變量X={x1,x2,…,xp},它們的線性組合構成新的綜合變量。設F1表示原變量的第一個線性組合所形成的主成分指標,即:

        F1=a11x1+a21x2+…+ap1xp

        (1)

        每一個主成分所提取的信息量可以用方差來表示,為了讓每一個綜合變量盡可能多地包含原有變量的信息,主成分的方差應該越大越好,即Var(F1)達到最大。通常第一主成分F1是所有主成分中包含信息量最大的,若第一主成分不足以表達原來p個變量的信息,再考慮選取第二、第三主成分,并且F1與F2之間要保持互相獨立,即兩者的協(xié)方差:

        Cov(F1,F2)=0

        (2)

        以此類推,可以構造出F1,F2,…,Fm為原變量指標的第一、第二、…、第m個主成分。如式(3)所示:

        (3)

        對于每個系數(shù)a,均應滿足規(guī)范化條件:

        需要計算原變量xi與xj的相關系數(shù)矩陣:

        (4)

        其中,rij(i,j=1,2,…,p)為原變量xi與xj相關系數(shù)且rij=rji,計算公式為:

        (5)

        (6)

        前p個主成分的方差貢獻率之和為方差累計貢獻率,計算公式為:

        (7)

        根據(jù)前n個主成分的累計貢獻率之和超過某一閾值(如90%)來選取主成分的個數(shù)。

        2.2基于微簇的異常識別分析

        常規(guī)的K-means算法、密度聚類等算法都是針對靜態(tài)數(shù)據(jù)庫一次性完成聚類。然而橋梁監(jiān)測數(shù)據(jù)是以數(shù)據(jù)流的方式不斷到達的,這就要求聚類算法必須以增量的方式對數(shù)據(jù)進行聚類,而不是每當數(shù)據(jù)到達時都需要掃描數(shù)據(jù)庫來確定數(shù)據(jù)的標簽。本文引入基于微簇的數(shù)據(jù)流處理方法來提高檢測的精度。

        傳統(tǒng)聚類算法中,經(jīng)過對數(shù)據(jù)集一次性掃描后數(shù)據(jù)集被分為不同的類別,這些類形狀任意,包含的數(shù)據(jù)點任意,如圖3所示。在基于微簇的聚類算法中,數(shù)據(jù)集合均以微簇的形式存在,并且微簇能夠覆蓋數(shù)據(jù)流中隨時到達的數(shù)據(jù),完成聚類。

        圖3 傳統(tǒng)聚類算法

        時間窗口分析和K-means密度聚類算法將會被用于其中。時間窗口分析就是對某一時刻開始到另一時刻結束時這一段時間內的所有數(shù)據(jù)進行分析,目的是為了確定需要處理的目標數(shù)據(jù)流。算法開始工作時,數(shù)據(jù)集進入內存,當?shù)谝粋€時間窗口數(shù)據(jù)到達時,微簇并沒有形成,需要調用K-means密度聚類算法對數(shù)據(jù)流進行聚類,以形成新的微簇;隨著數(shù)據(jù)流的不斷到達,潛在概念漂移可能發(fā)生,微簇隨著數(shù)據(jù)流的演化而變化,不斷產(chǎn)生新的微簇或者核心微簇組逐漸退化為孤立微簇,即離群點,此時也需要調用密度聚類算法定期更新核心微簇和孤立微簇的集合。核心微簇和孤立微簇定義如下:

        根據(jù)核心微簇的定義,核心簇中所包含的數(shù)據(jù)均為正常數(shù)據(jù),最理想的狀況就是核心微簇集能覆蓋所有的正常數(shù)據(jù),且任何一個核心微簇都必不可少。

        橋梁數(shù)據(jù)流異常檢測的目的就是通過訓練數(shù)據(jù)集建立一個模型,然后監(jiān)視微簇群的吸收和記錄情況并不斷更新模型,識別隱含概念漂移的數(shù)據(jù)流類標簽,達到提升識別精度的目的?;诋惓?shù)據(jù)在數(shù)據(jù)流中所占比例較少以及數(shù)據(jù)特征與正常數(shù)據(jù)流差別較大的事實[17],可得出:正常數(shù)據(jù)流產(chǎn)生大量微簇,且不斷有新的記錄加入而表現(xiàn)活躍;異常數(shù)據(jù)流產(chǎn)生少量微簇,這些微簇中數(shù)據(jù)點不如正常微簇群中的數(shù)據(jù)多,表現(xiàn)較不活躍,且由于產(chǎn)生異常的原因不同,異常微簇之間、異常微簇與正常微簇之間的微簇間距較大[17]。微簇生成步驟如下:

        (1) 對訓練集x采用K-means聚類算法;

        (2) 設訓練集中第一個點生成微簇C1,并加入微簇隊列;

        (3) 取訓練集x中的點xi,計算xi到微簇隊列中所有點的歐式距離,若該距離小于微簇半徑,則xi加入并更新該微簇;若該距離大于微簇半徑,則生成新的核心微簇或孤立微簇;

        (4) 重復步驟(2)、步驟(3),直至掃描完訓練集中所有點。

        根據(jù)訓練集建立的初始模型,微簇隊列包含核心微簇和孤立微簇,接下來對于數(shù)據(jù)流中新到達的對于數(shù)據(jù)流中新到達的數(shù)據(jù)點p,有如下步驟:

        (1) 當該點與核心微簇中心點c的歐氏距離滿足dist(c,p)≤ε時,p被核心微簇吸收。如圖4所示,實線部分的圓表示核心微簇,虛線部分的圓表示孤立微簇, 數(shù)據(jù)點P1落在核心微簇中直接被吸收,更新核心微簇。

        (2) 當該點與孤立微簇中心點c的歐氏距離滿足dist(c,p)≤ε時,p被孤立微簇吸收,同時計算微簇的權值ω,若ω≥βμ,達到核心微簇的條件,則把該微簇從孤立微簇隊列中刪除,加入到核心微簇中;ω<βμ,更新該孤立微簇。如圖4中的P2。

        (3) 當該點到所有微簇(核心微簇和孤立微簇)中心點c的歐式距離滿足dist(c,p)>ε時,該點不屬于任何類,以該點為中心構造孤立微簇,同時加入孤立微簇隊列。如圖4中的點P3。

        (4) 重復步驟(1)至步驟(3)。

        圖4 微簇進化示意圖

        3 實驗結果及評價

        3.1實驗數(shù)據(jù)采集及預處理

        本文采用湖北省某長江公路大橋的監(jiān)測數(shù)據(jù)作為實驗數(shù)據(jù)。該橋作為滬蓉高速公路主干線湖北省東段和國家高速公路網(wǎng)規(guī)劃中的大慶至廣州高速公路湖北段的共用過江通道,是跨徑組合為(3×67.5+72.5+926+72.5+3×67.5) m的9跨半漂浮體系雙塔混合梁斜拉橋。主橋橋面最大縱坡2.0%,雙向6車道;鋼箱梁外形與混凝土箱梁一致,均為分離式雙箱單室結構,主梁全寬為38 m,梁高3.8 m。根據(jù)橋梁的力學特性分析,大橋監(jiān)控的主要參數(shù)為結構溫度、環(huán)境溫濕、斜拉索索力、主梁撓度和振動、結構應變等。每種傳感器均主要安裝在大橋斜拉索、主梁及主塔上。

        實際橋梁監(jiān)測中,相對來說比較容易獲得大量的正常數(shù)據(jù)樣本,結構損傷樣本不太容易獲取。由于傳感器數(shù)量較多,本文主要選取4號墩到5號墩的部分傳感器數(shù)據(jù)作為樣本,包括: 4個索力傳感器、2個撓度儀、2個應變計、2個加速度傳感器及2個溫濕度傳感器,并把它們重新編號。有選擇性地選取了不同時間段的橋梁監(jiān)測數(shù)據(jù)樣本,共50 000條數(shù)據(jù),人工為其標記,正常數(shù)據(jù)45 920條,傳感器損壞異常樣本集1980條、因大風引起的信號異常樣本850條、因船撞引起的結構異常樣本集320條和疲勞損傷樣本集930條。圖5是索力監(jiān)測數(shù)據(jù)的采集界面。

        圖5 大橋索力監(jiān)測界面

        傳感器采集數(shù)據(jù)時,不同類型的傳感器采集的初始時間不同,采集頻率不一樣,采集時間間隔不同,還會有缺失值,因而需要對數(shù)據(jù)進行預處理。對于頻率不同的數(shù)據(jù),把時間最接近的各個參數(shù)記錄合并到一起,使之在相同的時間段內。當出現(xiàn)單點缺失值時,用該時刻前序2個數(shù)據(jù)和后續(xù)2個數(shù)據(jù)的平均值代替;當出現(xiàn)連續(xù)缺失值時,很大可能是傳感器出現(xiàn)異常,直接歸為異常數(shù)據(jù)樣本集即可。表1是對某一時間段內的數(shù)據(jù)進行采集,然后經(jīng)過預處理后得到的值。

        表1 某段時間段內數(shù)據(jù)統(tǒng)計

        3.2評價方法

        本文采用查全率(recall)和精度率(precision)對實驗結果進行評價。

        算法判斷數(shù)據(jù)流X是否屬于類C時,輸出的結果集可以分為C0、C1和C2三種情況。其中C0表示分類正確的數(shù)據(jù)集,即識別出數(shù)據(jù)流P屬于類C,并且被驗證確實屬于類C的數(shù)據(jù)集合;C1表示這些數(shù)據(jù)不屬于類C但算法把它識別錯誤識別為類C的數(shù)據(jù);C2表示這些數(shù)據(jù)屬于類C但算法卻沒有識別出來的數(shù)據(jù)集合。因此查全率公式定義為:

        (8)

        式(8)用來度量算法發(fā)生數(shù)據(jù)漏檢的情況。精度率定義為:

        (9)

        式(9)用來度量算法發(fā)生數(shù)據(jù)誤判的情況。

        3.3實驗結果

        首先利用主成分分析方法對收集的數(shù)據(jù)進行特征提取與降維,由于收集的數(shù)據(jù)集中濕度變化不大,排除濕度對結果的影響。在此P=9,x={x1,…,x9}。通過Matlab計算得到前5個主成分的貢獻率分別為:per=[49.90,15.35,13.52,10.85,4.77],所對應的特征值為egenvalue=[4.49,1.38,1.21,0.98,0.43]。前5個主成分的累計貢獻率已達到94%,若按90%以上的信息量來設定閾值,則可以選取前5個新的特征元素,其中第一個新因子F1所含信息量最大。

        式(10)給出了前5個主成分的系數(shù)矩陣,則之前的9個屬性{x1,…,x9}可以用5個新的變量F1、F2、F3、F4、F5表示,其各屬性之前的系數(shù)就對應著矩陣里面的列值。

        (10)

        新得到的變量也是數(shù)據(jù)流形式,用基于微簇的數(shù)據(jù)流異常檢測算法對其進行分類,選取50%的數(shù)據(jù)樣本作為訓練數(shù)據(jù)集,剩下的數(shù)據(jù)作為測試集。需要設定的實驗參數(shù)主要包括微簇半徑r,孤立點相對于核心微簇的閾值β,衰減因子λ。微簇半徑r應大小適中,太大則同一個簇中會出現(xiàn)不同標簽的數(shù)據(jù)點,太小則增加了算法空間復雜度,達不到聚類效果,該數(shù)據(jù)需要在實驗中憑經(jīng)驗控制;衰減因子決定了歷史數(shù)據(jù)對當前數(shù)據(jù)流影響的重要程度,可根據(jù)實際需要進行設定;閾值β則按照橋梁監(jiān)測數(shù)據(jù)流的特性來判定。根據(jù)文獻[18],初始化參數(shù)進行如下設置,InitN=1000,數(shù)據(jù)流速V=1000,衰減因子λ=0.25,閾值β=0.01。

        圖6中左邊的柱形代表查全率,右邊柱形代表精度率??梢钥闯鏊惴▽γ恳活惍惓5淖R別效果,包括查全率和精度率。算法對四種異常情況的分類結果準確率大多都在80%以上,船撞事件的精度識別率在75%以上,精度略有降低。因橋梁傳感器系統(tǒng)使用環(huán)境復雜并且多變,并且往往包含許多噪聲數(shù)據(jù),易引起數(shù)據(jù)流的分布不平穩(wěn),即發(fā)生概念漂移現(xiàn)象,需要測試在發(fā)生概念漂移時算法能否自適應處理這些數(shù)據(jù)流。用精度表示識別正確的數(shù)據(jù)流與總數(shù)據(jù)流的比值,建立了精度隨數(shù)據(jù)流的變化曲線坐標軸,如圖7所示。

        圖6 分類查全率及精度率

        圖7 算法識別精度變化

        從圖7中可以看出,算法識別精度主要保持在80%~90%之間,在第32 130條數(shù)據(jù)流出現(xiàn)時識別精度開始呈下降趨勢,第34 870條流到達后識別精度達到最低。通過對數(shù)據(jù)流標簽的監(jiān)測,發(fā)現(xiàn)出現(xiàn)概念漂移的數(shù)據(jù)流是傳感器異常數(shù)據(jù)流,傳感器出現(xiàn)異常時,連續(xù)缺失值和無效值明顯增多,造成數(shù)據(jù)分布紊亂,算法識別精度明顯下降。隨著數(shù)據(jù)流的繼續(xù)達到,識別精度逐漸升高,證明了該算法的有效性。

        4 結 語

        本文對橋梁健康監(jiān)測系統(tǒng)中的多傳感器網(wǎng)絡環(huán)境進行了分析,提出了一種基于微簇的多屬性數(shù)據(jù)流異常監(jiān)測框架。監(jiān)測橋梁的傳感器往往數(shù)量繁多,存在著復雜多樣的關聯(lián)關系,為了降低時間和空間復雜度,并沒必要分析所有數(shù)據(jù)。首先運用主成分分析原理,對判別橋梁健康狀態(tài)意義不大、包含重復信息的屬性進行降維,以減少數(shù)據(jù)的時空開銷;然后利用微簇的思想對新的主成分進行微簇分類,識別異常數(shù)據(jù)。真實數(shù)據(jù)集上的實驗表明,在應對橋梁監(jiān)測數(shù)據(jù)隨時間變化分布不平穩(wěn)而產(chǎn)生概念漂移的問題時,有較好的分類效果。本文也存在不足之處,如考慮到傳感器眾多,只是針對橋梁進行局部分析,若要做全全橋分析,算法的時間復雜度和空間復雜度還需要進一步降低。

        [1] Jingqiu Huang,Ogai H,Chen Shao,et al.On vibration signal analysis in Bridge Health Monitoring System by using Independent Component Analysis[C]//SICE Annual Conference,IEEE,2010:2122-2125.

        [2] 陳斌,陳松燦,潘志松,等.異常檢測綜述[J].山東大學學報:工學版,2009,39(6):13-21.

        [3] Elwell R Polikar.Incremental learning of concept drift in nonstationary environments[J].IEEE Trans on Neural Networks,2011,22(10):1517-1531.

        [4] Muthukrishnan S,Shah R,Vitter J S.Mining deviants in Time Series Data Streams[C]//Proceedings of the 16th International Conference on Scientific and Statistical Database Management,2004:41-50.

        [5] Park N H,Oh S H,Lee W S.Anomaly intrusion detection by clustering transactional audit streams in a host computer[J].Information Sciences,2010,180(12):2375-2389.

        [6] Yasami Y,Mozaffari S P.A novel unsupervised classification approach for network anomaly detection by k-means clustering and ID3 decision tree learning methods[J].Journal of Supercomputing,2010,53(1):231-245.[7] Song N,Zhou G.A study on intrusion detection based on data mining[C]//International Conference of Information Science and Management Engineering,2010:135-138.

        [8] 李娜,鐘誠.基于劃分和凝聚層次聚類的無監(jiān)督異常檢測[J].計算機工程,2008,34(2):120-123.

        [9] 肖政宏,陳志剛,李慶華.WSN中基于分布式機器學習的異常檢測數(shù)據(jù)研究[J].系統(tǒng)仿真學報,2011,23(1):121-127.

        [10] Bejerano Y.Coverage verification without location information[J].IEEE Trans on Mobile Computing,2012,11(4):631-643.

        [11] Knorr E M,Ng R T.Algorithms for mining distance-based outliers in large datasets[C]//Proceedings of VLDB 1998 C J. NewYork,USA,Morgan Kaufmann,1998:392-403.

        [12] Widmer G,Kubat M.Learning in the Presence of Concept Drift and Hidden Contexts[J].Machine Learning,1996,23(1):69-101.

        [13] Elwell R,Polika R.Incremental learning of concept drift in non-stationary environments[J].IEEE Trans on Neural Networks,2011,22(10):1517-1531.

        [14] Tsymbal A.The problem of concept drift:definitions and related work[J].Computer Science Department,Trinity College Dublin,2004.

        [15] 胡順仁,陳偉民,章鵬.橋梁監(jiān)測系統(tǒng)多傳感器測點之間的關聯(lián)分析[J].土木工程學報,2009,42(3):81-86.

        [16] 梁棟,張宇峰,袁慎芳,等.橋梁數(shù)據(jù)異常診斷方法在伸縮縫中的應用[J].數(shù)據(jù)采集與處理,2011,26(5):579-584.

        [17] 肖三,楊雅輝,沈晴霓.基于微簇的在線網(wǎng)絡異常檢測方法[J].計算機工程與應用,2013,49(6):86-90.

        [18] 任培花.基于微簇進化學習的數(shù)據(jù)流快速聚類算法研究[J].計算機仿真,2013,30(3):343-346.

        ON ANOMALY DETECTION OVER DATA STREAM OF BRIDGE HEALTH MONITORING BASED ON MICRO CLUSTER

        Wu Yunhong1,2Shu Xin1,2Wang Jiezao1,2Yan Guanghui3

        1(Wuhan Bridge Special Technology Corporation,Wuhan 430073,Hubei,China)2(StateKeyLaboratoryforHealthandSafetyofBridgeStructures,Wuhan430205,Hubei,China)3(CollegeofElectronicandInformationEngineering,LanzhouJiaotongUniversity,Lanzhou730070,Gansu,China)

        Aiming at the problem of data stream anomaly in bridge health monitoring system, this paper proposes a micro cluster-based data stream anomaly detection framework. First, it pre-processes the primitive acquisition data by data merging and missing data imputation. Since there is certain correlation between the data of measuring points of each sensor in monitoring system, it uses principal component analysis to extract bridge’s main feature parameters in order to remove the redundant information. Then it converts the data streams into micro clusters with density clustering algorithm, carries out real-time generation of micro clusters, and maintains the micro clusters according to their updating mechanism, as well as classifies data streams. It is demonstrated through the experiment on monitoring data of a certain bridge in Hubei Province that the proposed method has stronger capability of anomaly detection, and is able to self-adapt for the concept drift phenomenon.

        Bridge health monitoringData stream anomaly detectionMulti-sensor networksPrincipal component analysisMicro cluster

        2014-11-19。國家自然科學基金項目(61163010);東湖國家自主創(chuàng)新示范區(qū)現(xiàn)代服務業(yè)試點項目(2011-dhfwy-029)。吳運宏,高級工程師,主研領域:橋梁施工監(jiān)控,橋梁維修整治。舒昕,助理工程師。王戒躁,教授級高工。閆光輝,教授。

        TP306.1

        A

        10.3969/j.issn.1000-386x.2016.09.011

        猜你喜歡
        橋梁概念檢測
        Birdie Cup Coffee豐盛里概念店
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        幾樣概念店
        手拉手 共搭愛的橋梁
        句子也需要橋梁
        學習集合概念『四步走』
        聚焦集合的概念及應用
        高性能砼在橋梁中的應用
        亚洲av成人综合网成人| 国产精品亚洲国产| 亚洲国产综合性感三级自拍| 国产成人一区二区三区影院| av无码电影一区二区三区| 国产嫩草av一区二区三区| 国产a国产片国产| 老少交欧美另类| 亚洲精品综合色区二区| 尤物蜜桃视频一区二区三区| 丰满熟妇乱又伦精品| 亚洲av无码不卡| 国内自拍偷拍亚洲天堂| 一道本加勒比在线观看| 国产在线第一区二区三区| 精品一区二区三区无码免费视频| 免费大片黄在线观看| 2022精品久久久久久中文字幕| 精品久久一区二区三区av制服| 亚洲情综合五月天| 亚洲一本大道无码av天堂| 欧美日韩国产高清| 亚州av高清不卡一区二区| 好紧好爽免费午夜视频| 亚洲av成人一区二区三区在线观看| 爆乳午夜福利视频精品| 蜜桃高清视频在线看免费1| 波多野结衣久久精品99e| 大地资源网最新在线播放| 中文字幕日本女优在线观看| 亚洲人成网站色在线入口口| 在线观看热码亚洲av每日更新| 五月天国产精品| 青青草视频在线观看视频免费| 亚洲av高清一区二区三区| 亚洲精品久久久www小说| 少妇精品无码一区二区三区| 少妇一区二区三区乱码 | 亚洲视频在线播放免费视频| 日本男人精品一区二区| 中文字幕久久精品一二三区 |