亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于分層的體域網(wǎng)異常數(shù)據(jù)檢測(cè)方法

        2024-01-22 07:19:10廖棟森祝長(zhǎng)鴻余琪琦任君玉黃福瑩覃團(tuán)發(fā)
        關(guān)鍵詞:復(fù)雜度濾波器距離

        廖棟森,祝長(zhǎng)鴻,余琪琦,任君玉,黃?,?,覃團(tuán)發(fā)+

        (1.廣西大學(xué) 計(jì)算機(jī)與電子信息學(xué)院,廣西 南寧 530004;2.廣西大學(xué) 多媒體通信與網(wǎng)絡(luò)技術(shù)重點(diǎn)實(shí)驗(yàn)室,廣西 南寧 530004)

        0 引 言

        無線體域網(wǎng)[1](wireless body area networks,WBAN)是由人體攜帶的傳感器節(jié)點(diǎn)、匯聚節(jié)點(diǎn)和遠(yuǎn)程服務(wù)器組成的網(wǎng)絡(luò)。WBAN根據(jù)節(jié)點(diǎn)觀測(cè)的異常數(shù)據(jù)獲知人體健康狀態(tài)的變化和節(jié)點(diǎn)的工作狀態(tài)。現(xiàn)有的WBAN異常數(shù)據(jù)檢測(cè)方法可分為兩類:①基于數(shù)據(jù)統(tǒng)計(jì)特性的異常數(shù)據(jù)檢測(cè)方法。這類方法根據(jù)距離和信息熵來檢測(cè)異常數(shù)據(jù)。②基于機(jī)器學(xué)習(xí)的異常數(shù)據(jù)檢測(cè)方法。這類方法使用已有的數(shù)據(jù)訓(xùn)練模型,將數(shù)據(jù)分類而得到異常數(shù)據(jù)。然而這兩類檢測(cè)方法對(duì)數(shù)據(jù)點(diǎn)逐一分類,得到的異常數(shù)據(jù)是非連續(xù)數(shù)據(jù)點(diǎn)的集合,忽視了人體健康狀態(tài)發(fā)生變化時(shí),異常數(shù)據(jù)應(yīng)呈連續(xù)分布,檢測(cè)的結(jié)果應(yīng)按時(shí)間段分布,而這兩類方法只反映了人體在離散時(shí)間點(diǎn)的狀態(tài),缺乏對(duì)人體健康狀態(tài)發(fā)生變化時(shí)間段的準(zhǔn)確定位。由此本文將異常數(shù)據(jù)分為偶然性的異常數(shù)據(jù)點(diǎn)和連續(xù)性的異常數(shù)據(jù)集兩部分,并提出了基于Hampel濾波器和DBSCAN分層的異常數(shù)據(jù)檢測(cè)方法。該方法首先根據(jù)Hampel濾波器檢測(cè)并替換偶然性的異常數(shù)據(jù)點(diǎn),保證數(shù)據(jù)的連續(xù)性;其次,基于滑動(dòng)時(shí)間窗,將時(shí)間窗中的數(shù)據(jù)全部視為異常數(shù)據(jù)或正常數(shù)據(jù);然后根據(jù)DBSCAN本質(zhì)為劃分高密度區(qū)域的特征,將DBSCAN對(duì)數(shù)據(jù)聚類的結(jié)果轉(zhuǎn)換為每一個(gè)時(shí)間窗中數(shù)據(jù)能否聚類的問題;最后依據(jù)人體生理參數(shù)的相關(guān)性標(biāo)注出異常數(shù)據(jù)集。

        1 相關(guān)工作

        基于數(shù)據(jù)統(tǒng)計(jì)特性的異常數(shù)據(jù)檢測(cè)方法使用數(shù)據(jù)的中心趨勢(shì)統(tǒng)計(jì)量、散布程度統(tǒng)計(jì)量和分布統(tǒng)計(jì)量檢測(cè)異常數(shù)據(jù)。Chang等[2]提出了基于時(shí)間窗的滑動(dòng)平均模型,在時(shí)間窗截取數(shù)據(jù)的基礎(chǔ)上,使用滑動(dòng)平均模型預(yù)測(cè)下一數(shù)據(jù)點(diǎn)是否為異常數(shù)據(jù)點(diǎn),其模型簡(jiǎn)單并提供了較好的檢測(cè)精度;在文獻(xiàn)[3,4]中,研究者提出了基于馬氏距離和信息熵的異常數(shù)據(jù)檢測(cè)方法,這些方法通過計(jì)算數(shù)據(jù)點(diǎn)之間的馬氏距離和信息熵作為判定異常數(shù)據(jù)點(diǎn)的依據(jù),計(jì)算復(fù)雜度低,但需要訪問所有待檢測(cè)的數(shù)據(jù),不滿足WBAN的實(shí)時(shí)性要求。

        在基于機(jī)器學(xué)習(xí)的異常數(shù)據(jù)檢測(cè)方面,文獻(xiàn)[5-8]提出了基于監(jiān)督學(xué)習(xí)的異常數(shù)據(jù)檢測(cè)方法,采用的監(jiān)督學(xué)習(xí)方法有One-Class SVM(support vector machine)、k-NN(k-nearest neighbors)、貝葉斯網(wǎng)絡(luò)等,這些方法根據(jù)已有數(shù)據(jù)建立模型,利用數(shù)據(jù)的內(nèi)在特征訓(xùn)練模型,提高了異常數(shù)據(jù)檢測(cè)的精度,但存在使用的數(shù)據(jù)需預(yù)標(biāo)簽,WBAN異常數(shù)據(jù)占比較小,模型訓(xùn)練困難,且每個(gè)人健康狀態(tài)不同,訓(xùn)練的模型不能泛化,以及One-Class SVM時(shí)間復(fù)雜度高,K-NN檢測(cè)精度不足,貝葉斯網(wǎng)絡(luò)適應(yīng)度低等問題。文獻(xiàn)[9-12]提出了基于無監(jiān)督學(xué)習(xí)的異常數(shù)據(jù)檢測(cè)方法,采用的無監(jiān)督學(xué)習(xí)方法有主成分分析法、k-means、高斯混合模型、多層次聚類等,這些方法根據(jù)人體處于正常狀態(tài)時(shí)數(shù)據(jù)相對(duì)集中而異常數(shù)據(jù)較少的分布特征進(jìn)行聚類或降維,無需對(duì)數(shù)據(jù)進(jìn)行預(yù)標(biāo)簽,提高了算法的泛化能力,但存在需采集較長(zhǎng)時(shí)間段的數(shù)據(jù)進(jìn)行學(xué)習(xí),限制了WBAN系統(tǒng)的實(shí)時(shí)性,以及主成分分析法效率不高,k-means和高斯混合模型需根據(jù)不同個(gè)體獲取先驗(yàn)知識(shí)等問題。

        2 系統(tǒng)模型

        2.1 網(wǎng)絡(luò)模型

        WBAN網(wǎng)絡(luò)模型如圖1所示。被監(jiān)護(hù)人員攜帶n個(gè)傳感器節(jié)點(diǎn) {p1,p2,…,pi,…,pn},pi表示其中第i個(gè)傳感器節(jié)點(diǎn)。傳感器節(jié)點(diǎn)由于攜帶的能量、計(jì)算能力受限,對(duì)采集的數(shù)據(jù)進(jìn)行一定處理后,將其傳輸至匯聚節(jié)點(diǎn),匯聚節(jié)點(diǎn)一般具有較高的運(yùn)算和存儲(chǔ)能力,可以承擔(dān)復(fù)雜的計(jì)算任務(wù),數(shù)據(jù)在匯聚節(jié)點(diǎn)處理后通過互聯(lián)網(wǎng)傳輸至醫(yī)院并備份于數(shù)據(jù)中心。

        2.2 檢測(cè)模型

        圖2為本文提出的異常數(shù)據(jù)檢測(cè)模型。由于偶然性的異常數(shù)據(jù)點(diǎn)來源于環(huán)境噪聲和偶然的軟件或硬件錯(cuò)誤等因素,連續(xù)性的異常數(shù)據(jù)集產(chǎn)生于人體健康狀態(tài)的變化和連續(xù)的軟件或硬件錯(cuò)誤等因素,因此模型根據(jù)異常數(shù)據(jù)的來源分為兩個(gè)部分。①模型先通過Hampel濾波器檢測(cè)并替換偶然性的異常數(shù)據(jù)點(diǎn),保證數(shù)據(jù)的連續(xù)性;②模型將異常數(shù)據(jù)集檢測(cè)分解為基于DBSCAN的異常數(shù)據(jù)集檢測(cè)和異常數(shù)據(jù)集驗(yàn)證?;贒BSCAN的異常數(shù)據(jù)集檢測(cè)找出異常數(shù)據(jù)集所在的位置,在驗(yàn)證異常數(shù)據(jù)集的來源后,若數(shù)據(jù)集證實(shí)為人體健康狀態(tài)發(fā)生了變化,則向有關(guān)人員發(fā)出警報(bào)。最后更新數(shù)據(jù)庫和時(shí)間節(jié)點(diǎn)。

        3 異常數(shù)據(jù)點(diǎn)檢測(cè)

        異常數(shù)據(jù)點(diǎn)由于破壞了數(shù)據(jù)的連續(xù)性,對(duì)提取數(shù)據(jù)的特征具有較大的影響。基于數(shù)據(jù)序列時(shí)間相關(guān)性的Hampel濾波器是中值濾波器的改進(jìn),能夠有效地分辨并替換異常數(shù)據(jù)點(diǎn)。Hampel濾波器使用被檢測(cè)數(shù)據(jù)點(diǎn)對(duì)應(yīng)時(shí)間窗數(shù)據(jù)序列的中值和中值絕對(duì)偏移量(median absolute deviation,MAD)作為判斷被檢測(cè)數(shù)據(jù)點(diǎn)是否為異常數(shù)據(jù)點(diǎn)的依據(jù)。當(dāng)時(shí)間窗口大小為g時(shí),第i個(gè)數(shù)據(jù)點(diǎn)ri對(duì)應(yīng)的時(shí)間窗序列表示為Ri={ri-g,…,ri-1,ri,ri+1,…,ri+g} 根據(jù)Ri可得中值和MAD的計(jì)算公式

        Mi=median(Ri)

        (1)

        Swi=1.4826×median{|Ri-Mi|}

        (2)

        其中,Mi表示ri對(duì)應(yīng)Ri的中值,Swi表示ri對(duì)應(yīng)Ri的MAD,常量1.4826表示該偏移量在數(shù)據(jù)序列呈正態(tài)分布時(shí)等于標(biāo)準(zhǔn)偏移量。

        Hampel濾波器根據(jù)ri、Mi和Swi三者之間的關(guān)系來判斷ri是否為異常數(shù)據(jù)點(diǎn),判決公式如下所示

        |ri-Mi|≥k×Swi

        (3)

        其中,k為可變參量,如果式(3)成立則認(rèn)為ri為異常點(diǎn)并將Mi替換ri,否則為正常點(diǎn)。

        由于k和Swi決定了異常數(shù)據(jù)點(diǎn)的篩選,須根據(jù)人體特征選取。在文獻(xiàn)[13]中詳細(xì)討論了k的選取,一般為2~5。對(duì)于Swi,由式(1)、式(2)可得,Hampel濾波器不能處理時(shí)間窗序列中含有連續(xù)w個(gè)數(shù)據(jù)點(diǎn)為相同數(shù)值時(shí)的情形。而人體處于穩(wěn)定狀態(tài)時(shí),節(jié)點(diǎn)測(cè)量精度不足可能會(huì)產(chǎn)生上述錯(cuò)誤,MAD近于0,k和Swi對(duì)異常數(shù)據(jù)點(diǎn)判決影響過??;同時(shí),偶然丟失的數(shù)據(jù)須通過k和Swi恢復(fù)。因此,本文對(duì)Swi進(jìn)行了如下改進(jìn)

        Swi=max(Swi,d)

        (4)

        其中,d是預(yù)定義大于0的常數(shù),根據(jù)觀測(cè)數(shù)據(jù)的方差選取,max表示取Swi和d的最大值。

        由式(1)~式(4)可得,Hampel 濾波器依次處理傳感器的觀測(cè)數(shù)據(jù),保證了數(shù)據(jù)的連續(xù)性,時(shí)間窗包含了數(shù)據(jù)點(diǎn)前后各g個(gè)數(shù)據(jù)點(diǎn),具有一定的滯后性,可根據(jù)任務(wù)的實(shí)時(shí)性要求選取g的大小。Hampel濾波器的時(shí)間復(fù)雜度為O(n)。

        4 異常數(shù)據(jù)集檢測(cè)

        本小節(jié)所使用的變量含義見表1。

        表1 變量說明

        4.1 問題描述

        設(shè)單個(gè)傳感器可觀測(cè)m個(gè)生理參數(shù),一次觀測(cè)的時(shí)間點(diǎn)個(gè)數(shù)為t,則單個(gè)傳感器采集的數(shù)據(jù)可用矩陣G表示

        其中,Xi=(xi1,xi2,…,xim) 表示傳感器節(jié)點(diǎn)在時(shí)間點(diǎn)i對(duì)m個(gè)生理參數(shù)的觀測(cè)值集合,Si=(x1i,x2i,…,xti) 表示傳感器節(jié)點(diǎn)對(duì)第i個(gè)生理參數(shù)在t個(gè)時(shí)間點(diǎn)的觀測(cè)值集合。異常數(shù)據(jù)集檢測(cè)的結(jié)果為準(zhǔn)確地標(biāo)識(shí)出異常數(shù)據(jù)集開始和結(jié)束時(shí)間點(diǎn),可表示為 [t1,t2]=f(S1,S2,…,St)。 其中 [t1,t2] 表示異常數(shù)據(jù)集開始和結(jié)束的時(shí)間點(diǎn),f(S1,S2,…,St) 表示對(duì)矩陣G進(jìn)行的某種變換。

        4.2 DBSCAN算法

        DBSCAN算法根據(jù)數(shù)據(jù)之間的密度連通性發(fā)現(xiàn)簇和噪聲點(diǎn),包含Eps(指定數(shù)據(jù)集G中任一點(diǎn)的周圍半徑)和minPts(在指定的Eps下數(shù)據(jù)點(diǎn)成為核對(duì)象至少包含的對(duì)象個(gè)數(shù))兩個(gè)參數(shù),根據(jù)以上參數(shù)可有如下定義。

        定義1 鄰域:任意數(shù)據(jù)點(diǎn)p在G中的鄰域NbEps(P) 可通過如下定義獲得NEps={p|dist(p,q)≤Eps,q∈G}, 其中dist(p,q) 表示p和q之間的距離。

        定義3 直接密度可達(dá):若p,q∈G,NEps(q)≥minPts,p∈NEps(q), 則對(duì)象q從對(duì)象p直接密度。

        定義4 密度可達(dá):若D={d1,d2,…,dn},d1=q,dn=p, 任意di,di+1,NEps(di)≥minPts,di+1∈NEps(q), 則p和q密度可達(dá),其中D為一串相鄰對(duì)象直接密度可達(dá)的序列。

        定義5 密度相連:若G中存在一個(gè)對(duì)象O,使得對(duì)象p和q都從O密度可達(dá),則稱對(duì)象p和q密度相連。

        4.3 基于滑動(dòng)時(shí)間窗的DBSCAN改進(jìn)

        DBSCAN算法無需預(yù)標(biāo)記數(shù)據(jù),可實(shí)現(xiàn)任意形狀和大小的集群,能夠檢測(cè)出噪聲。DBSCAN聚類的結(jié)果是非連續(xù)數(shù)據(jù)點(diǎn)的集合,而人體生理參數(shù)在一段時(shí)間內(nèi)具有連續(xù)性,前一時(shí)刻的生理狀態(tài)影響著后一時(shí)刻,數(shù)據(jù)點(diǎn)之間的相關(guān)性決定了異常數(shù)據(jù)呈連續(xù)分布,因此直接使用DBSCAN檢測(cè)異常數(shù)據(jù)不能準(zhǔn)確標(biāo)識(shí)出異常數(shù)據(jù)集的起始和結(jié)束位置,且Eps和minPts是具有全局作用的參數(shù),決定了DBSCAN的聚類結(jié)果的好壞,這限制了DBSCAN對(duì)于不同異常數(shù)據(jù)的適應(yīng)能力。因此,本文從Eps和minPts的定義出發(fā),設(shè)置滑動(dòng)時(shí)間窗,某一時(shí)間窗內(nèi)的數(shù)據(jù)被認(rèn)為全部是異常數(shù)據(jù)或正常數(shù)據(jù),這樣將整個(gè)數(shù)據(jù)集聚類的結(jié)果變換為每一個(gè)時(shí)間窗中的數(shù)據(jù)能否聚為一個(gè)類的問題。圖3表示滑動(dòng)時(shí)間窗,時(shí)間窗的寬度是可調(diào)的參數(shù),當(dāng)傳感器節(jié)點(diǎn)采集的數(shù)據(jù)充滿第一個(gè)時(shí)間窗時(shí),即可對(duì)時(shí)間窗中的數(shù)據(jù)進(jìn)行分析。

        圖3 滑動(dòng)時(shí)間窗

        Eps和minPts的選?。簳r(shí)間窗中的數(shù)據(jù)一旦采集完畢,數(shù)據(jù)點(diǎn)之間的距離不再變化。因此,對(duì)于任意數(shù)據(jù)點(diǎn),若minPts為1,Eps為數(shù)據(jù)點(diǎn)的最近鄰距離,則該數(shù)據(jù)點(diǎn)為核心點(diǎn)。單獨(dú)一個(gè)數(shù)據(jù)點(diǎn)的最近鄰距離不具有代表性,本文將每一個(gè)數(shù)據(jù)點(diǎn)的最近鄰距離相加后平均得平均最近鄰距離,平均最近鄰距離作為Eps的候選值。同理,當(dāng)minPts為k時(shí),Eps為數(shù)據(jù)點(diǎn)與第k個(gè)最近鄰數(shù)據(jù)點(diǎn)之間的距離,將每一個(gè)數(shù)據(jù)點(diǎn)的第k個(gè)最近鄰數(shù)據(jù)點(diǎn)之間的距離平均得第k個(gè)Eps的候選值。設(shè)時(shí)間窗寬度為n,則Eps存在n個(gè)候選值,由此可得Eps候選值的計(jì)算步驟為:

        步驟1 計(jì)算時(shí)間窗數(shù)據(jù)的距離分布矩陣Dn×n={Dist(i,j)|1≤i≤n,1≤j≤n}, 其中n為時(shí)間窗包含的數(shù)據(jù)點(diǎn)個(gè)數(shù),Dist(i,j) 為第i個(gè)數(shù)據(jù)點(diǎn)到第j個(gè)數(shù)據(jù)點(diǎn)之間的距離。

        步驟2 對(duì)距離分布矩陣進(jìn)行升序排序,第一列為數(shù)據(jù)點(diǎn)到自身距離為0,第k列表示所有數(shù)據(jù)點(diǎn)與其對(duì)應(yīng)第k個(gè)最近鄰數(shù)據(jù)點(diǎn)之間的距離。

        步驟3 對(duì)每一列求平均,將其作為Eps的候選值。

        在得出Eps候選值的過程中,假設(shè)minPts為固定數(shù)值,這樣的限制不能代表數(shù)據(jù)自身的特征。minPts是在指定的Eps下數(shù)據(jù)點(diǎn)成為核對(duì)象至少包含的對(duì)象個(gè)數(shù),應(yīng)由Eps的候選值確定minPts的個(gè)數(shù)。因此,對(duì)于每一個(gè)Eps候選值,依次求出所有數(shù)據(jù)點(diǎn)的鄰域?qū)ο髷?shù)量,所有數(shù)據(jù)點(diǎn)鄰域?qū)ο蟮钠谕底鳛閙inPts的候選值。計(jì)算方法為

        (5)

        其中,Qi表示第i個(gè)數(shù)據(jù)點(diǎn)的鄰域數(shù)據(jù)點(diǎn)個(gè)數(shù)。這樣每一個(gè)minPts對(duì)應(yīng)于一個(gè)Eps,但minPts和Eps對(duì)于聚類算法是二維隨機(jī)變量,因此,本文將minPts和Eps合為一個(gè)變量,其公式如下所示

        Density=minPts/Eps2

        (6)

        其中,Density表示以Eps為半徑的圓內(nèi)存在minPts個(gè)數(shù)據(jù)點(diǎn)。Eps和Density一一對(duì)應(yīng),故Density有n個(gè)候選值。由于Eps第一個(gè)候選值為數(shù)據(jù)點(diǎn)到自身的距離0,Density從第二個(gè)值開始計(jì)算。

        Density候選值趨勢(shì)分析:平均最近鄰距離表示數(shù)據(jù)的緊密程度,Eps候選值不斷增大表示數(shù)據(jù)的緊密程度不斷減小,因此Density呈不斷減小的趨勢(shì)。本文將時(shí)間窗中的數(shù)據(jù)全部認(rèn)定為異常數(shù)據(jù)或正常數(shù)據(jù)。若為正常數(shù)據(jù),則時(shí)間窗內(nèi)的數(shù)據(jù)被視為一個(gè)類,不同數(shù)據(jù)點(diǎn)之間的相關(guān)性可用平均最近鄰距離衡量,因此平均最近鄰距離對(duì)應(yīng)的Density應(yīng)遠(yuǎn)大于其它Eps候選值對(duì)應(yīng)的Density,同時(shí)隨著Eps的不斷增加,時(shí)間窗中數(shù)據(jù)點(diǎn)的個(gè)數(shù)是不變的,Density逐漸趨于水平。若為異常數(shù)據(jù),數(shù)據(jù)點(diǎn)之間的緊密程度小,平均最近鄰距離和其它Eps候選值對(duì)應(yīng)的Density不具有顯著差別。

        根據(jù)Density的變化趨勢(shì),本文提出以下準(zhǔn)則作為判斷時(shí)間窗中的數(shù)據(jù)是否正常數(shù)據(jù)的標(biāo)準(zhǔn)。

        準(zhǔn)則1:平均最近鄰距離對(duì)應(yīng)的Density應(yīng)遠(yuǎn)大于其它Eps候選值對(duì)應(yīng)的Density即Density(2)>k×Density(3), 其中k>10。

        準(zhǔn)則2:Density應(yīng)在起始處快速下降,并隨著數(shù)據(jù)點(diǎn)的增長(zhǎng)趨于水平,即Density(i)-Density(i-1) 不斷減小并趨近于0,其中0

        這樣通過劃分時(shí)間窗的方式將DBSCAN直接聚類的結(jié)果轉(zhuǎn)換為Density趨勢(shì)的變化,由此判斷時(shí)間窗中的數(shù)據(jù)是否為異常數(shù)據(jù)。

        4.4 異常數(shù)據(jù)集驗(yàn)證

        WBAN通常有多個(gè)功能不同的傳感器節(jié)點(diǎn)對(duì)人體健康狀態(tài)進(jìn)行監(jiān)護(hù),人體作為一個(gè)有機(jī)的系統(tǒng),各種生理參數(shù)之間具有強(qiáng)相關(guān)性。本文使用協(xié)方差系數(shù)來描述不同生理參數(shù)之間的相關(guān)性。生理參數(shù)X和Y之間的協(xié)方差系數(shù)可表示為

        (7)

        由于人體生理參數(shù)具有波動(dòng)性,協(xié)方差系數(shù)應(yīng)在一定的范圍內(nèi)波動(dòng),本文采用3σ原則對(duì)其判定,其中σ表示協(xié)方差系數(shù)的標(biāo)準(zhǔn)差。如果某一節(jié)點(diǎn)測(cè)量的人體生理參數(shù)和其它節(jié)點(diǎn)測(cè)量的生理參數(shù)的協(xié)方差系數(shù)和人體處于正常健康狀態(tài)測(cè)得的協(xié)方差系數(shù)不超過3σ,則認(rèn)為異常數(shù)據(jù)來源于人體健康狀態(tài)。由于涉及到多個(gè)節(jié)點(diǎn),單獨(dú)一個(gè)節(jié)點(diǎn)不能承擔(dān)驗(yàn)證分析,需將多個(gè)節(jié)點(diǎn)的數(shù)據(jù)傳輸至匯聚節(jié)點(diǎn)處。異常數(shù)據(jù)集檢測(cè)已明確標(biāo)出了異常數(shù)據(jù)集所在的時(shí)間窗,其它時(shí)間窗中的數(shù)據(jù)對(duì)于異常數(shù)據(jù)集沒有提供有效信息,可直接忽略。因此,只需將異常數(shù)據(jù)集所在時(shí)間窗的數(shù)據(jù)傳輸至匯聚節(jié)點(diǎn)。

        4.5 異常數(shù)據(jù)集檢測(cè)算法描述

        異常數(shù)據(jù)集檢測(cè)方法流程為:

        步驟1 初始化時(shí)間窗的大小n。

        步驟2 當(dāng)時(shí)間窗中數(shù)據(jù)點(diǎn)個(gè)數(shù)達(dá)到n時(shí),根據(jù)時(shí)間窗中的數(shù)據(jù)點(diǎn)得距離分布矩陣Dn×n。

        步驟3 計(jì)算Eps和minPts的候選值。

        步驟4 由式(6)得Density向量。

        步驟5 根據(jù)準(zhǔn)則1和準(zhǔn)則2判斷時(shí)間窗中的數(shù)據(jù)是否為異常數(shù)據(jù)集。

        步驟6 若時(shí)間窗中的數(shù)據(jù)為異常數(shù)據(jù),將異常數(shù)據(jù)傳輸至匯聚節(jié)點(diǎn),匯聚節(jié)點(diǎn)根據(jù)式(7)計(jì)算不同生理參數(shù)之間的協(xié)方差系數(shù)。

        步驟7 比較人體健康狀態(tài)下的協(xié)方差系數(shù)和計(jì)算得到的協(xié)方差系數(shù),驗(yàn)證異常數(shù)據(jù)集后標(biāo)注出異常數(shù)據(jù)集所在的時(shí)間窗,并發(fā)出警報(bào)。

        數(shù)據(jù)集G中數(shù)據(jù)點(diǎn)個(gè)數(shù)為n,時(shí)間窗寬度為w,則存在n/w個(gè)時(shí)間窗,異常數(shù)據(jù)集檢測(cè)方法在每個(gè)時(shí)間窗運(yùn)行的時(shí)間復(fù)雜度為O(w2), 則總體時(shí)間復(fù)雜度為O(nw)。 每次算法只需存儲(chǔ)w個(gè)數(shù)據(jù)點(diǎn),其空間復(fù)雜度為O(w)。

        5 實(shí)驗(yàn)仿真分析

        5.1 數(shù)據(jù)集來源

        為保證實(shí)驗(yàn)結(jié)果的有效性和真實(shí)性,本次仿真實(shí)驗(yàn)使用的醫(yī)療數(shù)據(jù)來源于Physionet[14]的數(shù)據(jù)庫MIMIC(multiparameter intelligent monitoring in intensive care)中編號(hào)為221患者的生理數(shù)據(jù),其包括以下生理參數(shù)、心跳頻率(heart rate,HR)、呼吸頻率(respiration,RESP)、血氧飽和度(SpO2)、平均動(dòng)脈血壓(mean arterial blood pressure,ABPmean)。圖4表示患者生理參數(shù)在0到20 000個(gè)時(shí)間點(diǎn)的變化圖。

        圖4 人體生理參數(shù)

        5.2 異常數(shù)據(jù)檢測(cè)方法仿真

        圖5為ABPmean異常數(shù)據(jù)點(diǎn)檢測(cè)的結(jié)果。其中時(shí)間窗w取值為50,k為3,d在Hampel濾波器中作用為抑制常數(shù)錯(cuò)誤,在本次實(shí)驗(yàn)中選取為4。圖中豎線標(biāo)出的點(diǎn)為Hampel濾波器檢測(cè)出的異常數(shù)據(jù)點(diǎn),主要為常數(shù)錯(cuò)誤的數(shù)據(jù)點(diǎn)和相對(duì)于周圍數(shù)據(jù)具有顯著變化的點(diǎn)。

        圖5 ABPmean異常數(shù)據(jù)點(diǎn)

        在不失一般性的條件下,本文選取ABPmean和HR作為同一個(gè)節(jié)點(diǎn)觀測(cè)的人體生理參數(shù)。由于時(shí)間窗的大小對(duì)實(shí)驗(yàn)結(jié)果有著顯著影響,本文在4.3節(jié)進(jìn)行了詳細(xì)分析。圖6為不同時(shí)間窗密度曲線圖,時(shí)間窗寬度為400,其中“win”表示時(shí)間窗,圖中圈出的位置為Density曲線橫坐標(biāo)2到10的放大圖,其中win1和win6的橫坐標(biāo)為2的數(shù)據(jù)超過了圓圈范圍,進(jìn)行了截取,由圖可知Density趨勢(shì)符合上文的分析。通過準(zhǔn)則1和準(zhǔn)則2可知,第五和第六個(gè)時(shí)間窗是異常數(shù)據(jù)集所在的時(shí)間窗。圖7為異常數(shù)據(jù)集標(biāo)注圖,通過對(duì)20 000個(gè)數(shù)據(jù)進(jìn)行時(shí)間窗劃分并判定每一個(gè)時(shí)間窗數(shù)據(jù)是否為連續(xù)的異常數(shù)據(jù)集得到的結(jié)果,圖中每?jī)蓚€(gè)豎線之間的時(shí)間窗中的數(shù)據(jù)為異常數(shù)據(jù)集,和文獻(xiàn)[14]相比,標(biāo)準(zhǔn)的異常數(shù)據(jù)集具有一致性,較好地反映了異常數(shù)據(jù)集所在的位置。

        圖6 不同時(shí)間窗密度曲線

        圖7 異常數(shù)據(jù)集標(biāo)注

        5.3 異常數(shù)據(jù)檢測(cè)方法法性能評(píng)估

        本文使用檢測(cè)精度DR(detection rate)和虛警率FPR(false positive rate)來量化所提方法的有效性,并用受試者工作特征曲線(receiver operating characteristic curver,ROC)表示FPR和DR之間的關(guān)系[15]。下述定義中正常數(shù)據(jù)表示人體處于健康狀態(tài)時(shí)的觀測(cè)數(shù)據(jù),異常數(shù)據(jù)表示受到環(huán)境噪聲影響或人體健康狀態(tài)發(fā)生變化時(shí)的觀測(cè)數(shù)據(jù)。檢測(cè)率DR可通過如下公式表示

        (8)

        其中,F(xiàn)D表示檢測(cè)的異常數(shù)據(jù)點(diǎn)個(gè)數(shù),TN表示總體異常數(shù)據(jù)點(diǎn)個(gè)數(shù)。與之相應(yīng)的,虛警率可通過如下公式表示

        (9)

        其中,F(xiàn)P表示正常數(shù)據(jù)點(diǎn)被檢測(cè)為異常數(shù)據(jù)點(diǎn)的個(gè)數(shù),TF表示正常數(shù)據(jù)點(diǎn)的個(gè)數(shù)。

        圖8為時(shí)間窗的大小對(duì)DR和FPR的影響。當(dāng)時(shí)間窗較小時(shí),由于人體生理參數(shù)具有連續(xù)性,無法區(qū)分一個(gè)時(shí)間窗內(nèi)的數(shù)據(jù)是否為異常數(shù)據(jù),由于異常數(shù)據(jù)占比較小,本文將每一個(gè)時(shí)間窗中的數(shù)據(jù)均視為正常數(shù)據(jù),得到DR=0,F(xiàn)PR=0;當(dāng)時(shí)間窗寬度增至一個(gè)時(shí)間窗寬度內(nèi)的數(shù)據(jù)能夠表示人體處于異常狀態(tài)時(shí),即某些時(shí)間窗內(nèi)的數(shù)據(jù)不能夠聚類時(shí),異常數(shù)據(jù)檢測(cè)算法工作于正常區(qū)間的起始點(diǎn),得到DR=81.82%,F(xiàn)PR =0;在時(shí)間窗寬度增加至最長(zhǎng)異常數(shù)據(jù)集時(shí)間長(zhǎng)度時(shí),一部分正常數(shù)據(jù)被視為異常數(shù)據(jù),另一部分在時(shí)間窗長(zhǎng)度較小時(shí)檢測(cè)為異常數(shù)據(jù)集的數(shù)據(jù)被視為正常數(shù)據(jù),F(xiàn)PR和DR呈非線性上升直至DR=100%,F(xiàn)PR=11%,異常數(shù)據(jù)檢測(cè)算法工作于正常區(qū)間的截止點(diǎn);當(dāng)時(shí)間窗增大到最長(zhǎng)異常數(shù)據(jù)集被視為正常數(shù)據(jù)時(shí),DR=0,F(xiàn)PR=0,此時(shí)本方法失去實(shí)際應(yīng)用價(jià)值。

        圖8 FPR和DR隨時(shí)間窗寬度變化

        本文在文獻(xiàn)[14]基礎(chǔ)上將所提出的方法和基于SVM、KNN、MD的異常數(shù)據(jù)檢測(cè)方法進(jìn)行對(duì)比,如圖9和表2所示。圖9為不同檢測(cè)方法的ROC圖,表2為不同檢測(cè)方法的對(duì)比圖。由9圖可知,基于SVM的檢測(cè)方法有效性最好,當(dāng)DR=100%時(shí),F(xiàn)PR=5.2%,但由表2可知其空間和時(shí)間復(fù)雜度達(dá)到了O(n2)和O(n3),在對(duì)比的方法中計(jì)算復(fù)雜度最高,因此不適用節(jié)點(diǎn)資源有限的WBAN;基于KNN、MD方法和本文提出的方法在DR=100%時(shí),F(xiàn)PR分別為6.8%、15%、11%。因此,本文提出的方法相比于基于MD的方法具有更好的檢測(cè)精度,但差于KNN,主要因?yàn)楸疚奶岢龅姆椒檫_(dá)到100%檢測(cè)精度,選用的時(shí)間窗過大。但由圖8和圖9可知,當(dāng)時(shí)間窗處于正常工作區(qū)間時(shí),本文提出的方法的ROC曲線在KNN之上,因此在檢測(cè)精度和虛警率上優(yōu)于KNN,同時(shí)由表2可知,基于KNN和MD的方法和本文提出的方法的時(shí)間復(fù)雜度分別為O(n*k)、O(n)、O(wn), 其中k為特征維度,w為時(shí)間窗寬度,因此這3種方法在時(shí)間復(fù)雜度上不具有明顯差距,在空間復(fù)雜度上分別為O(n*k),O(n2),O(w), 因此本文提出的方法空間復(fù)雜度為常數(shù),顯著優(yōu)于其它方法,且基于SVM、KNN和MD的檢測(cè)方法均需在傳感器獲取所有數(shù)據(jù)后再檢測(cè)異常數(shù)據(jù),因此不滿足WBAN的實(shí)時(shí)性要求。而本文提出的方法只需存儲(chǔ)時(shí)間窗內(nèi)的數(shù)據(jù),可根據(jù)任務(wù)的實(shí)時(shí)性調(diào)整時(shí)間窗的大小,當(dāng)時(shí)間窗內(nèi)的數(shù)據(jù)為異常數(shù)據(jù)集時(shí),只需將時(shí)間窗內(nèi)的數(shù)據(jù)傳輸至匯聚節(jié)點(diǎn),有效地降低了傳感器節(jié)點(diǎn)由于頻繁通信產(chǎn)生的能量損耗。因此,本文提出的方法與基于SVM、KNN和MD的方法相比更適合用于傳感器側(cè)檢測(cè)異常數(shù)據(jù)。

        表2 不同檢測(cè)方法復(fù)雜度對(duì)比

        圖9 不同檢測(cè)方法ROC

        6 結(jié)束語

        本文提出了一種分層的異常數(shù)據(jù)檢測(cè)方法。Hampel濾波器檢測(cè)異常數(shù)據(jù)點(diǎn),在此基礎(chǔ)上異常數(shù)據(jù)集檢測(cè)方法通過劃分時(shí)間窗的方式將聚類的結(jié)果轉(zhuǎn)換為每一個(gè)時(shí)間窗中的數(shù)據(jù)能否聚類的問題,并與其它方法相比,本文的方法考慮了人體健康狀態(tài)發(fā)生變化時(shí)異常數(shù)據(jù)具有連續(xù)性的特征,空間復(fù)雜度更小,在檢測(cè)出異常數(shù)據(jù)集后,只需將異常數(shù)據(jù)集所在時(shí)間窗的數(shù)據(jù)傳輸至匯聚節(jié)點(diǎn),降低了節(jié)點(diǎn)的能量損耗。但所提出的方法固定了時(shí)間窗的寬度,降低了系統(tǒng)性能。因此,設(shè)計(jì)可變的時(shí)間窗,提高異常數(shù)據(jù)集的標(biāo)注準(zhǔn)確性是下一步改進(jìn)方向。

        猜你喜歡
        復(fù)雜度濾波器距離
        基于無擾濾波器和AED-ADT的無擾切換控制
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        一種低復(fù)雜度的慣性/GNSS矢量深組合方法
        算距離
        開關(guān)電源EMI濾波器的應(yīng)用方法探討
        電子制作(2018年16期)2018-09-26 03:26:50
        求圖上廣探樹的時(shí)間復(fù)雜度
        每次失敗都會(huì)距離成功更近一步
        山東青年(2016年3期)2016-02-28 14:25:55
        某雷達(dá)導(dǎo)51 頭中心控制軟件圈復(fù)雜度分析與改進(jìn)
        基于TMS320C6678的SAR方位向預(yù)濾波器的并行實(shí)現(xiàn)
        出口技術(shù)復(fù)雜度研究回顧與評(píng)述
        国产特级毛片aaaaaa| 精品亚洲av一区二区| 日韩麻豆视频在线观看| 人人妻人人澡人人爽欧美一区双 | 国产精品久久久久免费a∨不卡| 极品精品视频在线观看| 人人妻人人添人人爽欧美一区| 日韩av精品国产av精品| 97人妻视频妓女网| 一区二区三区在线观看视频| 97成人精品国语自产拍| 亚洲欧美一区二区三区在线| 最新亚洲人AV日韩一区二区| 久久婷婷夜色精品国产| 国产乱人伦av在线麻豆a| 人妻av无码系列一区二区三区| 无码不卡免费一级毛片视频 | 亚洲一区二区精品在线看| 日本一区二区三区人妻| 无码少妇一区二区性色av| 四虎国产精品视频免费看| 粗大挺进孕妇人妻在线| 国产精品久久久久久久久久红粉| 免费观看黄网站在线播放| 丰满少妇又紧又爽视频| 日本美女中文字幕第一区| 日本丰满熟妇videossex一| 无码视频一区二区三区在线观看| 国产一区二区在线观看我不卡| 亚洲女同恋av中文一区二区| 久久天天躁狠狠躁夜夜2020一| 日韩爱爱网站| 色婷婷精品国产一区二区三区| 亚洲av网一区二区三区| 内谢少妇xxxxx8老少交| 春色成人在线一区av| 国产亚洲一本二本三道| 人妻无码中文字幕| 国产黄三级三·级三级| av天堂在线免费播放| 国产精品一区二区av麻豆|