亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于VAE-LSTM 模型的航跡異常檢測(cè)算法*

        2020-03-14 13:40:52常吉亮趙建偉
        交通信息與安全 2020年6期
        關(guān)鍵詞:船舶檢測(cè)模型

        常吉亮 謝 磊 趙建偉 楊 洋

        (1.武漢理工大學(xué)國(guó)家水運(yùn)安全工程技術(shù)研究中心 武漢 430063;2.武漢理工大學(xué)能源與動(dòng)力工程學(xué)院 武漢 430063)

        0 引 言

        隨著船舶定位技術(shù)、通信技術(shù),以及大數(shù)據(jù)技術(shù)的迅速發(fā)展,在船舶行駛過(guò)程中,大量的船舶軌跡數(shù)據(jù)呈指數(shù)增長(zhǎng)。航跡作為1 種時(shí)間序列數(shù)據(jù),可視為時(shí)間到空間的映射,在客觀上記錄了船舶活動(dòng)的位置信息和時(shí)間信息。航跡大數(shù)據(jù)中蘊(yùn)藏著豐富的有價(jià)值的目標(biāo)活動(dòng)信息。近年來(lái),航跡數(shù)據(jù)挖掘一直是研究熱點(diǎn),包括船舶交通流研究[1-2]、航跡聚類[3-4]、航跡數(shù)據(jù)壓縮[5-6],以及船舶軌跡預(yù)測(cè)[7]等。船舶軌跡數(shù)據(jù)是由雷達(dá)、AIS等多種數(shù)據(jù)源感知獲得,由于不同數(shù)據(jù)源定位誤差的差異,導(dǎo)致航跡數(shù)據(jù)中出現(xiàn)異常,所以,在實(shí)際環(huán)境下軌跡數(shù)據(jù)的準(zhǔn)確性是難以保證的[8],這些異常航跡嚴(yán)重影響了航跡數(shù)據(jù)挖掘的準(zhǔn)確性。因此,航跡異常檢測(cè)是開(kāi)展航跡數(shù)據(jù)挖掘研究的重要前提。

        航跡異常檢測(cè)是指在海量無(wú)標(biāo)簽的航跡數(shù)據(jù)中識(shí)別出異常航跡。Hawkins[9]對(duì)異常的定義為:異常是指在數(shù)據(jù)集中顯著偏離其他絕大部分?jǐn)?shù)據(jù)的那些數(shù)據(jù)對(duì)象,以至于引起人們懷疑它們是由完全不同的機(jī)制產(chǎn)生的。具體而言,文中討論的異常航跡是指:①在航跡集合中相同軌跡數(shù)量少;②空間上偏離其他航跡;③航跡中存在許多與其鄰近大部分航跡點(diǎn)在運(yùn)動(dòng)特征上有顯著差異的采樣點(diǎn)的航跡。

        近年來(lái)的船舶異常航跡檢測(cè)方法主要集中在最近鄰、專家系統(tǒng)、聚類算法、自動(dòng)編碼器,以及遞歸神經(jīng)網(wǎng)絡(luò)等算法模型。在最近鄰的方法中,Laxhammar等[10]將待檢測(cè)的軌跡數(shù)據(jù)與存儲(chǔ)在數(shù)據(jù)庫(kù)中的所有數(shù)據(jù)進(jìn)行比較,找到最相似的數(shù)據(jù),并對(duì)待檢測(cè)數(shù)據(jù)進(jìn)行分類。專家系統(tǒng)是通過(guò)有經(jīng)驗(yàn)的專家制定異常軌跡的規(guī)則,根據(jù)這些規(guī)則對(duì)航跡進(jìn)行分類,衛(wèi)桂榮等[11]依據(jù)AIS 的通信原理,提出水上移動(dòng)業(yè)務(wù)標(biāo)識(shí)碼校驗(yàn)、填充位和校驗(yàn)碼綜合檢測(cè)、動(dòng)態(tài)信息和靜態(tài)信息匹配校驗(yàn)及異常位置點(diǎn)檢測(cè)等數(shù)據(jù)錯(cuò)誤檢測(cè)方法;吳建華等[12]在對(duì)大量AIS 數(shù)據(jù)深入解析的基礎(chǔ)上,歸納出AIS 軌跡異常的幾種類型,針對(duì)各類型的特征得出相應(yīng)的檢測(cè)規(guī)則,實(shí)現(xiàn)了對(duì)航跡異常的自動(dòng)檢測(cè)。聚類算法是將所有訓(xùn)練數(shù)據(jù)聚類為多個(gè)組,密集的類被視為正常航跡,而稀疏的類為異常航跡,魏照坤等[13]使用Hausdorff 的度量方式,提出基于DBSCAN聚類算法的船舶運(yùn)動(dòng)模式識(shí)別方法,對(duì)航跡異常檢測(cè)給出了理論性的支持。使用遞歸神經(jīng)網(wǎng)絡(luò)的目的在于,利用訓(xùn)練好的遞歸神經(jīng)網(wǎng)絡(luò),在已知先前點(diǎn)的位置信息情況下,對(duì)下1個(gè)點(diǎn)進(jìn)行預(yù)測(cè),對(duì)規(guī)定時(shí)間段內(nèi)的航跡點(diǎn)計(jì)算累積誤差,如果誤差超過(guò)閾值,則判定為異常,楊帆等[14]通過(guò)人為劃分船舶異常航跡狀態(tài)標(biāo)簽,對(duì)海量AIS數(shù)據(jù)進(jìn)行學(xué)習(xí),使用雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long short-term memory,LSTM)神經(jīng)網(wǎng)絡(luò)建立了能夠發(fā)現(xiàn)船舶異常航跡的模型。自編碼器異常檢測(cè)方法通常是將航跡轉(zhuǎn)換為固定的長(zhǎng)度,然后使用正常數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)的目的是將輸入的航跡進(jìn)行重建,重建的誤差決定了異常檢測(cè)結(jié)果[15]。

        上述航跡異常檢測(cè)方法均存在著一些影響模型效率或者檢測(cè)準(zhǔn)確度的問(wèn)題:①最近鄰和聚類算法的算法復(fù)雜度為O(n2),對(duì)于海量航跡數(shù)據(jù)來(lái)說(shuō),模型計(jì)算效率較低,難以適應(yīng)大數(shù)據(jù)計(jì)算的要求;②專家系統(tǒng)的方法中,人為規(guī)定一些判別規(guī)則難以較為準(zhǔn)確的契合數(shù)據(jù)的實(shí)際要求,一旦規(guī)則出現(xiàn)漏洞,方法容易出現(xiàn)漏檢和錯(cuò)檢;③航跡數(shù)據(jù)是1 種時(shí)間序列數(shù)據(jù),航跡點(diǎn)與相鄰點(diǎn)有著時(shí)空關(guān)系,這使得傳統(tǒng)的最近鄰、聚類和自編碼器等算法直接用于航跡異常檢測(cè)會(huì)忽略某些數(shù)據(jù)特征;④LSTM 等監(jiān)督學(xué)習(xí)的分類器,在實(shí)際異常檢測(cè)過(guò)程中需要進(jìn)行海量的樣本標(biāo)注,而異常航跡在實(shí)際數(shù)據(jù)中的比例很小,正負(fù)樣本不均衡增加了訓(xùn)練的難度,另外,標(biāo)注的人工成本較大,過(guò)程較為繁瑣。

        隨著深度學(xué)習(xí)技術(shù)的廣泛應(yīng)用,基于變分自編碼器的無(wú)監(jiān)督學(xué)習(xí)逐漸成為熱門研究領(lǐng)域,An等[16]在2015 年證明了變分自動(dòng)編碼器(variationalautoencoder,VAE)在數(shù)據(jù)異常檢測(cè)方面應(yīng)用的可行性,變分自編碼器在圖像和語(yǔ)音的異常檢測(cè)中開(kāi)始被應(yīng)用。Xu等[17]利用帶有卷積核的變分自編碼器解決了復(fù)雜場(chǎng)景下的視頻監(jiān)控異常檢測(cè)問(wèn)題。Chalapathy等[18]基于變分自編碼器提出群體異常檢測(cè)方法,該方法適用于醫(yī)學(xué)影像等異常檢測(cè)。馬波等[19]利用變分自編碼器解決了機(jī)械運(yùn)轉(zhuǎn)中的故障報(bào)警問(wèn)題。Fan 等[20]提出了1 種基于變分自編碼器的視頻異常檢測(cè)和定位方法,該方法在2 個(gè)主流數(shù)據(jù)集上展現(xiàn)了優(yōu)越性。變分自編碼器作為新興的無(wú)監(jiān)督深度學(xué)習(xí)技術(shù),在數(shù)據(jù)異常檢測(cè)領(lǐng)域有著非常大的潛力。

        為了避免正負(fù)樣本不均衡帶來(lái)的訓(xùn)練困難問(wèn)題,降低人工成本,應(yīng)用LSTM 處理時(shí)序性數(shù)據(jù)的優(yōu)勢(shì),提高異常檢測(cè)的準(zhǔn)確率,在上述無(wú)監(jiān)督學(xué)習(xí)應(yīng)用的啟發(fā)下,筆者研究了基于VAE-LSTM 的船舶軌跡異常檢測(cè)算法。以VAE 模型為主體結(jié)構(gòu),將VAE 中的BP 神經(jīng)網(wǎng)絡(luò)替換為殘差門LSTM,設(shè)計(jì)了1 個(gè)VAE-LSTM 模型。將每個(gè)航跡點(diǎn)提取4 維運(yùn)動(dòng)特征向量,以一段時(shí)間序列的特征向量為模型輸入,采用無(wú)監(jiān)督學(xué)習(xí)方法訓(xùn)練模型,模型的輸出為輸入數(shù)據(jù)的重建概率,重建概率小于閾值的結(jié)果為異常航跡點(diǎn),包含異常航跡點(diǎn)的航跡判定為異常航跡。

        1 模型與方法

        本文算法將無(wú)監(jiān)督學(xué)習(xí)中的變分自編碼器應(yīng)用到航跡異常檢測(cè)中,結(jié)合LSTM 模型時(shí)序性問(wèn)題的處理優(yōu)勢(shì),使航跡異常檢測(cè)問(wèn)題轉(zhuǎn)化為1 個(gè)無(wú)監(jiān)督學(xué)習(xí)問(wèn)題。首先對(duì)航跡進(jìn)行特征工程中的特征提取處理,然后對(duì)變分自編碼器的相關(guān)理論知識(shí)進(jìn)行描述,接著建立殘差門LSTM 并構(gòu)建本文的VAE-LSTM模型結(jié)構(gòu),最后介紹航跡異常檢測(cè)算法的流程。

        1.1 特征提取

        特征提取是機(jī)器學(xué)習(xí)中特征工程的一部分。特征提取是指從文字、圖像、聲音等其他非結(jié)構(gòu)化數(shù)據(jù)中提取新信息作為特征。航跡點(diǎn)是包含時(shí)間信息和空間信息的數(shù)據(jù),時(shí)間信息是指船舶行駛到某一位置點(diǎn)的時(shí)間,空間信息是指船舶所處位置的經(jīng)緯度。常用的船舶運(yùn)動(dòng)特征參數(shù)包括航速、船舶加速度、真航向、曲率半徑等。對(duì)于異常航跡數(shù)據(jù),其中包含一些距相鄰點(diǎn)的距離明顯大于其他點(diǎn)的航跡點(diǎn),這些航跡點(diǎn)的速度和加速度明顯超出了相鄰的航跡點(diǎn),甚至超出了實(shí)際船舶運(yùn)動(dòng)的速度和加速度閾值;真航向指的是船舶航行時(shí),真北線與船首線之間的夾角,由于異常航跡中某些航跡點(diǎn)偏離了正常航線,作為離群點(diǎn),其真航向?qū)τ谙噜彽暮桔E點(diǎn)有著很大的變化,所以具有真航向突變的數(shù)據(jù)特征的航跡,成為異常的可能性很大;曲率半徑主要是用來(lái)描述曲線上某處曲線彎曲變化的程度,曲率半徑越大,彎曲程度就越小,在異常航跡中,出現(xiàn)異常部分的航跡曲線的彎曲程度有更大可能性會(huì)變大,所以,異常航跡中某一段的曲率半徑會(huì)有更大可能性變小。

        選取船舶航速V,加速度a,真航向TC,曲率半徑ρ為特征,對(duì)每個(gè)航跡點(diǎn)提取1個(gè)4維的特征向量。船舶航速、加速度、航向、曲率半徑的公式分別見(jiàn)式(1)~(4)。

        式中:Si為第i個(gè)航跡點(diǎn);Dis為航跡點(diǎn)間的距離,m ;ti為第i個(gè)航跡點(diǎn)所處的時(shí)間,s;V為航速,m s;a為加速度,m s2;TC為真航向,rad;ρ為曲率半徑,m-1;lati和 loni為航跡點(diǎn)Si的經(jīng)緯度;e為Si-1與Si之間的距離,m;b為Si-1與Si+1之間的距離,m;c為Si與Si+1之間的距離,m。

        1.2 變分自編碼器

        VAE可以看作是自編碼器的升級(jí)版本,二者的主體結(jié)構(gòu)大體相同,但是VAE 融入了貝葉斯理論,使得性能大幅度提升。VAE擁有1個(gè)編碼器和1個(gè)解碼器,編碼器將輸入編碼成1 組高斯分布而不是簡(jiǎn)單的隱變量,然后解碼器從這組分布中隨機(jī)采樣1個(gè)樣本將其作為解碼器的輸入,得到1 個(gè)近似于編碼器輸入的輸出結(jié)果。VAE 通過(guò)假設(shè)隱變量的概率分布,來(lái)增加模型的魯棒性并降低剛性誤差。

        VAE 算法的基本思想是:對(duì)每1 個(gè)輸入x來(lái)說(shuō)都可以由1 個(gè)隱變量zk替代。因此,最終的輸出x?可以由某種概率分布pθ(xk|zk)生成,通常這種概率分布被假設(shè)成較為普遍的高斯分布。解碼器函數(shù)gθ(xk)能夠生成最終的生成分布的參數(shù),并由1組參數(shù)θ約束。編碼器函數(shù)fθ(zk)能夠生成每1 個(gè)概率分布qφ(zk|xk)的參數(shù),同時(shí)也被θ約束。

        變分自編碼器中的變分推斷目的是找出1個(gè)近似分布p(zk)來(lái)替代分布qφ(zk|xk),通常使用神經(jīng)網(wǎng)絡(luò)來(lái)擬合。2個(gè)分布間的相似度量通常使用Kullback-Leibler(KL)散度函數(shù)來(lái)度量。當(dāng)單個(gè)數(shù)據(jù)輸入模型中時(shí),模型的置信下界(evidence lower bound,ELBO)目標(biāo)函數(shù)的公式見(jiàn)式(5)。

        式(5)中的DKL可以看作是正則化項(xiàng),使qφ(zk|xk)向標(biāo)準(zhǔn)正態(tài)分布看齊,而Eq可以被看作是期望的自編碼重建。由于p(zk)是高斯分布,可以使用重參數(shù)化(reparemerization)來(lái)解決模型中神經(jīng)網(wǎng)絡(luò)反向梯度求解問(wèn)題,即對(duì)樣本zk來(lái)說(shuō),不從正態(tài)分布N(μ,δ)中采樣,而是從分布N(0,1)中取得1個(gè)變量ε,然后利用期望μ和標(biāo)準(zhǔn)差δ計(jì)算得到,見(jiàn)式(6)。

        最終模型目標(biāo)函數(shù)的公式見(jiàn)式(7)。

        1.3 改進(jìn)的LSTM

        LSTM 是1 種循環(huán)神經(jīng)網(wǎng)絡(luò),常用來(lái)處理時(shí)序性數(shù)據(jù),圖1為L(zhǎng)STM結(jié)構(gòu)圖,它由輸入門、遺忘門、記憶門,以及輸出門組成。這些門結(jié)構(gòu)決定了數(shù)據(jù)信息的輸入、存儲(chǔ)、遺忘,以及輸出。LSTM 的更新公式見(jiàn)式(8)~(11)。

        圖1 LSTM模型圖Fig.1 Standard LSTM structure

        式(8)~(11)分別為輸入門、遺忘門、記憶門,以及輸出門。Ct為L(zhǎng)STM 細(xì)胞單元狀態(tài);xt和ht為細(xì)胞單元輸入和隱藏層輸出;sigmoid(*)為sigmoid激活層;W*,b*為對(duì)應(yīng)門結(jié)構(gòu)的權(quán)重和偏置;為2個(gè)矩陣對(duì)應(yīng)元素相乘。

        殘差結(jié)構(gòu)[21]被廣泛應(yīng)用在卷積神經(jīng)網(wǎng)絡(luò)中,它直接將輸入加到經(jīng)過(guò)卷積操作得到的輸出上,解決了梯度消失的問(wèn)題,并且可以捕捉到很小的擾動(dòng),見(jiàn)圖2。筆者將殘差結(jié)構(gòu)引入LSTM 模型中,提出了基于殘差門的LSTM 模型,改進(jìn)的LSTM 依據(jù)殘差理論,將細(xì)胞單元的輸入,通過(guò)殘差門加到細(xì)胞單元狀態(tài)的輸出上,使得LSTM 模型對(duì)于軌跡數(shù)據(jù)能更好的記憶和學(xué)習(xí)數(shù)據(jù)特征,而避免梯度消失,見(jiàn)圖3。

        圖2 殘差結(jié)構(gòu)圖Fig.2 Residual structure

        圖3 殘差門LSTMFig.3 Residual gate LSTM

        殘差門rt的定義見(jiàn)式(12)。

        更新細(xì)胞狀態(tài)的計(jì)算公式見(jiàn)式(13)。

        1.4 模型構(gòu)建與算法流程

        本文以VAE為基礎(chǔ)設(shè)計(jì)了1個(gè)VAE-LSTM模型,結(jié)構(gòu)見(jiàn)圖4。將VAE編碼器和解碼器中的BP神經(jīng)網(wǎng)絡(luò)層替換為殘差門LSTM,旨在避免航跡數(shù)據(jù)特征提取過(guò)程的梯度消失和對(duì)航跡內(nèi)的時(shí)序性信息更好的進(jìn)行特征編碼與解碼。

        圖4 VAE-LSTM模型結(jié)構(gòu)圖Fig.4 A VAE-LSTM network

        圖5為航跡異常檢測(cè)模型,圖6為異常檢測(cè)算法流程。航跡異常檢測(cè)是1 個(gè)無(wú)監(jiān)督模型,模型的輸入為1 個(gè)定長(zhǎng)時(shí)間序列的航跡點(diǎn)特征向量,每個(gè)特征向量Xi包含航速V、加速度a、真航向TC、曲率半徑ρ,LSTM 編碼器會(huì)自動(dòng)提取輸入數(shù)據(jù)的時(shí)序特征并且將數(shù)據(jù)編碼為一系列隱變量,由另1 個(gè)LSTM 解碼器完成對(duì)隱變量的重建,對(duì)于來(lái)自編碼器的每個(gè)樣本,概率解碼器都會(huì)輸出均值和方差,使用這些均值和方差,計(jì)算從該分布產(chǎn)生原始數(shù)據(jù)的概率。多次計(jì)算得到概率的平均值,記為重建概率。具有低重建概率的航跡數(shù)據(jù)點(diǎn)被歸類為異常航跡點(diǎn),航跡內(nèi)存在異常航跡點(diǎn)的航跡判定為異常航跡。

        圖5 航跡異常檢測(cè)模型圖Fig.5 The model of ship trajectory outlier detection

        圖6 航跡異常檢測(cè)流程圖Fig.6 The flowchart of ship trajectory outlier detection

        VAE-LSTM 模型中的LSTM 解碼器與編碼器充分考慮到一段時(shí)間內(nèi)航跡數(shù)據(jù)的運(yùn)動(dòng)特征,有助于VAE-LSTM 模型學(xué)習(xí)正常數(shù)據(jù)隱變量的概率分布,提升正常數(shù)據(jù)重建概率的準(zhǔn)確性。模型采用無(wú)監(jiān)督訓(xùn)練方式,無(wú)需人工標(biāo)注,并且允許訓(xùn)練數(shù)據(jù)中存在少量的異常數(shù)據(jù),適用于航跡數(shù)據(jù)正負(fù)樣本不均衡的數(shù)據(jù)環(huán)境。

        2 實(shí)驗(yàn)驗(yàn)證

        2.1 數(shù)據(jù)集描述

        本文建立了1 個(gè)包含7 500 條的正常航跡訓(xùn)練數(shù)據(jù)集,該數(shù)據(jù)集數(shù)據(jù)來(lái)自于武漢段長(zhǎng)江水域、宜昌段長(zhǎng)江水域、南京段長(zhǎng)江水域等多處實(shí)際項(xiàng)目水域,數(shù)據(jù)集中的航跡數(shù)據(jù)均由有經(jīng)驗(yàn)的海事人員審核過(guò),保證航跡數(shù)據(jù)的正常。另外,準(zhǔn)備了3 000 條正常航跡數(shù)據(jù)和500條實(shí)驗(yàn)過(guò)程中常見(jiàn)的異常航跡數(shù)據(jù),每條數(shù)據(jù)包含200個(gè)以上的航跡點(diǎn),這些數(shù)據(jù)作為模型的測(cè)試集。異常航跡與正常航跡見(jiàn)圖7~8,異常航跡存在某一航跡點(diǎn)的速度突然超出周圍的航跡點(diǎn)、一小段航跡整體偏離正常航線等情況,這些航跡通常與正常航跡有著較大的差異。導(dǎo)致這些航跡異常的原因包括但不限于:由于環(huán)境的干擾,導(dǎo)致某一數(shù)據(jù)源設(shè)備定位精度降低,設(shè)備間的定位存在較大誤差;數(shù)據(jù)源定位設(shè)備對(duì)不同船舶目標(biāo)的誤識(shí)別;數(shù)據(jù)傳輸過(guò)程中的信號(hào)干擾等。

        2.2 實(shí)驗(yàn)設(shè)置

        圖7 異常航跡Fig.7 The abnormal ship trajectory

        圖8 正常航跡Fig.8 The normal ship trajectory

        實(shí)驗(yàn)使用GTX1080 顯卡在Tensorflow 深度學(xué)習(xí)框架上進(jìn)行VAE-LSTM 模型的搭建。每個(gè)航跡點(diǎn)數(shù)據(jù)的輸入維度設(shè)置為4,隱變量維度設(shè)置為16。輸入的航跡時(shí)間序列長(zhǎng)度如果太短不利于時(shí)序性信息的提取,長(zhǎng)度太長(zhǎng)則可能會(huì)造成冗余。為了不失一般性,分別嘗試取值6,10,14,18 和22,重建概率異常判別閾值α分別嘗試取值0.95,0.90,0.85,0.80和0.75,將最優(yōu)準(zhǔn)確率的結(jié)果作為參數(shù)設(shè)置值,最終進(jìn)行對(duì)比實(shí)驗(yàn)的參數(shù)值為:α=0.90,時(shí)間序列長(zhǎng)度為10。

        2.3 實(shí)驗(yàn)評(píng)估指標(biāo)

        在無(wú)監(jiān)督學(xué)習(xí)的異常檢測(cè)任務(wù)中,常通過(guò)混淆矩陣對(duì)結(jié)果進(jìn)行分析?;煜仃囀? 種特定的矩陣,用來(lái)呈現(xiàn)監(jiān)督學(xué)習(xí)或非監(jiān)督學(xué)習(xí)算法性能的可視化效果。其每一列代表預(yù)測(cè)值,每一行代表的是實(shí)際的類別。通過(guò)分析可以得到常用的核心指標(biāo)有分類的精度、準(zhǔn)確率、召回率、F1 值,在航跡異常檢測(cè)任務(wù)中,正常航跡數(shù)據(jù)占總數(shù)據(jù)的比例要遠(yuǎn)遠(yuǎn)超出異常航跡,更多的識(shí)別到異常航跡更為重要,所以本文著重關(guān)注召回率指標(biāo),它們的具體公式分別見(jiàn)式(14)~(17)。

        2.4 實(shí)驗(yàn)對(duì)比結(jié)果與分析

        訓(xùn)練之后,使用測(cè)試集對(duì)VAE-LSTM 航跡異常檢測(cè)模型評(píng)估,得到混淆矩陣見(jiàn)圖9。為驗(yàn)證本文VAE-LSTM航跡異常檢測(cè)模型的實(shí)用性和有效性,將本文模型與 VAE 模型、Zhao 等[22]提出的 LSTM異常檢測(cè)模型、孤立森林(iForest)、決策樹(shù)(DT)、支持向量機(jī)(SVM)進(jìn)行對(duì)比。孤立森林算法是1種適用于連續(xù)數(shù)據(jù)的無(wú)監(jiān)督異常檢測(cè)方法,在異常檢測(cè)任務(wù)重被廣泛使用。LSTM、決策樹(shù)和SVM 是3 種常用的有監(jiān)督分類算法,為了使用這3 種算法進(jìn)行對(duì)比,實(shí)驗(yàn)人員又將本文的數(shù)據(jù)集進(jìn)行了全部的標(biāo)注,耗費(fèi)了大量的人工成本,這相比于無(wú)監(jiān)督學(xué)習(xí)算法是1 個(gè)較大的缺點(diǎn)。同樣對(duì)上述對(duì)比模型采用4維特征提取,在相同的數(shù)據(jù)條件下進(jìn)行測(cè)試。實(shí)驗(yàn)對(duì)比結(jié)果見(jiàn)表1。

        圖9 分類結(jié)果混淆矩陣Fig.9 Confusion matrix of classification results

        航跡是時(shí)序性的數(shù)據(jù),異常航跡段相比相鄰航跡在運(yùn)動(dòng)特征上會(huì)有明顯的區(qū)別。VAE、DT、SVM、iForest 在模型上只利用了當(dāng)前點(diǎn)的信息,忽略了航跡段前后的船舶運(yùn)動(dòng)特征,這限制了模型的分類效果,使得模型的召回率較低?;诒疚臄?shù)據(jù)集,與 Zhao 等[22]提出的 LSTM 異常檢測(cè)模型對(duì)比,Zhao等所提方法在異常檢測(cè)前,使用DBSCAN聚類算法過(guò)濾噪聲數(shù)據(jù),數(shù)據(jù)質(zhì)量高于本文的數(shù)據(jù),此外,還將航跡的異常狀態(tài)設(shè)置為高低2個(gè)檔位,更方便研究人員進(jìn)行判斷。但是,對(duì)比結(jié)果顯示,基于BP神經(jīng)網(wǎng)絡(luò)層的標(biāo)準(zhǔn)VAE的精度、召回率和F1值略微高于LSTM 模型,準(zhǔn)確率只相差0.01;而VAE-LSTM 異常檢測(cè)模型的召回率、精度、準(zhǔn)確率等指標(biāo)全面高于LSTM和VAE異常檢測(cè)模型,而且相比于LSTM 模型不存在正負(fù)樣本平衡性問(wèn)題,無(wú)需數(shù)據(jù)標(biāo)注。

        表1 多種模型的對(duì)比結(jié)果Tab.1 The performance of different models

        本文提出的VAE-LSTM 航跡異常檢測(cè)模型在各項(xiàng)指標(biāo)均高于其他機(jī)器學(xué)習(xí)算法,尤其是在召回率。VAE-LSTM 航跡異常檢測(cè)模型利用無(wú)監(jiān)督學(xué)習(xí)避免了訓(xùn)練數(shù)據(jù)正負(fù)樣本不均衡問(wèn)題,其中改進(jìn)后的殘差門LSTM 模塊可以提取航跡時(shí)序性信息,VAE 結(jié)構(gòu)可以自動(dòng)學(xué)習(xí)正常航跡和異常航跡在運(yùn)動(dòng)特征上的差異,無(wú)論從模型效率、實(shí)用性、準(zhǔn)確率上都要優(yōu)于傳統(tǒng)的模型。本文提出的VAE-LSTM航跡異常檢測(cè)模型,可以在航跡數(shù)據(jù)挖掘之前,準(zhǔn)確的對(duì)船舶航跡數(shù)據(jù)進(jìn)行異常檢測(cè),提升航跡數(shù)據(jù)質(zhì)量,為下一步的數(shù)據(jù)挖掘工作打下基礎(chǔ)。

        3 結(jié)束語(yǔ)

        筆者提出1 種殘差門LSTM,將VAE 中的BP神經(jīng)網(wǎng)絡(luò)層替換為殘差門LSTM,對(duì)VAE 進(jìn)行改進(jìn),并基于此,提出1 種基于VAE-LSTM 航跡異常檢測(cè)方法。該方法對(duì)航跡點(diǎn)提取了運(yùn)動(dòng)特征,使用重建概率檢測(cè)異常航跡。通過(guò)與多種機(jī)器學(xué)習(xí)算法的比較,本方法的優(yōu)勢(shì)在于:模型為無(wú)監(jiān)督學(xué)習(xí),避免了有監(jiān)督分類的異常檢測(cè)中正負(fù)樣本不均衡問(wèn)題;對(duì)航跡點(diǎn)提取運(yùn)動(dòng)特征向量,模型擴(kuò)展性較好;使用殘差門LSTM 作為編碼器和解碼器,可以對(duì)航跡時(shí)序性特征進(jìn)行提??;訓(xùn)練數(shù)據(jù)集使用正常航跡,并且允許包含少量的異常航跡,無(wú)需人工標(biāo)注;模型的各項(xiàng)指標(biāo)均高于對(duì)比的其他分類算法,可滿足異常航跡檢測(cè)需求。下一步,筆者將嘗試基于卷積神經(jīng)網(wǎng)絡(luò)的變分自編碼器異常檢測(cè)模型,進(jìn)一步提高航跡異常檢測(cè)準(zhǔn)確率。

        猜你喜歡
        船舶檢測(cè)模型
        一半模型
        計(jì)算流體力學(xué)在船舶操縱運(yùn)動(dòng)仿真中的應(yīng)用
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        《船舶》2022 年度征訂啟事
        船舶(2021年4期)2021-09-07 17:32:22
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        船舶!請(qǐng)加速
        3D打印中的模型分割與打包
        亚洲乱妇老熟女爽到高潮的片| 国产精品女同一区二区免费站| 帅小伙自慰videogay男男| 性生交大片免费看淑女出招| av一区无码不卡毛片| 日本五十路熟女在线视频| 少妇被按摩出高潮了一区二区| 国产专区一线二线三线码| 99久久久无码国产精品免费砚床| 国产思思久99久精品| 成人自拍偷拍视频在线观看| 亚洲日韩精品一区二区三区无码| 久久久久久久人妻无码中文字幕爆| 二区久久国产乱子伦免费精品| 搞黄色很刺激的网站二区| 亚洲av日韩av激情亚洲| 麻豆一区二区99久久久久| 精品不卡久久久久久无码人妻| 日日麻批视频免费播放器| 麻豆91蜜桃传媒在线观看| 国产精品9999久久久久| 久久国产亚洲AV无码麻豆| 亚洲最大视频一区二区三区| 狠狠色噜噜狠狠狠狠97首创麻豆| 50岁熟妇的呻吟声对白| 欧美乱人伦中文字幕在线不卡| 一区二区三区一片黄理论片| 久久久国产精品va麻豆| 欧美黑人巨大xxxxx| 午夜av内射一区二区三区红桃视| 91精品国自产拍老熟女露脸| 中国少妇内射xxxx狠干| 欧美成人久久久| 亚洲中文字幕乱码在线视频| 欧美v国产v亚洲v日韩九九| 中文字幕爆乳julia女教师| 99亚洲乱人伦精品| 日韩精品一区二区三区乱码| 少妇私密会所按摩到高潮呻吟| 99热精品国产三级在线观看| 久久精品国产亚洲av试看|