亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        時(shí)空異常探測(cè)方法研究綜述

        2016-06-05 14:57:58敏,石巖,龔雅,楊學(xué)習(xí)
        地理與地理信息科學(xué) 2016年6期
        關(guān)鍵詞:鄰域度量時(shí)空

        鄧 敏,石 巖,龔 健 雅,楊 學(xué) 習(xí)

        (1.中南大學(xué)地球科學(xué)與信息物理學(xué)院地理信息系,湖南 長(zhǎng)沙 410083;2.武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430079;3.武漢大學(xué)地球空間信息技術(shù)協(xié)同創(chuàng)新中心,湖北 武漢 430079)

        時(shí)空異常探測(cè)方法研究綜述

        鄧 敏1,石 巖2,3,龔 健 雅2,3,楊 學(xué) 習(xí)1

        (1.中南大學(xué)地球科學(xué)與信息物理學(xué)院地理信息系,湖南 長(zhǎng)沙 410083;2.武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430079;3.武漢大學(xué)地球空間信息技術(shù)協(xié)同創(chuàng)新中心,湖北 武漢 430079)

        異常探測(cè)是數(shù)據(jù)挖掘領(lǐng)域的一個(gè)重要研究?jī)?nèi)容,旨在從海量數(shù)據(jù)中挖掘不符合普適性規(guī)律、表現(xiàn)出“與眾不同”特性的數(shù)據(jù)或模式,其在金融欺詐、公共衛(wèi)生、極端氣候事件發(fā)現(xiàn)、交通擁堵判別、環(huán)境污染監(jiān)測(cè)等領(lǐng)域具有重要應(yīng)用價(jià)值。異常探測(cè)最初應(yīng)用于事務(wù)型數(shù)據(jù)庫(kù),后來(lái)擴(kuò)展到空間數(shù)據(jù)庫(kù)和時(shí)空數(shù)據(jù)庫(kù),出現(xiàn)了一系列有針對(duì)性的異常探測(cè)算法。為了更好地滿(mǎn)足應(yīng)用需求,發(fā)展性能更高、適應(yīng)性更強(qiáng)的異常探測(cè)方法,該文從所使用的數(shù)據(jù)類(lèi)型將異常探測(cè)粗分為傳統(tǒng)異常探測(cè)、空間異常探測(cè)和時(shí)空異常探測(cè),并詳細(xì)回顧了典型的傳統(tǒng)/空間/時(shí)空異常探測(cè)方法,指出這些方法存在的問(wèn)題和局限性:1)不適用于高維數(shù)據(jù)的異常探測(cè);2)自適應(yīng)能力差;3)缺乏對(duì)異常探測(cè)結(jié)果的有效性評(píng)價(jià)。最后,展望了異常探測(cè)的相關(guān)熱點(diǎn)研究方向:1)顧及高維專(zhuān)題屬性的異常探測(cè);2)顧及領(lǐng)域知識(shí)的異常探測(cè);3)耦合度量關(guān)系和非度量關(guān)系的異常探測(cè);4)異常探測(cè)的有效性評(píng)價(jià)。

        異常;傳統(tǒng)異常探測(cè);空間異常探測(cè);時(shí)空異常探測(cè)

        0 引言

        近年來(lái),極端氣候事件、交通擁堵、環(huán)境污染等已經(jīng)成為熱點(diǎn)關(guān)注問(wèn)題,其共性在于此類(lèi)問(wèn)題中包含的模式在數(shù)據(jù)庫(kù)中呈現(xiàn)出明顯的異常特性,且蘊(yùn)含了大量未知和重要的知識(shí),稱(chēng)之為異常模式。在時(shí)空數(shù)據(jù)中,異常模式通常代表著事物發(fā)展的某種特殊規(guī)律,在現(xiàn)實(shí)生活中更能引起人們的興趣。例如,有效識(shí)別城市道路交通擁堵將有助于實(shí)行交通管制,以方便市民制定合理的出行計(jì)劃;探尋環(huán)境污染嚴(yán)重區(qū)域?qū)⒂兄谧犯菰?,并輔助出臺(tái)相關(guān)政策進(jìn)行環(huán)境治理;對(duì)極端氣候事件進(jìn)行準(zhǔn)確識(shí)別有助于深入分析其內(nèi)在發(fā)展規(guī)律,為進(jìn)一步準(zhǔn)確預(yù)測(cè)奠定重要的先驗(yàn)知識(shí)基礎(chǔ);對(duì)流行病/犯罪爆發(fā)熱點(diǎn)進(jìn)行探測(cè)識(shí)別將有利于掌握其時(shí)空演變規(guī)律,從而實(shí)現(xiàn)對(duì)流行病/犯罪爆發(fā)的準(zhǔn)確預(yù)測(cè)。因此,對(duì)時(shí)空異常的探測(cè)分析具有重要研究?jī)r(jià)值,已成為時(shí)空數(shù)據(jù)挖掘的重要研究?jī)?nèi)容之一,引起了相關(guān)領(lǐng)域?qū)W者們的廣泛關(guān)注[1-3]。

        “異?!币喾Q(chēng)為離群點(diǎn)、孤立點(diǎn)。1980年,Hawkins給出異常的本質(zhì)性定義,即“嚴(yán)重偏離其他對(duì)象的觀測(cè)數(shù)據(jù),以至于令人懷疑它是由不同機(jī)制產(chǎn)生的”[4]。1994年,Barnett等進(jìn)一步從統(tǒng)計(jì)學(xué)的角度給出“異常是指與數(shù)據(jù)集中其余數(shù)據(jù)分布不一致的觀測(cè)數(shù)據(jù)或觀測(cè)數(shù)據(jù)子集”[5]。2003年,Shekhar等[6]考慮到空間數(shù)據(jù)的特性,將傳統(tǒng)異常在空間數(shù)據(jù)中進(jìn)行了擴(kuò)展,并將空間異常定義為“專(zhuān)題屬性與其鄰近空間實(shí)體顯著不同,而在整體數(shù)據(jù)范圍內(nèi)差異可能不明顯的空間實(shí)體”。2006年,Cheng等在空間異常的基礎(chǔ)上,從空間域進(jìn)一步擴(kuò)展到時(shí)空域,給出時(shí)空異常的定義,即“專(zhuān)題屬性值嚴(yán)重偏離其時(shí)間或(和)空間鄰近域內(nèi)參考實(shí)體的時(shí)空實(shí)體”[7]。針對(duì)不同的異常類(lèi)型,學(xué)者們提出了一系列相應(yīng)的異常探測(cè)方法,大致歸納為傳統(tǒng)異常探測(cè)、空間異常探測(cè)和時(shí)空異常探測(cè)。針對(duì)各種類(lèi)型異常的探測(cè)方法,又可以進(jìn)行更加細(xì)致的分類(lèi),從而形成異常探測(cè)方法分類(lèi)體系,如圖1所示。本文將對(duì)該體系中各類(lèi)異常探測(cè)方法進(jìn)行詳細(xì)回顧。

        1 傳統(tǒng)異常探測(cè)方法

        針對(duì)Hawkins所提出的“異常”概念[4],學(xué)者們發(fā)展了一系列異常探測(cè)方法,從最初基于統(tǒng)計(jì)的方法,到后續(xù)為適應(yīng)海量數(shù)據(jù)而發(fā)展了基于距離、基于密度、基于角度、基于聚類(lèi)等探測(cè)方法。

        (1)基于統(tǒng)計(jì)的方法。該方法的基本思想是根據(jù)數(shù)據(jù)集的特性先假定一個(gè)數(shù)據(jù)分布的概率模型,然后根據(jù)模型的不一致性確定異常[5]。通常采用基于單一分布模型和基于混合分布模型兩大類(lèi)[8]。該類(lèi)方法的優(yōu)點(diǎn)是建立在成熟的統(tǒng)計(jì)學(xué)理論基礎(chǔ)上,異常含義明確;其缺陷是數(shù)據(jù)集的概率模型一般未知,估計(jì)時(shí)難免出現(xiàn)誤差甚至背離現(xiàn)實(shí)的錯(cuò)誤。為解決這個(gè)問(wèn)題,一些學(xué)者通過(guò)對(duì)數(shù)據(jù)集中每個(gè)實(shí)體給定一個(gè)深度值,并將其映射到二維空間的不同層上,將處于較淺層的實(shí)體識(shí)別為異常[9,10]。于是,基于深度的方法僅能有效探測(cè)低維數(shù)據(jù),處理高維數(shù)據(jù)效率較低[11]。

        圖1 異常探測(cè)方法分類(lèi)體系

        (2)基于距離的方法。該方法的基本思想是以對(duì)象間距離的大小檢測(cè)異常,將那些沒(méi)有足夠鄰居的對(duì)象識(shí)別為異常。Knorr等定義DB(p,D)-outlier為:若數(shù)據(jù)集中存在至少p%的實(shí)體到實(shí)體O的距離大于某距離閾值D,則實(shí)體O就是異常[12]。針對(duì)參數(shù)p和D難確定的缺陷,Ramaswamy等[13]通過(guò)計(jì)算每個(gè)實(shí)體的k鄰近距離并進(jìn)行排序,選取k鄰近距離最大的N個(gè)實(shí)體作為異常。該方法具有明顯的幾何解釋?zhuān)m用于探測(cè)全局異常,但探測(cè)局部異常能力有限,且需要人為輸入?yún)?shù)。

        (3)基于密度的方法。為了探測(cè)數(shù)據(jù)集中的局部異常實(shí)體,Breunig等[14]在基于距離探測(cè)方法的基礎(chǔ)上引入局部密度的概念,提出一種基于密度的探測(cè)方法——LOF算法(圖2a)。借助實(shí)體的局部可達(dá)密度定義局部異常度,異常度與局部密度成反比,將異常度較大的實(shí)體識(shí)別為異常。為了解決密度差異較大的簇相鄰時(shí)易產(chǎn)生誤判的問(wèn)題,Jin等[15]采用顧及對(duì)稱(chēng)K鄰近域的影響域,提出一種INFLO法。此外,一些學(xué)者在LOF算法基礎(chǔ)上提出了一些改進(jìn)算法(如GLOF[16]、LOCI[17]),并用于探測(cè)異常小簇?;诿芏鹊姆椒ㄒ嘈枰脩?hù)輸入大量參數(shù),并且穩(wěn)定性和可解釋性較差。

        (4)基于角度的方法。為了避免直接采用實(shí)體間的距離度量,Krirgel等[18]提出了一種基于角度的異常探測(cè)思想。該方法通過(guò)度量實(shí)體與其鄰域內(nèi)其他實(shí)體所構(gòu)成的角度定義異常度,角度越大,異常度越小,反之異常度越大(圖2b)。Zhang等[19]進(jìn)一步提出在子空間探測(cè)異常,并應(yīng)用于工業(yè)故障檢測(cè)。然而,當(dāng)數(shù)據(jù)呈線性分布時(shí),基于角度的方法難以準(zhǔn)確探測(cè)異常,并且效率低,無(wú)法適用于海量數(shù)據(jù)。

        (5)基于聚類(lèi)的方法。該方法的基本思想是將異常探測(cè)過(guò)程轉(zhuǎn)換成聚類(lèi)過(guò)程。聚類(lèi)的目的在于將數(shù)據(jù)集劃分為若干簇,并且簇內(nèi)實(shí)體間距離盡可能小,簇間實(shí)體間距離盡可能大,將聚類(lèi)后那些不隸屬于任何簇的實(shí)體識(shí)別為異常[20-23](圖2c)。通過(guò)聚類(lèi)技術(shù)可高效地從數(shù)據(jù)集中發(fā)現(xiàn)異常實(shí)體,但聚類(lèi)的主要目的在于發(fā)現(xiàn)簇,異常實(shí)體僅是一種副產(chǎn)物,使得異常探測(cè)精度較低。此外,異常探測(cè)結(jié)果嚴(yán)重依賴(lài)聚類(lèi)算法的選擇,是一種粗糙的探測(cè)方法。

        圖2 傳統(tǒng)異常探測(cè)

        2 空間異常探測(cè)方法

        遵循Shekhar等[6]提出的異常探測(cè)基本思想,并顧及空間數(shù)據(jù)的相關(guān)性、異質(zhì)性等特性,學(xué)者們對(duì)傳統(tǒng)異常探測(cè)方法進(jìn)行了擴(kuò)展和改進(jìn),提出了一系列空間異常探測(cè)方法,可大致分為:基于圖形、基于距離、基于密度、基于圖論、基于智能學(xué)習(xí)、基于空間聚類(lèi)等方法。與傳統(tǒng)異常探測(cè)不同的是,空間異常探測(cè)首先需要根據(jù)空間屬性建立空間實(shí)體間的鄰近關(guān)系,進(jìn)而顧及鄰近實(shí)體間的非空間屬性差異度量空間異常[24]。

        (1)基于圖形的方法。該方法是根據(jù)一定的準(zhǔn)則將空間數(shù)據(jù)可視化,使得空間異常表現(xiàn)直觀,常采用變量云和散點(diǎn)圖等[25]。其中,變量云是根據(jù)所有空間實(shí)體對(duì)間的空間距離和專(zhuān)題屬性值差異繪制坐標(biāo)平面,從空間距離較近而專(zhuān)題屬性值差異較大的實(shí)體對(duì)中篩選空間異常;散點(diǎn)圖根據(jù)實(shí)體的Z-core值與其空間鄰域內(nèi)實(shí)體的Z-core值平均值繪制坐標(biāo)平面,位于二、四象限的實(shí)體識(shí)別為空間異常[6](圖3a)。此類(lèi)方法存在諸多缺點(diǎn)(如結(jié)果的主觀性強(qiáng)),且無(wú)法用于海量空間數(shù)據(jù)的異常識(shí)別,現(xiàn)較少使用[26]。

        (2)基于距離的方法。該方法的基本思想是在空間鄰域內(nèi)通過(guò)度量該實(shí)體與其空間鄰域內(nèi)其他實(shí)體間的專(zhuān)題屬性值差異,利用統(tǒng)計(jì)檢驗(yàn)指標(biāo)識(shí)別空間異常(圖3b),中心實(shí)體與其4-鄰域度量屬性差異。Shekhar等[6]給出一種基于距離的探測(cè)框架,并應(yīng)用于交通異常檢測(cè)。例如,Liu等[27]利用八方向法劃分實(shí)體的空間鄰域,根據(jù)實(shí)體空間鄰域內(nèi)其他實(shí)體的專(zhuān)題屬性值,采用反距離加權(quán)法(IDW)獲得該實(shí)體的估值,并通過(guò)度量實(shí)體觀測(cè)值和估值之間的差異探測(cè)空間異常;李光強(qiáng)等[28]、鄭旻琦等[29]利用Delaunay三角網(wǎng)構(gòu)建空間鄰域,進(jìn)而利用與Liu等[27]類(lèi)似的策略獲得空間異常;Chen等[30]采用KNN建立空間鄰域,并將單一專(zhuān)題屬性擴(kuò)展到多維專(zhuān)題屬性,利用馬氏距離度量實(shí)體間的多維專(zhuān)題屬性距離以探測(cè)空間異常;馬榮華等[31]則利用專(zhuān)題屬性距離建立KNN鄰域,用空間屬性定義距離函數(shù),進(jìn)而探測(cè)空間異常。當(dāng)空間數(shù)據(jù)分布不均勻時(shí),基于距離的方法僅能探測(cè)全局異常實(shí)體,而難以識(shí)別密度差異較大區(qū)域中的局部異常實(shí)體。此外,若實(shí)體空間鄰域內(nèi)存在空間異常,也將對(duì)空間異常度量產(chǎn)生較大影響,從而導(dǎo)致誤判或漏判。

        (3)基于密度的方法。為了更加細(xì)致地探測(cè)不同密度分布等復(fù)雜空間數(shù)據(jù)集中的異常實(shí)體,Chawla等[32]將LOF算法的思想引入空間異常探測(cè)。針對(duì)空間鄰近實(shí)體間專(zhuān)題屬性差異計(jì)算其鄰域距離,并引入波動(dòng)參數(shù),進(jìn)而度量空間局部異常度SLOM(圖3c)。當(dāng)空間鄰域較少或波動(dòng)幅度較小時(shí),難以準(zhǔn)確表現(xiàn)波動(dòng)情況,從而容易產(chǎn)生漏判或誤判。薛安榮等[33]則通過(guò)鄰域距離與其空間鄰域?qū)嶓w的鄰域距離均值的比值度量空間局部異常度SLOF,提高了檢測(cè)率。然而,該類(lèi)方法通過(guò)剔除空間鄰域中屬性值較大的實(shí)體以減小潛在異常的影響,使得異常度量的結(jié)果不夠穩(wěn)健。

        (4)基于圖論的方法。該方法的基本思想在于將空間數(shù)據(jù)轉(zhuǎn)換為圖形(如Delaunay三角網(wǎng)、MST等)后,從圖形結(jié)構(gòu)數(shù)據(jù)中探測(cè)空間異常。Lu等[34]提出一種基于圖形的空間異常點(diǎn)和異常區(qū)域的探測(cè)方法,通過(guò)空間屬性建立KNN鄰域圖,以邊所連接的兩實(shí)體間的專(zhuān)題屬性值距離作為權(quán)重,通過(guò)連續(xù)打斷具有高權(quán)重的邊獲取與空間鄰域顯著不同的孤立點(diǎn)或區(qū)域;但該算法缺乏對(duì)數(shù)據(jù)的局部差異分析,仍屬于全局探測(cè),當(dāng)數(shù)據(jù)的空間分布以及專(zhuān)題屬性值分布較為復(fù)雜時(shí),難以準(zhǔn)確識(shí)別各類(lèi)空間異常。為此,Shi等[35]提出一種融合圖論與局部密度度量的思想進(jìn)行空間異常探測(cè),借助Delaunay三角網(wǎng),分別根據(jù)空間距離和專(zhuān)題屬性距離對(duì)Delaunay三角網(wǎng)進(jìn)行層次刪邊操作,并提出一個(gè)分布模式識(shí)別規(guī)則,從各子圖中識(shí)別空間均質(zhì)區(qū)域、空間異質(zhì)區(qū)域和空間異常區(qū)域,最后利用局部密度度量思想計(jì)算空間均質(zhì)區(qū)域和空間異常區(qū)域中實(shí)體的異常度,并通過(guò)IDW插值對(duì)空間實(shí)體異常度可視化以識(shí)別潛在的空間異常區(qū)域。楊學(xué)習(xí)等[36]則借助Delaunay三角網(wǎng)對(duì)空間距離和專(zhuān)題屬性距離進(jìn)行層次約束以獲取空間異常,并應(yīng)用于極端降水事件站點(diǎn)的檢測(cè)。

        (5)基于智能學(xué)習(xí)的方法。在計(jì)算機(jī)領(lǐng)域,一些學(xué)者打破傳統(tǒng)空間異常探測(cè)直接從數(shù)據(jù)出發(fā)的思路,通過(guò)機(jī)器學(xué)習(xí)方法對(duì)空間數(shù)據(jù)進(jìn)行建模分析以探測(cè)空間異常。典型方法有:Chen等[37]顧及空間數(shù)據(jù)集的局部特性利用高斯隨機(jī)場(chǎng)進(jìn)行建模,通過(guò)對(duì)觀測(cè)值與模型中的估計(jì)值進(jìn)行比較,將差異較大的實(shí)體識(shí)別為空間異常;Liu等[38]結(jié)合圖論和隨機(jī)游走模型(Random Walk)構(gòu)建圖模型,進(jìn)而度量實(shí)體間的相似度以挖掘空間異常;Cai等[39]利用自組織學(xué)習(xí)模型將高維空間數(shù)據(jù)映射到二維格網(wǎng)空間,尋找實(shí)體的多維屬性鄰域,進(jìn)而在各鄰域內(nèi)探測(cè)空間異常?;谥悄軐W(xué)習(xí)的方法多需對(duì)空間數(shù)據(jù)進(jìn)行必要假設(shè)。例如,假設(shè)數(shù)據(jù)服從高斯分布,此種情況下對(duì)數(shù)據(jù)施加約束往往使得探測(cè)結(jié)果同樣被約束在模型框架內(nèi),可能會(huì)導(dǎo)致探測(cè)結(jié)果脫離實(shí)際而失去應(yīng)用價(jià)值。

        (6)基于空間聚類(lèi)的方法:空間聚類(lèi)技術(shù)可用于空間異常探測(cè),主要有直接法和間接法兩類(lèi)。直接法通過(guò)對(duì)空間數(shù)據(jù)集進(jìn)行聚類(lèi)分析,將那些不隸屬于任何空間簇的實(shí)體識(shí)別為空間異常。例如李光強(qiáng)等[40]提出一種DDBSC算法,同時(shí)顧及空間鄰近和專(zhuān)題屬性相似進(jìn)行空間聚類(lèi)分析,得到空間簇和空間異常點(diǎn);間接法則主要采用空間聚類(lèi)技術(shù)獲取空間實(shí)體間準(zhǔn)確的鄰近關(guān)系,將離散的空間數(shù)據(jù)集劃分為各個(gè)空間簇,進(jìn)而在各個(gè)簇內(nèi)探測(cè)空間異常。例如,Adam等[41]利用Voronoi圖建立空間實(shí)體間的鄰接關(guān)系,并顧及語(yǔ)義關(guān)系采用JC系數(shù)進(jìn)一步精化實(shí)體間的鄰近關(guān)系,然后將空間鄰近且語(yǔ)義相似的實(shí)體進(jìn)行空間聚類(lèi)分析以獲取空間鄰域,并在各空間鄰域內(nèi)利用基于距離的方法探測(cè)空間異常實(shí)體;鄧敏等[42]通過(guò)聚類(lèi)分析獲取空間自相關(guān)較強(qiáng)的各空間簇,充分考慮空間數(shù)據(jù)的局部相似特性,以更充分地挖掘同一數(shù)據(jù)集中不同分布中的局部空間異常,并應(yīng)用于異常土壤重金屬采樣點(diǎn)探測(cè)。與傳統(tǒng)異常探測(cè)類(lèi)似,基于空間聚類(lèi)的方法嚴(yán)重依賴(lài)聚類(lèi)算法的選擇,不同聚類(lèi)算法可得到不同的異常探測(cè)結(jié)果。

        圖3 空間異常探測(cè)

        3 時(shí)空異常探測(cè)方法

        在實(shí)際應(yīng)用中,同時(shí)顧及時(shí)間域和空間域的時(shí)空異常探測(cè)具有更加重要的價(jià)值和意義。例如,在氣象方面,預(yù)測(cè)臺(tái)風(fēng)路徑突然變化的原因?qū)μ崆鞍l(fā)出疏散指令起到至關(guān)重要的作用;預(yù)測(cè)某個(gè)地區(qū)不尋常的降水行為將有助于對(duì)突如其來(lái)的洪澇災(zāi)害等極端事件做好充分準(zhǔn)備。通過(guò)對(duì)現(xiàn)有文獻(xiàn)進(jìn)行分析總結(jié),時(shí)空異常探測(cè)主要包括時(shí)空點(diǎn)事件異常探測(cè)、時(shí)空序列異常探測(cè)和時(shí)空軌跡異常探測(cè)。

        3.1 時(shí)空點(diǎn)事件異常探測(cè)

        時(shí)空點(diǎn)事件中的異常主要包括離群和熱點(diǎn)兩類(lèi)。其中,時(shí)空離群指那些不屬于任何時(shí)空簇的孤立點(diǎn)事件以及僅包含少量時(shí)空點(diǎn)事件的小簇,基于聚類(lèi)的方法是時(shí)空點(diǎn)事件離群探測(cè)的一種重要手段[43-45]。例如,Lee等[46]針對(duì)從Twitter中獲取的時(shí)空點(diǎn)事件,首先從時(shí)間維角度顧及Twitter數(shù)據(jù)的動(dòng)態(tài)性,基于密度進(jìn)行聚類(lèi)分析獲取其中的異常事件,進(jìn)而在空間維對(duì)異常事件進(jìn)行定位分析和可視化。Shi等[47]針對(duì)Twitter時(shí)空點(diǎn)事件,從時(shí)空演變的角度出發(fā),通過(guò)顧及時(shí)空點(diǎn)事件的空間和時(shí)空異常分布,提出一種基于時(shí)空耦合聚類(lèi)的時(shí)空異常點(diǎn)事件演變模式探測(cè)方法,如圖4a所示。

        時(shí)空熱點(diǎn)指那些局部聚集程度顯著偏大的簇,主要采用的是基于時(shí)空掃描統(tǒng)計(jì)的方法。例如,針對(duì)流行病、犯罪事件等的爆發(fā)熱點(diǎn)區(qū)域探測(cè),一些學(xué)者進(jìn)行了一系列相關(guān)研究,其基本假設(shè)為事件的發(fā)生在時(shí)空范圍內(nèi)服從泊松分布[48,49]。首先通過(guò)某種方式(如畫(huà)圓法)劃定一個(gè)區(qū)域,計(jì)算該區(qū)域內(nèi)事件發(fā)生頻率與區(qū)域外事件發(fā)生頻率的比值,并構(gòu)造一個(gè)統(tǒng)計(jì)量,進(jìn)而通過(guò)逐漸改變區(qū)域的范圍和位置,尋找整個(gè)研究范圍中統(tǒng)計(jì)量最大值所對(duì)應(yīng)的區(qū)域,最后通過(guò)蒙特卡洛模擬等方法對(duì)探測(cè)結(jié)果進(jìn)行檢驗(yàn),排除結(jié)果的隨機(jī)性。

        3.2 時(shí)空序列異常探測(cè)

        時(shí)空序列即各空間實(shí)體的專(zhuān)題屬性值以時(shí)間序列的形式進(jìn)行記錄。通過(guò)文獻(xiàn)分析,對(duì)時(shí)空序列異常探測(cè)的研究始于2006年Cheng等[7]提出的時(shí)空異常探測(cè)思想,認(rèn)為針對(duì)某個(gè)時(shí)刻t,若某空間實(shí)體的專(zhuān)題屬性值與該時(shí)刻其空間鄰域內(nèi)其他實(shí)體差異較大,那么該實(shí)體為空間異常;若時(shí)刻t內(nèi)的某空間異常與該實(shí)體前后時(shí)刻的專(zhuān)題屬性值差異亦較大,那么該空間異常就屬于時(shí)空異常。通過(guò)對(duì)文獻(xiàn)進(jìn)行分析,現(xiàn)有的時(shí)空序列異常探測(cè)方法主要包括:

        (1)基于距離的方法。這實(shí)際上是基于距離的空間異常探測(cè)方法在時(shí)間維的擴(kuò)展,通常分別在空間維和時(shí)間維進(jìn)行異常探測(cè),進(jìn)而將同時(shí)屬于空間異常和時(shí)間異常的實(shí)體作為時(shí)空異常。例如,Sun等[50]針對(duì)氣候時(shí)空序列數(shù)據(jù),采取基于距離的策略分別在空間維和時(shí)間維進(jìn)行異常探測(cè),但得到的并非真正意義上的時(shí)空異常;劉啟亮等[51]提出一種時(shí)空一體化框架下的時(shí)空異常探測(cè)算法,首先利用空間異常探測(cè)算法提取空間異常點(diǎn),進(jìn)而在建立時(shí)空鄰域的基礎(chǔ)上對(duì)各個(gè)空間異常點(diǎn)進(jìn)行驗(yàn)證分析,最終獲得時(shí)空異常點(diǎn)(圖4b)。

        (2)基于聚類(lèi)的方法。很多學(xué)者將聚類(lèi)技術(shù)引入時(shí)空異常探測(cè),形成混合的探測(cè)方法,以更加全面、準(zhǔn)確地探測(cè)時(shí)空異常。例如,Birant等[52]將傳統(tǒng)的基于密度的聚類(lèi)算法DBSCAN擴(kuò)展到空間領(lǐng)域,通過(guò)同時(shí)顧及空間屬性和專(zhuān)題屬性進(jìn)行聚類(lèi)操作,篩選不隸屬于任何簇的實(shí)體為空間異常,進(jìn)而將空間異常在時(shí)間維進(jìn)行驗(yàn)證以獲取時(shí)空異常實(shí)體;Telang等[53]充分考慮實(shí)體間的局部差異,借助統(tǒng)計(jì)學(xué)工具發(fā)展了一種融合聚類(lèi)思想的空間異常探測(cè)方法,針對(duì)時(shí)空數(shù)據(jù)集,通過(guò)觀察連續(xù)時(shí)刻的空間異常變化獲取空間異常隨時(shí)間的變化規(guī)律。

        (3)基于小波變換的方法。Barua等[54]利用小波變換在氣象數(shù)據(jù)中進(jìn)行了多尺度時(shí)空異常探測(cè)研究,在空間維上認(rèn)為屬性值主要隨緯度變化較為明顯,即在各個(gè)緯度探測(cè)多尺度空間異常,在時(shí)間維上則挖掘變化頻率較高的時(shí)間點(diǎn)為時(shí)間異常。

        (4)基于掃描統(tǒng)計(jì)的方法。Wu等[55]以降水時(shí)空數(shù)據(jù)為研究對(duì)象,將傳統(tǒng)的空間掃描統(tǒng)計(jì)進(jìn)行了擴(kuò)展,從空間數(shù)據(jù)集中發(fā)現(xiàn)k個(gè)與其他區(qū)域具有明顯差異的異常區(qū)域,并通過(guò)連接不同時(shí)段探測(cè)得到的空間異常以獲得時(shí)空異常。

        3.3 時(shí)空軌跡異常探測(cè)

        時(shí)空軌跡的異??梢源笾路譃闀r(shí)空軌跡形狀異常和時(shí)空軌跡分布異常兩大類(lèi),相應(yīng)地,現(xiàn)有方法根據(jù)這兩類(lèi)時(shí)空軌跡異常也可以分為時(shí)空軌跡形狀異常探測(cè)方法和時(shí)空軌跡分布異常探測(cè)方法。其中,時(shí)空軌跡的形狀異常探測(cè)方法主要包括:1)基于劃分的方法。Lee等[56]通過(guò)充分度量時(shí)空軌跡之間的空間關(guān)系,提出一種基于劃分的時(shí)空軌跡聚類(lèi)方法,并從中探測(cè)異常軌跡。2)基于方向和密度的方法。Ge等[57]通過(guò)對(duì)研究區(qū)域進(jìn)行格網(wǎng)劃分,提出一種基于方向和密度的時(shí)空軌跡異常度量方法,并通過(guò)將各軌跡在時(shí)間序列上的異常度進(jìn)行衰減性疊加,進(jìn)一步獲得那些偏離其他軌跡的異常軌跡。3)基于格網(wǎng)計(jì)數(shù)的方法。Zhang等[58]首先將研究區(qū)域劃分為若干規(guī)則格網(wǎng),并以通過(guò)選定起點(diǎn)格網(wǎng)和終點(diǎn)格網(wǎng)的時(shí)空軌跡為研究對(duì)象,利用時(shí)空軌跡之間所經(jīng)過(guò)格網(wǎng)之間的頻度差異探測(cè)那些由不同原因(例如出租車(chē)載客、路段整修等)所引起的異常軌跡(圖4c)。

        圖4 時(shí)空異常探測(cè)

        另外,時(shí)空軌跡的分布異常探測(cè)方法主要有:1)基于距離的方法。Liu等[59]根據(jù)城市道路網(wǎng)絡(luò)將城市劃分為若干功能區(qū)域,進(jìn)而將獲取的車(chē)輛GPS數(shù)據(jù)與城市路網(wǎng)進(jìn)行匹配,形成一系列穿梭于各區(qū)域之間的子軌跡,融合不同時(shí)間間隔得到的車(chē)輛數(shù)量形成一套時(shí)空數(shù)據(jù),通過(guò)距離度量探測(cè)時(shí)空異常軌跡,并利用頻繁模式挖掘異常軌跡之間的關(guān)聯(lián)模式;Pan等[60]針對(duì)GPS獲取的浮動(dòng)車(chē)行駛軌跡數(shù)據(jù),首先提取行駛時(shí)間較長(zhǎng)的軌跡作為候選異常,進(jìn)而將候選異常軌跡連接成網(wǎng),最后利用微博文本數(shù)據(jù)對(duì)得到的異常軌跡網(wǎng)進(jìn)行時(shí)空事件驗(yàn)證。2)基于PCA的方法。Chawla等[61]同樣根據(jù)城市道路網(wǎng)絡(luò)的區(qū)域劃分與獲取的車(chē)輛GPS數(shù)據(jù)進(jìn)行匹配,形成時(shí)空軌跡的OD數(shù)據(jù),通過(guò)PCA手段探測(cè)時(shí)空異常軌跡,進(jìn)而利用線性?xún)?yōu)化手段探索引起異常軌跡的根源。3)基于掃描統(tǒng)計(jì)的方法。Pang等[62]針對(duì)某一時(shí)段首先將城市劃分為三維時(shí)空格網(wǎng),根據(jù)該時(shí)段內(nèi)所記錄的GPS軌跡數(shù)據(jù)可得各時(shí)空格網(wǎng)中經(jīng)過(guò)的軌跡數(shù)目,進(jìn)而將統(tǒng)計(jì)方法探測(cè)出的軌跡數(shù)目相對(duì)較多的格網(wǎng)作為異常。

        4 總結(jié)與展望

        本文對(duì)傳統(tǒng)異常探測(cè)、空間異常探測(cè)以及時(shí)空異常探測(cè)的基本內(nèi)涵進(jìn)行了闡述,進(jìn)而系統(tǒng)地對(duì)現(xiàn)有典型的異常探測(cè)方法進(jìn)行了詳細(xì)回顧,通過(guò)總結(jié)分析發(fā)現(xiàn),現(xiàn)有方法主要存在以下局限性:1)現(xiàn)有異常探測(cè)方法普遍不適用于高維數(shù)據(jù)的異常探測(cè);2)很多方法需要先驗(yàn)知識(shí)的指導(dǎo),自適應(yīng)能力差;3)缺乏對(duì)異常探測(cè)結(jié)果的有效性評(píng)價(jià)。

        未來(lái)值得進(jìn)一步研究的工作包括:1)高維時(shí)空異常探測(cè),顧及高維專(zhuān)題屬性度量實(shí)體間相似和異質(zhì)特征,以有效提高時(shí)空異常探測(cè)效率;2)顧及領(lǐng)域知識(shí)的異常探測(cè),通過(guò)考慮多變量間的時(shí)空關(guān)聯(lián)特性以及探測(cè)領(lǐng)域的背景知識(shí),深入探測(cè)發(fā)現(xiàn)那些通過(guò)先驗(yàn)知識(shí)無(wú)法解釋的時(shí)空異常;3)耦合度量關(guān)系(如距離關(guān)系)和非度量關(guān)系(如拓?fù)?、方向、形狀關(guān)系)的時(shí)空異常探測(cè);4)時(shí)空異常的有效性評(píng)價(jià),指導(dǎo)從探測(cè)結(jié)果中提取真正有效的時(shí)空異常。

        [1] 李德仁,王樹(shù)良,李德毅,等.論空間數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的理論和方法[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2002,27(3):221-233.

        [2] 劉大有,陳慧靈,齊紅,等.時(shí)空數(shù)據(jù)挖掘研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2013,50(2):225-239.

        [3] HAN J,KAMBER M,PEI J.Data Mining:Concepts and Techniques,3rd Edition[M].San Francisco:Morgan Kaufman,2012.

        [4] HAWKINS D.Identification of Outliers[M].London:Chapman and Hall,1980.

        [5] BARNETT V,LEWIS T.Outliers in Statistical Data[M].John Wiley & Sons,1994.

        [6] SHEKHAR S,LU C T,ZHANG P.A unified approach to detecting spatial outliers[J].Geoinformatica,2003,7(2):139-166.

        [7] CHENG T,LI Z.A multiscale approach for spatio-temporal outlier detection[J].Transactions in GIS,2006,10(2):253-263.

        [8] TAN P N,STEINBACH M,KUMAR V.Introduction to Data Mining[M].Boston:Addison Wesley,2006.

        [9] RUS I,ROUSSEEUW P.Computing depth contours of bivariate point clouds[J].Journal of Computational Statistics and Data Analysis,1996,40(23):153-168.

        [10] JOHNSON T,KWOK I,NG R.Fast computation of 2-dimensional depth contours[A].Proceeding of the 4th International Conference on Knowledge Discovery and Data Mining[C].New York,USA,1998.224-228.

        [11] ANGIULLI F,PIZZUTI C.Outlier mining in large high-dimensional data sets[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(2):203-215.

        [12] KNORR E M,NG R T.Algorithms for mining distance-based outliers in large dataset[A].Proceedings of the 24th International Conference on Very Large Data Bases[C].New York,USA,1998.392-403.

        [13] RAMASWAMY S,RASTOGI R,SHIM K.Efficient algorithms for mining outliers from large data sets[A].Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data[C].Dallas,Texas,USA,2000.427-438.

        [14] BREUNIG M M,KRIEGEL H P,NG R T,et al.LOF:Identifying density-based local outliers[A].Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data[C].Dallas,Texas,USA,2000.93-104.

        [15] JIN W,TUNG A K H,HAN J,et al.Ranking outliers using symmetric neighborhood relationship[J].Advances in Knowledge Discovery and Data Mining,2006,3918:577-593.

        [16] JIANG S Y,LI Q H,LI K L.GLOF:A new approach for mining local outlier[A].Proceedings of the 2nd International Conference on Machine Learning and Cybernetics[C].Xi′an,China,2003.157-161.

        [17] PAPADIMITRIOU S,KITAGAWA H,GIBBONS P B,et al.LOCI:Fast outlier detection using the local correlation integral[C].Proc Icde,2003.315-326.

        [18] KRIRGEL H P,SCHUBERT M,ZIMEK A.Angle-based outlier detection in high-dimensional data[A].Proceeding of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining[C].Las Vegas,Nevada,USA,2008.444-452.

        [19] ZHANG L,LIN J,KARIM R.An angle-based subspace anomaly detection approach to high-dimensional data:With an application to industrial fault detection[J].Reliability Engineering & System Safety,2015,142:482-497.

        [20] JIANG M F,TSENG S S,SU C M.Two-phase clustering process for outliers detection[J].Pattern Recognition Letters,2001,22(6):691-700.

        [21] THOMAS B,RAJU G.A novel fuzzy clustering method for outlier detection in data mining[J].International Journal of Recent Trends in Engineering,2009,1(2):161-165.

        [22] Al-ZOUBI M B,Al-DAHOUD A,A.YAHYA A.New outlier detection method based on fuzzy clustering[J].WSEAS Transaction on Information Science and Applications,2010,7(5):681-690.

        [23] SHIY,DENG M,YANG X,et al.Adaptive detection of spatial point event outliers using multilevel constrained Delaunay triangulation[J].Computers Environment & Urban Systems,2016,59:164-183.

        [24] 石巖.時(shí)空數(shù)據(jù)異常模式挖掘方法研究[D].長(zhǎng)沙:中南大學(xué),2015.

        [25] HASLETT J,BRANDLEY R,CRAIG P,et al.Dynamic graphics for exploring spatial data with application to locating global and local anomalies[J].The American Statistician,1991,45(3):234-242.

        [26] 黃添強(qiáng),秦小麟,王欽敏.空間數(shù)據(jù)庫(kù)中離群點(diǎn)的度量與查找新方法[J].中國(guó)圖象圖形學(xué)報(bào),2006,11(7):982-989.

        [27] LIU H G,JEZEK K C,O′KELLY M E.Detecting outliers in irregularly distribution spatial data sets by locally adaptive and robust statistics analysis in GIS[J].International Journal of Geographical Information Science,2001,15(8):721-741.

        [28] 李光強(qiáng),鄧敏,朱建軍,等.一種顧及鄰近域內(nèi)實(shí)體間距離的空間異常檢測(cè)新方法[J].遙感學(xué)報(bào),2009,13(2):197-202.

        [29] 鄭旻琦,陳崇成,樊明輝,等.基于Delaunay三角網(wǎng)的空間離群挖掘[J].微型計(jì)算機(jī)應(yīng)用,2008,29(6):76-82.

        [30] CHEN D C,LU C-T,KOU Y F,et al.On detection of spatial outliers[J].Geoinformatica,2008,12(4):455-475.

        [31] 馬榮華,何增友.從GIS 數(shù)據(jù)庫(kù)中挖掘空間離群點(diǎn)的一種高效算法[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2006,31(8):679-682.

        [32] CHAWLA S,SUN P.SLOM:A new measure for local spatial outliers[J].Knowledge and Information System,2006,9(4):412-429.

        [33] 薛安榮,鞠時(shí)光,何偉華,等.局部離群點(diǎn)挖掘算法研究[J].計(jì)算機(jī)學(xué)報(bào),2007,30(8):1455-1463.

        [34] LU C T,DOS SANTOS J R F,LIU X,et al.A graph-based approach to detect abnormal spatial points and regions[J].International Journal on Artificial Intelligence Tools,2011,20(4):721-751.

        [35] SHI Y,DENG M,YANG X,et al.A spatial anomaly points and regions detection method using multi-constrained graphs and local density[J].Transactions in GIS,2016,doi:10.1111/tgis.12208.

        [36] 楊學(xué)習(xí),石巖,鄧敏,等.一種基于多層次專(zhuān)題屬性約束的空間異常探測(cè)方法[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2016,41(6):810-817.

        [37] CHEN F,LU C T,BOEDIHARDJO A P.GLS-SOD:A generalized local statistical approach for spatial outlier detection[A].Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining[C].Washington D.C.,USA,2010.1069-1078.

        [38] LIU X,LU C T,CHEN F.Spatial outlier detection:Random walk based approaches[A].Proceedings of the 18th SIGSPATIAL International Conference on Advances in Geographic Information Systems[C].San Diego,California,USA,2010.370-379.

        [39] CAI Q,HE H,MAN H.Spatial outlier detection based on iterative self-organizing learning model[J].Neurocomputing,2013,117:151-172.

        [40] 李光強(qiáng),鄧敏,程濤,等.一種基于雙重距離的空間聚類(lèi)方法[J].測(cè)繪學(xué)報(bào),2008,37(4):482-487.

        [41] ADAM N,JANEJA V P,ATLURI V.Neighborhood based detection of anomalies in high dimensional spatio-temporal sensor datasets[A].Proceedings of the 19th ACM Symposium on Applied Computing[C].Nicosia,Cyprus,2004.576-583.

        [42] 鄧敏,劉啟亮,李光強(qiáng).采用聚類(lèi)技術(shù)探測(cè)空間異常[J].遙感學(xué)報(bào),2010,14(5):951-958.

        [43] WANG M,WANG A,LI A.Mining spatial-temporal clusters from geo-database[J].Lecture Notes in Artificial Intelligence,2006,4093:263-270.

        [44] PEI T,ZHOU C,ZHU A,et al.Windowed nearest neighbour method for mining spatio-temporal clusters in the presence of noise[J].International Journal of Geographic Information Science,2010,24(6):925-948.

        [45] LIU Q,DENG M,BI J,et al.A novel method for discovering spatio-temporal clusters of different sizes,shapes and densities in the presence of noise[J].International Journal of Digital Earth,2014,7(2):138-157.

        [46] LEE C H.Mining spatio-temporal information on microblogging streams using a density-based online clustering method[J].Expert Systems with Applications,2012,39(10):9623-9641.

        [47] SHI Y,DENG M,YANG X,et al.A framework for discovering evolving domain related spatio-temporal patterns in Twitter[J].ISPRS International Journal of Geo-Information,2016,5(10):193

        [48] KULLDORFF M,HEFFERNAN R,HARTMAN J,et al.A space-time permutation scan statistic for disease outbreak detection[J].Plos Medicine,2005,2(3):e59.

        [49] NEILL D B,MOORE A W,SABHNANI M,et al.Detection of emerging space-time clusters[A].Proceeding of the 11th ACM SIGKDD Conference on Knowledge Discovery and Data Mining[C].Chicago,Illinois,USA,2005.218-227.

        [50] SUN Y,XIE K,MA X,et al.Detecting spatio-temporal outliers in climate dataset:A method study[A].Proceedings of the 2005 IEEE International Conference on Geoscience and Remote Sensing Symposium[C].2005.25-29.

        [51] 劉啟亮,鄧敏,王佳璆,等.時(shí)空一體化框架下時(shí)空異常探測(cè)[J].遙感學(xué)報(bào),2011,15(3):465-474.

        [52] BIRANT D,KUT A.Spatio-temporal outlier detection in large databases[J].Journal of Computing and Information Technology,2006,14(4):291-297.

        [53] TELANG A,DEEPAK P,JOSHI S,et al.Detecting localized homogeneous anomalies over spatio-temporal data[J].Data Mining and Knowledge Discovery,2014,28(5-6):1480-1502.

        [54] BARUA S,ALHAJJ R.Parallel wavelet transform for spatio-temporal outlier detection in large meteorological data[J].Intelligent Data Engineering and Automated Learning-IDEAL,2007,4881:684-694.

        [55] WU E,LIU W,CHAWLA S.Spatio-temporal outlier detection in precipitation data[J].Knowledge Discovery from Sensor Data,2010,5840:115-133.

        [56] LEE J G,HAN J,LI X.Trajectory outlier detection:A partition-and-detect framework[A].Proceedings of the 2008 IEEE 24th International Conference on Data Engineering[C].Cancun,Mexico,2008.140-149.

        [57] GE Y,XIONG H,ZHOU Z H,et al.TOP-EYE:Top-k evolving trajectory outlier detection[A].Proceedings of the 19th ACM International Conference on Information and Knowledge Management[C].Toranto,Canada,2010.1733-1736.

        [58] ZHANG D,LI N,ZHOU Z H,et al.iBAT:Detecting anomalous taxi trajectories from GPS traces[A].Proceedings of the 13th International Conference on Ubiquitous Computing[C].Beijing,China,2011.99-108.

        [59] LIU W,ZHENG Y,CHAWLA S.Discovering spatio-temporal causal interactions in traffic data streams[A].Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining[C].San Diego,California,USA,2011.1010-1018.

        [60] PAN B,ZHENG Y,WILKIE D,et al.Crowd sensing of traffic anomalies based on human mobility and social media[A].Proceedings of the 21st ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems[C].Orlando,Florida,USA,2013.344-353.

        [61] CHAWLA S,ZHENG Y,HU J.Inferring the root cause in road traffic anomalies[A].Proceedings of the 2012 IEEE 12th International Conference on Data Mining[C].Brussels,Belgium,2012.141-150.

        [62] PANG L X,CHAWLA S,LIU W,et al.On mining anomalous patterns in road traffic streams[J].Journal of Neuroendocrinology,2011,22(2):110-118.

        A Summary of Spatio-temporal Outlier Detection

        DENG Min1,SHI Yan2,3,GONG Jian-ya2,3,YANG Xue-xi1

        (1.DepartmentofGeo-informatics,SchoolofGeosciencesandInfo-Physics,CentralSouthUniversity,Changsha410083;2.StateKeyLaboratoryofInformationEngineeringinSurveying,Mapping&RemoteSensing,WuhanUniversity,Wuhan430079;3.CollaborativeInnovationCenterofGeospatialTechnology,WuhanUniversity,Wuhan430079,China)

        Outlier detection is an important research theme in the field of data mining,which is very valuable to detect financial fraud,public health,extreme climate event,traffic congestion and heavy environmental pollution.Outlier is identified as “an observation which deviates so much from other observations as to arouse suspicions that it is generated by a different mechanism”.As a result,outlier detection will be very helpful to discover the unusual geographical phenomena.Outlier detection is involved in transaction databases at first,and some representative methods are presented,e.g.distance-based,density-based,and clustering-based.These methods do not consider spatial or spatio-temporal characteristics (e.g.spatial or spatio-temporal correlation,heterogeneity).For this purpose,some researchers expand them for the applications of the spatial and spatio-temporal databases.Spatial outliers represent locations which are significantly different from their neighborhoods even though they may not be significantly different from the entire population.Spatio-temporal outlier represents spatio-temporal objects whose thematic attribute values are significantly different from those of other spatially and temporally referenced objects in its spatio-temporal neighborhood.Correspondingly,spatial or spatio-temporal outlier detection methods (e.g.spatial or spatio-temporal clustering-based,spatial or spatio-temporal scanning statistics-based) are developed by considering spatial or spatio-temporal characteristics.Obviously,there are still many shortcomings in these outlier detection methods for different application domains,because each of these methods is to large degree proposed for a special application.Therefore,in order to develop more general methods for detecting various types of outliers,this paper firstly describes the basic concepts and classifications of traditional outlier detection,spatial outlier detection and spatio-temporal outlier detection in details.Further,several classic algorithms are reviewed and their shortages are also analyzed.Finally,some hot research directions of spatio-temporal outlier detection are highlighted.

        outliers;traditional outlier detection;spatial outlier detection;spatio-temporal outlier detection

        2016-09-22;

        2016-10-27

        國(guó)家自然科學(xué)基金項(xiàng)目(41471385);國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2016YFB0502303);湖南省自然科學(xué)杰出青年基金項(xiàng)目(14JJ1007)

        鄧敏(1974-),男,教授,博士生導(dǎo)師,主要從事時(shí)空數(shù)據(jù)挖掘與信息服務(wù)研究。E-mail:dengmin208@tom.com

        10.3969/j.issn.1672-0504.2016.06.008

        TP311.13

        A

        1672-0504(2016)06-0043-08

        猜你喜歡
        鄰域度量時(shí)空
        有趣的度量
        跨越時(shí)空的相遇
        模糊度量空間的強(qiáng)嵌入
        鏡中的時(shí)空穿梭
        稀疏圖平方圖的染色數(shù)上界
        迷向表示分為6個(gè)不可約直和的旗流形上不變愛(ài)因斯坦度量
        玩一次時(shí)空大“穿越”
        基于鄰域競(jìng)賽的多目標(biāo)優(yōu)化算法
        關(guān)于-型鄰域空間
        時(shí)空之門(mén)
        疯狂三人交性欧美| av网页在线免费观看| 日本视频一区二区三区| 成人av片在线观看免费| 国产亚洲精品久久777777| 亚洲国产夜色在线观看| 国产av一区二区三区在线| 日本久久伊人特级黄色| 精品国产乱码久久久久久影片| 一级呦女专区毛片| 国产青春草在线观看视频| 精品天堂色吊丝一区二区| 日本黄页网站免费观看| 综合色天天久久| 日本一区二区偷拍视频| 性欧美长视频免费观看不卡| 日本不卡在线视频二区三区| av无码一区二区三| 各类熟女熟妇激情自拍| 潮喷大喷水系列无码久久精品| 中文乱码人妻系列一区二区| 加勒比东京热综合久久| 国产91久久麻豆黄片| 国产女主播精品大秀系列| 国产一国产一级新婚之夜| 中文字幕你懂的一区二区| 精品国产sm最大网站| 中文字幕无码不卡一区二区三区| 日本不卡在线一区二区三区视频| 在线国产丝袜自拍观看| 久久精品国产精品青草| 中文字幕第七页| 一本久道在线视频播放| 视频一区视频二区制服丝袜| 欧美巨大xxxx做受中文字幕| 国产精品女同学| 美女主播网红视频福利一区二区| 成人a级视频在线观看| 一区二区久久不射av| 三级国产高清在线观看| 亚洲熟妇久久国产精品|