亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LOF算法的規(guī)律異常車輛檢測

        2018-07-16 03:48:10高澤雄福建省晉江市公安局
        警察技術(shù) 2018年4期
        關(guān)鍵詞:特征檢測

        高澤雄  福建省晉江市公安局

        一、通過LOF算法進行規(guī)律異常車輛檢測應(yīng)用思路

        不同用途的車輛,其出行規(guī)律是不一樣的。如朝九晚五的上班族的出行峰值可能集中在早上八點之后及晚上六點之后;蔬果運輸車輛峰值可能在早上四、五點;一些私人運營車輛、個體公司送貨車輛看似軌跡比較零亂,頻率難以歸納,但就其所在村居的卡口數(shù)據(jù)來看,也存在一個相對固定的每天出發(fā)時間及歸來時間。本文梳理出每個卡口每輛車的出行規(guī)律特征,并通過LOF算法將規(guī)律特征相近的車輛進行聚合,而最為離散的幾輛車即為該卡口的規(guī)律異常車輛。最后對每個卡口的規(guī)律異常車輛進行統(tǒng)籌分析,只要一輛車在任一卡口被認定為規(guī)律正常車輛,即認定為規(guī)律正常車輛,其余即為規(guī)律異常車輛。在任一卡口的軌跡數(shù)不滿100的車輛不參與該卡口的規(guī)律異常統(tǒng)計。

        (一)數(shù)據(jù)介紹

        本文研究數(shù)據(jù)來自晉江市公安局社會治理視頻監(jiān)控系統(tǒng)的436個慢速卡口所獲取的過車數(shù)據(jù)。這些卡口主要部署在全市各個村居的主要出入口,基本可以實現(xiàn)對各個村居出入情況的全覆蓋。數(shù)據(jù)時間跨度從2014年8月至2017年10月,總量計8.7千萬條。每條數(shù)據(jù)包括卡口ID、過車時間、過車速度、車道及車輛的型號、車標(biāo)、顏色、遮陽板等特征,以及車牌的顏色、類型、號碼等特征。

        本次應(yīng)用是對規(guī)律異常車輛的檢測,因此僅需提取卡口ID、過車時間、車牌號碼三列數(shù)據(jù)進行分析。為簡化分析模型,假設(shè)車牌號碼即可唯一確定一輛車,暫不考慮套牌車、車牌識別錯誤等問題。

        (二)特征提取

        我們需要把上述軌跡數(shù)據(jù)轉(zhuǎn)化為可供機器學(xué)習(xí)模型直接分析的特征向量。因本應(yīng)用研究的是車輛出行規(guī)律,因此需要把軌跡數(shù)據(jù)轉(zhuǎn)化為車輛的出行規(guī)律特征。根據(jù)不同的時間維度,可分為特定車輛的每日出行規(guī)律、每周出行規(guī)律、每月出行規(guī)律等。

        本文采用的是每日出行規(guī)律,即根據(jù)特定車輛在特定卡口的歷史出行數(shù)據(jù),統(tǒng)計各小時段的通過次數(shù),除以總次數(shù),得出每小時的出行概率。

        對卡口i的所有軌跡數(shù)據(jù)進行計算,計算結(jié)果以px,t表示第x輛車t時的出行概率,得到某卡口i的所有過車頻率特征矩陣Camerai,矩陣中的每一行就是描述第x輛車出行規(guī)律的特征向量。

        (三)模型分析

        LOF算法[1](Local Outlier Factor,局部離群因子檢測方法)是基于密度的離群點檢測方法中一個比較有代表性的算法。該算法會給數(shù)據(jù)集中的每個點計算一個離群因子LOF,通過判斷LOF是否接近于1來判定是否是離群因子。若LOF遠大于1,則認為是離群因子,接近于1,則是正常點。

        在Camerai矩陣中,每行數(shù)據(jù)就是一個特征向量,也就是算法中的一個點。Python的sklearn.neighbors庫中有封裝好的LocalOutlierFactor類[2],只要調(diào)用該類對上述特征矩陣進行分析預(yù)測,即可得到一個一維數(shù)組,每一個值對應(yīng)矩陣中的一行,標(biāo)識該車輛規(guī)律特征是否為離散點(-1/1)。

        (四)綜合分析

        通過對各個卡口的數(shù)據(jù)逐一進行分析,可得所有車輛在各個卡口的檢測結(jié)果。特定車輛只需在任意一個卡口中被判斷為規(guī)律正常,即可定為規(guī)律正常點。若在所有卡口分析結(jié)果中均為異常點,則該輛車即為本應(yīng)用所探尋的規(guī)律異常車輛。

        二、技術(shù)實現(xiàn)

        (一)數(shù)據(jù)導(dǎo)入

        先以376號卡口的數(shù)據(jù)演示獲取單一卡口規(guī)律異常車輛的過程,然后再封裝整個過程,供其它卡口循環(huán)調(diào)用。

        通過數(shù)據(jù)庫連接先獲取376號卡口的所有過車數(shù)據(jù)。主要取記錄ID(VEHICLE_ID)、過車時間(PASS_TIME)和車牌號碼(PLATE_INFO)三個字段,寫入pandas庫的dataframe。數(shù)據(jù)預(yù)覽如圖1所示。

        (二)特征提取

        調(diào)用pivot_table方法生成數(shù)據(jù)透視表dfPass。行索引是每輛車的車牌,列索引是過車時間的小時數(shù),統(tǒng)計的數(shù)字則是該車輛在該小時內(nèi)的過車次數(shù)。

        此后,將每小時的過車次數(shù)除以總次數(shù),就得到了該車輛按小時統(tǒng)計的出行規(guī)律特征向量。同時,排除掉軌跡條數(shù)小于100的車輛,因為2年多的時間內(nèi)累計過車次數(shù)少于100,證明該車輛通過該卡口的頻率并不高,難以生成有意義的規(guī)律統(tǒng)計。通過計算,我們得到了存有該卡口所有車輛的規(guī)律特征向量集,存入dfPassE。此時dfPassE的車輛記錄數(shù)為2692條。

        圖4為隨機抽取的幾張車輛出行規(guī)律分布圖。

        (三)模型分析

        調(diào)用LocalOutlierFactor模型對dfPassE中的數(shù)據(jù)進行訓(xùn)練及預(yù)測。

        模型參數(shù)n_neighbors為20,表示取與一個點最臨近的20個點(即它的20個相鄰點)來計算離群因子。contamination為0.01,表示取1%的點作為離群點。生成結(jié)果y即是模型預(yù)測結(jié)果,是一個一維數(shù)組,用-1/1表示對應(yīng)點是否離群點。

        我們可以用kneighbors函數(shù)[3]來獲取某個點的20個相鄰點距離及編號。

        例如取一規(guī)律正常點68進行計算,可知其相鄰點從遠到近依次為2153、2126、4270、19888等。畫出這幾個點的出行規(guī)律圖,可見他們的規(guī)律是幾乎一致的。

        再取一個檢測結(jié)果為異常(-1)的點203,查看與其最接近的幾個點的出行規(guī)律圖,可以發(fā)現(xiàn)其規(guī)律相差較大。

        (四)綜合分析

        將上述過程封裝成函數(shù)countOutlier(crossing_id),傳入卡口id,即可返回該卡口的規(guī)律異常過車檢測情況。將所有卡口的檢測情況匯入總表dfAll,即可得到一張檢測總表。

        在圖9中,行索引是車牌,列索引是卡口ID,若該車輛在該卡口規(guī)律正常為1,異常為-1,無記錄則為NaN。該表記錄累計97448行。

        根據(jù)上述思路統(tǒng)計卡口規(guī)律存入result列,如果某車輛有任一卡口規(guī)律正常,則result為0,否則統(tǒng)計在所有卡口出現(xiàn)的異常次數(shù)。

        查詢result大于等于1的車輛,總數(shù)為930條。進一步查詢result大于等于2的車輛,僅42條。

        取其中一輛規(guī)律異常次數(shù)為4的車輛繪出其在4個卡口的規(guī)律分布圖如圖11所示。

        這部分車輛有何特征或有何價值,將移交負責(zé)研判的部門進行進一步分析。

        三、結(jié)語

        本文探討的僅是異常檢測在車輛軌跡上的一個應(yīng)用思路,同樣的算法配合不同的應(yīng)用思路可以產(chǎn)生更多有價值的研究。例如分析特定車輛每周的行動規(guī)律特征(幾點經(jīng)過哪個卡口),并以歷史特征作為異常檢測模型的訓(xùn)練數(shù)據(jù),來自動識別該車輛在某時刻是否出現(xiàn)異常行為;或者以特定卡口的每日過車數(shù)作為特征,即可以異常檢測模型發(fā)現(xiàn)其何時發(fā)生車流異常,進而判斷當(dāng)日是否有特殊事件發(fā)生。

        如何更好地挖掘車輛軌跡、人員軌跡是視頻大數(shù)據(jù)深度應(yīng)用的方向。在更高層面來說,如何更好地利用大數(shù)據(jù)挖掘不同數(shù)據(jù)集之間的潛在關(guān)聯(lián)關(guān)系為公安工作服務(wù),也是公安大數(shù)據(jù)未來發(fā)展的方向。機器學(xué)習(xí)的分類、回歸、聚類、降維等多種不同算法一旦落地公安已有大數(shù)據(jù),必將迸發(fā)出無窮的可能性。

        猜你喜歡
        特征檢測
        抓住特征巧觀察
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        “幾何圖形”檢測題
        “角”檢測題
        新型冠狀病毒及其流行病學(xué)特征認識
        如何表達“特征”
        不忠誠的四個特征
        抓住特征巧觀察
        成年美女黄网站色大免费视频| 韩国无码精品人妻一区二| 天堂av在线播放观看| 一本一道久久综合久久| 国产精品www夜色视频| 精品久久久久久久久久久aⅴ| 亚洲国产AⅤ精品一区二区久| 久久综合激情的五月天| 青青草原亚洲| 免费人成再在线观看网站| av无码特黄一级| 漂亮人妻出轨中文字幕 | 欧美日韩在线免费看| 亚洲在线一区二区三区四区| 国产一区二区三区青青草| 国产黄大片在线观看| 国产亚洲日韩欧美一区二区三区| 亚洲人成在线播放a偷伦| 偷拍综合在线视频二区日韩| 中文字幕在线日亚洲9| 亚洲欧美偷拍视频| 国产91九色视频在线播放| 亚洲成人中文字幕在线视频| 日本公与熄乱理在线播放| 欧美日韩国产亚洲一区二区三区 | 色婷婷综合久久久中文字幕| 免费又黄又爽又猛的毛片| 无码中文字幕久久久久久| 亚洲国产精品成人av在线不卡 | 日本一级特黄aa大片| 精品亚洲成在人线av无码| 91国在线啪精品一区| 国产精品麻豆一区二区三区 | 中文字幕乱偷乱码亚洲| 亚洲精品一区二区三区新线路| 国产午夜精品av一区二区麻豆| 先锋影音av资源我色资源| 亚洲国产av剧一区二区三区| 国产人妖网站在线视频| 亚洲精品无码久久久久牙蜜区| 天天插视频|