亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        公安數(shù)據(jù)挖掘分析實戰(zhàn)與教學實踐探析

        2020-04-27 02:55:24徐建峰
        江蘇警官學院學報 2020年1期
        關(guān)鍵詞:公安數(shù)據(jù)挖掘算法

        楊 杰 徐建峰 李 睿

        一、背景

        數(shù)據(jù)挖掘分析一般是指從大量的數(shù)據(jù)中搜索信息、提煉知識的過程,其常用的方法包括信息檢索、統(tǒng)計分析、機器學習等。隨著公安信息化的發(fā)展,公安機關(guān)利用大數(shù)據(jù)進行挖掘分析,實現(xiàn)尋線追蹤、打擊處置、預測預警已成為趨勢。公安警種部門多個業(yè)務崗位的工作都與數(shù)據(jù)挖掘分析密切相關(guān)①趙曉凡:《公安高等院校數(shù)據(jù)挖掘課程教改研究》,《計算機教育》2018第1期。,培養(yǎng)熟練掌握數(shù)據(jù)挖掘分析技能的警務人才、在公安院校中建設(shè)好相關(guān)學科體系,已成為新時代公安工作創(chuàng)新發(fā)展的迫切需要。目前,針對數(shù)據(jù)挖掘分析課程教學改革的探討有:邱明月等通過分析培養(yǎng)公安創(chuàng)新人才的課程教學、實訓及能力訓練,設(shè)計了符合網(wǎng)絡(luò)信息資源要求的公安數(shù)據(jù)挖掘能力培養(yǎng)方案②邱明月、唐松澤:《基于互聯(lián)網(wǎng)資源的公安數(shù)據(jù)挖掘能力培養(yǎng)研究》,《信息與電腦》2018第19期。;張云春等以課堂教學和項目實踐相結(jié)合的方式推進數(shù)據(jù)挖掘課程在大數(shù)據(jù)環(huán)境下的教學和實踐③張云春等:《基于MOOC嵌入式教學的數(shù)據(jù)挖掘教學改革初探》,《計算機教育》2015年第13期。;張艷等針對大數(shù)據(jù)的特點,以構(gòu)建課程核心知識體系為主題,采用案例教學法改革傳統(tǒng)的教學評價方式④張艷:《大數(shù)據(jù)背景下的數(shù)據(jù)挖掘課程教學新思考》,《計算機時代》2014年第4期。;李海林等從培養(yǎng)數(shù)據(jù)意識、加強理論體系、創(chuàng)新教學方法和深入科學研究等四個方面探索設(shè)計高校數(shù)據(jù)挖掘課程,以解決大數(shù)據(jù)挖掘課程因過于抽象而產(chǎn)生的問題⑤李海林:《大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘課程教學探索》,《計算機時代》2014年第2期。。本文結(jié)合公安實戰(zhàn)應用需求及相關(guān)技術(shù)要求,從典型的大數(shù)據(jù)挖掘分析方法出發(fā),探討與公安院校數(shù)據(jù)挖掘分析教學實踐密切相關(guān)的一些問題。

        二、主要的數(shù)據(jù)挖掘分析方法

        數(shù)據(jù)挖掘分析是為了提取有用信息并形成結(jié)論而對數(shù)據(jù)進行詳細研究和概括總結(jié)的過程。在警務工作中,數(shù)據(jù)挖掘分析主要包括根據(jù)線索特征找到嫌疑對象,通過數(shù)據(jù)統(tǒng)計總結(jié)出目標對象的行為規(guī)律、群體分布特性,以及通過機器學習方法預測警情、案事件的發(fā)生概率及趨勢等,并通過預警指令、專題報告等形式,賦能民警精準打擊,輔助領(lǐng)導決策指揮。根據(jù)應用場景和技術(shù)實現(xiàn)的難易程度,結(jié)合筆者多年的工作經(jīng)驗,我們將公安機關(guān)數(shù)據(jù)挖掘分析方法總結(jié)為查詢比對、規(guī)則判別、算術(shù)統(tǒng)計、和預測預警等四個類別,具體如表1所示。

        表1 公安機關(guān)數(shù)據(jù)挖掘分析方法主要分類

        目前公安工作中進行數(shù)據(jù)挖掘分析的主要“工具”包括SQL、機器學習算法和關(guān)系型數(shù)據(jù)庫、大數(shù)據(jù)組件等。上述方法中,前三個類別主要是基于關(guān)系型數(shù)據(jù)庫、大數(shù)據(jù)組件等,通過SQL開發(fā)進行數(shù)據(jù)分析應用,最后一類主要是基于機器學習算法和大數(shù)據(jù)組件通過深度開發(fā)分析模型開展應用。

        (一)查詢比對

        在數(shù)據(jù)挖掘分析中,查詢檢索、比對布控類應用,主要基于給定的 ID或確定的關(guān)鍵詞等線索數(shù)據(jù),與各類動態(tài)數(shù)據(jù)特別是軌跡類數(shù)據(jù)進行值比較,并按要求將匹配比中的數(shù)據(jù)返回給用戶。

        實現(xiàn)方法主要是基于SQL的結(jié)構(gòu)化等值比較,將比對條件放在WHERE子句中,并結(jié)合布爾運算,通過內(nèi)連接、外連接、交叉連接等運算機制,構(gòu)成有復合搜索條件的SELECT語句,此類方法常用于一鍵搜索、在逃人員比對布控等業(yè)務應用場景。

        (二)規(guī)則判別

        相較于查詢比對,規(guī)則判別類數(shù)據(jù)挖掘分析是更為復雜的數(shù)據(jù)比較,主要基于給定的業(yè)務規(guī)則進行條件符合性篩查。通常是由多個判別條件組合嵌套形成SQL語句中的復合搜索條件。其分析過程多用以下運算符:

        1.等值之外的值比較運算符,如!=,>=,in,between等;

        2.模糊查詢like,結(jié)合通配符%,_,[]等;

        3.條件組合運算符,如AND、OR、NOT等。

        此類數(shù)據(jù)挖掘分析主要是根據(jù)業(yè)務規(guī)則篩選出符合條件的目標對象集合,如盜竊案件潛在嫌疑人、通訊網(wǎng)絡(luò)詐騙易受害人群等。具體實現(xiàn)過程中,主要是將嫌疑人或受害人的自然屬性、嫌疑特征或受害特征等屬性條件逐條轉(zhuǎn)換為對應業(yè)務規(guī)則,然后基于上述規(guī)則組合,對相關(guān)數(shù)據(jù)表進行關(guān)聯(lián)查詢和條件比較,符合規(guī)則數(shù)越多則嫌疑度或易被侵害度越高。最終輸出的結(jié)果將提供給研判人員進行二次甄別篩選,并確定是否采取進一步的行動措施。

        (三)算術(shù)統(tǒng)計

        算術(shù)統(tǒng)計類數(shù)據(jù)挖掘分析主要是基于給定條件對數(shù)據(jù)進行規(guī)模量計數(shù)統(tǒng)計,或是基礎(chǔ)性計算統(tǒng)計,運算過程中通常要用到SQL的分組函數(shù)和聚合函數(shù),實現(xiàn)對數(shù)據(jù)表中數(shù)據(jù)的加、減、乘、除和計數(shù)、極值、均值等簡單計算。常見的聚合函數(shù)有AVG、COUNT、MAX、MIN、SUM等,可以組合起來使用。分組由GROUP BY子句實現(xiàn),通過歸納信息類型實現(xiàn)相關(guān)數(shù)據(jù)匯總。條件控制由HAVING子句實現(xiàn),通過條件符合性比較篩選出相應結(jié)果。以同行人員分析為例,通常同出行一定次數(shù)以上的人員聯(lián)系較為緊密,具體實現(xiàn)過程如下:

        步驟一:從多種來源的軌跡類數(shù)據(jù)中提取相應的數(shù)據(jù)記錄;

        步驟二:按照給定條件,對數(shù)據(jù)記錄中人員同行次數(shù)進行計數(shù)統(tǒng)計;

        步驟三:根據(jù)步驟二的計數(shù)統(tǒng)計結(jié)果,按照給定的閾值篩選出高密度同行人員。

        算術(shù)統(tǒng)計類的數(shù)據(jù)挖掘分析主要應用于對象群體的時空規(guī)律分析,如同伙軌跡伴隨、類案時空分布等。

        (四)預測預警

        預測預警類數(shù)據(jù)挖掘分析是實踐中難度最高的一類,通常是基于機器學習算法實現(xiàn),主要有聚類、分類、回歸、關(guān)聯(lián)規(guī)則等。不同類型的算法具有不同的特性,適用于不同的業(yè)務場景。以聚類算法為例,其主要運算過程是按內(nèi)在相似性將數(shù)據(jù)集劃分為多個類別,使類別內(nèi)的數(shù)據(jù)相似度較大而類別間的數(shù)據(jù)相似度較小,本質(zhì)上是通過對無標記數(shù)據(jù)的學習來揭示數(shù)據(jù)的內(nèi)在性質(zhì)及規(guī)律。最為常見的是K均值(K-means)聚類算法,其通過“距離”衡量數(shù)據(jù)間的相似度,應用時需預設(shè)聚類結(jié)果類別的個數(shù)。算法的基本步驟為:

        步驟三:將每個類別中心更新為隸屬該類別的所有樣本的均值

        步驟四:判斷是否滿足終止條件。常用的終止條件有迭代次數(shù)、簇中心變化率、最小平方誤差等。

        步驟五:若滿足終止條件,聚類結(jié)束;否則,跳轉(zhuǎn)到步驟二,重復執(zhí)行,直到滿足終止條件。

        基于機器學習算法的數(shù)據(jù)挖掘分析主要用于警情預測、軌跡預測、風險預測等應用場景。以盜竊慣犯的預測分析為例,可將最近一次無違法行為天數(shù)(即從最近一次接受處罰期滿釋放以來未出現(xiàn)新案件的時長)、年均盜竊次數(shù)、年均盜竊金額等特征屬性作為輸入維度,利用 K-means算法進行聚類分析,得出與已知慣犯處于同一類的盜竊嫌疑人員。具體實踐過程中,在得到聚類結(jié)果的基礎(chǔ)上,還需對聚類結(jié)果進行二次研判,以進一步確定盜竊嫌疑人員的作案可能性。

        三、數(shù)據(jù)挖掘分析的教學實踐

        (一)數(shù)據(jù)挖掘分析教學中的主要問題

        隨著數(shù)據(jù)挖掘分析對公安信息化應用工作的重要性越來越大,要培養(yǎng)符合公安實戰(zhàn)要求的數(shù)據(jù)挖掘分析人才,公安院校必須在數(shù)據(jù)挖掘分析的課程設(shè)置、教學方式、實踐設(shè)計、教學管理等方面不斷進行改進和創(chuàng)新。鑒于數(shù)據(jù)挖掘分析是一個多學科交叉的綜合業(yè)務領(lǐng)域,特別是在公安機關(guān)應用的時間不長,且領(lǐng)域內(nèi)新的技術(shù)理論發(fā)展迅猛,理解和掌握數(shù)據(jù)挖掘分析并不是一件容易的事。據(jù)初步調(diào)研,公安院校相關(guān)課程教學普遍存在以下難點和問題:

        一是起點高、難度大。數(shù)據(jù)挖掘分析課程內(nèi)容涉及領(lǐng)域廣泛,包括統(tǒng)計學、數(shù)據(jù)庫、機器學習、模式識別等內(nèi)容,且所涉及的算法繁多。公安院校主要為本科層次教育,一般很少專門開設(shè)數(shù)據(jù)挖掘的課程,所以理論基礎(chǔ)相對薄弱,學習難度較大。

        二是重算法、輕實踐。數(shù)據(jù)挖掘分析是數(shù)據(jù)獲取、數(shù)據(jù)整理、預處理、挖掘分析、結(jié)果分析等一系列流程的綜合,相關(guān)教學通常以高等數(shù)學算法為課程主體內(nèi)容。在具體實踐中,一方面,計數(shù)、求和、差值、極值、均值等簡單算術(shù)運算覆蓋了當前業(yè)務應用的大部分數(shù)據(jù)分析場景及具體分析模型;另一方面,數(shù)據(jù)預處理的時間往往占到工作量的 70%以上,且預處理的質(zhì)量很大程度上影響后續(xù)挖掘分析的結(jié)果。

        三是缺實景、少案例。承擔數(shù)據(jù)分析教學的教師很少有機會直接參加公安機關(guān)實際應用的數(shù)據(jù)分析模型的設(shè)計和開發(fā),實戰(zhàn)經(jīng)驗不足;課堂教學中所用的案例大多數(shù)來自參考書籍,跟警務工作實際相關(guān)的少之又少。

        (二)數(shù)據(jù)挖掘分析教學工作的完善

        針對上述問題,筆者結(jié)合公安機關(guān)開展數(shù)據(jù)挖掘分析應用常用的四類典型方法,嘗試探討公安院校做好數(shù)據(jù)挖掘分析教學的關(guān)鍵突破口。

        一是有的放矢,完善課程體系。公安機關(guān)開展數(shù)據(jù)挖掘分析通常要解決的問題包括:主體身份的確定、時間和空間的確定、行為方式和習慣以及參與人員等內(nèi)容的確定。就上述四類典型應用方法而言,前三類在實際應用中占據(jù)了當前公安機關(guān)數(shù)據(jù)挖掘分析需求的絕大部分。因此,具體的教學活動要強化關(guān)系代數(shù)、組合數(shù)學等課程的設(shè)置和教學,讓學生熟練掌握關(guān)系代數(shù)和組合數(shù)學的基本運算操作,理解其數(shù)學含義;要強化SQL語言開發(fā)課程的教學,讓學生熟練掌握SQL語法和常用的比較操作、統(tǒng)計函數(shù)等;要加大機器學習算法課程開設(shè)力度,強化數(shù)學基礎(chǔ)學習和案例分析,為開展數(shù)據(jù)深度分析儲備知識、積累經(jīng)驗。

        二是注重實踐,錘煉數(shù)據(jù)能力。在開展上述課程教學的同時,要注重案例分析實踐,培養(yǎng)鍛煉學生根據(jù)不同場景條件選用合適分析方法的能力。當目標對象明確時,可以基于等值比較查詢檢索相關(guān)信息;當給定條件模糊時,則可選用規(guī)則判別方法進行分析;當需要研判與特定對象有時空伴隨現(xiàn)象的未知對象時,則需要應用算術(shù)統(tǒng)計的分析方法;當需要預判某地將來一段時間的警情發(fā)生情況時,可采用機器學習中的回歸分析等方法進行分析。此外,要做好數(shù)據(jù)挖掘分析教學,還需要提高數(shù)據(jù)挖掘分析實踐課程的比例,提升學生數(shù)據(jù)處理和數(shù)據(jù)準備的能力。熟悉數(shù)據(jù)內(nèi)容、熟練掌握方法、選擇適用方法,這些都是較好地完成數(shù)據(jù)挖掘分析工作任務的必備要素。針對機器學習算法知識難度大的問題,可以選擇合適的分析工具,依托可視化建模拖拽、參數(shù)設(shè)置等功能組件,實現(xiàn)算法的自定義配置應用,從而降低學習門檻。

        三是任務驅(qū)動,興趣引領(lǐng)教學。建立由任務驅(qū)動的數(shù)據(jù)挖掘分析教學實踐流程①黃劍:《任務驅(qū)動探究式教學模式在數(shù)據(jù)挖掘課程中的應用研究》,《電腦知識與技術(shù)》2014年第6期。,探索形成以學生為主體、教師為主導的交互式、嵌入式教學方式。具體實踐中,可以結(jié)合公安實戰(zhàn)任務,突出實踐和討論交流,將數(shù)據(jù)挖掘分析工作流程,分解成若干子任務,設(shè)定階段性任務目標,由老師輔導、學生自主執(zhí)行,激發(fā)學生學習興趣,提升學習動力,培養(yǎng)分析和解決問題的能力,改變以往純理論單向灌輸?shù)慕虒W方式,將理論知識講解和實踐任務有機結(jié)合起來??紤]到數(shù)據(jù)挖掘分析的連貫性以及整體課程的工程龐大性,可以以項目化的方式加以推進,并將整個項目分解成數(shù)據(jù)收集、數(shù)據(jù)處理、探索性分析、挖掘分析、結(jié)果分析、報告撰寫等一系列小任務,安排好階段目標,有序推進,逐步建立學生完成小任務的信心并最終高效完成項目,掌握數(shù)據(jù)挖掘分析實戰(zhàn)應用技能。老師要及時跟進了解學生階段性任務完成情況,全流程做好任務進度控制,對學生遇到的困難及時給出意見建議,對難點給予技術(shù)支持,引導學生自主完成教學項目。

        四、結(jié)束語

        近年來,隨著公安信息化建設(shè)應用的升級提速,公安機關(guān)已經(jīng)建立了較為完整的大數(shù)據(jù)資源體系。不斷從這些大數(shù)據(jù)中快速挖掘分析出高價值情報線索以有效、精準服務公安工作現(xiàn)實需要,已成為公安機關(guān)技術(shù)能力建設(shè)的迫切需求。數(shù)據(jù)挖掘分析所涉學科眾多,作為公安人才隊伍培養(yǎng)的主陣地,公安院校的相關(guān)課程建設(shè)完善迫在眉睫。我們認為,公安院校數(shù)據(jù)挖掘分析教學設(shè)計應該重點突出實踐環(huán)節(jié),合理規(guī)劃數(shù)學理論和實踐部分的比例,突出數(shù)據(jù)挖掘分析的大數(shù)據(jù)環(huán)境,強化數(shù)據(jù)挖掘技術(shù)在警務工作中的應用,為不斷提升公安機關(guān)的情報洞察能力、分析決策能力、指揮管理能力、偵查破案能力和服務社會能力提供可持續(xù)的智力支持。

        猜你喜歡
        公安數(shù)據(jù)挖掘算法
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        “老公安”的斂財“利器”
        基于MapReduce的改進Eclat算法
        Travellng thg World Full—time for Rree
        進位加法的兩種算法
        “10歲當公安”為何能暢通無阻
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        公安報道要有度
        新聞傳播(2016年20期)2016-07-10 09:33:31
        一種改進的整周模糊度去相關(guān)算法
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        久草视频这里只有精品| 天堂a版一区二区av| 国产一区二区资源在线观看| 欧美性高清另类videosex| 999久久久国产精品| 在线视频一区二区日韩国产| 免费人成网站在线播放| 中出人妻希奇杰卡西av| 国产精品51麻豆cm传媒| 欧美日韩色| 色视频日本一区二区三区 | 女人无遮挡裸交性做爰| 国产精品夜间视频香蕉| 无码中文日韩Av| 亚洲第一页在线免费观看| 风韵丰满熟妇啪啪区老老熟妇| 男同gay毛片免费可播放| 久久精品国产亚洲一区二区| 国产精品高清免费在线| 久久亚洲中文字幕精品一区| 丁香五香天堂网| 久久久久久久综合日本| 亚洲av乱码国产精品观| 亚洲欧洲国产成人综合在线| 欧美日韩久久久精品a片| 激情五月婷婷久久综合| 丰满少妇被猛进去高潮| 香港三级精品三级在线专区| 国产精品久久久久尤物| 91精品蜜桃熟女一区二区| 在厨房被c到高潮a毛片奶水| 日产无人区一线二线三线新版| 日韩不卡无码三区| 中国老熟女露脸老女人| 欧美黑人性暴力猛交喷水黑人巨大| 亚洲AV无码久久久一区二不卡| 日韩精品一区二区在线视| 亚洲夜夜性无码| 精品无码国产污污污免费| 中国少妇和黑人做爰视频| 久久精品国产亚洲av精东|