亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于可視化的網(wǎng)吧非法運營行為檢測及分析

        2019-03-12 12:27:54張藝蘭梁晶喬亞男馮雪昱
        現(xiàn)代計算機 2019年5期
        關鍵詞:可視化分析信息

        張藝蘭,梁晶,喬亞男,馮雪昱

        (四川大學計算機學院,成都610065)

        0 引言

        隨著家庭網(wǎng)絡的普及,網(wǎng)吧經(jīng)營變得艱難,由此部分網(wǎng)吧出現(xiàn)了接納未成年人上網(wǎng)等非法運營現(xiàn)象,這些黑網(wǎng)吧通常設施簡陋、隱蔽性強,吸引了大量未成年人、外來務工人員(流動人口)前往,這類人群受經(jīng)濟、法律規(guī)定、家庭禁止等因素限制成為黑網(wǎng)吧的主要消費群體[1]。黑網(wǎng)吧的存在,一方面違反國家法律,另一方面嚴重危害未成年人身心健康、影響社會公共安全。為此,長期以來全國公安機關都在組織開展打擊黑網(wǎng)吧行動。然而,網(wǎng)吧數(shù)目巨大給執(zhí)法部門的執(zhí)法帶來困難,且現(xiàn)有的派遣專門人員挨個排查網(wǎng)吧的傳統(tǒng)執(zhí)法方式耗時耗力,給了非法網(wǎng)吧規(guī)避查處的可趁之機。在這樣的情況下,一套能可視化的檢測和分析網(wǎng)吧非法運營行為的處理流程就很有必要性了。

        網(wǎng)吧非法運營現(xiàn)象種類繁多,但這篇文章僅對網(wǎng)吧未成年人上網(wǎng)接納情況、流動人口上網(wǎng)行為分析、青年犯罪團伙檢測等幾類代表性的網(wǎng)吧非法運營行為進行分析研究,其他的網(wǎng)吧非法運營情況分析將會是將來的研究工作。

        結合了相關部門的實際需求以及初步調研,本文確定了以下四個可視分析任務,分別是:

        任務一,找出用于接納未成年人上網(wǎng)的成年人信息,并分析網(wǎng)吧未成年人上網(wǎng)接納情況。

        任務二,檢測在網(wǎng)吧上網(wǎng)的流動人口,并分析其行為特點。

        任務三,發(fā)現(xiàn)在網(wǎng)吧上網(wǎng)的青年犯罪團伙。

        任務四,對網(wǎng)吧主要上網(wǎng)人群進行用戶畫像。

        為了完成以上分析任務,本文提出了一套完整的、有效的可視化分析流程,能夠讓執(zhí)法部門從網(wǎng)吧上網(wǎng)登記數(shù)據(jù)中識別不同上網(wǎng)人群,分析上網(wǎng)人群的時空行為特征,進行網(wǎng)吧非法上網(wǎng)行為、團伙上網(wǎng)行為的有效檢測[2],該分析流程有助于提高執(zhí)法效率、維護社會治安,為打擊網(wǎng)吧非法運營行為領域提供了新的分析思路,該可視化分析流程的提出是本文的最大貢獻。

        1 可視化檢測分析流程

        網(wǎng)吧非法運營行為可視化檢測分析流程主要分為三個階段,第一階段進行數(shù)據(jù)預處理工作,第二階段根據(jù)問題需求進行可視化方案的設計與實現(xiàn),第三階段針對可視化結果進行分析總結。這三個階段是層層遞進的關系。

        2 數(shù)據(jù)預處理

        本文用到的數(shù)據(jù)是重慶市3000多個網(wǎng)吧的基本信息數(shù)據(jù)及2016年三個月約1600萬行上網(wǎng)記錄數(shù)據(jù),數(shù)據(jù)大小為1.7GB[2]。其中,網(wǎng)吧的基本信息數(shù)據(jù)是公安機關備案的網(wǎng)吧開業(yè)時的基本信息,包括網(wǎng)吧編號、名稱、地理位置信息(經(jīng)度、緯度)。網(wǎng)吧的上網(wǎng)記錄數(shù)據(jù)指客人來網(wǎng)吧上網(wǎng)時,網(wǎng)吧工作人員根據(jù)身份證等有效證件實名登記的上網(wǎng)人信息,包括上網(wǎng)人編號、網(wǎng)吧編號、姓名、性別、籍貫、出生日期、上線時間、下線時間。

        原始數(shù)據(jù)中存在一定的異常數(shù)據(jù),文章通過對網(wǎng)吧基本信息數(shù)據(jù),以及總上網(wǎng)記錄數(shù)據(jù)量12%(上網(wǎng)記錄數(shù)據(jù)分17個子文件,隨機抽取了兩個子文件)的數(shù)據(jù)進行初步分析,發(fā)現(xiàn)了四類主要異常情況,如表1所示。

        表1 數(shù)據(jù)異常類型表

        為了避免異常數(shù)據(jù)對分析結果的干擾,在數(shù)據(jù)預處理環(huán)節(jié)對表1的數(shù)據(jù)重復問題進行了去重處理;對外鍵缺失問題,通過兩張數(shù)據(jù)表的數(shù)據(jù)連接,去除缺失外鍵的數(shù)據(jù)項;對其余兩類問題數(shù)據(jù)進行了刪除整行錯誤數(shù)據(jù)的處理。

        為了增加數(shù)據(jù)的可解釋性、豐富語義,通過開源的全國行政區(qū)劃數(shù)據(jù)為原始數(shù)據(jù)增加籍貫地理信息屬性,即輸入網(wǎng)吧的位置經(jīng)緯度,通過數(shù)據(jù)庫連接全國行政區(qū)劃數(shù)據(jù)表,輸出該網(wǎng)吧所處省市名稱。

        預處理后的數(shù)據(jù)以CSV的格式存儲在MySQL[3]數(shù)據(jù)庫中。

        3 可視化方案設計與實現(xiàn)

        根據(jù)確定的四個可視分析任務來設計可視化方案,并基于 D3.js[4]、ECharts[5]、Leaflet[6]、Node.js[7]等技術進行方案實現(xiàn)。本文設計的可視化方案能清晰簡潔地解決四個可視分析任務所對應的問題,能幫助公安部門快速分析網(wǎng)吧運營行為,發(fā)現(xiàn)已有的和潛在的存在非法運營行為的網(wǎng)吧,是可視化技術在實際應用領域的一次良好運用。

        3.1 未成年人上網(wǎng)接納情況

        根據(jù)統(tǒng)計發(fā)現(xiàn),1600多萬條上網(wǎng)記錄中同一個上網(wǎng)人編號出現(xiàn)兩次及以上的人數(shù)共計190萬條,因此利用條件篩選得到非法網(wǎng)吧共計2289個,非法使用的成年人信息約86萬。本文通過散點地圖,日歷熱力圖與地區(qū)圖說明未成年人的上網(wǎng)接納情況。

        首先通過散點地圖呈現(xiàn)非法網(wǎng)吧的地理位置分布情況,如圖1所示,一個藍點表示一個非法網(wǎng)吧。點擊某一網(wǎng)吧顯示該網(wǎng)吧名稱以及所接納未成年人人數(shù)信息。從圖1中明顯看出非法網(wǎng)吧存在群聚現(xiàn)象,因此推斷該區(qū)域可能由于監(jiān)管不當導致未成年人上網(wǎng)現(xiàn)象泛濫。

        圖1 接納未成年人的網(wǎng)吧散點地圖

        日歷-熱力圖表示不同時間粒度(日,周,月)下所有網(wǎng)吧接收未成年人上網(wǎng)的人次情況,如圖2所示。方格表示具體的某一天,圓圈大小表示人次的多少,并且以顏色加深和波紋效果表示人次最多的12天。圖2表明在月粒度下,11月份未成年人上網(wǎng)次數(shù)較其他月份較多,推斷這一時期可能正值期中考試結束,學業(yè)壓力較小。

        圖2 所有網(wǎng)吧未成年人上網(wǎng)人次統(tǒng)計熱力圖

        最后通過地區(qū)圖展示所有非法成年人身份證信息歸屬地情況,如圖3所示,顏色深淺表示非法成年人身份證歸屬地人數(shù),餅圖表示男女比例。圖3顯示非法成年人身份證大多來自于重慶市的相鄰省份,例如四川省、湖南省。因此重慶市公安人員可以與相鄰省份合作,共同打擊網(wǎng)吧非法使用成年人信息的現(xiàn)象。

        圖3 非法使用的成年人籍貫信息地區(qū)圖

        3.2 流動人口行為特點

        流動人口是指籍貫不在給定城市的人。本文用到的網(wǎng)吧數(shù)據(jù)是重慶市的,重慶市的籍貫編號前兩位是50,因此將上網(wǎng)記錄信息表中上網(wǎng)人籍貫編號(AreaID)非50的上網(wǎng)人初步確定為流動人口。但是在得到初步數(shù)據(jù)之后,發(fā)現(xiàn)數(shù)據(jù)中仍然存在屬于重慶市的人口。按照國家制定的籍貫歸屬表,50代表重慶市,但是因為重慶市曾經(jīng)歸屬于四川省,籍貫編號為5102的人口也屬于重慶市人口。因此進一步將篩選條件修改為AreaID非50及非5102的上網(wǎng)人確定為流動人口。

        根據(jù)篩選條件(上網(wǎng)人籍貫編號非50以及非5102)獲得上網(wǎng)記錄信息表中流動人口列表,網(wǎng)吧中流動人口比例高達88%。通過地區(qū)圖,熱力圖與柱狀圖展示流動人口行為特點。

        首先以中國地區(qū)圖和各個省地區(qū)圖表示網(wǎng)吧流動人口數(shù)量,顏色深淺表示省或者市的流動人口數(shù)量。如圖4所示,流動人口的籍貫與地理位置,省自身經(jīng)濟發(fā)展狀況相關。例如湖北省、貴州省在地理上與重慶市的距離相差不大,但是貴州省的流動人口是湖北省的兩倍左右,因此可以推斷是因為貴州省發(fā)展相對緩慢閉塞,所以更多的人選擇外出打工。

        為了觀察流動人口的上網(wǎng)時段情況,本文選擇了柱狀圖,如圖5所示。橫軸表示一天的24個小時,縱軸表示對應的流動人口數(shù)量。從上網(wǎng)時段上來看,高峰期分別在11點與19點。由此推斷,部分流動人口可能存在失業(yè)或者工作時間不穩(wěn)定的情況,因此選擇中午上網(wǎng),然后大約在19點以后陸續(xù)離開網(wǎng)吧,開始工作。同時流動人口中也存在一般的上班族,主要是下班后進入網(wǎng)吧,從而解釋了柱狀圖中19點的頂峰現(xiàn)象。

        圖4 網(wǎng)吧流動人口籍貫信息地區(qū)圖

        圖5 上網(wǎng)時間段與上網(wǎng)人數(shù)柱狀圖

        最后通過熱力圖展示流動人口的上網(wǎng)時長與年齡特點,如圖6所示。其中橫軸表示上網(wǎng)時長,縱軸表示年齡,顏色深淺表示對應條件下的流動人口數(shù)量。圖6說明流動人口中18-35歲的人群是主力軍,大部分流動人口的上網(wǎng)時長集中在4-8小時,此外隨著年齡增大,上網(wǎng)人數(shù)也呈遞減趨勢。

        圖6 與上網(wǎng)時長、年齡相關的上網(wǎng)人數(shù)熱力圖

        3.3 社團發(fā)現(xiàn)

        《聯(lián)合國打擊跨國有組織犯罪公約》[8]將3人或多人視作一個團伙,因此本文將網(wǎng)吧中社團定義為人數(shù)超過兩人,且成員之間的上下線時間接近的集合。本文將上下線時間差小于5分鐘的上網(wǎng)記錄,人數(shù)大于2的集合確定為一個社團,并且通過可縮放的圓形打包圖表示網(wǎng)吧的社團分布情況,如圖7所示,其中最大圓表示一個網(wǎng)吧,次大圓聚集相同人數(shù)的社團,最小圓表示一個上網(wǎng)人。

        圖7 網(wǎng)吧社團可放縮圓形打包圖

        通過選取多個網(wǎng)吧查看其社團情況,發(fā)現(xiàn)單個社團人數(shù)一般不超過10人。網(wǎng)吧社團個數(shù)不定,個別網(wǎng)吧的社團個數(shù)偏多,可達200-300個,而且大型社團(8人以上)的個數(shù)比一般網(wǎng)吧多。進一步結合地圖發(fā)現(xiàn)此類網(wǎng)吧一般分布在網(wǎng)吧聚集程度較為密集的區(qū)域,可以推斷由于這些區(qū)域上網(wǎng)人數(shù)較多,因此更容易形成社團。

        3.4 網(wǎng)吧用戶畫像

        主要針對三類代表性網(wǎng)吧用戶描述其用戶畫像:未成年人、流動人口及網(wǎng)吧社團。網(wǎng)吧未成年人具有地理傾向性和上網(wǎng)時間周期性。根據(jù)接納未成年人的網(wǎng)吧群聚現(xiàn)象推斷未成年人是有選擇行的去某一區(qū)域上網(wǎng);在上網(wǎng)時間周期性上,未成人上網(wǎng)的高峰時期是節(jié)假日、正常教學周的休息日以及考試剛結束時期。流動人口在網(wǎng)吧上網(wǎng)總人數(shù)所占比例高達88%,大多來自于鄰接省市,并且呈現(xiàn)低齡性,多為18-35歲的青壯年。流動人口具有上網(wǎng)時間周期性,主要集中在中午11點及晚上18點之后,且平均時長為4-5小時。網(wǎng)吧社團以3-4人的社團最為常見,其人數(shù)與地域也存在一定關系,總數(shù)超過5人以上的社團所在的網(wǎng)吧一般存在于網(wǎng)吧分布較密集的區(qū)域。

        4 結語

        根據(jù)本文所設計及實現(xiàn)的可視化分析方案,在非法網(wǎng)吧搜尋與整治方面,可以通過網(wǎng)吧散點地圖找出網(wǎng)吧密集區(qū)域,對大量網(wǎng)吧群聚區(qū)域進行重點治理。此外,還可以根據(jù)未成年人上網(wǎng)行為特征,對未成年人上網(wǎng)集中時段做針對性監(jiān)管等。流動人口是犯罪的高發(fā)人群,通過流動人口的上網(wǎng)時間特性可以幫助公安集中關注并嚴格審查流動人口較為密集的、流動人口出現(xiàn)的高峰時段。并且建議重點關注18-25歲的上網(wǎng)人群。在網(wǎng)吧犯罪團伙刑偵與預防方面,建議定期檢查整治網(wǎng)吧密集區(qū)域,預防大型犯罪團伙的形成;同時建議結合上網(wǎng)上下線時間和籍貫信息綜合判斷3-4人社團中的犯罪團伙難度。

        本文基于可視化對網(wǎng)吧上網(wǎng)記錄進行分析,提出了一套系統(tǒng)性的可視化檢測分析網(wǎng)吧非法運營行為的處理流程,能有效提高公安部門查處非法網(wǎng)吧的執(zhí)法效率,也能進一步分析前往網(wǎng)吧上網(wǎng)的未成年人、流動人口及青年犯罪團伙的時空行為特征,具有較大實際意義。

        猜你喜歡
        可視化分析信息
        基于CiteSpace的足三里穴研究可視化分析
        基于Power BI的油田注水運行動態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        隱蔽失效適航要求符合性驗證分析
        基于CGAL和OpenGL的海底地形三維可視化
        “融評”:黨媒評論的可視化創(chuàng)新
        傳媒評論(2019年4期)2019-07-13 05:49:14
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        健康信息
        祝您健康(1987年3期)1987-12-30 09:52:32
        日韩av无码社区一区二区三区| 麻豆AV无码久久精品蜜桃久久| 国产精品久久夜伦鲁鲁| 久久综合国产精品一区二区| 日产精品久久久一区二区| 91精品国产色综合久久| 成人午夜特黄aaaaa片男男| 婷婷开心深爱五月天播播| 40分钟永久免费又黄又粗| 精品一区二区三区人妻久久福利| 国产专区一线二线三线码| 正在播放国产对白孕妇作爱| 精品一区二区三区影片| 激情都市亚洲一区二区| 亚洲av无码专区亚洲av网站| 久久久精品久久日韩一区综合| 久久精品综合国产二区| 亚洲色图专区在线视频| 亚洲妇女无套内射精| 国产午夜在线观看视频播放| av天堂一区二区三区| 久久久精品久久久久久96| 国产精品久久久久影院嫩草| 国产精品视频免费的| 丝袜美腿诱惑区在线播放| 国产大片黄在线观看| 人禽无码视频在线观看| 国产美女自拍国语对白| 亚洲国产色婷婷久久精品| 久久精品黄aa片一区二区三区| 精品免费福利视频| 精品一区二区三区老熟女少妇| 国产大屁股视频免费区| 亚洲色大网站www永久网站| 中文字幕日韩人妻高清在线| 日本一区二区视频在线| 国产无遮挡又黄又爽在线观看 | 成人免费va视频| 五月激情在线观看视频| 国产成人av在线免播放观看新| 初尝黑人嗷嗷叫中文字幕|