亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)關(guān)聯(lián)背景下芝加哥市一般盜竊案件的多維度分析

        2018-09-13 04:34:04朱小波葉信岳
        犯罪研究 2018年4期
        關(guān)鍵詞:案發(fā)盜竊案維度

        朱小波 李 昕 葉信岳

        一、引言

        近年來,無論是理論界還是警方、政府等犯罪治理部門對盜竊犯罪都進(jìn)行了詳細(xì)的研究和深入的探討。在國內(nèi)學(xué)界,以中國人民公安大學(xué)為代表的諸多研究團(tuán)隊(duì)長期致力于從犯罪地理、犯罪時(shí)空的角度對犯罪熱點(diǎn)識別、成因分析、熱點(diǎn)轉(zhuǎn)移以及犯罪預(yù)測進(jìn)行研究。①陸娟、湯國安、張宏等:《犯罪熱點(diǎn)時(shí)空分布研究方法綜述》,載《地理科學(xué)進(jìn)展》2012年第4期。在一線實(shí)戰(zhàn)單位,各地公安部門陸續(xù)開展了以“智慧警務(wù)”、“數(shù)據(jù)警務(wù)”為引領(lǐng)的警務(wù)革新項(xiàng)目,以期在大數(shù)據(jù)時(shí)代,通過海量犯罪數(shù)據(jù)挖掘、分析,優(yōu)化警力布置,精確治理犯罪。在國外,早在20世紀(jì)初,美國芝加哥大學(xué)的社會學(xué)者M(jìn)cKay等針對芝加哥城市犯罪區(qū)位特征進(jìn)行研究,并深入分析了環(huán)境特征與犯罪率的關(guān)系。②Wim Bernasco and Richard Block,“Robberies in Chicago: A Block-Level Analysis of the Influence of Crime Generators,Crime Attractors, and Offender Anchor Points”,Journal of Research in Crime and Delinquency,2011,48(1),PP.33-57.近年來,以地點(diǎn)警務(wù)創(chuàng)始人戴維·韋斯伯德(David L. Weisburd)為代表的學(xué)者們一直關(guān)注街區(qū)等地理微觀因素在解釋犯罪中的作用。最近,該團(tuán)隊(duì)在華盛頓州西雅圖進(jìn)行的一項(xiàng)關(guān)于犯罪集中程度的縱向研究中發(fā)現(xiàn),該市每年50%以上的犯罪事件都集中在5%至6%的街道上。因此,注重犯罪的微地點(diǎn)(Micro places)能使警方的預(yù)防犯罪工作起到事半功倍的效果。

        另一方面,我們也應(yīng)看到,盜竊犯罪是一項(xiàng)十分復(fù)雜的犯罪形式。目前,從理論方面解釋受害的日常活動理論、③吳宗憲:《西方犯罪學(xué)》,法律出版社2006年版,第14頁。剖析犯罪嫌疑人的理性選擇理論以及與犯罪情境相關(guān)的一些理論,①J.J.Turanovic,M.D.Reisig,“Risky lifestyles, low self-control, and violent victimization across gendered pathways to crime”,Journal of Quantitative Criminology,2015, 31(2),PP.183-206.顯然還不足以對盜竊犯罪做全面的剖析。在實(shí)證方面,目前對竊案發(fā)生的社會原因探討較多,但對各類影響因素的實(shí)證考量,尤其是對城市近年來的大數(shù)據(jù)量的盜竊樣本進(jìn)行多維度分析、數(shù)據(jù)關(guān)聯(lián)檢驗(yàn)的研究較少。②柳林、張春霞、馮嘉欣等:《.ZG市詐騙犯罪的時(shí)空分布與影響因素》,載《地理學(xué)報(bào)》2017年第2期。加之犯罪數(shù)據(jù)較難獲取,目前對于盜竊犯罪的實(shí)證分析研究只能在有限的范圍內(nèi)進(jìn)行開展。因此,相對來說研究的深度還有待提高。

        由此,本文選取美國芝加哥市2015年1月1日至2017年12月31日接報(bào)的一般盜竊③根據(jù)2016年美國聯(lián)邦調(diào)查局發(fā)布的《統(tǒng)一犯罪報(bào)告》(Uniform Crime Reports)的定義,theft意為為非法占有、攜帶、剝奪他人實(shí)際占有或推定占有的財(cái)產(chǎn)的行為。例如自行車、汽車零件和配件盜竊,入店行竊(shoplifting)、扒竊(pocket-picking)或是并非通過暴力、強(qiáng)迫、欺詐手段獲取他人財(cái)物的行為。預(yù)謀盜竊(attempted larcenies)也包括在內(nèi),而盜用(embezzlement)、偽造(forgery)、支票欺詐(check fraud)等被排除在外。警情為研究樣本,首先從時(shí)間的月、周、小時(shí)和空間的道路維度對該市的竊案報(bào)警進(jìn)行總體分析,在關(guān)聯(lián)相關(guān)數(shù)據(jù)后,得出總體的時(shí)間和空間特征。第二步,在盜竊案件發(fā)生的具體位置這一維度進(jìn)行數(shù)據(jù)深入挖掘、分別得出發(fā)生在街面(Street)、別墅(Residence)、公寓(Apartment)的三種多發(fā)性竊案的高發(fā)時(shí)間、空間特征并甄別其異同性。最后,在人口普查區(qū)尺度上,嘗試找出影響盜竊案發(fā)生的因素,力求從多維視角“透視”竊案背后隱藏的“秘密”,同時(shí)也為我國大城市的盜竊犯罪治理提供借鑒。即本文旨在解決三個(gè)問題:(1)芝加哥市一般盜竊報(bào)案總體時(shí)間分布和空間聚集性展示與檢驗(yàn);(2)確定三種多發(fā)性竊案的高發(fā)時(shí)間、空間特征、案值大小和高發(fā)警務(wù)區(qū);(3)分析一般盜竊案件發(fā)生的“強(qiáng)關(guān)聯(lián)”因素。

        二、研究區(qū)域概況

        芝加哥市位于美國伊利諾伊州的庫克縣,毗鄰五大湖之一的密歇根湖,是美國僅次于紐約市和洛杉磯的第三大城市。芝加哥南北長40.23公里、東西寬24.14公里,陸地面積約為588.3平方公里。人們習(xí)慣上將其分為北部、中部和南部三個(gè)部分。

        數(shù)據(jù)顯示,2017年芝加哥市警察局共接報(bào)118231起報(bào)警,其中暴力案件30154起(主要包括:謀殺、搶劫、強(qiáng)奸、攻擊他人),財(cái)產(chǎn)類案件88077起(主要包括:入室盜竊、一般盜竊、盜竊機(jī)動車)。財(cái)產(chǎn)案件幾乎是暴力案件的三倍。其中又以一般盜竊案件(Theft)接報(bào)數(shù)最多63949件,占財(cái)產(chǎn)案件的72.6%,總報(bào)警量的54%。同期紐約市的該類案件接報(bào)量為107589件,洛杉磯市接報(bào)66091件,全美該類案件接報(bào)總數(shù)為5638455。對比芝加哥市的人口為2704958人,紐約市人口8537552人,洛杉磯總?cè)丝?976322人,美國的總?cè)丝跒?23127513人④表一的數(shù)據(jù)均來自于United states census網(wǎng)站。。計(jì)算得出,芝加哥居民每一千人中成為盜竊案受害者的指數(shù)為23.64,洛杉磯為16.62,紐約為12.6,而全美的平均指數(shù)為17.44。再對比芝加哥市(陸地)面積606平方公里,紐約市(陸地)面積789平方公里,洛杉磯市(陸地)面積1290平方公里,得出芝加哥每平方千米發(fā)生一般盜竊案件的指數(shù)為 105.5,洛杉磯為 51.23,紐約為136.3 ,美國平均僅為0.6。

        表1 美國三大城市2017年一般盜竊案件案發(fā)情況

        通過上表可以清晰的看出,芝加哥市是三個(gè)城市中的面積最小、人口最少的城市,但每千人受害指數(shù)卻最高,接近紐約的兩倍,并且其每平方千米的竊案發(fā)生率位居第二,達(dá)到了洛杉磯的兩倍之多,盜竊案件居高不下,安全形勢不容樂觀。

        三、主要數(shù)據(jù)與研究方法

        (一)數(shù)據(jù)來源和相關(guān)說明

        本文運(yùn)用的犯罪數(shù)據(jù)來源于芝加哥市警察局的CLEAR系統(tǒng)(Citizen Law Enforcement Analysis and Reporting,即公民執(zhí)法分析和報(bào)告系統(tǒng))。為了保護(hù)犯罪受害人的隱私,地址只在道路(Street)級別顯示,具體門牌號位置不做確定。該數(shù)據(jù)集包括了 2015年 1月1日至2017年12月31日美國伊利諾伊州芝加哥市警察局接報(bào)的所有犯罪事件,內(nèi)容包括案件編號(ID)、案由(Primary Type)、對應(yīng)警務(wù)區(qū)(Beat)、案件坐標(biāo)(longitude latitude)等22個(gè)字段。其中案由字段包括販賣人口(human trafficking )、阻礙執(zhí)法(interference with public officer)、恐嚇(intimidation)等共30種罪名。本文抽取字段名為“theft”即一般盜竊的數(shù)據(jù),總量為182673條。(在美國警方的數(shù)據(jù)統(tǒng)計(jì)中,普遍將一般盜竊犯罪歸為除了入室盜竊(Burglary)和機(jī)動車盜竊(Motor Vehicle Theft)之外的所有盜竊。)經(jīng)過數(shù)據(jù)清洗,去除無法獲取經(jīng)緯度坐標(biāo)和撤銷報(bào)警的數(shù)據(jù),最終得到 176508條。通過Arcgis軟件,對每條一般盜竊案的報(bào)警數(shù)據(jù)通過經(jīng)緯度實(shí)現(xiàn)自動落點(diǎn)。

        研究中的其他數(shù)據(jù)主要包括芝加哥市各人口統(tǒng)計(jì)區(qū)的黑人數(shù)、白人數(shù)、亞裔數(shù)、總?cè)丝跀?shù)、單親家庭數(shù)、房價(jià)、貧困率、房屋新建(改建)許可頒證數(shù)等均來自于美國國家統(tǒng)計(jì)局的官方數(shù)據(jù),且也都在人口統(tǒng)計(jì)區(qū)級別進(jìn)行收集。

        (二)研究方法

        1.數(shù)據(jù)可視化:

        為了清晰的表達(dá)數(shù)據(jù),本文首先采用數(shù)據(jù)可視化的方法。第一步,將所有數(shù)據(jù)進(jìn)行匯總,然后運(yùn)用基于JavaScript的Cross filter組件進(jìn)行動態(tài)數(shù)據(jù)過濾,并采用dc.js進(jìn)行可視化展示。

        如圖1所示,左側(cè)為基于Leaflet的芝加哥一般盜竊案的熱度圖,根據(jù)犯罪地點(diǎn)的經(jīng)緯度坐標(biāo)進(jìn)行自動匯集,數(shù)量從高到低依次按照紅、黃、綠進(jìn)行可視化顯示。中間為所有案發(fā)道路的犯罪數(shù)量橫向柱狀圖,并按照數(shù)量從多到少進(jìn)行排序。右側(cè)上方為一般盜竊案的數(shù)據(jù)總量。右側(cè)下方用餅狀圖分別展現(xiàn)了Description(案情描述),Location(案發(fā)位置),District(警察分局)和Beat(警務(wù)巡邏區(qū))的犯罪數(shù)量對比。其中柱狀圖和餅狀圖采用dc.js的可視化展現(xiàn)方式,可進(jìn)行實(shí)時(shí)交互,用戶可以選取其中的任意一項(xiàng)或多項(xiàng),通過Cross filter組件進(jìn)行數(shù)據(jù)過濾并聯(lián)動展示。例如,點(diǎn)擊Location中的Street就可以同時(shí)顯示與街面盜竊案相關(guān)的案情描述、高發(fā)警察分局和警務(wù)巡邏區(qū)。犯罪時(shí)間統(tǒng)計(jì)則采用移動窗口的方式進(jìn)行時(shí)間范圍的數(shù)據(jù)過濾。

        圖1 芝加哥市一般盜竊案件可視化分析界面

        2.隨機(jī)森林回歸算法

        隨機(jī)森林回歸算法是 Breiman(2001)提出的基于決策樹分類器的融合算法,其基本思想是基于統(tǒng)計(jì)學(xué)理論,利用 Bootstrap重抽樣方法從原始樣本中抽取多個(gè)樣本,對每個(gè)Bootstrap 樣本構(gòu)建決策樹,然后將所有決策樹預(yù)測平均值作為最終預(yù)測結(jié)果。①王雨晨、過仲陽、王媛媛:《基于隨機(jī)森林的犯罪風(fēng)險(xiǎn)預(yù)測模型研究》,載《華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版)》2017年第4期。隨機(jī)森林回歸可以看成是由很多弱預(yù)測器(決策樹) 集成的強(qiáng)預(yù)測器。該算法在運(yùn)算量沒有顯著提高的前提下提高了預(yù)測精度,對多元共線性不敏感,可以很好地預(yù)測多達(dá)幾千個(gè)解釋變量的作用,被稱為當(dāng)前最好的算法之一。本文采用 Python語言作為模型運(yùn)行的平臺。

        四、芝加哥市一般盜竊案件的多維度分析

        (一)一般盜竊案件的總體時(shí)空分布檢驗(yàn)

        1.時(shí)間特征

        (1)按月度劃分(圖2):通過芝加哥市2015-2017年的一般盜竊犯罪報(bào)案折線圖,可以看出明顯的規(guī)律性特征。每年的二月都是盜竊犯罪的最低谷,隨后從三月開始發(fā)案就呈初步上升趨勢,這一趨勢一直持續(xù)到八月達(dá)到峰值,隨后從九月開始,開始逐步回落。

        圖2 芝加哥市2015-2017年的一般盜竊犯罪報(bào)案月度折線圖

        (2)按星期維度劃分(圖3),周一到周日的案發(fā)總量分布較為平均,未見明顯的差異性。

        (3)按小時(shí)維度劃分(圖3),呈“中間高兩端低”的金字塔型,該類報(bào)警一般是從8時(shí)開始上升,一直到12時(shí),隨后12-18時(shí),報(bào)警數(shù)量呈高發(fā)趨勢,持續(xù)在全天的最高位運(yùn)行,即下午時(shí)段為一般盜竊案最高發(fā)的時(shí)間段。從20時(shí)至次日凌晨6時(shí),報(bào)案量又開始逐步下降。

        圖3 芝加哥市2015-2017年的一般盜竊犯罪報(bào)案周、小時(shí)案發(fā)圖

        (二)空間特征

        (1)街道維度:在全部的176654件盜竊案件報(bào)警中,報(bào)案量前六位的街道分別是:N MICHIGAN AVE(密歇根北大道,3585件)、N STATE ST(州北街3518件)、N CLARK ST(克拉克北街,2771件)、W NORTH AVE(西北大道,2689件)、S STATE ST(州南街,2665件)、S MICHIGAN AVE(密歇根南大道,2149件),總計(jì)17377件,占全部盜竊報(bào)案量的9.84%。如果將N MICHIGAN AVE和S MICHIGAN AVE,N STATE ST和S STATE ST看成一條道路的話,那么芝加哥市的竊案高發(fā)區(qū)域就非常明確的集中在上述四條道路上。N MICHIGAN AVE和一街之隔的N STATE ST都處于整個(gè)城市的最核心,是芝加哥市最著名的高層購物中心,百貨商場、高級餐廳的聚集地。密歇根北大道的其中一段從 Oak street到芝加哥河,被譽(yù)為“Magnificent Mile”(華麗一英里)。而克拉克北街則長達(dá)13公里,擁有眾多的歷史景點(diǎn)、各式餐館和兩個(gè)球隊(duì)主場,在最南端又背靠著名的林肯公園。可以想見,每天如織的人潮和貨物的進(jìn)出,繁榮了經(jīng)濟(jì)的同時(shí)也帶來了大量的竊案。

        (2)警方維度:對應(yīng)案發(fā)最高的是第一分局(接報(bào) 19235件)和第十八分局(接報(bào)18103件),最高的巡邏區(qū)是1834號巡邏區(qū)域(3915件),1833號巡邏區(qū)域(2597件)。

        圖4 芝加哥市一般盜竊案件空間分布熱力圖(截取案發(fā)量最高的前六位街道顯示)

        (二)三種具體多發(fā)性盜竊犯罪的時(shí)空分布檢驗(yàn)

        在微觀層面,通過數(shù)據(jù)關(guān)聯(lián),本文根據(jù)竊案報(bào)警數(shù)量,篩選出案發(fā)前三位的主要位置(Location)分別為街面(Street)、別墅(Residence即House)、公寓(Apartment)的案案件逐一進(jìn)行深入挖掘分析。

        1.發(fā)生在街面的盜竊案件報(bào)警量為44867件,占一般盜竊案件總量的25.4%。經(jīng)過數(shù)據(jù)關(guān)聯(lián)發(fā)現(xiàn),街面盜竊案件的案值在500美金及以下的占27646件,占61.6%,500美金及以上的占15753件,占35.1%。因此,從整體上講,街面案件的案值普遍不高。再聚焦到街道發(fā)現(xiàn),該類報(bào)警最高的是N MILWAUKEE AVE(密爾沃基北大道,615件)。該大道是僅次于MICHIGAN AVE的商業(yè)街,坐落著琳瑯滿目的服裝、禮品和精品店。另一方面,地鐵藍(lán)線(Blue line,從奧黑爾國際機(jī)場始發(fā)經(jīng)市中心到福利斯特公園)也是沿該大道走向。由此可知,在地鐵和商業(yè)的為城市帶來了大量的人流,同樣也很可能成為盜竊分子首選的作案地。其次的四條街道:N CLARK ST、W NORTH AVE、S MICHIGAN AVE和S Doctor Martin Luther King Junior Drive(馬丁路德金南路)。對應(yīng)案發(fā)最高的警務(wù)區(qū)是十四分局(接報(bào)791件)和十八分局(接報(bào)456件),案發(fā)最高的巡邏區(qū)是1424號(1004件)。

        在時(shí)間維度上:①年度特征:每年二月和十二月一般都是發(fā)案的低谷期,同時(shí)四月之后一直到十月的春、夏、秋季普遍多發(fā)。②周維度分布相當(dāng)平均,周一到周日案發(fā)相差無幾。③小時(shí)維度就可以看出端倪,該類案件一般從下午14時(shí)開始上升一直到18時(shí)達(dá)到高峰,并且這一趨勢一直延續(xù)到22時(shí),隨后才逐漸下降。因此,從三年的數(shù)據(jù)可以非常明顯的看出每天的18時(shí)-22時(shí)(傍晚至上半夜)是街面盜竊案件高發(fā)時(shí)段。注意,這一點(diǎn)與前述分析的一般盜竊案發(fā)的整體時(shí)間趨勢有所不同。

        2.發(fā)生在別墅的盜竊案件報(bào)警量為13018件,占總量的7.4%,經(jīng)過數(shù)據(jù)關(guān)聯(lián)發(fā)現(xiàn),案值在500美金及以下的為5928件,占45.5%,500美金以上的有3365件,占25.9%,其余案值不詳。因此,別墅盜竊案有將近一半在500美金以下,情況與街面盜竊案件類似,案值較低。關(guān)聯(lián)到具體街道顯示,案發(fā)前五位的街道S Doctor Martin Luther King Junior Drive、S MICHIGAN AVE(密歇根南大道)、S INDIANA AVE(印第安納南大道)、S WABASH AVE(瓦巴什南大道)以及S EMERALD AVE(艾姆萊德南大道),全部處在南區(qū)。眾所周知,芝加哥的南區(qū)是美國最大,也是最為危險(xiǎn)的貧民窟之一,95%以上居住的是芝加哥最為窮困的少數(shù)族裔,尤其以非裔美國人為主。該區(qū)域還建設(shè)許多Public House(即保障房或是公租房),通常分配給位居社會最底層,無力承擔(dān)住房費(fèi)用的窮苦民眾乃至乞丐居住。由于住戶經(jīng)濟(jì)條件原因,治安通常十分?jǐn)?,甚至淪為犯罪窩點(diǎn)。對應(yīng)案發(fā)最高的警務(wù)區(qū)是分局是第七分局(接報(bào)1023件)和第八分局(接報(bào)966件),案發(fā)最高的警務(wù)巡邏區(qū)是512號巡邏區(qū)域(160件)。

        在時(shí)間維度上:①年度特征:每年十月之前的八、九月會有一波小高峰。②周維度分布也基本是平均分布,周一到周日案發(fā)相差無幾。③小時(shí)維度上,每天的9-10、12-14時(shí)兩個(gè)時(shí)間段案發(fā)量非常高。這一點(diǎn)尤為明顯,值得警方加以關(guān)注。

        3.發(fā)生在公寓的盜竊案件報(bào)警量為10440件,占總量的5.9%。通過運(yùn)用同樣的方法,發(fā)現(xiàn)公寓盜竊案件的案值在500美金及以下的為4697件,占45%,500美金以上的有2443件,占 23.4%。案值情況與前面兩類案件如出一轍。另外,同樣的方法獲取案發(fā)前五位的街道分別是:S DR MARTIN LUTHER KING JR、N SHERIDAN RD(謝里單北路)、S MICHIGAN AVE 、S INDIANA AVE 、S SOUTH SHORE DR(南岸南路)。由此可見,除謝里單北路之外,其余的又都位于南區(qū),而且 S DR MARTIN LUTHER KING JR、S MICHIGAN AVE和 S INDIANA AVE這三條街又重復(fù)出現(xiàn),說明該地區(qū)的竊案情況已經(jīng)相當(dāng)糟糕,應(yīng)當(dāng)引起當(dāng)?shù)鼐胶驼淖銐蛑匾?。對?yīng)案發(fā)最高的警務(wù)區(qū)是第三分局(接報(bào)851件)和第六分局(接報(bào)793件),案發(fā)最高的警務(wù)巡邏區(qū)是421號巡邏區(qū)域(187件)。

        在時(shí)間維度上:①年度特征:在每年的夏季七、八月份是該類盜竊案的高發(fā)月份,臨近圣誕的十二月也需要注意。②周維度分布也基本是平均分布。③小時(shí)維度上的案發(fā)呈“白天多、夜間少”的趨勢,每天的8-18時(shí)段要明顯高于20-24的時(shí)間段,其中9-10、12-13時(shí)為一天中公寓盜竊案發(fā)最高的兩個(gè)時(shí)段。由此可見,竊賊都明顯有等住客離家上班后,實(shí)施盜竊的意圖。

        此外,以上三種多發(fā)性的盜竊案有一個(gè)非常明顯的共同特征就是在凌晨時(shí)段22時(shí)-次日9時(shí)左右案發(fā)量是一天中最低。

        五、一般盜竊犯罪的影響因素分析

        (一)指標(biāo)選取

        目前大多數(shù)對于美國犯罪問題的研究普遍采用的解釋變量為貧困率,單親家庭數(shù),房價(jià)中位數(shù)、人種、就業(yè)率、本科學(xué)位獲得率等等。①Yan Zhang, Jihong Zhao, Ling Ren, Larry Hoover,“Space–Time Clustering of Crime Events and Neighborhood Characteristics in Houston”,Criminal Justice Review,2015,40(3),PP.341-356.但本文在考慮上述因素的同時(shí),將芝加哥市房屋管理局的住房新建(改建)許可數(shù)據(jù)也作為解釋變量加入其中,檢驗(yàn)其對一般盜竊案發(fā)的影響程度。

        (二)模型選擇

        借助SPSS軟件對因變量(一般盜竊案發(fā)數(shù))進(jìn)行正態(tài)性檢驗(yàn)(用Shapiro-Wilk檢驗(yàn)),發(fā)現(xiàn)處于離散分布狀態(tài),不服從正態(tài)分布,且標(biāo)準(zhǔn)化殘差過于集中。因此,該數(shù)據(jù)并不適用多元線性回歸模型。隨后,考慮Poisson回歸模型和負(fù)二項(xiàng)回歸模型進(jìn)行分析,但是擬合效果均不理想。最后,本文嘗試運(yùn)用 Python3.6軟件構(gòu)建隨機(jī)森林回歸算法進(jìn)行解釋。

        (三)模型訓(xùn)練與測試

        1.數(shù)據(jù)預(yù)處理

        考慮到房價(jià)、貧困率、犯罪數(shù)等變量的數(shù)值差距較大而且單位不同,因此考慮將其轉(zhuǎn)化為無量綱的純數(shù)值,便于不同量綱或者量級的指標(biāo)能夠進(jìn)行比較和加權(quán)。本文采用z-score標(biāo)準(zhǔn)化方法進(jìn)行數(shù)據(jù)預(yù)處理。z-score標(biāo)準(zhǔn)化:標(biāo)準(zhǔn)分?jǐn)?shù)(standard score)也叫z分?jǐn)?shù)(z-score),是一個(gè)分?jǐn)?shù)與平均數(shù)的差再除以標(biāo)準(zhǔn)差的過程。其公式表示為:

        2.特征選擇

        根據(jù)隨機(jī)森林自帶的特征選擇算法,得到八個(gè)影響因子及其估計(jì)結(jié)果(表3)。

        表3 隨機(jī)森林模型估計(jì)結(jié)果

        結(jié)果顯示:新建、改建房屋許可證數(shù)與房價(jià)中位數(shù)對一般盜竊犯罪的影響程度較大,其中新建、改建房屋許可證數(shù)對一般盜竊案發(fā)數(shù)影響程度達(dá)到了0.628,這可以理解為政府每頒發(fā)一張新建、改建房屋許可證,就有62.8%的可能發(fā)生一起盜竊案件。這一關(guān)系背后的深意尤其值得我們注意。眾所周知,一個(gè)地域的新建、改建房屋許可是該地區(qū)經(jīng)濟(jì)活力的直接反映。結(jié)合前文對該市一般盜竊案空間聚集的檢驗(yàn),市中心最繁華的“華麗一公里”密歇根大道是一般盜竊案發(fā)案最高的區(qū)域,與此同時(shí),2017年政府在區(qū)域共頒發(fā)了736張新建、改建房屋許可證,冠絕整個(gè)芝加哥市。因此,足可見該地區(qū)的經(jīng)濟(jì)活力之強(qiáng),并且隨之而來的人流、物流、車流也都為竊案提供了可乘之機(jī)。在結(jié)合房價(jià)的影響程度來看,對于盜竊這類典型的侵財(cái)類案件來說,“經(jīng)濟(jì)因素”無疑還是犯罪嫌疑人首要考量的對象。與之形成鮮明的對比的是,總?cè)丝?、貧困率、各人種數(shù)對一般盜竊犯罪的影響并不大。

        (四)回歸結(jié)果評估

        在本次算法測試過程中,隨機(jī)抽取80%的犯罪數(shù)據(jù)作為訓(xùn)練集,另外20%作為測試集。訓(xùn)練集用于訓(xùn)練分類模型,測試集用于評估模型的好壞。訓(xùn)練集的作用是用來擬合模型,通過設(shè)置分類器的參數(shù),訓(xùn)練分類模型并擬合出多個(gè)分類器得出最優(yōu)模型后,最后通過測試集進(jìn)行模型性能評價(jià),以此來衡量該最優(yōu)模型的性能和分類能力。即可以把測試集當(dāng)做從來不存在的數(shù)據(jù)集,當(dāng)已經(jīng)確定模型參數(shù)后,使用測試集進(jìn)行模型性能檢驗(yàn)。

        因此,根據(jù)訓(xùn)練好的隨機(jī)森林算法模型,對20%的測試集進(jìn)行測試,得到如下結(jié)果:

        (1)MSE是預(yù)測數(shù)據(jù)和原始數(shù)據(jù)對應(yīng)點(diǎn)誤差的平方和的均值,計(jì)算公式如下:

        通過計(jì)算的出該模型的MSE(均方差)=0.215

        (2)RMSE(均方根誤差),也叫回歸系統(tǒng)的擬合標(biāo)準(zhǔn)差,是MSE的平方根,計(jì)算公式如下:

        通過計(jì)算的出該模型的RMSE(均方根誤差)=0.4637

        (3)R-square(確定系數(shù)),計(jì)算公式如下:

        “確定系數(shù)”是通過數(shù)據(jù)的變化來表征一個(gè)擬合的好壞,其正常取值范圍為[0,1],越接近1,表明方程的變量對y的解釋能力越強(qiáng)。本文模型的R2(確定系數(shù))= 0.7199,擬合度較高,說明該模型解釋度較好。并且由圖5、6可以看出,該模型的可靠性較高。

        圖5 隨機(jī)森林模型算法真實(shí)值與預(yù)測值對比

        橫軸:表示從801個(gè)人口統(tǒng)計(jì)區(qū)內(nèi),抽取的20%即160個(gè)人口統(tǒng)計(jì)區(qū)的相關(guān)數(shù)據(jù)作為測試集??v軸:考慮到因變量一般盜竊犯罪數(shù)的數(shù)值(最小值為2起,最大值5597起)分布情況,因此本文對一般盜竊犯罪數(shù)即縱軸取對數(shù)處理,使之范圍在0-10內(nèi),這樣也利于作圖表達(dá)。

        圖6 誤差分布

        橫軸:表示從801個(gè)人口統(tǒng)計(jì)區(qū)內(nèi),抽取的20%即160個(gè)人口統(tǒng)計(jì)區(qū)的相關(guān)數(shù)據(jù)作為測試集??v軸即誤差(真實(shí)值減去預(yù)測值的絕對值),越接近于0表示越結(jié)果越穩(wěn)定,預(yù)測效果越好。從圖中可以看出,除了第90個(gè)到100個(gè)測試數(shù)據(jù)中有個(gè)別誤差較大外,其余數(shù)據(jù)均小于1,結(jié)果較好。

        六、結(jié)論

        本文以美國三大城市中安全形勢最嚴(yán)峻的芝加哥市為例,綜合運(yùn)用數(shù)據(jù)可視化、數(shù)據(jù)關(guān)聯(lián)等技術(shù)對該市2015-2017年的17余萬條一般盜竊數(shù)據(jù)進(jìn)行過濾和制圖表達(dá),并同時(shí)進(jìn)行了數(shù)據(jù)聯(lián)動展示,分析其時(shí)空分布特征。

        時(shí)間特征:每年的二月都是盜竊犯罪的最低谷,隨著天氣轉(zhuǎn)暖,從三月開始發(fā)案就呈初步上升趨勢,這一趨勢一直持續(xù)到八月達(dá)到峰值,隨后從九月開始,開始逐步回落。周一到周日的案發(fā)總量分布較為平均,未見明顯的差異性。每天的12-20時(shí)是一天中的發(fā)案最高峰,需嚴(yán)加注意。

        空間特征:該類案件呈現(xiàn)出在市中心“華麗一公里”區(qū)域內(nèi)的高度聚集。再深挖一步,對三種微觀類型的多發(fā)性盜竊案件,即街面盜竊、別墅盜竊和公寓盜竊進(jìn)行聚焦,挖掘其共性和特性。最后,通過隨機(jī)森林回歸算法建模分析得出新建、改建房屋許可證數(shù)與房價(jià)中位數(shù)對一般盜竊犯罪的影響程度較大,而傳統(tǒng)意義上我們認(rèn)為的“影響因素”總?cè)丝凇⒇毨?、各人種數(shù)等反而對一般盜竊犯罪的影響并不大。

        本文的研究僅僅是一次有益嘗試,目前還處在探索階段,需要在后續(xù)研究中不斷進(jìn)行深化與探索。例如,考慮到空間異質(zhì)性問題和自相關(guān)性的問題,在今后的深入研究中還將引入地理加權(quán)回歸模型或者空間滯后模型等空間分析技術(shù),力求最終的分析和建模更加精確。

        猜你喜歡
        案發(fā)盜竊案維度
        蹊蹺的盜竊案
        名畫盜竊案
        雨夜盜竊案
        快樂語文(2021年35期)2022-01-18 06:05:40
        淺論詩中“史”識的四個(gè)維度
        中華詩詞(2019年7期)2019-11-25 01:43:00
        錄下的證據(jù)
        俄前特工中毒案案發(fā)地發(fā)現(xiàn)神經(jīng)毒氣
        喇叭盜竊案
        光的維度
        燈與照明(2016年4期)2016-06-05 09:01:45
        “五個(gè)維度”解有機(jī)化學(xué)推斷題
        關(guān)于詐騙罪的幾點(diǎn)釋義
        日本在线免费不卡一区二区三区| 在线精品免费观看| 国内精品久久久久国产盗摄| 精品亚洲av一区二区| 久久精品99国产精品日本| 久久久av精品波多野结衣| 最新亚洲人成网站在线| 三级黄色片一区二区三区| 精品高清免费国产在线| 中文亚洲av片在线观看| 自拍欧美日韩| 免费在线观看视频专区| 精品人妻一区三区蜜桃| 亚洲精品乱码久久久久久日本蜜臀| 国产精品女视频一区二区| 91国语对白在线观看| 亚洲av综合色区无码一区| 日韩高清在线观看永久| 亚洲AV成人无码久久精品在| 日本在线综合一区二区| 俺去啦最新地址| 国产精品美女久久久浪潮av| 亚洲色无码中文字幕| 国产性虐视频在线观看| 我把护士日出水了视频90分钟| 国产亚洲精品自在久久蜜tv| 玩弄丝袜美腿超短裙校花| 无码人妻久久久一区二区三区| 日本少妇被黑人xxxxx| 女人的天堂av免费看| 成人av一区二区三区四区| 成人精品视频一区二区| 99久久久久国产| 久久久99精品国产片| 免费人成在线观看视频高潮| 日韩人妻精品无码一区二区三区| aⅴ色综合久久天堂av色综合| 天堂av网手机线上天堂| 挺进朋友人妻雪白的身体韩国电影| 国产精品欧美久久久久老妞| 性色国产成人久久久精品二区三区|