亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多源數(shù)據(jù)的出行安全時空評價模型研究

        2019-11-12 08:29:58王茜竹江德潮雒江濤
        關(guān)鍵詞:柵格特征空間

        王茜竹,徐 瑞,江德潮,雒江濤

        (1.新一代信息網(wǎng)絡與終端重慶市協(xié)同創(chuàng)新中心,重慶 400065;2.重慶郵電大學 電子信息與網(wǎng)絡工程研究院,重慶 400065)

        0 引 言

        隨著智慧城市建設的高速推進,包括交通、環(huán)境、治安等方面在內(nèi)的諸多安全問題逐漸暴露出來,《關(guān)于推進城市安全發(fā)展的意見》是由中共中央國務院辦公廳于2018年1月7日發(fā)布的,文中指出,隨著我國城市化進程明顯加快,城市人口、功能和規(guī)模不斷擴大,發(fā)展方式、產(chǎn)業(yè)結(jié)構(gòu)和區(qū)域布局發(fā)生了深刻變化,城市運行系統(tǒng)日益復雜,安全風險不斷增大[1]。本文聚焦城市出行安全問題,出行安全是指居民出行所需的包括交通、環(huán)境、治安等多方面在內(nèi)穩(wěn)定的外部環(huán)境和秩序。近年來,一些城市相繼發(fā)生出行安全事故,如上海外灘踩踏事件、女教師夜跑遇害事件等,暴露出城市安全管理存在不少漏洞和短板,而準確評估城市安全態(tài)勢是保障居民出行安全的關(guān)鍵。

        城市是一個復雜多變的綜合體,評估城市出行安全態(tài)勢需要融合多領(lǐng)域信息,且需要體現(xiàn)其時空動態(tài)特性[2]。傳統(tǒng)的評價方法有質(zhì)量控制法、多元回歸法、模糊綜合評價法、絕對數(shù)法、事故強度分析法、層次分析法、灰色聚類法等[3-6],這些方法雖然在操作上因相對簡單而具有優(yōu)勢,但其對于事故的分析過于簡單,且評價結(jié)果過度依賴評價人員的主觀意識,使得評價結(jié)果往往缺乏科學性和說服力。近年來利用數(shù)據(jù)分析、數(shù)據(jù)挖掘等新方法處理安全評價問題是該領(lǐng)域的一個研究熱點,楊天軍等指出影響城市交通安全的因素眾多且關(guān)系復雜,指標權(quán)重難以確定,因此提出利用BP神經(jīng)網(wǎng)絡的方法進行城市交通安全性的評價[7]。魏琳娜等提出利用神經(jīng)網(wǎng)絡理論建立城市道路交叉口安全預測模型,從而對城市道路交叉口的安全形勢進行預測[8]。江慧娟針對城市居民的居住適宜性展開研究,結(jié)合出租車軌跡、在線地圖興趣點(point of interest, POI)以及地理國情普查等多源數(shù)據(jù),基于分時段的社區(qū)交通熱點和社區(qū)活躍度構(gòu)建城市社區(qū)宜居性動態(tài)評價方法[9]。而隨著智能手機和各種傳感器設備的普及,城市數(shù)據(jù)種類愈加繁多,這些數(shù)據(jù)大多為時空數(shù)據(jù),許多學者對此展開研究,通過多源時空數(shù)據(jù)挖掘來應對城市發(fā)展過程中的諸多問題,輔助城市規(guī)劃、決策[10-11]。文獻[12]利用出租車軌跡數(shù)據(jù)及公共交通刷卡數(shù)據(jù),考慮地理數(shù)據(jù)的時空信息,通過基于鄰接關(guān)系的時空譜聚類來挖掘居民出行模式。文獻[13]則通過對城市中多種多源異構(gòu)人類行為軌跡數(shù)據(jù)的獲取、整合、分析、挖掘,來分析城市職相關(guān)住空間特征。文獻[14]利用軌跡數(shù)據(jù),通過地圖匹配、車輛速度估計及道路擁擠分類等一系列步驟,研究城市的交通擁堵分布狀況。文獻[15]通過時空聚類方法研究出租車載客數(shù)據(jù),挖掘城市載客熱點區(qū)域,為出租車和乘客推薦載客和乘車地點。文獻[16-17]利用大量出租車全球定位系統(tǒng)(global positioning system, GPS)數(shù)據(jù)進行分析挖掘,提取行駛距離、行駛時間、平均車速等參數(shù)從而得到城市人口流動性、城市熱點區(qū)域等特征。

        充分考慮多特征與出行安全之間復雜的非線性映射關(guān)系以及出行安全的時空傳播特性,建立出行安全時空域協(xié)同訓練評價模型。首先,基于條件隨機場(conditional random field, CRF)構(gòu)建時間域評價模型,輸入時間類特征如人口、交通流、空氣質(zhì)量指數(shù)(air quality index, AQI)等來模擬一個區(qū)域安全指數(shù)的時序相關(guān)性;然后,基于神經(jīng)網(wǎng)絡構(gòu)建空間域評價模型,輸入空間類特征如路網(wǎng)結(jié)構(gòu)、興趣點分布以模擬不同區(qū)域安全指數(shù)的相關(guān)性,這里考慮區(qū)域之間空間類特征的相關(guān)性以及地理位置的鄰近性。在模型訓練階段,考慮訓練樣本數(shù)據(jù)稀疏性問題,采用基于協(xié)同訓練的半監(jiān)督學習方法,利用大量未標記樣本數(shù)據(jù)訓練模型,使其相互迭代、增強;在評價階段,2個模型分別進行分類預測,再動態(tài)聚合得到最終評價結(jié)果。

        1 出行安全評價特征

        1.1 特征概述

        城市是一個復雜的綜合體,只有統(tǒng)籌道路交通、治安、環(huán)境、實時熱度等多種因素才能夠行之有效地進行城市居民出行安全評價。因此,本文充分研究了較為成熟的道路安全評價指標體系作為出行安全評價中交通類特征選取的重要考量,同時參考其他領(lǐng)域?qū)W科的理論研究對其進行概念延伸,利用移動用戶位置數(shù)據(jù)、出租車軌跡數(shù)據(jù)、歷史事故數(shù)據(jù)等確定了城市出行安全評價的5個基礎(chǔ)特征:人口、交通流、AQI,POI、路網(wǎng)結(jié)構(gòu),并對所需數(shù)據(jù)做了相應的梳理,如表1。

        按照出行安全評價特征在時間和空間維度上的特性,可以將其分為2類:時間類特征和空間類特征。時間類特征是指該特征在時間維度上呈動態(tài)性變化,包括某區(qū)域的人口特征、交通流特征、AQI特征??臻g類特征是指該特征不會隨時間變化,但會因空間位置的不同而呈現(xiàn)出明顯的差異,包括區(qū)域的POI特征以及路網(wǎng)特征。

        表1 出行安全評價基礎(chǔ)特征

        1.2 數(shù)據(jù)處理

        數(shù)據(jù)處理方面,主要包括數(shù)據(jù)預處理及時空匹配。在對多源數(shù)據(jù)進行數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換之后,對其做時間和空間匹配,在不丟失數(shù)據(jù)分布特性的基礎(chǔ)上確保特征在時空粒度上的一致性。時間維度上,對數(shù)據(jù)做以小時為單位的時間劃分,也即將不同形式的時間字段轉(zhuǎn)換到對應的時間區(qū)間內(nèi)從而完成時間維度上的匹配;空間維度上,對數(shù)據(jù)做基于地圖柵格化處理的空間匹配,具體方案是:首先確定目標研究區(qū)域,然后設定柵格邊長L,將目標區(qū)域均分為若干個L×L的正方形柵格,用柵格坐標代替柵格區(qū)域內(nèi)的地理位置坐標,即重新建立了目標區(qū)域的柵格坐標系,將移動用戶位置數(shù)據(jù)、出租車位置數(shù)據(jù)等映射到了柵格中。本文中設定L為1 000 m。

        1.3 特征提取

        針對每一類基礎(chǔ)特征展開研究,充分挖掘數(shù)據(jù)的語義價值,選擇與出行安全相關(guān)的特征參數(shù)作為評價模型的輸入。

        1.3.1 人口特征

        人口因素對于出行安全至關(guān)重要。結(jié)合心理學和社會學的相關(guān)理論研究不難發(fā)現(xiàn),人煙稀少極易使人產(chǎn)生不安全感,而人口過于密集的地方又往往蘊藏著許多威脅安全的不確定因素,此外,本文還考慮了人口流動性對出行安全的影響,由此確定了以下3個特征參數(shù):人口熱度fp是指單位時間(1小時)、單位區(qū)域(1 000 m×1 000 m柵格)的人口數(shù)量;進入流量fa是指單位時間內(nèi)進入到目標區(qū)域的人口數(shù)量;離開流量fl是指單位時間內(nèi)離開目標區(qū)域的人口數(shù)量。

        1.3.2 交通流特征

        本文使用出租車軌跡數(shù)據(jù)獲得區(qū)域的交通流參數(shù),參照道路交通領(lǐng)域的相關(guān)參數(shù)定義,選擇車速的期望、標準差、分布3個參數(shù)。

        車速期望E(v)定義為

        (1)

        車速標準差D(v)定義為

        (2)

        根據(jù)車速等級的通用劃分方法,將其分為0≤v<20,20≤v<40,v≥40,3個區(qū)間(車速單位為Km/h),一個柵格內(nèi)車輛的車速在這3個區(qū)間的分布定義為

        (3)

        (1)—(3)式中,p.l∈g.R表示落在柵格g.R內(nèi)的點。

        1.3.3AQI特征

        城市發(fā)展所伴隨的日益嚴重的環(huán)境污染問題不容小覷,環(huán)境安全也成為居民出行安全中舉足輕重的一部分,其中空氣質(zhì)量又是其中最為關(guān)鍵的一環(huán),近年來城市特別是大型城市的霧霾問題成為居民出行的一大障礙。本文選擇AQI等級fi作為環(huán)境安全的重要考量。

        1.3.4PQI特征

        POI數(shù)據(jù)是和居民生活息息相關(guān)的地理位置數(shù)據(jù),一個區(qū)域內(nèi)各類別興趣點的數(shù)量及分布往往代表著這個區(qū)域的功能以及交通模式等,這對于城市出行安全評價有著重要的參考價值,一些興趣點甚至與城市安全有著直接的因果關(guān)系。因此,將區(qū)域內(nèi)POI的數(shù)量以及分布情況作為出行安全評價的特征,定義以下2個特征參數(shù)。

        1)POI數(shù)量fn。統(tǒng)計目標柵格內(nèi)如表2所示類別的POI數(shù)目,得到fn;

        2)POI區(qū)域占比fρ。這里,將一個柵格劃分為更小的單元格,如圖1所示,計算目標柵格內(nèi)包含POI的小區(qū)的數(shù)目,得到POI區(qū)域占比fρ。

        表2 POI類別

        圖1 POI分布密度Fig.1 POI Density

        1.3.5 路網(wǎng)特征

        一個區(qū)域的路網(wǎng)結(jié)構(gòu)在一定程度上代表了它的交通模式,因此對于評估目標區(qū)域的交通安全性,進而評估出行安全有著重要的參考價值。參考道路交通研究領(lǐng)域的相關(guān)參數(shù)定義標準,本文采用3個與路網(wǎng)結(jié)構(gòu)相關(guān)的特征參數(shù):高速公路的總長度fh、其他低級路段的總長度fr、路口的數(shù)量fs。

        2 出行安全時空評價模型

        2.1 模型概述

        城市居民出行安全評價模型的框架如圖2。模型分為訓練和評價2個部分:訓練部分,數(shù)據(jù)流的方向由圖中的虛線箭頭標注,首先從多源數(shù)據(jù)中提取出行安全評價的特征,根據(jù)其時空特性分為時間類特征和空間類特征2類,并分別輸入基于CRF的時間域評價模型和基于改進BP神經(jīng)網(wǎng)絡的空間域評價模型,然后,為了應對訓練樣本數(shù)據(jù)稀疏性問題,本文采用協(xié)同訓練的方式,利用大量的未標記數(shù)據(jù)提升模型性能;評價部分,數(shù)據(jù)流的方向由圖中的實線箭頭標注,多源數(shù)據(jù)經(jīng)過特征提取后,輸入到訓練好的模型中,這里,時間類特征和空間類特征將被分別輸入到對應的評價模型中,得到2個概率值,選擇置信度最高的分類結(jié)果作為模型的最終輸出,這樣就得到了目標區(qū)域目標時間區(qū)間的安全指數(shù)等級。本文將模型輸出做可視化展示以更加直觀地了解模型的評價結(jié)果,利用樣本數(shù)據(jù)集中的測試數(shù)據(jù)驗證模型性能。

        圖2 模型框架圖Fig.2 Model frame diagram

        2.2 基于CRF的時間域評價模型

        2.2.1 問題定義

        在時間維度上,假設某目標區(qū)域當前的安全狀況僅與其前一小時的安全狀況相關(guān),也就是一個典型的馬爾科夫假設問題。CRF是給定隨機變量X條件下,隨機變量Y的馬爾科夫隨機場。本文采用CRF模型,主要解決由輸入序列對輸出序列預測的判別模型問題,形式為對數(shù)線性模型,學習方法通常為極大似然估計或正則化極大似然估計,其優(yōu)勢在于:條件隨機場在獨立性假設方面不同于隱馬爾科夫模型,它不需要嚴格的獨立性假設條件;另外,條件隨機場克服了最大熵馬爾科夫模型的標記偏置問題。CRF常用于標注問題,本課題的評價問題也可以等價為安全指數(shù)標記問題,這時,在條件概率模型P(Y|X) 中,Y是輸出變量,代表標記序列,X是輸入變量,表示需要標注的觀測序列。

        2.2.2 模型結(jié)構(gòu)

        基于CRF的時間域安全評價模型的圖結(jié)構(gòu)G如圖3,圖3中包括2種點,灰色的點Y={Y1,Y2,…,Yn}表示隱狀態(tài)變量也即標記變量,白色的點X={X1,X2,…,Xn}表示觀測值,Xi={Fh,Ft,Fa,t}(t表示以小時為單位的時間戳)。點Yi∈Y共同組成了鏈,每2個點Yi-1與Yi之間形成一條邊,并且?guī)в邪踩珮撕?。當給定條件X時,隨機變量Yi滿足馬爾科夫性,可以表示為

        P(Yi|X,Yj,i≠j)=P(Yi|X,Yj,i~j)

        (4)

        (4)式中:P(Y|X)為線性鏈條件隨機場;i~j表示i與j在圖G中相鄰。

        圖3 時間域模型圖結(jié)構(gòu)Fig.3 Graphic presentation of the temporal model

        在給定觀測序列X為條件時,選用指數(shù)勢函數(shù)并引入特征函數(shù)即可得到條件概率P(Y|X)為

        (5)

        (5)式中:tj(Yi-1,Yi,X,i)是定義在觀測序列的2個相鄰標記位置i,i-1上的轉(zhuǎn)移特征函數(shù),用于表征相鄰標記變量之間的相關(guān)關(guān)系以及觀測序列對其產(chǎn)生的影響;sk(Yi,X,i)為定義在觀測序列的標記位置i上的狀態(tài)特征函數(shù),用于表征觀測序列對標記變量的影響,一般情況下,特征函數(shù)的取值通常為1或0,滿足特征條件時取值為1,否則為0;λj和μk為對應的權(quán)值。

        將轉(zhuǎn)移特征與狀態(tài)特征及其對應的權(quán)值分別用統(tǒng)一的符號進行代替。令sk(Yi,X,i)=sk(Yi-1,Yi,X,i),(5)式可轉(zhuǎn)換為

        (6)

        (6)式中,Z為規(guī)范化因子,用于確保(6)式是正確定義的概率。

        在模型訓練階段,主要討論給定訓練數(shù)據(jù)集估計CRF模型參數(shù)的問題,即CRF的學習問題。從實際角度考慮,CRF模型可看作是定義在時序數(shù)據(jù)上的對數(shù)線形模型,其學習方法主要有極大似然估計和正則化的極大似然估計。給定k個訓練數(shù)據(jù)集{X(k),Y(k)},參數(shù)λ的極大似然函數(shù)為

        (7)

        2.3 基于神經(jīng)網(wǎng)絡的空間域評價模型

        在空間類特征方面,研究空間域評價模型的構(gòu)建以模擬其空間相關(guān)性。在輸入階段,考慮空間特征的靜態(tài)特性,提出一種多樣化輸入生成方法以提高模型訓練效率及預測精度;在模型構(gòu)建階段,采用遺傳算法對BP神經(jīng)網(wǎng)絡進行優(yōu)化以應對其收斂速度慢、易陷入局部極小值等問題。

        2.3.1 問題定義

        空間域模型主要是通過對待評價區(qū)域的特征觀測值以及其周圍若干區(qū)域的空間類特征觀測值和安全標記進行分析,預測待評價區(qū)域的安全指數(shù)。這里,安全指數(shù)的空間相關(guān)性主要考慮2點:①地理位置上的鄰近區(qū)域?qū)Υu價區(qū)域的影響;②空間類特征強相關(guān)的區(qū)域與待評價區(qū)域的相關(guān)性。本文用皮爾森相關(guān)系數(shù)來表征特征之間的相關(guān)性為

        (8)

        因此可以明確空間域評價模型的輸入為以下幾點。

        1)待評價柵格x與帶有安全標記的柵格k的POI特征之間的皮爾森相關(guān)系數(shù)為

        (9)

        (9)式中,F(xiàn)p=(fn,fρ),其中,fn為POI數(shù)目,fρ為POI分布密度。

        2)待評價柵格x與帶有安全標記的柵格k的路網(wǎng)特征之間的皮爾森相關(guān)系數(shù)為

        (10)

        (10)式中,F(xiàn)r=(fh,fr,fs),fh,fr,fs分別為柵格內(nèi)高速公路長度、其他等級道路長度、路口個數(shù)。

        3)待評價柵格x與帶有安全標記的柵格k之間的地理距離為

        dkx=Geo_Distance(lk,lx)

        (11)

        4)柵格k的安全指數(shù)ck。

        模型的輸出即為待評價柵格x的安全指數(shù)cx。

        2.3.2 模型結(jié)構(gòu)

        空間域評價模型主要包括2個部分:輸入生成階段和BP神經(jīng)網(wǎng)絡,如圖4。輸入生成階段首先要選擇n個帶有安全標記的柵格,計算出模型所需的各項輸入值,其中,D1為特征間的距離(本文用皮爾森相關(guān)性表征),D2為2柵格中心點之間的地理距離;BP神經(jīng)網(wǎng)絡部分主要包括網(wǎng)絡結(jié)構(gòu)的確定、初始權(quán)值和閾值的確定等。下面將分別對2個階段進行詳述。

        圖4 空間域評價模型結(jié)構(gòu)Fig.4 Structure of spatial model

        1)輸入生成階段,首先隨機選擇n個帶有安全標簽的柵格gn得到柵格組合g1用來推測待評價柵格的安全狀況,可以表示為

        g1=(g1,g2,…,gn)

        (12)

        然后,按照(8)—(11)式計算輸入值。

        由于柵格的POI特征以及路網(wǎng)特征均為靜態(tài)數(shù)據(jù),因此如果重復選擇相同的柵格組合,那么網(wǎng)絡的不同輸入(ΔPnx,ΔRnx,dnx)組合之間差異較小,從而導致模型的輸出即待評價柵格的安全指數(shù)將不會與已標記柵格的安全指數(shù)ck有太大差異,那么模型在訓練階段將會忽略這樣的輸入組合,而這將嚴重影響模型的訓練效果。因此,提出一種輸入生成方法使模型的輸入訓練數(shù)據(jù)更加多樣化,具體方法為,將選擇過程執(zhí)行m次從而得到一個輸入集合。每一輪柵格組合選擇過程中,需要保證集合中與之前的集合相同的安全標記柵格不得超過e個,上述規(guī)則可表示為

        Q={g1,g2,…,gm},?gi,gj∈Q,|gi∩gj|≤e

        (13)

        2)在空間域評價模型部分,本文采用BP神經(jīng)網(wǎng)絡構(gòu)建安全評價模型,選擇線性函數(shù)作為輸入層傳遞函數(shù),sigmoid函數(shù)φ(x)作為隱含層和輸出層傳遞函數(shù),則模型輸出為

        (14)

        在模型訓練之前,首先要初始化網(wǎng)絡的權(quán)值和閾值。采用遺傳算法對BP神經(jīng)網(wǎng)絡的初始權(quán)值和閾值進行優(yōu)化。用遺傳算法中的個體代表網(wǎng)絡的初始權(quán)值和閾值、個體值初始化的BP神經(jīng)網(wǎng)絡的預測誤差作為該個體的適應度值,通過選擇、交叉、變異等遺傳操作尋找最優(yōu)個體,從而得到最優(yōu)的BP神經(jīng)網(wǎng)絡的初始權(quán)值和閾值。

        2.4 協(xié)同訓練

        在模型訓練階段,帶有安全標記的樣本數(shù)據(jù)珍貴而稀少,而城市出行安全相關(guān)的各類特征數(shù)據(jù)卻唾手可得,因此采用基于協(xié)同訓練的半監(jiān)督學習方法來充分利用未標記數(shù)據(jù)從而提升模型的學習性能。圖5為本文協(xié)同訓練的整體框圖。首先針對2類特征分別構(gòu)建評價模型:時間域評價模型和空間域評價模型,2個模型分別對未標記數(shù)據(jù)進行評價,并標記一部分置信度高的數(shù)據(jù)給另一模型用以訓練,然后重復此過程使模型得以更新,以此迭代到更多的未標記數(shù)據(jù)加入標記數(shù)據(jù)集。

        圖5 協(xié)同訓練Fig.5 Co-training

        出行安全時空協(xié)同訓練模型為:

        輸入:特征集(Fh,Ft,Fa,Fp,Fr);

        有標記樣本集G1;

        未標記樣本集G2;

        學習輪數(shù)閾值θ;

        輸出:時間域評價模型TE,

        空間域評價模型SE

        方法步驟:

        1.i←0;

        2. Do

        3. SE←SE.Learning(Fr,Fp,G1);

        4. TE←TE.Learning(Fh,Ft,Fa,G1);

        5. 將未標記點集合G2中的每個點輸入SE進行評價,對于每類評價結(jié)果,選擇ni個置信度最高的樣本加入到G1中。

        6. 將未標記點集合G2中的每個點輸入TE進行評價,對于每類評價結(jié)果,選擇ni個置信度最高的樣本加入到G1中。

        7.i++;

        8.UntilG2為空或i>θ;

        9.返回TE,SE;

        評價階段如圖6。考慮待評價柵格安全指數(shù)的時序相關(guān)性,見圖6中的虛線箭頭所示,其空間相關(guān)性,見圖6中的實線箭頭所示,將2類特征集分別輸入SE,TE 2個模型中,得到2個模型的評價結(jié)果的置信度,也即選擇2個評價模型置信度最高的評價結(jié)果作為模型的最終輸出為

        (15)

        (15)式中,C表示所有柵格的集合。

        圖6 評價預測模型結(jié)構(gòu)Fig.6 Philosophy of the evaluation inference model

        3 實驗結(jié)果分析

        3.1 數(shù)據(jù)集

        實驗所使用的數(shù)據(jù)集來自SODA上海開放數(shù)據(jù)創(chuàng)新應用大賽,其中包括上海市政府和各企事業(yè)單位提供的開放數(shù)據(jù)集以及來自100名志愿者的安全標記數(shù)據(jù)集,其中安全標記分為0,1,2,3,分別代表安全、較安全、較不安全、不安全,數(shù)據(jù)集詳細信息如表3所示。數(shù)據(jù)時間跨度為2017.03.01—2017.03.07,在構(gòu)造訓練集和測試集時采用分層采樣的方式以確保每種類別的安全標記在訓練集和測試集中比例一致,采用可視化的方式輔助選擇,也即將安全標記數(shù)據(jù)映射到地圖上進而保證訓練數(shù)據(jù)集和測試數(shù)據(jù)集在標記樣本分布以及時間和空間維度分布上的均勻性。

        3.2 評價指標

        本文采用精確率、召回率、F1值以及混淆矩陣作為模型的評價指標。以二分類問題為例,通常以關(guān)注的類為正類,其他類為負類,分類器在測試數(shù)據(jù)集上的預測可能正確也可能不正確,預測結(jié)果包含以下4種情況,4種情況出現(xiàn)的總數(shù)分別記作:

        TP(真正例)—將正類預測為正類數(shù);

        FN(假反例)—將正類預測為負類數(shù);

        FP(假正例)—將負類預測為正類數(shù);

        TN(真反例)—將負類預測為負類數(shù)。

        則精確率,也稱查準率可定義為

        (16)

        召回率,也稱查全率可定義為

        (17)

        F1值是精確率和召回率的調(diào)和均值,其計算方式為

        (18)

        由此可得分類模型的混淆矩陣,矩陣的每一列表示模型預測的樣本情況,每一行表示樣本的真實情況。

        表3 數(shù)據(jù)集詳細信息

        3.3 結(jié)果分析

        為全面評估模型性能,首先驗證模型的整體結(jié)果并與其他幾種常用的分類算法進行對比;然后分別對時間域評價模型和空間域評價模型的性能進行驗證;最后針對本文采用的基于協(xié)同訓練的半監(jiān)督學習方法進行評估。

        3.3.1 模型整體結(jié)果

        將本文提出的基于CRF和改進BPNN的協(xié)同訓練評價模型與其他常見的分類方法,包括DT,SVM,BPNN,以及單獨使用CRF和改進BPNN時,模型性能的對比,評估指標為精確率、召回率以及F1值,結(jié)果如表4。

        為更直觀地體現(xiàn)模型性能對比,將結(jié)果以柱狀圖的形式展現(xiàn),如圖7所示。顯然,本文提出的模型在精確率、召回率以及F1值3個方面均優(yōu)于其他幾種常用的算法;而如果單獨使用CRF模型或改進BP模型,性能依然不如本文提出的基于協(xié)同訓練的組合模型,這也很好地驗證了本文中針對時間類特征和空間類特征分別建模并協(xié)同訓練的方法有效性。

        表4 模型整體結(jié)果對比

        圖7 模型性能對比Fig.7 Overall results of different methods

        3.3.2 時間域評價模型結(jié)果

        本節(jié)將單獨評價時間域模型的預測性能,圖8,圖9分別為一天24小時中模型預測的精確率和召回率。

        圖8 時間域評價模型精確率Fig.8 Precision of temporal evaluation model

        首先,比較將全部特征輸入時間域評價模型以及僅將時間相關(guān)特征輸入模型時的性能差異,也即圖中的2條不同的折線。不難發(fā)現(xiàn)將全部數(shù)據(jù)輸入模型非但不會提高模型的預測性能,反而會降低預測精度,這也很好地驗證了本文提出的將特征分為時間和空間2類并分別建模的必要性;然后,觀察圖中曲線的變化趨勢,不難發(fā)現(xiàn)時間域評價模型在一天中的8點和18點左右預測性能達到最優(yōu),結(jié)合實際情況可以嘗試解釋這一現(xiàn)象:8點和18點為城市的早晚高峰時段,此時城市的出行狀況尤其是交通狀況最為復雜,也即此時影響出行安全的主要因素為時間類特征如交通流特征、人口特征等,因此,用以模擬出行安全時序相關(guān)性的時間域評價模型性能達到最優(yōu)。

        圖9 時間域評價模型召回率Fig.9 Recall of temporal evaluation model

        3.3.3 空間域評價模型結(jié)果

        在空間域評價模型的輸入階段,圖10展示了選擇不同個數(shù)的柵格組合時進行空間評價時模型預測準確度的差異,由圖10可知,選擇3個柵格時模型的精度最高,因此,確定n=3。表5為空間域評價,模型混淆矩陣。

        圖10 柵格個數(shù)與時間域評價模型精確率Fig.10 Spatial model performance with different number of grids

        3.3.4 協(xié)同訓練結(jié)果

        本模型為了解決標記樣本數(shù)量少而未標記數(shù)據(jù)豐富的問題,提出采用協(xié)同訓練的方法。這里,設置置信度閾值為0.85,也即如果時間域評價模型或空間域評價模型對一個實例的分類結(jié)果的置信度大于0.85,則將此評價結(jié)果納入標記數(shù)據(jù)集。

        表5 空間域評價模型混淆矩陣

        表6為協(xié)同訓練綜合模型的混淆矩陣。圖11,圖12分別表示協(xié)同訓練的精確率和召回率。圖11,圖12中SE代表空間域評價模型;TE代表時間域評價模型,經(jīng)協(xié)同訓練后的時空域融合模型在精確率和召回率方面均優(yōu)于單獨使用時間域評價模型和空間域評價模型,從而證明協(xié)同訓練提高了模型的預測能力,可有效地應對訓練數(shù)據(jù)稀疏帶來的模型預測精度低等問題。

        表6 模型混淆矩陣

        圖11 協(xié)同訓練精確率Fig.11 Precision of Co-training

        4 結(jié)束語

        本文主要針對城市居民出行安全評價問題,提出了一種基于CRF的時間域模型和基于神經(jīng)網(wǎng)絡的空間域模型協(xié)同訓練的出行安全評價模型,經(jīng)驗證此模型評價預測精度較傳統(tǒng)方法有顯著優(yōu)勢。由于數(shù)據(jù)集所限,本文在時間域模型中僅考慮了相鄰時間的時序平滑性,未考慮其周期性和趨勢性,下一步研究工作可考慮利用深度卷積神經(jīng)網(wǎng)絡等方法模擬出行安全的周期性和趨勢性。

        圖12 協(xié)同訓練召回率Fig.12 Recall of Co-training

        猜你喜歡
        柵格特征空間
        基于鄰域柵格篩選的點云邊緣點提取方法*
        空間是什么?
        創(chuàng)享空間
        如何表達“特征”
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        抓住特征巧觀察
        不同剖面形狀的柵格壁對柵格翼氣動特性的影響
        基于CVT排布的非周期柵格密度加權(quán)陣設計
        雷達學報(2014年4期)2014-04-23 07:43:13
        線性代數(shù)的應用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        動態(tài)柵格劃分的光線追蹤場景繪制
        日韩日本国产一区二区 | 亚洲97成人在线视频| 亚洲精品国产av成人精品| 国产成人无码a区在线观看导航| 鲁鲁鲁爽爽爽在线视频观看| 欧美极品少妇性运交| 欧美v日韩v亚洲综合国产高清| 人妻少妇喷水意淫诱惑| 久久精品国产亚洲av麻豆床戏| 无码人妻精品一区二区三| 国产露脸精品产三级国产av| 一本一本久久a久久| 亚洲第一页综合av免费在线观看| 成人久久黑人中出内射青草| 国产乱人激情h在线观看| 国产精品无码一区二区三区免费| 国产综合久久久久影院| av蜜桃视频在线观看| 在线观看精品视频一区二区三区| 亚洲在线一区二区三区四区| 亚洲国产天堂av成人在线播放| 凌辱人妻中文字幕一区| 特级做a爰片毛片免费看无码| 国产精品一区二区av片| 久久国产高潮流白浆免费观看| 国产一区二区黄色的网站| 亚洲av永久无码精品网站在线观看 | 久久天堂综合亚洲伊人hd妓女| 色婷婷久久综合中文久久蜜桃av| 三级网址在线| 日韩美无码一区二区三区| 午夜精品男人天堂av| 完整版免费av片| 日韩精品无码视频一区二区蜜桃| 国产精品久久久一本精品| 亚洲熟妇一区二区蜜桃在线观看| 国产色在线 | 日韩| 99re这里只有热视频| 无码人妻专区一区二区三区| 中文乱码字幕人妻熟女人妻| 精品福利一区二区三区免费视频 |