亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于網(wǎng)約車數(shù)據(jù)的城市區(qū)域出行時(shí)空特征識(shí)別與預(yù)測(cè)研究

        2020-07-02 06:55:10陳艷艷梁天聞
        關(guān)鍵詞:時(shí)間尺度交通維度

        張 政,陳艷艷*,梁天聞

        (1.北京工業(yè)大學(xué)城市交通學(xué)院,北京100124;2.交通運(yùn)輸部公路科學(xué)研究院,北京100088)

        0 引 言

        網(wǎng)約車的逐步發(fā)展對(duì)城市居民的生活和出行方式產(chǎn)生較大影響.城市不同區(qū)域網(wǎng)約車出行需求特征精準(zhǔn)識(shí)別和預(yù)測(cè),對(duì)運(yùn)營(yíng)商優(yōu)化車輛調(diào)度方案,資源合理配置,緩解高峰時(shí)段關(guān)鍵區(qū)域供需失衡,減少環(huán)境污染等問(wèn)題具有重要意義;對(duì)交通規(guī)劃者制定面向區(qū)域的需求管理政策,開(kāi)展可替代的定制公共交通服務(wù)具有重要參考價(jià)值.

        城市交通需求特征識(shí)別廣泛采用聚類,矩陣分解等特征提取方法挖掘城市不同群體的出行特征規(guī)律.MA X.等[1]利用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)方法對(duì)北京市公交通勤者進(jìn)行辨識(shí);曲昭偉等[2]根據(jù)出租車GPS數(shù)據(jù)采用核密度方法對(duì)城市熱點(diǎn)路段進(jìn)行辨識(shí);CALABRESE F.[3]采用矩陣分解方法對(duì)不同交通需求進(jìn)行分類.交通需求特征識(shí)別是預(yù)測(cè)的基礎(chǔ),基于不同出行需求特征可分別構(gòu)建預(yù)測(cè)模型.交通預(yù)測(cè)方法主要包括參數(shù)方法和非參數(shù)方法,參數(shù)方法如基于時(shí)間序列的統(tǒng)計(jì)模型自回歸移動(dòng)平均[4]和泊松模型[5]等,而人工智能的發(fā)展使得機(jī)器學(xué)習(xí)方法逐漸成為解決短時(shí)交通需求預(yù)測(cè)的非參數(shù)方法,如支持向量機(jī)[6],長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)[7].JIANG S.[8]提出基于最小二乘支持向量機(jī)的網(wǎng)約車需求預(yù)測(cè)方法.谷遠(yuǎn)利[9]提出基于深度學(xué)習(xí)網(wǎng)絡(luò)的預(yù)測(cè)某區(qū)域內(nèi)網(wǎng)約車短時(shí)供需差的框架,該預(yù)測(cè)模型考慮時(shí)空因素和環(huán)境因素,預(yù)測(cè)短時(shí)間內(nèi)區(qū)域的出行需求.郭憲[10]提出基于多源數(shù)據(jù)的梯度決策回歸樹(shù)網(wǎng)約車需求預(yù)測(cè)方法.

        綜上,交通需求特征識(shí)別和需求預(yù)測(cè)缺乏聯(lián)系,辨識(shí)方法和預(yù)測(cè)方法易受時(shí)空數(shù)據(jù)集顆粒度影響.而基于特定需求特征的預(yù)測(cè)模型能夠?qū)Y(jié)果進(jìn)行較好的解析,主題模型LDA(Latent Dirichlet Allocation)能夠有效避免數(shù)據(jù)集稀疏和維數(shù)較高造成辨識(shí)結(jié)果差等問(wèn)題,且識(shí)別結(jié)果能夠呈現(xiàn)出概率較高的出行特征.本文以北京市三環(huán)路以內(nèi)網(wǎng)約車出行訂單需求和城市交通小區(qū)劃分結(jié)果為基礎(chǔ),構(gòu)建基于主題模型LDA 的城市出行需求辨識(shí)和預(yù)測(cè)組合分析框架;分析城市不同區(qū)域內(nèi)需求特征,基于需求特征辨識(shí)結(jié)果構(gòu)建多時(shí)間尺度下的組合預(yù)測(cè)模型;對(duì)比常用預(yù)測(cè)方法,驗(yàn)證模型的有效性和精度.

        1 基于LDA的區(qū)域出行需求特征辨識(shí)與預(yù)測(cè)模型

        1.1 問(wèn)題描述

        主題模型是以非監(jiān)督學(xué)習(xí)的方式對(duì)數(shù)據(jù)集中隱含特征進(jìn)行辨識(shí)的統(tǒng)計(jì)模型,被廣泛用于自然語(yǔ)言處理中的語(yǔ)義分析和文本挖掘.LDA 是一種常見(jiàn)的主題模型,圖1為標(biāo)準(zhǔn)LDA的概率圖模型,從概率分布角度表示時(shí)空數(shù)據(jù)集的生成過(guò)程.數(shù)據(jù)集中每個(gè)元素生成過(guò)程為:某時(shí)空數(shù)據(jù)集存在D個(gè)待挖掘隱含特征的研究對(duì)象,描述研究對(duì)象d(d=1,…,D)共有T條數(shù)據(jù)記錄,其中某一條數(shù)據(jù)記錄的數(shù)值記為w,該數(shù)值的主題編號(hào)為z.假設(shè)所有研究對(duì)象共存在K種隱含出行特征,每種特征可用主題z來(lái)概括,z=1,…,K.那么該數(shù)據(jù)集的主題服從超參數(shù)α的狄利克雷(Dirichlet)分布.研究對(duì)象d的主題服從參數(shù)為θd的多項(xiàng)(multinomial)分布,第t個(gè)數(shù)值取值w服從參數(shù)為φk的multinomial分布.當(dāng)某一主題確定后,該主題下數(shù)值服從超參數(shù)為β的Dirichlet分布.

        圖1 LDA 模型結(jié)構(gòu)圖Fig.1 Structure of LDA

        利用網(wǎng)約車時(shí)空數(shù)據(jù)集挖掘得到城市不同區(qū)域內(nèi)出行需求特征,網(wǎng)約車時(shí)空數(shù)據(jù)集為海量用戶的出行訂單數(shù)據(jù),每條訂單數(shù)據(jù)記錄出行者的起點(diǎn)O、終點(diǎn)D、出發(fā)時(shí)間S1、到達(dá)時(shí)間S2等信息.將訂單數(shù)據(jù)集按照一定的時(shí)間顆粒度集聚到交通小區(qū)層面,得到O×D×S三維張量,記為χ,為在時(shí)間段t內(nèi),從交通小區(qū)i到交通小區(qū)j的出行量.此時(shí),交通小區(qū)為研究對(duì)象,交通小區(qū)內(nèi)某時(shí)段產(chǎn)生的到發(fā)客流為具體數(shù)值.采用LDA模型發(fā)現(xiàn)交通小區(qū)層面隱含的經(jīng)常性的出行特征,分別得到O,D,S三個(gè)維度的主題分布O′,D′,S′,每個(gè)主題代表一種隱含的出行特征,即各出行特征以概率分布形式呈現(xiàn),表示某種出行特征出現(xiàn)概率的大小.符號(hào)含義如表1 所示.根據(jù)挖掘到的各維度隱含分布特征,構(gòu)建運(yùn)算高效的出行需求預(yù)測(cè)模型.

        表1 符號(hào)定義Table 1 Symbol definition

        1.2 基于LDA的區(qū)域出行需求辨識(shí)方法

        為發(fā)掘網(wǎng)約車時(shí)空數(shù)據(jù)集各維度隱含的主題分布特征,構(gòu)建圖2所示改進(jìn)LDA模型.數(shù)據(jù)集χ中每個(gè)數(shù)值的生成過(guò)程如下.

        圖2 改進(jìn)LDA 概率圖模型Fig.2 Structure of modified LDA model

        (1)對(duì)任一主題z(z=1,…,K)有:

        (a)對(duì)任一出發(fā)主題分布~Dirichlet(β);

        (b)對(duì)任一時(shí)間主題分布~Dirichlet(γ).

        (2)對(duì)任一到達(dá)交通小區(qū)j(j=1,…,v)有:

        (a)Dirichlet(α);

        (b) 對(duì)于任一到達(dá)小區(qū)j,共有Nj條出行記錄,出行記錄i(i=1,…,Nj)生成過(guò)程為

        ①該記錄主題編號(hào)zij服從zij~multinomial;

        ②該記錄來(lái)自出發(fā)小區(qū)oij~multinomial;

        ③該記錄的時(shí)間戳tij~multinomial

        圖2 中,α,β,γ為Dirichlet 超參數(shù),采用吉布斯采樣方法對(duì)改進(jìn)LDA 模型進(jìn)行參數(shù)估計(jì)[11].吉布斯采樣方法包括初始化和更新迭代兩部分,超參數(shù)需在初始化過(guò)程中按照經(jīng)驗(yàn)設(shè)定某初始值,更新迭代過(guò)程的全概率公式為

        式中:zijt為在t時(shí)間下由小區(qū)i出發(fā),到達(dá)小區(qū)j的主題編號(hào);分別表示第i出發(fā)小區(qū),第j到達(dá)小區(qū)和第t時(shí)間段屬于主題k的個(gè)數(shù).全概率公式為每次更新采樣過(guò)程中生成某個(gè)主題的概率.主題個(gè)數(shù)K取值利用混合度指標(biāo)[11]來(lái)衡量,當(dāng)混合度較小時(shí),模型效果較優(yōu).

        采樣經(jīng)過(guò)一定次數(shù)后,采樣過(guò)程趨于穩(wěn)定,主題概率分布不再變化,此時(shí)各維度的主題概率分布為

        如果時(shí)空數(shù)據(jù)集時(shí)間尺度不確定,需要得到不同時(shí)間尺度下各維度隱含的出行特征,直接做法是分別按照對(duì)應(yīng)的時(shí)間尺度重復(fù)上述參數(shù)推斷過(guò)程,計(jì)算成本較高.吉布斯采樣過(guò)程對(duì)所有尺度分配某一主題的概率是等價(jià)的,故構(gòu)建基于某最小時(shí)間尺度下的主題分布為基準(zhǔn),構(gòu)建任意時(shí)間尺度下的時(shí)間維度主題分布.記某時(shí)間窗口大小為lh,則任意時(shí)間窗口表示為

        式中:l0為基準(zhǔn)時(shí)間窗口大小;L(h)為時(shí)間窗口增長(zhǎng)因子,h為時(shí)間窗口大小編號(hào),h=0,1,2,…,H,通常情況下L=2[12].因?yàn)閷?duì)主題分布矩陣中每個(gè)元素分配主題的概率是相同的,即每個(gè)時(shí)間顆粒度下估計(jì)潛在主題的過(guò)程相同,故對(duì)于時(shí)間顆粒度為lh的時(shí)間主題矩陣分布有

        式中:為在時(shí)間窗口為h下的時(shí)間主題概率分布,m=lh/l0.根據(jù)最小時(shí)間窗口矩陣分析得到主題矩陣S(0),可以得到不同時(shí)間窗口下時(shí)間維度的主題特征分布矩陣,基于此可呈現(xiàn)在多時(shí)間窗口下的主題概率的分布特征情況.

        1.3 多時(shí)間尺度下的區(qū)域出行需求預(yù)測(cè)方法

        若通過(guò)主題分析得到時(shí)間維度的主題概率分布是明顯的時(shí)間序列,利用自回歸(AR)方法進(jìn)行預(yù)測(cè).對(duì)于某一時(shí)間窗口下,利用前ω時(shí)段下的記錄完成t時(shí)刻的預(yù)測(cè),即

        式中:λn為回歸系數(shù),n=1,…,ω;εt為誤差項(xiàng).

        多個(gè)層面的時(shí)間窗口,基于最小時(shí)間尺度下分布,實(shí)現(xiàn)不同時(shí)間尺度下時(shí)間維度主題的估計(jì).則有

        式中:為第h個(gè)時(shí)間窗口下,第n個(gè)回歸系數(shù);為第h個(gè)時(shí)間窗口下,t-n時(shí)段的主題分布.完成時(shí)間維度主題矩陣趨勢(shì)變化的預(yù)測(cè)后,還需要推算區(qū)域的交通出行需求.

        式中:a為采用數(shù)據(jù)集的時(shí)間長(zhǎng)度;是平均每個(gè)時(shí)間窗口下從i小區(qū)出發(fā)的平均出行需求表示區(qū)域出行需求.

        式(9)是利用出發(fā)主題分布矩陣,到達(dá)主題分布矩陣和時(shí)間主題分布矩陣,基于對(duì)時(shí)間主題矩陣的預(yù)測(cè)結(jié)果,預(yù)測(cè)未來(lái)區(qū)域出行需求.

        2 案例分析

        選用北京市三環(huán)路以內(nèi)2017年7月17~30日滴滴出行網(wǎng)約車訂單數(shù)據(jù)驗(yàn)證模型的有效性.網(wǎng)約車時(shí)空訂單數(shù)據(jù)集每條數(shù)據(jù)記錄每一訂單編號(hào),上車地點(diǎn)經(jīng)緯度,下車地點(diǎn)經(jīng)緯度,上車時(shí)間,下車時(shí)間等信息.為研究不同時(shí)間尺度下區(qū)域出行特征分布及預(yù)測(cè)結(jié)果,選取15,30,60 min這3個(gè)時(shí)間窗口,然后根據(jù)訂單經(jīng)緯度坐標(biāo)集聚到三環(huán)內(nèi)交通小區(qū)層面,得到χ1,χ2和χ3這3個(gè)數(shù)據(jù)集.

        2.1 區(qū)域出行特征識(shí)別結(jié)果分析

        對(duì)數(shù)據(jù)集χ1按照?qǐng)D2改進(jìn)LDA模型框架進(jìn)行主題分析,當(dāng)主題數(shù)K=3 時(shí),改進(jìn)LDA 模型取得較優(yōu)效果.圖3(a)為空間層面(出發(fā)小區(qū),到達(dá)小區(qū))主題分布結(jié)果,3種主題分別為低,中,高不同出行強(qiáng)度在空間上的分布.為驗(yàn)證模型結(jié)果的合理性,從數(shù)據(jù)周期內(nèi)隨機(jī)選取1 d 數(shù)據(jù),進(jìn)行統(tǒng)計(jì)分析,結(jié)果如圖3(b)所示.模型結(jié)果與統(tǒng)計(jì)結(jié)果整體趨勢(shì)相差不大,A,B,C,D,E這5處地點(diǎn),兩種方法結(jié)果相異或相似,利用POI(Point of interest)數(shù)據(jù)計(jì)算這5 處地點(diǎn)的土地利用性質(zhì)[13].A 主要為高等教育用地,此類用地約占該交通小區(qū)的67.8%;B和E主要為交通樞紐用地,此類用地約占交通小區(qū)面積的86.8%;C主要為公園綠地用地類型,約占該交通小區(qū)的76.1%.這4處地點(diǎn)出行主要是隨機(jī)出行,故某日出行數(shù)據(jù)統(tǒng)計(jì)結(jié)果與數(shù)據(jù)集總體模型結(jié)果存在一定差別.兩者結(jié)果相似的D類交通小區(qū),主要為商業(yè)寫(xiě)字樓,此類交通小區(qū)產(chǎn)生的出行較為規(guī)律,故兩種方法結(jié)果差別較小.圖4 為χ1在時(shí)間維度主題分析結(jié)果,根據(jù)式 (6)得到χ2和χ3的主題分布,如圖5 和圖6 所示.

        圖3 出發(fā)小區(qū)和到達(dá)小區(qū)主題分布Fig.3 Topics distribution of origin and destination traffic analysis zones.

        圖4 時(shí)間窗口為15 min 的時(shí)間維度主題分布Fig.4 Topic distribution on temporal dimensioanl under 15 min

        圖5 時(shí)間窗口為30 min 的時(shí)間維度主題分布日Fig.5 Topic distribution on temporal dimensioanl under 30 min

        圖6 時(shí)間窗口為60 min 的時(shí)間維度主題分布Fig.6 Topic distribution on temporal dimensioanl under 60 min

        由圖4~圖6 可看出,工作日與非工作日出行強(qiáng)度變化趨勢(shì)不同.隨著時(shí)間窗口變大,時(shí)間主題分布逐漸趨于平緩,各類出行強(qiáng)度大小關(guān)系逐漸變得明顯.a類出行特征在工作日內(nèi)始終能夠維持較高的出行強(qiáng)度,在非工作日內(nèi)存在明顯的單峰出行強(qiáng)度特征;b 類在工作日出行強(qiáng)度整體低于a類,在非工作日b 類同樣存在單峰,但與a 類單峰出現(xiàn)時(shí)段不一致;c 類表示較低的出行強(qiáng)度分布,在1 d內(nèi)變化較為平穩(wěn),且工作日和非工作日出行強(qiáng)度特征差別不大.

        2.2 區(qū)域出行預(yù)測(cè)結(jié)果分析

        為評(píng)價(jià)改進(jìn)LDA 構(gòu)建的預(yù)測(cè)模型效果,選取均方根誤差(Root Mean Squared Error,RSME)和平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)作為衡量誤差的指標(biāo),分別評(píng)價(jià)在不同時(shí)間尺度下模型的預(yù)測(cè)效果,如表2所示.

        表2 預(yù)測(cè)精度評(píng)價(jià)Table 2 Forecasting accuracy evaluation

        由表2 可知,時(shí)間尺度的大小會(huì)影響預(yù)測(cè)精度,時(shí)間窗口越大,需求越平滑,預(yù)測(cè)精度越高.改進(jìn)的LDA-AR 預(yù)測(cè)模型的精度比傳統(tǒng)的AR 模型高.

        3 結(jié) 論

        本文將LDA模型引入到識(shí)別交通時(shí)空數(shù)據(jù)集隱含出行特征問(wèn)題中來(lái),有別于LDA 得到單一維度主題分布,增加多維度信息作用于數(shù)據(jù)集觀測(cè)值,可得到到達(dá)小區(qū),出發(fā)小區(qū)和時(shí)間維度下的主題分布特征;同時(shí)基于最小時(shí)間尺度下的主題分布構(gòu)建任意時(shí)間尺度下的需求分布預(yù)測(cè)模型,提高計(jì)算效率;并選取北京市三環(huán)路以內(nèi)網(wǎng)約車時(shí)空數(shù)據(jù)集,驗(yàn)證模型的有效性和精度.結(jié)果表明,構(gòu)建的基于最小時(shí)間窗口下的多尺度分布特征識(shí)別和預(yù)測(cè)方法能夠識(shí)別不同時(shí)間顆粒度下的區(qū)域需求特征,實(shí)現(xiàn)區(qū)域間的需求變化趨勢(shì)預(yù)測(cè).本文研究對(duì)城市交通規(guī)劃,公共交通組織運(yùn)營(yíng)等方面具有重要意義.

        城市交通需求辨識(shí)與組合預(yù)測(cè)模型只對(duì)總體需求進(jìn)行了預(yù)測(cè),擬在后續(xù)研究中考慮不同主題下預(yù)測(cè)結(jié)果的對(duì)比分析.

        猜你喜歡
        時(shí)間尺度交通維度
        時(shí)間尺度上非完整系統(tǒng)的Noether準(zhǔn)對(duì)稱性與守恒量
        時(shí)間尺度上Lagrange 系統(tǒng)的Hojman 守恒量1)
        交直流混合微電網(wǎng)多時(shí)間尺度協(xié)同控制
        能源工程(2021年1期)2021-04-13 02:06:12
        繁忙的交通
        童話世界(2020年32期)2020-12-25 02:59:14
        淺論詩(shī)中“史”識(shí)的四個(gè)維度
        小小交通勸導(dǎo)員
        大連市暴雨多時(shí)間尺度研究分析
        光的維度
        燈與照明(2016年4期)2016-06-05 09:01:45
        “五個(gè)維度”解有機(jī)化學(xué)推斷題
        人生三維度
        吐魯番(2014年2期)2014-02-28 16:54:43
        蜜桃视频在线免费观看一区二区| 久久国产精品不只是精品| 国产国拍亚洲精品永久69| 91中文在线九色视频| 欧美群妇大交群| 激情航班h版在线观看| 日韩精品电影在线观看| 在线日本高清日本免费| 亚洲AV乱码毛片在线播放| 国产精品丝袜美女久久| 亚洲一区二区三区小说| 337人体做爰大胆视频| 日本一区二区三区激情视频| 在线看高清中文字幕一区| 天天做天天爱夜夜爽女人爽| 精产国品一二三产区m553麻豆 | 亚洲av无码专区首页| 亚洲欧洲精品成人久久曰不卡| 亚洲另类国产精品中文字幕| 成人一区二区三区国产| 人妻仑乱a级毛片免费看| 豆国产95在线 | 亚洲| 久久婷婷免费综合色啪| 99久久免费看精品国产一| 三叶草欧洲码在线| 免费无遮挡无码视频在线观看| 日本一区二区日韩在线| av无码精品一区二区三区| 欧美日韩视频无码一区二区三| 最新国产一区二区精品久久| 亚洲成a人片在线观看导航| 偷偷夜夜精品一区二区三区蜜桃| 少妇裸体性生交| 一本色综合亚洲精品蜜桃冫| 国产亚洲av手机在线观看| 日本av一区二区三区在线| 亚洲一区二区三区中文字幂| 久久亚洲成a人片| 中文字幕女同人妖熟女| 国产精品亚洲色婷婷99久久精品| 国产 国语对白 露脸|