亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        聯(lián)合重復(fù)性與周期性的公交乘客個(gè)體出行規(guī)律分類

        2023-10-30 11:38:56姚志剛盧致遠(yuǎn)

        姚志剛,盧致遠(yuǎn)

        (長(zhǎng)安大學(xué),運(yùn)輸工程學(xué)院,西安 710061)

        0 引言

        乘客出行規(guī)律是公交個(gè)性化需求感知和差異化服務(wù)的基礎(chǔ)[1],但乘客出行規(guī)律研究受數(shù)據(jù)獲取途徑與分析手段制約而進(jìn)展緩慢[2]。隨著大數(shù)據(jù)技術(shù)的快速發(fā)展,乘客出行規(guī)律在交通行為建模、需求預(yù)測(cè)、市場(chǎng)細(xì)分等方面的價(jià)值逐漸凸顯[3]。

        盡管公交乘客出行記錄包含短期的重復(fù)性與長(zhǎng)期的周期性兩方面規(guī)律特征,但已有文獻(xiàn)主要關(guān)注重復(fù)性規(guī)律度量問(wèn)題,早期文獻(xiàn)以單次或一天活動(dòng)為對(duì)象構(gòu)建出行時(shí)間或空間集[4],或者用乘客個(gè)體出行活動(dòng)的頻繁程度度量其重復(fù)性規(guī)律[5];進(jìn)一步,Ma 等[6]按乘客起、訖點(diǎn)構(gòu)建OD(Origin Destination)序列,用集計(jì)方式統(tǒng)計(jì)時(shí)、空相同/相近OD序列的乘客群體出行模式(近似甚至相同出行鏈)出現(xiàn)的次數(shù);類似地,Kieu 等[7]按出行時(shí)間或站點(diǎn)的相似性劃分出行模式或時(shí)間、空間相同的出行鏈,然后度量不同出行模式的重復(fù)程度。顯然,出行次數(shù)是乘客出行活動(dòng)頻繁程度的絕對(duì)值,當(dāng)乘客個(gè)體出行活動(dòng)基數(shù)存在差異(即區(qū)分有出行的天數(shù)和無(wú)出行的天數(shù))時(shí),僅用出行次數(shù)難以區(qū)分乘客個(gè)體出行活動(dòng)重復(fù)程度的強(qiáng)弱。為充分表征乘客個(gè)體出行重復(fù)性規(guī)律信息,Goulet-Langlois等[8]提出用熵率度量乘客個(gè)體出行時(shí)、空序列的重復(fù)程度,但熵率計(jì)算過(guò)程復(fù)雜,出行序列較長(zhǎng)時(shí)重復(fù)性值隨著信息熵增大而無(wú)限增大導(dǎo)致應(yīng)用困難。

        相比較而言,乘客出行周期性規(guī)律度量研究較少。何兆成等[9]引入傅里葉變換度量乘客個(gè)體出行模式出現(xiàn)的周期,Mahrsi等[10]以多天為時(shí)間單元度量時(shí)、空相同乘客的出行時(shí)間間隔及其穩(wěn)定程度,奠定了乘客個(gè)體出行周期性度量的基礎(chǔ)。為使周期長(zhǎng)度劃分更精準(zhǔn),Zhong 等[11]提出的環(huán)形周期檢測(cè)法(Ring-like Periodic Detection Method,RPDM)比傳統(tǒng)的周期圖法和自相關(guān)法的抗噪聲能力強(qiáng)、魯棒性好,而且用信息熵模型能度量乘客個(gè)體出行周期性強(qiáng)度。

        已有公交乘客出行規(guī)律分類文獻(xiàn)中,有按刷卡次數(shù)、首次出行時(shí)間、上下車站點(diǎn)、乘車線路序列等指標(biāo)將乘客出行規(guī)律分為非常高、高、中、低和非常低[12],也有按個(gè)體出行時(shí)、空特征將乘客分為極少出行、空間規(guī)律、時(shí)間規(guī)律、時(shí)空規(guī)律和不規(guī)律[13],指標(biāo)選擇的主觀性是導(dǎo)致公交乘客出行規(guī)律分類結(jié)果不確定的重要因素[14]。已有文獻(xiàn)分別研究公交乘客出行重復(fù)性與周期性的熵值度量方法,鮮有聯(lián)合重復(fù)性與周期性的公交乘客個(gè)體出行規(guī)律度量相關(guān)文獻(xiàn)?;诖耍疚奶岢雎?lián)合重復(fù)性和周期性信息熵指標(biāo)進(jìn)行乘客出行規(guī)律分類的策略,以天為單位構(gòu)建公交乘客出行鏈并劃分個(gè)體出行模式,分別改進(jìn)重復(fù)性信息熵模型和周期性評(píng)分函數(shù),充分表征公交乘客個(gè)體出行活動(dòng)短期與長(zhǎng)期規(guī)律特征,基于K-Means++聯(lián)合重復(fù)性與周期性進(jìn)行公交乘客分類,避免因分類指標(biāo)選擇的主觀性造成公交乘客出行規(guī)律分類結(jié)果的不確定性,旨在為探索公交乘客個(gè)性化需求感知提供新的思路。

        1 研究方法

        1.1 個(gè)體出行規(guī)律度量

        公交乘客出行過(guò)程可視為多個(gè)事件的組合,以天為單位構(gòu)建日出行鏈進(jìn)行模式劃分,將乘客多天出行活動(dòng)表示為日出行鏈序列,相同出行鏈歸為同一類出行模式,即公交乘客同一種模式的出行鏈上相應(yīng)位置的時(shí)間、地點(diǎn)、頻數(shù)相同(近)。公交乘客個(gè)體出行記錄中包含重復(fù)性(短期)和周期性(長(zhǎng)期)兩類不同規(guī)律特征,重復(fù)性是指公交乘客個(gè)體采用同一模式出行的頻繁程度,周期性是指公交乘客個(gè)體采用同一模式出行的間隔及其穩(wěn)定性。

        (1)重復(fù)性指標(biāo)

        將公交乘客個(gè)體活動(dòng)看作隨機(jī)變量X,R為出行模式集合,N天內(nèi)出行模式x(x∈R)發(fā)生的概率為p(x),X的重復(fù)程度由出行模式的概率分布p(x)決定。當(dāng)x∈R時(shí),表示X的信息熵值的函數(shù)為

        信息熵表示乘客個(gè)體以特定模式出行的平均機(jī)會(huì),取值大于等于0。其值為0時(shí),表示乘客僅一種出行模式,重復(fù)性規(guī)律最強(qiáng);其值越大,表示乘客出行重復(fù)性規(guī)律越弱。

        不同乘客個(gè)體的重復(fù)性強(qiáng)度會(huì)有差異,因而構(gòu)建參數(shù)α區(qū)分乘客出行重復(fù)性強(qiáng)度。

        式中:n′為相同出行模式的重復(fù)天數(shù);α值越小表示重復(fù)程度越高。

        進(jìn)而,公交乘客個(gè)體出行重復(fù)性規(guī)律函數(shù)Hr為

        (2)周期性指標(biāo)

        出行周期性度量的RPDM 方法是判定乘客出行OD“是”“否”出現(xiàn)周期,無(wú)法獲得乘客個(gè)體每一出行模式發(fā)生的周期,這里加入出行模式變量j改進(jìn)RPDM。在確定乘客個(gè)體出行模式發(fā)生的周期前,先將乘客個(gè)體日出行鏈按發(fā)生的先后順序排列為出行鏈序列,用周期t(t=2,3,…,N2)分割出行鏈序列,得到若干等長(zhǎng)的片段,再將每一片段首尾相連形成出行周期環(huán)。

        將按t分割出行鏈序列所得的周期環(huán)數(shù)定義為Pt,周期環(huán)上出行模式j(luò)(j=1,2,…,Pt)在位置i(i=1,2,…,t)處表示為,其出現(xiàn)概率為,i的信息熵表示j在i出現(xiàn)的穩(wěn)定程度。將周期環(huán)上各位置的平均信息熵(Average Information Entropy,AIE)作為初始的周期評(píng)分函數(shù),即

        顯然,EAIE值越小,表明按t分割的出行周期越好。因此,可以用周期評(píng)分函數(shù)值表示出行鏈序列被分割的優(yōu)劣程度,比較不同t分割出行鏈序列的結(jié)果,可以得到最佳的出行周期。

        不過(guò),當(dāng)出行鏈序列分割不完全時(shí),其尾部被放棄部分所占的比例越低,周期評(píng)分函數(shù)越可信。為盡量利用尾部信息,這里構(gòu)造參數(shù)β來(lái)優(yōu)化式(4)所示的初始周期評(píng)分函數(shù),即

        式中:Na為出行鏈序列分割時(shí)放棄的尾部長(zhǎng)度。

        不同t分割出行鏈序列所得片段可能存在差異,長(zhǎng)度相同而序列片段數(shù)越多時(shí),表明周期劃分的結(jié)果越好。為此,構(gòu)造計(jì)算參數(shù)γ為

        優(yōu)化后的公交乘客個(gè)體出行周期評(píng)分函數(shù)Ht為

        周期評(píng)分函數(shù)值大于等于0,其值為0時(shí),表示乘客按一個(gè)固定周期出行,周期性規(guī)律最強(qiáng);其值越大,表示乘客個(gè)體出行周期性規(guī)律越弱。比較每個(gè)t下的周期評(píng)分函數(shù)值,可以得到最小周期評(píng)分及相應(yīng)最佳周期長(zhǎng)度t*,值表示最終公交乘客個(gè)體出行周期性規(guī)律程度。

        鑒于文獻(xiàn)[8-9,11-12]強(qiáng)調(diào)時(shí)間和空間維度的乘客出行規(guī)律特征有明顯差異,這里的重復(fù)性和周期性指標(biāo)均為包含時(shí)間和空間兩個(gè)維度的信息熵。為便于比較,將僅用重復(fù)性度量出行規(guī)律給乘客分類的方法稱為方法1,將聯(lián)合重復(fù)性信息熵與周期性信息熵度量出行規(guī)律給乘客分類的方法稱為方法2。

        1.2 K-Means++聚類

        公交乘客分類方法以DBSCAN(Density-Based Spital Clustering of Applications with Noise)和KMeans兩種算法為主,DBSCAN是基于數(shù)據(jù)密度聚類且需要預(yù)先確定鄰域參數(shù),而乘客個(gè)體出行數(shù)據(jù)量大、規(guī)律性值局部密集特征不明顯,基于數(shù)據(jù)密度聚類的DBSCAN算法可能因?yàn)猷徲騾?shù)選擇的主觀性導(dǎo)致聚類效果不佳,因此本文選用K-Means算法。不過(guò),K-Means 聚類時(shí)需先確定分類數(shù)K,隨機(jī)選擇K個(gè)乘客作為每個(gè)類的初始聚類中心,然后將其余乘客劃分到最近聚類中心對(duì)應(yīng)的類。由于乘客分為K類一次性完成,所得到的類不一定最佳,需重新計(jì)算每個(gè)聚類中心點(diǎn),以判定是否再次劃分乘客所屬的類,直到劃分結(jié)果不變。K-Means算法的初始聚類中心遠(yuǎn)離真實(shí)中心時(shí),可能出現(xiàn)局部最優(yōu)。對(duì)此,這里用K-Means++算法,隨機(jī)選取第1 個(gè)聚類中心后,采用隨機(jī)化種子技術(shù),使離已有聚類中心越遠(yuǎn)的點(diǎn)有更高概率被選為下一個(gè)聚類中心,避免出現(xiàn)局部最優(yōu),提高聚類的準(zhǔn)確性。

        若數(shù)據(jù)集GM包含M個(gè)乘客的個(gè)體出行信息,乘客s(1≤s≤M)第r(1≤r≤p)個(gè)特征為ysr,乘客s的出行活動(dòng)表示為ys={ys1,ys2,…,ysr,…,ysp},則用K-Means++將M個(gè)乘客分為K類的過(guò)程如下。

        Step 1 從GM中隨機(jī)選取一個(gè)乘客樣本作為初始聚類中心c1。

        Step 2 計(jì)算ys與已有聚類中心cm的距離d(ys,cm),1 ≤m≤(K-1),并確定ys與離其最近聚類中心的距離D(ys)。

        Step 3 計(jì)算ys被選為聚類中心cm+1的概率P(ys),依據(jù)P(ys)用輪盤法選出聚類中心cm+1。

        Step 4 重復(fù)Step 2 和Step 3,直至得到K個(gè)聚類中心。

        Step 5 找到離ys最近的聚類中心ck(1≤k≤K),將乘客s歸為類別k,計(jì)算ck的聚類目標(biāo)函數(shù)J。

        式中:d(ys,ck)為ys與ck的距離;ys歸屬于ck時(shí),δsk=1,否則δsk=0。

        Step 6 計(jì)算類別k中乘客群體Ck的質(zhì)心及其聚類目標(biāo)函數(shù)J′將作為Ck新的聚類中心ck。

        Step 7 (J-J′) ≤10-4或達(dá)到最大迭代次數(shù)(按Python 的Scikit-learn 庫(kù)中默認(rèn)值取300 次)聚類結(jié)束;否則,重復(fù)Step 5和Step 6。

        2 數(shù)據(jù)來(lái)源與處理

        采集浙江省海寧市2019 年10 月~12 月的公交數(shù)據(jù),將車輛AVL(Automatic Vehicle Location)的進(jìn)、出站記錄與乘客支付數(shù)據(jù)的公交卡號(hào)、刷卡時(shí)間、乘坐線路、上車站點(diǎn)等進(jìn)行匹配,構(gòu)建出行鏈推斷乘客下車站點(diǎn)及其時(shí)間,得到有效下車站點(diǎn)數(shù)據(jù)4090131 條。用60 min 閾值識(shí)別單次出行并剔除掉出行一次的乘客,得到3730794條有效數(shù)據(jù)。

        然后,構(gòu)建公交乘客出行時(shí)間和站點(diǎn)的集群,出行時(shí)間取上下車時(shí)間,出行站點(diǎn)按上下車站點(diǎn)統(tǒng)計(jì)。由于同一乘客每天出發(fā)時(shí)間與站點(diǎn)不完全相同,按時(shí)間間隔將出發(fā)時(shí)段表示為時(shí)間集群,按空間近似程度將出發(fā)站點(diǎn)表示為空間集群,分別排序后構(gòu)建出乘客日出行時(shí)間鏈和空間鏈,將相同時(shí)段、區(qū)域的出行鏈視作同一出行模式。據(jù)此,可得到海寧市公交乘客739062種出行時(shí)間鏈,人均8.85種;774511種出行空間鏈、人均9.27種。

        以4名乘客為例,不同乘客出行模式的規(guī)律程度差異如表1 所示。公交卡尾號(hào)5868 的乘客出行時(shí)間與空間規(guī)律均強(qiáng),主要時(shí)間模式“7:00-17:00”和空間模式“1-2-2-1”均占其出行天數(shù)的98.78%;公交卡尾號(hào)4437 的乘客出行時(shí)間與空間規(guī)律均弱,主要時(shí)間模式“10:00-11:00-13:00”僅占其出行天數(shù)的10.34%、空間模式“1-1-9-1-1-1-1-1”占其出行天數(shù)的15.51%。而且,同一乘客出行時(shí)間與空間規(guī)律有差異:公交卡尾號(hào)8943 的乘客出行時(shí)間規(guī)律強(qiáng)但空間規(guī)律弱,主要時(shí)間模式“7:00-18:00”占其出行天數(shù)的96.00%,但主要出行空間模式“1-10-3-1”占其出行天數(shù)的42.00%;相反,公交卡尾號(hào)1931的乘客出行時(shí)間規(guī)律較弱但空間規(guī)律強(qiáng),主要出行時(shí)間模式“7:00-17:00”占其出行天數(shù)的72.55%,主要出行空間模式“1-2-2-1”占其出行天數(shù)的96.08%。

        表1 公交乘客日出行模式示例Table 1 Travel patterns of four sample passengers

        3 結(jié)果分析

        用式(3)度量的公交乘客出行時(shí)間重復(fù)性信息熵值如圖1(a)所示,出行時(shí)間與空間重復(fù)性有一定相關(guān)性;用式(7)度量的出行時(shí)間周期性信息熵值如圖1(b)所示,出行時(shí)間與空間周期性的相關(guān)性不明顯。因而,有必要從出行時(shí)間、空間兩個(gè)維度,度量公交乘客個(gè)體出行重復(fù)性與周期性規(guī)律特征。

        圖1 乘客出行規(guī)律性指標(biāo)的相關(guān)性Fig.1 Distribution spatio-temporal regularity values of bus passengers

        以重復(fù)性為橫軸,周期性為縱軸,繪制乘客出行時(shí)間與空間規(guī)律信息熵值散點(diǎn)圖,如圖2 所示??梢钥闯?,圖2(a)與圖2(b)的重復(fù)性與周期性呈“三角”分布,出行規(guī)律程度的信息熵值分布在圖的左上部分。因此,可以將公交乘客按其出行規(guī)律程度分為重復(fù)性與周期性均強(qiáng)、重復(fù)性強(qiáng)但周期性弱,重復(fù)性與周期性均弱這3類。

        圖2 乘客出行規(guī)律特征值散點(diǎn)分布圖Fig.2 Periodicity and repeatability scatterplots of individual bus passengers

        從時(shí)間與空間兩個(gè)維度用方法2,即聯(lián)合重復(fù)性與周期性度量乘客出行規(guī)律,得到時(shí)間重復(fù)性、時(shí)間周期性、空間重復(fù)性、空間周期性這4 個(gè)信息熵指標(biāo),進(jìn)行K-Means++聚類將71080 名乘客分為3類。

        類別1 乘客出行重復(fù)性與周期性均強(qiáng),共14049 人,平均出行21 d,2.06 次·d-1;類別2 乘客出行重復(fù)性強(qiáng)但周期性弱,共38178 人,平均出行10 d,2.32 次·d-1;類別3 乘客出行重復(fù)性與周期性均弱,共18853 人,平均出行34 d,3.10 次·d-1,出行天數(shù)多且每天出行頻次高??傮w看,乘客類別1規(guī)律程度高、類別2次之、類別3規(guī)律程度低。

        用時(shí)間重復(fù)性與空間重復(fù)性兩個(gè)信息熵指標(biāo)(方法1)進(jìn)行K-Means++聚類,將乘客分為3 類,并用兩種方法的分類結(jié)果分別統(tǒng)計(jì)乘客出行時(shí)間頻數(shù)分布得到圖3。可以看出,類別1乘客早、晚高峰明顯且早、晚高峰時(shí)段差異不明顯,但高峰與非高峰差異大;類別2和類別3的高峰與非高峰差異小,早高峰晚于類別1而晚高峰早于類別1,早、晚高峰乘客數(shù)量的差異比類別1明顯。更重要的是,方法1中類別1 非高峰時(shí)段乘客數(shù)量明顯高于方法2;方法1 中類別2 白天各時(shí)段乘客數(shù)量高于方法2;相反,方法1 中類別3 白天各時(shí)段乘客數(shù)量低于方法2。

        圖3 兩種分類結(jié)果的乘客構(gòu)成變化Fig.3 Comparison of passenger distribution among three groups of two methods

        通過(guò)公交卡號(hào)和移動(dòng)支付碼統(tǒng)計(jì)兩種分類結(jié)果各類間的乘客個(gè)體變化,方法1 中乘客類別1 共28315 人,有13385 人與方法2 中類別1 的乘客相同,其余14930 人被方法2 歸為類別2 且這部分乘客出行時(shí)間特征與類別2 一致。類似地,方法1 中乘客類別2 共30010 人,有23248 人與方法2 中類別2的乘客相同,有664人被方法2歸為類別1且這部分乘客出行時(shí)間特征與類別1一致,有6098人被方法2歸為類別3且這部分乘客出行時(shí)間特征與類別3一致。同時(shí),方法1中乘客類別3中12755名乘客與方法2乘客類別3的乘客完全相同??傮w上看,聯(lián)合重復(fù)性與周期性度量乘客出行規(guī)律,使21692 名乘客的分類結(jié)果發(fā)生變化,占乘客總數(shù)的30.52%,圖3乘客分類結(jié)果的變化表明,方法2比方法1的分類結(jié)果合理。

        進(jìn)一步,在3類乘客中分別選擇出行天數(shù)不少于26 d(每周平均2 d以上)且最規(guī)律的300名乘客,以行表示乘客個(gè)體,列表示出行模式,繪制每一乘客個(gè)體出行模式熱力圖,如圖4所示。

        圖4 兩種方法分類結(jié)果的乘客出行模式比較Fig.4 Comparison of travel pattern among three passenger groups of two methods

        從圖4 可以看出,3 類公交乘客的出行規(guī)律特征存在差異,類別1 乘客出行模式少且以5 d 工作日和2 d非工作日共7 d的出行周期明顯,類別2乘客出行模式較多但出行周期不明顯,類別3乘客出行模式最多且出行周期比類別1 弱。將兩種方法下的同類乘客進(jìn)行比較,可以看出,圖4(b)類別1乘客的周期性比圖4(a)類別1明顯,而圖4(a)類別2和類別3乘客的周期性比圖4(b)類別2和類別3明顯,這也表明方法2的乘客分類結(jié)果比方法1合理。

        4 結(jié)論

        本文得到的主要結(jié)論如下。

        (1)針對(duì)用重復(fù)性表征公交乘客個(gè)體出行規(guī)律特征信息不完全的問(wèn)題,分別改進(jìn)了出行重復(fù)性信息熵模型和周期性評(píng)分函數(shù),基于K-Means++提出聯(lián)合重復(fù)性與周期性度量個(gè)體出行規(guī)律的公交乘客分類方法。

        (2)將浙江省海寧市的公交乘客分為重復(fù)性與周期性均強(qiáng)、重復(fù)性強(qiáng)但周期性弱、重復(fù)性與周期性均弱這3 類;比較乘客頻數(shù)分布與個(gè)體數(shù)量變化,證明聯(lián)合重復(fù)性與周期性可以使30.52%的乘客分類結(jié)果更合理;進(jìn)行乘客個(gè)體出行模式熱力圖比較,驗(yàn)證了方法的有效性。聯(lián)合重復(fù)性與周期性度量乘客個(gè)體出行規(guī)律,可以提升個(gè)性化公交需求識(shí)別精準(zhǔn)度。

        欧洲美女黑人粗性暴交视频| 亚洲黄片久久| 国产精品久久熟女吞精| 极品人妻少妇av免费久久| 成人精品视频一区二区三区尤物| 国产精品乱码在线观看| 国产亚洲精品hd网站| 亚洲肥婆一区二区三区| 在线播放五十路熟妇| 国产日韩精品中文字无码| 久久久久久中文字幕有精品| 青青草好吊色在线视频| 欧洲美女黑人粗性暴交视频| 国产精品嫩草影院av| 亚洲VA欧美VA国产VA综合| 久久91精品国产91久久跳舞| 狠狠躁天天躁无码中文字幕图| 18禁裸男晨勃露j毛免费观看 | av资源在线播放网站| 中文字幕亚洲一区二区不下| 亚洲色精品aⅴ一区区三区| 小12箩利洗澡无码视频网站| 国产精品一区又黄又粗又猛又爽 | 欧美xxxxx高潮喷水麻豆| 内谢少妇xxxxx8老少交| 日韩av一区二区三区四区av| 亚洲白嫩少妇在线喷水| 亚洲精品动漫免费二区| 国产98在线 | 免费| 91蜜桃国产成人精品区在线| 爆操丝袜美女在线观看| 麻豆精品久久久久久久99蜜桃| 囯产精品无码一区二区三区| 日产精品毛片av一区二区三区| 东北少妇不戴套对白第一次| 亚洲精品久久久久久| 少妇av免费在线播放| 日本最新一区二区三区在线视频| 无码一区二区三区在线 | 国产精品网站在线观看免费传媒| 免费毛片在线视频|