亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于熵率的公交乘客出行重復(fù)性度量方法

        2020-09-08 06:38:50崔洪軍朱敏清
        公路交通科技 2020年9期
        關(guān)鍵詞:信息熵重復(fù)性度量

        崔洪軍,趙 銳,朱敏清,李 霞

        (河北工業(yè)大學(xué) 土木與交通學(xué)院,天津 300401)

        0 引言

        在城市基礎(chǔ)設(shè)施日趨完善的今天,人們的出行變得更加多元化,隨之對出行規(guī)律的研究也逐漸成為熱門。研究方法多為通過對出行者時(shí)空變化進(jìn)行有效地考量繼而總結(jié)出規(guī)律。

        Alfred等[1]、Ma等[2]利用時(shí)空關(guān)聯(lián)理論分別分析了智能卡乘客在指定車站的乘降數(shù)量及關(guān)聯(lián)行程、針對北京智能卡出行者的出行時(shí)空特性規(guī)律進(jìn)行了研究。Kusakabe T等[3-4]對地鐵出行乘客的智能卡數(shù)據(jù)加以研究進(jìn)而得到出行者的出行時(shí)空關(guān)聯(lián)性信息。Ordóez等[5]對出行活動(dòng)進(jìn)行聚類,并利用分層選擇模型對為期7天的連續(xù)出行活動(dòng)進(jìn)行了分析。張晚笛等[6]基于多時(shí)間粒度對乘客的地鐵出行規(guī)律進(jìn)行了研究。楊光[7]對快速公交乘客的出行時(shí)空規(guī)律特征進(jìn)行了研究。Sang、Gordon、Nassir、Weng等基于智能卡數(shù)據(jù)對出行目的、出行鏈進(jìn)行了分類研究[8-11]。由此可知,學(xué)者多注重研究出行者連續(xù)多日的出行習(xí)慣及行為,繼而總結(jié)出規(guī)律,同時(shí)需要大量連續(xù)的研究數(shù)據(jù)做以支撐。

        1 出行重復(fù)性

        乘客出行有著很強(qiáng)的時(shí)空關(guān)聯(lián)性;同時(shí),在一定的時(shí)間閾值內(nèi),出行者因個(gè)體需要,會(huì)反復(fù)訪問某一地點(diǎn)并在此地點(diǎn)逗留近似時(shí)長。本研究將此定義為出行的重復(fù)性,即:一定時(shí)間跨度內(nèi),出行者訪問某一地點(diǎn)并逗留相近時(shí)長的反復(fù)程度稱為出行重復(fù)性。出行重復(fù)性可衡量出行者的出行偏好,在出行規(guī)律推算中有著重要的意義,但要在冗雜的數(shù)據(jù)中準(zhǔn)確分析所選個(gè)體的出行規(guī)律時(shí)即需對出行重復(fù)性進(jìn)行合理度量。在此有必要說明,本研究的重復(fù)性度量是對乘客出行重復(fù)程度的度量,研究乘客出行的重復(fù)程度可以輔助分析其出行規(guī)律,并可為交管部門提供交通線路優(yōu)化的第一手?jǐn)?shù)據(jù)材料。

        2 出行重復(fù)性度量

        2.1 出行序列生成

        度量出行重復(fù)性首先需要對乘客多日的出行進(jìn)行合理化排序。乘客的出行可鏈化為一系列出行序列,而出行序列中又包含了諸多出行關(guān)鍵特征事件,例如:地點(diǎn)、模式、路線、活動(dòng)類型、活動(dòng)持續(xù)時(shí)間等。這些特征事件的維度變化并不是獨(dú)立的[12-14],如:一個(gè)乘客對出行方式及線路的選擇會(huì)影響到他的出行起始時(shí)間和出行持續(xù)時(shí)間;而探究序列的要點(diǎn)在于對各關(guān)鍵特征事件進(jìn)行合理排序。

        本研究將出行序列用數(shù)學(xué)方法呈現(xiàn),通過排列關(guān)鍵特征事件順序來定義出行序列。將每名乘客在多日的出行活動(dòng)看作一個(gè)隨機(jī)過程,該過程用以表示特征事件的發(fā)生頻率及發(fā)生次序。設(shè)給定乘客個(gè)體u出行所對應(yīng)的隨機(jī)過程為Xu,在該過程中產(chǎn)生的特征事件為隨機(jī)變量Xu。同時(shí)假設(shè)每個(gè)特征事件均為一個(gè)離散變量x,該變量來自個(gè)體u出行時(shí)產(chǎn)生的可能出行特征事件集Eu,并以此識(shí)別特征事件的唯一性;當(dāng)且僅當(dāng)兩個(gè)特征事件具有相同的事件屬性組合時(shí),二者的x值相同。對于x∈Eu,Xu具有離散概率分布p(x)=P{Xu=x}。

        圖1 出行序列示意圖Fig.1 Schematic diagram of travel sequences

        2.2 下車地點(diǎn)確定

        本研究針對公交乘客的出行重復(fù)性進(jìn)行研究。在國內(nèi)大多城市中,公交車輛的收費(fèi)方式為一票制,即只存在上車刷卡的數(shù)據(jù),而乘客下車的站點(diǎn)數(shù)據(jù)無法直接得到。因此,要生成完整的乘客公交出行序列需要推算下車站點(diǎn)信息。本研究根據(jù)多日乘車數(shù)據(jù),基于經(jīng)典出行鏈方法對下車站點(diǎn)數(shù)據(jù)進(jìn)行推斷,以得到乘客的下車站點(diǎn)信息,進(jìn)而為后續(xù)出行地點(diǎn)狀態(tài)的標(biāo)定奠定基礎(chǔ)。

        乘客在日常出行中,往往以居住地為起點(diǎn),經(jīng)過一天中一系列的出行活動(dòng)后返回起始居住地點(diǎn),同時(shí),在這一系列的出行活動(dòng)中又多以各行程間首尾順次相接作為典型特征。因此,可將乘客的出行活動(dòng)看做一個(gè)鏈狀結(jié)構(gòu),即出行鏈,通過以下3個(gè)基本假設(shè)對算乘客的下車站點(diǎn)信息:

        (1)在同一出行日中,同一乘客的前一次出行終點(diǎn)為其緊鄰下一次出行的起點(diǎn);

        (2)在同一出行日中,乘客最后一次出行的終點(diǎn)為其當(dāng)日首次出行的起點(diǎn);

        (3)在客觀條件不變的情況下,乘客總是選取離自己最近的乘車站點(diǎn)開始下一段行程。

        依照以上3個(gè)假設(shè),可推算出絕大部分乘客的下車站點(diǎn)信息,其準(zhǔn)確率為93%[15]。

        2.3 出行地點(diǎn)狀態(tài)標(biāo)定

        本研究側(cè)重于公交乘客出行的重復(fù)性,同時(shí)也因數(shù)據(jù)源的局限性,只對公交出行乘客的出行數(shù)據(jù)進(jìn)行了分析?,F(xiàn)實(shí)生活中,乘客可能采用公交、軌道交通等復(fù)合出行方式,繼而會(huì)影響到本研究對于乘客出行目的地的判斷。因而,針對此問題,本研究將可推算下車站點(diǎn)的出行即視為一次完整的出行。如該乘客在推斷的下車站點(diǎn)下車后采用了非公交的其他交通出行方式到達(dá)下一目的地,筆者則將其目的地一概劃入上文推算得到的下車站點(diǎn)中,而逗留時(shí)間起始值也按照該乘客在該站點(diǎn)下車的時(shí)間計(jì)算。簡言之:在乘客下車后,當(dāng)無法判斷其是否還采用了其他非公交出行方式到達(dá)他處時(shí)即認(rèn)為乘客在下車地點(diǎn)附近停留,并以此記錄逗留時(shí)長?;谠摾碚摲椒?,可盡可能地減少因數(shù)據(jù)局限性引發(fā)的對于乘客出行規(guī)律以及公交出行需求的判斷誤差。

        將乘客的出行地點(diǎn)狀態(tài)進(jìn)行標(biāo)定,其中狀態(tài)1,2…依照乘客出行的逗留時(shí)間予以劃分。具體描述如表1所示。

        表1 出行地點(diǎn)狀態(tài)描述Tab.1 Description of travel location status

        在此,以某持卡人出行記錄為例,其2018年1月1日—2018年2月1日的部分出行記錄如表2所示。

        表2 持卡人出行記錄Tab.2 Cardholder’s travel record

        以出行地點(diǎn)狀態(tài)為依據(jù)將其出行特征序列進(jìn)行排序,故可將此持卡人在2018年1月1日—2018年2月1日期間的出行序列簡化為(1,2,1,2,3,1,2,1,4,3,5),基于簡化的出行序列可對乘客每一出行地點(diǎn)的出行概率p(x)進(jìn)行計(jì)算,同時(shí)也將出行序列以數(shù)學(xué)方法進(jìn)行了表述,為后續(xù)出行重復(fù)性的度量做好準(zhǔn)備。

        以收集到的2018年1月1日—2018年2月1日石家莊公交智能卡乘客出行數(shù)據(jù)為例,將乘客的出行記錄進(jìn)行鏈化處理,依照前文所述方法將出行序列進(jìn)行整理后得到如圖2所示的46 923名乘客的出行特征事件序列分布情況。其中橫坐標(biāo)所示的出行特征事件序列長度指乘客出行中的地點(diǎn)狀態(tài)累計(jì)排列長度。

        圖2 出行特征事件序列長度分布Fig.2 Distribution of travel characteristics event sequence lengths

        3 度量方法

        如前文所述,本研究將出行者個(gè)體多日的出行特征事件看作隨機(jī)過程X,以此來度量出行序列。隨機(jī)過程X中不同的特征屬性可提供關(guān)于個(gè)人出行的不同規(guī)律信息,集合E中的關(guān)鍵特征事件個(gè)數(shù)表達(dá)了出行活動(dòng)的多樣性,而概率分布p(x)則可表現(xiàn)個(gè)人出行活動(dòng)的頻率。下面針對以上諸多性質(zhì),介紹其推算方法,并以此來度量出行重復(fù)性。

        3.1 出行序列的信息熵

        無論出行特征屬性如何排序,首先均應(yīng)核算出行序列的重復(fù)程度。在前文給定的假設(shè)下,隨機(jī)過程X(即出行特征序列)的規(guī)律性完全由概率分布p(x)決定。通常情況下:一個(gè)規(guī)律性的出行過程會(huì)產(chǎn)生更為確定且更易估計(jì)的出行規(guī)律結(jié)果。在信息論中,一個(gè)過程的隨機(jī)性或不可預(yù)測性可以用信息熵來衡量。信息熵以比特(bits)為單位,其可度量每次預(yù)測隨機(jī)變量時(shí)所需的平均信息,即基于現(xiàn)有信息推測乘客今后出行潛在訪問地點(diǎn)所需的信息量值。

        當(dāng)x∈E時(shí),具有概率分布p(x)=P{X=x}的隨機(jī)變量X的信息熵H(X)可用公式(1)表示。其中X為出行序列中被看做隨機(jī)變量的乘客訪問地點(diǎn)狀態(tài),E為給定個(gè)體出行時(shí)所有可能的特征事件集合。

        (1)

        對于乘客出行的地點(diǎn)序列而言,信息熵為考量出行地點(diǎn)在研究時(shí)段中被出行者訪問概率的方差,當(dāng)乘客只有一個(gè)備選訪問地點(diǎn)時(shí),其出行序列的信息熵為0。而當(dāng)乘客出行地點(diǎn)隨出行時(shí)段分布越均勻時(shí),其出行序列的信息熵就越大,出行重復(fù)性越高。

        將上述46 923名乘客出行特征序列的信息熵按照式(1)計(jì)算后,分布情況如圖3所示。其中,信息熵分布的均值為2.53 bits。

        圖3 智能卡乘客出行序列的信息熵分布Fig.3 Distribution of information entropies of smart card passengers’ travel sequence

        3.2 出行序列熵率

        盡管信息熵可以較好地度量出行序列中乘客訪問某一地點(diǎn)的重復(fù)性,但卻不能良好地反映隨時(shí)間變化時(shí)該乘客訪問某一出行地點(diǎn)的重復(fù)程度。與此同時(shí),特征事件Xi的條件概率分布也取決于事件Xi-1,Xi-2的分布結(jié)果(p(Xi|Xi-1,Xi-2,…)≠p(Xi)),即出行地點(diǎn)排列的先后順序。因此,筆者在此引入熵率來度量出行的重復(fù)性。

        (2)

        由文獻(xiàn)[16-17]可知:在所有平穩(wěn)隨機(jī)過程中此極限必存在,且等于式(3)所示,其中pn為長度n的子地點(diǎn)狀態(tài)序列的聯(lián)合分布概率。

        (3)

        結(jié)合式(2)、(3)可知,熵率測算的是隨機(jī)過程X中每一新產(chǎn)生的特征事件占之前特征事件信息熵的平均值,即反映了在乘客的出行地點(diǎn)狀態(tài)序列中,該乘客每新增一個(gè)訪問地點(diǎn),對其整體地點(diǎn)序列信息熵的影響變化情況。出行序列熵率的上界為該出行序列信息熵的值,而當(dāng)出行地點(diǎn)狀態(tài)序列中乘客新訪問的地點(diǎn)可完全由先前的地點(diǎn)狀態(tài)決定時(shí)(p(Xi=x|Xi-1,Xi-2,…)=1),其熵率為0。

        通俗來講,熵率是一系列事件中產(chǎn)生新生信息多少的度量,先前數(shù)據(jù)中存有的信息越多,可提供給后續(xù)數(shù)據(jù)分析的信息就越多,而可供挖掘的新信息就越少,相應(yīng)的,其熵率就越小。因而熵率可用來度量乘客的出行重復(fù)性,出行序列的熵率越小,則該乘客的出行重復(fù)性越高,出行規(guī)律性越強(qiáng)。

        3.3 熵率的計(jì)算

        表3 BWT轉(zhuǎn)換過程示例Tab.3 An example of BWT transform process

        在任一平穩(wěn)隨機(jī)過程X中,通過BWT均可將有限記憶序列轉(zhuǎn)化為分段形式的無記憶序列,通過這一過程可推算出原始序列過程的熵率。將變換后的序列分割為等長的s段,根據(jù)式(4)估計(jì)每段的結(jié)果分布。其中,Ns(x)為字符x在段落s中出現(xiàn)的次數(shù),而每一段s的信息熵由式(5)得到;q為字符出現(xiàn)次數(shù)的估計(jì)值,最后通過每一段信息熵的均值求得隨機(jī)過程X即乘客出行序列的熵率,由式(6)表示。

        (4)

        (5)

        (6)

        將上述46 923名乘客出行特征序列的熵率按上述方法計(jì)算后,分布情況如圖4所示。其中,熵率分布的均值為1.13 bits/事件。

        圖4 智能卡乘客出行序列熵率分布Fig.4 Distribution of entropy rates of smart card passengers’ travel sequence

        由上文可知,如不考慮事件發(fā)生順序所提供的信息,乘客的出行序列排序結(jié)果幾乎與公平擲骰子結(jié)果一致(擲骰子的信息熵為2.6 bits,而所研究乘客出行序列的信息熵均值為2.53 bits)。若一個(gè)人只在家庭和工作地(p(home)=p(work)=0.5)之間出行,則其熵為1 bits,等同于拋硬幣所產(chǎn)生結(jié)果的信息熵(信息熵為1 bits)。而熵率是考慮了事件發(fā)生順序時(shí)信息熵的值,文中考慮乘客的出行地點(diǎn)序列及目的地逗留持續(xù)時(shí)間。結(jié)合圖3、圖4可觀察到:出行序列的信息熵與熵率二者均值之差為1.4 bits,意味著考慮乘客出行事件的發(fā)生順序可使乘客出行重復(fù)性度量時(shí)的不確定性顯著降低,并有助于出行規(guī)律的推算。

        4 應(yīng)用與效果分析

        以石家莊公交智能卡出行數(shù)據(jù)為例,介紹該方法的實(shí)際應(yīng)用。分別選取編號(hào)為A、B、C、D的4名持卡人2018年1月1日—2018年2月1日期間的出行信息,將其出行記錄按照本研究所述方法進(jìn)行排列,計(jì)算得到以上4人的出行序列信息的信息熵及熵率值如表4所示。

        表4 所選乘客出行重復(fù)性度量指標(biāo)統(tǒng)計(jì)Tab.4 Statistics of selected passengers’ travel repeatability measurement

        根據(jù)不同地點(diǎn)的出行序列分布情況,結(jié)合乘客活動(dòng)的持續(xù)時(shí)間,可得到其出行序列分布情況分別如圖5所示。圖中不同紋理圖案表示該乘客的不同出行地點(diǎn)。

        圖5 乘客出行活動(dòng)序列Fig.5 Travel sequence of passengers

        由圖5(a)可知,該持卡乘客1月內(nèi)訪問5個(gè)出行地點(diǎn)的次數(shù)幾乎相同,工作日時(shí)段,該乘客固定的已知出行地點(diǎn)為5個(gè),而周末時(shí)多為2個(gè);其在每周一13:00—15:00時(shí)左右均會(huì)產(chǎn)生未知出行。出行地點(diǎn)訪問順序較為一致。此外,雖此用戶的多日出行活動(dòng)并不完全一致,但呈現(xiàn)出明顯規(guī)律,其出行重復(fù)性較強(qiáng),此結(jié)論可通過熵率在研究數(shù)據(jù)均值以下而得以佐證。

        圖5(b)、5(c)直觀來看并無規(guī)律性可言,但由出行序列的信息熵均在均值以上可知,兩位持卡用戶的出行較為規(guī)律。仔細(xì)分析圖像可見,圖5(b)用戶間隔兩周的出行序列顯示出重復(fù)性,即:第4周與第1周重復(fù),第2周與第5周重復(fù)?;诒狙芯康闹貜?fù)性度量方法,有理由相信:該用戶1月第3周的出行在接下來的日歷周期中會(huì)有較大的可能出現(xiàn)重復(fù)。而圖5(c)用戶在1月第1,3,5周及第2、4周的出行分別顯示出重復(fù)性,單數(shù)周與雙數(shù)周的出行需求并不一致,但總體卻呈現(xiàn)出規(guī)律性。

        圖5(d)展示了通過熵率測量而得到的另一個(gè)出行重復(fù)性度量實(shí)例。該乘客的出行模式在研究期間一直持續(xù),卻并不是嚴(yán)格意義上的周期性重復(fù),因而常規(guī)出行鏈模型可能無法捕捉到其間斷性的出行規(guī)律,但基于本研究提出的出行重復(fù)性度量方法,可明確地捕捉到數(shù)據(jù)集中此用戶的出行規(guī)律性。由圖可知,在4種不同的情況下,該乘客由主要位置(深色格紋)出行至次要位置(淺色斜紋),并在1~2 天后進(jìn)行反向出行。查閱ADCs系統(tǒng)數(shù)據(jù)可知,淺色斜紋所示位置區(qū)域臨近石家莊北站,該乘客可能在此處離開石家莊度過周末;該用戶在周五或周六離開,并在接下來一周的周一返回。

        通過上述4名持卡人的出行記錄及經(jīng)由本研究所述方法計(jì)算后可分析得到乘客的出行規(guī)律信息。基于該方法,在可獲得的研究數(shù)據(jù)較為有限的情況下可通過乘客的出行重復(fù)性判斷其出行規(guī)律特征,并依此推斷其今后一定時(shí)段內(nèi)的出行需求。與此同時(shí),基于乘客出行序列的信息熵及熵率可對新增出行信息的多少進(jìn)行度量評價(jià),因此,結(jié)合其概率特性,使用該法可對乘客今后一段時(shí)間內(nèi)的出行進(jìn)行預(yù)測。

        此外,由本研究的出行序列與時(shí)間分布信息圖可看出乘客在具體某一地點(diǎn)的停留時(shí)間,通過分析大量持卡人的出行數(shù)據(jù)可得到公交站點(diǎn)的上下客人數(shù)及各站點(diǎn)的載客高峰時(shí)段,結(jié)合本研究的出行重復(fù)性可對公交線路進(jìn)行站點(diǎn)選址、線路密度安排、車輛時(shí)間間隔優(yōu)化等一系列交通規(guī)劃管理工作。

        5 結(jié)論

        (1)對出行重復(fù)性概念進(jìn)行了定義及闡述。

        (2)用數(shù)學(xué)方法結(jié)合隨機(jī)過程對乘客的多日出行片段進(jìn)行鏈化排序,對乘客出行地點(diǎn)進(jìn)行狀態(tài)標(biāo)定,得到了度量出行重復(fù)性所需的基于地點(diǎn)狀態(tài)的乘客出行序列。

        (3)利用信息熵及熵率對乘客的出行重復(fù)性進(jìn)行度量。信息熵是對概率分布方差的考量,其分布越均勻,相應(yīng)的信息熵就越大,出行重復(fù)性就越高;而熵率作為對事件中新生信息產(chǎn)生量的度量,可更好地表現(xiàn)隨機(jī)事件隨時(shí)間變化時(shí)事件的重復(fù)程度,新生信息越少,其熵率就越小,出行的重復(fù)性越高。

        (4)結(jié)合石家莊智能卡乘客的出行數(shù)據(jù),通過4名乘客的出行實(shí)例分析了本研究所述方法的實(shí)用效果,利用出行序列圖表直觀地反映了乘客研究時(shí)段內(nèi)出行的重復(fù)性,同時(shí),該法為以少量研究數(shù)據(jù)推算較長周期內(nèi)乘客的出行規(guī)律提供了新思路。

        猜你喜歡
        信息熵重復(fù)性度量
        有趣的度量
        基于信息熵可信度的測試點(diǎn)選擇方法研究
        模糊度量空間的強(qiáng)嵌入
        化學(xué)分析方法重復(fù)性限和再現(xiàn)性限的確定
        昆鋼科技(2021年2期)2021-07-22 07:46:56
        迷向表示分為6個(gè)不可約直和的旗流形上不變愛因斯坦度量
        論重復(fù)性供述排除規(guī)則
        基于信息熵的實(shí)驗(yàn)教學(xué)量化研究
        電子測試(2017年12期)2017-12-18 06:35:48
        翻斗式雨量傳感器重復(fù)性試驗(yàn)統(tǒng)計(jì)處理方法
        水利信息化(2017年4期)2017-09-15 12:01:21
        一種基于信息熵的雷達(dá)動(dòng)態(tài)自適應(yīng)選擇跟蹤方法
        地質(zhì)異常的奇異性度量與隱伏源致礦異常識(shí)別
        中文字幕亚洲欧美日韩2019| 久久久调教亚洲| 青春草在线视频精品| 精品国产一区二区三区久久狼| 中文字幕一区二区三区在线乱码| 亚洲国产精品成人av| 国产一区二区美女主播| 亚洲av专区国产一区| 亚洲视频在线一区二区| 国产精品亚洲色婷婷99久久精品| 国模吧无码一区二区三区| 亚洲国产精品va在线看黑人| 日产国产精品亚洲系列| 蜜臀av一区二区| 中文字幕亚洲精品第1页| 亚欧视频无码在线观看| 国产一区二区三区免费小视频| 精品亚洲一区中文字幕精品| 日产精品高潮一区二区三区5月| 亚洲图片自拍偷图区| 国产色在线 | 日韩| 一边吃奶一边摸做爽视频| 无码熟妇人妻av在线影片| 亚州精品无码人妻久久| 亚洲中字幕永久在线观看| 日本高清中文字幕二区在线| 亚洲av高清不卡免费在线| 无码人妻丰满熟妇啪啪网不卡 | 青青草手机在线免费视频| 午夜免费观看国产视频| 蜜桃传媒免费在线播放| 久久久久人妻一区二区三区| 中文字幕无码日韩专区免费| 亚洲成在人线av| 亚洲无AV码一区二区三区| 人妖与人妖免费黄色片| 中文字幕乱码亚洲在线| 超碰色偷偷男人的天堂| 亚洲中文字幕国产综合| 91精品国产福利尤物免费| 国产精品香蕉网页在线播放|