亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的高鐵旅客出行選擇行為分析

        2024-12-04 00:00:00劉睿
        中國新技術(shù)新產(chǎn)品 2024年11期
        關(guān)鍵詞:深度學(xué)習(xí)

        摘 要:在高鐵大數(shù)據(jù)時代,基于海量出行數(shù)據(jù)對旅客選擇行為進行精準建模與預(yù)測,不僅可為產(chǎn)品設(shè)計提供支持,還可進行差異化運力調(diào)整,意義重大。本文融合前沿深度學(xué)習(xí)技術(shù),聚焦北京滬線的工作日OD票務(wù)數(shù)據(jù),考量旅客進行選擇決策時各類屬性(到達-出發(fā)站,到達-出發(fā)時間等)的綜合影響,構(gòu)建用戶偏好模型,通過挖掘?qū)傩蚤g的復(fù)雜關(guān)聯(lián)模式,對乘客選擇行為進行準確歸納與模擬。研究表明,與傳統(tǒng)模型相比,該方法可以顯著提升選擇預(yù)測精度。

        關(guān)鍵詞:出行選擇行為分析;深度學(xué)習(xí);客票數(shù)據(jù);京滬高鐵

        中圖分類號:U 293" " " " " " 文獻標志碼:A

        分析高鐵旅客出行選擇行為對高鐵產(chǎn)品設(shè)計和運輸組織至關(guān)重要。相關(guān)研究主要有2類,即基于調(diào)查(RP/SP)數(shù)據(jù)的分解模型和基于客票大數(shù)據(jù)的聚合模型[1]。張航等[2]利用京滬高鐵旅客出行RP調(diào)查數(shù)據(jù)構(gòu)建了旅客出行計劃的MNL模型。陳凱[3]建立高鐵公司收入最大化的分時定價模型,并利用遺傳算法進行求解,增加了高鐵運營企業(yè)的客運收益。羅鈞韶[4]利用空間匹配算法挖掘車輛出行軌跡,分析乘客出行分布特征等,并將其應(yīng)用于城市交通規(guī)劃。隨著大數(shù)據(jù)處理技術(shù)發(fā)展,馬書紅等[5]將旅客屬性、心理感知和選擇行為進行了融合,構(gòu)建了基于出行鏈的混合選擇模型。黃欣等[6]提出旅客行程服務(wù)記錄(PSR)概念,設(shè)計了鐵路電子客票技術(shù)方案。強麗霞等[7]基于離散選擇框架,建立描述旅客選擇行為的模型,闡明了出行分析的回歸方法。崔愿等[8]發(fā)揮不同數(shù)據(jù)源的比較優(yōu)勢,構(gòu)建覆蓋多運輸方式、旅客流總量和過境比例分析模型。

        本文以京滬虹橋高鐵平時的車票數(shù)據(jù)為基礎(chǔ),將車票數(shù)據(jù)的屬性作為深度學(xué)習(xí)模型的映射特征,研究旅客對不同類型列車的偏好,為運用大數(shù)據(jù)支撐智能決策奠定基礎(chǔ)。

        1 高鐵旅客選擇的影響因素分析

        旅客出行選擇的影響因素主要有2個方面,即旅客社會經(jīng)濟特征和列車特征。有學(xué)者將影響因素分為旅客主因素、列車特性和隨機因素,研究了鐵路旅客的選擇行為,包括到發(fā)站、到發(fā)站的GDP(萬億元/年)、到發(fā)時間、車票票價、乘車時間和座次。此外,列車運力約束和鐵路售票策略也會對旅客的實際選擇行為產(chǎn)生一定影響。從車票數(shù)據(jù)中可以反映出許多信息。1)OD里程。2)座位容量。座位容量與票務(wù)銷售策略有關(guān),列車運力越大,選擇乘客的可能性就越大。3)負載系數(shù)。負載系數(shù)反映了列車張力和列車運力,列車的載客率越高,列車運力越緊張,乘客可選擇的自由度越小。4)原點站系數(shù)。起源站的車票較多,車票較容易購買,旅客也有較充裕的上車時間和較好的列車環(huán)境。5)服務(wù)頻率。服務(wù)頻率是一天內(nèi)相同OD可服務(wù)的列車數(shù)量,服務(wù)頻率越高,乘客的選擇性自由度越高。6)總?cè)舜巍?側(cè)舜畏从沉寺每蛯嚻钡母偁幊潭?。乘客總?shù)越大,競爭越激烈,乘客選擇的自由度就越小。

        2 基于深度學(xué)習(xí)的模型概述

        2.1 模型概述

        深度學(xué)習(xí)是一種從數(shù)據(jù)中學(xué)習(xí)表示的新方法,強調(diào)從連續(xù)層學(xué)習(xí),這些連續(xù)層對應(yīng)越來越有意義的表示。深度學(xué)習(xí)模型的基礎(chǔ)是感知器,感知器接收來自n個其他感知器Xn的輸入信號。這些輸入信號通過加權(quán)連接Wn傳輸。將感知器接收到的輸入值與感知器的偏置bn進行比較,再通過激活函數(shù)σ(z)輸出感知器結(jié)果。它一般有3層或3層以上的神經(jīng)網(wǎng)絡(luò),包括一層輸入、一層輸出和幾個中間層。神經(jīng)網(wǎng)絡(luò)各層的輸出為σ(WnXn+bn)。

        目前,深度學(xué)習(xí)網(wǎng)絡(luò)模型主要分為密集前饋網(wǎng)絡(luò)模型、卷積網(wǎng)絡(luò)模型和遞歸網(wǎng)絡(luò)模型。由于本文中的數(shù)據(jù)沒有考慮時間,并且數(shù)據(jù)間沒有序列關(guān)系,因此采用前饋網(wǎng)絡(luò)模型。深度學(xué)習(xí)的前饋網(wǎng)絡(luò)模型可以通過一系列簡單的數(shù)據(jù)轉(zhuǎn)換(層)并由一系列輸入特征映射到目標。

        本文采用的深度學(xué)習(xí)前饋網(wǎng)絡(luò)與上層、下層完全連接,產(chǎn)生的信號向前傳輸,反饋誤差信號向后傳輸。將計算出的損失函數(shù)的輸出值作為反饋信號,并對權(quán)重和偏置進行微調(diào)以減小損失值,直到達到最小損失,從而得到訓(xùn)練好的網(wǎng)絡(luò)。此調(diào)整由優(yōu)化器完成。

        2.2 模型構(gòu)建

        數(shù)據(jù)處理完成后,將京滬高鐵客票數(shù)據(jù)的屬性作為深度學(xué)習(xí)全連網(wǎng)絡(luò)的輸入特征。通過一系列圖層變換,最終映射到選擇不同列車的人數(shù),得出不同列車的乘客選擇概率。建立深度學(xué)習(xí)網(wǎng)絡(luò)模型的步驟如下。

        2.2.1 數(shù)據(jù)處理

        數(shù)值和文本數(shù)據(jù)被處理為適合模型輸入的張量類型。將列車到達時間-出發(fā)時間作為0~1440的分鐘數(shù)進行處理,并將距離系數(shù)擴大100倍,以方便處理,文本數(shù)據(jù)通過one-hot編碼進行處理。在本文中,到達和出發(fā)站、座位類型以及是否為始發(fā)站均通過one-hot編碼進行處理。最后,對每個特征進行標準化處理,即減去輸入數(shù)據(jù)的每個特征(輸入矩陣的列)的平均值,將其除以標準偏差,并使特征的平均值為0,標準差為1。

        2.2.2 損失函數(shù)

        在本文中,損失函數(shù)為MAE(平均絕對誤差),計算過程如公式(1)所示。

        (1)

        式中:yi為預(yù)測選定列車旅客數(shù);xi為實際選定列車旅客數(shù);n為樣本數(shù)據(jù)的大小。

        2.2.3 模型超參數(shù)調(diào)整

        模型超參數(shù)包括網(wǎng)絡(luò)層數(shù)、每個中間層的節(jié)點數(shù)以及優(yōu)化器。深度學(xué)習(xí)網(wǎng)絡(luò)模型包括輸入層、輸出層和若干中間層。為了獲得最適合模型數(shù)據(jù)的網(wǎng)絡(luò)層,選擇相對較少的層(3層)。在本文中,數(shù)據(jù)經(jīng)過一次one-hot編碼處理后具有64維。因此,選擇的中間點必須>64,以更好地表示數(shù)據(jù)形成的三維空間,并根據(jù)平均損耗逐步調(diào)整具有不同節(jié)點數(shù)的網(wǎng)絡(luò)層中間層,直至平均損耗無明顯變化,最終實現(xiàn)中間節(jié)點數(shù)的最優(yōu)組合為256-128-64-1。不同網(wǎng)絡(luò)層的平均最小預(yù)測損耗值如圖1所示。

        從圖1可以看出,隨著中間網(wǎng)絡(luò)層數(shù)逐漸增加,模型預(yù)測的平均最小損耗值逐漸變小,而模型的中間網(wǎng)絡(luò)層數(shù)>7,預(yù)測結(jié)果沒有明顯改善,因此模型最終選擇了7個中間層的組合。目前,Adam優(yōu)化器、隨機梯度下降(SGD)和RMSprop算法是深度學(xué)習(xí)模型中的常用算法。根據(jù)不同優(yōu)化器下的損失,選擇最合適的模型數(shù)據(jù)的優(yōu)化器。通常,RMSprop比SGD具有更好的優(yōu)化效果,而Adam獲得的損失值較小,因此本文將Adam作為該模型的優(yōu)化器。本文共有5617個訓(xùn)練樣本。為了盡快獲得最佳質(zhì)量和偏差并加快訓(xùn)練效率,批量大小選擇128。

        調(diào)試后選擇的深度學(xué)習(xí)模型的超參數(shù)結(jié)構(gòu)如下:一層輸入,7個中間層,一層輸出;每一層的節(jié)點分別為輸入層-256-128-64-1(輸出層);優(yōu)化器是Adam;激活函數(shù)選擇通常用于機器學(xué)習(xí)的Relu函數(shù)。深度學(xué)習(xí)開發(fā)環(huán)境為TensorFlow 2.0 PyCharm。

        2.3 參數(shù)設(shè)置

        本文模型中共有5個參數(shù),包括輸入序列的時間步長T、預(yù)測序列的時間步長T'、高鐵站附近的距離閾值D、空間子網(wǎng)的多頭注意機制數(shù)量K以及時間子網(wǎng)的隱藏狀態(tài)維數(shù)M。設(shè)T=18,T'=6,即利用過去3h內(nèi)多個車站的客流量來預(yù)測一個高鐵站未來1h內(nèi)的客流量。將一個高鐵站的距離閾值設(shè)定為1000m,即預(yù)測某一地點的車站未來客流量時,考慮1000m內(nèi)的高鐵站客流對該車站未來客流量的影響。多頭注意機制的數(shù)量K和時間子網(wǎng)的隱藏狀態(tài)維數(shù)M均設(shè)置為16。

        3 案例分析

        將2019年4月某周二京滬高鐵線路的OD客票數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。原因是這段時間列車運力充裕,對乘客限制較少,因此可以盡可能選擇自己滿意的列車。樣本數(shù)為5617。將2019年5月的周二作為預(yù)測數(shù)據(jù),樣本總數(shù)為5373。為了減少個人主觀選擇的偶然性帶來的誤差,對于4月3個周二(20190410、20190417和20190424),以選擇不同列車的平均乘客數(shù)作為訓(xùn)練數(shù)據(jù)的目標;對于五一假期后的3個周二(20190508、20190515和20190522),選取平均人數(shù)作為預(yù)測目標,剔除人數(shù)較少(一般<10)的OD,以減少隨機誤差。部分原始票證數(shù)據(jù)見表1,數(shù)據(jù)包括日期、列車、始發(fā)站、始發(fā)時間到達站、到達時間、里數(shù)、座位類型、旅客和票價等。為了更好地分析旅客出行行為,對數(shù)據(jù)進行擴充和優(yōu)化,增加服務(wù)頻次、始發(fā)站以及達站GDP等數(shù)據(jù),處理后的數(shù)據(jù)見表2。

        由于同一地區(qū)的旅客具有相似的選擇特征,為了更好地進行分類,利用模糊聚類分析方法,根據(jù)到發(fā)交通流量、車站節(jié)點的位置、經(jīng)濟水平以及人口水平,將京滬高鐵線路的站級劃分為4個等級。分類結(jié)果見表3。

        根據(jù)客票數(shù)據(jù),可以從深度學(xué)習(xí)網(wǎng)絡(luò)模型中獲得京滬高鐵不同ODs不同列車的實際選擇概率,并與擬合結(jié)果進行比較,總體擬合效果良好。以北京南-上海虹橋為例,實際乘客選擇與擬合結(jié)果的比較如圖2所示??梢钥闯觯疃葘W(xué)習(xí)模型在預(yù)測上海虹橋到北京南的乘客選擇概率方面具有很好的擬合精度。不同節(jié)點的不同OD的選擇精度數(shù)據(jù)見表4。

        由于頭等艙節(jié)點通常是相對較大的綜合樞紐節(jié)點,客流量較多,乘客的出行選擇行為非常復(fù)雜,并涉及大量影響因素。因此,第一級節(jié)點的OD與其他節(jié)點間的擬合效果不理想。對于這種類型的OD,在后續(xù)的研究中將進一步增加映射特征維度,并增加票數(shù)據(jù)量,以提高擬合精確度。

        4 結(jié)論

        鑒于獨特的模式識別能力和數(shù)據(jù)規(guī)則提取能力,深度學(xué)習(xí)模型在大量數(shù)據(jù)的支持下不需要領(lǐng)域知識,越來越多的非參數(shù)機器被用于新興的行為選擇研究。本文采用深度學(xué)習(xí)網(wǎng)絡(luò)模型對京滬高鐵市場進行了分析,將車票數(shù)據(jù)的屬性作為深度學(xué)習(xí)模型的特征向量,映射出不同類型列車的高鐵旅客選擇概率。結(jié)果表明,深度學(xué)習(xí)模型可以較好地預(yù)測設(shè)計指標。本文僅對周二的門票數(shù)據(jù)進行分析,數(shù)據(jù)量有限。后續(xù)研究可以通過增加特征向量來提高預(yù)測精度,并增加數(shù)據(jù)訓(xùn)練量。

        參考文獻

        [1]曹堉,王成,王鑫,等.基于時空節(jié)點選擇和深度學(xué)習(xí)的城市道路短時交通流預(yù)測[J].計算機應(yīng)用,2020,40(5):1488-1493.

        [2]張航,趙鵬,喬珂,等.高速鐵路旅客出行時間選擇Logit模型與分析[J].鐵道運輸與經(jīng)濟,2017,39(1):55-60.

        [3]陳凱.基于旅客出行方式選擇的高速鐵路客運分時定價方案研究[J].鐵路計算機應(yīng)用,2022,31(9):57-62.

        [4]羅鈞韶,潘嘉杰.基于GPS數(shù)據(jù)挖掘的出租車出行特征分析[J].交通與運輸,2020,33(增刊2):49-54.

        [5]馬書紅,李陽,岳敏.考慮出行鏈的城際旅客換乘選擇行為研究[J].北京交通大學(xué)學(xué)報,2020,44(6):74-81.

        [6]黃欣,張志強,單杏花,等.基于電子客票的鐵路旅客智能出行研究[J].中國鐵路,2019(11):1-6.

        [7]強麗霞.基于客票數(shù)據(jù)的高速鐵路旅客出行選擇行為研究[J].鐵道運輸與經(jīng)濟,2018,40(4):52-57.

        [8]崔愿,陳璟,李可等.基于多源數(shù)據(jù)的區(qū)域綜合運輸通道旅客出行特征研究[J].公路交通科技,2023,40(1):252-260.

        通信作者:劉睿(1993-),甘肅蘭州人,工程師,研究方向為電力能源、城市軌道交通運輸工程。

        電子郵箱:3382300395@qq.com。

        猜你喜歡
        深度學(xué)習(xí)
        從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
        面向大數(shù)據(jù)遠程開放實驗平臺構(gòu)建研究
        基于自動智能分類器的圖書館亂架圖書檢測
        搭建深度學(xué)習(xí)的三級階梯
        有體驗的學(xué)習(xí)才是有意義的學(xué)習(xí)
        電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
        利用網(wǎng)絡(luò)技術(shù)促進學(xué)生深度學(xué)習(xí)的幾大策略
        考試周刊(2016年94期)2016-12-12 12:15:04
        MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
        大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
        深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
        久久精品夜色国产亚洲av| 纯爱无遮挡h肉动漫在线播放| 亚洲中文字幕无码一区| 欧美天欧美天堂aⅴ在线| 中文字幕无码日韩欧毛| 亚洲综合精品在线观看中文字幕 | 久久精品无码一区二区三区蜜费 | 成人一区二区免费中文字幕视频| 国产日韩av在线播放| 天天躁狠狠躁狠狠躁夜夜躁| a级福利毛片| 国产一区二区三区四区色| 国产一级黄色片在线播放| 大肉大捧一进一出好爽视频动漫| 99国产精品无码| 国产精品自产拍在线观看免费| 91青草久久久久久清纯| 国产呦系列呦交| 一区二区三区高清视频在线| 日本美女中文字幕第一区 | 亚洲日韩在线中文字幕综合| 久久久精品456亚洲影院| 久久精品免费无码区| 亚洲蜜桃视频在线观看| 久久国产成人午夜av免费影院| 国产精品多人p群无码| 疯狂做受xxxx高潮欧美日本| 丰满少妇棚拍无码视频| 免费观看在线一区二区| 偷拍综合在线视频二区日韩| 日本天堂免费观看| 欧美人与动人物牲交免费观看| 亚洲日本国产乱码va在线观看| 男人的天堂av你懂得| 无码乱肉视频免费大全合集| 国产精品久久久久9999吃药| 幻女bbwxxxx在线视频| 大学生被内谢粉嫩无套| 女人被躁到高潮嗷嗷叫| 大屁股流白浆一区二区三区| 人人妻人人澡人人爽欧美一区双|