亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于K-means聚類的城市軌道站點(diǎn)周邊共享單車需求預(yù)測(cè)方法研究

        2023-09-28 03:35:18胡雅群哈米提許子凱
        交通工程 2023年5期
        關(guān)鍵詞:套索借車高峰

        胡雅群,哈米提,許子凱

        (1.新疆維吾爾自治區(qū)交通建設(shè)管理局項(xiàng)目執(zhí)行三處,烏魯木齊 830000;2.長(zhǎng)安大學(xué)公路學(xué)院,西安 710064)

        0 引言

        共享單車大提高了公共交通利用效率.在城市軌道交通與共享單車接駁需求預(yù)測(cè)的研究方面,學(xué)者們主要關(guān)注預(yù)測(cè)模型的比較和改進(jìn)[1].Zilu Kang等[2]利用機(jī)器學(xué)習(xí)構(gòu)建了3類預(yù)測(cè)模型,并比較模型優(yōu)劣.此外,其他學(xué)者也提出了不同的預(yù)測(cè)方法,如基于馬爾可夫鏈模型的預(yù)測(cè)方法[3-4]、貝葉斯分類[5]引入注意力機(jī)制的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)預(yù)測(cè)模型[6]、二元Logit選擇模型[7-8]等.綜合現(xiàn)有研究可知,軌道交通接駁共享單車需求預(yù)測(cè)的研究主要關(guān)注于預(yù)測(cè)模型的比選.此類研究通常采用傳統(tǒng)的線性回歸預(yù)測(cè)和時(shí)間序列預(yù)測(cè)作為起點(diǎn),轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)型預(yù)測(cè)方法.然而,目前的研究多采用單一預(yù)測(cè)方法,而對(duì)于組合模型的精度比較研究仍有提升空間.

        針對(duì)軌道交通站點(diǎn)接駁共享單車停車分類研究,研究人員通常關(guān)注軌道交通站點(diǎn)的功能定位和停車需求特征.軌道交通站點(diǎn)是城市公共交通布局的核心,隨著地鐵物業(yè)的發(fā)展,使其成為城市集聚關(guān)鍵點(diǎn)[9-10].CERVERO[11-13]聚焦于香港地鐵,站點(diǎn)被聚為5類,計(jì)算了地體規(guī)模開發(fā)強(qiáng)度及混合度均值.其他研究,針對(duì)不同區(qū)位[14]、不同交通功能[15]將軌道交通站點(diǎn)劃分為不同類別.但是,由于軌道站點(diǎn)分類有差異,致使接駁的共享單車停放需求特征差異,產(chǎn)生不同類型站點(diǎn)配合停車設(shè)施規(guī)模不同的結(jié)果.值得注意的是,目前很少有研究考慮到不同類型的軌道交通站點(diǎn)對(duì)共享單車停車規(guī)模的影響,這導(dǎo)致共享單車在城市軌道交通站點(diǎn)周圍的投放顯得無序.因此,為了合理配置共享單車停車設(shè)施,需要進(jìn)一步研究不同類型軌道交通站點(diǎn)的停車需求特征和對(duì)共享單車停車設(shè)施規(guī)模的影響.

        基于上述分析,本文以K-means聚類算法進(jìn)行分析,將分時(shí)段共享單車借還量作為變量,構(gòu)建隨機(jī)森林和套索回歸算法下城市軌道站點(diǎn)周邊共享單車需求預(yù)測(cè)模型,最終對(duì)比不同算法下需求預(yù)測(cè)結(jié)果,為后續(xù)研究起到參考價(jià)值.

        1 城市軌道站點(diǎn)K-means聚類方法

        1.1 城市軌道站點(diǎn)K-means聚類算法步驟

        1)選擇K個(gè)聚類中心;

        2)計(jì)算各站點(diǎn)到聚類中心的間距,以距離作為條件進(jìn)行分配;

        3)更新每個(gè)簇的聚類中心,如果變化則重新進(jìn)行分配,直到收斂;

        4)輸出聚類結(jié)果.

        在開始之前,需要選擇合適的距離度量方法和目標(biāo)函數(shù)來計(jì)算聚類質(zhì)心.計(jì)算誤差平方和:

        (1)

        (2)

        式中,SSE為誤差平方和;k為聚類簇的數(shù)量;Ci為第i個(gè)簇;x為樣本數(shù)據(jù);μi為第i個(gè)簇Ci的聚類中心(質(zhì)心).

        1.2 K-means聚類簇?cái)?shù)估計(jì)

        在軌道交通站點(diǎn)K-means分析中,多利用站點(diǎn)周圍土地利用維度、時(shí)間空間維度、商業(yè)經(jīng)濟(jì)維度.然而,這些變量對(duì)于共享單車連接站點(diǎn)需求差異的解釋并不直觀.因此,本文利用站點(diǎn)周邊分時(shí)段共享單車借還量作為變量.

        輪廓系數(shù)(Sihouette Coefficient)用來評(píng)估聚類簇離散程度.當(dāng)輪廓系數(shù)值離1近時(shí),即效果越好,密集度越高;當(dāng)輪廓系數(shù)值越接近-1時(shí),即分離度高,結(jié)果不合理;輪廓系數(shù)計(jì)算見式(3):

        (3)

        式中,ai為樣本點(diǎn)i的簇內(nèi)不相似度;bi為樣本點(diǎn)i的簇外分散度;i為樣本數(shù).

        如圖1所示,聚類簇?cái)?shù)為5時(shí),輪廓系數(shù)的值為0.856,為聚類結(jié)果中最接近1的簇?cái)?shù),故本文將軌道交通站點(diǎn)類型劃分為5類,為了達(dá)到最好的結(jié)果.

        圖1 輪廓系數(shù)確定聚類簇?cái)?shù)

        2 城市軌道站點(diǎn)周邊共享單車需求預(yù)測(cè)方法

        2.1 隨機(jī)森林算法

        隨機(jī)森林是機(jī)器學(xué)習(xí)中的分支集成學(xué)習(xí)算法[17-19],即訓(xùn)練時(shí)從原始數(shù)據(jù)集N里面,有放有回的抽取樣本,從而得到訓(xùn)練集,但這樣會(huì)導(dǎo)致1個(gè)樣本可能會(huì)重復(fù)出現(xiàn).根據(jù)統(tǒng)計(jì)學(xué)理論,當(dāng)n足夠大時(shí),1個(gè)樣本不會(huì)被取到的概率約為0.368.

        (4)

        本文對(duì)m個(gè)結(jié)果計(jì)算算術(shù)平均值,從而得到弱學(xué)習(xí)器最終結(jié)果.即Bagging集成算法,它通過將多個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行平均或投票等方式計(jì)算結(jié)果.如圖2所示.

        圖2 集成學(xué)習(xí)示意圖

        隨機(jī)森林算法如圖3所示.

        圖3 隨機(jī)森林算法示意圖

        2.2 套索回歸算法

        套索回歸是由Robert Tibshirani提出的線性回歸方法.

        給定數(shù)據(jù)集D=[(x1,y1),(x2,y2),…,(xm,ym)].線性回歸模型優(yōu)化函數(shù)為:

        (5)

        式中,θ為函數(shù)的回歸系數(shù);y為預(yù)測(cè)值;L為線性回歸優(yōu)化函數(shù);x為樣本數(shù)據(jù).

        為了緩解函數(shù)過擬合,本文采用套索回歸模型正則化范數(shù)L1,從而式(5)變?yōu)?

        (6)

        3 實(shí)例分析

        3.1 數(shù)據(jù)來源

        2017年由《共享單車與電動(dòng)車停放》研究表明,2017年北京地區(qū)摩拜共享單車的投放量占總量的40%,具有相對(duì)的代表性.故本文數(shù)據(jù)使用2017年摩拜單車在北京地區(qū)數(shù)據(jù).同時(shí)為了進(jìn)行軌道站點(diǎn)接駁共享單車分布解析,筆者提前對(duì)數(shù)據(jù)進(jìn)行篩選和清洗,留下合理的數(shù)據(jù)集.

        3.2 城市軌道站點(diǎn)K-means聚類空間分布與結(jié)果

        3.2.1 K-means聚類結(jié)果分布

        通過計(jì)算輪廓指標(biāo)系數(shù),確定了最佳的聚類簇?cái)?shù)為5,并使用Python程序?qū)崿F(xiàn)了K-means算法,并獲得了5類軌道站點(diǎn)的聚類結(jié)果.根據(jù)聚類結(jié)果,軌道站點(diǎn)類型被分別記為類型1~5,分布情況如圖4所示.

        圖4 各類站點(diǎn)在北京城市軌道上的分布情況

        站點(diǎn)類型的具體統(tǒng)計(jì)如表1所示.

        3.2.2 K-means聚類結(jié)果分析

        本節(jié)根據(jù)前文的聚類結(jié)果,得到五大類站點(diǎn)的共享單車借還狀況.通過標(biāo)準(zhǔn)化處理不同時(shí)段共享單車借還量,進(jìn)而利用借還時(shí)間變化圖清晰展示借還特征.結(jié)果見表2.

        由表2可知,類型2早高峰借車率最低、晚高峰借車率最高,類型3早高峰還車率最低、晚高峰借車率最高.相反,類型2晚高峰最低,類型3早高峰借車率最高,晚高峰借車率最低.

        見圖5,結(jié)合不同類型軌道站點(diǎn)共享單車借還率分析得到對(duì)應(yīng)類型:

        圖5 共享單車時(shí)均借還率時(shí)間變化圖

        1) 類型1從表中可看出,在早高峰時(shí)段,還車率略低于借車率.在晚高峰時(shí)段,借車率低于還車率.符合“居住就業(yè)混合型”站點(diǎn)特征.

        2) 類型2從表中可看出,在早高峰時(shí)段,該類型站點(diǎn)的還車率遠(yuǎn)高于借車率.在晚高峰時(shí)段,借車率遠(yuǎn)高于還車率.符合“居住型”站點(diǎn)特征.

        3) 類型3從表2中可看出,在早高峰時(shí)段,該類型站點(diǎn)的借車率遠(yuǎn)高于還車率.在晚高峰時(shí)段,該類型站點(diǎn)的還車率遠(yuǎn)高于借車率.符合“就業(yè)型”站點(diǎn)特征.

        4) 類型4軌道交通站點(diǎn)在早高峰時(shí)段的借車量占全天借車總量的16.61%,而在全天還車總量中,早高峰時(shí)段的還車量占17.76%.符合“居住就業(yè)商業(yè)混合型”站點(diǎn)特征.

        5) 類型5在早高峰時(shí)段,該類型站點(diǎn)在早高峰時(shí)段的借車率高于還車率.此外,在晚高峰時(shí)段內(nèi),還車率高于借車率.符合“以居住為主的居住就業(yè)混合型”站點(diǎn)特征.

        3.3 算法對(duì)比下的軌道站點(diǎn)周邊共享單車需求預(yù)測(cè)分析

        3.3.1 實(shí)驗(yàn)驗(yàn)證評(píng)價(jià)標(biāo)準(zhǔn)

        EV(解釋方差):

        (7)

        MAE(平均絕對(duì)誤差):

        (8)

        MSE(均方誤差):

        (9)

        R2(決定系數(shù)):

        (10)

        式中,m為測(cè)試集數(shù)量;yi為測(cè)試集上的真實(shí)值;i為測(cè)試集上的預(yù)測(cè)值;為實(shí)際的平均值.

        實(shí)驗(yàn)驗(yàn)證評(píng)價(jià)標(biāo)準(zhǔn)中EV、R2的值接近1代表預(yù)測(cè)效果越好,MSE、MAE值越小代表預(yù)測(cè)精度越高.

        3.3.2 隨機(jī)森林預(yù)測(cè)結(jié)果

        隨機(jī)森林預(yù)測(cè)結(jié)果如圖6所示.

        圖6 隨機(jī)森林預(yù)測(cè)結(jié)果

        隨機(jī)森林模型可對(duì)特征進(jìn)行重要度評(píng)分,不同站點(diǎn)重要度如圖7.

        圖7表示,類型4站點(diǎn)在午高峰期間具有較高的特征重要度,這與其自身的特性有關(guān).不同類型的站點(diǎn)受特征影響的程度也不盡相同.對(duì)隨機(jī)森林模型結(jié)果進(jìn)行評(píng)估.評(píng)估結(jié)果見表3.

        表3 隨機(jī)森林預(yù)測(cè)結(jié)果評(píng)價(jià)

        3.3.3 套索回歸預(yù)測(cè)結(jié)果

        套索回歸預(yù)測(cè)效果對(duì)比結(jié)果如圖8所示.

        圖8 套索回歸預(yù)測(cè)結(jié)果

        套索回歸訓(xùn)練結(jié)果如圖9所示.

        圖9 套索回歸模型指標(biāo)重要性評(píng)估

        根據(jù)圖9,在套索回歸模型中,站點(diǎn)小時(shí)共享單車使用情況影響最大.結(jié)果見表4.

        表4 套索回歸模型預(yù)測(cè)結(jié)果評(píng)價(jià)

        綜上所述,隨機(jī)森林模型在預(yù)測(cè)類型1、2、3、5站點(diǎn)上預(yù)測(cè)精度優(yōu)于套索回歸模型.套索回歸模型在類型4預(yù)測(cè)結(jié)果優(yōu)于隨機(jī)森林模型.

        4 結(jié)束語

        建立精度更高的組合模型,本文旨在提供共享單車在不同類型軌道交通站點(diǎn)周邊的使用情況,并比較了在不同類型軌道站點(diǎn)周圍需求預(yù)測(cè)中隨機(jī)森林和套索回歸2種算法的精度,為后續(xù)軌道站點(diǎn)和軌道站點(diǎn)周圍停車設(shè)施的規(guī)劃和建設(shè)提供參考價(jià)值.

        本文利用共享單車借還量為聚類變量,聚為5類站點(diǎn).這些類別分別對(duì)應(yīng)特征:類型1~5分別為居住就業(yè)混合型、居住型、就業(yè)型、居住就業(yè)商業(yè)混合型、以居住為主的居住就業(yè)混合型.進(jìn)而使用隨機(jī)森林和套索回歸2種算法構(gòu)建需求預(yù)測(cè)模型,對(duì)5類站點(diǎn)計(jì)算其結(jié)果.進(jìn)而利用EV、MAE、MSE和R2評(píng)估預(yù)測(cè)結(jié)果.結(jié)果表明,除類型4以外站點(diǎn),隨機(jī)森林模型預(yù)測(cè)結(jié)果中表現(xiàn)最好.

        猜你喜歡
        套索借車高峰
        病毒病將迎“小高峰”全方位布控巧應(yīng)對(duì)
        套索肽替代抗生素應(yīng)用的研究進(jìn)展
        飼料博覽(2020年10期)2020-11-20 09:52:48
        石慶云
        書香兩岸(2020年3期)2020-06-29 12:33:45
        套索肽
        ——一種可供多肽類藥物設(shè)計(jì)和改造的多功能載體
        數(shù)字化圖像的簡(jiǎn)單合成教學(xué)分析
        新一代(2019年7期)2019-06-25 10:36:04
        淺議常見PS摳圖方法
        卷宗(2018年17期)2018-07-09 09:47:18
        安防巨頭借車聯(lián)網(wǎng)東風(fēng) 促智能交通發(fā)展升級(jí)
        基本殺法能力訓(xùn)練之借車使炮殺法
        棋藝(2016年6期)2016-11-14 05:33:19
        雨天早高峰,自在從容時(shí)。
        “我將不斷進(jìn)取,向藝術(shù)的高峰挺進(jìn)”
        雕塑(1998年4期)1998-06-25 06:44:20
        国产自拍视频在线观看免费| 日日摸夜夜欧美一区二区| 亚洲精品国产二区三区在线| 亚洲伊人av综合福利| 一区二区三区国产免费视频| 国产精品伦一区二区三级视频| 亚洲免费视频播放| 亚洲成av在线免费不卡| 久久狼精品一区二区三区 | 国内精品卡一卡二卡三| 免费a级毛片在线观看| 人妻熟女中文字幕在线视频| 美女在线一区二区三区视频| 377p日本欧洲亚洲大胆张筱雨| 中文字幕第1页中文字幕在| 日本岛国一区二区三区| 国产av一区二区三区性入口| 99国产精品无码| 国产精品久久久久久久久免费观看| 国产av在线观看91| 日产乱码一二三区别免费l| 中文人妻无码一区二区三区在线| 国产成人精品曰本亚洲| 中文字幕一区二区三区| 免费欧洲毛片a级视频老妇女| 欧美日韩不卡视频合集| 精品人妻一区二区三区蜜桃 | 精品人妻一区二区蜜臀av| 亚洲成人av在线第一页| 国产丝袜在线精品丝袜| 欧美色资源| 蕾丝女同一区二区三区| 真实国产精品vr专区| 91热这里只有精品| 亚洲高清一区二区三区视频| 国产在线视频一区二区天美蜜桃 | 国产aⅴ天堂亚洲国产av| 凹凸世界视频a一二三| 黑人巨茎大战俄罗斯美女| 热99re久久精品这里都是免费| 国内精品熟女一区二区|