彭 閩, 孫傳平, 馬 躍
(1.武漢市交通運(yùn)輸綜合執(zhí)法支隊(duì), 武漢 430014; 2.中電通途(北京)科技有限責(zé)任公司, 北京 100080)
近年來,共享單車成為一種新的出行方式,爆紅于各大城市. 共享單車的出現(xiàn)不僅解決 “最后1 km”出行難題,而且推進(jìn)綠色、低碳、環(huán)保出行,更是擺脫了傳統(tǒng)市政公共自行車受停車樁位限制的問題. 但是,隨著城市共享單車的大規(guī)模投入,無明確指導(dǎo)依據(jù),亂停放、投放不均等問題日益突出,對(duì)城市交通管理也帶來了一定的壓力[1-5].
為解決共享單車流行帶來的問題,本文將通過共享單車的需求規(guī)模預(yù)測(cè)研究,為相關(guān)公司對(duì)共享單車的合理投放提供依據(jù),為政府單位對(duì)共享單車的管理提供數(shù)據(jù)、理論基礎(chǔ). 目前共享單車需求規(guī)模預(yù)測(cè)方面的相關(guān)研究有:金含笑[6]根據(jù)北京摩拜單車數(shù)據(jù)提出基于時(shí)空分布的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法模型;馬勇[7]基于北京共享單車數(shù)據(jù),首先采用二次K-means算法得到區(qū)域簇,后建立基于LSTM的線性網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行預(yù)測(cè);甘維德[8]采用一種融合模型進(jìn)行預(yù)測(cè),命名為SSRG,其融合了支持向量機(jī)回歸模型、隨機(jī)森林模型和GBDT回歸模型;索源[9]采用層次凝聚聚類算法研究了共享單車出行需求分布及對(duì)應(yīng)的出行需求量;周傳鈺[10]結(jié)合軌道交通與共享單車研究共享單車投放量的測(cè)算方法及高峰時(shí)期的調(diào)度方法,提出共享單車投放規(guī)模預(yù)測(cè)需要借鑒公共自行車需求或者其他類型的需求預(yù)測(cè)方法. 現(xiàn)狀或缺乏共享單車需求預(yù)測(cè)的針對(duì)性研究,或相關(guān)針對(duì)性研究模型較為復(fù)雜,多選取時(shí)間、氣象、位置等影響因子作為自變量進(jìn)行分析,以上部分影響因子數(shù)據(jù)在實(shí)踐應(yīng)用中獲取困難.
本文選取時(shí)間影響因子作為自變量建立模型,首先對(duì)相同共享單車車輛id開、關(guān)鎖訂單量數(shù)據(jù)去重后,得到共享單車發(fā)生量、吸引量數(shù)據(jù),基于以上數(shù)據(jù)選取多元線性回歸預(yù)測(cè)模型建立武漢市各區(qū)域共享單車需求規(guī)模模型,合理確定共享單車需求規(guī)模,為武漢市共享單車在各個(gè)區(qū)域的投放提供決策支持.
本文共享單車需求規(guī)模預(yù)測(cè)主要依據(jù)武漢市798 839輛共享單車訂單和GPS實(shí)時(shí)數(shù)據(jù),其中摩拜單車370 108輛,哈羅bike 347 259輛,ofo 81 472輛. 根據(jù)開關(guān)鎖經(jīng)緯度數(shù)據(jù)定位到目標(biāo)區(qū)域,然后匹配相應(yīng)的車輛id,鎖id以及訂單數(shù)據(jù),基于以上數(shù)據(jù)得到目標(biāo)區(qū)域目標(biāo)時(shí)段的開鎖量即騎行發(fā)生訂單數(shù)(人次)和關(guān)鎖量即騎行吸引訂單數(shù)(人次)后,通過對(duì)同一車id的發(fā)生、吸引訂單數(shù)據(jù)去重后,得到騎行發(fā)生量(輛)、騎行吸引量(輛)和騎行需求量(輛).
根據(jù)吸引量(統(tǒng)計(jì)時(shí)間內(nèi),特定區(qū)域的導(dǎo)入共享單車車輛數(shù))、發(fā)生量(統(tǒng)計(jì)時(shí)間內(nèi),特定區(qū)域的導(dǎo)出共享單車車輛數(shù))和需求量(統(tǒng)計(jì)時(shí)間內(nèi),特定區(qū)域的發(fā)生量與吸引量的差值)3個(gè)指標(biāo)對(duì)武漢市共享單車的需求規(guī)?,F(xiàn)狀進(jìn)行分析. 通過處理武漢市798 839輛共享單車訂單和GPS實(shí)時(shí)數(shù)據(jù),獲取到指標(biāo)值,統(tǒng)計(jì)分析得到武漢市共享單車發(fā)生量和吸引量的熱點(diǎn)區(qū)域.
表1 摩拜單車數(shù)據(jù)屬性
1.2.1 共享單車供需匹配現(xiàn)狀分析
1)行政區(qū)
根據(jù)11月的數(shù)據(jù)統(tǒng)計(jì)得到武漢市共享單車需求現(xiàn)狀,共享單車發(fā)生量和吸引量排名前3的行政區(qū)為洪山區(qū)、江岸區(qū)和硚口區(qū).
洪山區(qū)為武漢市高新產(chǎn)業(yè)聚集地,江岸區(qū)和江漢區(qū)為武漢最中心城區(qū),其吸引量大于發(fā)生量;武昌區(qū)和青山區(qū)則呈現(xiàn)相反的情況;硚口區(qū)和漢陽區(qū)基本形成供需匹配. 各行政區(qū)需求情況如表2所示:
表2 共享單車行政區(qū)需求分布 輛
2)重點(diǎn)區(qū)域
現(xiàn)狀共享單車重點(diǎn)分析區(qū)域主要為中心城區(qū)的地鐵站點(diǎn)區(qū)域、重點(diǎn)商圈、重點(diǎn)居住小區(qū)和就業(yè)區(qū)域.
共享單車發(fā)生量排名前三位區(qū)域與吸引量排名前三位區(qū)域相同,漢正街商圈(8 292輛)、東湖(4 500輛)和小南湖公園區(qū)域(3 782輛). 其他排名區(qū)域分別是武漢市中醫(yī)院、雪松路商圈、六渡橋地鐵站、江漢路地鐵站、大智路地鐵站、徐東商圈和大智路商圈.
圖1 共享單車發(fā)生量排名前10區(qū)域分布
根據(jù)實(shí)際數(shù)據(jù)得到的武漢市共享單車吸引量排名前三位區(qū)域是漢正街商圈(9 967輛)、東湖(7 708輛)和小南湖公園區(qū)域(4 336輛). 其他排名區(qū)域?yàn)槲錆h市中醫(yī)院、六渡橋地鐵站、王家灣商圈、徐東商圈、雪松路商圈和大智路地鐵站.
圖2 共享單車吸引量排名前10區(qū)域分布
選取一周內(nèi)武漢市重點(diǎn)區(qū)域共享單車日均發(fā)生量、吸引量數(shù)據(jù)做差取絕對(duì)值后進(jìn)行排名,得到東湖、漢正街商圈、金融港、城開二七城市廣場(chǎng)等區(qū)域供需較不平衡,需要重點(diǎn)做發(fā)生量和吸引量預(yù)測(cè),有利于對(duì)車輛的調(diào)配.
表3 共享單車排名前十供需不匹配區(qū)域
1.2.2 共享單車時(shí)間特性分析
對(duì)以上供需不平衡區(qū)域,對(duì)其24 h發(fā)生、吸引量做平均值,得到以下變化曲線. 由曲線可得,共享單車擁有顯著的早晚高峰、以及午間小高峰特征;早、晚高峰發(fā)生、吸引量體現(xiàn)出顯著的潮汐現(xiàn)象和不均衡性,由此導(dǎo)致日發(fā)生量和吸引量的不平衡,因此主要對(duì)不平衡區(qū)域的早、晚高峰進(jìn)行預(yù)測(cè).
圖3 共享單車發(fā)生、吸引量時(shí)間分布
國內(nèi)外共享單車需求規(guī)模預(yù)測(cè)模型主要有神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)模型、灰色預(yù)測(cè)模型和時(shí)間序列預(yù)測(cè)模型. 通過對(duì)比發(fā)現(xiàn)前3種預(yù)測(cè)模型相對(duì)較為復(fù)雜,需要的數(shù)據(jù)類別及數(shù)量要求較高,因此本文采用時(shí)間序列法中的多元線性回歸預(yù)測(cè)模型預(yù)測(cè)共享單車的需求規(guī)模. 時(shí)間序列法能簡化所預(yù)測(cè)對(duì)象的影響因素,模型相對(duì)簡單,便于計(jì)算. 由于共享單車在各個(gè)區(qū)域長時(shí)間的投放,已經(jīng)形成了與區(qū)域用地性質(zhì)、氣候、日期等特性相關(guān)的規(guī)律,采用多元線性回歸預(yù)測(cè)模型,通過選取當(dāng)前日期屬性、星期屬性、時(shí)間段屬性的歷史數(shù)據(jù)進(jìn)行模型擬合,能較為準(zhǔn)確的預(yù)測(cè)得到相應(yīng)區(qū)域的共享單車需求量.
2.2.1 預(yù)測(cè)區(qū)域分析
武漢市共享單車區(qū)域需求規(guī)模預(yù)測(cè)模型采用多元線性回歸方法進(jìn)行預(yù)測(cè). 首先針對(duì)各中心城區(qū)進(jìn)行預(yù)測(cè), 其次挑選相關(guān)管理部門、企業(yè)較為關(guān)注的區(qū)域,以及根據(jù)歷史數(shù)據(jù)情況選取共享單車較集聚的區(qū)域.
表4 共享單車預(yù)測(cè)行政區(qū)域
表5 共享單車部分預(yù)測(cè)熱點(diǎn)區(qū)域
2.2.2 騎行發(fā)生量/吸引量預(yù)測(cè)
本文選用多元線性回歸方法對(duì)針對(duì)某一日和某時(shí)段特定區(qū)域的共享單車騎行發(fā)生/吸引量進(jìn)行預(yù)測(cè). 確定輸入變量包含當(dāng)前日期w、星期屬性(1~7). 因日期屬性的不同,而使模型有所不同. 通過選取當(dāng)前日期屬性、星期屬性的歷史數(shù)據(jù)進(jìn)行模型擬合,能較為準(zhǔn)確的預(yù)測(cè)得到相應(yīng)區(qū)域的共享單車需求量. 根據(jù)日期屬性的不同將模型分為工作日、非工作日和節(jié)假日3種預(yù)測(cè)模型,3種模型分別適用其對(duì)應(yīng)的早、晚高峰時(shí)段預(yù)測(cè). 早晚高峰時(shí)段預(yù)測(cè)模型只是在日期特性的基礎(chǔ)上加以考慮早、晚高峰時(shí)間特性,輸入變量在包含當(dāng)前日期w、星期屬性(1~7)的基礎(chǔ)上,加上時(shí)間段m屬性數(shù)據(jù)加以擬合得到早、晚高峰時(shí)間段預(yù)測(cè)模型.
由于在日尺度下共享單車發(fā)生量、吸引量往往趨于平衡,而高峰時(shí)段尺度下容易體現(xiàn)顯著的潮汐現(xiàn)象以及不均衡性,以上問題是共享單車調(diào)度和運(yùn)維的難題. 因此本文主要分析工作日、非工作日和節(jié)假日高峰時(shí)段的發(fā)生、吸引量預(yù)測(cè).
2.2.3 共享單車需求規(guī)模
目標(biāo)預(yù)測(cè)區(qū)域的需求量為其相應(yīng)的發(fā)生量與吸引量的差值,其性質(zhì)與發(fā)生、吸引量一致,存在工作日、非工作日和節(jié)假日的日期特性、早晚高峰的時(shí)間特性和地域特性不同,其需求量預(yù)測(cè)模型會(huì)相應(yīng)不同.
特定區(qū)域的共享單車需求量可反映該區(qū)域的供需匹配關(guān)系,值大于0,需要移除對(duì)應(yīng)數(shù)量的車輛,值小于0,則需要增加對(duì)應(yīng)數(shù)量的車輛.
因?yàn)樵撃P歪槍?duì)不同的區(qū)域,不同日期、時(shí)刻,預(yù)測(cè)模型的系數(shù)均不同. 現(xiàn)以江漢路地鐵站和漢正街商圈共享單車工作日和非工作日早高峰時(shí)段發(fā)生量需求預(yù)測(cè)模型進(jìn)行數(shù)據(jù)校核.
2.3.1 江漢路地鐵站
1)工作日早高峰
選取江漢路地鐵站11月25日、12月2日和12月9日3d同為星期一07:00—09:00的數(shù)據(jù),12月10日—12月13日共4個(gè)工作日07:00—09:00的數(shù)據(jù),一共7個(gè)數(shù)據(jù)擬合得到江漢路地鐵站2019年12月16日星期一07:00—09:00的共享單車日發(fā)生量預(yù)測(cè)模型. 以上數(shù)據(jù)是將開鎖訂單數(shù)據(jù)對(duì)共享單車id去重后得到的數(shù)據(jù),可近似看成騎行發(fā)生量(區(qū)域?qū)С鲕囕v數(shù)).
江漢路地鐵站2019-12-16星期一07:00—09:00的共享單車發(fā)生量預(yù)測(cè)模型為:
表6 共享單車發(fā)生/吸引量預(yù)測(cè)模型
Yworkday=63+0.05x1+0.13x2+0.31x3+0.08x6+
0.12x7+0.13x8+0.18x9
(x1、x2、x3為江漢路地鐵站11月25日、12月2日和12月9日3個(gè)星期一07:00—09:00騎行發(fā)生量;x6、x7、x8、x9為12月10日—12月13日4個(gè)工作日07:00—09:00騎行發(fā)生量. )
2)非工作日早高峰
選取江漢路地鐵站11月24日、12月1日和12月8日3個(gè)星期日07:00—09:00的歷史數(shù)據(jù)擬合得到江漢路地鐵站2019年12月15日星期日07:00—09:00的共享單車日發(fā)生量預(yù)測(cè)模型. 以上數(shù)據(jù)是將開鎖訂單數(shù)據(jù)對(duì)共享單車id去重后得到的數(shù)據(jù),可近似看成騎行發(fā)生量(區(qū)域?qū)С鲕囕v數(shù)).
江漢路地鐵站2019年12月15日星期日07:00—09:00共享單車發(fā)生量預(yù)測(cè)模型為:
Yweekend=32+0.19x1+0.25x2+0.56x3
(x1、x2、x3為江漢路地鐵站11月24日、12月1日和12月8日3個(gè)星期日07:00—09:00的騎行發(fā)生量數(shù)據(jù). )
對(duì)江漢路地鐵站工作日和非工作日早高峰共享單車發(fā)生量模型進(jìn)行檢驗(yàn),兩者模型R2分別為0.953和0.962,說明模型擬合的效果較好. 按α=0.05進(jìn)行F檢驗(yàn),P均小于0.05,說明模型有意義.
利用模型對(duì)2019-12-15到2019-12-28兩星期07:00—09:00的共享單車發(fā)生量進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果平均絕對(duì)百分誤差(MAPE)為6.11%,表明預(yù)測(cè)精度較高.
圖4 江漢路地鐵站早高峰真實(shí)量與預(yù)測(cè)量對(duì)比
2.3.2 漢正街商圈
1)工作日早高峰
選取漢正街商圈11月25日、12月2日和12月9日3個(gè)星期一07:00—09:00的數(shù)據(jù),12月10日—12月13日共4個(gè)工作日07:00—09:00的數(shù)據(jù),一共7個(gè)數(shù)據(jù)擬合得到漢正街商圈12月16日星期一07:00—09:00的共享單車日發(fā)生量預(yù)測(cè)模型. 以上數(shù)據(jù)是將開鎖訂單數(shù)據(jù)對(duì)共享單車id去重后得到的數(shù)據(jù),可近似看成騎行發(fā)生量(區(qū)域?qū)С鲕囕v數(shù)).
漢正街商圈2019-12-16星期一07:00—09:00共享單車發(fā)生量預(yù)測(cè)模型為:
Yworkday=76+0.07x1+0.15x2+0.21x3+0.09+
0.12x7+0.16x8+0.20x9
(x1、x2、x3為漢正街商圈11月25日、12月2日和12月9日3個(gè)星期一07:00—09:00騎行發(fā)生量;x6、x7、x8、x9為12月10日—12月13日4個(gè)工作日07:00—09:00騎行發(fā)生量.)
2)非工作日早高峰
選取漢正街商圈11月24日、12月1日和12月8日3個(gè)星期六07:00—09:00的數(shù)據(jù)擬合得到漢正街商圈2019-12-15星期日07:00—09:00的共享單車日發(fā)生量預(yù)測(cè)模型. 以上數(shù)據(jù)是將開鎖訂單數(shù)據(jù)對(duì)共享單車id去重后得到的數(shù)據(jù),可近似看成騎行發(fā)生量(區(qū)域?qū)С鲕囕v數(shù)).
漢正街商圈2019-12-15星期日07:00—09:00共享單車發(fā)生量預(yù)測(cè)模型為:
Yweekend=61+0.24x1+0.25x2+0.51x3
(x1、x2、x3為漢正街商圈11月24日、12月1日和12月8日3個(gè)星期日07:00—09:00的騎行發(fā)生量數(shù)據(jù). )
對(duì)漢正街商圈工作日和非工作日早高峰共享單車發(fā)生量模型進(jìn)行檢驗(yàn),兩者模型R2分別為0.989和0.978,說明模型擬合的效果較好. 按α=0.05進(jìn)行F檢驗(yàn),P均小于0.05,說明模型有意義.
利用模型對(duì)2019-12-15—2019-12-28兩星期07:00—09:00的共享單車發(fā)生量進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果平均絕對(duì)百分誤差(MAPE)為2.34%,表明預(yù)測(cè)精度較高.
綜上可利用該模型對(duì)不同區(qū)域的共享單車需求估計(jì),能為共享單車的短時(shí)出行需求預(yù)測(cè)和實(shí)時(shí)調(diào)度提供依據(jù).
通過采用多元線性回歸法,以2019年11月及12月小時(shí)粒度的歷史數(shù)據(jù)為基礎(chǔ)預(yù)測(cè)得到2019-12-18 07:00—09:00的共享單車需求,需求量為正的需要增加車輛的投放,為負(fù)的則需要移除相應(yīng)數(shù)量的車輛.
表7 行政區(qū)域需求規(guī)模 輛
對(duì)相關(guān)管理部分、企業(yè)較為關(guān)注的其他共享單車較集聚區(qū)域進(jìn)行需求量分析,分析結(jié)果見表8:
表8 其他性質(zhì)區(qū)域需求規(guī)模 輛
由所選擇區(qū)域預(yù)測(cè)結(jié)果可得,武漢中心城區(qū)共享單車供需均存在一定的不匹配性,其中洪山區(qū)、江漢區(qū)和江岸區(qū)呈現(xiàn)騎行吸引量大于發(fā)生量,需要移除相應(yīng)的車輛;武昌區(qū)和青山區(qū)則呈現(xiàn)騎行發(fā)生量大于吸引量,需要增加車輛的投放;硚口區(qū)和漢陽區(qū)基本達(dá)到供需匹配.
其他熱點(diǎn)區(qū)域,武漢火車站和江漢路地鐵站供需匹配較好,供需不匹配程度相對(duì)較高的熱點(diǎn)區(qū)域中六渡橋地鐵站和武漢中醫(yī)院需要增加車輛的投放,華中科技大學(xué)和武漢大學(xué)需要移除部分車輛.
1)本文研究分析共享單車區(qū)域需求規(guī)模預(yù)測(cè)方法,首先對(duì)武漢市共享單車的數(shù)據(jù)情況和需求規(guī)模現(xiàn)狀進(jìn)行介紹和分析,其現(xiàn)狀特征如下:
共享單車發(fā)生量和吸引量排名前三位的行政區(qū)為洪山區(qū)、江岸區(qū)和硚口區(qū),發(fā)生、吸引量熱點(diǎn)區(qū)域?yàn)闈h正街商圈、東湖和小南湖公園區(qū)域;東湖、漢正街商圈、金融港、城開二七城市廣場(chǎng)等區(qū)域供需較不平衡.
共享單車擁有顯著的早晚高峰、以及午間小高峰特征;早、晚高峰發(fā)生、吸引量體現(xiàn)出顯著的潮汐現(xiàn)象和不均衡性,由此導(dǎo)致日發(fā)生量和吸引量的不平衡.
2)針對(duì)武漢共享單車數(shù)據(jù)情況,對(duì)相同共享單車車輛id開、關(guān)鎖訂單量數(shù)據(jù)去重后,得到共享單車發(fā)生、吸引量數(shù)據(jù),基于以上數(shù)據(jù),選取多元線性回歸法對(duì)城區(qū)、商圈、大學(xué)、地鐵站等熱點(diǎn)區(qū)域共享單車在早、晚高峰以及全天的需求規(guī)模進(jìn)行了相應(yīng)的預(yù)測(cè). 并以江漢路地鐵站、漢正街商圈共享單車工作日非工作日07:00—09:00發(fā)生量預(yù)測(cè)模型進(jìn)行檢驗(yàn),經(jīng)檢驗(yàn)得預(yù)測(cè)模型有意義且預(yù)測(cè)精度較高.
3)本文所建立共享單車需求預(yù)測(cè)模型,通過選取當(dāng)前日期屬性、星期屬性的歷史數(shù)據(jù)進(jìn)行模型擬合,得到工作日、非工作日和節(jié)假日3種預(yù)測(cè)模型,模型相對(duì)簡單,便于計(jì)算,能較為準(zhǔn)確的預(yù)測(cè)得到相應(yīng)區(qū)域的共享單車需求量.