亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于K-means聚類與PLS回歸模型的交通速度短時預(yù)測

        2023-06-23 04:37:36賈秀燕孫秋霞李勍
        關(guān)鍵詞:means聚類城市交通

        賈秀燕 孫秋霞 李勍

        摘要:為實現(xiàn)對交通流局部特征的有效提取,提高交通速度預(yù)測模型的可解釋性,提出基于K-means聚類與偏最小二乘(Partial Least Squares,PLS)回歸的交通速度短時預(yù)測模型。模型采用時空相關(guān)矩陣挖掘路網(wǎng)中相鄰路段交通速度之間的關(guān)聯(lián)性,利用K-means聚類算法劃分歷史數(shù)據(jù)集,并選取實測出租車GPS數(shù)據(jù)驗證模型對交通速度短時預(yù)測的準(zhǔn)確性。實驗結(jié)果表明,與ARIMA、PLS回歸和LSTM模型相比,該模型的預(yù)測誤差減少了約30%。

        關(guān)鍵詞:城市交通;速度短時預(yù)測;K-means聚類;偏最小二乘回歸;時空相關(guān)矩陣

        中圖分類號:U121 文獻(xiàn)標(biāo)志碼:A

        隨著中國機動化進程不斷加快,高峰出行困難成為大中城市所普遍面臨的難題。作為智能交通運輸系統(tǒng)的一項重要功能,交通控制與誘導(dǎo)調(diào)控策略的制定主要依賴于交通速度預(yù)測的結(jié)果。交通速度預(yù)測按照預(yù)測時間窗的長度通常劃分為長時預(yù)測和短時預(yù)測,長時預(yù)測的時間步長通常以日、月或年計算,短時預(yù)測更傾向于對交通狀態(tài)的微觀描述,觀測時間通常小于15min[1-2]。預(yù)測短時交通速度,實時評價交通狀況,能夠起到疏導(dǎo)交通擁堵、減少環(huán)境污染和駕乘人員等待時間、提高交通參與者的安全、為駕駛?cè)颂峁┯行С鲂行畔⒎?wù)的作用。國內(nèi)外學(xué)者利用各學(xué)科領(lǐng)域內(nèi)的知識開發(fā)了各種用于短時交通速度預(yù)測的方法,這些方法大致分為兩大類:經(jīng)典方法和基于深度學(xué)習(xí)的方法。經(jīng)典預(yù)測方法包括統(tǒng)計方法和傳統(tǒng)的機器學(xué)習(xí)方法[3]。統(tǒng)計方法假設(shè)未來數(shù)據(jù)與歷史數(shù)據(jù)具有相似性,通過建立數(shù)據(jù)驅(qū)動的統(tǒng)計模型對交通速度分析預(yù)測,而交通速度數(shù)據(jù)具有復(fù)雜的非線性特征,往往不滿足統(tǒng)計方法的假設(shè),且這些方法多適用于小數(shù)據(jù)集[4-5]。傳統(tǒng)的機器學(xué)習(xí)模型整體的非線性有限,預(yù)測效果并不是最佳的[6-8]。深度學(xué)習(xí)的出現(xiàn)使人工智能在交通速度預(yù)測的潛能得到進一步開發(fā)[9-14]。在數(shù)據(jù)集有限的應(yīng)用情景下,深度學(xué)習(xí)模型難以有效的挖掘數(shù)據(jù)的規(guī)律,同時具有計算復(fù)雜度高、可解釋性差的缺點。為了實現(xiàn)交通流量、交通速度、行程時間的短時預(yù)測,將多個模型組合以提升模型預(yù)測性能[15-17]。模型的組合方式、權(quán)重參數(shù)的確定以及訓(xùn)練數(shù)據(jù)集的平衡問題是組合模型研究中的難點[18-19]。為了克服傳統(tǒng)模型無法有效提取交通速度數(shù)據(jù)非線性特征這一缺點,本文聚焦路網(wǎng)交通速度之間關(guān)聯(lián)性的挖掘,建立時空相關(guān)矩陣,利用K-means聚類算法把相似狀態(tài)的交通速度聚類進行建模分析,放大數(shù)據(jù)的局部特征,更準(zhǔn)確地把握交通速度的變化趨勢。綜合考慮模型的預(yù)測精度與計算時間復(fù)雜度,使模型具有更高的解釋性,選擇偏最小二乘回歸模型作為最終的預(yù)測模型。

        1 研究方法

        1.1 路網(wǎng)時空相關(guān)性的挖掘

        為分析相關(guān)路段交通流對目標(biāo)路段交通流的影響程度,估計交通流之間的相關(guān)性,而不是直接對交通流本身進行聚類。若城市道路網(wǎng)絡(luò)中某一區(qū)域內(nèi)含有P節(jié)路段,且每一路段上都裝有環(huán)路檢測器(傳感器)以采集實時的交通速度數(shù)據(jù),可以得到P條路段的歷史交通速度數(shù)據(jù)所組成的時間序列數(shù)據(jù)V=(V1,V2,…,VP),

        2 實證分析

        2.1 研究區(qū)域概況

        為驗證提出模型的有效性,選取青島市西海岸新區(qū)長江中路作為主要的研究區(qū)域。青島市西海岸新區(qū)長江路是一條東西走向的主干道,沿線串聯(lián)了新區(qū)的行政、商務(wù)、教育、餐飲、居住功能區(qū),路口較多,交通流密集,尤其是上下班的早晚高峰時段,人車交織,導(dǎo)致通車效率不高、交通事故頻發(fā),長江中路路段尤為嚴(yán)重。作為新區(qū)核心位置的主干道,長江中路的交通服務(wù)品質(zhì)難以滿足日益增長的社會需求,成為新區(qū)主要的道路“瓶頸”。

        將青島市西海岸新區(qū)長江中路作為目標(biāo)道路,為清晰、直觀地觀察各條路段的地理位置,從OpenStreetMap官網(wǎng)下載路網(wǎng)矢量數(shù)據(jù),如圖1所示。研究地點具有典型拓?fù)浣Y(jié)構(gòu),展示了交通流之間不同程度的時空相關(guān)性,這七條道路雖位于不同的方向,但間接相連,每條道路對應(yīng)不同的道路名稱,具體對應(yīng)關(guān)系見表1。

        2.2 數(shù)據(jù)預(yù)處理

        研究數(shù)據(jù)為青島市西海岸新區(qū)長江中路2017年8月7日至2017年8月20日出租車GPS軌跡數(shù)據(jù),利用Python軟件對其預(yù)處理,獲得有效數(shù)據(jù)1 752 694條,出租車GPS原始軌跡數(shù)據(jù)示例見表2。

        其中,v(k)為當(dāng)前路段在時間間隔k內(nèi)的平均速度,vi,n為第n輛出租車在第i個GPS點處的速度值,i為當(dāng)前路段內(nèi)GPS點的編號,I為當(dāng)前路段內(nèi)所有GPS點的數(shù)量,n是當(dāng)前路段內(nèi)出租車的編號,N為當(dāng)前路段上所有出租車的數(shù)量,Nk是時間間隔k內(nèi)經(jīng)過當(dāng)前路段的車輛數(shù)。

        為了解西海岸新區(qū)長江中路交通速度的宏觀特征,基于預(yù)處理后的數(shù)據(jù),利用Python軟件繪制2017年8月7日至8月20日交通速度熱力圖(圖2),交通速度存在明顯的周期性和日相似特征,即不同天的同一時間段的速度值有著相類似的趨勢規(guī)律,而同一天的不同時間段存在著較大的差異。圖2中顏色的深淺代表了交通速度值的大小,顏色越深,速度就越小,代表道路越擁堵,長江中路8月7日至8月20日的交通流速度數(shù)據(jù)存在明顯的雙峰現(xiàn)象,且出行的早高峰集中于07∶00~08∶30時間段,晚高峰集中17∶00~19∶00時間段。

        2.3 構(gòu)建時空相關(guān)矩陣

        根據(jù)長江中路早晚高峰時段的分布狀況,利用式(2)分別計算長江中路2017年8月19日8∶30的早高峰時空相關(guān)矩陣與2017年8月19日19∶00的晚高峰時空相關(guān)矩陣,時間延遲d分別設(shè)置為18與24個時間間隔,每個時間間隔為5 min,相應(yīng)的時空相關(guān)矩陣熱力圖如圖3所示。

        圖中顏色的深淺代表了目標(biāo)路段R3的交通速度與其他路段交通速度之間相關(guān)性的大小,顏色越深代表相關(guān)性越強。結(jié)果分析發(fā)現(xiàn),早高峰時段,當(dāng)時間延遲為0時,路段R3與路段R1、路段R4、路段R5以及路段R7的相關(guān)系數(shù)均為正值,且大于0.5。晚高峰時段,在時間延遲為0時,路段R3與路段R1、路段R2以及路段R4(相關(guān)系數(shù)的絕對值大于0.5。7條路段在不同時間延遲下相關(guān)系數(shù)的變化趨勢相似,但在同一時間延遲下路段之間交通速度的相關(guān)性強度有較大差異。這說明選擇的路段之間存在較強的相關(guān)性,可以通過時空相關(guān)矩陣的聚類來捕獲交通流之間的時空相關(guān)的異質(zhì)性。

        2.4 K-means聚類結(jié)果

        為了確定聚類數(shù)目m值,采用方差比準(zhǔn)則(Calinski-Harabaz Index,CHI)評價聚類效果,CHI基于數(shù)據(jù)集特性評估聚類效果,值越大代表聚類的效果越好[16]。CHI值隨m值的變化趨勢如圖4所示??芍?,m=2時CHI值取得最大值,說明兩種情況均在劃分為兩簇時聚類效果最佳,因此將訓(xùn)練數(shù)據(jù)集分為兩簇。

        K-means聚類結(jié)果見表3??梢钥闯觯?、晚高峰時段的數(shù)據(jù)雖均被劃分為兩簇,但兩簇之間并不完全相同。如路段R1、R3始終在同一簇中,說明路段R3與路段R1的交通狀態(tài)最為相似;而路段R6缺少辦公樓、商場、醫(yī)院等因素吸引人車流入,始終在數(shù)量少的一簇內(nèi)。在不同的高峰時段,路段R4與路段R5被劃分到了不同的簇中,這可能與路段所處的地理位置、交通流流向以及周邊的興趣點(Point of Interest,POI)屬性相關(guān)。路段R4為城市主干道,西鄰富春江路小學(xué),東鄰青島西海岸新區(qū)中心醫(yī)院,早高峰時段與相鄰路段的車流來往密切,而路段R5穿過居民區(qū),在晚高峰時段與相鄰路段的車流關(guān)系密切,說明同一天不同時間段的交通速度之間存在差異性。

        2.5 基于偏最小二乘算法的短時交通速度預(yù)測

        利用K-means聚類算法得到與目標(biāo)路段R3在早晚高峰時段最相關(guān)的路段,篩選出與目標(biāo)路段的交通速度具有高相關(guān)性的歷史數(shù)據(jù)集,使用更新后的數(shù)據(jù)集構(gòu)建基于偏最小二乘算法的短時交通速度預(yù)測模型。由偏最小二乘算法的建模過程可知,只需選取前r個主成分建立回歸方程就可以達(dá)到較好的預(yù)測精度,r個成分的選擇提取可通過進行交叉有效性檢驗來確認(rèn)[20]。交叉有效性檢驗結(jié)果見表4。

        由表4可知,前4個主成分的交叉有效性均大于0.097 5,但第5個主成分交叉有效性小于0.097 5,不滿足交叉有效性提取條件,表明該成分不能明顯改善模型的擬合能力,因此,模型只提取前4個主成分,得到標(biāo)準(zhǔn)化偏最小二乘回歸方程為

        其中,y*zao、y*wan分別為長江中路在早高峰時段和晚高峰時段的預(yù)測模型。最終預(yù)測的效果如圖5所示。

        對比圖5(a)與(b),早高峰時段交通速度的預(yù)測值更接近于真實值,晚高峰時段的預(yù)測值誤差略大,說明該模型對高頻率波動的數(shù)據(jù)預(yù)測精度相對較差,但預(yù)測值與真實值的總體變化趨勢是一致的。長江中路交通速度整體較為平緩,早高峰時段集中在15~25 km/h,晚高峰時段集中在10~20 km/h,晚高峰速度值低于早高峰,因為長江中路位于經(jīng)濟開發(fā)區(qū)中心,商場較多,晚間時段人口集中,車流密度大。

        2.6 模型評價

        其中,yi為交通速度的真實值;i為模型預(yù)測值;N為測試樣本集的個數(shù)。對比結(jié)果見表5、表6。

        添加“周”周期并采取對歷史數(shù)據(jù)集先聚類后預(yù)測的方法,模型的預(yù)測精度有了較明顯的改善。與經(jīng)典模型相比,本文提出的基于K-means聚類與PLS回歸預(yù)測模型的預(yù)測精度最佳。這說明通過構(gòu)建時空相關(guān)矩陣并對其進行聚類,篩選出與目標(biāo)路段相關(guān)性最強的路段,更新訓(xùn)練數(shù)據(jù)集,可以提高模型的預(yù)測精度。相比于LSTM模型,PLS回歸模型具有更高的預(yù)測精度,且模型的訓(xùn)練時間更少。這說明PLS回歸模型不僅能夠以量化的方式給出模型提高精度過程,具有更強的解釋性,且模型的計算復(fù)雜度更低。

        3 結(jié)論

        本文的交通速度短時預(yù)測模型通過計算時空相關(guān)矩陣挖掘路網(wǎng)中相鄰路段之間交通速度的關(guān)聯(lián)性,利用K-means聚類更新數(shù)據(jù)集,結(jié)合PLS回歸模型預(yù)測交通速度。本文模型相比于傳統(tǒng)方法具有更高的預(yù)測精度,模型的預(yù)測速度和可解釋性也有較大的提升,是一種可行的交通速度短時預(yù)測方法。后續(xù)研究中,將考慮組合模型的方式,在模型訓(xùn)練過程中選擇添加其他時段的交通速度數(shù)據(jù),以增強模型的適用性。

        參考文獻(xiàn)

        [1]VLAHOGIANNI E I, KARLAFTIS M G, GOLIAS J C. Short-term traffic forecasting: Where we are and where we′re going[J]. Transportation Research Part C-Emerging Technologies, 2014, 43(1): 3-19.

        [2]袁健, 范炳全. 交通流短時預(yù)測研究進展[J]. 城市交通, 2012,10(6):73-79.

        [3]周輝宇, 李瑞敏, 黃安強, 等. 基于時空關(guān)聯(lián)規(guī)則挖掘的城市交通擁堵傳導(dǎo)預(yù)測[J]. 系統(tǒng)工程理論與實踐,2022, 42(8): 2210-2224.

        [4]張國赟, 金輝. 基于改進ARIMA模型的城市軌道交通短時客流預(yù)測研究[J]. 計算機應(yīng)用與軟件, 2022, 39(1): 339-344.

        [5]LI W, WANG J X, FAN R, et al. Short-term traffic state prediction from latent structures: Accuracy vs. efficiency[J]. Transportation Research Part C-Emerging Technologies, 2020, 111: 72-90.

        [6]CHEN R, LIANG C Y, HONG W C, et al. Forecasting holiday daily tourist flow based on seasonal support vector regression with adaptive genetic algorithm[J]. Applied Soft Computing, 2015, 26: 435-443.

        [7]LI Y F, JIANG X, ZHU H, et al. Multiple measures-based chaotic time series for traffic flow prediction based on Bayesian theory[J]. Nonlinear Dynamics, 2016, 85(1):179-194.

        [8]PRIAMBODO B, AHMAD A, KADIR R A. Spatio-temporal K-NN prediction of traffic state based on statistical features in neighboring roads[J]. Journal of Intelligent and Fuzzy Systems, 2021, 40(5): 9059-9072.

        [9]RUMELHART D E, HINTON G E, WILLIAMS R J. Learning representations by back-propagating errors[J]. Nature, 1986, 323: 533-536.

        [10]? SUN Z Y, HU Y J, LI W, et al. Prediction model for short-term traffic flow based on a K-means-gated recurrent unit combination[J]. IET Intelligent Transport Systems, 2022, 16(5): 675-690.

        [11] KANG C L, ZHANG Z Y. Application of LSTM in short-term traffic flow prediction[C]// 2020 IEEE 5th International Conference on Intelligent Transportation Engineering (ICITE). Beijing, 2020: 98-101.

        [12] LI Z Y, GE H X, CHENG R J. Traffic flow prediction based on BILSTM model and data denoising scheme[J]. Chinese Physics B, 2022,31(4):214-223.

        [13] BRUNA J, ZAREMBA W, SZLAM A, et al. Spectral networks and locally connected networks on graphs[DB/OL].[2022-08-30]. https://arxiv.org/pdf/1312.6203.pdf.

        [14] SHEN G J, HAN X, CHIN K, et al. An attention-based digraph convolution network enabled framework for congestion recognition in three-dimensional road networks[J]. IEEE Transactions on Intelligent Transportation Systems, 2021,23(9): 14413-14426.

        [15] CHENG Z Y, WANG W, LU J, et al. Classifying the traffic state of urban expressways: A machine-learning approach[J]. Transportation Research Part A-Policy and Practice, 2020, 137: 411-428.

        [16] 王旭鵬, 王夢靈. 基于相似性聚類的交通流概率組合預(yù)測模型[J]. 華東理工大學(xué)學(xué)報(自然科學(xué)版), 2022, 48(3): 381-387.

        [17] ZHANG Z H, WANG Y P, CHEN P, et al. Probe data-driven travel time forecasting for urban expressways by matching similar spatiotemporal traffic patterns[J]. Transportation Research Part C-Emerging Technologies, 2017, 85: 476-493.

        [18] GUO Y N, YANG H, CHEN M Y, et al. Ensemble prediction-based dynamic robust multi-objective optimization methods[J]. Swarm and Evolutionary Computation, 2019, 48: 156-171.

        [19] YANG L K, GUO Y N, CHENG J, et al. Manifold distance-based over-sampling technique for class imbalance learning[C]// 33rd AAAI Conference on Artificial Intelligence/31st Innovative Applications of Artificial Intelligence Conference/ 9th AAAI Symposium on Educational Advances in Artificial Intelligence. Hawaii, 2019: 10071-10072.

        [20] 王德政, 張益農(nóng), 楊帆. 基于MapReduce的并行PLS過程監(jiān)控算法實現(xiàn)[J]. 計算機工程與應(yīng)用, 2018, 54(24): 61-65+175.

        Short-term Prediction of Traffic Speed Based on K-means Clustering and PLS Regression Model

        JIA Xiu-yan, SUN Qiu-xia, LI Qing

        (College of Mathematics and Systems Science, Shandong University of Science and Technology, Qingdao 266590, China)

        Abstract: To achieve effective extraction of local features of traffic flow and to improve the interpretability of traffic prediction models, a K-means clustering and PLS regression model was proposed to predict short-time traffic speed. The Spatio-temporal correlation matrix was calculated to explore the correlation between the traffic speeds of adjacent road sections in the road network. The K-means clustering algorithm was used to divide the historical data set. The PLS regression model was used to make the predictions. To verify the accuracy of the model for short-time traffic speed prediction, the GPS data of taxis was selected for validation. The experimental results show that the models prediction error is reduced by about 30% compared with the ARIMA, PLS regression, and LSTM models.

        Keywords: urban transportation; short-term speed prediction; K-means clustering; partial least squares regression; spatio-temporal correlation matrix

        收稿日期:2022-09-09

        基金項目:山東省自然科學(xué)基金面上項目(批準(zhǔn)號:ZR2021MF113)資助。

        通信作者:孫秋霞,女,博士,副教授,主要研究方向為交通大數(shù)據(jù)分析與建模。E-mail:qiuxiasun@sdust.edu.cn。

        猜你喜歡
        means聚類城市交通
        新形勢下我國城市交通發(fā)展戰(zhàn)略思考
        老齡化背景下關(guān)于城市交通適老化對策的思考
        共享單車對城市交通的影響
        智富時代(2019年2期)2019-04-18 07:44:42
        上海城市交通大數(shù)據(jù)研究與實踐
        上海公路(2018年1期)2018-06-26 08:37:40
        基于“粉絲經(jīng)濟”的自媒體社群用戶消費意愿研究
        人工神經(jīng)網(wǎng)絡(luò)在聚類分析中的運用
        雹云圖像的識別指標(biāo)設(shè)計
        基于QPSO聚類算法的圖像分割方法
        科技視界(2016年12期)2016-05-25 11:54:25
        基于知網(wǎng)的無指導(dǎo)詞義消歧
        契合城市交通需求 推進單軌交通發(fā)展
        中出人妻中文字幕无码| 国产成人一区二区三区免费观看| 91热久久免费精品99| 国产精品人人爱一区二区白浆| 国产福利一区二区三区视频在线看 | 久久久噜噜噜久久| 亚洲热妇无码av在线播放| 天下第二社区在线视频| 亚洲国产成人无码av在线影院| 国产成人+亚洲欧洲+综合| 国产成人九九精品二区三区| 久久久久国产亚洲AV麻豆| 亚洲人妖女同在线播放| 蜜桃视频成年人在线观看| 97中文字幕精品一区二区三区| 精品人妻av区乱码| 女人和拘做受全程看视频 | 精品人妻大屁股白浆无码| 国产成人午夜无码电影在线观看| 国产农村妇女精品一二区| 国产亚洲精品第一综合麻豆| 无码久久精品蜜桃| 中文国产成人精品久久一区| av一区二区不卡久久| 亚洲伊人av综合福利| 久久精品国产av麻豆五月丁| 蜜芽亚洲av无码精品色午夜| 免费a级毛片无码av| 久久久精品人妻一区二区三区四| 国产午夜福利短视频| 中日无码精品一区二区三区| 国产免费网站在线观看不卡| 999zyz玖玖资源站永久| 成片免费观看视频大全| 亚洲高清有码在线观看| 亚洲伊人久久综合精品| 亚洲av色av成人噜噜噜 | 欧美男生射精高潮视频网站| 麻豆果冻传媒在线观看| 少妇高潮惨叫喷水在线观看| 白白色发布在线播放国产|