李慧穎,武亞鵬,許熳靈,李 婷
(中南勘察設計院集團有限公司 武漢市 430073)
經過四十余年的建設發(fā)展,截至2020年末,我國高速公路里程已經突破16萬公里,超過5000km的省份(市、自治區(qū))達到了18個,在全國范圍內構建起了快捷、高效的運輸體系,支撐國民經濟的高質量發(fā)展。同時,“十四五”時期我國高速公路里程仍舊持續(xù)增長,預計至2026年達到20km,面對規(guī)模如此巨大的高速公路網(wǎng)絡,如何做好運行特征研究,優(yōu)化運營管理成為高速公路“提質增效”的關鍵命題。
關于高速公路運行特征的相關研究可分為兩類,下面進行分別介紹。第一類是利用高速公路收費數(shù)據(jù)、視頻監(jiān)測數(shù)據(jù)等基礎數(shù)據(jù),運用統(tǒng)計分析方法對高速公路時間運行特征、空間運行特征進行定量或定性的描述,如劉國盼等[1]對貴州省高速公路在節(jié)假日期間車輛出行目的進行了相關闡述,并以此分析交通擁堵原因;桑美英等[2],利用高速公路運行大數(shù)據(jù),對全國高速公路貨運車輛比例、月平均車流量、分時段客貨車流量、節(jié)假日車流量以及運距等相關指標進行了統(tǒng)計;李若靈[3]則重點對上海市2012年至2018年高速公路節(jié)假日車流量數(shù)據(jù)進行統(tǒng)計分析,研究高速公路擁堵原因,并提出相關建議;楊朗等[4]以高速公路卡口數(shù)據(jù)、貨車GPS定位數(shù)據(jù)等為基礎數(shù)據(jù),對廣州機場高速公路高峰小時交通量、飽和度、客貨車比例等時間特征進行了統(tǒng)計。
第二類則是構建數(shù)學模型對基礎數(shù)據(jù)進行挖掘,分析高速公路運行特征產生機理,如戢曉峰等[5]采用線性回歸的方法,分析研究惡劣天氣對高速公路交通流影響;趙珍珍等[6]利用聚類分析的方法,對經濟發(fā)展水平與交通量之間的相關性進行了分析;王林等人以高速公路聯(lián)網(wǎng)收費數(shù)據(jù)為基礎,采用線性回歸分析的方法,研究交通量與地區(qū)生產總值之間的相關性。楊中岳[7]利用手機信令數(shù)據(jù),基于神經網(wǎng)絡模型建立了高速公路運行狀態(tài)預測方法;李桃迎等[8]則是以高速公路車流量數(shù)據(jù)及天氣數(shù)據(jù)為基礎數(shù)據(jù),建立交通量短時預測模型;龍科軍等[9]對高速公路線圈監(jiān)測數(shù)據(jù)展開研究,并建立了交通流評判模型。
綜上所述,采用數(shù)學模型進行數(shù)據(jù)挖掘的方法能夠進一步揭示高速公路運行特征影響機理,在基礎數(shù)據(jù)充裕的情況下更具研究意義,其挖掘方式主要包括分類、估計、預測、聚類、相關性分析等多種類型。因此,以湖北省某高速公路收費站所數(shù)據(jù)為基礎,采用聚類、線性回歸等方法對其運行特征展開研究。
選取湖北省某條高速公路作為研究對象,并統(tǒng)計了其2018年至2020年分月份斷面交通量數(shù)據(jù)、收費站所分日交通量及收費站一天中分時段交通量,由于卡口僅記錄出站口車輛數(shù)據(jù),因此該數(shù)據(jù)不含進站口車輛數(shù)據(jù),見圖1。
圖1 高速公路月平均日交通量統(tǒng)計
以月為單位分析可知,該高速公路2018年與2019年月平均日交通量分布趨勢基本一致(注:2020年由于疫情的影響,暫不分析其交通量變化趨勢),均是在1月份至2月份交通量達到峰值,之后開始下降,至5月份開始回升,10月份出現(xiàn)高峰,12月份出現(xiàn)低谷。
重點選取1月份、4月份、5月份、10月份的日交通量進行統(tǒng)計分析,結果顯示,高速公路交通量受節(jié)假日影響較為明顯,其中春節(jié)返鄉(xiāng)前期,12號收費站所最高日交通量達到12000vel,是正常情況下6倍之多;清明節(jié)、五一勞動節(jié)、國慶節(jié)也均出現(xiàn)了較大波動。究其原因,主要是受節(jié)假日返鄉(xiāng)、出游、復工等交通集中出行以及高速免費政策的影響,導致高速公路交通量短時間內激增,見圖2。
圖2 高速公路12號收費站所2019年1月份、4月份、5月份、10月份日交通量統(tǒng)計
以小時為單位分析可知,12號收費站所一天中存在明顯的早高峰和晚高峰時段,分別集中在9時至10時和18時至19時,高峰小時系數(shù)為0.08左右,凌晨1時至6時交通量者處于較低水平,其中3時至5時交通量趨近于0,見圖3。
圖3 高速公路12號收費站所小時交通量分布統(tǒng)計
為深入探究前章節(jié)中高速公路所呈現(xiàn)出的交通量時間分布特征形成原因及影響因素,針對14個收費站所進行聚類分析,之后對同類收費站所共同特征進行因素相關分析,尋找影響機理。
聚類分析簡稱為聚類,是把一個數(shù)據(jù)集分為多個數(shù)據(jù)集的過程,且每個子集所含對象具有高度相似性,而相對于其它子集對象則不相似[10]。聚類的方法有很多,基本類型主要包括:劃分方法、層次聚類法、基于密度的方法和基于網(wǎng)格的方法[11]。其中,劃分方法較為常用,其分為K-mediods法和K-means法兩種,K-mediods法是由K-means法改進而來,是用來解決k-means法中離群點干擾問題,在小型數(shù)據(jù)集上運行良好。本文共14個研究對象,數(shù)據(jù)量不大,故選用K-mediods法進行聚類分析。
K-mediods法計算步驟:
(1)確定聚類簇數(shù)K值。
(2)隨機選取K個樣本作為簇中心。
(3)計算剩余樣本至中心點距離(選取歐式距離)。
(4)將簇內每個樣本點作為簇中心計算一遍距離,并將距離之和最小的點作為新的簇中心。
(5)重復步驟3與4,直至簇中心不再變化,目標函數(shù)值最小。
目標函數(shù)計算公式如下:
(1)
其中,E表示數(shù)據(jù)集中所有對象p與Ci的代表對象Oj的絕對誤差之和。
由于K值為自行選取,因此需要構建聚類結果評價指標來評判K值的合理性,通過組內平方誤差(Sum of Squared Error-SSE)來評判,具體如下:
(2)
其中,d是兩個點的歐氏距離;k是簇的個數(shù);x是數(shù)據(jù)點;ci是第i個簇的中心;si表示第i個簇中數(shù)據(jù)點的集合。
隨著聚類數(shù)目增多,每一個類別中數(shù)量減少,距離變短,SSE減小。當某一K值,SSE的減小明顯變緩,即將該聚類數(shù)目取為K值。
聚類分析之初需要對收費站所原始交通量數(shù)據(jù)進行標準化處理,以消除數(shù)量級差異對聚類結果的影響。選用z-score法(正規(guī)化方法)對交通量數(shù)據(jù)進行標準化處理,計算公式如下:
(3)
其中,yi表示第i小時標準化后的交通量數(shù)據(jù);vi表示第i小時原始交通量數(shù)據(jù);n表示交通量數(shù)據(jù)個數(shù),n=24。
選取K=2、3、4、5、6、7、8等值進行試算,并計算組內平方誤差(SSE),具體結果見圖4。
圖4 組內平方誤差(SSE)計算結果
從圖4可以看出,當K=4時,SSE減小趨勢明顯變緩,因此選取聚類簇數(shù)為4,并選取各類收費站所中部分樣本進行小時交通量分布統(tǒng)計,具體結果分析如圖5和表1所示。
圖5 四種類型收費站所小時交通量分布統(tǒng)計
表1 四種類型收費站所小時交通量分布統(tǒng)計
進行交通量時間分布影響因素分析時,采用了多元線性回歸的方法,即將收費站所是否包含在某一類別中作為被解釋變量,是取值為“1”,否則取值為“0”,將收費站所5km范圍內工業(yè)園區(qū)、景區(qū)、學校、公司(工廠)、賓館、娛樂場所、醫(yī)院、小區(qū)、村莊等POI(興趣點)數(shù)量作為解釋變量,具體計算公式如下:
z=ε+β0+β1q1+β2q2+…+βnqn
(4)
其中,z為被解釋變量,q為解釋變量,β為回歸系數(shù),ε為隨機誤差。
回歸結果顯示:一類收費站所周邊以工廠用地為主,由于上班通勤交通流的影響,導致出站口形成早高峰,小時交通量分布為單峰型;二類收費站所周邊以工業(yè)、辦公及居住用地為主,由于上班、下班通勤交通流的影響,分別導致出站口形成早高峰與晚高峰,小時交通量分布為雙峰型;三類收費站靠近或處于城區(qū),周邊用地屬性種類較多,通勤、貨運、業(yè)務、生活等各類交通流交織,導致通勤交通流帶來的高峰被稀釋,呈現(xiàn)全峰型;四類僅包含14號收費站所,難以利用線性回歸進行定量分析,通過定性分析可知,14號收費站所是某城市向東對外出行的唯一入口,同時也是溝通機場與城市的重要通道,因此其小時交通量分布綜合了二類與三類的特征,全天交通量水平較高且呈現(xiàn)多個峰值。
表2 POI(興趣點)數(shù)量與聚類結果擬合結果
通過以月、日為單位分析可知,在無特殊事件發(fā)生的情況下(自然災害、疫情等)高速公路交通量波動,主要受節(jié)假日返鄉(xiāng)、出游、復工等交通出行及高速公路免費政策的影響,交通量短時內激增,容易發(fā)生交通擁堵以及安全事故,需要相關部門制定合理的措施。對站所聚類分析,將14個收費站所分為四類,其小時分布正特征分別呈現(xiàn)單峰型、雙峰型、全峰型以及多峰型,并通過回歸分析得出,高速公路小時分布特征主要受周邊用地屬性的影響,其中工廠、辦公等用地屬性引發(fā)出站早高峰,居住用地引發(fā)出站晚高峰。本文結論對高速公路新建或改擴建過程中互通位置布設、樣式設計等相關內容,具有重要指導意義。同時,由于基礎數(shù)據(jù)的影響,并未對高速路公路交通量空間分布進行分析,后續(xù)將考慮運用OD反推等手段進行研究分析。