湯旻安,王攀琦
(1.蘭州交通大學(xué) 自動(dòng)化與電氣工程學(xué)院, 甘肅 蘭州 730070;2.蘭州理工大學(xué) 機(jī)電工程學(xué)院,蘭州 730050)
城市化與機(jī)動(dòng)化發(fā)展水平的提高,對(duì)整個(gè)交通運(yùn)輸?shù)母窬之a(chǎn)生了根本性的改造。然而,城市交通供求矛盾的情況也日漸凸顯,道路交通擁堵情況逐漸加劇。道路擁堵帶來了交通管理矛盾突出、環(huán)境污染、能源消耗顯著以及應(yīng)對(duì)突發(fā)事件的響應(yīng)時(shí)間延長(zhǎng)等城市綜合問題。
蘭州市屬于典型的河谷地形,這種地形條件下城市交通路網(wǎng)的形成受到嚴(yán)重的制約。整個(gè)市區(qū)呈一字型分布,城區(qū)的劃分也根據(jù)這一地形進(jìn)行功能分區(qū)。黃河穿過城市中心,將市區(qū)分為南北兩個(gè)部分,東西方向的主干道承載了蘭州市交通的大部分客流,而南北方向則不夠通達(dá),其交通狀況整體表現(xiàn)為東西交通量大,南北閉塞的局面。除了兩山夾黃河的天然屏障,近年來機(jī)動(dòng)車的增加也是一個(gè)不容忽視的影響因素。除了上述這些原因,鐵路對(duì)蘭州市路網(wǎng)的二次分割加劇了交通擁堵現(xiàn)狀[1-2]。
圖1 蘭州市地形圖Fig.1 Lanzhou topographic map
城市交通擁堵問題是一個(gè)復(fù)雜的系統(tǒng)性問題,對(duì)其進(jìn)行研究具有巨大的現(xiàn)實(shí)意義[3]。本文挖掘蘭州市交通評(píng)價(jià)體系中交通的參數(shù),利用因子分析法(FA)和聚類分析對(duì)蘭州市交通擁堵狀況進(jìn)行評(píng)價(jià)。首先,利用因子分析方法對(duì)交通量各參數(shù)提取公共因子,其次,利用聚類分析發(fā)掘各路口的相關(guān)性。除此之外,利用主成分分析法在保證數(shù)據(jù)完整性的條件下對(duì)各項(xiàng)參數(shù)降維,將其數(shù)據(jù)分析結(jié)果與因子分析的數(shù)據(jù)處理結(jié)果進(jìn)行對(duì)比,進(jìn)行綜合分析驗(yàn)證。Wen等人指出,緩解交通擁堵的基本原則是科學(xué)定量地描述交通擁堵[4]。本研究通過綜合運(yùn)用因子分析和聚類分析進(jìn)行理論探索和實(shí)證分析,對(duì)蘭州市交通擁堵狀況作出了合理的評(píng)價(jià),將為地方政府的交通管理提供科學(xué)的決策方法。
因子分析是一種多元統(tǒng)計(jì)分析技術(shù),在解決多變量問題時(shí),具有顯著的優(yōu)點(diǎn),其主要思想是將原始的變量進(jìn)行分組,得到每組變量的相關(guān)性,從新得到的n組變量中提取出新的公共因子,可以同時(shí)處理許多因素相互影響的復(fù)雜體系[5]。正是這些特性,使得它在特征提取、數(shù)據(jù)壓縮方面都有著廣泛的應(yīng)用。造成交通擁堵影響的因素有很多,用因子分析對(duì)各個(gè)因素的數(shù)據(jù)進(jìn)行規(guī)格化處理,發(fā)掘造成蘭州市交通擁堵的潛在因素。
設(shè)對(duì)蘭州交通有影響的因素?cái)?shù)目為N,選取路口數(shù)目為M,則原始數(shù)據(jù)矩陣為
(1)
xij為第i個(gè)路口第j個(gè)指標(biāo)的觀察數(shù)據(jù),i=1,2,…,M;j=1,2,…,N。
因子分析中每一個(gè)變量用新公共因子的線性函數(shù)與特殊因子之和表示,公式為
Xi=ai1F1+ai2F2+…+aimFm+εi,
(i=1,2,…,p)
(2)
其中,F1,F2,…,F(xiàn)m為求取的新的公共因子,εi為特殊因子。
此模型用矩陣表示為
X=AF+ε。
其中,
(3)
矩陣A稱為因子載荷矩陣,aij稱為因子載荷。
因子分析的計(jì)算從協(xié)方差矩陣入手,可以證明,經(jīng)過標(biāo)準(zhǔn)化處理后的數(shù)據(jù)的協(xié)方差矩陣就是X的相關(guān)系數(shù)矩陣。因此,可以直接利用上文主成分分析得到的相關(guān)系數(shù)矩陣進(jìn)行分析。
求解因子載荷陣的具體方法如下:
1)計(jì)算標(biāo)準(zhǔn)化處理后的數(shù)據(jù)的相關(guān)系數(shù)矩陣,并通過相關(guān)顯著性檢驗(yàn)方法檢測(cè)因子分析法對(duì)所取樣本數(shù)據(jù)的適用性。
2)計(jì)算相關(guān)系數(shù)矩陣的特征根及其對(duì)應(yīng)的特征向量,根據(jù)特征值的大小(一般取大于1的特征值)和累積方差貢獻(xiàn)率(累積貢獻(xiàn)率達(dá)80%以上)來確定因子個(gè)數(shù)。
3)利用相關(guān)系數(shù)矩陣的特征根和特征向量計(jì)算因子載荷矩陣,
(4)
因子分析法的目的是為了減少變量個(gè)數(shù),實(shí)現(xiàn)降維,因此,得到的公因子數(shù)目是小于變量數(shù)目p的。
由因子載荷矩陣可知,因子載荷矩陣第j列元素的平方和
(5)
又因?yàn)榈趈列元素的平方和為
(6)
所以有λj=gj2,各個(gè)因子的方差貢獻(xiàn)gj2即是其對(duì)應(yīng)的各第j個(gè)特征根。
確定要提取的因子即是選取方差貢獻(xiàn)大于1的因子,也可以利用累積方差貢獻(xiàn)率來確定要提取的因子的個(gè)數(shù)m。
4)計(jì)算因子得分系數(shù)[6-7]。
聚類分析用來分析衡量同類樣本的類似性,即將高維空間數(shù)分布的結(jié)構(gòu)特征用二維圖像顯示,利用對(duì)二維圖像的識(shí)別能力考察高維空間數(shù)據(jù)分布結(jié)構(gòu)的特征。利用這一特性,從各路口的歷史數(shù)據(jù)中獲得路口間交通流量的相似性和相關(guān)性,找出各路口間的相互關(guān)系[8]。對(duì)高維數(shù)據(jù)點(diǎn)Xi(xi1,xi2,…,xim),其二維顯示的對(duì)應(yīng)點(diǎn)為Yi(yi1,yi2),則yi1,yi2應(yīng)是xi1,xi2,…,xim的某種函數(shù)。這里采用非線性映射方法(NLM)得到二維圖像。根據(jù)NLM方法,多維空間中的點(diǎn)經(jīng)過投影后,點(diǎn)與點(diǎn)之間的距離必然會(huì)產(chǎn)生誤差。
在m維空間,矢量Xi和Xj的距離為
(7)
在二維空間中,矢量Yi和Yj的距離為
dij=dis(Yi,Yj)。
(8)
映射時(shí)的誤差函數(shù)為
(9)
交通擁堵的原因是多方面的,從不同的角度都可以對(duì)其進(jìn)行評(píng)價(jià)。道路交通擁堵評(píng)價(jià)指標(biāo)可分為交叉口指標(biāo)、路段指標(biāo)、區(qū)域指標(biāo),城市交叉口作為路網(wǎng)的節(jié)點(diǎn)和交通的咽喉,對(duì)于一個(gè)城市交通狀況的評(píng)估和改善有著重要的意義,本文選擇交叉口指標(biāo)來進(jìn)行研究[11]。
交通量不是一個(gè)靜止量,隨時(shí)處于變動(dòng)之中,但其變化具有統(tǒng)計(jì)規(guī)律性。在調(diào)查時(shí),每個(gè)路口的4個(gè)方向都要設(shè)置調(diào)查組。調(diào)查時(shí)為了使數(shù)據(jù)更有說服力,需要對(duì)相對(duì)擁堵的多個(gè)路口都進(jìn)行測(cè)量統(tǒng)計(jì),最終再?gòu)钠渲袔讉€(gè)路口進(jìn)行研究分析。
為了對(duì)蘭州市交通擁堵的主要原因進(jìn)行分析,選取了8個(gè)交叉路口及其交通量參數(shù):機(jī)動(dòng)車量、非機(jī)動(dòng)車量、引道延誤、車速、路段均速、效率指數(shù)、飽和度等。車速是衡量道路通行能力的重要參數(shù)。車輛在區(qū)段行駛時(shí),往往受到各種因素的影響,如道路線形、車行道寬度、路面狀況、車輛性能、停靠站位置、交叉口交通狀況及氣候條件等。
在交通量的測(cè)量中,需要將不同類型車輛換算成標(biāo)準(zhǔn)車輛,然后進(jìn)行匯總,換算系數(shù)如表1所示。
獲取數(shù)據(jù)時(shí),由于觀測(cè)或者記錄的原因,可能會(huì)導(dǎo)致有些數(shù)據(jù)明顯不合理,在實(shí)際分析中要淘汰這些數(shù)據(jù)。在分析中如果出現(xiàn)了參數(shù)未按要求記錄、延誤時(shí)間為負(fù)、明顯地超過了合理范圍等情況就認(rèn)為數(shù)據(jù)失效。因此,必須對(duì)無效數(shù)據(jù)進(jìn)行剔除。
除此之外,在實(shí)際的提取數(shù)據(jù)的過程中,不可避免地會(huì)存在設(shè)備故障、操作失誤而造成的個(gè)別數(shù)據(jù)丟失。這時(shí)需要對(duì)丟失的數(shù)據(jù)進(jìn)行彌補(bǔ),常用的技術(shù)就是均值彌補(bǔ),即用集中變量的均值來代替丟失的數(shù)據(jù)。還可能有個(gè)別數(shù)據(jù)離群較遠(yuǎn),或者叫作異常值、極端值,一般情況下,這種數(shù)據(jù)應(yīng)直接舍去。
從蘭州市主要的擁堵路口路段中選取一些具有代表性的路口進(jìn)行分析。通過實(shí)地檢測(cè),選取8個(gè)路口,得到各交通流信息如表2所示。
表1 標(biāo)準(zhǔn)車換算系數(shù)Tab.1 Conversion coefficient of standard vehicle
數(shù)據(jù)來源:蘭州市交通規(guī)劃調(diào)查報(bào)告
表2 蘭州各路口交通參數(shù)值Tab.2 Traffic parameters of each intersection in Lanzhou
數(shù)據(jù)來源:蘭州市交通規(guī)劃調(diào)查報(bào)告。
本文采用SPSS軟件進(jìn)行因子模型分析[12],進(jìn)行因子分析的7個(gè)指標(biāo):機(jī)動(dòng)車量(B1)、非機(jī)動(dòng)車量(B2)、引道延誤(B3)、車速(B4)、路段均速(B5)、效率指數(shù)(B6)、飽和度(B7)。
經(jīng)計(jì)算得到相關(guān)系數(shù)矩陣及相關(guān)顯著性檢驗(yàn)如表3所示。上下兩部分分別為原始變量相關(guān)系數(shù)矩陣和相關(guān)系數(shù)顯著性檢驗(yàn)的P值,從上半部分可以看出,矩陣中存在大量高值相關(guān)系數(shù),下半部分P值存在很多小于0.05的數(shù)值,上下兩部分均表明原始變量之間存在著較強(qiáng)的相關(guān)性。
表3 相關(guān)系數(shù)矩陣及相關(guān)顯著性檢驗(yàn)Tab.3 Correlation matrix and relevant significance test
表4為特征根及方差貢獻(xiàn)情況。初始特征值用于選擇和確定要提取的因子,共有3項(xiàng),分別為特征值、方差貢獻(xiàn)率、累積方差貢獻(xiàn)率。在表4中共有兩個(gè)因子的特征根大于1,所以應(yīng)提取兩個(gè)因子,如表5所示。從旋轉(zhuǎn)前因子方差貢獻(xiàn)率可以看到,提取出的兩個(gè)因子可以解釋原始變量81.383% 的信息,具有代表性。對(duì)比旋轉(zhuǎn)前后方差貢獻(xiàn)情況可以看出,旋轉(zhuǎn)后兩個(gè)因子的特征根和方差發(fā)生改變,但其累積方差貢獻(xiàn)率與旋轉(zhuǎn)前保持一致。
表4 特征根與方差貢獻(xiàn)Tab.4 Characteristic root and variance contribution
因子旋轉(zhuǎn)的目的在于使因子載荷簡(jiǎn)單化,便于對(duì)測(cè)量數(shù)據(jù)點(diǎn)進(jìn)行分組。從表5可看出,兩個(gè)因子在不同原始變量上的載荷范圍沒有明顯的差別,因此要對(duì)因子載荷進(jìn)行旋轉(zhuǎn)。
表5 旋轉(zhuǎn)前因子載荷陣Tab.5 Factor load array before rotation
從表6可以看出,旋轉(zhuǎn)后載荷系數(shù)兩極差異顯著。第一公因子在指標(biāo)B6(效率指數(shù))、B3(引道延誤)、B4(車速)、B5(路段均速)上有較大載荷,這表明這些指標(biāo)有較強(qiáng)的相關(guān)性,歸為一類,從影響因素來看,這些指標(biāo)主要受道路條件的制約,對(duì)于蘭州,對(duì)道路限制最大的是兩山夾一河的特殊地形,因此可以把第一公因子命名為“地形因子”。第二公因子在B1(機(jī)動(dòng)車量)、B2(非機(jī)動(dòng)車量)、B7(飽和度)上有較大載荷,而這3個(gè)因子都是關(guān)于交通量的指標(biāo),因此,可以將其命名為“交通量因子”。
從相關(guān)系數(shù)矩陣出發(fā)來進(jìn)行因子分析,這里的B1~B7是標(biāo)準(zhǔn)化變換之后的變量。此外,因子得分是利用旋轉(zhuǎn)后的因子載荷陣得到的。根據(jù)因子分析的數(shù)學(xué)特性可以得出,得分值越大的因子,其對(duì)新因子的影響也越大[13]。從表7和圖2可以看出, 7個(gè)指標(biāo)中, 3(引道延誤)、 4(車速)、 5(路段均速)、6(效率指數(shù))與地形關(guān)系較大,1(機(jī)動(dòng)車量)、2(非機(jī)動(dòng)車量)、7(飽和度)與交通量關(guān)系較大。
表6 旋轉(zhuǎn)后因子載荷陣Tab.6 Factor load array after rotation
表7 因子得分系數(shù)矩陣Tab.7 Component score coefficient matrix
圖2 各因子得分圖Fig.2 Score of each factor
通過圖3可以看出,各交通路口聯(lián)系的緊密程度,南關(guān)什字 (3)、中山橋 (5)、小西湖(8)的3個(gè)路口數(shù)據(jù)在二維空間的距離比較接近,說明這3個(gè)路口之間的聯(lián)系較為緊密。同樣得出,天水路什字(6)和省圖書館(7)兩路口關(guān)系較大。各路口的分類在二維平面圖上是按照一定的方向和順序鄰次排列的,自右向左,擁堵程度逐漸增加。因此,各個(gè)路口之間不是相互獨(dú)立的,反而有著一定的聯(lián)系。不同的擁堵類別,客觀地反映了地理、車流對(duì)交通狀況的影響。在對(duì)交通流進(jìn)行控制和疏導(dǎo)時(shí),對(duì)于聯(lián)系緊密程度不同的路口,應(yīng)分別考慮各路口之間的相互影響,以便實(shí)現(xiàn)合理疏導(dǎo)。
圖3 高維數(shù)據(jù)映射到二維空間的結(jié)果圖像Fig.3 High-dimensional data is mapped to the result image in two-dimensional space
PCA是一種多元統(tǒng)計(jì)分析技術(shù)。它是一種基于目標(biāo)統(tǒng)計(jì)特性的正交變換方法,變換后的新分量正交或不相關(guān),同時(shí)可以反映原始變量的絕大部分信息[14]。分析結(jié)果如圖4所示。
圖4 各主成分方差的帕累托圖Fig.4 Pareto charts for variance of the principal components
通過圖4可以簡(jiǎn)明地看出,各個(gè)新主成分的各自貢獻(xiàn)率及其對(duì)應(yīng)的累積貢獻(xiàn)率的大小,選取前3個(gè)成分:機(jī)動(dòng)車量(1)、非機(jī)動(dòng)車量(2)、引道延誤(3),其累積貢獻(xiàn)率為91.763 5%(大于85%),因而前3個(gè)主成分即可作為提取的主成分,來代表全部7個(gè)變量的大部分信息。根據(jù)前3個(gè)主成分得分,用其貢獻(xiàn)率加權(quán),可分別求出8個(gè)路口各自的得分[15]。
運(yùn)用PCA仿真分析得到,造成蘭州市交通擁堵的主要原因包括機(jī)動(dòng)車和非機(jī)動(dòng)車交通量過大,混合交通流量往往會(huì)加劇交通的擁堵。由于受自行車和行人影響,機(jī)動(dòng)車減速、停車等待、占用路面等問題總是導(dǎo)致道路堵塞。因此,與機(jī)動(dòng)車交通流量相比, 混合交通流量加重了交通擁堵[16]。其次,引道延誤方差貢獻(xiàn)率也較大,而道路條件是對(duì)引道延誤的主要制約因素,說明蘭州市的特殊地形同樣是交通擁堵的巨大誘因。
綜上所述,蘭州市的道路條件,即河谷狹長(zhǎng)地形以及車流量是導(dǎo)致蘭州市交通擁堵現(xiàn)狀的首要因素,與因子分析提取出的兩個(gè)新因子“地形”、“交通流”的結(jié)論是一致的,因此把二者視作擁堵治理的重點(diǎn)對(duì)象。
本文綜合運(yùn)用了因子分析法和聚類分析對(duì)蘭州交通擁堵狀況進(jìn)行了分析。首先,利用因子分析法建立因子分析模型,提取出不可觀測(cè)的潛在變量,分別為車量因子和地形因子。然后,利用聚類分析對(duì)8個(gè)交叉口進(jìn)行分類,分析了路口之間的相關(guān)性。最后,運(yùn)用主成分分析法提取主成分,與因子分析進(jìn)行對(duì)比。運(yùn)用PCA 法提取出了機(jī)動(dòng)車量、非機(jī)動(dòng)車量、引道延誤這3個(gè)新主成分。這一仿真結(jié)果證實(shí)了因子分析結(jié)果的正確性。可以證明,二者分析結(jié)果一致,因此,總結(jié)蘭州市交通擁堵的主要因素為蘭州市特殊的地形和混合交通量。本文的研究結(jié)果為蘭州市交通擁堵治理提供了明確的方向。此外,還可以把路段和交叉口各個(gè)交通量結(jié)合在一起同時(shí)進(jìn)行因子分析,這將對(duì)蘭州市交通擁堵的緩解和治理有重要的指導(dǎo)意義。