邵志成,錢勇生,曾俊偉
(1.蘭州交通大學(xué)建筑與城市規(guī)劃學(xué)院,甘肅蘭州730070;2.蘭州交通大學(xué)交通運(yùn)輸學(xué)院,甘肅蘭州 730070)
為解決城市交通問題,交通領(lǐng)域的工作者們都在致力于追尋有效的解決方法。這些方法和手段概括起來有兩大類。一類是從交通管理入手,用現(xiàn)代化的交通管理手段對交通流進(jìn)行有效的控制、誘導(dǎo)、調(diào)度和指揮,這些管理方法的應(yīng)用大大地提高了城市道路系統(tǒng)的利用效率,并縮短了出行者的出行時間;解決交通問題的另一類方法是從城市交通規(guī)劃入手,根據(jù)交通需求規(guī)劃交通設(shè)施,改善交通條件,排除交通瓶頸??茖W(xué)的交通規(guī)劃是解決城市交通供需矛盾的有效途徑。通過準(zhǔn)確預(yù)測城市交通需求,對城市交通進(jìn)行系統(tǒng)科學(xué)的規(guī)劃,進(jìn)而提高城市交通網(wǎng)絡(luò)的利用率。
隨著城市交通需求管理(Transportation Demand Management,簡稱TDM)政策的實(shí)施應(yīng)用和交通系統(tǒng)規(guī)劃思想的不斷發(fā)展,分析城市居民出行行為、建立高效的出行需求預(yù)測模型對未來年城市居民出行行為進(jìn)行預(yù)測,為交通系統(tǒng)規(guī)劃和交通需求管理政策的制定和評價提供基礎(chǔ)數(shù)據(jù)和分析評級的依據(jù),成為交通領(lǐng)域近幾年來一直研究和探討的問題。河谷型城市由于特殊地形條件的限制和城市發(fā)展階段、城市性質(zhì)的影響,其交通問題要比同等條件平原型城市出現(xiàn)得早,而且較為嚴(yán)重。同時由于域內(nèi)河流對城市空間的割裂,嚴(yán)重影響著城市布局,城市道路網(wǎng)規(guī)劃嚴(yán)重不足,導(dǎo)致了河谷型城市交通混亂、堵塞較為嚴(yán)重。因此,研究西部河谷型中小城市特征的居民出行行為、建立高效的出行需求預(yù)測模型具有重要意義。
目前,對城市居民出行方式預(yù)測的主要方法是采用VISEM軟件進(jìn)行預(yù)測或是采用Israell模型、Wen and Koppehman模型、PETRA模型、AMOS模型、ALBATROSS模型等進(jìn)行分析和預(yù)測。而居民出行預(yù)測的考慮的因素較多,數(shù)據(jù)維數(shù)較多,上述模型在處理大維數(shù)的數(shù)據(jù)方面比較困難,預(yù)測結(jié)果的隨機(jī)性不可避免。本文采用支持向量機(jī)進(jìn)行城市居民出行預(yù)測。支持向量機(jī)是一種有堅(jiān)實(shí)理論基礎(chǔ)的新穎的小樣本機(jī)器學(xué)習(xí)方法,它區(qū)別于現(xiàn)有的統(tǒng)計方法,基本上不涉及概率測度和大數(shù)定理;可以有效地避免數(shù)據(jù)“維數(shù)災(zāi)難”。在城市居民出行預(yù)測這種影響因素較多,數(shù)據(jù)維數(shù)比較大的問題中,支持向量機(jī)能夠發(fā)揮較大的作用,可有效地避免數(shù)據(jù)的隨機(jī)性,預(yù)測結(jié)果更加科學(xué)合理。
河谷型城市是指城市主體在河谷中形成并發(fā)育的一類城市,有廣義和狹義兩類。廣義的河谷型城市是指城市主體本身不受地形限制,但城鎮(zhèn)體系的發(fā)育卻受到相當(dāng)程度的限制,隨地形、河流走向布局和沿伸。狹義的河谷型城市是指城市的主體發(fā)育受到河谷地形較為強(qiáng)烈的直接限制,城市本身被迫沿地形、河流走向發(fā)展[1]。
河谷型城市由于獨(dú)特的內(nèi)涵而具有以下幾個方面的特點(diǎn):(1)地形對城市發(fā)展格局的強(qiáng)烈限制,迫使城市隨地形的格局而布局。(2)城市發(fā)展到一定階段為群組形態(tài),城市布局一般具有明顯的組團(tuán)特征。(3)城市發(fā)展主軸一般沿河流主河道伸展,呈現(xiàn)帶狀密集空間結(jié)構(gòu)。(4)城市主體一般在河谷的第二、第三級階地上先行發(fā)展,再向外圍、山上逐步延伸。(5)城市發(fā)展到一定規(guī)模,必出現(xiàn)“跳躍”發(fā)展,由于河谷的天然限制,城市發(fā)展到一定階段后,擴(kuò)散的迫切性和必要性比平原型城市要強(qiáng)烈得多,必將跳出河谷,向外圍尋求支撐點(diǎn),如衛(wèi)星城鎮(zhèn)。(6)河谷型城市的城市容量與規(guī)模有明顯的限制。城市病(如環(huán)境污染、交通問題等)也比相應(yīng)規(guī)模和性質(zhì)的其它類型城市出現(xiàn)的時間早,而且一般較為嚴(yán)重。(7)城市布局獨(dú)特,層次分明、立體感強(qiáng)、景觀與其它城市差別顯著[2]。
城市居民進(jìn)行出行方式選擇既受到出行者主觀心理需求、愿望和出行目的的影響,又受到出行距離、城市交通設(shè)施建設(shè)水平、布局結(jié)構(gòu)、服務(wù)水平的制約。我們將影響人們選擇出行方式的因素分為宏觀因素和微觀因素。宏觀因素如社會經(jīng)濟(jì)發(fā)展水平、車輛擁有量、交通政策等,決定著出行方式的總結(jié)構(gòu);微觀因素主要包括出行者的特征(有無車輛、年齡、經(jīng)濟(jì)水平、生活習(xí)慣等)、出行特征(出行目的、出行時間、出行距離或空間分布)、交通設(shè)施的服務(wù)水平(費(fèi)用、時間、舒適度、可靠性、安全性)決定著居民出行行為的發(fā)生。此外,城市的經(jīng)濟(jì)發(fā)展,居民生活水平的變化,城市公共交通系統(tǒng)的發(fā)展,都將改變居民的出行特征。
城市居民出行行為選擇是一個非常復(fù)雜的心理過程,既反映在居民對家庭住址、交通工具的購買等長期決策過程方面,也反映在居民的出行動機(jī)、出行方式選擇等臨時決策方面;既表現(xiàn)在居民出行的普遍心理需求上,也表現(xiàn)在居民對交通系統(tǒng)運(yùn)營效率、服務(wù)質(zhì)量評價態(tài)度上。這些行為心理選擇決策既受到居民自身的社會經(jīng)濟(jì)特性的約束,也受到交通系統(tǒng)運(yùn)營特征的影響。而城市居民的出行活動,亦即城市的客運(yùn)交通量是構(gòu)成城市交通的主體,居民的行為表現(xiàn)顯示了城市客運(yùn)交通的特點(diǎn)、結(jié)構(gòu)和模式。
綜上所述,本文選取經(jīng)濟(jì)性、快速性和便捷性作為判斷指標(biāo),建立廣義費(fèi)用函數(shù)Qi=Ei+Fi+Ci。
式中:
Ei是經(jīng)濟(jì)性指標(biāo),Ei=Ri×Li,其中:Ri為第 i種出行方式的小時費(fèi)用;Li為第i種出行方式的出行里程。
Fi是快捷性指標(biāo),其中:vi為第種出行方式的速度;li為第i種出行方式與換乘站之間的距離;vi為第i種出行方式與另一種換乘站的時間;GDP為地區(qū)國民生產(chǎn)總值;P為地區(qū)人口數(shù)量;t為勞動者平均勞動時間。
Ci是便捷性指標(biāo),其中:Wi為第i種出行方式平均等待時間。
支持向量機(jī)最初廣泛應(yīng)用于模式識別及函數(shù)回歸等傳統(tǒng)機(jī)器學(xué)習(xí)領(lǐng)域,取得很好的效果。現(xiàn)在將支持向量機(jī)的預(yù)測功能應(yīng)用到城市居民出行方式選擇預(yù)測上。
把支持向量機(jī)估計指示函數(shù)中得到的結(jié)論推廣到實(shí)函數(shù)中,即支持向量機(jī)回歸。根據(jù)統(tǒng)計學(xué)理論,構(gòu)造線性回歸方程[3]:
其中:非線性映射Φ把數(shù)據(jù)x映射到高維特征空間F;ω為在空間F中的特征向量;b為偏置值。
其中:ε為不敏感損失函數(shù):C為懲罰系數(shù)。
引入拉格朗日函數(shù)和對偶變量[3]:
其中:K(xi,xj)=φ(xi)φ(xj)為核函數(shù),可用于預(yù)測的核函數(shù)一般為多項(xiàng)式函數(shù)和徑向基(RBF)函數(shù)為核函數(shù)寬度。這兩種核函數(shù)都能進(jìn)行非線性映射,但多項(xiàng)式核函數(shù)的參數(shù)較多,相應(yīng)的復(fù)雜程度比RBF核函數(shù)高。目前關(guān)于核函數(shù)的選取問題沒有明確的理論依據(jù),用仿真實(shí)驗(yàn)法選取核函數(shù)是比較可行的辦法。
在式(3)的約束條件下,最小化式(5)求得 ai,ai*,代入式(4),可構(gòu)造一個線性的回歸函數(shù):
圖1 集合S、E、R的分布特征示意圖
上述3個集合的分布特征如圖1所示。
基于支持向量機(jī)的城市居民出行費(fèi)用預(yù)測的技術(shù)路線如圖2所示。首先確定影響居民出行的影響因素,本文選擇國內(nèi)生產(chǎn)總值(GDP)、地區(qū)人口數(shù)量、單位小時出行費(fèi)用、出行里程、出行速度、出行換乘時間,因變量就是出行方式。對數(shù)據(jù)進(jìn)行預(yù)處理后,就可以進(jìn)行預(yù)測了。在預(yù)測時,要對不同的參數(shù)進(jìn)行設(shè)定和選擇。對于不同的參數(shù),數(shù)據(jù)擬合的程度也不相同,對原始數(shù)據(jù)擬合程度能達(dá)到預(yù)期要求,支持向量機(jī)就可以選定了,從而對城市居民出行費(fèi)用進(jìn)行進(jìn)一步的預(yù)測。
基于支持向量機(jī)的城市居民出行費(fèi)用預(yù)測算法步驟:
Step1:選擇居民出行指數(shù)自變量和因變量。
Step2:將選擇居民出行指數(shù)自變量和因變量作量化預(yù)處理。
Step3:參數(shù)初步選擇。
Step4:進(jìn)行SVM模型訓(xùn)練。如果達(dá)到預(yù)定要求,獲得最優(yōu)模型;否則,參數(shù)調(diào)整,轉(zhuǎn)到step3。
Step5:用最優(yōu)模型進(jìn)行居民出行預(yù)測,得到結(jié)論。
圖2 基于支持向量機(jī)的城市居民出行預(yù)測技術(shù)路線圖
以西部城市定西市為研究對象,對其從2007-2013年的及上文提到的6個因素及出行費(fèi)用進(jìn)行統(tǒng)計,統(tǒng)計結(jié)果如表1和表2所列。
選擇其中的6組數(shù)據(jù)進(jìn)行訓(xùn)練,剩余1組數(shù)據(jù)樣本進(jìn)行測試,采用數(shù)據(jù)滑動窗方式,構(gòu)造不同的訓(xùn)練樣本及測試樣本。
表1 定西市居民出行影響因素調(diào)查表
表2 定西市居民出行費(fèi)用統(tǒng)計表
分別選擇核函數(shù)和多項(xiàng)式核函數(shù)對數(shù)據(jù)樣本進(jìn)行訓(xùn)練。通過仿真發(fā)現(xiàn),RBF核函數(shù)的擬合效果比多項(xiàng)式核函數(shù)的擬合效果要好。因此,本文選擇高斯RBF函數(shù)為核函數(shù)。對于其他參數(shù)的選擇,本文選擇了V-SVR作為SVM的類型,選擇損失函數(shù)為默認(rèn)值1。
分別分析各個參數(shù)的變化對居民出行費(fèi)用的影響(見圖3),由圖3可知,當(dāng)C=32,g=0.0078時,費(fèi)用最大。
輸入樣本數(shù)據(jù):將表2中的6組數(shù)據(jù)作為輸入樣本,剩余1組為測試輸出。
訓(xùn)練結(jié)果:隨機(jī)選取一組輸入樣本進(jìn)行訓(xùn)練并對剩下的樣本進(jìn)行測試,為比較該算法的性能,這里引入相對誤差eerr,對預(yù)測效果進(jìn)行比較分析:
圖3 居民出行費(fèi)用因素分析圖
其中:y為居民實(shí)際出行費(fèi)用:y,為用訓(xùn)練模型預(yù)測出的居民出行費(fèi)用。
分別對2013年的城市居民出行幾種方式的費(fèi)用進(jìn)行預(yù)測,結(jié)果如圖4所示。
由圖4可以看出:預(yù)測的出行方式和城市交通未來發(fā)展前景接近,誤差均在1%左右,說明選擇的支持向量機(jī)對數(shù)據(jù)的擬合效果較好。
由于城市居民出行影響因素較多,數(shù)據(jù)的維數(shù)相對較大,而支持向量機(jī)在處理大維數(shù)數(shù)據(jù)方面有獨(dú)特的優(yōu)勢,本文以定西市城市居民出行費(fèi)用預(yù)測為實(shí)例,對不同出行方式費(fèi)用用支持向量機(jī)進(jìn)行擬合,擬合誤差較小,預(yù)測精度較高。由此可見,支持向量機(jī)預(yù)測模型在城市居民出行方式費(fèi)用預(yù)測中有較好的應(yīng)用潛力,對定西市交通方式合理規(guī)劃、利用有深遠(yuǎn)意義。
[1]王定成.支持向量機(jī)建模預(yù)測與控制 [M].北京:氣象出版社,2009:20-27.
[2]錢勇生.山地河谷型城市交通特性及其空間演進(jìn)機(jī)理研究[D].西北師范大學(xué),2010.
[3]陳琳.中小城市道路網(wǎng)合理級配結(jié)構(gòu)研究[D].武漢:華中科技大學(xué),2012.