羅小強(qiáng)
(長安大學(xué)建筑學(xué)院,西安710064)
出行分布觀測數(shù)據(jù)中的稀疏矩陣問題研究
羅小強(qiáng)*
(長安大學(xué)建筑學(xué)院,西安710064)
對出行分布觀測數(shù)據(jù)中的稀疏矩陣問題進(jìn)行分析,提出了部分矩陣估計、補(bǔ)零矩陣估計和增量矩陣估計3種不同方法來標(biāo)定雙約束重力模型的參數(shù).通過定義估計的精確性和有效性兩個不同的估計效果測度,將雙約束重力模型等價為帶有約束的數(shù)學(xué)規(guī)劃,并采用解析方法比較3種不同標(biāo)定方法的估計精度差異.在此基礎(chǔ)上,通過數(shù)值方法模擬計算,并比較3種標(biāo)定方法的估計有效性.通過研究可以發(fā)現(xiàn),補(bǔ)零矩陣估計的參數(shù)精確性最好,而增量矩陣估計的有效性最好.研究成果能夠作為實際城市交通規(guī)劃中觀測稀疏矩陣參數(shù)標(biāo)定工作的理論依據(jù).
城市交通;稀疏矩陣;參數(shù)標(biāo)定;重力模型;誤差估計
在城市交通規(guī)劃實踐中,通過實際調(diào)查所得到的出行矩陣往往含有很多零元.假如某城市共劃分了100個交通小區(qū),每個交通小區(qū)平均2萬人左右.若為分析需要而劃分了9種出行目的、5個出行時段及7種交通方式,那么在分目的分時段分方式的出行矩陣分析中要使每個點(diǎn)對之間至少有一次出行被觀測到,觀測出行量至少為315萬人次.但總的出行量即使按照2.5人次/人·日計算,一天也不過500萬人次,加之出行分布在空間上的不均勻性,故觀測矩陣毫無疑問地會存在很多零元.
由于從出行生成到出行分布的預(yù)測分析過程主要是一種乘積運(yùn)算,這就意味著觀測矩陣中的零元將被保持到對未來的估計中去.這明顯有悖于常識.為了避免這樣的情形出現(xiàn),實踐中有三種可行的方法用以解決這一問題:
(1)部分矩陣法[1]:將含有大量零元的觀測矩陣視為部分矩陣來估計參數(shù),而后用模型估計整個矩陣,并將其視為觀測矩陣的“真實態(tài)”.這種辦法顯然損失了零元部分的阻抗信息.
(2)補(bǔ)零矩陣法[1]:采用一個較小的數(shù)來替換零元.但這樣的方法對實際觀測矩陣而言,無疑是一種結(jié)構(gòu)上的變形.
(3)增量矩陣法:采用一個全部單元格都為相同較小數(shù)的滿陣與原觀測矩陣相加.顯然這種辦法能夠最大程度地保留原有分布結(jié)構(gòu).
那么,當(dāng)面對稀疏矩陣時應(yīng)該如何選擇合理的標(biāo)定方法就成了交通需求預(yù)測理論與實踐過程中亟待解決的問題.
重力模型的參數(shù)標(biāo)定并不是一個新問題,早在上世紀(jì)70年代Williams I[2]就提出了受Hyman M[3]啟發(fā)的采用平均阻抗為收斂性判據(jù)的參數(shù)標(biāo)定算法,在實際中得到相當(dāng)廣泛的應(yīng)用.近些年來,隨著交通規(guī)劃建模技術(shù)的廣泛應(yīng)用,對一些非常規(guī)狀態(tài)下的重力模型參數(shù)標(biāo)定問題有很多新的研究成果.Lam W等對部分觀測矩陣和交通量的組合估計提出了一種隨機(jī)校準(zhǔn)方法[4].Celik M證明了重力模型的標(biāo)定中小樣本觀測數(shù)據(jù)與大樣本觀測數(shù)據(jù)同樣有效[5].Foulds H.等針對出行矩陣觀測數(shù)據(jù)中的不完備和不精確問題提出了模糊逐次線性逼近的標(biāo)定算法[6].Guo A等提出了對數(shù)線性回歸方法用以估計矩陣缺失數(shù)據(jù)[].這些研究成果都涉及到了實踐中出行矩陣的標(biāo)定問題,但對于城市交通規(guī)劃中經(jīng)常遇到的稀疏矩陣問題還缺少與實踐相對應(yīng)的分析成果.實際上在交通規(guī)劃理論的發(fā)展過程中,稀疏矩陣的問題被提出了很長時間[1,8],但由于實踐中重力模型不需要完整的觀測數(shù)據(jù)也能進(jìn)行標(biāo)定,所以這一問題在實踐中往往被忽視.
本文從重力模型參數(shù)估計的有效性和精確性兩個不同的效果出發(fā),對出行分布觀測數(shù)據(jù)中的稀疏矩陣問題進(jìn)行了分析,并通過對重力模型作等價數(shù)學(xué)規(guī)劃變換,用拉格朗日乘數(shù)法分析了對觀測稀疏矩陣的三種不同處理方法的參數(shù)估計精確性,最后通過數(shù)值計算比較了三種不同處理方法的參數(shù)估計有效性.研究結(jié)論表明,參數(shù)估計的精確性和有效性并不一致,增量矩陣的估計精度最高,但補(bǔ)零矩陣的有效性最好.本文研究結(jié)論可以作為實踐中觀測稀疏矩陣參數(shù)標(biāo)定的理論依據(jù).
為了分析問題,定義真實的出行分布所定義的矩陣結(jié)構(gòu)為“原象”,記為A;通過居民出行調(diào)查所得到的觀測結(jié)果為“觀測矩陣”,記為A0;對觀測矩陣中原來為零的單元加上小量a后得到的矩陣稱為“補(bǔ)零矩陣”,記為A1;對全部單元都加上小量a后得到的矩陣稱為“增量矩陣”,記為A2.
那么現(xiàn)在需要比較通過A1和A2標(biāo)定所得到的重力模型參數(shù)與原象矩陣參數(shù)的相對關(guān)系.但前提條件是雙約束重力模型相對于待標(biāo)定參數(shù)而言是單調(diào)增的.為了便于問題表述,假定雙約束重力模型的阻抗函數(shù)為
式中f(xij)為交通小區(qū)i到j(luò)的交通阻抗,由費(fèi)用、時間和距離等表達(dá);θ為待定系數(shù).
2.1 重力模型的單調(diào)性
按照交通規(guī)劃理論,一般雙約束重力模型可以寫為
式中qij為交通小區(qū)i到j(luò)的估計出行量;Oi為交通小區(qū)i的出行發(fā)生量;Dj為交通小區(qū)j的出行吸引量.
將qij視為關(guān)于θ的函數(shù),對式(2)兩端求關(guān)于θ的導(dǎo)數(shù),得到
考慮到模型的實際意義,顯然有Oi>0,Dj>0,cij>0成立.故?qij?θ<0成立.即qij是關(guān)于參數(shù)θ的單調(diào)減函數(shù).
2.2 阻抗函數(shù)的一般形式
假設(shè)矩陣的所有單元可以劃分為兩個集合,分別記為S和U.其中S代表觀測矩陣中不為0的單元所組成的集合,U代表觀測矩陣中為0的單元所組成的集合.則平均費(fèi)用函數(shù)為
式中a和b分別為對非0單元和0單元的調(diào)整量,顯然有a≥0 a≥0且b≥0b≥0成立.
不妨稱式(6)為費(fèi)用函數(shù)的一般形式,容易看出:當(dāng)a=b=0時為觀測矩陣的平均費(fèi)用函數(shù)0,當(dāng)a=0,b>0時為補(bǔ)零矩陣的平均費(fèi)用函數(shù)1,當(dāng)a>0,b>0時為增量矩陣的費(fèi)用函數(shù)2.
其中,出行量的估計值通過式(9)~式(11)計算得到.
這樣就建立了出行觀測量與參數(shù)之間的關(guān)系.
2.3 參數(shù)估計有效性和精確性
盡管重力模型的參數(shù)標(biāo)定是依靠迭代求得估計值所對應(yīng)的估計平均費(fèi)用與觀測平均費(fèi)用盡量靠近時所對應(yīng)的參數(shù).然而,通過迭代所得出的參數(shù)估計值盡管可能具有較高的精確性,但不一定有對預(yù)測工作來說具有有效性.在預(yù)測理論中,估計參數(shù)的精確性和有效性是兩個不同的概念[9].陳華友最早提出了預(yù)測有效度概念[10].受此啟發(fā),給出估計的精確性和有效性的定義.
定義1參數(shù)估計的精確性:將根據(jù)對現(xiàn)象的觀察所標(biāo)定的參數(shù)值與客觀上存在的參數(shù)值之間的接近程度定義為參數(shù)估計的精確性[11].一般情況下,采用參數(shù)的估計值與真值之間的相對距離來表示,即
式中δk為稀疏矩陣的不同處理方法所導(dǎo)致的參數(shù)估計誤差,下標(biāo)k為0代表觀測矩陣、為1代表補(bǔ)零矩陣、為2代表增量矩陣;為原象矩陣所對應(yīng)的參數(shù)估計值,可以視為參數(shù)估計的真值;k為稀疏矩陣的第k種處理方法所得到的參數(shù)估計值.
定義2參數(shù)估計的有效性:應(yīng)用參數(shù)估計出行矩陣時估計出行量與實際出行量之間的差距[12,13].定義估計的有效性為[14]
式中Δk為稀疏矩陣的不同處理方法所導(dǎo)致的出行量估計誤差,下標(biāo)k為0代表觀測矩陣、為1代表補(bǔ)零矩陣、為2代表增量矩陣;tij為原象矩陣第i行、j列的出行量,可以視為矩陣估計的真值;ij,k為稀疏矩陣的第k種處理方法所得到的第i行、j列的出行量的估計值;n為出行矩陣的維數(shù).
按照交通規(guī)劃理論,式(2)~式(4)所表達(dá)的雙約束重力模型與式(14)~式(18)是等價的[15].
式中Q為出行總量,那么采用拉格朗日乘數(shù)法將式(14)~式(18)轉(zhuǎn)化為無約束極值問題,即
式中λi,μj為拉格朗日系數(shù).
同理,對于觀測矩陣而言,其無約束極值問題為
同理,對于補(bǔ)零矩陣而言,其無約束極值
同理,對于增量矩陣而言,其無約束極值問題為
由于雙約束重力模型的結(jié)構(gòu)形式較為復(fù)雜,要從解析角度進(jìn)行參數(shù)的有效性估計是十分困難的.但通過數(shù)值運(yùn)算模擬的辦法則相對較為可行.借助一個簡單的算例來分析稀疏矩陣估計中不同處理方法的有效性差異.
假設(shè)有如圖1所示的交通小區(qū)劃分,各小區(qū)之間的出行阻抗如表1所示,(觀測)部分矩陣為表2,其所對應(yīng)的出行矩陣原象如表3所示.表4和表5分別為補(bǔ)零矩陣和增量矩陣.
圖1 交通小區(qū)劃分Fig.1 Traffic zone division
表1 阻抗矩陣Table 1Impedance matrix
表2 (觀測)部分矩陣Table 2Segment matrix(observation)
表3 原象矩陣Table 3The original matrix
表4 補(bǔ)零矩陣Table 4Zero padding matrix
表5 增量矩陣Table 5Incremental matrix
需要說明的是,對于圖1所示的交通小區(qū)劃分而言,其阻抗是固定不變的,而其原象矩陣可以視為在實際中真實發(fā)生的出行分布情況.要了解出行分布狀況,就需要對出行的分布進(jìn)行觀測.但需要注意的是,這樣的觀測往往是不完備的.
按照三種不同的處理方式得到的參數(shù)估計結(jié)果與原象矩陣的估計結(jié)果比較如表6所示.
表6 參數(shù)標(biāo)定結(jié)果的精確性比較分析Table 6The accuracy comparative analysis of the calibration results of parameters
在表6中,分別列出了根據(jù)原象矩陣、部分矩陣、補(bǔ)零矩陣和增量矩陣分別進(jìn)行雙約束重力模型的標(biāo)定運(yùn)算之后的結(jié)果,為了比較參數(shù)標(biāo)定的結(jié)果,表6中同時也列出了相應(yīng)于模型參數(shù)估計值的平均費(fèi)用情況.
各個單元格的編號規(guī)則如表7所示.為了分析不同參數(shù)估計值在矩陣估計中的有效性,將上述依據(jù)原象矩陣、部分矩陣、補(bǔ)零矩陣和增量矩陣所估計得到的參數(shù)值代入模型當(dāng)中,并輸入阻抗矩陣計算得到各個單元格的估計出行量如表8所示.
表7 各個單元格的編號規(guī)則Table 7The numbering rule of each cell
從計算結(jié)果上來看,不同參數(shù)值的雙約束重力模型估計結(jié)果表明:采用原象矩陣、部分矩陣、補(bǔ)零矩陣和增量矩陣估計得到的不同參數(shù)應(yīng)用于模型之后所得到的出行矩陣估計效果是不同的.這種差距最主要地表現(xiàn)在估計出行量與實際中真實發(fā)生的原象之間的差距上.
從結(jié)果上來看,就估計的有效性而言,補(bǔ)零矩陣>部分矩陣>增量矩陣.
該結(jié)果揭示了重力模型參數(shù)標(biāo)定并不唯一地依賴于對出行現(xiàn)象的觀測結(jié)果的準(zhǔn)確性.除了數(shù)據(jù)之外,還有一些模型本身的標(biāo)定算法及計算機(jī)存儲的舍入等因素對參數(shù)標(biāo)定的結(jié)果起著不可忽略的作用[16,17].
表8 不同參數(shù)值的出行矩陣估計結(jié)果的有效性分析Table 8The efficiency analysis of the trip matrix estimation results about different parameter values
本文通過對出行分布觀測中常見的稀疏矩陣問題的三種不同處理方式(部分矩陣法、補(bǔ)零矩陣法、增量矩陣法)的比較分析和數(shù)值計算,得到以下幾點(diǎn)研究結(jié)論:
(1)從精確性的角度來看,增量矩陣法相對于補(bǔ)零矩陣法、部分矩陣法具有優(yōu)勢,盡管在數(shù)值計算的過程中展現(xiàn)出的優(yōu)勢相對比較微弱.但也有可能隨著所研究矩陣的維數(shù)增加而表現(xiàn)地更為顯著.
(2)從有效性的角度來看,補(bǔ)零矩陣法比增量矩陣法和部分矩陣法更有優(yōu)勢.
(3)雖然本文對稀疏矩陣的處理方法問題作了一定辨析,但依然存在很多尚未解決的問題.例如:不同維數(shù)矩陣、不同標(biāo)定算法結(jié)構(gòu)、不同計算精度要求等情況下三種處理方法的差別等等.這些問題還需要更進(jìn)一步的分析和研究.
[1]毛保華,曾會欣,袁振洲.交通規(guī)劃模型及其應(yīng)用[M].北京:中國鐵道出版社,1999.[MAO B H,ZENG H X, YUANZZ.Trafficplanningmodelandits application[M].Beijing:China Railway Press,1999.]
[2]Williams I.A comparison of some calibration techniques for doubly constrained models with an exponential cost function[J].Transportation Research,1976,10(2):91-104.
[3]Hyman M.The calibration of trip distribution models[J]. Environment and Planning,1969,1(3):105-112.
[4]Lam W,Huang H J.Calibration of the combined trip distribution and assignment model for multiple user classes[J].TransportationResearchPartB: Methodological,1992,26(4):289-305.
[5]Celik H M.Sample size needed for calibrating trip distribution and behavior of the gravity model[J].Journal of Transport Geography,2010,18(1):183-190.
[6]Foulds H,Nascimento D,Calixto I,et al.A fuzzy setbased approach to origin-destination matrix estimation inurbantrafficnetworkswithimprecisedata[J]. European Journal of Operational Research,2013,231 (1):190-201.
[7]Guo A,Shen Q,Gizem S.Origin-destination missing data estimation for freight transportation planning:a gravity model-based regression approach[J].General Information,2014,37(6):505-524.
[8]HensherD,ButtonK.Handbookoftransport modelling[M].Oxford,U.K.:Elsevier Science Ltd.,2000.
[9]郎茂祥,傅選義,朱廣宇.預(yù)測理論與方法[M].北京:清華大學(xué)出版社,北京交通大學(xué)出版社,2011. [LANG M X,FU X Y,ZHU G Y.Forecasting theory and method[M].Beijing:TsingHua University Press,Beijing Jiaotong University Press,2011.]
[10]陳華友.基于預(yù)測有效度的非負(fù)變權(quán)組合預(yù)測模型研究[J].運(yùn)籌與管理,2001,10(1):48-52.[CHEN H Y. Research on combination forecasting model with nonnegative and time-variant weights based on effective measure of forecasting methods[J].Operations Research and Management Science,2001,10(1):48-52.]
[11]王麗霞.概率論與數(shù)理統(tǒng)計:理論、歷史及應(yīng)用[M].大連:大連理工大學(xué)出版社,2010.[WANG L X. Probability theory and mathematical statistics:Theory, history and application[M].Dalian:Dalian University of Technology Press,2010.]
[12]陳華友,侯定丕.基于預(yù)測有效度的優(yōu)性組合預(yù)測模型研究[J].中國科學(xué)技術(shù)大學(xué)學(xué)報,2002,32(2):172-180.[CHEN H Y,HOU D P.Research on superior combination forecasting model based on forecasting effective measure[J].Journal of University of Science and Technology of China,2002,32(2):172-180.]
[13]陳華友,侯定丕.基于標(biāo)準(zhǔn)差的預(yù)測有效度的組合預(yù)測模型[J].系統(tǒng)工程學(xué)報,2003,18(3):203-210+223. [CHEN H Y,HOU D P.Combination forecasting model based on forecasting effective measure with standard deviate[J].Journal of Systems Engineering,2003,18(3): 203-210+223.]
[14]張令剛,牛德寧,孟兆民.基于預(yù)測有效度的組合模型在交通量預(yù)測中的應(yīng)用[J].道路交通與安全,2010,10 (1):24-27.[ZHANG L G,NIU D Y,MENG Z M. Application of combination forecasting model based on effective measure in traffic volume forecasting[J].Road Traffic and Security,2010,10(1):24-27.]
[15]劉燦齊.現(xiàn)代交通規(guī)劃學(xué)[M].北京:人民交通出版社, 2001.[LIU C Q.Modern transportation planning[M]. Beijing:China Communications Press,2001.]
[16]陳國強(qiáng).精密運(yùn)動控制、設(shè)計與實現(xiàn)(原書第2版)[M].北京:機(jī)械工業(yè)出版社,2011.[CHEN G Q.Precision motion control,the design and implementation(Version 2)[M].Beijing:China Machine Press,2011.]
[17]劉勝.最優(yōu)估計理論[M].北京:科學(xué)出版社,2011. [LIU S.The optimal estimation theory[M].Beijing: Science Press,2011.]
The Sparse Matrix Problem in Trip Distribution Observational Data
LUO Xiao-qiang
(School ofArchitecture,Chang'an University,Xi'an 710061,China)
The problem of sparse matrix in the trip distribution observational data are analyzed,and three different methods are put forward to calibrate the parameters of the double restraint gravitational model,as Parted Matrix Estimation,Zero Replaced Matrix Estimation and Incremental Matrix Estimation.By defining the Estimate Accuracy Index and the Estimate Effectiveness Index to measure the effects of estimation,this paper through the double restraint gravitational model equivalent mathematical programming with constraints,and compares three different analytical method of the estimation precision of the calibration method.On the basis of analysis,it used the methods of numerical simulation calculation,and contrasted the three estimation methods in accuracy and effectiveness.The conclusion finds that the calibration parameters by the method of the Zero Replaced Matrix Estimation have the best results in accuracy,and the calibration parameters by the method of the Incremental Matrix Estimation have the best results in effectiveness.The research results can be used as a theoretical basis of parameters calibration of observation sparse matrix in urban traffic planning in practical.
urban traffic;sparse matrix;parameter calibration;gravity model;error estimation
1009-6744(2015)05-0216-07
U491.1
A
2015-05-21
2015-07-25錄用日期:2015-08-11
中央高?;?2013G1411077);陜西省社科基金(2014D39).
羅小強(qiáng)(1979-),男,陜西南鄭人,講師,博士. *
luoxq37@yeah.net