王志如 梁作論 袁競峰 李啟明
(1東南大學土木工程學院,南京 210096)
(2中國電子科技集團公司南京第十四研究所,南京 210031)
網(wǎng)絡的標度特性是復雜網(wǎng)絡研究的一個重要領(lǐng)域[1-4].網(wǎng)絡的標度特性決定網(wǎng)絡演化的連接機制[2].對地鐵網(wǎng)絡標度特性的研究是了解地鐵網(wǎng)絡的內(nèi)在演化機制、建立地鐵網(wǎng)絡演化模型及研究地鐵網(wǎng)絡動力學問題的基礎.
目前對地鐵網(wǎng)絡標度特性的研究,主要有數(shù)學歸納法和數(shù)理統(tǒng)計法.基于數(shù)學歸納法的地鐵網(wǎng)絡節(jié)點度分布模型的假設條件比較嚴格,如Angeloudis等[5]構(gòu)造的地鐵網(wǎng)絡節(jié)點度(節(jié)點被連接次數(shù))均為偶數(shù),與實際并不相符.基于數(shù)理統(tǒng)計的地鐵網(wǎng)絡標度特性研究分為以節(jié)點(地鐵車站)被連接次數(shù)作為節(jié)點度計算指標和以經(jīng)過節(jié)點的線路數(shù)目作為節(jié)點度計算指標.前者指該車站連接到其他車站的次數(shù),經(jīng)實證分析得到地鐵網(wǎng)絡度分布服從指數(shù)分布[6-7]、Possion 分布[8]、冪律分布[9-10].后者指經(jīng)過該車站的地鐵線路數(shù)目,Derrible等[1,11]通過實證分析得到15個地鐵網(wǎng)絡度分布服從冪律分布.
在以線路為演化單位的交通網(wǎng)絡中,“節(jié)點被連接次數(shù)”不能夠反映實際網(wǎng)絡的演化機理,而以“經(jīng)過車站的線路數(shù)目”作為評價度分布的指標才具有實際意義.雖然 Derrible等[1,11]提出的“經(jīng)過車站的線路數(shù)目”的評價方法有很大改進,但由于因變量“給定節(jié)點度對應的節(jié)點數(shù)目”因網(wǎng)絡規(guī)模而異,不同網(wǎng)絡之間不具有可比性,頻次不同于概率值,運營線路數(shù)目不具有唯一性.基于以上不足,本文提出基于經(jīng)過車站拓撲線路數(shù)目的節(jié)點度分布評價方法,通過改進線路計量方法、函數(shù)因變量方面的不足,增加擬合回歸樣本,改進擬合方法,得到地鐵網(wǎng)絡節(jié)點度分布函數(shù).
節(jié)點度定義為經(jīng)過車站的拓撲線路數(shù)目.拓撲線路是指網(wǎng)絡中存在的有固定的、物理形態(tài)上的復線軌道(復線是指含有雙向獨立軌道的線路),不同于運營中所指的線路.運營線路依賴與拓撲線路,相同的拓撲線路可以有不同的運營方式,例如,在圖1所示的拓撲網(wǎng)絡中,最多可以產(chǎn)生6條運營線路,分別是:運營線路 1-4,4-2,4-3,1-2,1-3,2-3,6條線路通過不同的組合可以產(chǎn)生多種運營方式.因此,拓撲線路具有唯一性,而運營線路不具有唯一性.
圖1 含有2條拓撲線路的網(wǎng)絡
給定地鐵網(wǎng)絡中含有拓撲線路 L1,L2,…,La,節(jié)點i的度Li定義為經(jīng)過該節(jié)點的拓撲線路數(shù)目,令 Lj=1,j=1,2,…,a,節(jié)點 i的度表示為
地鐵網(wǎng)絡節(jié)點度的分布用分布函數(shù)P(L)來描述,P(L)表示一個隨機選定的節(jié)點度恰好為L的概率,viL表示如果節(jié)點i的度為L,則記為1,否則為0;V表示地鐵網(wǎng)絡節(jié)點數(shù)目,基于經(jīng)過節(jié)點線路數(shù)目的度分布函數(shù)表示為
將被解釋變量P(L)作為函數(shù)的因變量,是基于如下2個原因:① 原始的解釋變量和被解釋變量的函數(shù)形式與其累計分布一般都不相同[12],也就是說,無法通過累計的度分布函數(shù)得到地鐵網(wǎng)絡的演化機制.②雙對數(shù)化過程會導致殘差的增加,影響擬合效果.
最大似然估計(MLE)和普通最小二乘法(ordinary least squares,OLS)是最為常見的統(tǒng)計擬合準則.Goldstein等[13]認為 MLE 結(jié)合 Kolmogorov-Smirnov(KS)檢驗更加適用于冪律分布的參數(shù)估計.然而,MLE適用于大樣本參數(shù)估計,在小樣本中會低估殘差值.由于52個地鐵網(wǎng)絡樣本中,數(shù)據(jù)點最大為6個,因此 MLE不適用于本研究.而OLS無論樣本大小都是取殘差平方的最小值,因此本文選取OLS作為參數(shù)估計方法.
擬合效果檢驗通過非線性回歸的擬合優(yōu)度系數(shù) R2和殘差平方和 SSE 檢驗[12],當 R2接近于 1,且SSE接近于0時,認為擬合效果很好.
地鐵網(wǎng)絡按照單模式網(wǎng)絡 L-Space建模方式[14];采用人工識別方法統(tǒng)計拓撲線路數(shù)目;節(jié)點度由線路搜索算法計算;52個地鐵網(wǎng)絡樣本節(jié)點度分布部分基礎數(shù)據(jù)見表1.
在52個地鐵網(wǎng)絡樣本中,10個地鐵網(wǎng)絡樣本含有大于3個數(shù)據(jù)點(見表1),21個地鐵網(wǎng)絡樣本含有3個數(shù)據(jù)點,21個地鐵網(wǎng)絡樣本有2個數(shù)據(jù)點.由于度分布函數(shù)至少含有1個回歸系數(shù)、1個常量,所以在52個地鐵網(wǎng)絡樣本中,剔除含有2個數(shù)據(jù)點的21個樣本.含有大于3個數(shù)據(jù)點的10個地鐵網(wǎng)絡樣本的度分布折線圖如圖2所示.
圖2 含有大于3個數(shù)據(jù)點的10個地鐵網(wǎng)絡樣本的度分布折線圖
表1 52個地鐵網(wǎng)絡樣本的標度分析部分基礎數(shù)據(jù)
由圖2可見,在地鐵網(wǎng)絡中,只有1條拓撲線路經(jīng)過的節(jié)點概率為0.743~0.946,有2條拓撲線路經(jīng)過的節(jié)點概率急速下降到0.054~0.176,節(jié)點同時被3條及以上拓撲線路經(jīng)過的概率就更加小.這種現(xiàn)象與冪律分布中“大多數(shù)節(jié)點只有比較少的連接,而少數(shù)節(jié)點有大量的連接”性質(zhì)[15]一致,因此,初步估計地鐵網(wǎng)絡度分布形式為冪律分布.本文選取3種函數(shù)對地鐵網(wǎng)絡度分布進行擬合,分別是一般形式的冪律函數(shù)[16]f(x)=axb、漂移冪律(shifted power law,SPL)[17]f(x)=(x+a)b,及縱軸平移(longitudinal shifted power law,LSPL)的f(x)=axb+c冪律函數(shù),擬合回歸參數(shù)及檢驗結(jié)果見表2.
表2 3種函數(shù)對含有大于3個數(shù)據(jù)點的10個樣本的擬合回歸參數(shù)及檢驗結(jié)果
由表2可見,在置信度為95%的情況下,3種分布函數(shù)擬合得到的R2都接近于1,SSE接近于0,這說明擬合效果非常好.對于含有大于3個數(shù)據(jù)點的10個地鐵網(wǎng)絡樣本,L-SPL分布函數(shù)擬合得到的R2和SSE要優(yōu)于SPL分布函數(shù)和一般形式冪律函數(shù),SPL分布函數(shù)擬合結(jié)果優(yōu)于一般形式冪律函數(shù).以紐約地鐵網(wǎng)絡為例,6個數(shù)據(jù)點都較好地落在了3條擬合曲線上(見圖3).
圖3 3種分布函數(shù)對紐約地鐵網(wǎng)絡度分布擬合曲線
為了進一步證明L-SPL分布函數(shù)能夠很好地描述節(jié)點度分布,本文對3種度分布函數(shù)的預測值與真實值進行分析,并比較殘差大小.以紐約地鐵網(wǎng)絡為例,取該樣本中的前5個數(shù)據(jù)點,通過對3種分布函數(shù)擬合,得到3種度分布函數(shù)的回歸參數(shù),由擬合得到的回歸方程預測第6個數(shù)據(jù)點.第6個數(shù)據(jù)點的預測數(shù)據(jù)與真實值的殘差見圖4.
由圖4可見,與SPL和一般冪律形式的分布函數(shù)擬合得到的殘差值相比,L-SPL度分布函數(shù)擬合得到的殘差值更加接近于零.但是,從預測值來看,L-SPL度分布函數(shù)預測的節(jié)點度L=6的度分布值 P(L=6)=-0.00397,小于0(見圖5),而度分布為頻次的百分比值,不可能出現(xiàn)負值.從LSPL解析式可知,解析式中包含的參數(shù)c是一個加性誤差項,由表2給出的10個地鐵網(wǎng)絡樣本的3種度分布函數(shù)擬合得到的回歸參數(shù)可以看出,參數(shù)c在10個樣本中只有2個為正值,其余都為負值,所以會導致度分布隨著節(jié)點度的增加而出現(xiàn)負值.因此,L-SPL函數(shù)不適用于地鐵網(wǎng)絡度分布擬合.
圖4 3種冪律函數(shù)擬合殘差圖
圖5 3種分布函數(shù)預測結(jié)果
SPL分布和一般形式冪律分布對節(jié)點度為6的度分布預測值都為正值,當節(jié)點度增大時,2種分布函數(shù)的預測值都無限接近于0,且SPL分布的收斂速度要大于一般形式冪律分布(見圖5).在實際建設中,若一個地鐵車站同時有多條線路經(jīng)過,則車站容量及換乘設施必須滿足大客流需求,因此會增加施工難度并導致建設成本過高;同時,一個車站發(fā)生故障,經(jīng)過該車站的線路越多,受影響的范圍越大,同時還會產(chǎn)生嚴重的社會影響;因而在規(guī)劃地鐵站時,會避免多條線路同時經(jīng)過一個地鐵車站,所以,地鐵網(wǎng)絡中不可能出現(xiàn)擁有幾十條線路的站點.因此,當節(jié)點度趨向于100時,收斂速度快的分布函數(shù)更適合于地鐵網(wǎng)絡度分布;其次,通過R2和SSE比較,SPL分布要優(yōu)于一般形式冪律分布.由此認為,SPL分布形式更加符合地鐵網(wǎng)絡度分布,即地鐵網(wǎng)絡度分布為漂移冪律SPL分布,由于漂移程度參數(shù)的a值非常小,故不影響其冪律分布的實質(zhì).
在大于等于3個數(shù)據(jù)點的31個地鐵網(wǎng)絡樣本中,香港地鐵網(wǎng)絡的SPL函數(shù)擬合得到的非線性回歸的擬合優(yōu)度系數(shù)R2=0.9675,在31個樣本中的擬合程度最低;相比其他30個樣本,香港地鐵網(wǎng)絡的殘差平方和為SSE=0.005,大了1個數(shù)量級,因此認為,香港地鐵網(wǎng)絡度分布擬合效果最差.究其原因,香港地鐵網(wǎng)絡中存在大量共線拓撲線路,導致共線段的車站都有2條線路經(jīng)過,從而增加了節(jié)點度為2的車站數(shù)目,使節(jié)點度為1的車站數(shù)目到節(jié)點度為2的節(jié)點數(shù)目平緩下降,因而產(chǎn)生“肥尾”特征,標度系數(shù)b=-2.312,然而,同時有3條線路經(jīng)過的車站的增長速度遠小于有2條線路經(jīng)過的共線車站增長速度,導致節(jié)點度為3的車站數(shù)目稀少,無法落到肥尾曲線上.除香港地鐵外,其他30個城市地鐵網(wǎng)絡的擬合優(yōu)度系數(shù)R2都大于0.99,擬合效果良好.
52個地鐵網(wǎng)絡樣本的標度系數(shù)-b在2~5范圍內(nèi),且在只含有2個數(shù)據(jù)點的21個樣本中,標度系數(shù)-b隨著節(jié)點度為1的度分布值與節(jié)點度為2的度分布值的比值的增大而增大,標度系數(shù)-b越接近5,換乘車站在網(wǎng)絡中占的比例越小,吸引力強的點越少,網(wǎng)絡的異質(zhì)程度越低;標度系數(shù)-b越接近2,換乘車站在網(wǎng)絡中占的比例越多,吸引力強的點越多,網(wǎng)絡的異質(zhì)程度越高.標度系數(shù)最大的日本Sapporo地鐵網(wǎng)絡,為典型的星型網(wǎng)絡結(jié)構(gòu),共含有2個換乘車站,一個位于城市中心,有3條徑向線路同時經(jīng)過,另一個車站有2條徑向線路同時經(jīng)過.因此,同等規(guī)模的地鐵網(wǎng)絡中,星型結(jié)構(gòu)的標度系數(shù)最大.
在節(jié)點數(shù)目大于300的紐約、巴黎、倫敦、柏林4個大規(guī)模網(wǎng)絡中,標度系數(shù)-b落在了2~3之間(見表2),表明在規(guī)模較大的地鐵網(wǎng)絡中,存在較多吸引力強的節(jié)點,如在紐約地鐵網(wǎng)絡中,存在6條線路同時經(jīng)過的節(jié)點,換乘站點在網(wǎng)絡中所占比例較高,度分布曲線呈“肥尾”.在8個發(fā)達城市(地鐵網(wǎng)絡站點數(shù)目大于200的城市),除上海地鐵網(wǎng)絡之外,標度系數(shù)都小于3,說明地鐵網(wǎng)絡隨著網(wǎng)絡化程度的提高,標度系數(shù)會同其他大多數(shù)大規(guī)模網(wǎng)絡一樣,落在2~3范圍內(nèi),這也表明連接偏好現(xiàn)象存在于地鐵網(wǎng)絡中.
本文提出的基于經(jīng)過站點的拓撲線路數(shù)目的地鐵網(wǎng)絡節(jié)點度分布評價方法,能夠反映地鐵網(wǎng)絡的內(nèi)在演化機制,突出以線路為演化單位的公共交通網(wǎng)絡與以節(jié)點為演化單位的社會網(wǎng)絡、航空網(wǎng)絡、WWW網(wǎng)絡等的區(qū)別,且拓撲線路數(shù)目的量化標準相比運營線路,其結(jié)果具有唯一性;通過3種分布函數(shù)對52個地鐵網(wǎng)絡樣本節(jié)點度分布的擬合,證明了漂移冪律SPL分布函數(shù)對地鐵網(wǎng)絡度分布擬合效果最好,SPL函數(shù)實質(zhì)上是一種介于指數(shù)和冪律之間的分布,當常數(shù)項a=0時,SPL函數(shù)為冪律分布;當a→∞時,SPL函數(shù)趨于指數(shù)分布;由于擬合結(jié)果中52個地鐵網(wǎng)絡樣本a分布在0~1范圍內(nèi),說明了地鐵網(wǎng)絡度分布是介于冪律和指數(shù)分布之間的漂移冪律函數(shù),這與實際現(xiàn)象相吻合.
References)
[1]Derrible S,Kennedy C.The complexity and robustness of metro networks[J].Physica A,2010,389(17):3678-3691.
[2]Albert R,Barabási A L.Statistical mechanics of complex networks[J].Reviews of Modern Physics,2002,74(1):47-97.
[3]汪小帆,李翔,陳關(guān)榮.復雜網(wǎng)絡理論及其應用[M].北京:清華大學出版社,2006:8-14.
[4]張君超.基于復雜網(wǎng)絡的城市公交網(wǎng)絡特性分析與演化研究[D].成都:西南交通大學交通運輸規(guī)劃與管理學院,2010.
[5]Angeloudis P,F(xiàn)isk D.Large subway systems as complex networks[J].Physica A,2006,367:553-558.
[6]汪濤.城市公交網(wǎng)絡的拓撲結(jié)構(gòu)和演化模型研究[D].南京:南京航空航天大學經(jīng)濟與管理學院,2009.
[7]王燚,楊超.上海市軌道交通網(wǎng)絡的復雜網(wǎng)絡特征研究[J].城市軌道交通研究,2009(2):33-36.Wang Yi,Yang Chao.Characteristics of the complex network in shanghai urban rail transit[J].Urban Mass Transit,2009(2):33-36.(in Chinese)
[8]Han C,Liu L.Topological vulnerability of subway networks in China[C]//IEEE Management and ServiceScience.Wuhan,China,2009:1-4.
[9]王志強,徐瑞華.基于復雜網(wǎng)絡的軌道交通道路網(wǎng)可靠性仿真分析[J].系統(tǒng)仿真學報,2009,21(20):6670-6674.Wang Zhiqiang,Xu Ruihua.Reliability simulation analysis of urban rail transit networks based on complex network [J].Journal of System Simulation,2009,21(20):6670-6674.(in Chinese)
[10]王云琴.基于復雜網(wǎng)絡理論的城市軌道交通網(wǎng)絡連通可靠性研究[D].北京:北京交通大學交通運輸學院,2008.
[11]Derrible S,Kennedy C.Characterizing metro networks:state,form,and structure[J].Transportation,2010,37(2):275-297.
[12]何曉群,劉文卿.應用回歸分析[M].2版.北京:中國人民大學出版社,2007:294-295.
[13]Goldstein M L,Morris S A,Yen G G.Problem with fitting to the power-law distribution [J].European Physical Journal B,2004,41(2):255-258.
[14]葉青.基于復雜網(wǎng)絡理論的軌道交通網(wǎng)絡脆弱性分析[J].中國安全科學學報,2012,22(2):122-126.Ye Qing.Vulnerability analysis of rail transit based on complex network theory[J].China Safety Science Journal,2012,22(2):122-126.(in Chinese)
[15]Barabási A L,Albert R.Emergence of scaling in random networks[J].Science,1999,286(5439):509-512.
[16]何大韌,劉宗華,汪秉宏.復雜系統(tǒng)與復雜網(wǎng)絡[M].北京:高等教育出版社,2009:267-269.
[17]Chang H,Su B B,Zhou Y P,et al.Assortativity and act degree distribution of some collaboration networks[J].Physica A,2007,383(2):687-702.