徐開俊,吳佳益,楊 泳,梁 磊
(中國民用航空飛行學院飛行技術學院,四川 廣漢 618307)
交通運輸業(yè)是經(jīng)濟和社會發(fā)展的中堅力量,航空運輸已成為交通運輸業(yè)不可或缺的重要部分,對航線運輸網(wǎng)絡的研究也就顯得尤為重要。Amaral等[1]利用復雜網(wǎng)絡理論研究了全球航空運輸網(wǎng)絡,并發(fā)現(xiàn)該網(wǎng)絡是無標度的小世界網(wǎng)絡,存在冪律下降的度分布和介數(shù)分布。此后,利用復雜網(wǎng)絡理論對世界各地區(qū)的航空運輸網(wǎng)絡研究相繼發(fā)表[2-5]。這些研究反映出了大區(qū)域性的航空類網(wǎng)絡的一些共有特征,例如雙段冪律分布、小世界特性、度負關聯(lián)性等。但在這些研究中的航線運輸網(wǎng)絡被認為是單層的網(wǎng)絡,其中機場之間的所有連接被認為是等同性質(zhì)的。
最近的研究指出,將現(xiàn)實系統(tǒng)抽象為單個網(wǎng)絡,這樣的研究具有一定的弊端,其中一個主要限制因素就是現(xiàn)實系統(tǒng)的多層性[6,7]。Wenbo Du[8]和Oriol Lordan[9]等人按照“K-核分解”法,將航線網(wǎng)絡分解為核心、橋和邊緣三層,深入研究了中國和歐洲航線網(wǎng)絡的網(wǎng)絡特性。Cardillo等人[10]建立了以航空公司為分層依據(jù)的多層網(wǎng)絡模型,研究了幾種拓撲特征參數(shù)在層與層之間合并的過程中的發(fā)展情況。結果表明,歐洲航空多層網(wǎng)絡的拓撲特性與其網(wǎng)絡的多層性密切相關。Richard Klophaus[11]等人以各航空公司聯(lián)盟為一層的依據(jù)建立了全球的航線多層網(wǎng)絡,評估了3個航空聯(lián)盟的魯棒性。Liang Dai[12]等人利用多層航空網(wǎng)絡理論研究了1979—2012年間東南亞航線網(wǎng)絡,研究了核心、橋及邊緣三層隨時間波動的關系,并將其研究結果聯(lián)系到了航空公司規(guī)模以及地區(qū)經(jīng)濟發(fā)展。航線運輸是一個多層網(wǎng)絡,每層網(wǎng)絡是由各航空公司單獨管控。由于航空公司間運營航線的獨立性和相互影響性,僅建立單層的網(wǎng)絡模型并不能較好反映整個航線運輸網(wǎng)絡的狀態(tài),并且可能導致忽略網(wǎng)絡中的一些重要細節(jié)。此外,航線多層網(wǎng)絡的幾個重要結構特性,如全球效率,連通系數(shù)和網(wǎng)絡極化,還沒有相繼引入研究。建立中國航線多層網(wǎng)絡(Chinese Airline Multilayer Network)能夠為中國航線網(wǎng)絡的研究提供新思路。
本文將深入研究中國航線多層網(wǎng)絡的拓撲特性。首先以航空公司作為中國航線網(wǎng)絡的分層依據(jù),進行建模分析,再對多層網(wǎng)絡的聚合過程進行仿真,最后進行相應的仿真結果分析。此外,我們還比較了大中型航空公司和廉價航空公司相對應的兩種主要類型層的不同聚合過程,分析它們對中國航線多層網(wǎng)絡屬性的不同貢獻。
p(k)表示網(wǎng)絡中度值為k的節(jié)點在整個網(wǎng)絡中所占的比例,作為復雜網(wǎng)絡的關鍵特征,度分布通常用于表征現(xiàn)實復雜系統(tǒng)的結構特征和動態(tài)特征。在本文中,度分布用于反映CAMN中所有機場的分布規(guī)律和結構異質(zhì)性程度。
聚類系數(shù)C是復雜系統(tǒng)網(wǎng)絡的重要屬性。它量化了節(jié)點之間形成三角形的趨勢,即與同一節(jié)點相連接的兩個節(jié)點連接在一起的概率。節(jié)點的聚類系數(shù)定義為:
(1)
其中,ei是節(jié)點i的鄰節(jié)點之間實際連接邊數(shù),ki是節(jié)點的度。聚類系數(shù)C=∑i∈NCi/N,其中N是網(wǎng)絡中節(jié)點的總數(shù)。聚類系數(shù)能宏觀反應三角模體的密度[13],我們用它來估計在CAMN中進行長度為3的周轉型往返運輸概率。
平均最短路徑長度〈L〉是網(wǎng)絡中所有節(jié)點對之間的最短路徑的平均長度,即:
(2)
其中,N是網(wǎng)絡中節(jié)點的總數(shù),dij是從節(jié)點i到節(jié)點j的最短路徑長度。平均最短路徑長度可以測量網(wǎng)絡中節(jié)點對之間的間隔,在航線運輸網(wǎng)絡中,它可以用于量化乘客從出發(fā)地到目的地旅行時應乘坐的平均航班數(shù)量。為避免計算過程中出現(xiàn)兩節(jié)點不連通的情況,本文先計算各連通子圖中的〈L〉。
為了避免當較多節(jié)點間不連通時計算出現(xiàn)的偏差,本文采用了另一個關于路徑長度的屬性——全局效率E,它能反應現(xiàn)實交通網(wǎng)絡的傳輸效率[14]:
(3)
E的值越大,網(wǎng)絡傳輸效率越高。在網(wǎng)絡完全連接的情況下,效率達到最大值E=1。
最大連通子圖相對大小G=N′/N可以測量網(wǎng)絡的連通度[15]。在本文中可以利用他評估一個特定航空公司(或他們的組合)提供的最大覆蓋范圍,越大的覆蓋范圍能更好地滿足運輸要求。
上述特征參數(shù)主要對應于節(jié)點的度,實際上節(jié)點的介數(shù)也是網(wǎng)絡的重要屬性,特別在網(wǎng)絡動力學方面,因此本文引入了介數(shù)相關的特征參數(shù)。網(wǎng)絡極化率π[16]可以表征網(wǎng)絡的負載均勻性,這對網(wǎng)絡的魯棒性具有很大的影響[17]。網(wǎng)絡極化率定義為:
(4)
其中,Bmax是網(wǎng)絡中節(jié)點介數(shù)最大的值,〈B〉是網(wǎng)絡平均介數(shù)。π的值越小,網(wǎng)絡越均勻。在本文中,網(wǎng)絡極化率用于衡量CAMN的負載均勻性。由于介數(shù)也與最短路徑長度有關系,為避免節(jié)點不連通的情況,我們分別計算各連通子圖中的π。
以上這些拓撲結構參數(shù)在模糊方法建模、證據(jù)理論的數(shù)據(jù)挖掘和人工智能網(wǎng)絡建模等當前熱門研究中都必不可少[18-19],接下來我們將研究CAMN的上述結構特性。
(5)
總度數(shù)和傳統(tǒng)單層網(wǎng)絡的節(jié)點度相比,它不僅反映了某機場在航空網(wǎng)絡中的重要性,更能反映某機場在各個航空公司的運營網(wǎng)絡中的重要程度。
oi值高的機場僅能表征這個機場在整個航空公司的運營中的重要程度,但不能表示它對于每一航空公司都重要,有可能有它在某些航空公司層里的ki值很低。為了量化各機場oi總度在各層的分布情況,總度分布參數(shù)Pi的引入很有必要[20]:
(6)
Pi為[0,1]中的值,它測量節(jié)點i的度值是均勻分布在M層之間還是主要集中在一層或幾層中。當機場i所有的航線都由某一航空公司單獨運則Pi=0,而僅當機場i在M個航空層中的航線數(shù)量完全相同時Pi=1。通常Pi的值越大,機場i在CAMN的參與性越均勻。
中國航線運輸多層網(wǎng)絡(CAMN)的數(shù)據(jù)來自于中國民航數(shù)據(jù)公司提供的2018年中國春運期間2月1日到3月1日國內(nèi)外近30萬條計劃航班信息,航線數(shù)據(jù)包括48個國內(nèi)航空公司運營的國內(nèi)航線和中國跨境航線。由于近年來國際航線已占到中國民航運營航線三分之一的規(guī)模,我們在選取國內(nèi)航班的同時,也考慮到了中國的跨境航線[21-22]。在CAMN中,機場作為節(jié)點,兩機場間的航線作為邊,利用Python編程,輔助Networkx復雜網(wǎng)絡庫、Matplotlib繪圖庫、Numpy科學計算包等工具建立398個節(jié)點4 609條邊的無權無向的多層網(wǎng)絡。
(7)
(8)
圖1展示了部分單層網(wǎng)絡可視圖,圖2為多層網(wǎng)絡構建示意圖。
圖1 某3個航空公司單層網(wǎng)絡可視圖Fig.1 Single layer network view of some three airlines
圖2 多層網(wǎng)絡(CAMN)模型示意圖
投影聚合演示如圖3,X=48層網(wǎng)絡可視圖如圖4,圖中節(jié)點大小與度值成正比。
圖3 網(wǎng)絡聚合示意圖Fig.3 Network aggregation schematic
圖4 第X=48層CAMN網(wǎng)絡可視圖
在CAMN聚合仿真的基礎之上,我們嘗試著將航空公司分為兩個主要類型:一個是呈中心軸輻式網(wǎng)絡結構的大中型航空公司(由18個的大中型航空公司層組成,包含368個節(jié)點、4 553條邊),另一個是點對點網(wǎng)絡結構的廉價航空公司(由30個廉價航空公司層組成,包含252個節(jié)點、980條邊)[10,25]。我們按照同樣的方式,分類聚合后對比仿真結果,發(fā)現(xiàn)了一些有價值的結論。
為了分析網(wǎng)絡總體特征,我們首先從多層網(wǎng)絡理論的角度,建立了M=48的中國航空運輸多層網(wǎng)絡(CAMN)模型,并繪制累積度分布函數(shù)如圖5所示。
圖5 節(jié)點累積度分布圖
圖5中橫坐標表示機場總度值,縱坐標表示總度不小于此橫坐標(總度值o)的概率。CAMN總度值服從雙段冪律分布,這表現(xiàn)出機場間在航線運輸作用上的異質(zhì)性:少數(shù)的機場承擔著較多的航線運輸任務,而大部分的機場的航線并不多。我們可以從機場總度統(tǒng)計圖(見圖6)和Pi分布圖(見圖7)中進一步研究那些運輸任務重的少部分機場。
總度值前五的機場分別是:PEK(北京首都機場)、KMG(昆明長水機場)、PVG(上海浦東機場)、CKG(重慶江北機場)和CTU(成都雙流機場)。并且這些機場Pi值均大于0.85,它們在48個單層網(wǎng)絡中的度值分布均勻,由此可以看出,國內(nèi)大多數(shù)航空公司在這5個機場都有航線運營且運營數(shù)量較多。
圖6 節(jié)點總度統(tǒng)計圖
圖7 Pi分布圖
首先,我們分析了復雜網(wǎng)絡的關鍵性質(zhì):累積度分布p(k)。圖8a顯示了通過合并不同數(shù)量的層(X=1,12,24,36,48)而創(chuàng)建的4個聚合網(wǎng)絡度分布圖。可以看出,所有展示的層中都呈現(xiàn)異構分布特征并服從無標度網(wǎng)絡的雙段冪律分布特征,表明這些聚合網(wǎng)絡都是由少數(shù)的度值大的節(jié)點和大量度值低的節(jié)點組成,這和多層網(wǎng)絡呈現(xiàn)的特征一致。
圖8 CAMN拓撲特征演變
圖8b中可以看出,聚類系數(shù)C的值總體隨著X的增加而增加,這表明更多的層合并導致連續(xù)有新的節(jié)點之間形成三角形,更多的航空公司合作將為旅客提供更多的長度為3的往返旅途選擇。
圖8c中可以看出,當X<6時,平均最短路徑長度L大幅度增加,這與各層中最大連接子圖之間大部分點和邊不相連接有很大關系。當X>6時,新增層中新節(jié)點緩慢增加,已存在節(jié)點間新產(chǎn)生的邊迅速增加,導致L隨X增加而緩慢減小。圖8d中表示網(wǎng)絡全局效率E隨X增長的關系,從中可以看出E和L有很大的關系。L是先急速上升再逐漸減小,而E是先急劇下降再逐漸平穩(wěn)增加。這意味著更多成規(guī)模性的航空公司相互合作,乘客可以更有效率地運輸,但并不是所有的航空公司間合作都會提升效率。
從圖8e可以看出,最大連通子圖比率G隨著X的增加而增加。這表明隨著更多航空公司層的合并,可達目的地機場數(shù)量也增加。特別是前十層合并時,G的值增加更為顯著。當將10個隨機選擇的層合并在一起時G的均值已達60%,也就是說網(wǎng)絡所涉及的機場覆蓋率已達到60%。
圖8f中,我們可以看到π的值會隨著X的增加而增加,表明隨著更多層被合并在一起,CAMN變得越來越不均勻。值得注意的是當X>42時,π的值的范圍驟然變小,這是因為航空網(wǎng)絡本身就由于地緣政治關系,負載不均勻[26],當運營范圍各不相同的航空公司層合并到一定量時,這個特點顯得異常明顯。
從上述仿真結果可以看出,CAMN的結構特性中,其高聚類系數(shù)和短平均最短路徑長度在多層網(wǎng)絡聚合后較為明顯,呈現(xiàn)為“小世界網(wǎng)絡”。
圖9a和b分別顯示了大中型和廉價航空公司聚合層的度分布p(k)。圖中廉價層分布衰減相對較快且不連續(xù),這表明廉價航空公司中度高的機場比大中型航空公司少。
圖9 網(wǎng)絡拓撲特征演變對比圖
圖9c顯示了聚類系數(shù)C分別與大中型航空公司和廉價航空公司的層數(shù)X的關系,大中型航空公司層的C值大于廉價航空公司。這意味著大中型航空公司層有更多的節(jié)點形成三角形,也就是說,大中型航空公司承擔著更多的長度為3的往返航班。
圖9d顯示大中型航空公司層的平均最短路徑長度L總體呈下降趨勢,這與歐洲多層航空網(wǎng)絡的研究中有明顯差異[10]。這是因為中國的大中型航空公司擁有大量的機場覆蓋范圍,它們之間的聚合使節(jié)點間新的邊迅速增加而新的節(jié)點增加較為緩慢,廉價航空公司層和CAMN表現(xiàn)出一樣的趨勢。
圖9e描繪了網(wǎng)絡全局效率E與大中型、廉價航空公司的層數(shù)X之間的關系。大中型航空公司層的E值大于廉價航空公司層的值,反映出大中型航空公司的客運轉移效率高于廉價航空公司。
大中型航空公司和廉價航空公司的層數(shù)X與最大連通子圖比率G的關系如圖9f所示。大中型航空公司的G值大于廉價航空公司的值,這意味著大中型航空公司擁有比廉價航空公司更多的可達目的地。
圖9g顯示了大中型和廉價航空公司的網(wǎng)絡極化π和層數(shù)X之間的關系。能看出大中型航空公司層的π值更大,意味著相比之下的廉價航空公司的網(wǎng)絡更加均勻。軸輻式結構網(wǎng)絡本身相比點對點式結構更不均勻,因此大中型航空公司的π值大于廉價航空公司的值。
通過比較大中型層和廉價層,我們可以得出它們在CAMN中的不同作用:CAMN是個小世界網(wǎng)絡,即擁有高聚類系數(shù)和短平均最短路徑長度,且這一特性主要由大中型航空公司層導致;另一方面,大中型航空公司相對應的網(wǎng)絡具有更高的乘客轉移效率,更多的可達目的地和更高的連通性,但同質(zhì)性低于廉價航空公司網(wǎng)絡。
我們利用航空公司對應為每個單層的方法廣泛探索了中國航空運輸多層網(wǎng)絡(CAMN)的聚合演變特征和整體結構特性。仿真結果表明:1)CAMN總度值呈現(xiàn)冪律分布,總度值高的五大機場不僅承擔著較多的航線任務并且總度值在各航空公司間分布均勻。2)CAMN呈現(xiàn)高聚類系數(shù)、短平均最短路徑長度和大量的可達目的地集合特征是在各航空公司網(wǎng)絡層逐步聚合中形成的。3)大型和廉價航空公司對CAMN的拓撲特征有不同的影響。其中,小世界現(xiàn)象主要由大型航空公司引發(fā),而廉價航空公司可以使網(wǎng)絡更加同質(zhì)化。
本研究探究了中國航線網(wǎng)絡拓撲特征形成機理和多層航線網(wǎng)絡的內(nèi)在特性,將有助于更好地認識中國航線運輸網(wǎng)絡和規(guī)劃未來航空市場結構。我們將在以后的研究中將航班頻率、座位數(shù)或地理距離作為權重因素,對中國航線運輸多層網(wǎng)絡進行更進一步分析,為優(yōu)化航線和航空管理提供更好的支撐。