陳 斌, 吳 瑾
(1. 南京航空航天大學(xué)民航學(xué)院, 江蘇 南京 211106; 2. 中國民航工程咨詢有限公司, 北京 100621)
機場客、貨吞吐量預(yù)測結(jié)果是決策機場建設(shè)規(guī)模的重要依據(jù),直接決定著機場建設(shè)投資[1]。目前,時間序列法、因果關(guān)系法、人工智能法等方法已廣泛應(yīng)用于機場客、貨吞吐量預(yù)測[2-9]。時間序列法和因果關(guān)系法能夠精準地對線性平穩(wěn)序列進行預(yù)測,人工智能法能夠?qū)⒎蔷€性非平穩(wěn)序列逼近到預(yù)期精度[10-12]。
然而,機場業(yè)務(wù)量發(fā)展容易受到外界宏觀經(jīng)濟因素的干擾和驅(qū)動,因此在科學(xué)研究領(lǐng)域,因果關(guān)系法常被用于機場業(yè)務(wù)量需求預(yù)測[4,13-15]?;貧w分析法是因果關(guān)系模型中的一種經(jīng)典預(yù)測方法,已被廣泛使用和推廣。在利用回歸分析法進行預(yù)測時,首先需要確定與航空運輸相關(guān)的各類經(jīng)濟指標。例如,Wu等[16]利用2006~2015年中國各省機場吞吐量和社會經(jīng)濟發(fā)展數(shù)據(jù),以人均機場客、貨吞吐量和單位國內(nèi)生產(chǎn)總值(gross domestic product, GDP)機場客、貨吞吐量作為區(qū)域航空運輸利用的衡量指標,分析了機場吞吐量與宏觀變量之間的相關(guān)性,結(jié)果表明機場客、貨吞吐量與人均GDP、城鎮(zhèn)化率、人口密度之間存在較強的相關(guān)性。Zhang[17]等分析了航空運輸與經(jīng)濟增長之間的因果關(guān)系,研究表明航空運輸與經(jīng)濟的關(guān)系是雙向的,這種雙向關(guān)系在欠發(fā)達地區(qū)普遍存在。但通過對航空市場成熟國家的研究發(fā)現(xiàn),航空運輸對經(jīng)濟增長產(chǎn)生積極影響,反之則不然。在基于回歸分析法的預(yù)測中,Bastola[18]等在假設(shè)機場旅客吞吐量取決于游客人次和GDP的基礎(chǔ)上,分別構(gòu)建了兩個一元線性回歸模型,結(jié)果表明構(gòu)建的模型表現(xiàn)較好。Peng[19]等基于GDP、常住人口、機場競爭和空間距離等多源數(shù)據(jù)構(gòu)建了多元線性回歸模型,結(jié)果表明GDP和人口是影響民航機場旅客吞吐量的重要因素。Zhang[20]等從GDP、從業(yè)人員數(shù)量、水路貨運量、公路貨運量、游客人數(shù)等宏觀統(tǒng)計指標中選取相關(guān)性最高的變量構(gòu)建回歸預(yù)測模型,預(yù)測大連新機場航空貨郵吞吐量。此外,隨著大數(shù)據(jù)的發(fā)展,Kim[21]等將互聯(lián)網(wǎng)搜索數(shù)據(jù)作為自變量構(gòu)建回歸預(yù)測模型,證實了搜索數(shù)據(jù)是預(yù)測航空運輸需求的有效數(shù)據(jù)。
雖然已有大量文章研究回歸分析法在機場業(yè)務(wù)量需求方面的預(yù)測問題,然而從目前的研究成果來看,依然存在著以下幾點不足:① 自變量選擇正確與否對預(yù)測結(jié)果產(chǎn)生重大影響,雖然已有利用大量樣本從省級層面對航空運輸影響因素進行研究的文獻,但從機場角度出發(fā)進行大樣本研究目前較為稀缺,無法系統(tǒng)地說明哪些宏觀變量與機場業(yè)務(wù)量之間具有強相關(guān)性;② 回歸分析法有各種變體,現(xiàn)有研究多使用一元線性回歸和多元線性回歸,然而一元線性回歸一次只能引入一個宏觀變量。多元線性回歸一次可以引入多個變量,但宏觀變量之間具有一定的相關(guān)性,同時引入模型會導(dǎo)致模型存在多重共線性,因此有必要對模型進行改進;③ 沒有一個單一的預(yù)測模型在所有情況下都能始終優(yōu)于其他模型[22],也不存在能夠保證準確性的最佳預(yù)測方法[23-24],然而現(xiàn)有研究在回歸方法選擇上多是依賴主觀選擇,因此非常有必要利用大量樣本對預(yù)測方法進行事后評估,通過大量樣本實證研究判斷預(yù)測模型的適用性[25-28]。
本文從不同回歸分析法的優(yōu)缺點出發(fā),提出了相關(guān)性回歸和主成分回歸兩種組合回歸預(yù)測方法,并基于2015年之前通航的203個機場航空客、貨吞吐量和機場所在市的12個宏觀指標數(shù)據(jù),對每一個機場客、貨吞吐量分別構(gòu)建一元線性回歸模型、相關(guān)性回歸模型、逐步回歸模型、主成分回歸模型,并根據(jù)預(yù)測結(jié)果和真實結(jié)果之間的絕對誤差百分比評判預(yù)測效果,分析每種回歸方法在機場客、貨吞吐量預(yù)測中的適用性,并得出結(jié)論。
本文主要介紹構(gòu)建的旅客吞吐量預(yù)測模型,貨郵吞吐量預(yù)測模型與之相似。
回歸預(yù)測模型的模型參數(shù)及變量說明如下:
k:機場旅客吞吐量第k個觀測年份;
K:機場旅客吞吐量最大觀測年份;
Yhistory={y(1),y(2),…,y(k)} (k=1,2,…,K):機場旅客吞吐量歷史觀測數(shù)列;
M:機場所在市宏觀統(tǒng)計變量個數(shù);
m:機場所在市第m個宏觀統(tǒng)計變量;
P:代入模型的宏觀變量個數(shù),滿足P≤M;
Xhistory,m={xm(1),xm(2),…,xm(k)} (m=1,2,…,M;k=1,2,…,K)代表機場所在市第m個宏觀變量K年的歷史觀測數(shù)列,其中xm(k)表示第m個宏觀變量在第k年的指標觀測值;
xmax:機場所在市M個宏觀統(tǒng)計變量中與機場旅客吞吐量相關(guān)性最高的變量;
XXhistory,m={xxm(1),xxm(2),…,xxm(k)} (m=1,2,…,P;k=1,2,…,K)表示P個宏觀變量做主成分后第m個主成分K年的歷史觀測數(shù)列,其中xxm(k)表示第m個主成分在第k年的指標值;
t:機場旅客吞吐量第t個預(yù)測年份;
T:機場旅客吞吐量預(yù)測區(qū)間最大值;
Xfuture,m={xm(1),xm(2),…,xm(t)} (m=1,2,…,M;t=1,2,…,T):機場所在市第m個宏觀變量T年的預(yù)測數(shù)列,其中xm(t)表示第m個宏觀變量在第t年的指標預(yù)測值;
XXfuture,m={xxm(1),xxm(2),…,xxm(t)} (m=1,2,…,P;t=1,2,…,T)表示主成分分析之后第m個主成分T年的預(yù)測序列,其中xxm(t)表示第m個主成分在第t年的預(yù)測值;
Ω:允許的最大預(yù)測誤差情景集合;
ω:一種特定的情景,ω∈Ω;
φ:允許的最大預(yù)測誤差百分比。
一元線性回歸模型如下:
(1)
式中:a1m是一元線性回歸模型的回歸系數(shù);ε1是常數(shù)項。
相關(guān)性回歸模型如下:
ρ(Y,xm)=
(2)
ρ(Y,xmax)=
max{ρ(Y,x1),ρ(Y,x2),…,ρ(Y,xm)},m=1,2,…,M
(3)
(4)
式(2)表示計算旅客吞吐量和第m個宏觀變量之間的相關(guān)系數(shù);式(3)表示找到與機場旅客吞吐量相關(guān)性最大的宏觀統(tǒng)計變量;式(4)表示利用相關(guān)性最高的宏觀統(tǒng)計變量進行一元線性回歸,amax2,ε2是回歸系數(shù)。
主成分回歸模型如下:
b1xx1(t)+b2xx2(t)+n+bmxxm(t)+ε3,m=1,2,…,P
(5)
式(5)表示利用P個宏觀統(tǒng)計指標做主成分分析后得到P個線性無關(guān)的主成分回歸建模,b1,b2,…,bm,ε3表示多項式回歸系數(shù)。
逐步回歸模型如下:
逐步回歸模型是從備選的宏觀自變量中依次引入新變量到回歸模型中,使得最終引入模型的變量都對因變量顯著為止。本文使用的搜索方法為向前法。
(6)
(7)
步驟 3考慮機場旅客吞吐量對宏觀變量子集{xm1,xm2,xm}的回歸重復(fù)步驟2。
依次按方法重復(fù)進行,每次從未引入回歸模型的自變量中選取一個自變量,直到檢驗到?jīng)]有變量引入為止。
對于每個機場客、貨吞吐量預(yù)測結(jié)果,利用絕對誤差百分比進行評估。
(8)
et≤φ(ω)
(9)
式中:et表示第t年的絕對誤差百分比;φ(ω)表示情景ω下允許的最大預(yù)測誤差,如果機場客、貨吞吐量預(yù)測誤差小于允許的最大預(yù)測誤差百分比,則認為模型預(yù)測效果良好。
本文用到的數(shù)據(jù)主要包括兩類:一類是機場客、貨吞吐量,主要來源于民用航空局官方網(wǎng)站公布的民航機場生產(chǎn)統(tǒng)計公報;另一類是機場所在市宏觀統(tǒng)計指標,數(shù)據(jù)來源于統(tǒng)計年鑒。個別城市部分年份的宏觀統(tǒng)計指標尚未公布,應(yīng)在實證分析過程中將這些缺口數(shù)據(jù)對應(yīng)的年份做剔除處理。
在歷史數(shù)據(jù)選取上,由于2020年和2021年受疫情影響,航空運輸需求受到某種程度抑制,機場客、貨吞吐量未能反映真實的航空運輸需求,本文選用2020年以前的相關(guān)數(shù)據(jù)進行實證分析。在每一個機場客、貨吞吐量實證回歸預(yù)測過程中,以2002~2014年(2002年后通航的機場以通航年份作為初始年份)數(shù)據(jù)作為歷史數(shù)據(jù)預(yù)測2015~2019年機場客、貨吞吐量。其中,宏觀變量為自變量,機場客、貨吞吐量分別為因變量。
在宏觀變量選取上,本文根據(jù)各地市公布的歷年國民經(jīng)濟和社會生產(chǎn)統(tǒng)計公報選取綜合指標、旅游指標、貿(mào)易指標、人口指標、收入指標和城鎮(zhèn)化度量指標6大類12個可能相關(guān)的經(jīng)濟指標,即GDP、第一產(chǎn)業(yè)GDP、第二產(chǎn)業(yè)GDP、第三產(chǎn)業(yè)GDP、旅游人次、旅游收入、進出口額、社會消費品零售總額、常住人口、年末總?cè)丝?、人均可支配收入、城?zhèn)化率。
在相關(guān)性分析中,一般認為,相關(guān)系數(shù)|ρ|≥0.8時,兩個變量之間呈現(xiàn)高度相關(guān);0.5<|ρ|<0.8時,兩個變量呈現(xiàn)中度相關(guān);0.3<|ρ|<0.5時,兩個變量呈現(xiàn)低度相關(guān);|ρ|≤0.3時,兩個變量不相關(guān)。本文以|ρ|≥0.8作為兩個變量之間是否高度相關(guān)的判斷標準。
在實證過程設(shè)計上,對于每個機場客、貨吞吐量進行預(yù)測,在一元線性回歸模型構(gòu)建中,自變量依次選擇12個宏觀指標;在相關(guān)性回歸模型構(gòu)建中,自變量選擇與機場客、貨吞吐量相關(guān)性最高的宏觀指標;在逐步回歸模型構(gòu)建中,為了驗證不同宏觀指標組合下預(yù)測結(jié)果的差異,自變量分別選取高度相關(guān)的n個宏觀指標(由機場客、貨吞吐量影響因素研究得出高度相關(guān)的宏觀指標)和12個宏觀指標;在主成分回歸模型構(gòu)建中,自變量選取與逐步回歸法保持一致,確定自變量后根據(jù)主成分分析結(jié)果構(gòu)建多元線性回歸模型。為了下文描述清晰,此處對所有構(gòu)建的模型進行編號,如表1所示。
表1 預(yù)測模型編號
在回歸分析模型有效性方面,一般采用擬合優(yōu)度R-Squared評估最佳擬合線預(yù)測的準確性,R-Squared越接近1,說明回歸直線對觀測值的擬合程度越好;相反,R-Squared值越小,說明回歸直線對觀測值的擬合程度越差,一般擬合優(yōu)度大于0.8則認為模型有效。此外,還要通過F檢驗和t檢驗對模型參數(shù)進行顯著性檢驗,即檢驗在一定顯著性水平下回歸系數(shù)的顯著性,顯著性水平通常取0.95。本文按照擬合優(yōu)度是否大于0.8作為回歸模型是否有效的判定標準,并在顯著性水平為0.95的條件下對模型參數(shù)進行F檢驗和t檢驗,如果同時滿足擬合優(yōu)度檢驗、F檢驗和t檢驗,則認為擬合模型可以用于預(yù)測,否則則認為擬合模型無法進行有效預(yù)測。
在擬合模型滿足檢驗的情況下,預(yù)測效果評判標準設(shè)置參照Nicolaisen[29]及Profillidis[30]的事后評估研究。一般情況下,預(yù)測絕對誤差百分比在10%以下認為是高精度預(yù)測。為了觀察φ在不同取值下,不同回歸分析法對中國機場客、貨吞吐量的預(yù)測效果,本文對φ進行靈敏度分析,設(shè)置情景1~情景4共4個分析情景。首先,以5%為步長設(shè)置,設(shè)置φ(1)=10%、φ(2)=15%、φ(3)=20%。此外,機場客、貨吞吐量量級不同,允許的最大預(yù)測誤差應(yīng)該有所區(qū)別,因此φ(4)以梯度方式進行設(shè)置。根據(jù)民航機場生產(chǎn)統(tǒng)計公報,按照旅客吞吐量200萬人次和1 000萬人次將機場劃分為3個等級,即1 000萬人次以上、200~1 000萬人次、200萬人次以下;對應(yīng)的貨郵吞吐量則分為5萬噸以上、1~5萬噸、1萬噸以下3個等級。因此,按照梯度設(shè)置的思路,旅客吞吐量在200萬人次以下(貨郵吞吐量在1萬噸以下)機場,φ(4)=20%;旅客吞吐量在200~1 000萬人次(貨郵吞吐量為1~5萬噸)機場,φ(4)=15%;旅客吞吐量在1 000萬人次以上(貨郵吞吐量在5萬噸以上)機場,φ(4)=10%。在結(jié)果分析中,對于任意一個機場客、貨吞吐量預(yù)測結(jié)果,如果絕對誤差百分比小于對應(yīng)情景的φ值,則認為在該情景下模型預(yù)測效果良好。此外,為了觀察回歸分析法對不同量級機場客、貨吞吐量預(yù)測的適用性問題,本文對203個機場的客、貨吞吐量預(yù)測效果分別按照3個等級進行統(tǒng)計,統(tǒng)計結(jié)果如表2和表3所示。
表2 機場旅客吞吐量等級分布統(tǒng)計
表3 機場貨郵吞吐量等級分布統(tǒng)計
機場客、貨吞吐量預(yù)測的目的主要是確定機場建設(shè)規(guī)模,常以5年為一個預(yù)測周期,因此本文在2015~2019年預(yù)測結(jié)果中主要分析2019年的預(yù)測結(jié)果。以A機場旅客吞吐量預(yù)測為例,當(dāng)允許的最大預(yù)測誤差百分比給定后,對于17個單個擬合模型預(yù)測結(jié)果,如果2019年旅客吞吐量預(yù)測誤差百分比小于允許的最大預(yù)測誤差百分比,即當(dāng)e5≤φ(ω)時,認為模型預(yù)測結(jié)果有效。對于同一細分回歸分析法,例如一元線性回歸,如果在構(gòu)建的12個細分模型中至少有一個模型的預(yù)測誤差百分比滿足e5≤φ(ω),則認為一元線性回歸預(yù)測結(jié)果有效,同時選取最小的預(yù)測誤差百分比作為該機場一元線性回歸的預(yù)測誤差。如果12個細分預(yù)測模型均不滿足e5≤φ(ω),則記作一元線性回歸無法有效預(yù)測A機場旅客吞吐量。如果4類回歸分析法中至少有一種細分回歸分析法可以有效預(yù)測A機場的旅客吞吐量。則認為回歸分析法能夠有效預(yù)測A機場的旅客吞吐量。根據(jù)Atiya[31]和Blancy[32]的研究結(jié)果,加權(quán)平均之后預(yù)測結(jié)果最可靠,因此A機場旅客吞吐量回歸分析預(yù)測誤差由4類回歸分析法中有效的細分回歸分析法的預(yù)測誤差百分比取平均加權(quán)得到。
2.3.1 機場客、貨吞吐量影響因素
針對機場客、貨吞吐量影響因素已有相關(guān)研究[4,17,33-34]。本文基于大量的統(tǒng)計數(shù)據(jù),分析了203個機場樣本客、貨吞吐量與12個宏觀指標的兩兩相關(guān)性,并分別統(tǒng)計客、貨吞吐量與12個宏觀指標分別高度相關(guān)的機場數(shù)量,根據(jù)高度相關(guān)機場數(shù)量確定與機場客、貨吞吐量高度相關(guān)的宏觀指標。此外,還計算了GDP與其他宏觀指標之間的兩兩相關(guān)系數(shù),用于判定宏觀指標之間的自相關(guān)性,統(tǒng)計結(jié)果如表4~表6所示。研究表明:機場客、貨吞吐量分別與GDP高度相關(guān),GDP又與其他宏觀指標相關(guān),因此機場客、貨吞吐量與12個宏觀指標均有不同程度的相關(guān)性。根據(jù)統(tǒng)計,總體而言,至少60%的機場的旅客吞吐量與GDP、第三產(chǎn)業(yè)GDP、可支配收入、社會消費品零售總額、旅游人次、旅游收入等6個指標呈現(xiàn)高度相關(guān),至少60%的機場貨郵吞吐量與GDP、第一產(chǎn)業(yè)GDP、第三產(chǎn)業(yè)GDP、社會消費品零售總額、人均可支配收入之間呈現(xiàn)高度相關(guān),且隨著機場量級的不斷提高,機場客、貨吞吐量與宏觀指標的相關(guān)性更加明顯。此外,從機場客、貨吞吐量與宏觀指標高度相關(guān)的單個機場特征來看,機場均具有歷史數(shù)據(jù)充足、發(fā)展規(guī)律明顯等特點,然而相關(guān)性低的機場則表現(xiàn)為因歷史數(shù)據(jù)少、因改擴建或遷建機場中途停航、遷建后機場客、貨吞吐量飛躍式發(fā)展、機場客、貨吞吐量波動無序發(fā)展或吞吐量波動上升(多為支線旅游機場)而呈現(xiàn)出經(jīng)濟指標逐年下降(多為邊遠省份機場)等特點。
表4 旅客吞吐量與宏觀變量高度相關(guān)的機場數(shù)統(tǒng)計
表5 貨郵吞吐量與宏觀變量高度相關(guān)的機場數(shù)統(tǒng)計
表6 GDP與其他宏觀變量高度相關(guān)的機場數(shù)統(tǒng)計
2.3.2 不同回歸分析法的預(yù)測結(jié)果
本節(jié)仿真求解每個機場在不同預(yù)測模型、不同預(yù)測情景下的預(yù)測結(jié)果。根據(jù)機場客、貨吞吐量影響因素研究結(jié)果,在逐步回歸模型和主成分回歸模型計算中,旅客吞吐量預(yù)測時選取12個經(jīng)濟指標和6個高度相關(guān)的宏觀指標兩種情景,貨郵吞吐量選取12個經(jīng)濟指標和5個高度相關(guān)的宏觀指標兩種情景。
4種回歸方法構(gòu)建的17個細分模型客、貨吞吐量預(yù)測結(jié)果如圖1所示。圖1中,黑色線表示吞吐量與宏觀指標高度相關(guān)的機場數(shù)量,品紅色線表示模型通過檢驗的機場數(shù)量,深藍色、紅色、綠色、淺藍色分別表示情景1~情景4的預(yù)測結(jié)果。對比來看,高度相關(guān)的機場數(shù)量高于模型通過檢驗的機場數(shù)量,模型通過檢驗的機場數(shù)量又遠高于情景1~情景4代表的可預(yù)測機場數(shù)量,這說明雖然客、貨吞吐量與宏觀指標高度相關(guān),但二者構(gòu)建的回歸模型不一定能夠通過檢驗。同時,即使回歸模型通過檢驗,也不一定能夠得到精準的預(yù)測結(jié)果。從4類回歸方法的預(yù)測效果來看,以情景1為例,模型13表示的相關(guān)性回歸預(yù)測效果最好;模型16和模型17表示的逐步回歸法預(yù)測效果次之。從模型16和模型17的對比來看,改變自變量輸入個數(shù),可預(yù)測的機場數(shù)量基本保持一致,因此如果使用逐步回歸法進行預(yù)測,可以引入多個相關(guān)的宏觀變量,模型自動選擇能使模型顯著的若干宏觀變量。需要注意的是,逐步回歸法引入的宏觀變量相關(guān)性并非很高。模型14和模型15表示的主成分回歸預(yù)測效果相對中等。從模型14和模型15的對比來看,模型14在自變量選擇高度相關(guān)的n個宏觀變量時預(yù)測效果更好,這說明主成分分析時要選擇相關(guān)性最高的宏觀經(jīng)濟指標,相關(guān)性不高的宏觀變量越多,越會削弱最大主成分所涵蓋的主要宏觀指標信息,從而使預(yù)測結(jié)果精度不高。模型1~模型12表示的一元回歸分析預(yù)測效果相對最低,但從單個自變量的預(yù)測效果來看,旅客吞吐量與GDP、第三產(chǎn)業(yè)GDP、可支配收入、社會消費品零售總額、旅游人次、旅游收入6個指標的一元回歸分析結(jié)果相對更加有效,貨郵吞吐量與GDP、社會消費品零售總額、可支配收入、第一產(chǎn)業(yè)GDP、第二產(chǎn)業(yè)GDP、第三產(chǎn)業(yè)GDP的一元回歸分析結(jié)果相對更加有效,即一元回歸分析法預(yù)測效果較好的宏觀經(jīng)濟指標均是與機場客、貨吞吐量高度相關(guān)的宏觀指標。從情景1~情景4的預(yù)測效果對比來看,改變φ值,可有效預(yù)測的機場數(shù)量基本不會發(fā)生太大變化,即如果回歸分析法可以預(yù)測,那么預(yù)測誤差百分比多在10%以內(nèi)。從旅客和貨郵吞吐量預(yù)測效果的對比來看,利用4類回歸方法構(gòu)建的17個模型對機場客、貨吞吐量的預(yù)測效果整體上基本一致。
圖1 機場客、貨吞吐量預(yù)測結(jié)果Fig.1 Prediction results of airport passenger and cargo throughput
對4類回歸方法可有效預(yù)測的機場數(shù)量進行統(tǒng)計,由于不同φ值下預(yù)測結(jié)果差異不大,本文以情景3為例進行統(tǒng)計分析,預(yù)測結(jié)果的統(tǒng)計分析如圖2所示。
圖2 不同回歸分析法的預(yù)測結(jié)果(情景3)Fig.2 Prediction results of different regression analysis methods (Scenario 3)
從圖2來看,4類回歸方法中,相關(guān)性回歸、主成分回歸和逐步回歸法的預(yù)測效果基本一致,可預(yù)測機場數(shù)占比在50%上下,一元線性回歸由于一次只能代入一個宏觀變量,預(yù)測效果相對較低。此外,從客、貨吞吐量預(yù)測效果的對比來看,4類回歸方法可預(yù)測機場數(shù)量中客運相比貨運更多,這是由于民航客運發(fā)展與宏觀因素關(guān)系密切,貨運在宏觀因素的影響下,還會受到地方政府補貼、快遞企業(yè)引進等多方面外力因素影響,導(dǎo)致機場貨郵吞吐量發(fā)展與地方宏觀變量相關(guān)性更低。
將4類回歸分析法看作一個整體,按照設(shè)定規(guī)則統(tǒng)計回歸分析法對不同量級機場客、貨吞吐量的預(yù)測效果。以情景3為例,統(tǒng)計結(jié)果如表7和表8所示。
表7 機場客運吞吐量可有效預(yù)測的機場數(shù)量(情景3)
表8 機場貨郵吞吐量可有效預(yù)測的機場數(shù)量(情景3)
對機場旅客吞吐量預(yù)測而言,整體上可有效預(yù)測機場117個,占比58%,從不同量級可有效預(yù)測機場數(shù)量來看,機場量級越高,可預(yù)測機場數(shù)量越多,尤其是對旅客吞吐量在千萬級以上機場,回歸分析法基本均可實現(xiàn)預(yù)測。機場貨郵吞吐量也存在一致的結(jié)論,但對于貨郵來說,由于航空貨郵發(fā)展主要聚焦在一些大型機場,支線機場多是客運機場,其貨運發(fā)展基本處于無序狀態(tài),因此1萬噸以下機場可有效預(yù)測的機場的數(shù)量相比客運較少,且無法預(yù)測的機場的貨郵吞吐量基本都在5 000噸以下。客、貨吞吐量無法預(yù)測的機場的相關(guān)數(shù)據(jù)發(fā)展趨勢如圖3所示。
圖3中,縱坐標數(shù)值表示原始數(shù)據(jù)按照0~1歸一化后的數(shù)值,根據(jù)變動趨勢無法預(yù)測的機場的特征可歸納為兩類,一是機場客、貨吞吐量發(fā)展速度與地方經(jīng)濟發(fā)展速度不同步,例如珠海機場、九寨溝機場、鄭州機場等;二是機場在發(fā)展過程中經(jīng)歷了遷建、改擴建停航、其他交通方式影響等,導(dǎo)致機場客、貨吞吐量出現(xiàn)猛增、中斷或斷崖式下跌,從而無法預(yù)測,例如漢中機場由于遷建,在2012~2013年停航。
圖3 無法有效預(yù)測機場吞吐量與宏觀變量發(fā)展關(guān)系圖Fig.3 Development relationship between airport throughput and macroeconomic variables of unpredictable airport
本文按照機場客、貨吞吐量由大到小繪制回歸分析法可有效預(yù)測的機場的絕對誤差百分比,如圖4所示。(注:圖4中縱坐標數(shù)值表示原始數(shù)據(jù)按照0~1歸一化后的數(shù)值。)可以看出,回歸分析法的預(yù)測誤差因機場而異,整體上表現(xiàn)為機場量級越大,預(yù)測誤差相對越低的趨勢。
圖4 回歸分析法預(yù)測誤差Fig.4 Prediction error of regression analysis method
基于大量樣本數(shù)據(jù),利用4類回歸分析法對中國機場旅客吞吐量和貨郵吞吐量進行預(yù)測,主要研究結(jié)論如下:
(1) 從203個機場預(yù)測效果統(tǒng)計來看,機場客、貨吞吐量與各類宏觀指標之間均具有一定的相關(guān)性。其中,旅客吞吐量與GDP、第三產(chǎn)業(yè)GDP、旅游總?cè)舜?、旅游總收入、社會消費品零售總額、人均可支配收入呈現(xiàn)高度相關(guān),貨郵吞吐量與GDP、第一產(chǎn)業(yè)GDP、第三產(chǎn)業(yè)GDP、社會消費品零售總額、人均可支配收入呈現(xiàn)高度相關(guān)性。同時,利用高度相關(guān)的指標作為自變量構(gòu)建的回歸模型預(yù)測效果相對更好。
(2) 在4類回歸方法中,本文提出的相關(guān)性回歸、主成分回歸及逐步回歸預(yù)測效果相對更好。通過大量樣本實證發(fā)現(xiàn),不是每個回歸方法都適用于所有機場,存在僅能使用其中一種回歸方法進行預(yù)測的情況。
(3) 回歸分析法能否實現(xiàn)有效預(yù)測與機場旅客吞吐量和貨郵吞吐量的量級息息相關(guān),機場客、貨吞吐量量級越高,可預(yù)測機場數(shù)量越多,且預(yù)測絕對誤差百分比越小。其中,當(dāng)機場旅客吞吐量超過1 000萬人次或機場貨郵吞吐量超過5萬噸時,回歸分析法可預(yù)測90%以上的機場。這是因為當(dāng)機場客、貨吞吐量發(fā)展到一定量級后,機場發(fā)展已經(jīng)逐步穩(wěn)定,如果沒有疫情、地震等隨機事件影響,機場發(fā)展將與宏觀經(jīng)濟呈現(xiàn)高度相關(guān)性,因而客、貨吞吐量與宏觀指標之間的回歸預(yù)測效果更好。
(4) 從回歸分析法對203個機場客、貨吞吐量的預(yù)測效果來看,客運可預(yù)測機場數(shù)量相對更多。這是因為機場航空客運發(fā)展主要由當(dāng)?shù)匦枨筘暙I,貨運發(fā)展除本地貨源,還靠周邊集散貨物提振,因此航空貨運發(fā)展主要聚焦在大型樞紐機場,多數(shù)機場貨運發(fā)展長期處于較低量級,與當(dāng)?shù)亟?jīng)濟相關(guān)性較弱,回歸分析法預(yù)測效果相對較差。