(遼寧大學(xué) 遼寧 沈陽 110034)
不同交通工具客運量的統(tǒng)計分析
楊凱月
(遼寧大學(xué)遼寧沈陽110034)
本文針對全國近十年不同交通工具客運量的變化趨勢,利用Eviews軟件采用趨勢外推法分別對鐵路、公路、水運以及民航客運量進行了分析與預(yù)測.同時,分析選取了影響鐵路客運量的主要因素,基于SPSS軟件對各因素進行了主成分分析,構(gòu)建了鐵路客運量預(yù)測模型.最后對我國近十年的交通客運量的發(fā)展狀況進行了綜合分析評價,擬解決我國交通運輸業(yè)快速發(fā)展過程中存在的問題.通過對我國客運量的預(yù)測與綜合分析,以期發(fā)現(xiàn)我國交通客運量的未來走勢以及不同交通工具在交通運輸方面的作用,從而給相關(guān)部門以合理的參考與建議,使得交通運輸業(yè)在促進中國經(jīng)濟發(fā)展方面發(fā)揮更加重要的作用.
我國;客運量;時間序列趨勢外推法;主成分分析;預(yù)測
(一)我國交通旅客運輸業(yè)的發(fā)展現(xiàn)狀
近年來,隨著我國交通設(shè)施規(guī)模不斷擴大,客運量也快速上升,根據(jù)我國統(tǒng)計局發(fā)布的數(shù)據(jù)顯示,我國鐵路運營里程已達到世界第二位,高鐵投入運營里程居世界第一,并且在建規(guī)模已超過一萬公里[1].
2015年,在總的客運量中,公路客運量占到了83%,即公路運輸成為旅客運輸業(yè)的中流砥柱;其次是鐵路運輸,占總量的13%;最后是水運和民航,各占2%.
然而數(shù)據(jù)顯示:鐵路、水運和民航在近十年一直處于低速平穩(wěn)增長狀態(tài),沒有太大波瀾;而占比較大的公路客運量在2012年以前一直處于增長趨勢,在2012年下半年達到頂峰后在近幾年一直處于下降態(tài)勢.公路客運量的波動使得總客運量出現(xiàn)了與其同樣的變化趨勢.
(二)問題的提出
近年來,隨著我國的經(jīng)濟實力及綜合國力水平的快速提高,交通運輸客運量也出現(xiàn)迅速增長的態(tài)勢.由于受到人口總量、社會經(jīng)濟發(fā)展水平、旅游業(yè)的迅猛發(fā)展、居民消費水平、就業(yè)人員平均工資水平等多方面因素的影響,交通客運量呈現(xiàn)出復(fù)雜性波動的特征.因此,如何更加科學(xué)的組織運輸?shù)母咝нM行、構(gòu)建更為完善的交通運輸體系,對于促進社會的穩(wěn)定、構(gòu)建和諧社會具有重要的意義.
科學(xué)準確的預(yù)測不同交通工具客運量,建立客運量預(yù)測模型,是完善交通運輸?shù)幕A(chǔ).目前客運量的預(yù)測方法已達上百種,比如,在文獻《城市交通客運量統(tǒng)計分析與建模預(yù)測研究》[2]中,其就客運量與客運量的主要影響因素總?cè)丝?、國?nèi)生產(chǎn)總值、消費品批發(fā)零售量等之間運用回歸分析法進行了分析,建立了多元非線性回歸方程;而在河南省交通科學(xué)技術(shù)研究院的一篇文獻《基于SPSS主成分分析法在公路客運量預(yù)測中的應(yīng)用》[3]中則基于SPSS軟件對各公路客運量的影響因素進行了主成分分析,通過選取主成分避免了因自變量過多而產(chǎn)生的多重共線性的影響,進而構(gòu)建了河南省公路客運量的預(yù)測模型.
本文在參考各類預(yù)測方法的基礎(chǔ)上,結(jié)合SPSS和EVIEWS軟件的操作應(yīng)用,分別采用時間序列趨勢外推法和主成分分析法構(gòu)建了我國不同交通工具客運量的預(yù)測模型.
(一)時間序列趨勢外推法概述
大量統(tǒng)計資料表明,很多社會經(jīng)濟現(xiàn)象的變化趨勢與時間序列t具有一定的規(guī)律性,因此,如果該觀察序列能夠依據(jù)時間序列t呈現(xiàn)出某種有規(guī)律的變化趨勢,并且沒有季節(jié)變動趨勢,而這種變化趨勢可以找到契合的函數(shù)曲線來反映時,就可以建立以時間序列t為自變量,時序數(shù)值y為因變量的趨勢模型[5]:
y=f(t)
對于趨勢模型的選擇,一般可采用兩種方法:一是建立以時間序列t為自變量,時序數(shù)值y為因變量的散點圖,根據(jù)圖的變化趨勢找到契合的函數(shù)圖像;二是利用差分運算,將原序列修勻,使其轉(zhuǎn)化為平穩(wěn)序列.
(二)數(shù)據(jù)的選取
本文研究的數(shù)據(jù)來源于中華人民共和國國家統(tǒng)計局官網(wǎng).
(三)數(shù)據(jù)預(yù)處理
1.差分運算
公路客運量從2012年至今一直處于下降趨勢,分析原因,歸結(jié)為:2012年下半年開始實行的節(jié)假日高速公路免費通行帶來的沖擊.公路客運量是以客票為依據(jù)的,人們的出行觀念有了改變,再加上節(jié)假日高速公路免費,大批的人選擇了自駕出行.
由于近十年公路客運量出現(xiàn)了不規(guī)則的復(fù)雜性波動,對其建立模型進行預(yù)測并沒有實際的意義.故本文僅對鐵路、水運和民航客運量進行時間序列分析.
下面以鐵路為例進行分析建模.
鐵路運輸量在近十年一直呈上升趨勢.為使得序列呈平穩(wěn)狀態(tài),對序列進行了二階差分.對差分后的序列進行單位根檢驗知p-值<0.05,故該序列平穩(wěn),可進行多項式建模.
(四)建模與預(yù)測
1.模型的建立。建立時間序列t:{t}={1,2,3,4,5,6,7,8,9,10},將X1與t之間做非線性回歸模型,如下:
表2.1 鐵路客運量模型
由表2.1可看到,該模型的系數(shù)均通過檢驗(p<0.05),并且擬合優(yōu)度達到了0.99,說明接近完全擬合,該模型的F值為563.03,模型通過檢驗.故鐵路客運量模型為:
X1=121726+4995.436T+793.9566T2
用以上方法對水運和民航客運量建立的模型如下:
水運模型為:
X3=20449.21+593.4152T
民航客運量模型為:
X4=13962.86+1836.443T+110.2485T2
2.客運量的預(yù)測。本文建立的模型是以2006年為基期,即2006年的t=1,預(yù)測2016年的客運量,只需將t=11代入模型即可.
故2016年鐵路客運量:
X1=121726+4995.436×11+793.9566×112=272744.5446
水路客運量:
X3=20449.21+593.4152×11=26976.7772
民航客運量:
X4=13962.86+1836.443×11+110.2485×112=47503.8015
小結(jié):本部分通過運用時間序列趨勢外推法,將鐵路、水運、民航等交通工具客運量與時間序列t之間分別建立了線性或非線性的回歸方程,并對2016年的不同交通工具的客運量進行了預(yù)測.通過檢驗,該模型擬合程度較高,預(yù)測值也符合客觀情況.通過本部分的分析與預(yù)測,發(fā)現(xiàn)在近幾年來,占比較大的公路客運量受某些因素的影響一直呈下降趨勢,而鐵路、水運、民航等客運量卻一直呈平穩(wěn)上升狀態(tài).
(一)主成分分析概述
1.主成分分析的基本原理
主成分分析(PrincipalComponentsAnalysis,PCA)是一種通過降維來簡化數(shù)據(jù)結(jié)構(gòu)的方法.它通過將一組相關(guān)性較高的幾個變量轉(zhuǎn)化為幾個無相關(guān)性的綜合指標,達到消除多重共線性的影響.該綜合指標稱為主成分.一般來說,主成分的個數(shù)小于原始變量的個數(shù)且彼此之間互不相關(guān),并且主成分集中了原始變量的大多數(shù)信息.
2.主成分分析的模型及步驟
設(shè)對某一事物的研究涉及p個標準化變量,分別用X1,X2,…,Xp表示,則最多可得p個主成分:F1,F(xiàn)2,…,F(xiàn)p.則它們可滿足下式:
其中,a11,a12,…,app是隨機變量X的協(xié)方差矩陣∑的特征向量.F1是X1,X2,…,Xp的線性組合中方差最大者,稱為第一主成分;F2是X1,X2,…,Xp的所有線性組合中與F1無關(guān)的且方差最大者,稱為第二主成分;Fp是X1,X2,…,Xp的所有線性組合中與F1,F(xiàn)2,…,F(xiàn)p均無關(guān)且方差最大者[5].
進行主成分分析的主要步驟如下:
(1)根據(jù)研究問題選取相應(yīng)指標和數(shù)據(jù);
(2)指標數(shù)據(jù)的標準化處理;
(4)確定主成分個數(shù),選取主成分,并得到主成分的表達式;
(5)結(jié)合主成分,對研究問題進行分析研究.
(二)實例分析
1.指標選取
鐵路客運量的影響因素有很多,本文在參考相關(guān)文獻和研究的基礎(chǔ)上,選取了年末總?cè)丝?、國?nèi)游客數(shù)、國內(nèi)生產(chǎn)總值、居民消費水平、社會消費品零售總額等5項指標作為鐵路客運量的主要影響因素.
2.主成分回歸建模
為了消除量綱和數(shù)量級不同帶來的影響,首先需要對原始變量進行標準化處理(SPSS軟件實現(xiàn)).接著采用SPSS對自變量X1,X2,…,Xp進行主成分析,輸出結(jié)果如下:
目前,殼牌、道達爾等西方石油公司憑借在液化天然氣等方面的特有技術(shù),占據(jù)該地區(qū)天然氣開發(fā)生產(chǎn)多年。中國石油企業(yè)要想在卡塔爾有所建樹,需要與國際公司開展合作,利用市場及資金優(yōu)勢來彌補技術(shù)的不足。但一段時間以來,卡塔爾因政策導(dǎo)向與周邊阿拉伯國家關(guān)系緊張,對其投資環(huán)境應(yīng)給與重點關(guān)注。
表3.1 相關(guān)矩陣
由表3.1可以看出,在相關(guān)矩陣表中,各個變量之間的相關(guān)系數(shù)均接近0.99,即各個變量間存在非常強的相關(guān)關(guān)系,因此,可以進行主成分分析.
表3.3 解釋的總方差
提取方法:主成份分析.
“解釋的總方差”表(表3.3)則顯示了各主成分解釋原始變量總方差的情況,SPSS默認保留特征根大于1的主成分,在本例中可看到保留1個主成分為宜.這個主成分集中了5個原始變量信息的99.649%,可見效果比較好.
表3.4 成份矩陣a
提取方法:主成份.
a.已提取了1個成份.
用表3.4中的數(shù)據(jù)除以主成分相對應(yīng)的特征值4.982開平方根就得到主成分中每個指標所對應(yīng)的系數(shù).將得到的特征向量與標準化后的數(shù)據(jù)相乘,就可以得出主成分表達式:
F=0.447ZX1+0.446ZX2+0.447ZX3+0.448ZX4+0.448ZX5
以標準化后的ZY為因變量,F為自變量進行多元線性回歸分析.
ZY=0.445F
該回歸模型具有較強的統(tǒng)計學(xué)意義,能夠?qū)﹁F路客運量做出合理預(yù)測.因為主成分F為原始自變量X1,X2,…,X5的線性組合,經(jīng)過轉(zhuǎn)化,用X1,X2,…,X5替代F,得到因變量Y與關(guān)于原始自變量X1,X2,…,X5的線性回歸方程為:
Y=0.1989X1+0.1985X2+0.1989X3+0.1994X4+0.1994X5
小結(jié):本部分通過對鐵路客運量的主要影響因素的主成分分析,將相關(guān)性較高的影響因素轉(zhuǎn)化為無相關(guān)性的綜合指標即主成分,建立了主成分與各影響因素的線性組合.運用回歸分析法建立了以鐵路客運量為因變量,以主成分為自變量的回歸模型.經(jīng)過轉(zhuǎn)化,便得到了鐵路客運量與其各影響因素之間的線性回歸模型.該回歸模型具有較強的統(tǒng)計學(xué)意義,能夠?qū)﹁F路客運量做出合理預(yù)測.
(一)結(jié)論
由趨勢外推法得知,鐵路、水運和民航等客運量與時間序列{t}之間存在較吻合的線性或非線性的回歸模型,可根據(jù)此模型對客運量進行預(yù)測.
由主成分分析法得知,鐵路客運量與總?cè)丝跀?shù)、游客人數(shù)、國內(nèi)生產(chǎn)總值、居民消費水平、社會消費品零售總額等影響因素之間具有較強的相關(guān)性,并且可建立他們之間的線性回歸模型.
由以上數(shù)據(jù)及時間序列分析的結(jié)果可以看出,近十年中,隨著社會經(jīng)濟發(fā)展、總?cè)丝诘脑黾拥雀饕蛩氐挠绊?,鐵路、水運和民航等客運量一直增加.而由于私家車的增多、人們出行觀念的改變、節(jié)假日高速公路的免費等因素的影響,公路客運量在近幾年一直呈下降趨勢.
(二)建議
1.鑒于城市交通擁堵現(xiàn)象,交通有關(guān)部門可采取有關(guān)措施限行私家車;
2.發(fā)展城市郊區(qū)交通運輸網(wǎng),轉(zhuǎn)移交通運輸密集區(qū);
3.大力推廣公共交通工具的使用,倡導(dǎo)環(huán)保無煙出行;
4.完善鐵路、水運、民航等交通線路的網(wǎng)絡(luò)布局,根據(jù)客運量的密集程度改善交通線路;
5.合理建立客運量預(yù)測模型,科學(xué)準確把握客運量的增減動態(tài),對于旅客運輸量的隨機性波動做好一切準備.
[1]王燕.應(yīng)用時間序列分析(第四版)[M].北京:中國人民大學(xué)出版社,2015.
[2]徐國祥.統(tǒng)計預(yù)測與決策(第四版)[M].上海:上海財經(jīng)大學(xué)出版社,2012.54:56
[3]何曉群.多元統(tǒng)計分析(第四版)[M].北京:中國人民大學(xué)出版社,2015.113:11
楊凱月(1993.10-),女,漢族,山東濟南人,本科,遼寧大學(xué)2017級研究生,統(tǒng)計學(xué)。