薛方,蘇芮鋒,楊升,姚遠(yuǎn)征,張俊
(陜西重型汽車有限公司,陜西 西安 710200)
公路貨運(yùn)量反應(yīng)了國民經(jīng)濟(jì)水平,同時(shí)也是重卡銷量的基石。國內(nèi)很多學(xué)者都對(duì)公路貨運(yùn)量進(jìn)行過相關(guān)的分析,可概括為:(1)基于公路貨運(yùn)量統(tǒng)計(jì)方法的研究:梁仁鴻、仵思燃研究了公路貨物運(yùn)輸量統(tǒng)計(jì)新試行方案問題及完善思路[4];張忠民做了公路貨物運(yùn)輸量統(tǒng)計(jì)方案完善與應(yīng)用研究[5];孫磊磊、李瓊提出了公路運(yùn)輸量統(tǒng)計(jì)中的計(jì)量誤差分析[6];劉擁華等人提出了高速公路貨物運(yùn)輸量統(tǒng)計(jì)方法[7]。(2)基于調(diào)查方法的研究:于丹陽等人提出了北京市公路貨物運(yùn)輸量抽樣調(diào)查分析與建議[8];郭紅霞、栗慶耀提出了公路貨運(yùn)量統(tǒng)計(jì)調(diào)查方法的改進(jìn)[9];張志俊、周婭提出了滿足多層次需要的公路運(yùn)輸量抽樣調(diào)查方法[10]。(3)基于公路貨運(yùn)量預(yù)測(cè)的研究:王俊波提出了組合預(yù)測(cè)方法在公路運(yùn)輸量預(yù)測(cè)中的應(yīng)用研究[11];吳鳳山、范林業(yè)做了中國公路貨物運(yùn)輸量的長(zhǎng)期預(yù)測(cè)[12];瞿爾仁等人做了公路運(yùn)輸量預(yù)測(cè)的綜合時(shí)序分析[13]。
公路貨運(yùn)量預(yù)測(cè)是制定公路運(yùn)輸業(yè)發(fā)展規(guī)劃和重卡銷量研究的基礎(chǔ)。本文從宏觀上影響公路貨運(yùn)量的因子出發(fā),首先利用散點(diǎn)圖分析各因子和公路貨運(yùn)量之間的關(guān)系,然后用逐步回歸法剔除掉對(duì)公路貨運(yùn)量不顯著的因子,建立了多元線性回歸方程對(duì)貨運(yùn)量進(jìn)行預(yù)測(cè)。經(jīng)檢驗(yàn)預(yù)測(cè)模型擬合效果好。
公路貨運(yùn)量,如下圖所示。貨運(yùn)量數(shù)據(jù)呈現(xiàn)上升趨勢(shì),且跌宕起伏,是一條折線,用一條直線或者曲線是描述不清楚的。因此需要考慮使用多變量預(yù)測(cè)模型。
表1 2010-2017 年貨運(yùn)量統(tǒng)計(jì)
圖1 公路貨運(yùn)量隨著年份的變化趨勢(shì)
表2 2010-2017 國內(nèi)生產(chǎn)總值、國民總收入、第一產(chǎn)業(yè)增加值、第二產(chǎn)業(yè)增加值
經(jīng)過嚴(yán)格的分析可知,與貨運(yùn)量相關(guān)的可以獲取到的數(shù)據(jù)有:國內(nèi)生產(chǎn)總值,國民總收入,人均國內(nèi)生產(chǎn)總值,工業(yè)增加值,建筑業(yè)增加值,批發(fā)和零售業(yè)增加值,交通運(yùn)輸、倉儲(chǔ)和郵政業(yè)增加值,第一產(chǎn)業(yè)增加值,第二產(chǎn)業(yè)增加值,第三產(chǎn)業(yè)增加值這10 種數(shù)據(jù)。
表3 2010-2017 第三產(chǎn)業(yè)增加值、人均國內(nèi)生產(chǎn)總值、工業(yè)增加值、建筑業(yè)增加值
表4 2010-2017 批發(fā)和零售業(yè)增加值、交通運(yùn)輸、倉儲(chǔ)和郵政業(yè)增加值
能否使用線性回歸模型,要先分析自變量和因變量之間是否有線性關(guān)系,最常見的方法是散點(diǎn)圖法,畫出自變量和因變量之間的二維散點(diǎn)圖,進(jìn)行觀察,如果呈現(xiàn)線性關(guān)系,就用線性回歸,如果呈現(xiàn)非線性關(guān)系,就使用非線性函數(shù)來進(jìn)行非線性回歸。
圖2 公路貨運(yùn)量隨著各個(gè)因子的變化趨勢(shì)
觀察圖2 中的散點(diǎn)圖,可見各因子對(duì)公路貨運(yùn)量的影響不是直接的線性但是可以近似為線性關(guān)系。因此可以建立多元線性回歸模型求解。
這10 個(gè)因子對(duì)公路貨運(yùn)量的影響程度決定了回歸模型的優(yōu)劣。通常情況下,如果方程中含有對(duì)因變量不起作用或者作用極小的自變量,也就是不顯著的自變量,會(huì)造成回歸方程預(yù)測(cè)效果下降,因此先使用多元逐步回歸法對(duì)因子進(jìn)行選擇。
逐步回歸的思想是有進(jìn)有出。引入一個(gè)自變量,對(duì)已引入的變量要進(jìn)行逐個(gè)檢驗(yàn),當(dāng)原引入的變量由于后面變量的引入而變得不再顯著時(shí),要將其剔除。引入一個(gè)變量或從回歸方程中剔除一個(gè)變量為逐步回歸的一步,每一步都要進(jìn)行F 檢驗(yàn),以確保每次引入新的變量之后回歸方程中只包含顯著的變量。這個(gè)過程反復(fù)進(jìn)行,直到既無顯著的自變量引入回歸方程,也無不顯著的自變量從回歸方程中剔除為止。這樣就可以保證最后所得的變量子集中的所有變量都是顯著的。經(jīng)過若干步以后可得到“最優(yōu)”變量子集。
使用MATLAB 工具箱中的stepwise 命令進(jìn)行因子選擇,結(jié)果見表5。
表5 因子選擇的結(jié)果
回歸分析預(yù)測(cè)法,是在分析了自變量和因變量之間相關(guān)關(guān)系的基礎(chǔ)上,建立變量之間的回歸方程,并將建立的回歸方程作為預(yù)測(cè)模型。根據(jù)自變量的變化來預(yù)測(cè)因變量的變化,變化關(guān)系一般為相關(guān)關(guān)系?;貧w分析預(yù)測(cè)法主要是對(duì)具有因果關(guān)系的變量進(jìn)行分析預(yù)測(cè)。回歸分析所建立的模型,只有通過了各種檢驗(yàn),并且預(yù)測(cè)誤差很小,才能應(yīng)用到實(shí)際的預(yù)測(cè)中。
根據(jù)模型中自變量個(gè)數(shù)的多少,可以將回歸模型分為一元回歸模型和多元回歸模型;根據(jù)模型是否是線性的,可分為線性回歸模型和非線性回歸模型。本文主要使用了一元和多元線性回歸模型。
一元線性回歸只涉及一個(gè)因變量y 和一個(gè)自變量x,用x的線性函數(shù)對(duì)y 建模,即y=a+bx,其中a,b 稱為回歸系數(shù)對(duì)應(yīng)的直線稱為回歸直線。在用一元線性回歸模型進(jìn)行預(yù)測(cè)時(shí),首先必須對(duì)a,b 進(jìn)行評(píng)估。一般采用最小二乘法。根據(jù)最小二乘法得到的參數(shù)估計(jì)值為:
式中,xi,yi是已知的歷史數(shù)據(jù),x,y 是自變量和因變量的算數(shù)平均值??紤]到隨機(jī)因素的影響,可以加入隨機(jī)干擾項(xiàng)ε,一般假定服從正態(tài)分布,且各εi互不相關(guān)。一元線性回歸預(yù)測(cè)模型為:yi=a+bxi+εi。
用最小二乘法求解ω 和b
當(dāng)XTX 為滿秩矩陣或正定矩陣時(shí),另上式為零可得:,其中(XTX)-1是矩陣(XTX)的逆矩陣,令,則最終學(xué)得的多元線性模型為。
對(duì)貨運(yùn)量y 與國民總收入、人均國內(nèi)生產(chǎn)總值、工業(yè)增加值、建筑業(yè)增加值、批發(fā)和零售業(yè)增加值、交通運(yùn)輸、倉儲(chǔ)和郵政業(yè)增加值這6 個(gè)因子建立6 元線性回歸模型:
其中,
應(yīng)用最小二乘法解得:
得到模型的回歸系數(shù)
其中β0為常數(shù)項(xiàng),β1,…,β6為各因子系數(shù)。因此該模型的函數(shù)表達(dá)式為:
x1,…x6依次為國民總收入(億元),人均國內(nèi)生產(chǎn)總值(元),工業(yè)增加值(億元),建筑業(yè)增加值(億元),批發(fā)和零售業(yè)增加值(億元),交通運(yùn)輸、倉儲(chǔ)和郵政業(yè)增加值(億元)。為貨運(yùn)量預(yù)測(cè)值。
預(yù)測(cè)結(jié)果見表6。
表6 多元線性回歸模型預(yù)測(cè)結(jié)果
圖3 原始貨運(yùn)量與預(yù)測(cè)貨運(yùn)量的曲線圖
對(duì)回歸模型進(jìn)行檢驗(yàn),結(jié)果見表7。
表7 檢驗(yàn)結(jié)果
該模型使得p=0.02137<0.05,樣本可決系數(shù)R2=0.99987,接近于1,因此模型的擬合效果較好。
要對(duì)未來1 年或者未來2-5 年的貨運(yùn)量進(jìn)行預(yù)測(cè),只需要在模型中輸入自變量的值,就可以求得。但是本文自變量的數(shù)據(jù)來源于國家統(tǒng)計(jì)局,統(tǒng)計(jì)局的數(shù)據(jù)是根據(jù)真實(shí)數(shù)據(jù)測(cè)得的,因此不可能提前得知自變量的真實(shí)值。
所以需對(duì)6 種自變量進(jìn)行預(yù)測(cè),根據(jù)因子的變化趨勢(shì)可知,各因子的變化和年份成一元線性關(guān)系,因此可以建立一元線性模型,分別對(duì)各項(xiàng)因子進(jìn)行預(yù)測(cè)。預(yù)測(cè)結(jié)果見表8。使用一元線性回歸模型預(yù)測(cè)的結(jié)果和原始值的對(duì)比圖見圖4。
表8 2018 年各因子的預(yù)測(cè)值
圖4 各因子原始值與預(yù)測(cè)值的曲線圖
將2018 年各因子的預(yù)測(cè)值代入貨運(yùn)量預(yù)測(cè)模型可以求得2018 年的貨運(yùn)量為:3747247.95 萬噸。
圖5 貨運(yùn)量預(yù)測(cè)結(jié)果曲線圖
本文以中華人民共和國交通運(yùn)輸部公開的公路貨運(yùn)量數(shù)據(jù)為基準(zhǔn),結(jié)合國家統(tǒng)計(jì)局公開的年度數(shù)據(jù)搭建多元線性回歸預(yù)測(cè)模型來預(yù)測(cè)未來某時(shí)段的公路貨運(yùn)量,模型可行性較好,預(yù)測(cè)效果優(yōu)。
不足之處:各因子都近似為線性模型,如果可以找到一種非線性的函數(shù)形式替換效果估計(jì)更好。