曾華燕 鄭瓊芳 蔡銘洲
(1.深圳大學(xué),深圳 518052;2.佛山市自然資源局順德分局,佛山 528333)
在預(yù)測研究中,研究目標(biāo)一般會被視為因變量,例如一個(gè)城市的年度公共交通客運(yùn)量(包括公共汽車客運(yùn)量和軌道交通客運(yùn)量,不包括出租車客運(yùn)量)。在現(xiàn)實(shí)生活中,公共交通客運(yùn)量的影響因素一般包括該城市的人口情況、交通管理政策、居民出行習(xí)慣、公共交通服務(wù)水平,以及公共衛(wèi)生條件、司乘人員的健康情況等。分析現(xiàn)實(shí)因素對因變量的影響,一般被稱為因果分析或相關(guān)分析法。如果因變量影響因素的變化規(guī)律隨時(shí)間的發(fā)展而保持大體一致,那么可以將在以往年份的因變量數(shù)值列成一個(gè)序列,將影響因素看成時(shí)間,采用預(yù)測函數(shù)來模擬因變量的變化規(guī)律,這種方法一般被稱為時(shí)間序列預(yù)測方法[1-2]。
相對于因果分析法而言,時(shí)間序列預(yù)測法不需要采集很多現(xiàn)實(shí)數(shù)據(jù),使用起來較為方便,能夠迅速預(yù)測未來的客運(yùn)量情況;但時(shí)間序列預(yù)測法無法一一辨別影響因素對因變量的影響程度,因此非常依賴于現(xiàn)實(shí)因素是否一直保持大體一致的變化規(guī)律。在一般情況下,人們可以利用以往若干年的數(shù)據(jù),模擬得出一條時(shí)間序列曲線,如果預(yù)測值與真實(shí)數(shù)值的相對誤差和標(biāo)準(zhǔn)差在可接受范圍內(nèi),則認(rèn)為此時(shí)能采用時(shí)間序列法來預(yù)測因變量在未來若干年的變化,以輔助管理者進(jìn)行決策;在這種情況下,時(shí)間序列法是一種較為簡便的、具有一定實(shí)用性的預(yù)測方法[1-2]。
(1)一般情況下,建議采用以下3 種函數(shù)來模擬時(shí)間序列的變化規(guī)律[1-2]:直線、指數(shù)曲線和二次曲線,曲線的參數(shù)可以采用最小二乘法來計(jì)算。
(2)計(jì)算出3 種曲線的預(yù)測方程之后,代入預(yù)測方程,可計(jì)算出往年的預(yù)測值。
(3)再計(jì)算出歷年預(yù)測值和真實(shí)值之間的相對誤差、以及誤差平方和,來作為篩選預(yù)測曲線的指標(biāo)之一;直線函數(shù)還可以采用相關(guān)系數(shù)來分析預(yù)測方程的準(zhǔn)確性。
利用Excel 可以快速計(jì)算出預(yù)測曲線的各個(gè)參數(shù);而如果需要手算的話,可以通過對時(shí)間單位進(jìn)行簡化,來快速提高手算速度,其預(yù)測準(zhǔn)確度和使用軟件計(jì)算原自然年份下的時(shí)間序列的準(zhǔn)確度是相同的。
由于時(shí)間序列法的應(yīng)用前提是假定因變量的影響因素隨時(shí)間變化而保持大體一致,因此在理論上,當(dāng)自變量采用線性變化時(shí),也即時(shí)間年份發(fā)生線性變化時(shí),相當(dāng)于因變量在時(shí)間橫軸上左右移動,因變量的具體數(shù)值不受影響,而時(shí)間數(shù)值的改變可以簡化參數(shù)的求解過程。
本文利用直線方程來說明簡化算法。用最小二乘法確定的直線預(yù)測方程的參數(shù)方程組為:
上述方程組中,在求解參數(shù)a 和b 時(shí),如果對t 進(jìn)行線性變換,即令T = t- k,并使得盡可能小,或使則能大大簡化計(jì)算[1]。
在本文中,因變量為一個(gè)城市的公共交通客運(yùn)量(包括公共汽車客運(yùn)量和軌道交通客運(yùn)量,不包括出租車客運(yùn)量)。例如,根據(jù)深圳市統(tǒng)計(jì)年鑒數(shù)據(jù)[3],深圳市的公共交通客運(yùn)量在2009-2018 年的變化情況如表1、圖1 所示。
設(shè):公共交通客運(yùn)量為因變量y,年份為自變量t,則該序列是一個(gè)為期10 年的序列。y 和t 都可以加上下標(biāo)來表示年份之間的差別,客運(yùn)量為yi,時(shí)間為ti,i 為正整數(shù)(1、2、3……10)。
表1 深圳市公共交通客運(yùn)量表
圖1 自然年份下深圳市公共交通客運(yùn)量的散點(diǎn)圖
(1)使年份之和歸零的簡化方法
如前文1.2 節(jié)所述,若令T = t - k(k 為年份的平均值),使得可簡化手算求解參數(shù)方程組的過程。
本例中,年份ti為自然正整數(shù),是一個(gè)等差數(shù)列,其前n 項(xiàng)之和為:
此時(shí),數(shù)據(jù)列表和折線圖如表2、圖2 所示。
由表2 可方便地計(jì)算得出式(2)各參數(shù)項(xiàng)的數(shù)據(jù)(表3)。
表2 年份簡化后的深圳市公共交通客運(yùn)量表(1)
圖2 第1 種年份簡化法得到的客運(yùn)量散點(diǎn)圖
表3 年份簡化后的預(yù)測曲線參數(shù)
把表3 數(shù)據(jù)代入式(2),計(jì)算得出直線預(yù)測方程的參數(shù)項(xiàng)a,b。
這種簡化方法使得相鄰2 個(gè)時(shí)間數(shù)值的間隔仍是一年,上述表格中的數(shù)據(jù)序列是10 年,是偶數(shù)值,簡化后的年份數(shù)據(jù)帶有小數(shù)點(diǎn);如果數(shù)據(jù)序列是奇數(shù)值,則年份數(shù)據(jù)可以關(guān)于縱軸對稱,年份數(shù)據(jù)可以簡化為正整數(shù)。
(2)使年份從1 開始的簡化方法
也有將自然年份簡化為從1 開始的方法,同樣可以明顯簡化手算過程[1]。此時(shí),令W = t - 2008,則數(shù)據(jù)列表和折線圖如表4,圖3 所示。
表4 年份簡化后的深圳市公共汽車客運(yùn)量表(2)
圖3 第2 種年份簡化方法得到的客運(yùn)量散點(diǎn)圖
采用第2 種簡化方法后,關(guān)于簡化年份數(shù)據(jù)W2的運(yùn)算可以保持在百位數(shù)以內(nèi),比原來自然年份的千位數(shù)運(yùn)算要簡單,也能大大提高手算速度。接下來可以驗(yàn)算年份簡化后所獲得的預(yù)測數(shù)據(jù),與用原自然年份計(jì)算獲得的預(yù)測數(shù)據(jù)可以保持同樣的準(zhǔn)確度。
可以采用Excel 中的linest 函數(shù)計(jì)算預(yù)測結(jié)果,來驗(yàn)算分別使用原自然年份和兩種簡化方法所求得的預(yù)測數(shù)據(jù)。計(jì)算3 種年份數(shù)據(jù)的預(yù)測數(shù)據(jù)[1]如表5 所示。
將式(1)自然年份、簡化年份T 和簡化年份W 對應(yīng)的3 組參數(shù)分別標(biāo)記為a1 和b1、a2 和b2、a3 和b3,利用linest 函數(shù)計(jì)算出3 組參數(shù)(表6)。
由表6 中可以看出,3 條直線的斜率b 是一樣的,區(qū)別在于年份在橫軸上有了變化,使得直線在縱軸上的截距a 有所差別。
利用3 個(gè)直線方程代入3 種年份數(shù)據(jù),可計(jì)算得到3 組相同的預(yù)測數(shù)值(表7)。其中,預(yù)測值與真實(shí)值相對誤差 = (預(yù)測值-真實(shí)值) / 真實(shí)值。
從表7 中第一至第五列的數(shù)據(jù)可以看出,年份進(jìn)行簡化后,得到的預(yù)測數(shù)值是一樣的。從第六列數(shù)據(jù)可以看出,直線方程預(yù)測值與真實(shí)值相對誤差較小(〈±9%),在-7.83%~8.09%之間。
這意味著深圳市在2009 年至2018 年這十年間公共交通客運(yùn)量發(fā)展趨勢有較好的一致性,使用時(shí)間序列法預(yù)測公共交通客運(yùn)量具有一定的準(zhǔn)確度,其預(yù)測結(jié)果可以輔助管理者進(jìn)行公共交通規(guī)劃方面的決策[2]。當(dāng)需要更高預(yù)測準(zhǔn)確度、特別是當(dāng)需要考慮實(shí)際因素來人為地調(diào)整公共交通客運(yùn)量的發(fā)展變化時(shí),需要使用相關(guān)分析法來進(jìn)行分析和預(yù)測[1-2]。
表5 自然年份和兩種年份簡化方法的數(shù)據(jù)表
表6 自然年份和2 種年份簡化方法對應(yīng)的預(yù)測參數(shù)表
表7 自然年份和2 種年份簡化方法得到的預(yù)測數(shù)據(jù)計(jì)算表
在滿足一定的前提下,時(shí)間序列法是一種較為簡便的預(yù)測方法,可以用于預(yù)測公共交通客運(yùn)量的變化,以輔助管理者進(jìn)行公共交通規(guī)劃方面的決策;在使用最小二乘法來求解時(shí)間序列預(yù)測方程時(shí),可以采用兩種簡化年份的做法來簡化計(jì)算過程[1],能夠得到同樣的預(yù)測結(jié)果,有助于使用者更快地完成計(jì)算過程,并更好地理解時(shí)間序列預(yù)測法的本質(zhì)含義。