劉墨德
(1.三明學(xué)院 信息工程學(xué)院,福建 三明 365004;2.工業(yè)大數(shù)據(jù)分析及應(yīng)用福建省高校重點實驗室,福建 三明 365004;3.數(shù)字福建工業(yè)能源大數(shù)據(jù)研究所,福建 三明 365004)
科學(xué)預(yù)測網(wǎng)絡(luò)設(shè)備銷售收入對該公司的發(fā)展十分重要,因為錯誤的預(yù)測會讓公司浪費寶貴的人力、物力、財力,甚至斷送公司。
由于大數(shù)據(jù)時代各種資料的積累受到廣泛的重視,計算機網(wǎng)絡(luò)技術(shù)迅速發(fā)展,運用日趨完善,人類有效進行預(yù)測活動的方法及手段已經(jīng)具備,因此科學(xué)預(yù)測該公司未來網(wǎng)絡(luò)設(shè)備銷售收入可以實現(xiàn)。
要進行正確的預(yù)測是有難度的,主要體現(xiàn)在以下幾個方面:
(1)隨著科學(xué)技術(shù)的發(fā)展,各種因素、現(xiàn)象之間的聯(lián)系越來越復(fù)雜,正確預(yù)測未來的難度越來越大。
(2)人類認(rèn)識能力是有限的,預(yù)測要求人類能超越現(xiàn)實,理解未來,但人類的理解力又局限于自身的經(jīng)歷,這是一個難以解決的矛盾,因此人類并不能得出準(zhǔn)確的預(yù)測結(jié)論。
(3)雖然人類可以采用概率統(tǒng)計的方法來研究并揭示非確定性事件的概率,但人類無法消除這些事件的非確定性,預(yù)測的難度來源于未來所具有的非確定性。
(4)預(yù)測過程本身存在“干擾”未來的現(xiàn)象:當(dāng)人們預(yù)感前景不妙時,便會設(shè)法阻止其出現(xiàn),這是“自毀”性預(yù)測;當(dāng)前景不錯時,人們會努力促使它盡快實現(xiàn),這是“自成”性預(yù)測。
某網(wǎng)絡(luò)設(shè)備公司2006-2015年的網(wǎng)絡(luò)設(shè)備銷售收入如下表所示,時間序列數(shù)據(jù)呈現(xiàn)拋物線形狀,試預(yù)測2016年的銷售收入為多少萬元?網(wǎng)絡(luò)設(shè)備銷售收入數(shù)據(jù)見表1。
表1 網(wǎng)絡(luò)設(shè)備銷售收入數(shù)據(jù)表
針對上述預(yù)測難度,為了正確預(yù)測該公司的網(wǎng)絡(luò)設(shè)備銷售收入,建立最小二乘法和三點法兩種不同模型進行預(yù)測與應(yīng)用分析。
二次曲線趨勢外推預(yù)測法是研究時間序列觀察值數(shù)據(jù)隨時間變化呈現(xiàn)一種由高到低再到高或由低到高在到低的趨勢變化的曲線外推預(yù)測法,由于時間序列觀察值的散點圖呈現(xiàn)拋物線形狀,所以也稱二次曲線趨勢外推預(yù)測法。
設(shè)xt為時間變量(自變量)為第t期時間變量xt的預(yù)測值(因變量),yt為第t期時間變量xt的觀察值,則為二次曲線趨勢外推預(yù)測法的數(shù)學(xué)模型,其中a,b,c為待定常數(shù)為第 t期離差為離差平方和。
二次曲線趨勢外推預(yù)測法適用于時間序列數(shù)據(jù)呈現(xiàn)拋物線形狀上升或下降,且曲線僅有一個極值(極大值或極小值)的情況下使用,可通過使誤差為最小的標(biāo)準(zhǔn)來確定待定常數(shù)a,b,c,求出數(shù)學(xué)模型進行預(yù)測分析。
這里要注意到,自變量xt的取值為1到n,也就是說自變量xt取值等于其下標(biāo)t,即xt=t。而實際上,從拋物線趨勢法的原理來講,時間變量xt的取值代表的是時間變量的編號,而這種編號不一定要從1開始,可以從任一自然數(shù)開始順序編號,因此可以利用這樣的便利減少計算工作量。當(dāng)時間序列的數(shù)據(jù)長度n為奇數(shù)時,取中位數(shù)(n+1)/2的編號為0,那么xt就構(gòu)成了以0號為中心的正、負(fù)數(shù)對稱的順序編號,即于是
所以(1)可簡化為
由(2)解得
(1)根據(jù)所給實際問題的觀察值繪制散點圖。
(2)根據(jù)散點圖的變化趨勢確定實際問題屬于二次曲線變化趨勢后,列表計算二次曲線待定常數(shù)所需數(shù)據(jù)。
(3)確定待定常數(shù),建立預(yù)測模型。
(4)計算預(yù)測值。
解:(1)繪制時間序列數(shù)據(jù)散點圖(圖略),由散點圖可知,銷售收入變化趨勢屬于二次曲線變化趨勢,選擇二次曲線預(yù)測模型。
(2)列表計算最小二乘法所需數(shù)據(jù):
年份2007 2008 2009 2010 2011 2012 2013 2014 2015∑xt-4-3-2-1 0 1 2 3 4 0 yt 545 641 764 923 1107 1322 1568 1836 2140 10846 xt 2 16 9 4 1 0 1 4 9 1 6 60 xt 4 256 81 16 1 0 1 1 6 81 256 708 xtyt-2180-1923-1528-923 0 1322 3136 5508 8560 11972 xt 2yt 8720 5769 3056 923 0 1322 6272 16524 34240 76826 y^t 543.89 640.73 766.91 922.43 1107.29 1321.49 1565.03 1837.91 2140.13(yt-y^t)2 1.23 0.07 8.47 0.32 0.08 0.26 8.82 3.65 0.02 22.92
(3)確定待定常數(shù),建立預(yù)測模型。
利用上表計算得
(4)計算預(yù)測值。
將xt=5代入中,得2016年的銷售收入預(yù)測值為
用三點法確定待定常數(shù)的思路是:在二次曲線模型上選取遠、中、近期三點坐標(biāo)作為預(yù)測模型待定常數(shù)a,b,c的估計值。其具體做法是,使時間序列的總項數(shù)n為奇數(shù)(若n為偶數(shù),可刪去最初的一個觀察期數(shù)據(jù));如果n≥15,則在時間序列的遠、中、近三期各取5個數(shù)據(jù)項,用權(quán)數(shù)w=1,2,3,4,5由遠到近分別賦權(quán)并進行加權(quán)平均;如果15≥n≥9,則在時間序列的遠、中、近三期各取3個數(shù)據(jù)項,用權(quán)數(shù)w=1,2,3由遠到近分別賦權(quán)并進行加權(quán)平均。并以此三個加權(quán)平均值作為該二次曲線預(yù)測模型上遠、中、近三點的縱坐標(biāo)的數(shù)值,對遠、中、近三點的橫坐標(biāo)也作權(quán)數(shù)相同加權(quán)平均值作為該二次曲線預(yù)測模型上遠、中、近三點的橫坐標(biāo)的數(shù)值,然后聯(lián)立方程組求出待定常數(shù) a,b,c。
假設(shè)遠、中、近期三點坐標(biāo)分別為 P1(t1,R),P2(t2,S),P3(t3,T)因為時間序列的總項數(shù) n 為奇數(shù),所以中間項為當(dāng) n≥15時, 取遠期 5個觀察值 y1,y2,y3,y4,y5, 其加權(quán)平均值為 R=取中期5個觀察值yd-2,yd-1,yd,yd+1,yd+2,其加權(quán)平均值為S=取近期5個觀察值yn-4,yn-3,yn-2,yn-1,yn,其加權(quán)平均值為T=對遠、中、近三點的橫坐標(biāo) t1,t2,t3,作權(quán)數(shù) w=1,2,3,4,5加權(quán)平均值得 t1=于是5項觀察值作加權(quán)平均后三點坐標(biāo)分別為P1將點 P1,P2,P3代入二次曲線預(yù)測模型中,得聯(lián)立方程組
當(dāng)15≥n≥9時,取遠期3個觀察值y1,y2,y3,其加權(quán)平均值為取中期3個觀察值yd-1,yd,yd+1, 其加權(quán)平均值為取近期3個觀察值yn-2,yn-1,yn,其加權(quán)平均值為S=對遠、中、近三點的橫坐標(biāo) t1,t2,t3,作權(quán)數(shù) w=1,2,3 加權(quán)平均值得于是3項觀察值作加權(quán)平均后三點坐標(biāo)分別為將點 P1,P2,P3代入二次曲線預(yù)測模型中,得聯(lián)立方程組
(1)三點法不需要觀察值的全部數(shù)據(jù),計算比較簡單。
(2)對選取的數(shù)據(jù)比較敏感,即便是取加權(quán)平均值,預(yù)測結(jié)果也會因為選取數(shù)據(jù)方式不同而受到一定的影響。
(3)一般而言,每一組里的數(shù)據(jù)相對較多時,預(yù)測模型會越接近于實際。
(4)每一組里的數(shù)據(jù)個數(shù)要求是奇數(shù),是為了方便計算。
(5)三點法的計算比最小二乘法方便,但因采集數(shù)據(jù)較少,所以用三點法作預(yù)測所產(chǎn)生的誤差比用最小二乘法作預(yù)測所產(chǎn)生的誤差大。
解:(1)繪制時間序列數(shù)據(jù)散點圖(圖略),由散點圖可知,銷售收入變化趨勢屬于二次曲線變化趨勢,選擇二次曲線預(yù)測模型。
(2)列表計算三點法所需數(shù)據(jù):
年份2007 2008 2009 2010 2011 2012 2013 2014 2015∑xt 1 2 3 4 5 6 7 8 9 yt 545 641 764 923 1107 1322 1568 1836 2140 w 1 2 3 1 2 3 1 2 3 wyt 545 1282 2292 923 2214 3966 1568 3672 6420 y^t 549.68 647.44 774.34 930.38 115.56 1329.88 1573.34 1845.94 2147.68(yt-y^t)2 21.9 41.47 106.92 54.46 73.27 62.09 28.52 98.8 58.98 546.41
(3)確定待定常數(shù),建立預(yù)測模型[4]。
(4)計算預(yù)測值。
將xt=10代入:中,得2016年的銷售收入預(yù)測值為
算例3.5與算例2.3均為預(yù)測2016年的銷售收入,均是對時間序列數(shù)據(jù)呈現(xiàn)拋物線形狀的同一實際問題進行有效預(yù)測,只是使用的方法不同,算例2.3的運算復(fù)雜性比算例3.5大,算例2.3的最小二乘法更適用于大中型精密的預(yù)測,算例3.5的三點法更適用于小型簡便快捷的預(yù)測。由于算例3.5的樣本均方差大于算例2.3的樣本均方差,所以算例2.3的預(yù)測值比算例3.5的預(yù)測值準(zhǔn)確、可靠。兩個預(yù)測值的相對誤差限為是一個較小數(shù)據(jù),所以兩個預(yù)測值均可接受。