王炎林,陳 建,王 卓,胡陳君,鄭延莉,曹中華,方晶晶,羅澤勇
(西南大學(xué) 工程技術(shù)學(xué)院,重慶 400716)
農(nóng)用拖拉機(jī)總數(shù)量指現(xiàn)有的投入農(nóng)業(yè)生產(chǎn)的拖拉機(jī)總臺數(shù),是衡量我國農(nóng)業(yè)機(jī)械化水平的一個重要指標(biāo)[1-2],也是我國農(nóng)機(jī)行業(yè)制定生產(chǎn)與銷售規(guī)劃的參考。2017年上半年,由于農(nóng)機(jī)補貼購置影響,農(nóng)產(chǎn)品價格下滑和農(nóng)民購買力和購機(jī)意愿下降,拖拉機(jī)總產(chǎn)值同比下降18.33%,而大中型拖拉機(jī)的庫存率達(dá)到114%,供需矛盾極為突出。因此,合理地預(yù)測我國農(nóng)用拖拉機(jī)總數(shù)量發(fā)展趨勢并為拖拉機(jī)的發(fā)展提供建議便顯得尤為重要。
農(nóng)用拖拉機(jī)逐年總數(shù)量由于受到政府政策(如購機(jī)補貼、排放標(biāo)準(zhǔn),土地整治等)的影響,無法用一個準(zhǔn)確的數(shù)學(xué)公式預(yù)測其發(fā)展趨勢,其實質(zhì)上是一個模糊時間序列的集合。采用平均法、指數(shù)平滑法、季節(jié)分析法[3]存在著明顯的不足,而已有的模糊時間序列模型難以同時兼顧精度和計算的簡便性。為此,通過改進(jìn)一種模糊時間序列模型,簡化計算,降低平均預(yù)測誤差率,得到較為準(zhǔn)確的農(nóng)用拖拉機(jī)總數(shù)量預(yù)測模型,并與其他經(jīng)典模型進(jìn)行對比,旨在對我國農(nóng)用拖拉機(jī)發(fā)展提供建議。
時間序列是指某種現(xiàn)象的某一個(或多個)統(tǒng)計指標(biāo)按時間先后順序排列而形成的數(shù)據(jù)序列(如股價、國民收入、商品銷售等),但傳統(tǒng)的經(jīng)典時間序列無法處理模糊不清、不精確的現(xiàn)實問題[4]。1965年,美國自動控制專家Zadeh教授提出了模糊理論和模糊邏輯概念,并初步建立了處理帶有不確定的、模糊的語言的數(shù)學(xué)模型[5]。1994年,Song和Chissom運用Zadeh[6-8]提出的模糊集理論,建立了針對模糊時間序列的預(yù)測模型,預(yù)測每年入學(xué)學(xué)生數(shù)量,開創(chuàng)了模糊時間序列及其應(yīng)用的先河。
模糊時間序列的核心便是模糊區(qū)間的劃分和對模糊關(guān)系的處理。2006年,Li-Wei Lee提出一種改進(jìn)型時間序列,預(yù)測多因素影響的時間序列,計算精度較高,平均誤差率僅為0.26%。2007年,Tahseen Ahmed Jilan提出了一種改進(jìn)的模糊時間序列,預(yù)測道路交通事故,其平均誤差率達(dá)到2%[9-10]。之后,Shiyi、Duru等學(xué)者改進(jìn)隸屬度函數(shù)或加權(quán)處理差分論域值,提高了計算精度[11-12]。
經(jīng)典的Song模糊時間序列定義如下:對任意一個固定的Y(t)(t=0,1, 2,...),設(shè)Y(t)為實數(shù)域的子集,Y(t)上定義了一組模糊集fi(t)(i=1,2,...),且F(t)={f1(t),f2(t),...},則稱F(t)為定義在Y(t)上的的模糊時間序列。
定義A為論域,將論域A劃分為有限個有序子集,即為模糊區(qū)間,可表示為A={A1,A2,…,Ai}(i=1,2,…,n)。將論域A逐年差分,得到論域A的差分論域ΔA={ΔA1,ΔA2,...,ΔAi},差分計算方法為
ΔAi=Ai-Ai-1
(1)
計算論域A的差分論域的單位分割,并根據(jù)論域A的差分論域中的最大值,向下取整,分割論域[13]。分割方法為
V1=max(|ΔAi|)/m
(2)
Ui=i·V1(-m≤i≤m)
(3)
其中,m選取過大會造成差分論域的分割論域過大,增加計算量;m選取過小,難以將數(shù)據(jù)分離。針對選取的數(shù)據(jù),通過計算比較選取。
論域A差分的分割論域為
U={Um,,...,U0,...,U-m}
在完成A的論域、差分論域、分割論域的建立后,建立模糊數(shù)和逆模糊公式[14-15]。
其中,模糊數(shù)表示為Ti,公式為
(4)
其中,Ui的選擇根據(jù)差分論域匹配。
對應(yīng)的逆模糊數(shù)表示為Si,公式為
(5)
論域A中元素的預(yù)測計算公式為
Gi=Ai-1+Si
(6)
應(yīng)用上述預(yù)測模型,不僅可以驗證論域A中元素歷史數(shù)據(jù),還可以預(yù)測其未來數(shù)據(jù),但兩者的側(cè)重點及對模型的要求不一樣。前者需要考慮預(yù)測模型的預(yù)測誤差率,后者則是側(cè)重對預(yù)測模型中元素增長率的預(yù)測。
預(yù)測歷史數(shù)據(jù)的絕對預(yù)測誤差率表示為
(7)
由于論域A中的逐項的絕對預(yù)測誤差率均不相同,選擇最大絕對預(yù)測誤差率來刻畫預(yù)測模型的精度是不合理的,選擇平均預(yù)測誤差率AFER(Average Forecasting Error Rate)加權(quán)表示預(yù)測模型精度。AFER計算公式為
(8)
逐項增長率表示為
(9)
當(dāng)εi>0時,表示第i項相對于第i-1項,論域A中元素相對于上一項元素呈增加趨勢,增長εiGi-1;當(dāng)εi≤0時,表示第i項相對于第i-1項,論域A中元素相對于上一項元素成減小趨勢,減少-εiGi-1。
根據(jù)中華人民共和國國家統(tǒng)計局公布的數(shù)據(jù),選擇全國1997-2016年農(nóng)用大中型拖拉機(jī)總臺數(shù)、農(nóng)用小型拖拉機(jī)總臺數(shù)為樣本數(shù)據(jù)[16],并得到農(nóng)用拖拉機(jī)總臺數(shù),如表1所示。
表1 1997-2016全國農(nóng)用拖拉機(jī)總臺數(shù)Table 1 Total number of agricultural tractors nationwide 1997-2016
根據(jù)公式(1),計算得到農(nóng)用拖拉機(jī)總數(shù)量逐年差分論域,即
Δ={771902,840959,831518,262497,424814,452062,910299,996982,732345,856636,1965437,805473,754856,739490,305566,-31700,184200,126100,66395}
計算表明:當(dāng)選取m=100時,能較好地區(qū)分開差分分割論域集合。
根據(jù)公式(2),計算得出V1=1965437/100=19654.37。如果以萬臺作為單位,則V1=1.965 437,得到全國農(nóng)用拖拉機(jī)總數(shù)量的逐年差分的分割論域U。U為首項為-196.543 7、末項為196.543 7、公差為1.965 437的等差數(shù)列,則
U={-196.5437,-194.578263,…,0,…,196.5437}
在驗證歷史數(shù)據(jù)的時候,最關(guān)鍵的便是找到匹配的Ui。在計算某年全國農(nóng)用拖拉機(jī)總臺數(shù)時,應(yīng)用不同的Vi,能得到201個不同的預(yù)測值,從這個201個預(yù)測值中找出最接近該年的真實值的數(shù)據(jù)作為預(yù)報值。假如預(yù)測1999年農(nóng)用拖拉機(jī)總臺數(shù),首先計算模糊數(shù)和逆模糊數(shù),即
逆模糊數(shù)為
預(yù)測1999年農(nóng)用拖拉機(jī)總數(shù)量,即
G1999=A1998+S1999=1277.6317056
預(yù)測的絕對誤差率δ1999=0.0814%,該組數(shù)據(jù)預(yù)測精度較高。
同理,依據(jù)上述公式求出1997-2016年全國農(nóng)用拖拉機(jī)總臺數(shù)歷史數(shù)據(jù),如表2所示。
計算出平均絕對誤差率為0.037 2%,已經(jīng)非常小。
表2 應(yīng)用模型預(yù)測1997-2016年全國拖拉機(jī)總數(shù)量Table 2 Application of the model to predict the total number of tractors in China from 1997 to 2016
根據(jù)公式(4)可知:預(yù)測某年農(nóng)用拖拉機(jī)總數(shù)量時,需要兩項數(shù)據(jù),上年差分論域值ΔAi-1和分割論域值Ui。當(dāng)預(yù)測2017年農(nóng)用拖拉機(jī)總數(shù)量時,可知ΔA2016=6.6395,其關(guān)鍵問題確定分割論域U2016。當(dāng)年份沒有重大利空好消息諸(如國家政策大方向調(diào)整)時,可知U2016∈[-196.5437,196.5437],則關(guān)于2017年農(nóng)業(yè)拖拉機(jī)總數(shù)量預(yù)測函數(shù)為
根據(jù)表2可知:2014-2016年差分論域的值分別為18.420 0,12.610 0,6.639 5,與它們接近的差分論域的分割值為U9、U6、U3;將U9、三者平均值、U3用作2017年全國農(nóng)用拖拉機(jī)總數(shù)量預(yù)測的冒險預(yù)測值(RPV)、正常預(yù)測值(NPV)和保守預(yù)測值(CPV)的所用參數(shù),可得RPV=2335.1381、NPV=2329.5234、CPV=2323.6090,并計算其年均增長率。
由表3可知:對于2017年全國農(nóng)用拖拉機(jī)總數(shù)量冒險預(yù)測值為2 335.138 1萬臺,相對于2016年的年增長率為0.784 2%;正常預(yù)測值為2 329.523 4萬臺,相對于2016年的年增長率為0.539 5%;保守預(yù)測值為2 323.609 0萬臺,相對于2016年的年均增長率為0.286 6%。
當(dāng)預(yù)測第i年(i>2017)時,要考慮誤差累計效應(yīng),轉(zhuǎn)化成已知最近的年份計算,即
(10)
此時,可根據(jù)差分論域中值出現(xiàn)的次數(shù)進(jìn)行加權(quán)處理,則
表3 預(yù)測2017年全國農(nóng)用拖拉機(jī)數(shù)量及其增長率Table 3 Forecasts the number and growth rate of agricultural tractors in the whole country in 2017
本文修正模型和Song模型和Chen模型[17]進(jìn)行比較,將模糊區(qū)間劃分為8份,Song模型隸屬度函數(shù)為三角函數(shù),得出模型比較結(jié)果,如表4和圖1所示。
表4 本文模型與Song、Chen模型Table 4 Comparison with classical models
續(xù)表4
圖1 模型比較Fig.1 Comparison with Song model and Chen model
由圖1可知:本文模型預(yù)測的全國農(nóng)用拖拉機(jī)數(shù)量的預(yù)測精確度高于Chen模型,Chen模型的預(yù)測準(zhǔn)確性高于Song模型,且其預(yù)測趨勢一致。
基于模糊時間的預(yù)測模型是一種改進(jìn)模型,且與經(jīng)典Song模型和Chen模型對比,其計算過程大大簡化,平均誤差率提高了10多倍,使得預(yù)測結(jié)果更加接近真實值。預(yù)測結(jié)果表明,全國農(nóng)用拖拉機(jī)總臺數(shù)處于緩慢增長狀態(tài)。同時,應(yīng)用本文模型分別預(yù)測小型拖拉機(jī)和大中型拖拉機(jī)增長率及大中型農(nóng)用拖拉機(jī)配套農(nóng)具數(shù),大中型農(nóng)用拖拉機(jī)增長率達(dá)到6.897 3%,這與土地整治大背景下大中型農(nóng)業(yè)機(jī)械取代小微型農(nóng)業(yè)機(jī)械的趨勢一致;大中型農(nóng)用拖拉機(jī)配套農(nóng)具數(shù)其正常預(yù)測值達(dá)到7.543 1%,年均增長率高于大中型拖拉機(jī)的正常預(yù)測值6.597 3%,在一定程度上反應(yīng)了農(nóng)用大中型拖拉機(jī)的利用率在提高。在農(nóng)用拖拉機(jī)行業(yè)發(fā)展方面,國家除了宏觀政策的調(diào)控與購機(jī)補貼之外,還需協(xié)調(diào)傳統(tǒng)農(nóng)機(jī)子行業(yè)與新興子行業(yè)的發(fā)展,緩解產(chǎn)能過剩,加快產(chǎn)品結(jié)構(gòu)調(diào)整,逐步解決供需失衡問題,促進(jìn)我國拖拉機(jī)行業(yè)乃至我國農(nóng)業(yè)機(jī)械健康發(fā)展。