左 凱
(成都師范學(xué)院 數(shù)學(xué)學(xué)院,四川 成都611130)
統(tǒng)計(jì)資料表明,大量社會(huì)經(jīng)濟(jì)現(xiàn)象的發(fā)展主要是漸進(jìn)型的,其發(fā)展相對(duì)于時(shí)間具有一定的規(guī)律性[1-2].趨勢(shì)外推法是事物發(fā)展?jié)u進(jìn)過(guò)程的一種統(tǒng)計(jì)方法,主要優(yōu)點(diǎn)是可以揭示事物未來(lái)的發(fā)展,并定量地估計(jì)其功能特性,常見(jiàn)的趨勢(shì)外推統(tǒng)計(jì)模型有多項(xiàng)式曲線預(yù)測(cè)模型、指數(shù)曲線模型、對(duì)數(shù)曲線預(yù)測(cè)模型和生長(zhǎng)曲線預(yù)測(cè)模型.如果社會(huì)經(jīng)濟(jì)現(xiàn)象的發(fā)展趨勢(shì)每期基本上按照相同的增長(zhǎng)速度變化,則可采用指數(shù)曲線模型進(jìn)行擬合;如果社會(huì)經(jīng)濟(jì)現(xiàn)象的發(fā)展趨勢(shì)為初期增長(zhǎng)迅速,隨后增長(zhǎng)率逐漸減低,最終以一個(gè)常數(shù)為增長(zhǎng)極限時(shí),則可采用修正指數(shù)曲線模型進(jìn)行擬合.
楊桂元[3]根據(jù)指數(shù)曲線預(yù)測(cè)模型的特點(diǎn),對(duì)模型的假設(shè)、參數(shù)估計(jì)、擬合誤差以及無(wú)偏性等問(wèn)題進(jìn)行了討論,并與經(jīng)典的線性回歸模型進(jìn)行了比對(duì).高燕希等[4]根據(jù)現(xiàn)有指數(shù)曲線模型計(jì)算方法的應(yīng)用特點(diǎn),對(duì)其計(jì)算過(guò)程進(jìn)行了優(yōu)化,并以湖南省岳陽(yáng)市進(jìn)港道路為例,分析路面沉降的變化規(guī)律.官陳平等[5]利用2004—2010年福州市細(xì)菌性疾病的發(fā)病率建立指數(shù)曲線方程,并進(jìn)行外推5 a預(yù)測(cè),取得了較為準(zhǔn)確的計(jì)算結(jié)果.程健等[6]利用指數(shù)曲線法研究了在役儲(chǔ)罐發(fā)生不均勻沉降后的結(jié)構(gòu)疲勞安全性問(wèn)題.最近,左凱等[7]研究了具有時(shí)間一次項(xiàng)的指數(shù)曲線模型,采用分段求和的思想方法給出了模型各個(gè)參數(shù)的具體表達(dá)式,并通過(guò)一個(gè)例子詳細(xì)地給出了求解的具體步驟.2009年,吳新燕等[8]采用修正指數(shù)曲線模型對(duì)汶川地震各時(shí)刻的死亡人數(shù)進(jìn)行擬合,并與指數(shù)曲線模型進(jìn)行比較,同時(shí)又用集集地震和阪神地震的數(shù)據(jù)進(jìn)行了驗(yàn)證.計(jì)算結(jié)果表明,修正指數(shù)曲線模型能夠很好地對(duì)地震死亡人數(shù)進(jìn)行估計(jì),從而為各級(jí)抗震救災(zāi)指揮部提供救災(zāi)決策參考依據(jù).
歐陽(yáng)明等[9]在對(duì)已有的數(shù)學(xué)模型預(yù)測(cè)方法進(jìn)行分析,并將指數(shù)曲線模型按照一定的修正方法進(jìn)行優(yōu)化的基礎(chǔ)上,提出了一個(gè)新的修正指數(shù)曲線模型.通過(guò)對(duì)不同類型的單樁靜載荷試驗(yàn)數(shù)據(jù)進(jìn)行擬合,驗(yàn)證了提出的新模型能夠?qū)螛禤-S曲線進(jìn)行很好地描述.譚生源[10]在修正指數(shù)曲線模型的基礎(chǔ)上提出了具有振蕩項(xiàng)的修正指數(shù)曲線模型.針對(duì)模型本身的特點(diǎn),采用最小二乘法給出了系統(tǒng)參數(shù)滿足的最優(yōu)化問(wèn)題,并結(jié)合Matlab軟件包求解出系統(tǒng)參數(shù)的具體取值.最后,將模型應(yīng)用在一次能源消費(fèi)分析中.最近,張萍等[11]結(jié)合指數(shù)曲線模型和修正指數(shù)曲線模型的特點(diǎn),提出了具有時(shí)間冪次項(xiàng)的指數(shù)曲線模型,利用信賴域算法給出了模型參數(shù)的數(shù)值求解方法,并將其應(yīng)用在西藏自治區(qū)水資源總量的分析中.
但是,值得注意的是,文獻(xiàn)[10-11]并沒(méi)有給出模型參數(shù)的具體表達(dá)式,而是通過(guò)數(shù)值計(jì)算方法給出模型參數(shù)的計(jì)算方法.本文在經(jīng)典指數(shù)曲線模型、修正的指數(shù)曲線模型和文獻(xiàn)[7,10-11]的啟發(fā)下,提出了具有二次多項(xiàng)式項(xiàng)的新型指數(shù)曲線模型,并采用分段求和的方法給出了模型各個(gè)參數(shù)的具體表達(dá)式.最后,以我國(guó)稻谷產(chǎn)量為例,將數(shù)值計(jì)算結(jié)果與指數(shù)曲線模型、修正的指數(shù)曲線模型進(jìn)行對(duì)比.從結(jié)果上可以明顯看出,本文提出的模型具有更高的精度和準(zhǔn)確度.
1.1 指數(shù)曲線模型由文獻(xiàn)[1-2]可知,經(jīng)典的指數(shù)曲線模型為
為了估計(jì)參數(shù)a、b的表達(dá)式,一般將方程(1)兩端取對(duì)數(shù),得
從而估計(jì)出參數(shù)lna和lnb,再取反對(duì)數(shù),即可得到參數(shù)a、b的估計(jì)值.
1.2 修正指數(shù)曲線模型由文獻(xiàn)[1-2]可知,在經(jīng)典指數(shù)曲線模型的基礎(chǔ)上增加一個(gè)常數(shù)c,即得到修正指數(shù)曲線模型的表達(dá)式
其中,a、b、c為未知參數(shù),a≠0,b∈(0,1)∪(1,∞),c∈(0,∞).
參數(shù)a、b、c估計(jì)的基本思想是三和法:把整個(gè)原始序列分成相等的3個(gè)數(shù)組,每個(gè)組有m項(xiàng),根據(jù)趨勢(shì)值Y(t)的3個(gè)局部總和分別等于原數(shù)列觀察值3個(gè)局部總和來(lái)確定3個(gè)參數(shù).具體設(shè)觀察值的3個(gè)局部總和分別為得:
在經(jīng)典指數(shù)曲線模型、修正指數(shù)曲線模型上,本文提出了具有二次多項(xiàng)式項(xiàng)的指數(shù)曲線模型,其一般方程為
可以看出,當(dāng)p=0、q=0、r=0時(shí),新型指數(shù)曲線模型退化為經(jīng)典指數(shù)曲線模型;當(dāng)p=0、q=0時(shí),新型指數(shù)曲線模型退化為修正指數(shù)曲線模型.
接下來(lái),利用分段求和法的思想推導(dǎo)系統(tǒng)中參數(shù)a、b、p、q、r的具體表達(dá)式.首先,把用于建模的數(shù)據(jù)分成相等的5組,每組有m項(xiàng),根據(jù)趨勢(shì)值Y(t)的5個(gè)局部和分別等于原序列的5個(gè)局部和來(lái)確定模型的參數(shù).具體為設(shè)觀察值的5個(gè)局部和分別為S1、S2、S3、S4、S5,得到:
通過(guò)對(duì)方程(22)和(23)求解,并結(jié)合表達(dá)式(10)(15)(19)得到
至此,通過(guò)分段求和的方法得到了模型各個(gè)參數(shù)的具體表達(dá)式,一旦給定原始序列的具體取值,則可建立具體的模型并進(jìn)行擬合和預(yù)測(cè).
3.1 模型精度判斷準(zhǔn)則在具體應(yīng)用之前,給出衡量模型精確的幾個(gè)度量指標(biāo),分別是絕對(duì)百分誤差(APE)、平均絕對(duì)誤差(MAE)、平均絕對(duì)百分誤差(MAPE)和希爾統(tǒng)計(jì)量(TIC).
在(26)式中,當(dāng)l=2,v=5m,MAE為擬合誤差,記為MAEfit;當(dāng)l=5m+1,v=n,MAE為預(yù)測(cè)誤差,記為MAEfore;當(dāng)l=2,v=n,MAE為總誤差,記為MAEtotal,表達(dá)式中^Y(t)為計(jì)算得到的值,5m為用于建模的個(gè)數(shù),n為原始序列的總個(gè)數(shù).
3.2 對(duì)中國(guó)稻谷產(chǎn)量的分析使用2002—2018年共17 a的我國(guó)稻谷產(chǎn)量(萬(wàn)t)的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行研究.首先,以2002—2016年共15 a的數(shù)據(jù)進(jìn)行模型的建立,2017—2018年的數(shù)據(jù)進(jìn)行驗(yàn)證,將相應(yīng)的數(shù)據(jù)代入分別得到3種模型的具體表達(dá)式為:
1)指數(shù)曲線模型
經(jīng)典指數(shù)曲線模型、修正指數(shù)曲線模型、二次多項(xiàng)式項(xiàng)的指數(shù)曲線模型的數(shù)值計(jì)算結(jié)果見(jiàn)表1、表2.從計(jì)算結(jié)果看出,二次多項(xiàng)式項(xiàng)的指數(shù)曲線模型的值與真實(shí)的數(shù)據(jù)更接近.從平均絕對(duì)百分誤差看到:指數(shù)曲線模型的建模誤差、擬合誤差和總的誤差分別為26.887 3%、47.013 8%和29.403 1%;修正指數(shù)曲線模型的建模誤差、擬合誤差和總的誤差分別為1.154 0%、1.983 0%和1.257 6%;新型指數(shù)曲線模型的建模誤差、擬合誤差和總的誤差分別為1.115 3%、0.142 7%和0.993 7%.可以明顯看出,新提出的模型在稻谷產(chǎn)量中比經(jīng)典指數(shù)曲線模型和修正指數(shù)曲線模型有更高的精度.
表1 指數(shù)曲線模型、修正指數(shù)曲線模型和新型指數(shù)曲線模型對(duì)稻谷產(chǎn)量數(shù)據(jù)的計(jì)算結(jié)果Tab.1 Calculations of rice yields by an exponential curve model,a modifed exponential curve model and a new exponential curve model
表2 指數(shù)曲線模型、修正指數(shù)曲線模型和新型指數(shù)曲線模型對(duì)稻谷產(chǎn)量數(shù)據(jù)的計(jì)算誤差Tab.2 Calculational errors of rice yields by an exponential curve model,a modifed exponential curve model and a new exponential curve model
本文討論了帶有二次多項(xiàng)式項(xiàng)的新型指數(shù)曲線模型,并充分利用分段求和的思想給出了模型中每個(gè)參數(shù)的具體表達(dá)式.最后,以我國(guó)稻谷產(chǎn)量為例說(shuō)明了本模型在某些數(shù)據(jù)下的擬合精度和預(yù)測(cè)精度比經(jīng)典指數(shù)曲線模型、修正指數(shù)曲線模型都要高.
相比較傳統(tǒng)的最小二乘法或者是對(duì)數(shù)變換等方法,本文的分段求和方法思想簡(jiǎn)單,操作性好,且能夠得到滿意的結(jié)果.在今后的研究中,將考慮此方法在其他類似模型中的應(yīng)用.
致謝成都師范學(xué)院校級(jí)重點(diǎn)項(xiàng)目(CS19ZA12)對(duì)本文給予了資助,謹(jǐn)致謝意.