張慶春,張 黎,范曉東
(1.吉林化工學院 理學院,吉林 吉林 132022;2.鞍山師范學院 數(shù)學與信息科學學院,遼寧 鞍山 114007)
對整數(shù)值時間序列模型進行參數(shù)估計[5-7]也是統(tǒng)計學者研究的熱點問題.擬似然(Quasi Likelihood,QL)方法是由Wedderburn (1974)[8]提出的一種非參數(shù)估計方法,可以看作是最小二乘估計法的一種推廣.擬似然方法最大的優(yōu)勢在于:不需要借助分布信息,只需要在二階矩存在的條件下,就可以對參數(shù)進行類似于 “似然” 的推斷,并且擬似然估計比極大似然估計具有穩(wěn)健性.正因如此,擬似然方法一經(jīng)提出便受到廣泛關(guān)注,先后被學者們應用于包括整數(shù)值時間序列模型在內(nèi)的很多模型中.本文基于推廣的負二項稀疏算子利用預設(shè)新息過程分布法構(gòu)造一元 INAR(1) 模型并用擬似然方法估計該模型的未知參數(shù),具有一定的創(chuàng)新性和實際應用價值.
把滿足迭代方程(1)的過程稱為基于推廣的負二項稀疏算子的INAR(1)過程,記作ENBINAR(1)過程.
Xt=α*Xt-1+εt,t∈Z,
(1)
其中“*”表示推廣的負二項稀疏算子,其定義如下:
(2)
設(shè){Xt)是由(1)式定義的一個ENBINAR(1)過程,其條件矩和矩分別為:
E(Xt|Xt-1)=α(Xt-1+1)+λ,
(3)
Var(Xt|Xt-1)=(1+α)α(Xt-1+1)+Vλ,
(4)
(5)
(6)
設(shè)θ=(α(1+α),Vλ)T,模型的未知參數(shù)是β=(α,λ)T,記(4)式的一步條件方差為Wθ=(1+α)α(Xt-1+1)+Vλ.根據(jù)擬似然方法(Wedderbrun,1974)可以建立下面的標準估計方程:
(7)
首先設(shè)θ值已知,若θ值未知則利用其他方法估計出θ的值,帶入上面的方程組得到修正的擬似然估計方程組,若該方程組的解存在則可以解得未知數(shù)β的擬似然估計值為:
(8)
利用條件最小二乘估計法可以得到未知參數(shù)β的估計值為:
(9)
先給出模型的條件概率密度如下:
(10)
(11)
表1 Geo-ENBINAR(1)模型的CLS、MQL和MLE估計結(jié)果
從表1可以看出,隨著樣本量的增大,3種估計法的經(jīng)驗誤差和標準誤差都在減小,說明3種估計量都具有一致性,都可以得到可靠的估計結(jié)果;MQL估計的經(jīng)驗誤差和標準誤差比最小二乘估計的小,但沒有極大似然估計法的經(jīng)驗誤差和標準誤差小,說明在非參數(shù)估計中,擬似然估計優(yōu)于最小二乘估計,但稍遜于極大似然估計.
為闡明模型的應用,我們選用匹斯堡警察署所統(tǒng)計的每月毒品犯罪案件數(shù)量的數(shù)據(jù)集,時間為1990年1月至2011年12月,共計264個月度觀測值.下面判斷該序列的平穩(wěn)性并建立模型.利用R軟件畫出該序列的時序圖,ACF圖和PACF,見圖1.
從圖1中的時序圖可以看到該序列大致是平穩(wěn)的,并且從ACF圖和PACF圖可以看出,ACF呈拖尾狀,PACF為一階截尾,一階偏自相關(guān)系數(shù)為0.45.初步判斷模型為INAR(1)類型.
number(a)時序圖
下面考慮新息過程分別為泊松分布和幾何分布的ENBINAR(1)模型,分別記為P-ENBINAR(1)模型和Geo-ENBINAR(1)模型,并與基于二項稀疏算子,新息過程分別為泊松分布和幾何分布的兩個BINAR(1)模型,分別記為P-BINAR(1)模型和Geo-BINAR(1)模型,相比較得出最優(yōu)模型.利用MQL和MLE兩種方法來對4種模型中的參數(shù)進行估計,結(jié)果見表2.
表2 毒品犯罪數(shù)據(jù)的模型及估計結(jié)果
通過對比,4個模型中AIC值最小的是Geo-ENBINAR(1)模型,即基于推廣的負二項稀疏算子的幾何新息過程的INAR(1)模型是更適合該毒品犯罪數(shù)據(jù)的模型.
基于推廣的負二項稀疏算子建立整數(shù)值一階自回歸(INAR(1))模型,推導出了模型概率性質(zhì),對模型的未知參數(shù)進行擬似然推斷,得到了未知參數(shù)的修正的擬似然估計量,同時也針對模型中的未知參數(shù)給出了最小二乘和極大似然估計方法,通過數(shù)值模擬對模型的估計方法的有效性進行了評估.模擬結(jié)果表明,隨著樣本量的增大,3種估計法的估計誤差都在減小,說明3種估計量都可靠,修正的擬似然估計的誤差比最小二乘估計的小,但沒有極大似然估計法的誤差小,說明在非參數(shù)估計中,擬似然估計具有很大優(yōu)勢,但稍微劣于參數(shù)估計法的極大似然估計.通過給出實際數(shù)據(jù)展示了模型的實用性,通過對比4個模型的AIC值,得出更適合數(shù)據(jù)的模型是基于推廣的負二項稀疏算子的幾何新息過程的INAR(1)模型.