亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Yule-Walker估計法的敏感性分析及其穩(wěn)健改進

        2019-06-29 03:18:08王志堅王斌會
        統(tǒng)計與信息論壇 2019年6期
        關鍵詞:污染方法模型

        王志堅,王斌會

        (1.廣東財經(jīng)大學 a.統(tǒng)計與數(shù)學學院;b.大數(shù)據(jù)與教育統(tǒng)計應用實驗室,廣東 廣州 510320; 2.暨南大學 管理學院,廣東 廣州 510632)

        一、引言

        受隨機因素的影響,金融時間序列中通常會含有異常值(outliers),也稱為離群值。如:突發(fā)的金融危機、人為的觀測差錯等。從現(xiàn)有文獻來看,時間序列離群值分類較多,但考慮到影響水平與處理效果,可加型異常值(簡稱AO)和新息型異常值(簡稱IO)仍是最為主流的離群值研究對象。Box等曾指出,在建立時間序列模型時,離群值會影響模型識別及統(tǒng)計推斷,導致基于該模型的預測和控制均有誤。故有必要建立一種穩(wěn)健的時間序列模型。為此,許多學者對其進行了研究。

        關于如何建立一個穩(wěn)健的時間序列模型,目前學術界主要有以下兩種思路:一是離群值診斷方法,二是穩(wěn)健統(tǒng)計方法。前者基本原理是先對離群值進行檢測并剔除之,而后再采用經(jīng)典估計方法建立模型。主要有:Karioti和Caroni采用似然比以及設定臨界值方法來診斷AO型異常點[1]。Chareka等建立基于Gumbel分布統(tǒng)計量檢驗AO[2]。Louni通過擴展Abraham和Yatawara的AO及IO型離群值檢測法,采用修正次序檢測法對ARMA模型離群值進行檢測,效果要優(yōu)于改進前,特別是對IO型離群值[3]。Nare等用Gumbel分布作為極限分布來檢測和校正離群值[4]。王志堅和王斌會將Chen等提出的AO型異常點檢測統(tǒng)計量進行穩(wěn)健改進,改進后檢測效力顯著提高,其主要方法就是用絕對離差均值替代標準差[5]。

        穩(wěn)健統(tǒng)計方法,即當數(shù)據(jù)中含有離群值時,基于該方法得到的時序模型參數(shù)估計值幾乎不受影響或變化輕微。學者們常用的穩(wěn)健回歸參數(shù)估計方法主要有:M估計、GM估計、S估計、RA估計與MM估計等[6-11],以及基于輔助AR模型的間接推斷法、穩(wěn)健濾波法等[12-13]。王志堅基于FQn統(tǒng)計量對傳統(tǒng)自相關函數(shù)進行改進,構建出自回歸AR模型的穩(wěn)健估計算法,以克服離群值的影響[14]。袁海靜研究了計數(shù)時間序列模型的穩(wěn)健估計問題[15]。

        對于時間序列AR模型的穩(wěn)健估計法目前最為流行的是Huber提出的基于成對協(xié)方差的穩(wěn)健自相關函數(shù)法,下文將該方法簡稱為Huber穩(wěn)健法。本文首先分析了AR模型Yule-Walker估計法(以下簡稱Y-W估計法,全文適用)的不穩(wěn)健性。其次基于均值和方差的穩(wěn)健估計量組合構建了穩(wěn)健自相關函數(shù),從而得出時序AR模型的穩(wěn)健Y-W估計法。最后將本文提出的基于穩(wěn)健Y-W穩(wěn)健估計法與Huber提出的穩(wěn)健估計法以及AR模型四種經(jīng)典參數(shù)估計方法:最小二乘、最大熵譜法、極大似然和Y-W估計法進行模擬和金融數(shù)據(jù)實證對比,發(fā)現(xiàn)當對含有異常值的時間序列建立AR模型時,本文提出的穩(wěn)健估計方法得出的結果要顯著優(yōu)于傳統(tǒng)估計法。全文用R語言進行統(tǒng)計分析。

        二 、AR模型的Yule-Walker估計法及其敏感性分析

        Y-W估計法(也稱為矩估計法)是時間序列AR模型常用的參數(shù)估計方法之一,關于Y-W估計法的敏感性問題,文獻[14]已有部分相關闡述??紤]到后面研究的需要,將其原理梳理一遍。考慮如下零均值AR(p)模型:

        xt=φ1xt-1+φ2xt-2+…+φpxt-p+et

        (1)

        其中,φ1,φ2,…,φp為待估參數(shù),為估計之,在式(1)兩邊同乘xt-j,j>0,得式(2):

        xtxt-j=φ1xt-1xt-j+φ2xt-2xt-j+…+

        φpxt-pxt-j+etxt-j

        (2)

        對式(2)兩邊取期望,得

        Extxt-j=φ1Ext-1xt-j+φ2Ext-2xt-j+…+

        φpExt-pxt-j+Eetxt-j

        (3)

        γj=φ1γj-1+φ2γj-2+…+φpγj-p

        (4)

        ρj=φ1ρj-1+φ2ρj-2+…+φpρj-p

        (5)

        (6)

        (7)

        通常,對于弱平穩(wěn)時序xt與xt-k,其自相關系數(shù)可記為:

        因為xt為弱平穩(wěn),所以上式有Var(xt)=Var(xt-k),根據(jù)定義有ρ0=1,ρt=ρ-t。而集合{ρk}稱為xt的自相關函數(shù)。 Y-W估計法的最主要部分是樣本自協(xié)方差函數(shù),即下面的式(8) :

        γk=Cov(xt,xt-k)

        =E[(xt-Ext)(xt-k-Ext-k)]

        (8)

        R語言包中自帶的時間序列數(shù)據(jù)集data(lh),共有48個觀測值。在該觀測值中隨機抽取一個數(shù),再用30去替代之,將30作為數(shù)據(jù)集data(lh)的離群值,同時分別對被污染前后的數(shù)據(jù)集data(lh) 計算其自相關函數(shù)值,相應的R代碼與序列圖如圖1所示:

        lh1=replace(lh,25,30) #在原始數(shù)據(jù)集lh上構造一個離群值30

        plot(lh1,type="p",ylim=c(0,31)) #含離群值的序列圖(圖1左)

        text(25,28,expression(離群值),adj=0)

        par(mfrow=c(1,2)) #含離群值和不含離群值自相關函數(shù)圖(圖1中、右)

        acf(lh)

        acf(lh1)

        圖1 含離群值時序圖(左)與被污染前后的自相關函數(shù)圖(中、右)

        由圖1可以看出,被污染前數(shù)據(jù)集data(lh)自相關函數(shù)圖(中)與被污染后數(shù)據(jù)集data(lh)自相關函數(shù)圖(右)相差較大,說明自相關函數(shù)對離群值很敏感,是不穩(wěn)健的。另外,在模型識別中,通常根據(jù)ACF圖來確定模型移動平均階數(shù),而從圖1可以得出,由于一個離群值的存在,移動平均階數(shù)已由原來的ma=1變?yōu)閙a=0階。即離群值會改變樣本自相關函數(shù)值,同時對模型識別也有較大的影響。

        三、Yule-Walker估計法的穩(wěn)健改進及其模擬比較

        (一)Yule-Walker估計法的穩(wěn)健改進

        (9)

        顯然,式(9)中的均值Ext、Ext-k以及方差Var(xt)、Var(xt-k)都是不穩(wěn)健的,它們對尾部數(shù)據(jù)和異常值非常敏感。因此,要構建穩(wěn)健的自相關函數(shù)ρk,關鍵是要構建均值Ext、Ext-k以及方差Var(xt)、Var(xt-k)的穩(wěn)健估計量。

        均值常用的穩(wěn)健估計量包括:

        (1)切尾均值(TM)。假設x(1)≤x(2)≤…≤x(N)是樣本順序統(tǒng)計量,切尾均值TN(δ,1-γ)的定義為:

        δ,γ∈(0,0.5),LN=floor[Nδ],UN=floor[Nγ]

        (3)中位數(shù)(Med)。中位數(shù)Med(X)是樣本順序統(tǒng)計量中心位置的值:

        方差常用的穩(wěn)健估計量有:

        (1)縮尾標準差(WSD),表達式為:

        縮尾標準差指的是縮尾數(shù)據(jù)的標準差。

        (2)絕對離差均值(MeanAD),表達式為:

        顯然,其穩(wěn)健性體現(xiàn)在表達式中的中位數(shù)MED上。

        (3)絕對離差中位數(shù)(MAD),表達式為:

        MAD=MED|X-MED(X)|

        顯然,其穩(wěn)健性體現(xiàn)在表達式中的雙重中位數(shù)MED上。

        (4)四分位數(shù)間距(IQR),表達式下:

        IQR=Q(0.75)-Q(0.25)

        其中,Q(0.75)和Q(0.25)分別是數(shù)據(jù)由小到大排序后的第三和第一分位數(shù)。其穩(wěn)健性體現(xiàn)在數(shù)據(jù)排序后異常點被排在序列的兩端,當異常點比例未達到總數(shù)據(jù)的25%時,異常點對IQR沒有干擾。

        基于以上3個均值穩(wěn)健估計量、4個方差穩(wěn)健估計量,本文經(jīng)反復試驗比較均值和方差穩(wěn)健估計量的組合,發(fā)現(xiàn)當選取中位數(shù)(Med)為均值的穩(wěn)健估計量,絕對離差中位數(shù)(MAD)為方差的穩(wěn)健估計量時,自相關函數(shù)ρk的穩(wěn)健估計效果最優(yōu),因此經(jīng)典的樣本自相關函數(shù):

        (10)

        (11)

        (12)

        (二)模擬研究

        下面用R語言模擬一個如下AR(2)序列:xt=5xt-1+2xt-2+et其中,φ1=5,φ2=2。殘差et服從一個被均勻分布Uuiform(-16,16)污染的正態(tài)分布即:

        et~(1-ε)N(xt;0,1)+εUniform(xt;-16,16)

        ε為污染率,分別取如下不同的污染度:0,0.01,0.05和0.1,即從無污染、輕污染到重污染來探討。樣本量取100,500和1 000,即覆蓋小樣本、中樣本到大樣本來考慮,目的是綜合來看穩(wěn)健Y-W估計法對參數(shù)穩(wěn)健估計效果。

        表1 不同污染率以及不同樣本量下各估計法對AR(2)模型估計結果對比表

        從表1可以看出,在樣本數(shù)據(jù)無污染情況下,即污染率為0%時,樣本量不同時,穩(wěn)健Y-W估計法、Huber穩(wěn)健法與AR模型的經(jīng)典估計法對參數(shù)估計結果差別不大,均接近真值,說明穩(wěn)健Y-W估計法具有可行性。當污染率為1%時,穩(wěn)健Y-W估計法與Huber穩(wěn)健法在不同的樣本量下均比較接近真值,而其他四種估計法估計結果較接近,但偏離真值較大。值得一提的是,相比于中樣本和大樣本,小樣本偏離更厲害。當污染率為5%時,穩(wěn)健Y-W估計法與Huber穩(wěn)健法雖在不同的樣本量下相差不大,但穩(wěn)健Y-W估計法比Huber穩(wěn)健法更接近真值,而其他四種估計法基本一致,但與真值相差較大;當污染率為10%時,穩(wěn)健Y-W估計法與真值有少許偏離,Huber穩(wěn)健法偏離較大,而其他四種估計法已偏離的面目全非,而且樣本量越大,偏離越厲害。因此,穩(wěn)健Y-W估計法在大樣本、重污染率下優(yōu)勢更明顯。因此,從模擬結果看穩(wěn)健Y-W估計法很好的驗證了穩(wěn)健估計的三個目標:第一,穩(wěn)健估計在假定分布模型下得到的結果是最優(yōu)的;第二,當假定分布與實際分布模型偏離較小時,離群值對模型的參數(shù)估計值影響是很小的;第三,當假定與實際分布模型偏離較大時,離群值不會對參數(shù)估計值產(chǎn)生致命影響。

        四、實證檢驗

        為檢驗本文提出的穩(wěn)健矩估計法的有效性,下面選取上海證券交易所的一只股票-貴州茅臺(簡稱GZMT)公司股票收盤價及收益率數(shù)據(jù)作為研究對象,研究區(qū)間為2015年2月4日至2018年11月30日,共933個樣本數(shù)據(jù),數(shù)據(jù)通過采用R軟件從雅虎財經(jīng)網(wǎng)站獲取。先通過可視化方法對樣本數(shù)據(jù)進行探索性數(shù)據(jù)分析,以期對收益率有大概了解,可視化結果如圖2所示。

        從圖2的第一個收盤價圖可以看出,2018年之前收盤價一直呈上升趨勢,從2018年開始震蕩并伴隨有局部下降趨勢。另外,從收益率圖可以看出,收益率存在較多離群值,從收益率QQ圖及直方圖來看,兩者均已明顯偏離正態(tài)分布??梢酝茰y,由于離群值的存在使得收益率偏離正態(tài)分布。同時,Shapiro-Wilk正態(tài)性檢驗結果顯示,檢驗統(tǒng)計量值為0.954,p值接近0,拒絕收益率為正態(tài)性的原假設。因此,前面的探索性數(shù)據(jù)分析結論得到驗證:收益率偏離正態(tài)分布是由于序列中含有離群值導致。

        下面我們用文獻[5]的時間序列異常值穩(wěn)健檢測方法對貴州茅臺收益率進行異常值檢測,共檢測到16個異常值,其中IO型異常值7個,AO型9個,結果見表2。

        表2 貴州茅臺公司股票收益率異常值檢測結果表

        從檢測結果來看,異常值在總樣本數(shù)據(jù)中所占的比重較小,僅為1.71%,但它確實客觀存在,由前文分析可知,實際上單個較大的異常值就能將模型識別或參數(shù)估計變得面目全非,故對于含有異常值較小比重的時間序列采用穩(wěn)健建模方法也是很有必要。在建模之前需要對收益率序列進行平穩(wěn)性檢驗,用ADF單位根檢驗,檢驗結果見表3。

        表3的檢驗結果非常顯著,表明收益率序列是平穩(wěn)的,可以用來建模。為防止模型識別錯誤,用穩(wěn)健的識別法對模型進行識別,得出序列可擬合AR(2)模型。

        表3 貴州茅臺股票的日對數(shù)收益率ADF檢驗結果

        對模型識別后分別用本文提出的穩(wěn)健Y-W估計法與AR模型常用的四個估計方法對AR(2)模型進行參數(shù)估計,估計結果如表4所示:

        從表4可以看出,對參數(shù)φ1與φ2的估計,四種經(jīng)典估計方法很接近,但與穩(wěn)健Y-W估計法相差較大,而Huber穩(wěn)健法則介于四種經(jīng)典估計方法與穩(wěn)健Y-W估計法之間。該結果僅僅說明了穩(wěn)健估計與非穩(wěn)健估計之間的差別。而至于哪種方法更優(yōu),還有待于進一步論證。

        表4 穩(wěn)健Y-W估計法與傳統(tǒng)估計法對AR(2)模型估計結果對比表

        接下來,我們將前面檢測出的16個異常點剔除,考慮在無異常點情形下對比各估計法的估計效果。先對剩下的樣本數(shù)據(jù)的收盤價及收益率數(shù)據(jù)做探索性數(shù)據(jù)分析圖,如圖3所示。

        從圖3可以看出,在刪除被檢測到的離群值后,收益率圖與QQ圖比刪除前要整齊很多。而QQ圖及直方圖均說明刪除離群值后的貴州茅臺收益率序列比刪除前更接近于正態(tài)分布。接下來,對刪除離群值后的貴州茅臺收益率序列同樣采用本文提出的穩(wěn)健估計法與Huber穩(wěn)健法以及四種經(jīng)典的估計方法進行參數(shù)估計,結果如下表5。

        表5 刪除離群值后穩(wěn)健Y-W估計法與傳統(tǒng)估計法對AR(2)模型估計結果對比表

        從表5可以看出:對φ1,φ2的估計結果,四種經(jīng)典估計法對與兩種穩(wěn)健估計法很接近。通過對比表4和表5的結果,可以看出刪除離群值前后,四種經(jīng)典估計法改變很大,Huber穩(wěn)健法改變較大,而穩(wěn)健Y-W估計法改變輕微。

        以上結果也正好說明以下兩點:一是當數(shù)據(jù)中不存在離群值時,本文提出的穩(wěn)健估計方法與經(jīng)典的估計方法對參數(shù)的估計結果幾乎沒什么差別;二是當數(shù)據(jù)中存在離群值時,穩(wěn)健估計結果與真值非常接近,表現(xiàn)出一定的耐抗性,而傳統(tǒng)的估計方法已變得面目全非。同時,說明經(jīng)典估計方法對異常值敏感,而穩(wěn)健估計克服了常規(guī)估計法的弱點,對異常值表現(xiàn)出了一定的耐抗性,因而估計結果是穩(wěn)健的、可靠的。

        五、結語

        由以上模擬和實證分析結果可以看出,當金融時間序列中存在離群值時,用傳統(tǒng)的參數(shù)估計方法建模、分析得出的結果往往與實際情況不符,甚至單個或多個離群值就有可能徹底改變我們對金融現(xiàn)象的判斷。然而,金融時序中的離群值又通常隱含了重要的投資信息,故不能直接將其剔除。因此,在建模過程中為了使模型能夠符合大多數(shù)數(shù)據(jù)表現(xiàn)出來的規(guī)律性,有必要構造一種穩(wěn)健的參數(shù)估計量來克服離群值的影響。這即是本文研究的出發(fā)點。

        文中首先從理論上分析了時間序列AR模型矩估計法(Yule-Walker法)的不穩(wěn)健性。其次,構建了基于穩(wěn)健均值與穩(wěn)健方差的穩(wěn)健自相關函數(shù),得到了AR模型的穩(wěn)健參數(shù)估計算法來克服離群值的影響。第三,將本文提出的穩(wěn)健Yule-Walker估計法與Huber穩(wěn)健法以及AR模型常用四種參數(shù)估計法:最小二乘、最大熵譜法、極大似然以及傳統(tǒng)Yule-Walker法在三種污染率、三種樣本量下進行模擬:發(fā)現(xiàn)在無離群值時,穩(wěn)健Yule-Walker估計法、Huber穩(wěn)健法與其他四種方法得到的結果基本保持一致;在有離群值時,其他四種方法得出的結果均出現(xiàn)很大變化,Huber穩(wěn)健法變化較大而本文提出的穩(wěn)健Yule-Walker估計法基本不變;特別注意到,在高污染率、大樣本情形下,其他四種方法結果已變得面目全非時,穩(wěn)健Yule-Walker結果只是變化輕微。

        最后,選取貴州茅臺股票從2015年2月4日至2018年11月30日的日對數(shù)收益率作為研究對象進行實證檢驗,檢驗結果與模擬結果基本一致,而本文提出的穩(wěn)健Yule-Walker估計法能抵抗異常值干擾,是穩(wěn)健的,可以運用于金融數(shù)據(jù)分析。

        猜你喜歡
        污染方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        堅決打好污染防治攻堅戰(zhàn)
        當代陜西(2019年7期)2019-04-25 00:22:18
        堅決打好污染防治攻堅戰(zhàn)
        可能是方法不對
        3D打印中的模型分割與打包
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        捕魚
        亚洲欧美在线观看| 日本视频一区二区三区观看| 国产在线播放一区二区不卡| 久久久无码精品亚洲日韩按摩| 国产精品亚洲五月天高清| 久九九久视频精品网站| 免费看av网站在线亚洲| 成年性生交大片免费看| 国产95在线 | 欧美| 国产欧美日本亚洲精品一4区| 国产精品又爽又粗又猛又黄 | 精品亚洲国产成人av色哟哟| 九九热线有精品视频86| 久久AV中文一区二区三区| 久久久国产视频久久久| 极品一区二区在线视频观看| 亚洲人成人网站在线观看| 91亚洲国产成人aⅴ毛片大全 | 丝袜美腿一区在线观看| 亚州国产av一区二区三区伊在| 国产人妻无码一区二区三区免费| 国产精品女同久久免费观看| 白白色发布在线观看视频| 国产激情综合在线观看| 精品三级久久久久久久电影| 青青草免费在线手机视频| 精品国产一区二区三区三| 怡红院a∨人人爰人人爽| 91精品国产91| 偷拍视频这里只有精品| 欧美成人精品a∨在线观看| 亚洲熟女少妇一区二区| 白白色发布永久免费观看视频| 日韩精品人妻系列中文字幕| 久久久精品国产sm调教网站 | 少妇放荡的呻吟干柴烈火动漫| 在线观看亚洲你懂得| 免费人妖一区二区三区| 亚洲熟妇少妇任你躁在线观看无码| 色综合久久丁香婷婷| 日韩中文字幕一区在线|