程麗娟
(嶺南師范學(xué)院數(shù)學(xué)與計(jì)算科學(xué)學(xué)院,廣東湛江524048)
基于部分函數(shù)型線性回歸模型的上證指數(shù)預(yù)測(cè)
程麗娟
(嶺南師范學(xué)院數(shù)學(xué)與計(jì)算科學(xué)學(xué)院,廣東湛江524048)
在金融數(shù)據(jù)的研究中,經(jīng)常遇到函數(shù)型數(shù)據(jù).本文主要建立部分函數(shù)型線性回歸模型,分析函數(shù)型數(shù)據(jù)在上證指數(shù)預(yù)測(cè)中的應(yīng)用,根據(jù)函數(shù)型數(shù)據(jù)分析的原理及其求解主成分分析的方法,使用Matlab對(duì)上證指數(shù)進(jìn)行預(yù)測(cè).
部分函數(shù)型線性回歸模型;函數(shù)型數(shù)據(jù);預(yù)測(cè)
本文主要建立部分函數(shù)型線性回歸模型,根據(jù)文獻(xiàn)[1]通過把L2空間的函數(shù)型數(shù)據(jù)進(jìn)行K-L展開,得到部分函數(shù)型線性模型中系數(shù)的估計(jì)量,給出其在上證指數(shù)預(yù)測(cè)中的實(shí)證分析,根據(jù)函數(shù)型數(shù)據(jù)分析的原理及其求解主成分分析的方法,使用Matlab軟件對(duì)上證指數(shù)進(jìn)行預(yù)測(cè).
對(duì)于定義在概率空間(Ω,B,P)上的實(shí)值隨機(jī)變量Y和(z,X),滿足如下的線性關(guān)系
則稱該模型為部分函數(shù)型線性回歸模型,其中:z=(z1,z2,…,zp)T為P維隨機(jī)向量,Ez=0,EzzT存在且有限;{X(t)}∈L2[0,1]為隨機(jī)過程,均值為零,
E‖X‖2=E<X(t),X(t)>=EX2(t)dt<∞;ε與z,X相互獨(dú)立,且Eε=0,Varε=σ2;θ(t)∈L2[0,1],且‖θ‖2<∞,β為p維隨機(jī)向量.
特別地,當(dāng)β=0時(shí),模型(1)為Y=<θ(t),X(t)>+ε,即為函數(shù)型線性模型,當(dāng)θ=0時(shí),模型(1)為Y=βTz+ε,即為多元線性模型.
記過程X的協(xié)方差函數(shù)KX(s,t)=Cov(X(S),X(t)),{(λj,φj)}j為協(xié)方差算子K(x)(t)=<x (s),KX(s,t)>的特征值和特征函數(shù),即滿足K(φj)=λjφj.同樣的,記KYX(·)=Cov(Y,X(·)),
KzX(·)=Cov(z,X(·))=(Kz1X(t),…,KzpX(t))T,Kz=Var(z),KzY=Cov(z,Y).
假設(shè)已觀測(cè)了n組樣本(Yi,zi,Xi(t))n
i=1,由模型(1)有
其中εi獨(dú)立同分布.從而可得KX(s,t)的樣本估計(jì)值為
根據(jù)文獻(xiàn)[2],使用函數(shù)型數(shù)據(jù)主成分分析方法,選擇前m個(gè)最大特征值對(duì)應(yīng)的主成分將X(t)進(jìn)行Karhunen一Loève正交展開,使用最小二乘方法得到估計(jì)量
其中:
建立上證指數(shù)的函數(shù)型數(shù)據(jù)預(yù)測(cè)模型,F(xiàn)=μ+Y+ε,其中μ為上證指數(shù)的日收益率的均值,Y=βTz +<θ(t),X(t)>+ε為部分函數(shù)型線性回歸模型,本文選取我國上證指數(shù)作為研究對(duì)象,其中Y為2015年4月21日至6月8日的日收益率減去其均值后的數(shù)據(jù),z~N34(0,I),{X(t)}為2015年4月21日至6月8日的5分鐘收益率減去其均值后的數(shù)據(jù).這里,z~N34(0,I),則其為隨機(jī)向量,Ez=0,EzzT存在且有限;{X(t)}∈L2[0,1]為隨機(jī)過程,均值為零,
ε與z,X相互獨(dú)立,且Eε=0,Varε=σ2;θ(t)∈L2[0,1],且‖θ‖2<∞,β為p維隨機(jī)向量.從而,該模型符合部分函數(shù)型線性回歸模型的條件,可以進(jìn)行上證指數(shù)預(yù)測(cè).
為了避免“隔夜效應(yīng)”的影響,在進(jìn)行數(shù)據(jù)分析時(shí),舍棄每天的第一個(gè)數(shù)據(jù)(即9:35時(shí)刻),把每天的5分鐘收益率數(shù)據(jù)視為其對(duì)應(yīng)函數(shù)產(chǎn)生的一組樣本觀測(cè)值,使用B樣條插值法對(duì)這些樣本觀測(cè)值進(jìn)行擬合,并進(jìn)行套準(zhǔn)和平滑處理,然后根據(jù)得到的光滑曲線求出其變化速度曲線,即一階導(dǎo)數(shù)曲線,如下圖所示.圖1表示的是收益率曲線及其平滑曲線,其中綠線表示的原數(shù)據(jù),藍(lán)線表示的是B樣條插值法得到的曲線,紅線表示對(duì)B樣條插值法得到的曲線平滑處理后得到的新曲線.圖2表示的是B樣條插值法得到曲線的一階導(dǎo)數(shù)曲線[3-6].
圖1 收益率曲線及其平滑曲線
圖2 一階導(dǎo)數(shù)曲線
得到平滑函數(shù)后,對(duì)該收益率函數(shù)進(jìn)行函數(shù)型主成分分析,得到主成分權(quán)重函數(shù),如下圖3所示.
圖3 主成分權(quán)重函數(shù)
得到主成分特征值與貢獻(xiàn)率,如下表1所示.
表1 主成分特征值與貢獻(xiàn)率
根據(jù)表1中的方差貢獻(xiàn)率,選取前四個(gè)最大特征值對(duì)應(yīng)的主成分將X(t)進(jìn)行Karhunen一Loève正交展開,使用最小二乘方法得到估計(jì)量:
將觀測(cè)到的真實(shí)值、模型估計(jì)出的預(yù)測(cè)值及由兩者得到的誤差百分比如下表2所示.
表2 真實(shí)值與預(yù)測(cè)值
由表2可以看出,除6月11日誤差百分比較大以外,絕大部分的誤差百分比都較小.因此說明建立的部分函數(shù)型線性回歸模型具有很好的準(zhǔn)確性.綜上知,建立函數(shù)型主成分預(yù)測(cè)模型對(duì)我國上證指數(shù)收益率進(jìn)行預(yù)測(cè),預(yù)測(cè)的準(zhǔn)確程度較高.
本文對(duì)部分函數(shù)型線性回歸模型在上證指數(shù)中的應(yīng)用進(jìn)行了研究,介紹了函數(shù)型數(shù)據(jù)分析的研究意義,研究了函數(shù)型數(shù)據(jù)的主成分分析方法以及如何使用部分函數(shù)型線性回歸模型對(duì)上證指數(shù)進(jìn)行預(yù)測(cè).通過對(duì)上證指數(shù)收益率進(jìn)行預(yù)測(cè)的實(shí)證分析,得到建立部分函數(shù)型線性回歸模型對(duì)我國上證指數(shù)收益率進(jìn)行預(yù)測(cè),預(yù)測(cè)的準(zhǔn)確程度較高.
[1]Shin H.Partial Functional Linear Regression[J].Journal of Statistical Planning and Inference,2009,139(10):3405-34l8.
[2]Ferraty F,GonzMez-Manteiga W,Martinez-Calvo A,et a1.Presmoothing in Functional Linear Regression[J].Statistica Sinica,2012 (22):69-94.
[3]Ramsay J O.When the data are functions[J].Psychometrika,1982(47):379-396.
[4]Ramsay J O,Hooker G.Functional Data Analysis with R and MATLAB[M].New York:Springer,2009.
[5]Mallor F,Leon T,Gaston M.Changes in power curve shapes as an indicator of fatigue during dynamic contractions[J].Journal of Biomechanics,2010(43):1627-1631.
[6]Berrendero J.R.Principal components for multivariate functional data[J].Computational Statistics and Data Analysis,2011,55(9): 2619-2634.
Prediction for the Shanghai Stock Index Based on the Partial Functional Linear Regression Model
CHENG Li-juan
(School of Mathematics and Computation Science,Lingnan Normal University,Zhanjiang,524048,China)
In the research of financial data,the functional data is often encountered.In this paper,the partial functional linear regression model is established to predict the Shanghai stock index.Based on the principal component analysis theory and calculation method,the Shanghai Composite Index is predicted by Matlab.
partial functional linear regression model;functional data;prediction
F224;F830.91
A
1672-2590(2016)03-0014-04
2016-04-05
嶺南師范學(xué)院自然科學(xué)青年項(xiàng)目(QL1407)
程麗娟(1986-),女,安徽阜陽人,嶺南師范學(xué)院數(shù)學(xué)與計(jì)算科學(xué)學(xué)院助教.