周若其,李俊林,董安強(qiáng)
(太原科技大學(xué) 應(yīng)用科技學(xué)院,太原030024)
1965年美國芝加哥大學(xué)著名教授尤金·法瑪(Eugene Fama)在《商業(yè)學(xué)刊》發(fā)表論文《股票市場價格行為》,1970年對該理論進(jìn)行深化并提出有效市場假說(efficient markets hypothesis),并因此獲得2013年諾貝爾經(jīng)濟(jì)學(xué)獎。
有效市場假說理論認(rèn)為,在一個充滿信息交流和信息競爭的社會里,一個特定的信息能夠在股票市場上迅即被投資者知曉。資產(chǎn)價格反映了一種資產(chǎn)價值的所有公開的、可獲得的信息。根據(jù)這一理論,股票市場表現(xiàn)出信息有效,即以理性方式反映所有可獲得的信息的有關(guān)資產(chǎn)價格的描述。當(dāng)信息改變時,股票價格就會變動。但是,在任何一個時點上,市場價格是以可獲得信息為依據(jù)的公司價值的最好估算[1]。
對于有效市場假說理論,美國賓夕法尼亞大學(xué)沃頓商學(xué)院金融學(xué)教授、經(jīng)濟(jì)學(xué)家Jeremy Siegel認(rèn)為,這個假說并不認(rèn)為市場價格總是正確的。相反,它意味著市場上的價格經(jīng)常是錯誤的,但在某一既定時點上,根本不能輕易地判斷這些價格是太高還是太低[1]。
這表明有效市場假說的缺陷。國內(nèi)學(xué)者[2]認(rèn)為,除了地震、戰(zhàn)爭等突發(fā)事件外,絕大多數(shù)新的信息形成都需要一段時間,新的信息整合到股價中需要一個過程。資金是證券市場的唯一驅(qū)動力,新的股價不是一蹴而就的,它是由連續(xù)不斷的資金買入推高或資金賣出壓低。新的信息被整合到股價中的過程就是資金的流動過程。目前反映國內(nèi)外股票市場波動的指數(shù)全部都是“價格”類的,稱為股票價格指數(shù),簡稱股價指數(shù)。它們是以個股的股價為變量,應(yīng)用綜合指數(shù)計算公式而計算得出一個數(shù)字。然而,由于證券市場的驅(qū)動力是資金,反映股票市場波動和趨勢的應(yīng)該是以資金為變量的“資金”類指數(shù)。李俊林提出的股票資金流強(qiáng)度(strength of stock fund flows)指數(shù)就是一種“資金”類指數(shù)。它是為了能夠更全面地洞察股票市場的運行特征和市場信息而提出的一種同時考慮股票價格與成交量的綜合性指標(biāo)[2-3]。
文獻(xiàn)[3]中的股票資金流強(qiáng)度的模型為:
股票資金流強(qiáng)度=
其數(shù)學(xué)表達(dá)式為:
(1)
其中:Sj為第j天股票資金流強(qiáng)度;Pj(i)為第j天的第i次成交價;Qj(i)為第j天的第i次成交量;L為流通量,指股票的流通總股,是確定的常數(shù);φ為參考價,是人為選擇的常數(shù),一經(jīng)確定便固定不變;n為時間T內(nèi)成交總次數(shù)。
文獻(xiàn)[3]中有詳細(xì)的介紹與說明。文獻(xiàn)[4]-[7]在基于上述模型得到的股票資金流強(qiáng)度基礎(chǔ)上對其進(jìn)行一系列的統(tǒng)計分析,包括驗證其有效性,研究與股票收益率等常用指標(biāo)的相關(guān)性,及其自身的波動性等等。
但是該模型亦有自身缺陷。首先,計算結(jié)果的精度不夠,導(dǎo)致計算結(jié)果大量為0;其次,無法處理高頻數(shù)據(jù)。盡管文獻(xiàn)[8]對模型進(jìn)行一定的優(yōu)化,但依然無法克服這些問題。
本文致力于解決這些問題。
針對上述所提的問題,對模型進(jìn)行如下優(yōu)化。
式(1)中Pj(i),Qj(i)是離散函數(shù),連續(xù)化后記為Pj(t),Qj(t)。Pj(t)和Qj(t)分別為連續(xù)的價格函數(shù)與成交量函數(shù)。
記:
將式(1)積分化,即為:
(2)
計算式(2)得:
(3)
只需計算積分:
(4)
(5)
即可。
同時需要指出式(3)是協(xié)變量為函數(shù),響應(yīng)變量為標(biāo)量的函數(shù)型線性回歸模型。
函數(shù)型數(shù)據(jù)分析的首要工作是將得到的離散數(shù)據(jù)轉(zhuǎn)化為函數(shù)[9]?;窘鉀Q方法是基函數(shù)擬合。
基函數(shù)擬合是將采樣得到的有限多個離散的數(shù)據(jù)值轉(zhuǎn)化成函數(shù)。對比于傳統(tǒng)的擬合方法,基函數(shù)擬合往往可以更好地擬合數(shù)據(jù)分布復(fù)雜的曲線圖形。
函數(shù)型數(shù)據(jù)分析的數(shù)學(xué)前提是無窮維函數(shù)空間,且是Hilbert空間。它將離散的數(shù)據(jù)轉(zhuǎn)化為函數(shù),該函數(shù)是函數(shù)空間中的一個元素,可以用空間的基進(jìn)行線性表示。
設(shè)無窮維函數(shù)空間的基為:{φk(t),k=1,2,…},則對于任意屬于該空間的函數(shù)可表示為:
f(t)=c1φ1(t)+c2φ2(t)+…+ckφk(t)+…
注意到無窮維函數(shù)空間是Hilbert空間,即完備的內(nèi)積空間,故有[10]:
?k∈N+, s.t.
f(t)=c1φ1(t)+c2φ2(t)+…+ckφk(t)
基函數(shù)擬合是通過求解系數(shù){ck(t),k=1,2,…},進(jìn)而得到f(t)的表達(dá)式。
常用系數(shù)計算方法是最小二乘法。
其中{ck,k=1,2,…,K,K∈N+}為基所對應(yīng)的系數(shù)。
最小二乘法計算ck:
即:
解得:
Cp=(Φ′Φ)-1ΦP
同理:
Cq=(Φ′Φ)-1ΦQ
進(jìn)而式(4),式(5)為:
其次,需要考慮所選的基函數(shù),即上述中的φk(t).常用的基函數(shù)系統(tǒng)有:多項式基函數(shù)(Polynomial basis function),傅里葉基函數(shù)(Fourier basis function)和B-樣條基函數(shù)(B-Spline basis function).
最后,需要考慮選取的基函數(shù)個數(shù),即上述中的K。一般選取的原則有模型選擇(model selection)和交叉驗證(Cross-Validation).
本文有不同的觀點。本文選取基函數(shù)個數(shù)的原則:單個函數(shù)的數(shù)據(jù)個數(shù)等于基函數(shù)個數(shù)。
例如,五分鐘均衡價格數(shù)據(jù),一天有48個數(shù)據(jù),則選取48個基函數(shù)。
對比來看:
設(shè)有限維歐氏空間F和無窮維Hilbert空間E.且有x∈F,f(t)∈E.
F的基為:{ek,k=1,2,…,n}
E的基為:{φk(t),k=1,2,…,n,…}
對于F而言:
dim(F)=1時:
x=(x1)=〈x·e1〉·e1.
dim(F)=2時:
x=(x1,x2)=〈x·e1〉·e1+〈x·e2〉·e2.
dim(F)=n時:
x=(x1,x2,…,xn)=〈x·e1〉·e1+〈x·e2〉·e2+…+〈x·en〉·en.
對于E而言:
f(t)=〈f(t)·φ1(t)〉·φ1(t)+〈f(t)·
φ2(t)〉φ2(t)+…+〈f(t)·φk(t)〉φk(t)+…
〈·〉是內(nèi)積運算,指元素在基上的投影。
當(dāng)dim(F)每多一個數(shù)據(jù)時,便多一個基。對于無窮維函數(shù)空間E而言,函數(shù)的數(shù)據(jù)意味著函數(shù)在基上的投影。最小二乘法逼近問題本質(zhì)上是用空間E中一個有限維子空間逼近空間E中無窮維的函數(shù),理論上,子空間維數(shù)越高越接近原函數(shù)。如果采集到的單個函數(shù)數(shù)據(jù)個數(shù)為n,則意味著函數(shù)在空間E中的n個基上有投影,進(jìn)而可以用這n個基構(gòu)成的子空間逼近空間E中無窮維的函數(shù)。
另一方面,以此為準(zhǔn)的擬合結(jié)果顯示,數(shù)據(jù)會全部落到函數(shù)中。本文并不認(rèn)為這是包含干擾信息或者是過擬合現(xiàn)象,而這恰恰是和有效市場假說形成相互印證,即資產(chǎn)的價格(成交量)表達(dá)了市場的全部信息。
介紹兩種計算方法。
直接計算:
得到價格函數(shù)和成交量函數(shù)的估計表達(dá)式后直接利用式(3)計算。
基函數(shù)展開:
則式(3)為:
(6)
(7)
首先闡明一個觀點。函數(shù)型線性回歸模型最為直接的應(yīng)用是預(yù)測。在回歸中的問題是系數(shù)函數(shù)的估計。利用部分?jǐn)?shù)據(jù)估計出系數(shù)函數(shù),即可得到回歸模型。預(yù)測是指在得到回歸模型中,將剩余數(shù)據(jù)作為協(xié)變量帶入回歸模型中得出響應(yīng)變量[12]。按照此過程,本文的估計可以理解為預(yù)測。不同的是,式(3)所代表的函數(shù)型線性回歸模型中的系數(shù)函數(shù)是有具體現(xiàn)實意義的,是人為規(guī)定的。
對于基函數(shù)展開法的計算,若為非正交基,則用式(6)計算;若為正交基,則用式(7)計算。實際上,正交基的運算效率要高于非正交基的運算效率,為此可通過Karhunen-Loève展開即主成分分析得到新的正交基,即主成分基。
Karhunen-Loève展開:
以Pj(t)為例。
即有:
Pj(t)=μp(t)+
令Xj(t)=Pj(t)-μp(t),則有:
故有Pj(t)和Qj(t):
(3)式變?yōu)椋?/p>
(8)
取前K個主成分時:
(9)
關(guān)于K的選擇采取累計貢獻(xiàn)率的方法.
易知,通過函數(shù)型主成分分析,得到的主成分基{fi(t),i=1,2,…,K,K∈N+}是正交基。進(jìn)而股票資金流強(qiáng)度可以利用式(9)估計。
股票名稱:貴州茅臺。
股票代碼:600519.
時間范圍:2018年7月2日至2018年9月28日,共64天。
數(shù)據(jù)結(jié)構(gòu):五分鐘均衡數(shù)據(jù),包括股價數(shù)據(jù)和成交量數(shù)據(jù)。
基函數(shù)選擇:傅里葉基函數(shù)。
累計貢獻(xiàn)率:95%
數(shù)學(xué)軟件:MATLAB.
由于數(shù)據(jù)雜多,僅展示9月份的計算結(jié)果,如表1所示。
表1 600519股票資金流強(qiáng)度(9月)
兩種計算方法耗時如表2所示:
表2 兩種方法耗時
采用滾動估計的方法。
先對前60天的價格函數(shù)和成交量函數(shù)做函數(shù)型主成分分析,得到主成分函數(shù);然后計算第61天的價格函數(shù)和成交量函數(shù)的主成分得分,最后利用式(9)估計第61天的股票資金流強(qiáng)度。
以此類推,估計后四天的股票資金流強(qiáng)度。結(jié)果如表3所示:
表3 估計結(jié)果
相對于文獻(xiàn)[3]的計算結(jié)果,優(yōu)化后的模型提高了股票資金流的計算精度,同時解決無法處理高頻數(shù)據(jù)的困境。另外相比文獻(xiàn)[4],利用函數(shù)型主成分分析估計股票資金流強(qiáng)度的結(jié)果更為準(zhǔn)確。
函數(shù)型數(shù)據(jù)分析是近些年蓬勃發(fā)展的新型非參數(shù)統(tǒng)計方法,相比于傳統(tǒng)的統(tǒng)計方法有著得天獨厚的優(yōu)勢。本文首次將函數(shù)型數(shù)據(jù)分析的方法應(yīng)用于股票資金流強(qiáng)度的研究。將求和模型優(yōu)化為積分模型,優(yōu)化后的模型是協(xié)變量為函數(shù),響應(yīng)變量為標(biāo)量的函數(shù)型線性回歸模型。實證結(jié)果表明,優(yōu)化后的模型可以提高股票資金流的計算精度,克服無法處理高頻數(shù)據(jù)的問題,同時在估計方面也更為精確。此外,對于基函數(shù)個數(shù)的選擇上,筆者也有著不同的看法。對于函數(shù)型數(shù)據(jù)分析的最小二乘問題,就是在無窮維空間中找一個有限維子空間來逼近無窮維空間的元素?;瘮?shù)的個數(shù)其實就是有限維子空間的維度。通過與有限維空間的對比,筆者認(rèn)為采集的數(shù)據(jù)實際上是函數(shù)在無窮維空間基上的投影,那么有多少個數(shù)據(jù)即意味著在多少個基上有投影,所以選取基函數(shù)的原則是數(shù)據(jù)個數(shù)。