趙德紀
摘 要:金融體系間的諸多關系可以通過構造金融網絡來體現(xiàn)。目前大量的研究工作表明,網路拓撲結構存儲了金融系統(tǒng)的豐富信息。而傳統(tǒng)的皮爾遜相關系數(shù)并不能給出金融序列間的非線性關系,格蘭杰因果關系檢驗要求序列是平穩(wěn)定的且并不能給出變量關系的因果強度。因此,給出了一種非線性因果關系的度量方法,用部分互信息(part mutual information)來度量股票之間的因果強度。采用這一方法研究了2013年1月到2018年10月在鄭州期貨交易所交易的6中農產品和非農產品序列(棉花CF、玻璃FG、菜籽油OI、菜籽粕、對苯二甲酸TA和強麥WH)的收益率數(shù)據(jù),并通過構造網絡來研究期貨市場的因果關系。有趣的發(fā)現(xiàn)是,強麥和二甲酸、玻璃和二甲酸之間有很強的雙向因果關系,二甲苯和棉花有弱的雙向因果關系;玻璃對棉花和強麥有強因果關系,而棉花和強麥對玻璃有弱的因果關系。菜籽油對二甲苯、強麥和玻璃有單向的因果關系,棉花對強麥有單向因果關系。在整個網絡中菜籽粕是一個孤立節(jié)點;網絡以強麥、二甲苯和玻璃為中心。
關鍵詞:部分互信息;因果強度;因果網絡
中圖分類號:F832.5? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2019)02-0107-04
引言
金融系統(tǒng)變量之間的相關性研究一直是一個熱門的話題[1-10]。韓高峰等人[1]根據(jù)極值理論研究了上海期貨交易所和倫敦金屬交易所銅期貨價格的尾部相關性,結果發(fā)現(xiàn),兩個交易所的日收益率數(shù)據(jù)樣本峰度比正態(tài)分布要高,尾部呈現(xiàn)厚尾特征;兩個序列的右尾有顯著的相關性,但漸進不相關;而他們的左尾不僅顯著相關也表現(xiàn)很強的漸進相關性。趙靜雯[7]基于格蘭杰因果關系方法研究了歐盟碳期貨和能源期貨的相關性,結果發(fā)現(xiàn),碳和能源之間存在協(xié)整關系,碳價格對煤炭價格產生了影響,并與電價格之間存在雙向的因果關系,與天然氣價格之間存在顯著的因果關系,而與石油價格并不存在。Ren等人[10]依據(jù)交叉相關系數(shù)和最大特征值方法研究來自于1999年至2011年的上海證券交易所的367只A股股票數(shù)據(jù),并通過400天的固定移動窗口構造了相關矩陣。分析相關系數(shù)、特征值和特征向量的統(tǒng)計特性演變發(fā)現(xiàn),上海股票價格的相關系數(shù)在2001年泡沫時期和2008年全球金融危機時期顯著增強。并從不同行業(yè)角度對相關系數(shù)矩陣的特性進行了細致的分析和解釋。
多數(shù)研究研究者主要用皮爾遜相關系數(shù)度量變量間的相關關系,以及用格蘭杰因果關系檢驗變量之間的因果性。皮爾遜相關系數(shù)只能度量變量之間的線性相關性。格蘭杰因果關系是從預測的角度來檢驗變量之間的因果性,且要求時間序列是平穩(wěn)的。然而,金融序列間的關系往往并非線性關系,其次序列也并不是平穩(wěn)的,往往序列間是非線性和平穩(wěn)的。本文通過部分互信息來度量變量之間的因果關系。首先部分互信息并不要求序列是線性和平穩(wěn)的,其次還能給出變量相關性的方向。因此我們通過部分互信息來構造因果關系矩陣,具體研究了從2013年1月到2018年10月鄭州期貨交易所的6個期貨日收益率數(shù)據(jù),分別為棉花CF、玻璃FG、菜籽油OI、菜籽粕、對苯二甲酸TA和強麥WH。我們讓窗口涵蓋一年的期貨數(shù)據(jù),并按照一個月的固定步長向前滑動,建立多元序列,從而研究變量之間的因果關系。研究結果表明,強麥和二甲酸、玻璃和二甲酸之間有很強的雙向因果關系,二甲苯和棉花有弱的雙向因果關系;玻璃對棉花和強麥有強因果關系,而棉花和強麥對玻璃有弱的因果關系。菜籽油對二甲苯、強麥和玻璃有單向的因果關系,棉花對強麥有單向因果關系。在整個網絡中菜籽粕是一個孤立節(jié)點,且網絡以強麥、二甲苯和玻璃為中心。
一、數(shù)據(jù)和方法
(一)原始數(shù)據(jù)和預處理
考慮數(shù)據(jù)的連續(xù)性和持續(xù)性,本文研究數(shù)據(jù)為鄭州期貨交易所的6種農產品和非農產品,分別為棉花CF、玻璃FG、菜籽油OI、菜籽粕、對苯二甲酸TA和強麥WH。數(shù)據(jù)選取2013年1月4日至2018年10月26日的每天日收盤價作為原始數(shù)據(jù)。數(shù)據(jù)來源于鄭州期貨交易所官網(http://www.czce.com.cn)。
期貨原始數(shù)據(jù)矩陣:
(二)方法
其中矩陣元PMIi→j為由上述公式得到的指數(shù)i對指數(shù)j的影響強度。
在計算序列的部分互信息時候,當?子>1時,存在序列之間的相互影響。因此針對公式6我們選取的為滯后一階(即?子=1),我們只考慮一階滯后,即一個序列的昨日收益率對另一個序列今日收盤價的因果強度。
二、結果
(一)部分互信息計算問題
由因果強度的定義可知,采用信息熵來度量因果強度,在對數(shù)據(jù)計算求概率求熵的過程中,由于劃分區(qū)間不同、概率估計不同,最終求得的部分互信息也不同。至于如何判斷計算結果的合理正確性,應考慮不同數(shù)據(jù)類型和不同函數(shù)關系,仿真來考慮最合適的劃分區(qū)間。我們考慮不同函數(shù)關系,然后對其中一個變量隨機化重排,這樣一來,變量間的關系就變得隨機(無關)。我們隨機化重排100次,然后計算隨機化重排后的均值和方差。
其中,分子為數(shù)據(jù)的極值,分母為標準差的倍數(shù)。在這里考慮T∈(0.1,0.25,0.5,0.75,1,1.5,2)。同時考慮均勻(uniform distribution)和正態(tài)(normal distribution)兩種不同的分布來估計部分互信息。仿真數(shù)據(jù)長度為200,接下來會說明數(shù)據(jù)長度為200時,計算的結果是可靠且穩(wěn)定的。仿真結果如圖一。
通過圖一我們可以看到當區(qū)間為數(shù)據(jù)的極值除以1倍標準差的時候,真實值和隨機化后值的差最大,且隨機化后的值在0.1左右。
下面來說明數(shù)據(jù)長度的問題,當數(shù)據(jù)達到多少時,我們的計算結果是穩(wěn)定且可靠的。同樣的考慮表二中的五中函數(shù)關系。仿真結果如圖2。
圖2中藍色曲線為五中函數(shù)關系計算的記過,紅色曲線為對其中變量隨Y機化重排100次計算結果的均值+2倍的標準差。由圖2可以得到,當數(shù)據(jù)長度達到200的時候,計算的結果是穩(wěn)定且可靠的。
(二)因果網絡
我們的分析中,選取固定窗口長度12(即一年的數(shù)據(jù)長)正常一年的數(shù)據(jù)在220左右,剔除節(jié)假日等數(shù)據(jù)一年的數(shù)據(jù)在200左右,故選取一年的數(shù)據(jù)計算結果是可靠的。選取滑動步長一個月(即一個月的數(shù)據(jù)長)共W=59個多維序列。
第i只序列和第j只序列間的因果強度可以用如下公式表示:
其中,Astr、Aflu分別代表了影響的強度和影響強度的波動性。Astr(i,j)表示第i只序列對第j只序列的均勻因果強度,Aflu(i,j)表示第i只序列對第j只序列因果強度的波動。由圖3,我們首先過濾掉那些大的波動的點(圖四中橫軸虛線表示),然后當?shù)趇只序列對第j只序列之間的因果強度大于或等于6只股票因果強度均值時(縱軸虛線表示),表示第i只序列對第j只序列間有相互作用,否者第i只序列對第j只序列無因果關系。最終得到如下期貨間的因果強度關系網絡圖(圖4)。
由圖4可以得到,其一,強麥和二甲酸、玻璃和二甲酸之間有很強的雙向因果關系,二甲苯和棉花有弱的雙向因果關系;玻璃對棉花和強麥有強因果關系,而棉花和強麥對玻璃有弱的因果關系。其二,菜籽油對二甲苯、強麥和玻璃有單向的因果關系,棉花對強麥有單向因果關系。其三,在整個網絡中菜籽粕是一個孤立節(jié)點;整個網絡以強麥、二甲苯和玻璃為中心。
三、結論
期貨序列元素之間的相互關系可以把元素連接成一個因果網絡。網路拓撲結構存儲了金融系統(tǒng)的豐富信息,這正是人們去調控金融系統(tǒng)的基礎,因而受到來自多學科領域的廣泛關注。
首先對部分互信息概率估計進行仿真研究,通過仿真模擬獲得了可靠且穩(wěn)定的概率估計。其次通過選取鄭州期貨交易所的農產品和非農產品來研究期貨市場的變化,依據(jù)部分互信息來度量變量間的非線性因果關系,部分互信息不僅能夠度量因果強度,同時還能夠給出因果方向??疾?013年1月到2018年10月5年的棉花CF、玻璃FG、菜籽油OI、菜籽粕、對苯二甲酸TA和強麥WH的6個期貨品種,我們發(fā)現(xiàn),整個網絡以強麥,二甲苯和玻璃期貨為中心,而菜籽粕在整個網絡中處于一個孤立的位置。
復雜系統(tǒng)普遍存在于各個領域中。一個復雜系統(tǒng)包含很諸多元素,這些元素之間存在著復雜的關系。復雜系統(tǒng)中的元素通過它們之間的關系構成復雜網絡,其結構也將隨著時間變化而發(fā)生變化。跟蹤測量每個元素及元素之間的關系狀態(tài),會產生一個多變量時間序列。從這一時間序列重構出元素之間的關系網絡,并跟蹤這一結構的變化是認識和調控復雜系統(tǒng)的基礎。本文中給出來的方法可以直接應用于該領域問題的研究。
參考文獻:
[1]? 韓高峰,鮑建平.商品期貨市場尾部相關性初探[J].證券市場導報,2005,(2):45-49.
[2]? 楊文靜.市場情緒,玉米期貨價格和現(xiàn)貨價格相關性分析——基于MSVAR-Full BEKK-GRACH模型的實證研究[J].價格理論與實踐,2017,(2):127-130.
[3]? 劉炎德,孫萬嶺.基于格蘭杰因果分析的山東省碳排放量與經濟增長的關系[J].甘肅科學學報,2015,(5):137-139.
[4]? 施文月.貨幣供應量與資產價格交付影響的實證研究——基于頻域格蘭杰因果檢驗[J].合肥工業(yè)大學學報:社會科學版,2016,(4):25-31.
[5]? 李娜.新增開戶數(shù)與股票指數(shù)的格蘭杰因果檢驗——基于上證A股的研究[J].經濟研究導刊,2017,(4):75-76.
[6]? 姚曉陽,孫曉蕾,吳登生,楊玉英.基于互信息熵的國家風險相關性研究[J].系統(tǒng)工程理論與實踐,2015,(7):1657-1665.
[7]? 趙靜雯.歐盟碳期貨價格與能源價格的相關性分析[J].金融經濟,2012,(14):92-94.
[8]? 高偉,田錚.基于條件互信息的多維時間序列圖模型[J].控制理論與應用,2008,(2):26,257-260.
[9]? 程國勝,孫超男,宋鳳麗,來鵬.基于條件互信息的超高維分類數(shù)據(jù)特征篩選[J].統(tǒng)計與決策,2018,(8):64-67.
[10]? F.Ren,and W.X.Zhou,Dynamic evolution of cross-correlations in the Chinese stock market,PLo S One9(2014)e97711.
[11]? J.Zhao,Y.Zhou,X.Zhang,Part mutual information for quantifying direct associations in networks[J].Proc Natl Acad Sci USA,2016,113(18):5130-5135.