亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于混合分布的中國股票波動風險因素的識別與分析

        2018-03-09 03:25:01王安興譚鮮明
        中國管理科學 2018年2期
        關鍵詞:總體個數(shù)方差

        王安興,譚鮮明

        (1上海財經(jīng)大學金融學院,上海 200433;2.加拿大麥吉爾大學健康中心,加拿大 魁北克 H4A 3J1)

        1 引言

        金融研究中,習慣用證券的收益或收益率代表證券,證券的預期收益(收益的均值)與證券的波動率(收益率的標準差)是描述收益的兩個重要基本量。股票收益可以用多因素模型表示[1-3],著名的多因素模型是五因素模型[1-2]。五因素模型說明影響股票預期收益的共同因素個數(shù)是五個,有大量文獻研究股票收益率的多因素模型。

        股票波動率是測量股票風險的重要指標,在資產(chǎn)定價、金融風險管理中有重要應用。GARCH模型可以很好的描述股票波動集聚性[4~6],日內(nèi)新的信息不斷到達,且信息數(shù)量序列相關,導致股票價格變化出現(xiàn)集聚性現(xiàn)象,產(chǎn)生GARCH效應[7],市場深度與信息到達的相關性與市場波動率特性有關[8]。因為波動率在測量股票風險中有重要作用,高頻數(shù)據(jù)情況下的金融資產(chǎn)收益率已實現(xiàn)波動率的估計問題時,可以通過混合泊松分布而非傳統(tǒng)的連續(xù)擴散模型來描述價格過程[9],利用SV-t模型來擬合金融時序的邊緣分布可以幫助解決非線性相關的高維投資組合風險度量問題[10]。

        如果根據(jù)多因素模型計算股票收益率的方差,可以很容易發(fā)現(xiàn),決定股票波動率(波動)的共同影響因素也是有限個。分析或識別股票波動的共同因素個數(shù)的文獻卻不多見。

        識別股票波動率的共同影響因素個數(shù),也就是分析股票波動率來自多少個組或者類。聚類是將物理或抽象對象的集合分組成為由類似的對象組成的多個類的過程。同一個類中的對象有很大的相似性,而不同類間的對象有很大的相異性?;旌戏植?Finite mixture distribution)或混合模型(Finite mixture model)是常用于基于模型的聚類分析(Model-based clustering)的重要模型[11-12],對來自不同總體的樣本,混合分布推斷每個樣本來自不同總體的概率。

        混合模型被廣泛應用于醫(yī)學及其他學科研究中[13],例如,應用正態(tài)混合模型分析新生兒癲癇的分類與預測[14],以及分析醫(yī)學圖像[15]。

        應用混合分布研究股票價格行為也是文獻研究的熱點之一。GARCH效應產(chǎn)生的原因是日內(nèi)信息流到達的數(shù)量序列相關?;诓煌男畔善眱r格的波動性影響不同,單個股票收益率與成交量時間序列視為來自不同分布的樣本,用混合分布建立股票價格波動率和成交量的關系[7],用混合分布解釋股票價格波動的持續(xù)性[16-17]。由于混合分布對股票價格波動持續(xù)性的解釋有限[17-21],股票價格波動性和成交量的雙變量混合模型被提出[22]。混合分布也可以應用于單因子模型的定價問題[23]。

        由于影響所有股票價格的公開的公共信息數(shù)量有限,影響所有股票波動率的共同因素也有限。例如股票的5因素模型提示影響股票波動率的共同因素可能不超過5個。然而,在現(xiàn)有的文獻中,沒有看到解釋GARCH模型參數(shù)的共同決定因素文獻。關于究竟有多少個共同因素影響中國股票波動率,現(xiàn)有文獻并沒有給出明確的答案。

        本文擬基于混合分布模型分析影響所有中國股票波動率的因素個數(shù),并分析可能的影響因素。已有的混合模型將個別股票的時間序列作為混合模型的樣本。本文首先對所有股票的時間序列(高維數(shù)據(jù))分別建立GARCH模型,將建模得到的每個股票的GARCH模型參數(shù)作為該股票波動性的代理(低維)數(shù)據(jù)。將所有股票的低維數(shù)據(jù)(GARCH模型參數(shù))作為本文混合模型的樣本,對每個股票波動代理低維數(shù)據(jù)進行聚類分析,并分析決定每個股票類別的影響因素。對所有股票的分類可以作為資產(chǎn)配置的依據(jù)之一。

        2 混合模型與股票波動分析

        稱一個d-維隨機向量Y服從多元正態(tài)混合分布。有限正態(tài)混合分布(Finite mixture of normal distribution)或有限正態(tài)混合混合模型(Finite mixture of normal model)),指的是它的分布密度f(y)有如下形式:

        f(y)=p1φ(y;μ1,Σ1)+p2φ(y;μ2,Σ2)+…+pKφ(y;μK,ΣK)

        (1)

        其中,φ(y;μ,Σ)表示均值向量為μ協(xié)方差陣為Σ的多元正態(tài)密度函數(shù);K指的是子總體的個數(shù)(或成分數(shù));p1、p2、…、pK分別表示K個子總體的比例,滿足條件p1,p2,…,pK>0,且p1+p2+…+pK=1。

        混合分布與隱藏變量(latent variable)緊密相關。假設存在一個隱藏變量C,C服從多項分布P(C=k)=pk,k=1,2,…K,而給定C=k條件下Y的分布為:

        f(y|C=k)=φ(y;μk,Σk)

        這樣,Y的邊際分布即有(1)的形式。因此,混合分布常用于基于模型的聚類分析(Model-based clustering)。

        一個股票市場可能包含數(shù)千只股票,每個股票可以用GARCH模型去擬合其波動性。GARCH效應產(chǎn)生的原因是日內(nèi)信息流到達的數(shù)量序列相關[7]。影響所有股票波動率的共同因素(共同隨機信息)對不同個股股價波動性的影響不一定相同,而個別股票的波動特征可以用GARCH模型的參數(shù)刻畫。因此,個股的GARCH模型的參數(shù)或呈現(xiàn)不同的類型,即擬合股票的GRACH模型參數(shù)或可以被視為服從某種混合分布(若干個子總體混合得到的分布)。

        更具體地,影響所有股票價格變化的共同信息,是影響所有股票GARCH效應的共同因素。而同樣的宏觀經(jīng)濟信息,對不同行業(yè)、不同所有制類型的影響不同。用GARCH模型描述股票收益率波動時,模型參數(shù)完全決定股票收益率波動特征。我們提出如下假設:

        ①GARCH模型參數(shù)屬于有限個分布類:共同因素決定了GARCH模型參數(shù)來自混合分布

        ②公司所有權結(jié)構(gòu)、公司所屬行業(yè)與GARCH模型參數(shù)的分類相關。

        經(jīng)驗研究表明,GARCH(1,1)模型能很好地描述股票價格變化的聚集性,可以用GARCH(1,1)模型的參數(shù)來刻畫所有股票的價格波動特性:

        rt=μ+εt

        (2)

        其中,rt是股票在t日的收益率,μ是rt的均值,ht是給定t-1時刻信息下收益率rt的條件方差,ηt是獨立同分布,均值為零、方差為1。(a0,a1,λ1)是對應于該股票的GARCH(1,1)模型參數(shù),a0是股票條件方差的常數(shù)項,a1表示前期誤差項(信息)對當前條件方差的敏感性,a1越大,則前期的信息對當前條件方差的影響越大,市場信息轉(zhuǎn)換為未來波動性沖擊的傳播速度越快;λ1是前期條件方差對當前條件方差的敏感性,λ1越大,則前期條件方差對當前條件方差的影響越大,波動性干擾的影響越持久;a1+λ1反映新信息對股票波動影響的持久性,a1+λ1越接近1,則條件方差回復到無條件方差的時間越久。

        GARCH(1,1)模型的無條件方差σ2和波動半衰期T的計算公式為:

        (3)

        波動半衰期T表示條件方差減少一半所需要的時間。

        在下面的分析中,將所有股票的GARCH(1,1)模型參數(shù)(μ,a0,a1,λ1)的估計值視為樣本,用混合分布進行聚類分析,判斷股票波動率是否來自有限混合分布總體。如果推斷GARCH模型參數(shù)估計樣本來自混合分布的不同總體,則分別應用列聯(lián)表(交互分類表)和Multilogisitic(多元logisitic)模型分析公司所有權結(jié)構(gòu)、公司所屬行業(yè)是否是GARCH模型參數(shù)的解釋因素。

        列聯(lián)表分析的目的是判明公司的特性(用變量描述)與公司子總體劃分之間有無關聯(lián),即考察公司特性與子總體劃分是否獨立。檢驗的原假設是公司特性與公司的子總體劃分獨立,檢驗統(tǒng)計量是皮爾森的擬合優(yōu)度檢驗或似然比檢驗,當原假設成立時,統(tǒng)計量的漸近分布是χ2分布。

        應用Multilogisitic(多元logisitic)模型分析公司所有權結(jié)構(gòu)、公司所屬行業(yè)是否是GARCH模型參數(shù)的解釋因素,即假設公司的分組概率的對數(shù)服從如下模型:

        (4)

        其中,pi、p0分別為是公司分組為i、0的概率,xj表示所有權性質(zhì)、所屬行業(yè)等變量,K表示分組個數(shù)。

        公式可以變形為:

        (5)

        式(5)表示各派參數(shù)分別屬于不同組的概率。

        3 數(shù)據(jù)及基本分析

        本文采用2006年—2014年A股上市公司每日股票收盤價數(shù)據(jù),從2006年到2014年,中國經(jīng)濟經(jīng)歷了高速增長、面臨全球經(jīng)濟危機的沖擊、逐步過渡到平穩(wěn)增長,雖然僅僅9年時間樣本,卻能夠反映中國經(jīng)濟增長的各種特征。本文在樣本中剔除了在2006年是ST公司、PT公司、數(shù)據(jù)缺失和銷售收入為0的公司。因為金融業(yè)是受到高度監(jiān)管的公司,所以也將金融、保險業(yè)的公司剔除。剔除這些股票之后,獲得的總樣本個數(shù)為1165。本文的數(shù)據(jù)來自CSMAR數(shù)據(jù)庫和Wind數(shù)據(jù)庫。

        本文根據(jù)不同性質(zhì)的股權構(gòu)成的比例關系,對公司的所有權形式進行劃分,用虛擬變量來代表不同所有權類型的企業(yè)。本文采用中國證監(jiān)會的行業(yè)分類標準進行行業(yè)分類,剔除金融、保險業(yè),分析采掘業(yè)、傳播與文化產(chǎn)業(yè)、電力煤氣及水的生產(chǎn)和供應業(yè)、房地產(chǎn)業(yè)、建筑業(yè)、交通運輸倉儲業(yè)、農(nóng)林牧漁業(yè)、批發(fā)和零售貿(mào)易、社會服務業(yè)、信息技術業(yè)、制造業(yè)和綜合類。用虛擬變量代表不同行業(yè)。本文將用到每個變量與虛擬變量賦予名稱,將變量名稱、代碼簡單定義列于表1和表2。

        首先對樣本分組做簡單的基本統(tǒng)計,統(tǒng)計數(shù)據(jù)見表3。從表3可以看出,數(shù)據(jù)中總的樣本公司數(shù)1165家,六類所有權結(jié)構(gòu)形式的公司數(shù)量都有數(shù)百家公司。不過,按照行業(yè)進行公司分組時,國有控制的企業(yè)的發(fā)展主要集中在采掘業(yè)、電力煤氣及水的生產(chǎn)和供應業(yè)和交通運輸倉儲業(yè),而非國有控制的企業(yè)的發(fā)展主要集中在制造業(yè)、信息技術業(yè)和農(nóng)林牧漁業(yè)。這可能導致按照行業(yè)和所有權結(jié)構(gòu)分組時,有些組包含的樣本個數(shù)比較少,這是在解釋統(tǒng)計數(shù)據(jù)時必須注意的事實。

        表1 行業(yè)虛擬變量

        表2 所有權比例虛擬變量

        表3 樣本分布統(tǒng)計

        用GARCH(1,1)模型分別擬合1165只股票收益率,假設(2)式中μ=0擬合模型,根據(jù)文獻的研究和我們的經(jīng)驗,這樣選擇的模型幾乎能夠很好的擬合所有股票收益率(選擇μ≠0進行分析得到的結(jié)論相同,為節(jié)省篇幅計,本文舍棄了對μ≠0時的分析)。對所有1165只股票分別擬合GARCH(1,1)模型,得到每個股票的GARCH模型參數(shù)a0,a1,λ1的估計值。將這些參數(shù)向量(a0,a1,λ1)的估計值視為3維隨機向量的樣本,分析這些三維隨機向量樣本(參數(shù)估計)是否服從3元正態(tài)混合分布,并分析行業(yè)、不同所有制類型是否與參與決定個股書哪個子總體。

        4 混合模型擬合分析

        ⑴混合分布的參數(shù)估計

        進行統(tǒng)計分析使用的分析軟件為免費統(tǒng)計軟件R以及R軟件包mclust[24-25]?;旌夏P偷膮?shù)估計為最大似然估計(MLE),一般通過應用EM算法[28]得到。特別地,對1165只個股的GARCH(1,1)模型參數(shù)用不同成分個數(shù)的3元正態(tài)混合分布進行擬合,然后比較不同模型(不同成分個數(shù))的BIC統(tǒng)計量[29]。BIC越大表示模型越優(yōu),最大BIC對應的模型最好地兼顧了擬合優(yōu)度以及模型復雜度。

        圖1描述不同子總體個數(shù)多元正態(tài)混合模型擬合1165只個股的GARCH(1,1)模型參數(shù)的BIC統(tǒng)計量,橫軸是子總體個數(shù),縱軸上對應的BIC統(tǒng)計量數(shù)值。圖1是不同子總體數(shù)下的混合分布估計的BIC統(tǒng)計量。需要指出的是,在給定子總體數(shù)后,可以考慮對各子分布(多元正正態(tài)分布)的協(xié)方差陣加上適當?shù)募s束:如要求各協(xié)方差陣都是相同的(EII),或要求各協(xié)方差陣僅特征根可以不同(VII),或各協(xié)方差陣可以自由變化,無任何約束(VVV)。在分析中考慮了10種不同的協(xié)方差陣約束的情形(見圖1),這些情形的具體描述請參見該文獻[13]第8頁的表1。

        圖1 BIC檢驗統(tǒng)計量

        根據(jù)圖1,7個成分協(xié)方差無約束(VVV)的混合模型對應的BIC最大。注意到當成分數(shù)大于4后,BIC的變化其實很小。本著簡約的原則(在檢驗統(tǒng)計量相同或相似的條件下,選擇參數(shù)最小的模型),選擇4個成分協(xié)方差無約束(VVV)的混合模型為最終模型。

        因此,這1165支股票的波動特性具有異質(zhì)性(成分數(shù)大于1),這些股票的參數(shù)向量樣本的分布可以看作是4個多元正態(tài)分布的混合,而不是來自一個正態(tài)分布。

        在設定這些股票的參數(shù)向量樣本來自一個4成分混合多元正態(tài)分布的前提下,對參數(shù)向量樣本進行混合分布分析,可以得到每個個股的GARCH(1,1)模型參數(shù)向量屬于4個子分布的后驗概率。根據(jù)每支股票屬于各子分布的后驗概率,把樣本中的股票分成4類(根據(jù)最大后驗概率原則),屬于同一類的股票的可以認為是同質(zhì)的。其中子總體1包含35只股票,子總體2包含551只股票,子總體3包含240只股票,子總體4包含339只股票??偣善?樣本)數(shù)為1165。表4-1是對四個子總體按行業(yè)分類統(tǒng)計,表4-2是對四個子總體按所有權性質(zhì)分類統(tǒng)計。

        表4-1 子總體按行業(yè)分類——行業(yè)相關性

        表4-2 子總體按所有權性質(zhì)分類

        選定子總體個數(shù)為4后,進一步分析這四個子總體的基本統(tǒng)計。對每個子總體,分別計算這4個子總體的比例、每個子總體中參數(shù)向量(a0,a1,λ1)的估計值的均值、協(xié)方差陣和相關系數(shù)矩陣,分別將計算結(jié)果列于表5-1、5-2中。

        表5-1

        表5-2

        根據(jù)GARCH(1,1)模型的無條件方差計算公式(3),分別計算四個子總體對應GARCH模型的無條件方差,列于表5-1。在表5-1中,a1+λ1是將α1均值估計值、λ1均值估計值相加得到,反映股票波動持久性(Persistency)。將表5-1、表5-2中四個總體的參數(shù)均值、標準差摘錄列入表6。

        表6 子總體分布函數(shù)的均值與標準差

        ⑵混合分布的分析

        比較表4-1、4-2可以發(fā)現(xiàn),4個子總體股票在各個行業(yè)、各種所有權類型中分布并不均勻:子總體股票分布與行業(yè)、所有權性質(zhì)是有關聯(lián)的。

        比較表5-1可以發(fā)現(xiàn),在這四個子總體中,子總體1與其他三個子總體有顯著差異。第一個子總體股票個數(shù)所占的比例最小,僅僅占3.13%(在1165只股票總樣本中僅僅35只股票),其他3個子總體股票個數(shù)雖然也有差異,但在一個數(shù)量級上,與子總體1股票所占的比例比較差異不大;子總體1中的股票條件方差的不變項比較大,前期誤差項(信息)對當前條件方差的敏感性比較小,前期條件方差對當前條件方差的敏感性比較大,新信息對股票波動影響的持久性較短,股票價格受到新信息沖擊之后能夠比較快的恢復,子總體1里的股票的波動風險比其他子總體的股票的波動風險大性,而其它子總體里的股票的波動風險差別不大。

        注意到表5-2中子總體2、子總體3和子總體4的參數(shù)向量的相關系數(shù)矩陣很相似,與子總體1的相關系數(shù)矩陣差異比較大,說明子總體2、子總體3和子總體4的相關性相似,而他們的差異主要體現(xiàn)在各參數(shù)的均值與方差上。子總體1與其他三個子總體各參數(shù)的均值、相關性與方差均存在顯著差異,是數(shù)量級水平不同的差異。而子總體2、子總體3和子總體4的各參數(shù)在數(shù)量級上是同一水平,但是其大小有差異。

        從表6可以看出,子總體1參數(shù)對應的標準差最大,約為其它子總體對應值的3倍以上甚至更多,而其他三個子總體參數(shù)對應的標準差基本上在一個數(shù)量級,說明這三個子總體的GARCH模型參數(shù)值的變化范圍差不多。這表示子總體1里GARCH模型參數(shù)值的變化范圍很大,遠遠大于其他三個子總體的GARCH模型參數(shù),意味著子總體1中不同股票的GARCH模型參數(shù)差異較大,而其他三個子總體中股票的GARCH模型參數(shù)差別不大,子總體1中的股票波動性的差異比其它子總體里的股票波動性的差異要大。

        仔細檢查子總體1的35只股票,全部都是出現(xiàn)虧損、重組、增發(fā)、資產(chǎn)注入、甚至退市的公司,部分公司甚至公司名稱也發(fā)生變化。也就是說,子總體1中包含的主要是退市、重組、ST公司、PT公司、重組、增發(fā)等類型公司股票。因此,剔除這些公司樣本。

        綜合上述數(shù)據(jù)分析,我們發(fā)現(xiàn)子總體2、子總體3和子總體4的參數(shù)向量的相關性相似,而他們的差異主要體現(xiàn)在參數(shù)向量的方差和子總體參數(shù)向量均值對應的GARCH模型的方差上。子總體1其實包含表現(xiàn)異常的公司股票,其它子總體包含的股票相似度比較高。數(shù)據(jù)提示:混合分布的分組依據(jù)可能是股票GARCH模型參數(shù)的均值與方差,而各參數(shù)間的相關性相似。

        5 股票混合分布的分類歸因分析

        根據(jù)每支股票屬于各子分布的后驗概率把樣本中的股票分成4類,屬于同一類的股票的可以認為是同質(zhì)的?,F(xiàn)在分析公司的所有權結(jié)構(gòu)以及公司所屬行業(yè)是否與股票的分類有關聯(lián)?,F(xiàn)在通過比較子總體2、子總體3、子總體4的GARCH(1,1)模型參數(shù)均值向量來描述各子總體的特征,然后檢查這些類的公司的所有權結(jié)構(gòu)、所屬行業(yè)是否有差異。子總體2包含551只股票,子總體3包含240只股票,子總體4包含339只股票??偣善?樣本)數(shù)為1130,各子總體的行業(yè)分布和所有權分布參見表4-1和表4-2。

        下面分別用列聯(lián)表和多元logistic模型分析公司所有權、所屬行業(yè)差異與公司子總體分組是否有關。首先進行列聯(lián)表分析,然后進行多元logistic模型分析。

        ⑴列聯(lián)表分析

        表7是各子總體的行業(yè)分布和所有權分布及列聯(lián)表(交互分類表)檢驗統(tǒng)計。表7中第一列是變量名稱,第二列是變量值,第三、第四和第五列分布是變量取得該值時子總體2、子總體3和子總體4中的股票個數(shù)及占比,最后一列是原假設成立時用樣本數(shù)據(jù)計算檢驗統(tǒng)計量的值對應的概率。

        表7中的變量是行業(yè)虛擬變量(Dummy variable)和所有權虛擬變量,變量名稱的含義見表1和表2。行業(yè)虛擬變量等于1,表示屬于這個行業(yè),等于0表示不是這個行業(yè);所有權虛擬變量的含義相同。子總體中的股票個數(shù)根據(jù)變量分別計算,括號中的數(shù)值是相應的比例。下面以子總體2中變量G1對應的股票個數(shù)(第三列中的第二行、第三行)來說明相關數(shù)值的含義。453表示子總體2中對應G1等于0(不屬于G1)的股票個數(shù)有453個,453后面括號中的48.9表示子總體2中不屬于G1的股票個數(shù)占子總體1中股票的比例為48.9%;98表示子總體2中G1等于1(屬于G1)的股票個數(shù)有98個,后面括號中的48.3表示子總體2中屬于G1的股票個數(shù)占子總體2中股票的比例為48.3%(子總體2中總股票個數(shù)是453+98即551個);第四、第五列下面的數(shù)據(jù)同樣解釋。

        表7 各子總體的行業(yè)分布和所有權分布及列聯(lián)表檢驗

        注:*和**分別表示在10%和5%的顯著性水平上拒絕參數(shù)等于零的原假設

        表7 的列聯(lián)表分析的目的是判明公司的特性(用變量描述)與子總體劃分之間有無關聯(lián),即考察公司特性與子總體劃分是否獨立。在下面的分析中,分別對每個變量進行2×3列聯(lián)表分析,檢驗該變量與子總體劃分獨立的原假設。

        現(xiàn)在以變量G1來解釋列聯(lián)表的統(tǒng)計分析方法。在表7中的第二、第三列構(gòu)成的2×3列聯(lián)表中,若以pi(i=2,3,4)分別表示屬于股票子總體2、3、4的概率,pj(j=0,1)分別表示股票特性為G1等于0和G1等于1的概率,pij表示股票同時屬于子總體i(i=2,3,4)和股票特性G1等于j(j=0,1)的概率,2×3列聯(lián)表統(tǒng)計分析的原假設為:pij=pi×pj(i=2,3,4;j=0,1),即公司特性與股票屬于是否屬于特定子總體無關,股票在三個子總體的比例相同。檢驗統(tǒng)計量(χ2統(tǒng)計量)為皮爾森的擬合優(yōu)度檢驗或似然比檢驗。當原假設成立時,統(tǒng)計量的漸近分布是自由度為3的χ2分布。表7中的第六列即檢驗統(tǒng)計量對應的概率值。

        以變量G1為例比較表7中的數(shù)據(jù)。在子總體2包含的551只股票中,有98只(17.8%)為G1,而453只(82.2%)非G1;子總體3里有49只(20.4%)為G1,而191只(79.6%)非G1;子總體4里有56只(16.5%)為G1,而283只(83.5%)非G1。χ2統(tǒng)計量對應的p-值為0.479(47.9%)。因此,不能拒絕“這三個子總體是有相同比例的G1”的原假設。其他數(shù)據(jù)的解釋類似。

        特別地,注意到4個子總體有顯著不同比例的F1(p-值為0.02),F(xiàn)DC(p-值為0.044),SH(p-值為0.015),ZZ(p-值為0.079)。因此,拒絕這四個子總體是有相同比例的“非國有股權分散公司”、“社會服務業(yè)”、“房地產(chǎn)公司”、“制造業(yè)公司”原假設。

        對照表7可以看到,非國有股權分散公司(F1)在子總體3中比例(23.3%)最高,在子總體2中比例(15.2%)最低;房地產(chǎn)公司(FDC)在子總體4中比例(11.2%)最高,在子總體3中比例(6.2%)最低;社會服務業(yè)(SH)在子總體4中比例(4.7%)最高,在子總體3中比例(.2%)最低;制造業(yè)公司在子總體3中的比例(62.0%)最高,在子總體4中的比例(52.8%)最低。

        觀察表5-1注意子總體2的無條件方差(10.69)最大,子總體4的無條件方差次大(10.57),子總體3的無條件方差最小(10.38)。因此,非國有股權分散公司、制造業(yè)公司相對偏向低風險,社會服務業(yè)、房地產(chǎn)公司相對偏向高風險公司。出現(xiàn)這種現(xiàn)象的原因有待進一步研究。我們猜測,這是樣本期2006-2014內(nèi)國有絕對控股公司、房地產(chǎn)業(yè)、制造業(yè)發(fā)展的中國經(jīng)濟形式有對應關系。

        ⑵多元logistic模型分析

        在混合分布分析中,發(fā)現(xiàn)總體可以分為四個子總體。其中,子總體1主要有少量“噪音”樣本組成。因此,下面僅僅分析子總體2、子總體3和子總體4的劃分是否與公司的所有權結(jié)構(gòu)、所屬行業(yè)有關系??梢杂枚嘣猯ogistic模型來分析子總體和公司的所有權結(jié)構(gòu)、所屬行業(yè)的關系,從而找出影響股票波動性分類的因素。用回歸分析估計(6)中的多元logistic模型,結(jié)果列于表8 中。

        (6)

        在多元logistic模型統(tǒng)計分析中,公式(6)中k=2,待估模型參數(shù)是α1、β11、β12、α2、β21、β22。p0是公司分組屬于子總體4的概率,p1、p2分別是公司屬于子總體2、子總體3的概率。提醒注意,因為多元logistic分析中剔除了子總體1的樣本,這里的p0、p1、p2與混合分布分析時得到的股票屬于某子總體的概率不同,是將混合分布是股票屬于該子總體的概率除以股票不屬于子總體1的概率(即一減去股票屬于子總體1的概率)。

        表8 多元logistic模型參數(shù)估計

        **表示在5%的顯著性水平上拒絕參數(shù)等于零的原假設

        我們僅考慮后3個子總體,以子總體4為對照,通過變量選擇后,得到如上的最終模型。通過這個模型,制造業(yè)的公司(股票)更可能屬于子總體2和3子總體,而不是子總體4。表5-1提示子總體4的波動持續(xù)性最大,因此,制造業(yè)的公司股票波動的持續(xù)性相對較低。

        6 結(jié)語

        論文以GARCH模型描述股票的波動特性,應用混合分布以中國上市公司股票波動特性進行分組,研究發(fā)現(xiàn),中國上市公司可以被分為4個子總體,每個子總體股票在各個行業(yè)、各種所有權類型中分布并不均勻:子總體股票分布與行業(yè)、所有權性質(zhì)是有關聯(lián)的。其中,子總體1主要包含表現(xiàn)異常的公司股票,子總體2、子總體3和子總體4的參數(shù)向量的相關性相似,而他們的差異主要體現(xiàn)在參數(shù)向量的方差和子總體參數(shù)向量均值對應的GARCH模型的方差上。

        應用列聯(lián)表法分析發(fā)現(xiàn),非國有股權分散公司、制造業(yè)公司相對偏向低風險,社會服務業(yè)、房地產(chǎn)公司相對偏向高風險公司。對子總體2、子總體3和子總體4中的股票,以子總體4為對照,對三個子總體進行多元logistic模型統(tǒng)計分析發(fā)現(xiàn),制造業(yè)的公司(股票)波動的持續(xù)性相對較低。

        總之,混合分布是對股票特性進行分組的良好工具,能夠清晰地將異常股票尋找出來,并將異常股票分在同一子總體中。

        [1] Fama E F. French K R, Dissecting anomalies with a five-factor model[J].Review of Financial Studies, 2016, 29(1): 69-103.

        [2] Fama E F. French K R. A five-factor asset pricing model[J].Journal of Financial Economics,2015,116(1):1-22.

        [3] Jegadeesh N,Titman S. Returns to buying winners and selling losers: Implications for stock market efficiency[J].Journal of Finance,1993, 48, 65-91.

        [4] Engle R F. Autoregressive conditional heteroskedasticity with estimates of the variance of United Kingdom inflation[J]. Econometrica, 1982, 50(4):987-1007.

        [5] Bollerslev T. Generalized autoregressive conditional heteroskedasticity[J]. Journal of Econometrics,1986, 31(3):307-327.

        [6] Bollerslev T. A conditionally heteroskedastic time series model for speculative prices and rates of return[J]. Review of Economics and Statistics,1987, 69(3), 542-547.

        [7] Lamoureux C G, Lastrapes W D. Heteroskedasticity in stock return data: Volume versus GARCH effects[J]. Journal of Finance, 1990, 41(1): 221-229.

        [8] Bessembinder H, Seguin P J. Price volatility, trading volume, and market depth: Evidence from futures markets[J]. Journal of Financial and Quantitative Analysis, 1993, 28(1):21-39.

        [9] 趙軍力, 梁循. 基于TrTS取樣的股票收益率RV測度的改進[J]. 中國管理科學, 2015, 23(7):26-34.

        [10] 劉祥東, 范彬, 楊易銘,等. 基于M-Copula-SV-t模型的高維組合風險度量[J]. 中國管理科學, 2017, 25(2):1-9.

        [11] Fraley C, Raftery A E. Model-based clustering, discriminant analysis and density estimation[J]. Journal of the American Statistical Association.2002, 97(458):611-631.

        [12] Dempster A P, Laird N M, Rubin D B.Maximum-likelihood from Incomplete Data via the EM Algorithm[J]. Journal of the Royal Statistical Society,1997, 39(1): 1-38.

        [13] Schlattmann P. Medical applications of finite mixture models[M]. Springer Series: Statistics for Biology and Health,2009.

        [14] Thomas E M, Temko A, Lightbody G, et al, Gaussian mixture models for classification of neonatal seizures using EEG[J].Physiological Measurement,2010, 31(7):1047-64.

        [15] 劉艷琪,胡亨伍.基于EM 算法的混合模型醫(yī)學圖像分割[J].計算機工程,2012, 38(2):231-233.

        [16] Tauchen G E, Pitts M. The price variability-volume relationship on speculative markets[J]. Econometrica, 1983, 51(2):485-505.

        [17] Andersen T G. Return volatility and trading volume: An information flow interpretationof stochastic volatility[J]. Journal of Finance,1996, 51(1):169-204.

        [18] Lamoureux C G, Lastrapes W D. Endogenous trading volume and momentum in stock-return volatility[J]. Journal of Business & Economic Statistics, 1994, 12(2):253-260.

        [19] Liesenfeld R. Dynamic bivariate mixture models: Modeling the behavior of prices and trading volume[J]. Journal of Business & Economic Statistics,1998, 16(1): 101-109.

        [20] Mitchell M L, Mulherin J H. The impact of public information on the stock market[J]. Journal of Finance, 1994, 49(3):923-950.

        [21] Berry T D, Howe K M. Public information arrival[J]. Journal of Finance,1994, 49(4), 1331-1346.

        [22] Liesenfeld R. A generalized bivariate mixture model for stock price volatility and trading volume[J]. Journal of Econometrics,2001, 104(1): 141-178.

        [23] 楊瑞成,秦學志,陳田,等,基于混合分布單因子模型的CDO定價問題[J],數(shù)理統(tǒng)計與管理,2009, 28(6),1082-1090.

        [24] Fraley C. Raftery A E. Murphy T B,et al, Mclust Version 4 for R: Normal mixture modeling for model-based clustering, classification, and density estimation technical[R]. Report No. 597,University of Washington.

        [25] Thomas E M,Femko A,Lightbody G,et al. Gaussian mixture models for classification of neonatal seizures using EEG[J]. Physiological Measurement, 2010,31(7):1047-1064.

        猜你喜歡
        總體個數(shù)方差
        方差怎么算
        怎樣數(shù)出小正方體的個數(shù)
        概率與統(tǒng)計(2)——離散型隨機變量的期望與方差
        用樣本估計總體復習點撥
        2020年秋糧收購總體進度快于上年
        等腰三角形個數(shù)探索
        怎樣數(shù)出小木塊的個數(shù)
        外匯市場運行有望延續(xù)總體平穩(wěn)發(fā)展趨勢
        中國外匯(2019年6期)2019-07-13 05:44:06
        計算方差用哪個公式
        怎樣數(shù)出小正方體的個數(shù)
        麻豆成人精品国产免费| 视频国产自拍在线观看| 免费a级毛片高清在钱| 欧美大屁股xxxx| 最新亚洲人AV日韩一区二区 | 青青草视频在线播放81| 美利坚日韩av手机在线| 国产免费av片无码永久免费| 亚洲精品免费专区| 亚洲av永久久无久之码精| 国模91九色精品二三四| 大地资源在线观看官网第三页| 精品一区二区三区在线观看视频 | 久久国产精品波多野结衣av| 中文人妻av大区中文不卡| 久久精品熟女亚洲av麻豆永永 | 噜噜中文字幕一区二区| 国产日产欧产精品精品| 亚洲精品视频久久| 亚洲国产精品二区三区| 人妖一区二区三区四区| 久久中文字幕无码专区| 久久婷婷国产精品香蕉| 亚洲黄色精品在线播放| 久9re热视频这里只有精品| 精品乱码卡1卡2卡3免费开放| 精品国产成人一区二区不卡在线| 中文字幕有码人妻在线| 蜜桃无码一区二区三区| 亚洲两性视频一三区| 少妇被躁到高潮和人狍大战| 18岁日韩内射颜射午夜久久成人| 97精品伊人久久大香线蕉| 一区视频在线观看免费播放.| 成年人干逼视频水好多| 正在播放东北夫妻内射| 91精品国产免费青青碰在线观看| 日韩中文字幕在线丰满| 午夜福利理论片在线观看| 日韩高清毛片| 久久精品国产亚洲av专区|