張?bào)忝罚旒颐?/p>
(1.安徽財(cái)經(jīng)大學(xué)金融學(xué)院;2.安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽蚌埠 233030)
基于Pearson相關(guān)系數(shù)模型對(duì)股票間相關(guān)性研究
張?bào)忝?,朱家明2
(1.安徽財(cái)經(jīng)大學(xué)金融學(xué)院;2.安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽蚌埠 233030)
針對(duì)股票間的相關(guān)性,主要運(yùn)用Pearson相關(guān)系數(shù)、社會(huì)網(wǎng)絡(luò)的相關(guān)理論,從數(shù)據(jù)挖掘、數(shù)量統(tǒng)計(jì)、實(shí)證分析的角度出發(fā),利用Excel和UCINET分別建立Pearson相關(guān)系數(shù)、股票網(wǎng)絡(luò)、CONCOR分塊等模型.運(yùn)用個(gè)股回報(bào)率指標(biāo)建立Pearson相關(guān)系數(shù)模型度量股票間相關(guān)性,并根據(jù)相關(guān)性矩陣構(gòu)建股票網(wǎng)絡(luò),最后通過(guò)CONCOR分塊模型得到對(duì)股票市場(chǎng)行業(yè)的分塊.
股票間相關(guān)性;Pearson相關(guān)系數(shù);社會(huì)網(wǎng)絡(luò)模型;UCINET
影響股票價(jià)格的因素多樣導(dǎo)致股票市場(chǎng)變動(dòng)的不可預(yù)測(cè),如何理清同一板塊不同行業(yè)股票之間交錯(cuò)的影響關(guān)系,分析股票之間內(nèi)在的影響機(jī)制,關(guān)鍵在于對(duì)股票間相關(guān)性關(guān)系的研究,本文基于pearson相關(guān)系數(shù)模型分析同一板塊中股票之間的相互影響;在股票間相關(guān)關(guān)系系數(shù)的基礎(chǔ)上,選擇合適的閥值,閥值用于衡量股票間影響關(guān)系的強(qiáng)弱,在此基礎(chǔ)上建立股票間相關(guān)系數(shù)的網(wǎng)絡(luò)模型.
本文數(shù)據(jù)來(lái)源于安徽財(cái)經(jīng)大學(xué)校內(nèi)數(shù)學(xué)建模模擬題,為方便解決問(wèn)題提出四條假設(shè):(1)假設(shè)股票沒(méi)有分紅,考慮現(xiàn)金紅利再投資的周個(gè)股回報(bào)率和不考慮現(xiàn)金紅利再投資的周個(gè)股回報(bào)率相同;(2)假設(shè)選取的樣本股票能代表這一類型股票市場(chǎng)的整體狀況;(3)假設(shè)不同類型市場(chǎng)之間的相關(guān)性不強(qiáng),所以選取同一類型股票市場(chǎng)內(nèi)的股票數(shù)據(jù)進(jìn)行相關(guān)性研究;
2.1 研究思路
根據(jù)賽題附件中股票的相關(guān)數(shù)據(jù)選取合適的指標(biāo),利用時(shí)間序列相關(guān)性知識(shí),分析股票間的相關(guān)性,并建立合適的模型度量股票間的相關(guān)性.
首先,本文選取深圳B股為樣本進(jìn)行股票間相關(guān)性分析.其次,選擇兩支股票相同交易周份的數(shù)據(jù)進(jìn)行計(jì)算,如果某個(gè)交易周份只有一只股票有交易而另一只股票停牌等原因缺失的數(shù)據(jù)在計(jì)算過(guò)程中被忽略.最后,對(duì)篩選的數(shù)據(jù)選取合適的指標(biāo)進(jìn)行股票間相關(guān)性分析.
2.2 研究方法——Pearson相關(guān)系數(shù)計(jì)算公式
個(gè)股回報(bào)率計(jì)算公式:
式中hi為周個(gè)股回報(bào)率;si為周收盤價(jià)格;ki為周開盤價(jià)價(jià)格;i為證券編號(hào).
Pearson相關(guān)系數(shù)計(jì)算公式:
式中E為數(shù)學(xué)期望;cov(x,y)為x,y之間的協(xié)方差;ρxy為x,y之間皮爾遜相關(guān)系數(shù);x和y是任意兩支股票所對(duì)應(yīng)的個(gè)股回報(bào)率;σx,σy為任意兩支股票所對(duì)應(yīng)個(gè)股回報(bào)率的方差.
2.3 數(shù)據(jù)處理
選取市場(chǎng)類型為8(深圳B股),交易周份為2013年8 到32周的所有股票,利用上述模型求得各股票間相關(guān)性(鑒于所得表格數(shù)據(jù)太多,這里從略).
2.4 結(jié)果分析
Pearson相關(guān)系數(shù)是一種度量?jī)蓚€(gè)變量間相關(guān)程度的方法,文中使用該指標(biāo)度量股票間相關(guān)性.并對(duì)Pearson相關(guān)系數(shù)模型做出三點(diǎn)評(píng)價(jià):⑴以個(gè)股回報(bào)率為變量指標(biāo),利用Pearson相關(guān)系數(shù)模型分析股票間相關(guān)性;⑵Pearson相關(guān)系數(shù)要求變量是連續(xù)變量,本題中以周作為交易周分,即可視為連續(xù)變量;⑶每個(gè)證券代碼代表的股票的個(gè)股回報(bào)率均為上市公司運(yùn)營(yíng)情況所導(dǎo)致股息的變化和市場(chǎng)利率決定,故各變量之間相互獨(dú)立,符合Pearson相關(guān)系數(shù)約束條件.
3.1 研究思路
在前文中以市場(chǎng)8為例得出股票間的相關(guān)系數(shù),在此基礎(chǔ)上,構(gòu)建該股票市場(chǎng)環(huán)境下股票間的相關(guān)系數(shù)矩陣.其次,分別選定閥值為0.5,0.55,0.6,0.65,0.7,0.75構(gòu)建社會(huì)網(wǎng)絡(luò),并統(tǒng)計(jì)對(duì)應(yīng)的結(jié)點(diǎn)個(gè)數(shù),觀察變化趨勢(shì),得出較合理的閥值,構(gòu)建對(duì)應(yīng)的股票網(wǎng)絡(luò).最后,從中心性角度分析網(wǎng)絡(luò)中各股票間的關(guān)系,得出整個(gè)股票網(wǎng)絡(luò)的特性.
定理1網(wǎng)絡(luò)構(gòu)建原則:本文中的網(wǎng)絡(luò)是基于股票價(jià)格相關(guān)系數(shù)Cij而建立起來(lái)的股票網(wǎng)絡(luò),由于股票間的關(guān)系只有兩種情況:有關(guān)系和無(wú)關(guān)系.選定了閥值后,如果兩支股票的相關(guān)系數(shù)Cij>P,則說(shuō)明兩支股票間有關(guān)系,記作1,否則記作0. 3.2數(shù)據(jù)處理
以問(wèn)題二中計(jì)算所得44支股票間的相關(guān)系數(shù)構(gòu)建相關(guān)系數(shù)矩陣,部分?jǐn)?shù)據(jù)如圖1:
圖1 相關(guān)矩陣部分截圖
將相關(guān)系數(shù)矩陣轉(zhuǎn)化為UCINET數(shù)據(jù),在給定閾值0.5的基礎(chǔ)上,分別選取一系列新的閾值點(diǎn),構(gòu)建相應(yīng)的網(wǎng)絡(luò)結(jié)構(gòu)圖,并算出每個(gè)閾值所構(gòu)建的網(wǎng)絡(luò)的最大連通子圖的節(jié)點(diǎn)個(gè)數(shù),如表2所示.
根據(jù)表2,做出節(jié)點(diǎn)個(gè)數(shù)隨閥值變化的趨勢(shì)圖,如圖2.
圖2 節(jié)點(diǎn)變化趨勢(shì)圖
由圖2可得,隨著閥值的不斷增加,網(wǎng)絡(luò)圖的節(jié)點(diǎn)個(gè)數(shù)不斷減少,整個(gè)網(wǎng)絡(luò)中的散點(diǎn)數(shù)不斷增加,越來(lái)越多的節(jié)點(diǎn)成為獨(dú)立的散點(diǎn),同時(shí)網(wǎng)絡(luò)結(jié)構(gòu)業(yè)越來(lái)越清晰.因此,選定0.65為最佳閥值,對(duì)原相關(guān)系數(shù)矩陣進(jìn)行篩選,做出對(duì)應(yīng)的股票網(wǎng)絡(luò)結(jié)構(gòu)圖如圖3:
圖3 股票網(wǎng)絡(luò)結(jié)構(gòu)圖
3.3 中心性分析
分析股票市場(chǎng)的網(wǎng)絡(luò)中心性時(shí),本文從度數(shù)中心度及中間中心度兩個(gè)方面進(jìn)行分析.
分析度數(shù)中心度
一個(gè)核心點(diǎn)是處在一系列關(guān)系“核心”位置的點(diǎn),該點(diǎn)與其它點(diǎn)有多個(gè)直接聯(lián)系.因此,對(duì)點(diǎn)A的度數(shù)中心度的最簡(jiǎn)單的測(cè)量就是運(yùn)用圖中點(diǎn)A的各種度數(shù),即與點(diǎn)A直接相連的其他點(diǎn)的個(gè)數(shù).如果用CAD代表絕對(duì)度數(shù)中心度,那么,一個(gè)點(diǎn)x的絕對(duì)度數(shù)中心度的表達(dá)式為CAD(x).如果某點(diǎn)具有最高的度數(shù),則稱該點(diǎn)居于中心.
由于上述網(wǎng)絡(luò)是無(wú)方向的,上述公式為:C'RD(x)=x,其中n是網(wǎng)絡(luò)的規(guī)模.如果C'RD(x)=0,點(diǎn)x就是一個(gè)孤立點(diǎn);反之,如果C'RD(x)=1,點(diǎn)x就是圖的核心點(diǎn)之一.運(yùn)用UCINET軟件對(duì)閥值為0.65時(shí)的數(shù)據(jù)進(jìn)行分析,以各個(gè)股票為中心求出中心度,按照中心度降序排序,得出各股票分析數(shù)據(jù),如圖4:
從股票網(wǎng)絡(luò)總體分析,股票200521度數(shù)中心度最大,相對(duì)中心度及相關(guān)份額也高于其他股票,在股票網(wǎng)絡(luò)圖中占據(jù)著中間的位置.但是,度數(shù)中心度大于20的股票僅有9支,占有31.4%的市場(chǎng)份額,因此可見,不同的股票間存在明顯的分水嶺,具有核心影響力的股票只是股票市場(chǎng)中的小部分,其他股票間的關(guān)聯(lián)程度相對(duì)較弱.
相關(guān)性系數(shù)模型與實(shí)際的聯(lián)系緊密,利用EXCEL和UCINET軟件對(duì)數(shù)據(jù)進(jìn)行處理并作出各種分析圖形,使股票網(wǎng)絡(luò)更加簡(jiǎn)潔、明了、直觀的呈現(xiàn),易于理解和接受;但是無(wú)向網(wǎng)絡(luò)模型只能根據(jù)相關(guān)性系數(shù)體現(xiàn)兩只股票之間的相關(guān)性,但是卻不能體現(xiàn)兩只股票間定向影響關(guān)系,不能體現(xiàn)兩只股票誰(shuí)對(duì)誰(shuí)的影響力較強(qiáng).
本文通過(guò)相關(guān)系數(shù),中心度分析等方法,對(duì)股票間相關(guān)關(guān)系進(jìn)行分析,為股票間相關(guān)關(guān)系的分析研究提供了更廣泛的思路.
〔1〕http://www.szse.cn/;2014年8月27日;深圳證券交易所.市場(chǎng)數(shù)據(jù)查詢.
〔2〕http://www.eastmoney.com/;2014年8月27日;東方財(cái)富網(wǎng).證券編號(hào)查詢.
〔3〕余壽喜,韓立巖.中國(guó)股票市場(chǎng)行業(yè)交易額分布特征研究[J].首都經(jīng)濟(jì)貿(mào)易大學(xué)學(xué)報(bào),2006.
〔4〕楊桂元,黃己立.?dāng)?shù)學(xué)建模[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2008.
〔5〕羅家德.社會(huì)網(wǎng)分析講義[M].社會(huì)科學(xué)文獻(xiàn)出版社,20010.
F833.48
A
1673-260X(2015)05-0032-02
國(guó)家自然科學(xué)項(xiàng)目(11301001);安徽財(cái)經(jīng)大學(xué)教研項(xiàng)目(acjyzd201429)