楊博翔
北京交通大學(xué)中國產(chǎn)業(yè)安全研究中心博士后科研工作站,北京100032
基于優(yōu)勢粗糙集的證券投資決策研究及其應(yīng)用
楊博翔
北京交通大學(xué)中國產(chǎn)業(yè)安全研究中心博士后科研工作站,北京100032
粗糙集方法在金融及投資領(lǐng)域發(fā)揮著越來越大的作用,然而經(jīng)典粗糙集理論不能發(fā)現(xiàn)偏好多屬性決策表中與偏好屬性相關(guān)的不相容性。本文基于優(yōu)勢粗糙集理論的知識約簡算法,提出了基于優(yōu)勢關(guān)系的屬性重要度約簡算法,并構(gòu)建了基于優(yōu)勢粗糙集的證券投資分析模型,針對中國上市公司財務(wù)數(shù)據(jù)為連續(xù)值、分布未知、含有偏好信息等特征,對證券樣本進行綜合排序,得到最終的綜合排序和評價,并對算法進行有效性分析。
粗糙集;優(yōu)勢關(guān)系;證券投資決策
基于證券市場的全球化大背景,以及證券投資分析的重要作用,關(guān)于證券投資決策分析的理論和方法的研究已經(jīng)成為一個重要的前沿領(lǐng)域[1]。以往的證券投資分析方法由于預(yù)測的精度比較低,或由于過于苛刻的基本假設(shè)而在真實市場中無法完全實現(xiàn)等問題,影響投資者進行科學(xué)、正確的投資決策。因此需要研究更適合于管理決策的數(shù)據(jù)挖掘方法——粗糙集方法。在一個投資決策方案中,偏好屬性的順序特性是很重要的決策信息,這就決定了優(yōu)勢粗糙集比傳統(tǒng)的粗糙集理論對投資決策問題應(yīng)具有更強的適應(yīng)力和解釋力[2]。
將借鑒經(jīng)典粗糙集啟發(fā)式知識約簡算法提出基于優(yōu)勢關(guān)系的偏好決策表的有效算法。屬性約簡是以獲取最佳屬性約簡為目標(biāo)的,前提條件是不損失原有信息系統(tǒng)的信息。在經(jīng)典的約簡算法中,最直觀的就是使用刪除法,但該復(fù)雜度非常高,不適合于數(shù)據(jù)和屬性龐大的信息系統(tǒng)。為了降低復(fù)雜度,基于屬性重要度的約簡算法應(yīng)運而生,經(jīng)典的基于屬性重要度的約簡算法是建立在經(jīng)典粗糙集理論的基礎(chǔ)上的,因沒有考慮到?jīng)Q策者的偏好決策需要,而使得約簡結(jié)果容易產(chǎn)生不相容問題,大大制約了這種算法的使用。而在眾多基于DRSA的知識約簡算法中,以屬性重要度為約簡原則的算法還比較少。文章擬借鑒經(jīng)典的基于屬性重要度的約簡算法,充分考慮偏好關(guān)系,以屬性的重要性作為啟發(fā)規(guī)則,尋求基于優(yōu)勢關(guān)系的啟發(fā)式最小約簡算法?;趦?yōu)勢關(guān)系的啟發(fā)式最小約簡算法的主要思想是,判斷從條件屬性集中刪除某個屬性后,剩下的條件屬性集是否能將對象正確地劃分到?jīng)Q策屬性類中,最終找到與C的Cl分類質(zhì)量一致的C的最小子集。
2.1證券投資指標(biāo)體系的選擇與建立
2.1.1選擇指標(biāo)的原則一般來講,選購股票就是選擇上市公司。本文僅從證券投資者的角度出發(fā),按照以下原則選擇財務(wù)指標(biāo):
(1)由于不同行業(yè)在不同時期的情況不盡相同,如果選擇多種行業(yè)的股票會導(dǎo)致對排序和評價的結(jié)果產(chǎn)生不良影響,使結(jié)果可信度不高,因此,選擇一個行業(yè)板塊進行股票指標(biāo)的分析;
(2)考慮到指標(biāo)的客觀性、可比性原則,不選擇反應(yīng)公司經(jīng)營規(guī)模和財務(wù)規(guī)模的指標(biāo),如資產(chǎn)總額、利潤總額等,而是選擇能夠融合更多特征的指標(biāo),如每股凈資產(chǎn)、股東權(quán)益等財務(wù)比率指標(biāo);
(3)選擇指標(biāo)要盡可能體現(xiàn)公司的財務(wù)結(jié)構(gòu)、經(jīng)營效率、成長能力、盈利能力、以及抵抗風(fēng)險的能力,這些指標(biāo)能夠綜合反映出公司的經(jīng)營狀況和財務(wù)狀況,是進行投資選擇的重要指標(biāo)。
2.1.2證券投資指標(biāo)體系的選擇根據(jù)以上原則,在證券領(lǐng)域普遍認(rèn)為的證券指標(biāo)作為參照,確定以下9個證券投資財務(wù)指標(biāo):
(1)每股收益(元)=凈利潤/總股本;(2)每股凈資產(chǎn)(元)=股東權(quán)益/總股本;(3)每股資本公積金=資本公積金/總股本;(4)每股未分配利潤=未分配利潤/總股本;(5)每股經(jīng)營現(xiàn)金流量=經(jīng)營活動產(chǎn)生的現(xiàn)金流量凈額/總股本;(6)主營業(yè)務(wù)收入增長率(%)=(本期主營業(yè)務(wù)收入-上期主營業(yè)務(wù)收入)/上期主營業(yè)務(wù)收入;(7)凈資產(chǎn)收益率=凈利潤/股東權(quán)益;(8)股東權(quán)益比=股東權(quán)益/資產(chǎn)總額;(9)資產(chǎn)負(fù)債率=負(fù)債總額/資產(chǎn)總額。
其中,指標(biāo)1、2、3、4、5、7可以體現(xiàn)公司股票價值和盈利能力,指標(biāo)6可以體系公司經(jīng)營與發(fā)展能力,指標(biāo)8可以反應(yīng)公司財務(wù)結(jié)構(gòu),指標(biāo)9可以反應(yīng)公司抵抗風(fēng)險的能力。
2.2針對偏好決策表的兩種排序方法
2.2.1基于優(yōu)勢粗集權(quán)重的綜合排序方法基于優(yōu)勢粗集權(quán)重的綜合排序方法[3]的步驟:
(1)確定評價因素集C={C1,C2,...,Cn};
(2)確定評價目標(biāo)集U={S1,S2,...,Sm};
(4)建立基于DRSA[4]的權(quán)重矩陣;
(6)多級綜合排序:如果評價目標(biāo)的有關(guān)因素很多,很難合理的定出權(quán)數(shù)分配,就難以真實的反映各因素在整體中的地位,有時通過一次綜合排序很難分出評價等級,即評價次序,這時需要采取二級或多級評價。如綜合二級評價。其中。這里算子“∧”,“∨”表示取大,取小的含義;
(7)綜合評價。對綜合排序結(jié)果向量進行分析。
以上基于優(yōu)勢粗集權(quán)重的綜合排序方法的七個基本步驟,第四步和第七步為比較核心的兩個步驟,第六步根據(jù)實際需要選取,也可不進行。由此,以優(yōu)勢粗糙集相關(guān)理論為基礎(chǔ),應(yīng)用關(guān)系合成的原理,建立起基于優(yōu)勢粗集權(quán)重的綜合排序方法。
2.2.2基于擴展Vague值理論的偏好決策表綜合排序方法基于擴展Vague值的偏好決策表[5]綜合排序方法的一般步驟:
(1)據(jù)(1)式將偏好決策表中的評價目標(biāo)賦予擴展Vague值;
其中,tx表示基于優(yōu)勢關(guān)系擴展Vague集的肯定隸屬度,fx表示基于優(yōu)勢關(guān)系擴展Vague集的否定隸屬度為[6];Yl是含有m個分量的一維列向量,l=1,2。
(2)根據(jù)擴展Vague值建立構(gòu)造矩陣Y;(3)計算矩陣Y的最大特征值對應(yīng)的特征向量作為排序向量;(4)根據(jù)排序向量對Vague值排序,分量越大,Vague值越大;(5)根據(jù)排序結(jié)果進行綜合評價。
2.3基于優(yōu)勢粗糙集的證券投資分析模型
基于優(yōu)勢粗糙集的證券投資決策模型建立步驟:
(1)建立證券投資指標(biāo)體系;(2)從證券網(wǎng)站上選數(shù)支股票為樣本,輸入各指標(biāo)值并進行數(shù)據(jù)歸一處理,生成初始偏好決策表;(3)將指標(biāo)進行離散化,按照偏好順序作分級處理,生成分級評價偏好決策表;(4)對決策表按照基于優(yōu)勢關(guān)系的屬性重要度約簡算法進行知識約簡,得到約簡后的偏好決策表;(5)按照兩種綜合排序方法對所選股票進行綜合排序,得出評價結(jié)果,分析模型的有效性。
至此,證券投資決策模型構(gòu)建完成。
3.1樣本選擇及分析
本文從有色金屬板塊中隨機抽取了35支股票2009年第四季度的數(shù)據(jù)作為研究樣本,以9個財務(wù)指標(biāo)作為條件屬性,綜合評價作為決策屬性,由于這些屬性均是含有偏好信息的,如投資者希望每股收益總是越高越好,資產(chǎn)負(fù)債率越低越好,決策屬性也具有偏好信息,如評價等級越高,代表股票的質(zhì)量越好,越值得投資,因此19家上市公司的財務(wù)數(shù)據(jù)便形成了一張初始的偏好決策表。從該偏好決策表中任意抽取3個屬性,對其屬性值的分布情況進行分析,發(fā)現(xiàn)屬性的值域分布見圖1。
圖1所顯示的是每股收益、主營收入增長率、股東權(quán)益比率三個屬性指標(biāo)的分布情況,可以看出,該三個屬性指標(biāo)均為無序分布,即不服從現(xiàn)有已知的正態(tài)分布、均勻分布等。
圖1 證券指標(biāo)屬性值的分布Fig.1 Distribution of securities index properties
從以上屬性的分布及其他屬性的分布圖中可知,各屬性指標(biāo)值的分布均不相同,對于該樣本,首先對數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,然后利用基于優(yōu)勢關(guān)系的屬性重要度約簡算法進行知識約簡,得到約簡后的偏好決策表,再利用綜合排序方法對所選股票進行綜合排序,得出最終的評價結(jié)果[7]。
3.2綜合排序
3.2.1基于優(yōu)勢粗集權(quán)重的綜合排序方法
由偏好決策表可知評價矩陣為R
綜合評價模型
得到所選樣本的綜合排序為:
其中,“?”代表優(yōu)于,“{}”內(nèi)元素表示評價值相同。
3.2.2基于擴展Vague值理論的偏好決策表綜合排序方法基于優(yōu)勢關(guān)系擴展Vague集的肯定隸屬度為
基于優(yōu)勢關(guān)系擴展Vague集的否定隸屬度為
采用Eig函數(shù)[8],用Matlab計算得:最大的特征值為:δ=24.7517。
得到所選樣本的綜合排序為:
可見兩種方法得到的產(chǎn)品排序有一定的差異,從ω的值可以看出第二種方法得出樣本間的評價值非常接近,導(dǎo)致基于擴展Vague值理論的偏好決策表綜合排序方法對樣本數(shù)據(jù)分辨率不高,如果將精確度變低,將小數(shù)點后三位精確到小數(shù)點后兩位,再看兩種方法的綜合排序結(jié)果。
基于優(yōu)勢粗集權(quán)重的綜合排序方法:
基于擴展Vague值理論的偏好決策表綜合排序方法:
兩種方法的排序結(jié)果的擬合度較高,排序結(jié)果基本相同。
3.3有效性分析
當(dāng)結(jié)果取高精確度進行排序時,兩種排序方法的結(jié)果有一定的差異性,主要是由于基于擴展Vague值理論的偏好決策表綜合排序方法得出的評價值非常接近,對樣本數(shù)據(jù)分辨率不高,但這時排名前兩位和排名后兩位的股票是相同的,可以告訴投資者者22、28兩支股票評價值最高最值得推薦,18,31兩支股票評價值最低要謹(jǐn)慎投資,同理,兩種方法同樣排名靠前的股票2綜合評價值很高,股票26評價值都很低,模型不予推薦。
因此,當(dāng)只關(guān)心綜合評價最好的股票和綜合評價最不好的股票時,模型是適用的,這種情況對投資者也是有意義的,因為投資者在投資時可能不需要全部的排序,只需挑出1到2支評價最高的股票進行投資,或者知道評價最低的股票,從而在投資時不予購買;當(dāng)結(jié)果降低精確度進行排序時,兩種排序方法的結(jié)果基本相同,上述案例中35個樣本數(shù)據(jù),排序相同的有27支股票,只有1、8、12、19、24、25、32、33等8支股票不同,兩種方法的排序一致性達到77.14%,是一個滿意的結(jié)果,對于8支“另類”樣本,本文的模型可能不適應(yīng)這類數(shù)據(jù),對此將進行下一步研究。
首先,構(gòu)建了基于優(yōu)勢粗糙集的證券投資分析模型,提出了兩種綜合排序方法,給出了基于優(yōu)勢關(guān)系的偏好決策表的權(quán)重系數(shù),并在此基礎(chǔ)上給出了排序方法;利用上下聯(lián)合的粗糙隸屬函數(shù)基于優(yōu)勢關(guān)系擴展Vague集的肯定隸屬度、否定隸屬度,然后采用特征向量的方法,將不同的Vague區(qū)間值轉(zhuǎn)化特征向量,建立了基于擴展Vague值理論的偏好決策表綜合排序方法。根據(jù)上述研究,建立了基于優(yōu)勢粗糙集的證券投資分析模型的完整模型。最后,對所建立的基于優(yōu)勢關(guān)系的證券投資分析模型進行應(yīng)用研究,并取得了良好的效果。
[1]曾劍鋒,吳根秀.基于相異關(guān)系的粗糙集理論[J].江西師范大學(xué)學(xué)報:自然科學(xué)版,2004,28(5):426-430
[2]李鋼,張雪婷.基于相似關(guān)系粗糙集的分解[J].計算機工程與應(yīng)用,2004(2):85-87
[3]崔玉泉,張麗,史開泉.粗糙集的動態(tài)特性研究[J].山東大學(xué)學(xué)報:理學(xué)版,2010,45(6):8-14
[4]Ju S,Wu W,Zhang W.Approaches to Knowledge Reduction Based on Variable Precision Rough Set Model[J]. Information Sciences,2004(159):255-272
[5]楊青山,王國胤,張清華,等.基于優(yōu)勢關(guān)系的區(qū)間值粗糙集擴充模型[J].山東大學(xué)學(xué)報:理學(xué)版,2010,45(9):7-13
[6]菅利榮,達慶利,陳偉達.基于粗糙集的不一致信息系統(tǒng)規(guī)則獲取方法[J].中國管理科學(xué),2003,11(4):90-95
[7]安利平,陳增強,袁著扯.多準(zhǔn)則分級決策的擴展粗糙集方法[J].系統(tǒng)工程學(xué)報,2004,12,19(6):559-576
[8]侯福均,廖愛紅,吳祈宗.判斷信息為偏好序的社會選擇:特征向量法[J].南京理工大學(xué)學(xué)報:自然科學(xué)版,2008,32(12):80-83
Research andApplication of Securities Investment Decision Based on Rough Set Theory
YANG Bo-xiang
Postdoctoral Scientific Research Workstation of China Center for Industrial Security Research/Beijing Jiaotong University,Beijing 100032,China
Rough set method plays a more and more important role in finance and investment field.However,the classical rough set theory cannot find the incompatibility between preference attribute and preference attribute in the decision table. Under this background,this paper constructed the dominance rough set based on securities investment analysis model and for the Chinese Listed Companies'financial data for continuous value,distribution is unknown,preference information and other characteristics,the comprehensive sort of sample securities was made and the final comprehensive ranking and evaluation were gotten to analyze the validity of the algorithm.
Rough set theory;dominance relation;security investment decisions
TN202
A
1000-2324(2016)05-0785-04
2016-05-15
2016-06-18
楊博翔(1989-),男,湖南常德人,博士后,主要研究方向為金融產(chǎn)業(yè)安全.E-mail:yangboxiang7@126.com