[摘 要] 利用數(shù)據(jù)挖掘技術(shù)中的聚類分析方法進行財務(wù)分析#65377;選取幾個核心的財務(wù)指標數(shù)據(jù),利用SPSS分析軟件對我國上市房地產(chǎn)公司進行聚類分析,將其分類,為投資者提供最佳的決策依據(jù)#65377;
[關(guān)鍵詞] 數(shù)據(jù)挖掘;聚類分析;財務(wù)分析
[中圖分類號]F275[文獻標識碼]A[文章編號]1673-0194(2009)03-0030-03
1 數(shù)據(jù)挖掘技術(shù)
從商業(yè)角度來看數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點是對商業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進行抽取#65380;轉(zhuǎn)換#65380;分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性信息#65377;數(shù)據(jù)挖掘就是從大量的#65380;不完全的#65380;有噪聲的#65380;模糊的#65380;隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的#65380;人們事先不知道的#65380;但又是潛在有用的信息和知識的過程[2]#65377;
數(shù)據(jù)挖掘的分析方法有許多,如關(guān)聯(lián)分析#65380;聚類分析#65380;人工神經(jīng)網(wǎng)絡(luò)和決策樹等#65377;它被應(yīng)用到公司客戶關(guān)系管理#65380;投資項目決策#65380;銀行風(fēng)險評估和金融市場股價分析等眾多領(lǐng)域#65377;
2 聚類分析
聚類分析是數(shù)據(jù)挖掘技術(shù)中的重要分析技術(shù),是通過數(shù)據(jù)建模簡化數(shù)據(jù)的一種方法,研究成果主要集中在基于距離和相似度的聚類方法#65377;就數(shù)據(jù)挖掘功能而言,聚類能夠作為一個獨立的工具獲得數(shù)據(jù)的分布狀況,觀察每一簇數(shù)據(jù)的特征,集中對特定的聚簇集合作進一步的分析,聚類分析主要針對的數(shù)據(jù)類型包括區(qū)間標度變量#65380;二元變量#65380;標稱變量#65380;序數(shù)型變量#65380;比例標度變量以及由這些變量類型構(gòu)成的符合類型[5]#65377;
稱為數(shù)據(jù)矩陣#65377;數(shù)據(jù)矩陣是對象—變量結(jié)構(gòu)的數(shù)據(jù)表達方式#65377;
相異度矩陣(Dissimilarity Matrix),按n個對象兩兩間的相異度構(gòu)建n 階矩陣,又因為相異度矩陣是對稱的,只需寫出上三角或下三角即可:
其中d(i, j)表示對象i與j的相異度,它是一個非負的數(shù)值#65377;當對象i與j越相似或“接近”時,d(i, j)值越接近0;反之,d(i, j)值越大#65377;相異度矩陣是對象—對象結(jié)構(gòu)的一種數(shù)據(jù)表達方式#65377;多數(shù)聚類算法都是建立在相異度矩陣基礎(chǔ)上,如果數(shù)據(jù)是以數(shù)據(jù)矩陣形式給出的,就要將數(shù)據(jù)矩陣轉(zhuǎn)化為相異度矩陣#65377;對象間距離是經(jīng)常采用的求相異度方法#65377;
3 房地產(chǎn)類上市公司聚類分析研究
3. 1確定挖掘?qū)ο?/p>
財務(wù)分析是管理中不可缺少的工具,是在會計信息供給與會計信息需求之間架起的一座橋梁,它通過對會計信息的透視與剖析,滿足會計信息需求者的不同要求[1]#65377;財務(wù)狀況反映了公司的運營狀況#65377;本文選取了我國上市公司中20家具有代表性的房地產(chǎn)公司進行分析:招商地產(chǎn)(000024)#65380;萬科A(000002)#65380;棲霞建設(shè)(600533)#65380;榮盛發(fā)展(002146)#65380;中糧地產(chǎn)(000031)#65380;中華企業(yè)(600675)#65380;華發(fā)股份(600325)#65380;保利地產(chǎn)(600048)#65380;金地集團(600383)等,分別用X1,X2,X3,…,X20表示#65377;可以預(yù)測大部分公司屬于一類,也即表現(xiàn)一般,它們將歸為一類;很少一部分歸為一類,也即表現(xiàn)業(yè)績優(yōu)良或是較差#65377;再利用其他輔助指標就可以判定哪些是值得投資的#65377;
3. 2數(shù)據(jù)準備
3. 2. 1數(shù)據(jù)選取
以2008年3月31日為時點,選取20家上市房地產(chǎn)公司以下關(guān)鍵財務(wù)數(shù)據(jù):流動資產(chǎn)合計#65380;總資產(chǎn)合計#65380;流動負債合計#65380;長期負債合計#65380;資本公積#65380;盈余公積#65380;未分配利潤7個財務(wù)數(shù)據(jù),分別用L1,L2,L3,…,L7表示(見表1)#65377;
表3反映了聚類分析的凝聚過程#65377;
第一列表示聚類分析的步驟,在本次分析中共進行了19次#65377;第二和第三列表示哪兩個樣本聚成了一類#65377;第四列表示兩個樣本的相似系數(shù)#65377;第五列表示參與聚類的是樣本還是類,0表示樣本,非零數(shù)字N表示第N步產(chǎn)生的聚類參與本步聚類#65377;第七列表示本步驟聚類結(jié)果將在以后的第幾步中用到#65377;
第一行表示8和9兩個樣本最先進行了聚類,樣本間相似系數(shù)為0.998,本次聚類結(jié)果將在以后的第四步中用到;以此類推,將20個樣本全部聚類#65377;
表4是最終聚類結(jié)果的類成員表,在利用SPSS分析過程中,本文設(shè)置分為2~4類,從而輸出了劃分2~4類時每個樣本屬于某一類的結(jié)果#65377;
4 結(jié) 論
聚類分析事前并沒有制定分類的標準#65377;本文中,當劃分為兩類的時候,只有銀基發(fā)展和其他不同類,通過傳統(tǒng)的財務(wù)分析方法可以得出,其總資產(chǎn)增長率為負;當劃分為3類時,天倫置業(yè)各項指標表現(xiàn)都較差,其總資產(chǎn)周轉(zhuǎn)率是最低的;當劃分為4類時,華業(yè)地產(chǎn)的總資產(chǎn)周轉(zhuǎn)率和凈資產(chǎn)報酬率都不錯,尤其是速動比率最大#65377;聚類分析對于通過財務(wù)指標理性選擇值得投資的上市公司起到了積極的作用,但一個企業(yè)的價值衡量并不限于此,聚類分析只是提供了一個可以橫向比較同類上市公司的工具#65377;
主要參考文獻
[1] 葛家澍. 財務(wù)會計理論#65380;方法#65380;準則探討[M]. 北京:中國財政經(jīng)濟出版社,2002.
[2] 〔加〕 Jiawei Han,M kamber. 數(shù)據(jù)挖掘技術(shù)與概念[M]. 北京:機械工業(yè)出版社,2001.
[3] 李劍鋒,李一軍,祁威,等. 數(shù)據(jù)挖掘在公司財務(wù)分析中的應(yīng)用[J]. 計算機工程與應(yīng)用,2005(2).
[4] 林偉林,林有. 數(shù)據(jù)挖掘在上市公司財務(wù)狀況分析中的應(yīng)用[J]. 市場周刊:財經(jīng)論壇,2004(10).
[5] 李雄飛,李軍. 數(shù)據(jù)挖掘與知識發(fā)現(xiàn)[M]. 北京:高等教育出版社,2003.
[6] 章文波,陳紅艷. 實用數(shù)據(jù)統(tǒng)計分析及SPSS 12.0應(yīng)用[M]. 北京:人民郵電出版社,2006:179-192.
“本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文”