張望舒
摘要:本文選取了28支在我國交易所掛牌上市的房地產(chǎn)行業(yè)股票,9項分別從盈利能力、成長能力、償債能力以及公司的股本擴張能力中選取的具有代表性的公司財務狀況指標。對其進行聚類分析,主要思路為:先對其應用NbCIus咆中NbcIust()函數(shù)得到最優(yōu)聚類類數(shù),再應用六種系統(tǒng)聚類方法以及K-means聚類方法對其進行聚類,畫出樹狀圖并得出分類結(jié)果,再結(jié)合實際對其進行分析。
關(guān)鍵詞:房地產(chǎn)行業(yè)股票 Rstudio 聚類分析
一、數(shù)據(jù)描述性分析
(一)數(shù)據(jù)來源
因考慮到不同行業(yè)間的數(shù)據(jù)差異可能會很大,這對分析結(jié)果會帶來較大誤差。故本文僅以房地產(chǎn)行業(yè)為例,隨機選取28家上市公司2018年上半年度相關(guān)信息進行分析。數(shù)據(jù)如表l所示。
由于衡量上市公司的股票價值的財務指標數(shù)量紛繁復雜,為了使統(tǒng)計分析更易進行,經(jīng)過分類與挑選,最終在不損失衡量股票價值有效信息的前提下,盡可能地縮減了指標個數(shù)。查詢資料發(fā)現(xiàn),目前評估上市公司基本面狀況最為核心的財務能力指標是上市公司的贏利能力、成長能力、償債能力以及公司的股本擴張能力。由此,本文在上市公司財務指標中選取如下反映這些能力的9項重要指標:總資產(chǎn)、每股收益、流動比率、速動比率、應收賬款周轉(zhuǎn)率、凈資產(chǎn)收益率、營業(yè)收入增長率、凈利潤增長率,總資產(chǎn)增長率。
(二)相關(guān)性分析
為了更加清楚所選擇的各指標間的相關(guān)關(guān)系,接下來,我又對每股收益,流動比率,速動比率,應收帳款周轉(zhuǎn)率,凈資產(chǎn)收益率,營業(yè)收入增長率,凈利潤增長率,總資產(chǎn)增長率這些指標兩兩之間進行了相關(guān)性分析,做出相關(guān)系數(shù)矩陣圖(如圖1所示)。
二、關(guān)于股票評級的聚類分析
(一)評判聚類的類數(shù)
為了得到更加準確的最終聚類方案就必須事先確定類的個數(shù),此處,我應用了NbClust包中NbClust()函數(shù)所提供的30個不同指標來幫助我進行選擇。最終,我發(fā)現(xiàn)所有聚類方法的最優(yōu)類數(shù)均為2類。故之后,我主要將所討論的房地產(chǎn)行業(yè)股票聚為2類。
(二)系統(tǒng)聚類法
運行Rstudio程序后我發(fā)現(xiàn),6種系統(tǒng)聚類法(最短距離法、最長距離法、中間距離法、類平均法、重心法、Ward法)所聚出來的結(jié)果是完全相同的。且各種系統(tǒng)聚類方法所聚類數(shù)為2時的指數(shù)評分均為7或8分,足以看出這個聚類結(jié)果還是十分有可信度的。(聚類圖如圖2所示,分類結(jié)果如表2所示)。
(三)K-均值聚類法
K-均值聚類的目的是將幾個點劃分到k個聚類中,使每個點都屬于離它最近的聚類中心。通過事先評估,發(fā)現(xiàn)類數(shù)為2時,評分已經(jīng)高達了11.所以在這里,我將這幾支股票聚為兩類,并得到兩個聚類中心各項指標的均值,如下表所示:
(四)評價與分析
聚類后我發(fā)現(xiàn),聚類結(jié)果主要分為2種:系統(tǒng)聚類法中的6種方法所聚出來的結(jié)果是相同的,而K一均值聚類法又聚出了另一種結(jié)果。通過與實際情況對比,可以發(fā)現(xiàn),并不存在哪種聚類方法好或者不好,因為它們的分類依據(jù)是不同的。即系統(tǒng)聚類方法將其聚成了地產(chǎn)行業(yè)龍頭企業(yè)與非龍頭企業(yè)。即:萬科A,保利地產(chǎn),綠地控股這三家地產(chǎn)上市公司均屬于該行業(yè)龍頭企業(yè)。不僅在總資產(chǎn)與每股收益排名在所選樣本前三,而且增長穩(wěn)健,流動比率與速動比率也十分適中。
而K-均值聚類所聚出來結(jié)果,則將其聚成了正常企業(yè)與問題企業(yè),即2類中有三支都被打上了sT標志,有一家天業(yè)更是打上了星號。這意味著這家公司已經(jīng)連續(xù)三年虧損,并正在面臨退市風險。而另外兩家企業(yè),陽光股份總資產(chǎn)只有68.71億元,增長率更是全部為負。嘉凱城每股收益,凈資產(chǎn)收益率,凈利潤增長率,總資產(chǎn)增長率也全部為負值。
綜上所述,兩種聚類方法都具有實際意義。故在使用這兩種聚類方法時,僅需根基自己實際需要選擇。