姜婷
【摘要】本文利用2006年滬深股市24家房地產(chǎn)上市公司的年報數(shù)據(jù),利用SAS軟件來展現(xiàn)主成分分析在房地產(chǎn)數(shù)據(jù)中的應(yīng)用,并得出結(jié)論,認為用主成分分析在預(yù)處理數(shù)據(jù)上發(fā)揮了重要作用,使得主成分分析與其他統(tǒng)計方法更好地結(jié)合應(yīng)用。
【關(guān)鍵詞】主成分分析;房地產(chǎn);SAS
1引言
21世紀(jì)以來,國內(nèi)的房地產(chǎn)行業(yè)日漸火爆,房價上漲迅速,房地產(chǎn)業(yè)正在逐步成為很多地區(qū)經(jīng)濟發(fā)展的強支柱,不僅拉動著經(jīng)濟的增長,也在改善人民的居住水平。但是在發(fā)展的過程中,房地產(chǎn)市場的泡沫不斷增大,房價的虛高也增加了百姓住房的困難,使得過多資本流人到房地產(chǎn)業(yè)。針對這些情況,政府也實事求是地出臺了各種政策,從2005年的“新國八條”到2017年的宏觀調(diào)控政策,大力發(fā)展“互聯(lián)網(wǎng)+”模式等都是為了減小百姓在住房問題上的壓力。
2主成分分析基本思想
當(dāng)我們在研究某個課題或項目時,為了更準(zhǔn)確、更全面地反映所研究對象的特點及其發(fā)展規(guī)律時,我們第一反應(yīng)就是尋找與其有關(guān)的因素,這樣會產(chǎn)生兩個問題:一是由于害怕丟失原始數(shù)據(jù)的重要信息,會自然地考慮很多指標(biāo),這就增加了研究過程的復(fù)雜度:二是選取的指標(biāo)之間會出現(xiàn)多重共線性問題,就會抹殺所研究對象的內(nèi)部真實特點和規(guī)律。針對上述問題,我們就會希望在定量研究中能有個兩全其美的辦法,既可以減少涉及的變量個數(shù),又不會遺漏重要的信息。而主成分分析恰是研究如何通過對具有一定相關(guān)性的多個變量進行線性組合得到幾個不相關(guān)的綜合指標(biāo),且能解釋原始數(shù)據(jù)的絕大部分信息。
變量問存在一定的相關(guān)性,通過對原始變量的相關(guān)矩陣或者協(xié)方差陣內(nèi)部關(guān)系的研究,利用線性變換,將相關(guān)的原始變量轉(zhuǎn)變?yōu)椴幌嚓P(guān)的新的綜合變量,這既保留了絕大部分的原始信息,也起到降維和簡化問題的作用。
要想從研究對象錯綜復(fù)雜的關(guān)系中得到一些主干特點,主成分分析就恰好發(fā)揮了作用,通過這種多元統(tǒng)計方法,可以有效利用海量數(shù)據(jù)進行定量分析,揭示研究對象的內(nèi)部信息,進一步挖掘其內(nèi)在發(fā)展規(guī)律,從而能對癥下藥,找出實事求是的解決辦法。
3實證分析
3.1樣本選取與數(shù)據(jù)來源
本文采用2006年滬深股市24家房地產(chǎn)上市公司的年報數(shù)據(jù),利用SAS軟件研究我國房地產(chǎn)上市公司盈利能力與資本結(jié)構(gòu)之間的關(guān)系。我們將銷售凈利率x1.資產(chǎn)凈利率x2.凈資產(chǎn)收益率x3及銷售毛利率x4納為反映上市公司盈利能力的指標(biāo),用資產(chǎn)負債率v來反映公司資本結(jié)構(gòu)。
3.2實證結(jié)果分析
3.2.1相關(guān)性分析
先用Excel對這五個變量做一個折線圖,了解各房地產(chǎn)上市公司資產(chǎn)負債率與銷售凈利率等其他變量的關(guān)系,發(fā)現(xiàn)各房地產(chǎn)上市公司資產(chǎn)負債率與銷售凈利率等其他變量的關(guān)系并不完全相關(guān)。
根據(jù)上市公司盈利能力四項指標(biāo)之間的相關(guān)系數(shù)矩陣結(jié)果,除了銷售毛利率與資產(chǎn)凈利率之間的相關(guān)系數(shù)相對較低,約為0.17.其他指標(biāo)之間的相關(guān)系數(shù)都相對比較高:銷售毛利率與銷售凈利率相關(guān)系數(shù)約為0.45.凈資產(chǎn)收益率與銷售凈利率的相關(guān)系數(shù)將近為0.67.資產(chǎn)凈利率與銷售的凈利率相關(guān)系數(shù)約達到0.8.資產(chǎn)凈利率與凈資產(chǎn)的收益率之間的相關(guān)系數(shù)甚至高達0.9。這說明四個指標(biāo)之間存在顯著相關(guān)性,指標(biāo)之間具有多重共線性,所以采用主成分分析法對四個指標(biāo)進行降維。
3.2.2主成分分析
根據(jù)相關(guān)系數(shù)矩陣計算出的所有特征值、相鄰兩個特征值之間的差值、每個特征值對應(yīng)的方差貢獻率以及累積貢獻率。特征值越大那就說明它所對應(yīng)的主成分變量包含信息就越多。第一個至第四個主成分貢獻率分別約為67.12%、25.20%、6.09%、1.59%,前兩個主成分就包含了原來四個指標(biāo)92.32%的信息,所以表明可以提取前兩個主成分。
然后根據(jù)全部特征值對應(yīng)的特征向量,就得到各主成分的數(shù)理關(guān)系式,即:
各標(biāo)準(zhǔn)化指標(biāo)前面的系數(shù)絕對值越大,說明該主成分受該指標(biāo)的影響就越大。前三個標(biāo)準(zhǔn)化指標(biāo)對第一主成分大小的影響差不多,都在0.55上下波動:決定第二主成分z,大小主要為銷售毛利率,其系數(shù)高達0.9:影響第三主成分大小主要為銷售凈利率和凈資產(chǎn)收益率,系數(shù)分別約為-0.75、0.55.二者對第三主成分大小的作用相反:決定第四主成分大小主要為資產(chǎn)凈利率和凈資產(chǎn)收益率,系數(shù)分別約為-0.78、0.54.二者對第四主成分大小的作用也相反。
由此得出:第一個主成分與前三個指標(biāo)關(guān)系都比較大,說明它主要涵蓋前三個指標(biāo)的信息,第一個主成分可以稱之為“公司資產(chǎn)的獲利能力”;而第二個主成分主要涵蓋了第四個指標(biāo)的信息,可以稱之為“公司的經(jīng)營能力”。
3.2.3綜合評價
由于主成分z1和z2從不同角度反映了這24家上市公司的盈利能力,所以可以考慮按z1和z2的加權(quán)平均值進行排序,然后了解哪一家上市公司的盈利能力最好。根據(jù)結(jié)果顯示:中糧地產(chǎn)的三項指標(biāo)均名列第一,而高新發(fā)展綜合排名倒數(shù)第一。
4總結(jié)
在研究房地產(chǎn)信息時會有大量的數(shù)據(jù),這些數(shù)據(jù)并不都是有用的,如果在研究某些自變量對某一個因變量影響程度時,把自變量都納入研究范疇,就會出現(xiàn)大量信息重疊情況,無法準(zhǔn)確反映原始數(shù)據(jù)的重要信息。用較少數(shù)量的特征對樣本指標(biāo)進行降維就特別重要。所以在分析數(shù)據(jù)時,主成分分析占有重要的地位。