摘 要:由于面板數(shù)據(jù)是時序數(shù)據(jù)與面板數(shù)據(jù)的結(jié)合,使得多指標(biāo)的面板數(shù)據(jù)聚類分析存在一定的困難。針對這一問題,本文設(shè)計選取2014年-2018年39家公司的8個財務(wù)指標(biāo)來反映其財務(wù)狀況,并對每一年度數(shù)據(jù)進行主成分分析提取主成分,并利用每個公共因子的方差貢獻率占累計方差貢獻率的比例來進行加權(quán)最終得到綜合得分指標(biāo),在此基礎(chǔ)上通過系統(tǒng)聚類法進行分類。最后通過實證研究表明此方法的聚類效果擁有一定的合理性和可解釋性。
關(guān)鍵詞:多指標(biāo)面板數(shù)據(jù);財務(wù)狀況;主成分方法;聚類分析
一、引言
當(dāng)我們對特定的事物進行實際研究時,從更全面和嚴(yán)謹?shù)慕嵌葋砜?,人們通常要采取與其相關(guān)的多個指標(biāo),同時也需要考慮多種維度。而面板數(shù)據(jù)就是同時兼顧時間維度與空間維度,所以能夠盡可能多地包含更多的信息,也能揭示事物發(fā)展的動態(tài)特點。近年來我國學(xué)者對面板數(shù)據(jù)的研究從無到有,日益增多,并在理論研究和實際應(yīng)用上都有了創(chuàng)新和進步,從相關(guān)研究來看,對面板數(shù)據(jù)加以利用與建模可以得到較為不錯的效果。鄭兵云(2008)闡述了面板數(shù)據(jù)的特點,并重新構(gòu)造了用于聚類分析過程中的距離函數(shù)及離差平方和函數(shù),最后通過實證研究證明其效果良好。王雙英等(2014)對面板數(shù)據(jù)中的因變量與自變量進行區(qū)分,通過定義不同的協(xié)方差,重構(gòu)度量數(shù)據(jù)間相似程度的距離函數(shù)。任娟(2013)改進了基于多指標(biāo)的面板數(shù)據(jù)聚類方法,將有序聚類理論融合進入傳統(tǒng)的方法中,實現(xiàn)了多指標(biāo)面板數(shù)據(jù)的有序聚類,實證結(jié)果表明了這種方法能夠解決一些時間維度上由于均值處理帶來的偏差。董鋒等(2009)選取一定時間段內(nèi)40家公司的多個R&D能力評價指標(biāo)為樣本,利用改進的因子分析方法處理面板數(shù)據(jù),最后得出能夠得到可以直觀地評價40家公司的綜合因子總得分。王澤東(2019)提出了能夠體現(xiàn)出面板數(shù)據(jù)的動態(tài)變化特征的趨勢距離概念,并且通過實證表明了在此基礎(chǔ)上的聚類方法具有較良好的穩(wěn)定性。吳利豐等(2013)通過三維的灰色凸關(guān)聯(lián)度來聚焦面板數(shù)據(jù)的聚類方法,作者提出使用數(shù)據(jù)的凸性表征樣品之間的相近程度,并使用二階的差商值來近似代替二階導(dǎo)數(shù),實證表明該種方法具有很大的改良性。
通過在前人研究基礎(chǔ)上的學(xué)習(xí)與借鑒,本文將對面板數(shù)據(jù)先進行分年度的主成分分析,得到各個樣本的綜合得分時間序列,在此基礎(chǔ)上通過系統(tǒng)聚類法對面板數(shù)據(jù)實現(xiàn)聚類分析。
二、多指標(biāo)面板數(shù)據(jù)特征
1.單指標(biāo)面板數(shù)據(jù)
單指標(biāo)的面板數(shù)據(jù)可以用一個二維表格來表示,其中每一個元素都可以用
2.多指標(biāo)面板數(shù)據(jù)
多指標(biāo)面板數(shù)據(jù)具有時間序列數(shù)據(jù)和截面數(shù)據(jù)的特征,是兩者的結(jié)合,它不能再和單指標(biāo)面板數(shù)據(jù)一樣用二維表來表示,但我們可以用一個三維矩陣來描述它。設(shè)有N個研究總體,每個個體的記錄時間為T,共選取了P個指標(biāo)來描述總體,那么第i個個體在第t時間上的第j個指標(biāo)可以表示為
三、多指標(biāo)面板數(shù)據(jù)聚類分析
1.利用主成分分析法進行特征提取
由于多指標(biāo)面板數(shù)據(jù)是一個三維的數(shù)據(jù),在處理的時候比較困難,因此本文采取先對面板數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,消除量綱的影響。視各個時間節(jié)點的數(shù)據(jù)為二維截面數(shù)據(jù),使用主成分分析法來進行特征的提取。主成分分析的意義在于對數(shù)據(jù)進行降維處理,從而簡化數(shù)據(jù),對原來復(fù)雜的數(shù)據(jù)關(guān)系進行簡明有效的統(tǒng)計分析。
對提取的主成分計算綜合得分,并通過每個公共因子的方差貢獻率占累積方差貢獻率的比例為權(quán)重系數(shù),這樣能夠考慮到每個主成分綜合原始信息的能力差別,這里我們選取的主成分是特征值大于1的。通過計算每個個體的加權(quán)綜合得分,就能得到一個加權(quán)綜合得分時間序列數(shù)據(jù)。
2.特征提取后的聚類分析
基于主成分分析法提取的加權(quán)綜合得分序列數(shù)據(jù),已經(jīng)減少了指標(biāo)維度,將面板數(shù)據(jù)轉(zhuǎn)化為一個時間序列數(shù)據(jù),每個個體對應(yīng)的是長度相等的時序數(shù)據(jù),此時我們可以使用二維截面數(shù)據(jù)的聚類方法對多指標(biāo)面板數(shù)據(jù)進行聚類。
本文嘗試?yán)孟到y(tǒng)聚類法進行聚類分析。采用歐式距離作為樣本相似性的度量,由于主成分分析需要將指標(biāo)進行標(biāo)準(zhǔn)化,得到的各主成分間不相關(guān),滿足歐氏距離的要求。
由于不同的類間距離計算方法,系統(tǒng)聚類法又可分為重心法、離差平方和法和類平均法等,雖然每種方法的優(yōu)缺點不同,但不可否認都有其可取之處。本文采取的方法是系統(tǒng)聚類法中多數(shù)學(xué)者經(jīng)過數(shù)次實驗認證的比較推薦的方法:類平均法中的組間聯(lián)結(jié)法。此方法與其他方法的差別就在于它在計算距離時只考慮兩類之間樣品之間距離的平均,雖然取平均的做法在一定程度上抵消了一些樣品之間差異性的表現(xiàn),但是平均值表達的方式一直有其穩(wěn)定性和計算便捷性的優(yōu)勢。
下面給出距離計算公式:
四、實證分析
1.數(shù)據(jù)來源與指標(biāo)選擇
綜合考慮影響公司財務(wù)狀況的各個指標(biāo),考慮到數(shù)據(jù)的可獲取性與數(shù)據(jù)的可靠性,并結(jié)合以往學(xué)者的研究,本文選取總結(jié)資產(chǎn)負債率、應(yīng)付賬款周轉(zhuǎn)率、凈資產(chǎn)收益率(ROE)、凈利潤現(xiàn)金含量、每股盈余公積、總資產(chǎn)同比增長率、流動比率、速動比率、現(xiàn)金比率和Z值這八個指標(biāo)為特征變量,綜合反映企業(yè)的財務(wù)狀況,通過公司的經(jīng)營情況,我們可以對公司做出的種種可能行為進行解釋其原因。其中總資產(chǎn)負債率和應(yīng)付賬款周轉(zhuǎn)率是評價公司負債程度的綜合指標(biāo),可以看出公司將債權(quán)人的資金進行經(jīng)營的能力如何,企業(yè)的流動負債的償付能力,合理的應(yīng)付賬款周轉(zhuǎn)率可以帶來更好的資金狀態(tài)。每股盈余公積是企業(yè)用來彌補虧損和增加資本的保障。總資產(chǎn)同比增長率代表了企業(yè)相較于上一年度的發(fā)展情況,公司資本規(guī)模的擴張程度可以從中反映,是一個企業(yè)成長的重要度量。流動比率、速動比率和現(xiàn)金比率都是用來描述企業(yè)能否快速變現(xiàn),形成資金鏈,來償還各種短期負債或流動負債。Z值是由美國學(xué)者Altman提出的,用來預(yù)警企業(yè)財務(wù)狀況的一個指標(biāo),因此也可以代表企業(yè)的財務(wù)狀況。本文的數(shù)據(jù)來源于wind數(shù)據(jù)庫,選取了39家上市公司在2104年-2018年間的財務(wù)指標(biāo)數(shù)據(jù)為樣本。
2.聚類分析
按照本文上述的方法,使用SPSS和Excel軟件進行操作。先對面板數(shù)據(jù)的每個年份數(shù)據(jù)進行主成分分析,根據(jù)方差貢獻率加權(quán)并得到其綜合得分,再對各公司進行系統(tǒng)聚類分析,以此達到對多指標(biāo)面板數(shù)據(jù)的聚類分析目的。在聚類分析后可以從冰柱圖和樹狀聚類圖看到各類分別包含的樣品。通常是通過聚合系數(shù)隨分類數(shù)變化的曲線,來確定樣本劃分的類數(shù)。本實驗可以比較明顯看出在分類數(shù)為5之后的曲線變化十分地緩慢,所以可以把樣品劃分為5類會比較符合分類的目的。
將樣本按五類劃分后,最終的聚類結(jié)果為:第一類為爾康制藥,ST慧球這兩家公司;第二類為華塑控股這一家公司;第三類為華創(chuàng)陽安這一家公司;第四類為青海春天這一家公司;第五類為科融環(huán)境、春興精工、澄星股份、佳電股份、圣萊達、青島中程、上海普天、武漢凡谷、中兵紅箭、聯(lián)建光電、華聞集團、ST康美、恒順醋業(yè)、ST銳電、ST中基、康欣新材ST天成、山東墨龍、迪馬股份、登云股份、嘉寓股份、北大荒、亞太實業(yè)、淮河能源、海聯(lián)訊、康達新材、南紡股份、啟迪古漢、亞星化學(xué)、華陽集團、寧波富邦、魯北化工、安妮股份、科達股份。
本文所選的公司都是曾經(jīng)被證監(jiān)會公開行政處罰的年度財務(wù)報表披露有虛假地方的公司,但各個公司在不同年度的財務(wù)狀況表現(xiàn)不一樣,進行虛假披露的年份和類型也不一樣。從上述分類結(jié)果來看最后一類囊括了大部分企業(yè),這也從一定的角度說明了相似的處于困境的財務(wù)狀態(tài)會使公司做出同樣的舉動,即虛報財務(wù)報表的行為,說明第五類中的34家公司在一定程度上是具有相似性的,分類的結(jié)果較為合理。
第一類是爾康制藥和ST慧球,這兩家公司在2015年和2016年這兩年都具有虛假披露財務(wù)報告的行為,故分為一類也是合理的。華塑控股是一家制造業(yè)企業(yè),被指控在2011年進行了年報披露造假,在之后的年份里并未發(fā)現(xiàn)造假行為,說明在之后的幾年內(nèi)企業(yè)的財務(wù)狀況比較良好。第三類華創(chuàng)陽安在2014年-2018年間的財務(wù)狀況表現(xiàn)正常,并未有虛假披露的狀況出現(xiàn),故自成一類。最四類是青海春天,該公司在2011年-2012年有虛假披露的行為,與其他類別表現(xiàn)也不同。從聚類結(jié)果來看,39家公司的不同財務(wù)狀況導(dǎo)致的虛假披露行為得到了比較合理的劃分。
五、總結(jié)
本文采用的聚類分析方法對多指標(biāo)面板數(shù)據(jù)的聚類分析具有一定的參考意義。該方法提供了多指標(biāo)面板數(shù)據(jù)的降維方法,使問題更加簡化,通過主成分分析降維后,面板數(shù)據(jù)就可簡要地轉(zhuǎn)化為截面數(shù)據(jù)的分析。利用此方法對2014年-2018年的39家公司的財務(wù)數(shù)據(jù)進行了實證研究,結(jié)果表明該方法得到的聚類結(jié)果有一定的合理性,對信息使用者有一定的參考價值。
參考文獻:
[1]鄭兵云.多指標(biāo)面板數(shù)據(jù)的聚類分析及其應(yīng)用[J].數(shù)理統(tǒng)計與管理.2008.(27):265-270.
[2]王雙英,王群偉,曹澤.多指標(biāo)面板數(shù)據(jù)聚類方法及應(yīng)用-以行業(yè)一次能源消費面板數(shù)據(jù)為例[J].數(shù)理統(tǒng)計與管理.2014.(33):42-49.
[3]任娟.多指標(biāo)面板數(shù)據(jù)融合聚類分析[J].數(shù)理統(tǒng)計與管理.2013.(32):57-67.
[4]董鋒,譚清美,周德.多指標(biāo)面板數(shù)據(jù)下的企業(yè)R&D能力因子分析[J].研究與發(fā)展管理.2009(21.):50-56.
[5]王澤東,鄧光明.基于趨勢距離的面板數(shù)據(jù)聚類方法探討[J].統(tǒng)計與決策.2019(08):34-38.
[6]吳利豐,劉思峰.基于灰色凸關(guān)聯(lián)度的面板數(shù)據(jù)聚類方法及應(yīng)用.[J].控制與決策.2013(28):1033-1045.
作者簡介:呂晨(1995- ),女,漢族,安徽宣城人,安徽大學(xué)經(jīng)濟學(xué)院,2018級研究生,應(yīng)用統(tǒng)計專業(yè)