左韶澤
摘 要:城市的經(jīng)濟(jì)發(fā)展水平是一個(gè)城市發(fā)展水平的重要體現(xiàn),但由于各方面的原因,城市間的經(jīng)濟(jì)發(fā)展水平差異越來(lái)越大。選取能夠體現(xiàn)經(jīng)濟(jì)發(fā)展水平的8個(gè)變量,利用因子分析的方法對(duì)山東省17市的經(jīng)濟(jì)發(fā)展水平進(jìn)行綜合分析。之后對(duì)得到的因子得分進(jìn)行聚類(lèi),將17市劃分為3個(gè)類(lèi)別,分析不同類(lèi)別之間的差異和影響因素,并對(duì)區(qū)域經(jīng)濟(jì)的協(xié)調(diào)發(fā)展提出一些建議。
關(guān)鍵詞:區(qū)域經(jīng)濟(jì);因子分析;聚類(lèi)分析
中圖分類(lèi)號(hào):F2 文獻(xiàn)標(biāo)識(shí)碼:Adoi:10.19311/j.cnki.1672-3198.2019.29.001
1 前言
山東省位于渤海與黃海之畔,是中國(guó)著名的經(jīng)濟(jì)強(qiáng)省之一。2018年山東省的生產(chǎn)總值高達(dá)7.6萬(wàn)億元,在全國(guó)排名第三。改革開(kāi)放以來(lái),全省經(jīng)濟(jì)持續(xù)快速發(fā)展,成為中國(guó)經(jīng)濟(jì)不可或缺的一部分,這與山東各市的貢獻(xiàn)是分不開(kāi)的。但由于多方面的原因,省內(nèi)區(qū)域經(jīng)濟(jì)發(fā)展差異顯著,尤其是在近些年來(lái)有進(jìn)一步拉大的趨勢(shì),這也將成為制約山東經(jīng)濟(jì)發(fā)展的一個(gè)重要問(wèn)題。因此本文選取2017年山東省17市體現(xiàn)經(jīng)濟(jì)發(fā)展水平的相關(guān)數(shù)據(jù),采用因子分析和聚類(lèi)分析來(lái)探索不同城市的經(jīng)濟(jì)發(fā)展情況,找到一些對(duì)山東省的區(qū)域經(jīng)濟(jì)差異造成影響的公共因素,借助這些公共因素,對(duì)山東各市的經(jīng)濟(jì)差異進(jìn)行一個(gè)客觀的評(píng)價(jià),并且找出造成這種經(jīng)濟(jì)差異的主要原因。最后希望能通過(guò)分析,提出一些行之有效的方法,能夠有利于山東省區(qū)域經(jīng)濟(jì)的協(xié)調(diào)發(fā)展。
2 模型介紹與指標(biāo)選取
2.1 模型介紹
因子分析的基本思想是根據(jù)相關(guān)性的大小對(duì)原始變量進(jìn)行分組,使同一組內(nèi)變量之間的相關(guān)性較高,不是同一組的變量間的相關(guān)性低。每組變量都是一個(gè)基本結(jié)構(gòu),用一個(gè)綜合變量表示,這個(gè)基本結(jié)構(gòu)被稱(chēng)之為公共因子。對(duì)所研究的一個(gè)具體問(wèn)題,原始變量可以分解成兩部分之和的形式:一部分是不可觀測(cè)的公共因子的線性函數(shù);另一部分是與公共因子無(wú)關(guān)的特殊因子。聚類(lèi)分析則是按照某種距離計(jì)算方法,對(duì)個(gè)體或?qū)ο蠓诸?lèi),使得同類(lèi)對(duì)象相似性最高,異類(lèi)對(duì)象差異性最大。
2.2 指標(biāo)選取
本文選取了X1-工業(yè)總產(chǎn)值、X2-就業(yè)人數(shù)、X3-城鎮(zhèn)人口數(shù)、X4-地區(qū)生產(chǎn)總值、X5-公共預(yù)算收入、X6-在崗職工工資總額、X7-住宿餐飲業(yè)就業(yè)人數(shù)和X8-貨運(yùn)總量8個(gè)指標(biāo),所有數(shù)據(jù)均來(lái)自《山東統(tǒng)計(jì)年鑒2018》。其中X2、X3、X6是反映城市規(guī)模的指標(biāo),X1、X8反映的是工業(yè)發(fā)展規(guī)模,X7反映第三產(chǎn)業(yè)的規(guī)模,X4、X5在一定程度上反映了國(guó)民收入水平。
3 因子分析
3.1 數(shù)據(jù)檢驗(yàn)
因子分析是為了從眾多的原始變量中綜合出少數(shù)幾個(gè)具有代表性的因子,這其中有一個(gè)要求,原有的變量間應(yīng)當(dāng)具有較強(qiáng)的相關(guān)關(guān)系。因?yàn)槿绻兞块g的相關(guān)關(guān)系弱的話,就無(wú)法從原始變量中綜合出反映某些變量共同特性的幾個(gè)較少的公共因子。因此在進(jìn)行因子分析前,需要對(duì)原始的變量是否相關(guān)進(jìn)行檢驗(yàn)。檢驗(yàn)結(jié)果顯示,所有相關(guān)變量的相關(guān)系數(shù)都大于0.3,大部分相關(guān)變量的相關(guān)系數(shù)較高,各變量具有較強(qiáng)的線性相關(guān)關(guān)系。巴特利特球度檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值是240.796,相應(yīng)的P值接近0。把顯著性水平α設(shè)為0.05,則相應(yīng)的概率P值小于顯著性水平α,應(yīng)當(dāng)拒絕原假設(shè),認(rèn)為相關(guān)系數(shù)矩陣與單位陣有顯著差異。同時(shí),KMO值為0.731,符合KMO度量標(biāo)準(zhǔn),所以原始變量適合進(jìn)行因子分析。
3.2 因子提取
在對(duì)原始變量進(jìn)行相關(guān)性檢驗(yàn)后,就應(yīng)該求解因子載荷矩陣進(jìn)行因子提取了。因子載荷矩陣的求法很多,本文使用的是在因子分析中占主要地位的主成分分析法。主成分分析法能夠?yàn)橐蜃臃治鎏峁┏跏冀?,因子分析是?duì)主成分分析的擴(kuò)展與補(bǔ)充。主成分分析法的核心就是通過(guò)原有變量的線性組合以及各個(gè)主成分的求解來(lái)達(dá)到對(duì)原始變量的降維目的。因?yàn)楸疚倪x取的變量數(shù)量級(jí)差異很大,而且單位不同,所以采用相關(guān)系數(shù)矩陣作為提取因子的依據(jù)。進(jìn)行因子提取后,根據(jù)因子的累計(jì)方差貢獻(xiàn)率來(lái)確定因子個(gè)數(shù)。一般選取累計(jì)方差貢獻(xiàn)率大于0.85時(shí)的特征值個(gè)數(shù)為因子個(gè)數(shù)k。本文提取了2個(gè)主因子,累計(jì)方差貢獻(xiàn)率達(dá)到了93.6%,基本體現(xiàn)了原始變量中所有的信息。
3.3 因子旋轉(zhuǎn)與命名
建立因子分析模型的目的不僅僅在于找到公共因子,更重要的是對(duì)公共因子進(jìn)行解釋?zhuān)軌蚋尤菀椎姆治鰧?shí)際問(wèn)題。然而,得到的初始因子解各主因子的代表變量常常不是很突出,容易造成因子意義含糊不清的后果,不容易分析實(shí)際問(wèn)題。因此,可以對(duì)初始公共因子進(jìn)行線性組合,通過(guò)線性組合來(lái)找到意義明確,更容易被解釋的公共因子,這就是因子旋轉(zhuǎn)。因子旋轉(zhuǎn)可以被分為正交旋轉(zhuǎn)和斜交旋轉(zhuǎn),二者各有優(yōu)劣。本文選用的是正交旋轉(zhuǎn)方式中的方差極大法,以便使因子更容易被命名解釋。旋轉(zhuǎn)后的因子載荷是按照第一個(gè)因子降序的順序輸出的,旋轉(zhuǎn)后的因子載荷矩陣如表1。
從表1可以看出,住宿餐飲業(yè)就業(yè)人數(shù)、公共預(yù)算收入、地區(qū)生產(chǎn)總值、在崗職工工資總額、工業(yè)總產(chǎn)值在第一個(gè)因子上的載荷都大于0.85,這幾個(gè)變量主要被因子一解釋?zhuān)梢岳斫鉃閷?duì)山東省內(nèi)區(qū)域經(jīng)濟(jì)差異的直接影響因素,因此命名為經(jīng)濟(jì)發(fā)展因子;就業(yè)人數(shù)、貨運(yùn)總量、城鎮(zhèn)人口數(shù)在第二個(gè)因子上的載荷都大于0.85,因子二主要解釋了這幾個(gè)變量,可以理解為對(duì)區(qū)域經(jīng)濟(jì)差異的間接影響因素,命名為持續(xù)影響因子。經(jīng)過(guò)旋轉(zhuǎn)后,各個(gè)變量的因子含義更清晰。
3.4 計(jì)算因子得分
在建立因子模型后,就要反過(guò)來(lái)考察每個(gè)樣品的性質(zhì)和樣品間的關(guān)系。比如在建立了關(guān)于區(qū)域經(jīng)濟(jì)差異的因子模型后,就想要知道哪些區(qū)域經(jīng)濟(jì)發(fā)展好,哪些區(qū)域經(jīng)濟(jì)發(fā)展較差等,這就要進(jìn)行因子分析的關(guān)鍵一步,即計(jì)算因子得分。因子得分也是因子分析的最終體現(xiàn),需要計(jì)算各個(gè)因子在每個(gè)樣品點(diǎn)上的具體數(shù)值,這些數(shù)值就是因子得分,由此形成的變量也被稱(chēng)之為因子得分變量。在以后的分析中,就可以直接使用因子得分變量來(lái)研究樣品的評(píng)價(jià)或?qū)ζ溥M(jìn)行分類(lèi)了。本文采用回歸法計(jì)算因子得分系數(shù),得分系數(shù)的均值為0,標(biāo)準(zhǔn)差為1,大于0證明比平均水平高,小于0表示比平均水平低,計(jì)算結(jié)果如表2。