龍藝
摘 要:隨著我國國家改革開放以來,我國經(jīng)濟不斷發(fā)展,我國包分配的就業(yè)制度也逐漸被更加適應國情的體制所取代。但是近幾年來,不僅是畢業(yè)本科生就連研究生都面臨著與日俱增的就業(yè)壓力,讓我們不得不去認真思考該如何解決這一重大難題。無論是在決定大學就讀專業(yè)的時候,還是畢業(yè)選擇工作地點和職業(yè)方向都值得我們重視。筆者認為,在如今大數(shù)據(jù)背景下,首要任務是對原始數(shù)據(jù)進行分析。因此本文筆者將對全國各地區(qū)城鎮(zhèn)的就業(yè)數(shù)據(jù)進行整理以及研究選取的影響因素,通過聚類分析方法、主成分分析方法以及回歸分析方法分析數(shù)據(jù),希望能從分析結果向廣大就業(yè)者提供結論和相應的借鑒。
關鍵詞:聚類分析;回歸系數(shù);樹狀圖
引言
近幾年來,高校畢業(yè)生就業(yè)領域取向明顯向大城市、經(jīng)濟發(fā)達地區(qū)集中,地域結構性矛盾相當突出。以上海海事大學2016年研究生調(diào)查問卷為例,“畢業(yè)后最理想的就業(yè)城市”的結果仍然是上海、深圳以及北京等一線城市。根據(jù)這一現(xiàn)狀,本文針對就業(yè)情況,先用聚類分析方法中的系統(tǒng)聚類法進行分類,將全國各地區(qū)進行劃分。然后再對原始數(shù)據(jù)進行回歸分析,得出各變量與就業(yè)人數(shù)的回歸關系。
就業(yè)情況影響因素實證分析
數(shù)據(jù)及其來源
本文選取國家統(tǒng)計局、中國統(tǒng)計年鑒2015年的國家級相關統(tǒng)計數(shù)據(jù),是我國部分省市自治區(qū)2014年末的城鎮(zhèn)就業(yè)情況及相關指標(變量)數(shù)據(jù)。
變量選取
Y:城鎮(zhèn)就業(yè)人數(shù)總和
X1:城鎮(zhèn)居民可支配收入
X2:城鎮(zhèn)平均工資指數(shù)
X3:城鎮(zhèn)居民消費價格指數(shù)
X4:城鎮(zhèn)居民人均消費支出
X5:城鎮(zhèn)人口密度
X6:城鎮(zhèn)失業(yè)率
分析方法
聚類分析簡述
聚類分析方法有很多,包括系統(tǒng)聚類法、動態(tài)聚類法、有序樣品聚類法等。在本文中,由于筆者能力有限僅運用系統(tǒng)聚類法進行分析。系統(tǒng)聚類的基本思想是:距離相近的樣品(或變量)先聚成類。距離相遠的后聚成類,過程持續(xù)進行下去,直到將所有的樣品(或變量)聚成一類。
回歸分析簡述及假設
簡略地說,回歸分析主要研究客觀事物變量間的統(tǒng)計關系,是通過建立統(tǒng)計模型研究變量間相互關系的密切程度、結構狀態(tài)、模型預測的一種有效工具。由于實際問題中,影響因變量y的自變量往往不止一個,一元回歸模型往往也不適用,就需要建立多元回歸模型。本例假設城鎮(zhèn)就業(yè)人口數(shù)Y與相關變量X1,X2,X3,X4,X5,X6之間存在線性關系:
分析過程
本文利用軟件SPSS 13.0進行實證分析,分析過程如下:
聚類分析過程
將2014年我國31個省、市、自治區(qū)就業(yè)狀況作為樣品聚類分為3-6類時的各樣品所屬類別。
( 1 )第一類包括2個樣品,分別為:北京市和上海市。從地區(qū)分布和地區(qū)經(jīng)濟發(fā)展狀況來看,這一類的特點是:北京作為中國首都周邊資源相對豐富,工作崗位需求不僅廣度大深度也很大;上海作為一個沿海城市,不僅是中國的金融中心還是中國的交通樞紐中心,與外界交流相當方便,這也就形成了人才濟濟的局面;二者作為中國的首要一線城市,交通網(wǎng)絡發(fā)達,經(jīng)濟發(fā)展狀況良好,高校較多、人才較為集中、氣候四季適宜、工業(yè)發(fā)展蓬勃等優(yōu)勢不斷吸引著一批又一批的人前去尋找心儀的工作。
( 2 )第二類包括4個樣品,分別為:天津市、江蘇省、浙江省、廣東省。從地區(qū)分布和地區(qū)經(jīng)濟發(fā)展狀況來看,第二類所包含的省、市、自治區(qū)主要分布在我國沿海地區(qū),這些地區(qū)高校林立、人才人口集中,工業(yè)高度發(fā)達、科學技術引入便利,海陸交通四通八達,既有外資投入又有內(nèi)政支持鼓勵,又有中國尖端技術又有國外先進管理文化滲入。得天獨厚的地理位置和環(huán)境優(yōu)勢不僅為求職者提供了舒適優(yōu)異的居住環(huán)境,更是提供了一系列的水上作業(yè)工作。近年來,這些地區(qū)更是吸引了大量的“孔雀東南飛”、“民工潮”此起彼伏,眾多社會現(xiàn)象不僅向我們說明了這些地區(qū)對人才和勞動力的吸引力;也讓人們意識到了這些地區(qū)豐富的就業(yè)機遇和個人發(fā)展前景;更重要的是,國內(nèi)外先進的技術和人才以及眼界開闊的海歸們也積極投入到了這些地區(qū)的經(jīng)濟發(fā)展中,促使這些地區(qū)的經(jīng)濟蓬勃發(fā)展。
( 3 )第三類包括21個樣品,分別為:河北省、山西省、吉林省、黑龍江省、安徽省、江西省、河南省、湖北省、湖南省、廣西壯族自治區(qū)、海南省、重慶市、四川省、貴州省、云南省、西藏省、陜西省、甘肅省、青海省、寧夏回族自治區(qū)、新疆維吾爾自治區(qū)。從地區(qū)分布和地區(qū)經(jīng)濟發(fā)展狀況來看,相對于前兩類,第三類所包含的省、市、自治區(qū)就遠遠沒有那么幸運了。他們大多數(shù)主要分布在我國自然氣候較為惡劣的地區(qū),人才缺乏、各方面資源有限,交通線路不豐富,地理位置較偏遠、我國社會政治治安不穩(wěn)定,少數(shù)名族聚集,民俗民風差異大、多自然災害、人口相對較稀少等等特點導致這些地區(qū)對求職者們的吸引力不算很大,大多數(shù)都是本地人在當?shù)鼐蜆I(yè)。
( 4 )第四類包括4個樣品,分別為:內(nèi)蒙古自治區(qū)、遼寧省、福建省、山東省。這一類是具有個別特殊性的省、自治區(qū),當?shù)靥厥獾穆糜螛I(yè)、工業(yè)或者的奶制品業(yè)等等拉動了當?shù)氐木蜆I(yè)情況,促進當?shù)氐母鱾€方面的發(fā)展。
回歸分析過程
采用所有解釋變量即X1、X2、X3、X4、X5、X6對被解釋變量Y用SPSS進行回歸分析。
變量Y和X1、X2、X3、X4、X5、X6的均數(shù)(Mean)、標準差(Std. Deviation)和例數(shù)(N)。
居民人均消費者支出和居民可支配收入的相關系數(shù)是0.989,單尾單側檢驗P=0.000,相關度相當?shù)母摺?/p>
模型摘要中相關系數(shù)R=0.544,判定系數(shù)R Square=0.296,調(diào)整判定系數(shù)Adjusted R Square=0.120,估計值的標準誤差Std. Error of the Estimate=609.33131。
表1是偏回歸系數(shù)結果,常數(shù)項(Constant)=3062.279,居民可支配收入回歸系數(shù)=0.201,回歸系數(shù)的標準誤差(Std. Error)=0.093;平均工資指數(shù)回歸系數(shù)=64.222,回歸系數(shù)的標準誤差=58.338;居民消費價格指數(shù)回歸系數(shù)=-95.924,回歸系數(shù)的標準誤差=287.033;居民人均消費支出回歸系數(shù)=-0.245,回歸系數(shù)的標準誤差=0.131;人口密度回歸系數(shù)=-0.038,回歸系數(shù)的標準誤差=0.098;失業(yè)率回歸系數(shù)=62.694,回歸系數(shù)的標準誤差=186.003。求得回歸方程為Y=3062.279+0.201X1+64.222X2-95.924X3-0.245X4-0.038X5+62.694X6+ε。
結語
首先運用聚類分析,可以從分析結果看出全國各地中,相對于我國華中地區(qū)以及一些自然環(huán)境較為惡劣或者是少數(shù)民族地區(qū)的就業(yè)情況,北京、上海、浙江、廣東、江蘇等沿海地區(qū)或者靠近首都、沿海地區(qū)的就業(yè)情況較為優(yōu)異,從這一結論可以提供廣大擇業(yè)者選擇就業(yè)地區(qū)。但是同時,如果按照大多數(shù)人的擇優(yōu)心理,我國必將會出現(xiàn)兩極分化逐漸加重,導致我國經(jīng)濟結構嚴重失衡,進而可能影響我國在國際上的影響,這后果是相當嚴重。由于筆者能力有限,模型中存在一定問題,需要具有更加完備的知識去修改并完善模型。
(作者單位:上海海事大學 )