韓春慧 李文
摘 要 本文利用回歸分析中較為穩(wěn)健的分位數(shù)回歸方法,研究了上海市互聯(lián)網(wǎng)行業(yè)中,就業(yè)人才的不同特點(diǎn)對(duì)企業(yè)提供的就業(yè)工資水平的影響,將學(xué)歷、工作經(jīng)驗(yàn)、企業(yè)自身規(guī)模這3個(gè)重要的影響因素作為自變量,工資水平作為因變量建立分位數(shù)回歸模型。本文主要分析了5個(gè)主要的分位點(diǎn),得到不同位置上的自變量對(duì)于工資水平影響更全面的結(jié)論。不同位置上的回歸結(jié)果表明,在較高工資水平上,工作經(jīng)驗(yàn)對(duì)企業(yè)提供的工資水平影響最大,并且呈現(xiàn)出上升的趨勢(shì),教育水平對(duì)于高層次人才的工資水平的影響隨著所考察的分位數(shù)不同而變化,但并不是簡單的上升趨勢(shì),在較高工資水平上,呈現(xiàn)出類似倒“U”形狀的分布。
關(guān)鍵詞 分位數(shù)回歸 倒“U”形狀 工資水平 教育水平
一、引言
近年來,互聯(lián)網(wǎng)行業(yè)不斷發(fā)展,人工智能等新興的科技領(lǐng)域越來越需要高端人才的創(chuàng)新與實(shí)踐,國家大力支持戰(zhàn)略性產(chǎn)業(yè)的發(fā)展,實(shí)行相關(guān)政策,重點(diǎn)規(guī)劃城市的發(fā)展。上海提出建立全球科創(chuàng)中心,以科技和創(chuàng)新引領(lǐng)行業(yè)發(fā)展,同時(shí)吸引了許多人才,也有越來越多的互聯(lián)網(wǎng)企業(yè)在人工智能、大數(shù)據(jù)等新興領(lǐng)域取得了成績,同時(shí)大數(shù)據(jù)已成為國家基礎(chǔ)性戰(zhàn)略資源,對(duì)經(jīng)濟(jì)社會(huì)發(fā)展各領(lǐng)域日益產(chǎn)生深遠(yuǎn)的影響。本文利用大數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)分析,聚焦上海提出的科創(chuàng)中心戰(zhàn)略重點(diǎn)發(fā)展行業(yè),從互聯(lián)網(wǎng)行業(yè)入手,利用工資水平等數(shù)據(jù),建立模型進(jìn)行分析,對(duì)就業(yè)與上海重點(diǎn)行業(yè)發(fā)展的互動(dòng)關(guān)系展開研究,嘗試分析其所反映出的產(chǎn)業(yè)發(fā)展?fàn)顩r。
二、分位數(shù)回歸介紹
分位數(shù)回歸(QR)的思想最初是由Koenker和Bassett提出的,這一方法是對(duì)最小二乘法(OLS)的拓展和應(yīng)用。分位數(shù)回歸迅速發(fā)展主要是因?yàn)橄啾绕胀ㄗ钚《朔ǖ玫降幕貧w,分位數(shù)回歸具有自身獨(dú)有的優(yōu)點(diǎn)。傳統(tǒng)的均值回歸在使用普通最小二乘法時(shí),對(duì)于模型有非常嚴(yán)格的假定,即假定隨機(jī)擾動(dòng)項(xiàng)滿足零均值、同方差并且無序列相關(guān)性,較強(qiáng)的假定限制了這一方法在許多實(shí)際問題研究中的應(yīng)用。當(dāng)不滿足其中任何一個(gè)假定時(shí),會(huì)對(duì)所建立的模型造成無法估計(jì)的影響,從而使模型的建立失去意義。分位數(shù)回歸理論的提出解決了這一弊端,相對(duì)于普通最小二乘法的嚴(yán)格假定,分位數(shù)可以應(yīng)用于存在嚴(yán)重異方差,以及數(shù)據(jù)分布具有尖峰或厚尾的數(shù)據(jù),應(yīng)用的范圍更加廣泛,也更加深入地挖掘出數(shù)據(jù)所隱藏的信息,給我們研究分析問題提供了更好的思路和解決方案。
三、實(shí)證分析
(一)數(shù)據(jù)及其預(yù)處理
本文通過大數(shù)據(jù)分析中的爬蟲等方法抓取了2018年上海市互聯(lián)網(wǎng)行業(yè)招聘人員的基本信息,其中包括有關(guān)公司的信息如行業(yè)類別、公司特征、公司規(guī)模、提供的最低薪酬等,為互聯(lián)網(wǎng)行業(yè)的各類公司提供有關(guān)從業(yè)人員的信息如工作經(jīng)驗(yàn)、教育水平等。由于模型中需要探究的變量為工資水平、企業(yè)規(guī)模、從業(yè)人員的工作經(jīng)驗(yàn)和教育水平,所以本文將樣本中缺失相關(guān)信息的較少量樣本刪除,最終得到的樣本量為34053個(gè),樣本量滿足數(shù)據(jù)分析的要求,后期得到的模型也較為合理。同時(shí),在進(jìn)行建模分析時(shí),根據(jù)模型的需要,本文將數(shù)據(jù)中的分類數(shù)據(jù)轉(zhuǎn)換成順序數(shù)據(jù),以此建立模型,進(jìn)一步分析變量對(duì)工資水平的影響。因變量采用的是最低薪酬數(shù)據(jù),并對(duì)其進(jìn)行對(duì)數(shù)化處理。數(shù)據(jù)分析使用的軟件是Stata。
(二)建模分析過程
其中l(wèi)n(wage)表示工資收入的自然對(duì)數(shù),edu表示受教育程度,exp表示潛在工作經(jīng)驗(yàn)(從事工作時(shí)間),squ則表示潛在工作經(jīng)驗(yàn)的平方,X'i表示一系列控制變量所組成的矩陣,i表示樣本中的觀察個(gè)體。教育回報(bào)率是描述教育與收入之間關(guān)系的常用指標(biāo),指的是每增加一年的教育程度所帶來的工資收入增加的百分比。由于被解釋變量是對(duì)數(shù)形式,edu的系數(shù)可直接視為教育回報(bào)率。在不考慮個(gè)體異質(zhì)性的情況下,教育回報(bào)率是既定的,但是每個(gè)人都有不一樣的受教育年限,因此每個(gè)人有不同的收入。
建立分位數(shù)回歸模型,將數(shù)據(jù)進(jìn)行預(yù)處理,得到分析的數(shù)據(jù)。首先,對(duì)變量進(jìn)行如下處理,本文將工資水平的對(duì)數(shù)作為被解釋變量y,將公司規(guī)模、教育水平和工作經(jīng)驗(yàn)作為解釋變量x,建立如下分位數(shù)回歸模型:
分位數(shù)回歸模型是在不同的分位點(diǎn)下的條件回歸,模型中估計(jì)的參數(shù)隨著分位點(diǎn)t的不同而變化,建立的分位數(shù)回歸模型含有三個(gè)自變量,均為虛擬變量。
(三)分位數(shù)回歸結(jié)果及其解釋
采用分位數(shù)回歸模型能得到任意分位點(diǎn)的模型參數(shù)估計(jì)值,但是由于分析問題的具體情況時(shí)并不是越多的分位點(diǎn)就有越好的分析結(jié)果,本文采用比較具有代表性的5個(gè)分位點(diǎn)進(jìn)行分析,分別是0.1、0.25、0.5、0.75、0.9。
Stata仍報(bào)告了OLS下估計(jì)方程的回歸系數(shù),盡管本文沒有使用OLS方法,但是這一結(jié)果給了我們一個(gè)參照和對(duì)比,從OLS的回歸結(jié)果可以看出,公司規(guī)模在模型中的貢獻(xiàn)較小,工作經(jīng)驗(yàn)和教育水平對(duì)工資水平的影響較大,這符合之前許多學(xué)者對(duì)于教育回報(bào)率和工作經(jīng)驗(yàn)對(duì)收入影響的研究。從工作經(jīng)驗(yàn)來看,平均來說,企業(yè)給有工作經(jīng)驗(yàn)的人提供的工資水平要比沒有經(jīng)驗(yàn)的人高19.8%,但具體在工資水平上是如何影響的,尚沒有具體的結(jié)論,因此下文將對(duì)分位數(shù)回歸的結(jié)果進(jìn)行分析。
由表1的結(jié)果可以看出,從公司規(guī)模對(duì)工資水平影響的變動(dòng)趨勢(shì)來看,在0.1、0.25、0.5、0.75、0.9分位點(diǎn)上的參數(shù)估計(jì)值很小,并且不顯著。
從工作經(jīng)驗(yàn)對(duì)工資水平影響的變動(dòng)趨勢(shì)來看,說明工作經(jīng)驗(yàn)對(duì)于提高勞動(dòng)者工資收入有著明顯的積極作用,且工作經(jīng)驗(yàn)的回歸系數(shù)隨著分位點(diǎn)的增加而增加,說明工作經(jīng)驗(yàn)越豐富,工資收入越高,且對(duì)高收入群體的積極作用更強(qiáng)。在工資水平的10%和90%分位點(diǎn)處的參數(shù)估計(jì)值分別為0.198和0.405,可以看出,工作經(jīng)驗(yàn)在10%分位點(diǎn)對(duì)于工資水平的影響小于90%分位點(diǎn)的影響,也就是說,增加一年的工作經(jīng)驗(yàn),在10%分位點(diǎn)上,工資水平將提高19.8%,而在90%分位點(diǎn)上,工資水平將提高40.5%,可以看出,在企業(yè)招聘人才時(shí),工作經(jīng)驗(yàn)具有重要的影響作用,就業(yè)崗位的質(zhì)量、水平越高,工作經(jīng)驗(yàn)越重要。從趨勢(shì)上看,工作經(jīng)驗(yàn)對(duì)于工資水平的影響總體上呈上升趨勢(shì),中位數(shù)的參數(shù)估計(jì)值為0.288,也就是說在中位數(shù)的水平上,工作經(jīng)驗(yàn)增加一年,相應(yīng)的工資水平將會(huì)提升28.8%。
從教育水平對(duì)工資水平影響的變動(dòng)趨勢(shì)來看,從0.1、0.25、0.5、0.75、0.9分位點(diǎn)可以看出各參數(shù)估計(jì)量均為正值,這說明教育水平對(duì)于勞動(dòng)者工資收入有明顯的積極作用。在低分位點(diǎn)的系數(shù)較大,但受教育水平在高分點(diǎn)的系數(shù)變得相對(duì)較小,說明每個(gè)人的受教育年限每增加1%,工資在低收入水平的人的月工資基礎(chǔ)上有大幅的提高,在高收入水平的人的月工資水平上也有提高,但是受教育程度的比例增長對(duì)低收入水平人群的拉動(dòng)作用遠(yuǎn)大于高收入水平人群。
從公司規(guī)模對(duì)工資水平影響的變動(dòng)趨勢(shì)來看,在低分位數(shù)上有影響,但在高分位數(shù)上的影響很??;從工作經(jīng)驗(yàn)對(duì)工資水平影響的變動(dòng)趨勢(shì)來看,一般來說,工作經(jīng)驗(yàn)對(duì)于提高勞動(dòng)者工資收入有著明顯的積極作用,且工作經(jīng)驗(yàn)的回歸系數(shù)隨著分位點(diǎn)的增加而增加,說明工作經(jīng)驗(yàn)越豐富,工資收入越高,其對(duì)高收入群體的積極作用更強(qiáng);從教育水平對(duì)工資水平影響的變動(dòng)趨勢(shì)來看,教育水平對(duì)工資收入中間分位數(shù)的影響較大,但在高分位數(shù)上的影響較小。
四、結(jié)語
條件分位數(shù)回歸有助于研究者了解各解釋變量對(duì)于被解釋變量在擾動(dòng)項(xiàng)的不同分位點(diǎn)上的異質(zhì)性邊際影響,無條件分位數(shù)回歸則是對(duì)條件分位數(shù)回歸方法的完善,能確保參數(shù)的識(shí)別與一致估計(jì)。本文基于OLS回歸和分位數(shù)回歸模型,研究了上海市互聯(lián)網(wǎng)行業(yè)中,就業(yè)人才的不同特點(diǎn)對(duì)企業(yè)提供的就業(yè)工資水平的影響,將學(xué)歷、工作經(jīng)驗(yàn)、企業(yè)自身規(guī)模這三個(gè)重要的影響因素作為自變量,工資水平作為因變量,建立分位數(shù)回歸模型。本文主要分析了五個(gè)主要的分位點(diǎn),得到不同位置上的自變量對(duì)于工資水平影響更全面的結(jié)論。不同位置上的回歸結(jié)果表明,在較高工資水平上工作經(jīng)驗(yàn)對(duì)企業(yè)提供的工資水平影響最大,并且呈上升趨勢(shì),教育水平對(duì)于高層次人才工資水平的影響隨著所考察分位數(shù)的不同而變化,但并不是簡單的上升趨勢(shì),在較高工資水平上,呈現(xiàn)出類似倒“U”形狀的分布。
(作者單位為上海對(duì)外經(jīng)貿(mào)大學(xué)統(tǒng)計(jì)與信息學(xué)院)
參考文獻(xiàn)
[1] 張濤.工資收入差異的解釋:基于分位數(shù)回歸的經(jīng)驗(yàn)研究[J].統(tǒng)計(jì)與信息論壇,2011(11).
[2] 張車偉.人力資本回報(bào)率變化與收入差距:“馬太效應(yīng)”及其政策含義[J].經(jīng)濟(jì)研究,2006(12).
[3] 劉生龍.教育和經(jīng)驗(yàn)對(duì)中國居民收入的影響——基于分位數(shù)回歸和審查分位數(shù)回歸的實(shí)證研究[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2008(4).
[4] 邢春冰.分位回歸、教育回報(bào)率與收入差距[J].統(tǒng)計(jì)研究,2008(5).
[5] Elena Martinez-Sanchisa,Juan Moraa,Ilker Kandemirb . Counterfactual distributions of wages via quantile regression with endogeneity[J]. Working Papers Serie Ad,2012,56(11):3212-3229.