——基于百度遷徙大數(shù)據(jù)的研究①"/>
王群勇 孫倩
(南開大學 經(jīng)濟學院數(shù)量經(jīng)濟研究所,天津 300071)
隨著發(fā)展理念的更新,勞動力的流動格局也在不斷演化。2000-2010 年間流動人口規(guī)模增加了117.6%,2010-2020 年間流動人口規(guī)模增加了69.8%,不僅流動總量出現(xiàn)下降趨勢,流向也出現(xiàn)了由東部向西部回流的情形[1],勞動力流動過程的背后有著一系列非常復(fù)雜的作用機制,承載著資本流、信息流、技術(shù)流的大規(guī)模勞動力流動,既是經(jīng)濟結(jié)構(gòu)、產(chǎn)業(yè)布局、資源配置的結(jié)果,同時也反向?qū)Τ鞘械陌l(fā)展產(chǎn)生深遠的影響。
在我國經(jīng)濟進入新常態(tài)的情勢下,如何促進勞動力要素在本市聚集,實現(xiàn)勞動力資源的優(yōu)化配置,已成為各地實現(xiàn)高質(zhì)量發(fā)展的重要課題。那么,我國城市間呈現(xiàn)出怎樣的勞動力流動格局?近年間發(fā)生了怎樣的演變?促使勞動力流出與流入的主要驅(qū)動因素是什么?
經(jīng)典的勞動力理論試圖對勞動力流動的原因及區(qū)位選擇做出解釋,早期新古典理論認為經(jīng)濟差異是促使人口流動的主要原因,由于傳統(tǒng)經(jīng)濟部門與現(xiàn)代經(jīng)濟部門的邊際生產(chǎn)力不同,導(dǎo)致現(xiàn)代經(jīng)濟部門的工資收入高于傳統(tǒng)的農(nóng)業(yè)部門,因此勞動力從傳統(tǒng)的經(jīng)濟部門不斷流向新興經(jīng)濟部門[2-3],勞動者會在權(quán)衡城鄉(xiāng)的真實收入差距與城市的就業(yè)概率下做出使個體效用最大化的流動決策[4],除收入影響外,個體效用還會受到其他多種因素的影響,“推拉理論”指出,有利于改善生活水平的因素成為了促使勞動力流入的拉力,而不利的生活條件因素成為了導(dǎo)致勞動力流出的推力[5]。新勞動力遷移理論在此基礎(chǔ)上認為相對收入而不是絕對收入影響著勞動力的流動決策[6],人們會將自己的生活水平與周圍人的生活水平進行比較,然后會產(chǎn)生相對滿意與相對剝奪的心理狀態(tài),這種因感受到不平等的相對剝奪感,會加強勞動者的流出傾向??傮w來說,新古典理論強調(diào)經(jīng)濟因素的重要作用,而與之相對應(yīng)的是舒適度理論的興起,隨著人們對生活質(zhì)量需求的不斷提高,環(huán)境、氣候、城市建設(shè)、公共服務(wù)等方面的因素越來越受到學者們的關(guān)注,舒適度理論認為,氣候條件、環(huán)境資源、自然災(zāi)害,社會管理等因素都會促進或阻礙勞動力的流動[7],而城市也可以通過提供更優(yōu)質(zhì)的文化環(huán)境與公共服務(wù)來吸引勞動力進而促進經(jīng)濟的增長[8-9]。
基于上述理論,國內(nèi)學者使用中國的相關(guān)數(shù)據(jù)開展了豐富的實證研究,其中一個核心的領(lǐng)域是對勞動力流動空間結(jié)構(gòu)特征的描述,學者們運用分型理論與ESDA 方法[10]、熱點分析與空間回歸[11]、莫蘭指數(shù)[12]、地理加權(quán)回歸模型[13]等多種方法來刻畫省、市、縣不同層面的人口流動格局,近年來,隨著信息化的發(fā)展,原有的地理空間結(jié)構(gòu)正在被復(fù)雜的網(wǎng)絡(luò)關(guān)系所重塑,網(wǎng)絡(luò)分析方法逐漸走入人們的視野并發(fā)現(xiàn),中國城市間的人口流動有明顯的分層集聚現(xiàn)象,具有典型的“小世界”特征[14-15],呈現(xiàn)出一定的核心邊緣結(jié)構(gòu)[16],以廣東、浙江、江蘇、安徽、四川構(gòu)成的“一主四副”的網(wǎng)絡(luò)結(jié)構(gòu)凸顯,等級層次性加強[17],以區(qū)域內(nèi)流動為主要的流動模型,省際間流動網(wǎng)絡(luò)密度不大[18],以子群內(nèi)流動為主,子群間聯(lián)系較少[19]?;诖?,學者們對勞動力流動的動因進行了研究,指出經(jīng)濟因素是勞動力流動的主要因素,地區(qū)的發(fā)展水平、開放程度、收入水平、人力資本等都是影響勞動力跨區(qū)流動的動因[20];城市的公共服務(wù)水平、基礎(chǔ)設(shè)施建設(shè)對勞動力流入具有正向影響[21],方言文化的距離[22]、空氣污染[23]等因素對勞動力的流入具有負向影響,而房屋價格對于勞動力流動的影響則呈現(xiàn)“倒U 型”[24]。使用社會網(wǎng)絡(luò)分析方法的學者則指出,各地區(qū)在經(jīng)濟、社會、文化水平上的區(qū)域差異,是促使勞動力從低水平地區(qū)流向高水平地區(qū)的源動力[17][19][25]。
文獻梳理發(fā)現(xiàn),目前勞動力流動的研究多側(cè)重考察省際間或特定區(qū)域內(nèi)的勞動力流動,從城市層面考察全國勞動力流動網(wǎng)絡(luò)的較少;多側(cè)重于截面數(shù)據(jù)的影響因素分析,而對勞動力流動網(wǎng)絡(luò)結(jié)構(gòu)時空演化規(guī)律的研究較少;多側(cè)重人為因素對流動的影響,對自然環(huán)境影響的關(guān)注較少。基于此,本文嘗試做出以下改進:一是使用2020-2023 年元宵節(jié)后十天的百度遷徙大數(shù)據(jù)構(gòu)建城市勞動力流動網(wǎng)絡(luò),基于網(wǎng)絡(luò)視角考察勞動力流動的空間特征,并比較了2020-2022 年特殊時期與2023 年常態(tài)化后的勞動力流動網(wǎng)絡(luò)的變化;二是通過時間指數(shù)隨機圖模型(TERGM)對勞動力流動網(wǎng)絡(luò)形成的影響因素進行識別,并在時間維度上揭示網(wǎng)絡(luò)變化規(guī)律,深入探究我國城市勞動力流動網(wǎng)絡(luò)的發(fā)育機制;此外,構(gòu)建城市民生資源指數(shù)來描述城市為勞動力提供的生存與發(fā)展資源,用自然舒適度指數(shù)與人為舒適度指數(shù)來衡量城市的宜居性。
本研究的數(shù)據(jù)源自百度地圖慧眼-百度遷徙平臺(https://qianxi.baidu.com)所提供的數(shù)據(jù)作為數(shù)據(jù)來源。該平臺基于百度地圖LBS 開放平臺的大數(shù)據(jù)進行計算分析,展現(xiàn)了中國春節(jié)前后人口遷徙的動態(tài)趨勢。平臺提供2023 年實時遷徙數(shù)據(jù)以及2020-2023 年春運和國慶期間的人口遷徙數(shù)據(jù),詳細記錄了各城市遷入來源地和遷出目的地的流動強度前100 位數(shù)據(jù)。
盡管百度遷徙數(shù)據(jù)覆蓋了廣泛的人口群體,但在代表性和準確性方面仍存在一定的挑戰(zhàn)。該平臺通過數(shù)十萬款A(yù)PP 提供的定位服務(wù)覆蓋了數(shù)億智能手機用戶,但由于缺乏特定年齡段智能手機使用者的精確統(tǒng)計數(shù)據(jù),因此難以準確判斷覆蓋人群中勞動力人口的比例。16-59 歲智能手機用戶的確切分布可從其他報告中推算。例如,根據(jù)中國互聯(lián)網(wǎng)信息中心(CNNIC)2021 年報告,我國60 歲及以上的老年網(wǎng)民占網(wǎng)民總數(shù)的11.5%;根據(jù)QuestMobile 在2022 年報告,18 歲以下的用戶占移動互聯(lián)網(wǎng)用戶總數(shù)的12.6%,而51 歲以上用戶占比26.4%。據(jù)此估計,百度遷徙平臺所捕捉到的用戶中,勞動力人口的比例可能至少達到了75%。盡管這一估算并非精確,但它為分析勞動力人口流動提供了一個相對可靠的基礎(chǔ)。
此外,在數(shù)據(jù)時段選擇上,考慮到與春節(jié)假期相比,元宵節(jié)后探親旅游的游客大幅減少,以外出打工和上班就業(yè)為目的的人口流動占主體,在數(shù)據(jù)上更能體現(xiàn)勞動力的流動[26]。因此,本文爬取了2020-2023 年春運時段內(nèi),元宵節(jié)后10 天的數(shù)據(jù),具體為:2020 年2 月8 日-2 月18 日;2021 年2 月26 日-3 月8 日;2022 年2 月15 日-3 月25 日;2023 年2 月5 日-2 月15 日,該數(shù)據(jù)集共包含337 個地級市在上述四個時間段內(nèi),每個城市及其每日流動強度排名前100 的遷出目的地,共約200 萬條數(shù)據(jù)??紤]到匹配數(shù)據(jù)的可得性,模型的適應(yīng)性,本文對數(shù)據(jù)進行了清洗和精簡,最終保留了295 個城市的數(shù)據(jù)作為最終的研究樣本。其余變量數(shù)據(jù)來自于《中國城市統(tǒng)計年鑒》。
基于上述數(shù)據(jù),本文整理構(gòu)建了中國城市勞動力流動網(wǎng)絡(luò),以295 個地級市作為網(wǎng)絡(luò)結(jié)點,以城市間的人口流動強度作為網(wǎng)絡(luò)連帶,組成了295*295 的鄰接矩陣Yinitial(行為勞動力流出地,列為勞動力流入地),根據(jù)平臺數(shù)據(jù)計算規(guī)則,yij代表了城市i 到城市j 的人口流動強度。由于TERGM 模型要求及計算網(wǎng)絡(luò)特征與結(jié)點度分布均需要二值網(wǎng)絡(luò)數(shù)據(jù),故將2020-2023 年的原始網(wǎng)絡(luò)矩陣元素統(tǒng)一排序,選擇該序列的3/4 分位數(shù)做為臨界值,大于等于此值的設(shè)置為1,小于此值的設(shè)置為0,各年份網(wǎng)絡(luò)設(shè)置統(tǒng)一的臨界值有助于觀察到網(wǎng)絡(luò)基本特征隨時間的變化情況,由此將勞動力流動強度矩陣轉(zhuǎn)化為0-1 鄰接矩陣,記為Ybinary,TERGM 分析將基于此網(wǎng)絡(luò)展開。
對2020-2023 年的原始鄰接矩陣Yinitial進行深入的社會網(wǎng)絡(luò)分析及可視化處理,可發(fā)現(xiàn)城市間勞動力流動的微妙變化。鑒于城市節(jié)點眾多,為精準捕捉并展現(xiàn)網(wǎng)絡(luò)的核心特征,本研究篩選了每個年份中入度與出度排名前20 的城市,構(gòu)建出一個凝練而富有代表性的網(wǎng)絡(luò)圖(見圖1),并采取了一致的閾值標準來篩選網(wǎng)絡(luò)連帶,確保了不同年份網(wǎng)絡(luò)圖的可比性。從圖中可以看出,2020 年的網(wǎng)絡(luò)相對稀疏,而從2021-2023 年,流動的密度與強度均顯著增加。在宏觀結(jié)構(gòu)上,除2020 年的中部地區(qū)流動略顯稀薄之外,其余年份均展現(xiàn)出一種明顯的菱形結(jié)構(gòu):以鄭州和武漢為中樞,北京、上海、深圳和成都構(gòu)成四個頂點。此菱形構(gòu)型內(nèi)部的流動活躍度遠超其外圍。在這些戰(zhàn)略節(jié)點城市周圍,可觀察到以其為核心的區(qū)域性集群效應(yīng),城市間的勞動力流動強度異常突出,如北京與天津、石家莊之間,上海與南京、杭州之間,深圳與廣州之間,成都與重慶,武漢與鄭州、長沙之間的聯(lián)動,均構(gòu)成了區(qū)域勞動力流動的強力紐帶。2023 年較前期的顯著不同是,勞動力流動菱形區(qū)域內(nèi)部與外圍的分化更加顯著,而菱形區(qū)域內(nèi)部則更為均衡,菱形區(qū)域內(nèi)網(wǎng)絡(luò)密集程度增強但超高流動強度的線路減少,這說明有更多的中部城市發(fā)揮著越來越重要的樞紐作用。
通過所構(gòu)建的二值網(wǎng)絡(luò)Ybinary,本文分析了2020-2023 年期間勞動力流動網(wǎng)絡(luò)的關(guān)鍵特征指標(見表1)。在節(jié)點數(shù)量(295 個)與二值網(wǎng)絡(luò)構(gòu)建閾值固定的條件下,勞動力網(wǎng)絡(luò)的平均度由2020 年55.746上升至2023 年89.488,網(wǎng)絡(luò)密度從0.190 增加到0.304,這一變化體現(xiàn)了網(wǎng)絡(luò)節(jié)點之間的聯(lián)系顯著增多,揭示了勞動力流動的擴展和城市經(jīng)濟互動的增強。平均最短路徑從1.910 減到1.757,指 示網(wǎng)絡(luò)效率的增強,意味著勞動力從一個區(qū)域到另一個區(qū)域的流動更為迅捷和無阻。這可能得益于交通、信息技術(shù)的進步或者勞動市場政策的優(yōu)化。網(wǎng)絡(luò)中心勢分析中,可見勞動力流動網(wǎng)絡(luò)的出度中心勢遠低于入度中心勢,這種“集中流入,分散流出”的格局意味著某些城市成為人才匯聚中心,而人才的流出來源則更趨廣泛和分散;此外,中心勢隨年份呈現(xiàn)整體下降的趨勢,這表明網(wǎng)絡(luò)中的依賴程度不再集中于少數(shù)中心城市,而是向其他城市分散,顯示出勞動力流動的地理分布正變得更加均衡,這意味著權(quán)力和影響力正在從傳統(tǒng)的勞動力市場中心城市向其他城市轉(zhuǎn)移,反映出經(jīng)濟發(fā)展機會的地理擴散。網(wǎng)絡(luò)中小團體數(shù)量的下降強調(diào)了地區(qū)間勞動力流動模式的變遷。局部流動的格局及其凝聚子群的減少,指向了區(qū)域之間壁壘的打破和勞動力流動的均衡化。
表1 2020 年-2023 年城市勞動力流動網(wǎng)絡(luò)統(tǒng)計特征
圖2 展示了2020-2023 年勞動力流動網(wǎng)絡(luò)入度與出度的區(qū)域分布特征,圖2 左側(cè)為各區(qū)域的平均入度,右側(cè)為平均出度。首先,在勞動力流動的活躍度方面,東部地區(qū)的平均入度與出度均處于高位,勞動力流動最為活躍,隨后依次是中部地區(qū),西部地區(qū)與東北地區(qū)活躍度較低。其次,在流向方面,平均入度最高的是東部地區(qū),平均出度最高的是中部地區(qū);在度分布上,除東部地區(qū)存在明顯的凈流入外,其他三個地區(qū)均為凈流出,東北地區(qū)的凈流出特征最為明顯。再次,從縱向時間維度上看,東部地區(qū)的平均入度與出度差逐年增加,中部地區(qū)的平均流出與流入差逐年縮小,西部與東北地區(qū)的平均流出與流入差逐年擴大,這說明東部地區(qū)一直保持著對勞動力的吸引力,且這種優(yōu)勢仍在擴大,中部地區(qū)的吸引力有所增強,而西部和東北地區(qū)則呈現(xiàn)出吸引力明顯下降的趨勢。
圖2 2020-2023 年各區(qū)域平均入度與平均出度對比
在網(wǎng)絡(luò)結(jié)點層面,基于2020-2023 年的二值網(wǎng)絡(luò)Ybinary,分別計算了295 個城市節(jié)點在網(wǎng)絡(luò)中的入度與出度,四年間城市結(jié)點的入度與出度分布較為穩(wěn)定,圖3 僅展示2023 年入度與出度分布熱力圖。
圖3 2023 年中國勞動力流動網(wǎng)絡(luò)入度與出度空間分布
對城市結(jié)點入度與出度的分析可見:第一,勞動力流動網(wǎng)絡(luò)的入度在3-289 之間分布,方差較大,存在著一些吸納勞動力的“超級城市”,入度最高的城市為北京,向后排名前十的城市依次為:上海、蘇州、杭州、武漢、廣州、深圳、重慶、成都、西安,這些城市的入度均在270 以上,從地圖上看,高入度地區(qū)集中在以上述城市為支點的菱形結(jié)構(gòu)內(nèi);第二,勞動力網(wǎng)絡(luò)的節(jié)點出度相較于入度較為平均,區(qū)間在4-134,出度最高的城市為河南省周口市,向后排名前十的城市依次為:南陽、駐馬店、鄭州、西安、渭南、洛陽、重慶、徐州、許昌這些城市的出度均在125 以上。從地圖上看,出度較高的城市主要集中在中部與西部地區(qū)。
中介中心度也是分析網(wǎng)絡(luò)節(jié)點特性的關(guān)鍵指標之一,它顯現(xiàn)了一個節(jié)點在資源與信息傳遞過程中的協(xié)調(diào)和控制能力。本研究通過計算2020-2023 年期間各城市節(jié)點的中介中心度反映其在勞動力流動網(wǎng)絡(luò)中的作用和地位。在中介中心度排名前20 的城市中,除了深圳、蘇州、青島、東莞外,其余16 座城市均為省會或直轄市。這些城市在經(jīng)濟實力上也居于領(lǐng)先地位,成為區(qū)域內(nèi)的經(jīng)濟與文化核心,并且作為主要的交通樞紐,發(fā)揮著勞動力跨省流動的關(guān)鍵中轉(zhuǎn)作用(見表2)。
表2 中國勞動力流動網(wǎng)絡(luò)各城市中介中心度
中介中心度動態(tài)變化反映出大部分城市的中介中心度出現(xiàn)了不同程度的下降,其中尤以北京、深圳、成都、上海、廣州和蘇州等城市最為明顯。這說明,京津冀、長三角、珠三角等區(qū)域的交通基礎(chǔ)設(shè)施建設(shè)和完善程度超越了其他地區(qū),進而提高了人口流動的便捷性,并相應(yīng)減弱了這些關(guān)鍵節(jié)點城市在整個網(wǎng)絡(luò)中的控制力。同時,中部地區(qū)的鄭州、長沙和武漢城市的中介中心度有所上升,表明它們作為交通樞紐的功能正在增強。特別是武漢,盡管在2020 年因疫情沖擊其中介中心度顯著下降至294.26,但隨恢復(fù)情況的改善,其網(wǎng)絡(luò)中的協(xié)調(diào)作用及中心地位有顯著提升。
本文人口流動數(shù)據(jù)覆蓋2020-2023 年間的關(guān)鍵時間段。為深入分析網(wǎng)絡(luò)結(jié)構(gòu)的時間演變,本文采用時間指數(shù)隨機圖模型(TERGM)。TERGM 是指數(shù)隨機圖模型(ERGM)的一種擴展,適用于分析動態(tài)網(wǎng)絡(luò)數(shù)據(jù),可揭示網(wǎng)絡(luò)結(jié)構(gòu)隨時間變化的動態(tài)規(guī)律,它不僅可解釋網(wǎng)絡(luò)在特定時間點的狀態(tài),還能分析過去網(wǎng)絡(luò)狀態(tài)如何影響當前網(wǎng)絡(luò)結(jié)構(gòu),為理解復(fù)雜網(wǎng)絡(luò)時間演進的有力工具。
TERGM 的特點在于其能夠同時解釋網(wǎng)絡(luò)中關(guān)系存在與否的內(nèi)生和外生機制,這一點超越了傳統(tǒng)回歸分析方法的限制。它打破了獨立性假定,基于極大偽似然估計,通過一系列的估計、模擬、診斷和改進步驟,對網(wǎng)絡(luò)的時間依賴性進行細致分析,從而得到穩(wěn)定且準確的實證結(jié)果。
在模型的具體運作中,TERGM 考慮了網(wǎng)絡(luò)在不同時間點的狀態(tài),并將這些狀態(tài)串聯(lián)起來,形成對網(wǎng)絡(luò)動態(tài)特性的全面握。模型的表達形式為:
其中,Yt代表時間時間t的網(wǎng)絡(luò)狀態(tài),θ是一組待估參數(shù),Yt網(wǎng)絡(luò)狀態(tài)的形成依賴于K個時點的歷史網(wǎng)絡(luò)Yt-k,……,Yt-1,函數(shù)h是從這些歷史網(wǎng)絡(luò)狀態(tài)計算得到的統(tǒng)計量,涵蓋了影響網(wǎng)絡(luò)連接的各種因素,這些因素共同決定了當前時間點網(wǎng)絡(luò)形成的概率P。
本文考察了勞動力流動的四類驅(qū)動因素:勞動力流動的網(wǎng)絡(luò)結(jié)構(gòu)、結(jié)點城市的特征變量、城市對間的二元關(guān)系變量、以及時間變量。綜合考慮各統(tǒng)計量對勞動力流動網(wǎng)絡(luò)形成的影響,以及優(yōu)化模型的擬合效果,最終選取的用于TERGM 模型的統(tǒng)計量及其含義如表3 所示.
表3 TERGM 統(tǒng)計量說明
5.2.1 網(wǎng)絡(luò)結(jié)構(gòu)變量
分析勞動力流動模式時,TERGM 的一大優(yōu)勢是能夠?qū)⒕W(wǎng)絡(luò)結(jié)構(gòu)效應(yīng)考慮在內(nèi),網(wǎng)絡(luò)結(jié)構(gòu)定義為網(wǎng)絡(luò)中存在的局部連接構(gòu)型(如三角形、星形等),它們對網(wǎng)絡(luò)形成的概率具有“內(nèi)生效應(yīng)”。邊(edges)在模型中起到類似傳統(tǒng)回歸中截距項的作用,體現(xiàn)了在不考慮其他任何影響因素的情況下,網(wǎng)絡(luò)連帶形成的基本傾向。由于勞動力流動網(wǎng)絡(luò)為有向網(wǎng)絡(luò),本文考慮網(wǎng)絡(luò)的互惠性(mutuality)與傳遞性(transitivity),為防止模型退化,本文選擇幾何加權(quán)的邊沿共享伙伴(gwesp)納入模型。gwesp 具有多種模式,本文所考慮的三種結(jié)構(gòu)模式如圖4 所示,首先,TSP(傳遞共享伙伴)代表一種傳遞三角形結(jié)構(gòu),在有向網(wǎng)絡(luò)中,可以被解釋為一種社會等級[27],它所描述的是勞動力的等級性流動,如果城市i 的勞動力傾向于流向城市k,則說明城市k 比城市i 更有吸引力,而同時勞動力又傾向于從城市k 流向城市j,說明城市j 比k 更具吸引力,因此勞動力也會傾向于從城市i 流動到城市j,在此三角形結(jié)構(gòu)中,城市j 對于勞動力來說具有最高的效用等級;與TSP類似,RTSP(互惠傳遞共享伙伴)表示互惠傳遞性,描述了兩個城市同時與第三個城市存在勞動力互換,那么這兩個城市間也傾向于發(fā)生勞動力流動的趨勢;由于上述的勞動力流動的傳遞特征,本文認為勞動力不太可能遵循三個城市之間的循環(huán)模式,網(wǎng)絡(luò)中循環(huán)三元關(guān)系發(fā)生概率更低,因此,本文也將納入CSP(循環(huán)共享伙伴)結(jié)構(gòu)進行驗證。
圖4 邊沿共享伙伴類型示意圖
5.2.2 結(jié)點城市屬性變量
結(jié)點屬性變量指各城市在經(jīng)濟、環(huán)境、文化等方面的特征與稟賦。本文所使用的TERGM 模型可將城市結(jié)點特征對勞動力流動網(wǎng)絡(luò)形成的影響按“發(fā)送者、接收者效應(yīng)”、“同配效應(yīng)”、“差異效應(yīng)”三個維度進行檢驗。本文選取的結(jié)點屬性變量如表4 所示。
表4 外生變量及指標構(gòu)成
本文構(gòu)建了城市資源指數(shù)?!笆奈濉币?guī)劃綱要中指出,7 個民生福祉類指標包括就業(yè)、收入、落戶限制、教育、醫(yī)療、社會保障、養(yǎng)老育幼。由于收入、教育、醫(yī)療是勞動者選擇就業(yè)城市時考慮的首要因素,故將收入、教育、醫(yī)療作為二級指標,構(gòu)建“城市民生資源指數(shù)”,選擇城市平均工資作為收入的三級指標,選擇高考本科錄取率、高校數(shù)量、每萬人高中教師數(shù)、每萬人小學教師書作為教育的三級指標,選擇三甲醫(yī)院數(shù)量、每萬人口床位數(shù)、每萬人醫(yī)師數(shù)作為醫(yī)療的三級指標,在每一級指標中,利用主成分分析法,計算得出每個城市的“民生資源指數(shù)”。此外,在城市民生資源指數(shù)基礎(chǔ)上,構(gòu)建分類變量,取民生資源指數(shù)值的中位數(shù),將城市分為高資源與低資源兩個層次,以考察不同民生資源水平的城市組合之間的同配性。
本文選擇人均GDP 作為衡量城市經(jīng)濟發(fā)展情況的指標;第三產(chǎn)業(yè)比重作為衡量就業(yè)機會的指標;選擇總?cè)丝跀?shù)作為衡量城市人口規(guī)模的指標。基于城市舒適度的遷移理論,從自然舒適與人為舒適度兩個方面進行驗證,利用主成分分析法,選擇平均氣溫、溫差、水資源總量、PM2.5 構(gòu)建自然舒適度指標;利用文化設(shè)施、交通、綠化、公共服務(wù)構(gòu)建人為舒適度指標。
5.2.3 結(jié)點城市間的二元關(guān)系變量
結(jié)點屬性變量與二元關(guān)系協(xié)變量對網(wǎng)絡(luò)的形成具有“外生效應(yīng)”[28]。城市間的人口流動,不僅受到城市本身的影響,還可能受到城市對之間特定關(guān)系的影響。本文認為,城市間的勞動力流動,很大程度上取決于城市間的距離,這種距離包含三個方面:一是實際地理距離;二是行政距離(即是否屬于同一省份),本文構(gòu)建了一個以城市為結(jié)點的鄰接矩陣,若城市i與城市j在同一省份,則xij=1,否則xij=0;三是文化距離,本文借鑒趙向陽關(guān)于中國區(qū)域文化的研究結(jié)論,根據(jù)其研究中通過GLOBE 文化習俗量[29]表計算得出的各省市文化得分,形成了代表地區(qū)間文化差異的鄰接矩陣,矩陣中xij為城市i與城市j文化得分差的絕對值。
5.3.1 網(wǎng)絡(luò)內(nèi)生格局
表5 展示了網(wǎng)絡(luò)互惠性的參數(shù)估計,其顯著正值指出,人口流動在城市間呈現(xiàn)顯著的雙向性。這一現(xiàn)象表明,相較于單一方向的流動,雙向交互更為常見,反映出勞動力流動網(wǎng)絡(luò)的互補性和平衡性。此外,時間維度上,延遲互惠性參數(shù)的正值進一步證明了在特定流動路徑上,城市間的密切交互不僅增強了信息交流,還可能觸發(fā)勞動力的循環(huán)流動。在傳遞性分析中,研究辨識了邊沿共享伙伴的三種模式(見圖4)。特別是互惠傳遞性(RTC)的顯著正向關(guān)聯(lián),揭示了城市間勞動力吸引力的聚合性特點。具體來說,若城市i 與城市j 在與第三方城市K 的勞動力交換中顯示出高度互換,那么城市i 和城市j 之間的勞動力流向也將變得更為緊密。這種模式不斷促成了以資源、經(jīng)濟力量、環(huán)境優(yōu)勢為紐帶的城市網(wǎng)絡(luò),形成了結(jié)構(gòu)上的強強聯(lián)合。
表5 勞動力流動網(wǎng)絡(luò)內(nèi)生格局及驅(qū)動因素TERGM 估計結(jié)果
5.3.2 結(jié)點屬性效應(yīng)
城市特性與勞動力流向緊密相關(guān)。數(shù)據(jù)顯示,城市民生資源的正向吸引效應(yīng)和負向輸出效應(yīng)均統(tǒng)計顯著,意味著資源豐富的城市更能吸引勞動力,而資源條件較差的城市則更多地輸出勞動力。加入和時序變量模型中的經(jīng)濟發(fā)展水平、自然舒適度與人為舒適度對勞動力流入具有正面影響,但這一影響在流出方面并不顯著,暗示經(jīng)濟水平與否、居住環(huán)境是否優(yōu)越和社會服務(wù)體系對勞動力吸引力有重要影響,但不是推動勞動力流出的關(guān)鍵因素。人口規(guī)模的正向自增強效應(yīng)表明,大城市的人口集聚態(tài)勢進一步促進勞動力流入,反映出勞動力流動的趨勢性和集聚特性。第三產(chǎn)業(yè)的比重高顯著地與勞動力流入正相關(guān),揭示了更多就業(yè)機會的吸引力。
就流動成本而言,收入與房價比對流入有顯著的正向效應(yīng),表明勞動者在選擇遷徙地點時偏好收入相對于房價更有優(yōu)勢的城市,而這一指標對于決定是否流出的影響則不顯著。經(jīng)濟因素已非勞動力遷移唯一考量,城市的綜合實力在公共服務(wù)、生態(tài)環(huán)境和文化發(fā)展層面等同樣關(guān)鍵。
資源水平的匹配性分析顯示,勞動力傾向于從資源較少的城市流向資源豐富的城市,高-高資源組合城市間亦展現(xiàn)較強流動性,提示城市間資源差異對流動趨勢的影響可能存在異質(zhì)性。
5.3.3 協(xié)變量網(wǎng)絡(luò)效應(yīng)
勞動力流動的協(xié)變量網(wǎng)絡(luò)效應(yīng)分析中,地理和行政因素顯示出了對流動模式的明顯影響。具體而言,地理距離與勞動力流動呈現(xiàn)負相關(guān)關(guān)系,而同一省份內(nèi)的流動則呈現(xiàn)正相關(guān)性。這說明,相比跨省流動,我國勞動力的省內(nèi)流動更頻繁,這與長距離遷移會帶來更高的經(jīng)濟成本和心理負擔有關(guān)。此外,文化因素也在勞動力流動中扮演了關(guān)鍵角色,文化差異的負相關(guān)性表明文化異質(zhì)性可能阻礙了人口的遷移,突顯了文化融合和身份認同在勞動者選擇居住地時的重要作用。
5.3.4 時間依賴效應(yīng)
時間穩(wěn)定性分析揭示了勞動力流動網(wǎng)絡(luò)的歷史連續(xù)性。通過加入不同的時間穩(wěn)定性指標,研究發(fā)現(xiàn)二元穩(wěn)定性顯著為正,創(chuàng)新與消融顯著為負,表明在2020-2023 年間勞動力流動網(wǎng)絡(luò)保持較高的穩(wěn)定性。即已存在的流動模式有繼續(xù)保持的趨勢,而之前未見的流動關(guān)系出現(xiàn)的可能性較低,突顯出勞動力流動路徑與模式的歷史依賴性。
為了判斷 TERGM 對觀測網(wǎng)絡(luò)的有效性和適用性,驗證模型中的統(tǒng)計量能夠較好地描述觀測網(wǎng)絡(luò)的形成機制,本文進行了擬合優(yōu)度檢驗。評估擬合優(yōu)度圖的目的是檢查觀測到的網(wǎng)絡(luò)對于模型隱含的分布是否異常,通過擬合模型進行網(wǎng)絡(luò)仿真生成100 個模擬網(wǎng)絡(luò),形成網(wǎng)絡(luò)特征的分布區(qū)間,用灰色箱線圖表示,黑色折線為實際觀測網(wǎng)絡(luò)的統(tǒng)計值,若黑色折線越接近箱型圖的中值,說明模型的擬合度越好,若黑線位于灰色箱型圖區(qū)域內(nèi),說明擬合度在可接受范圍之內(nèi)。本文選取了度(Degree)、入度(Indegree)、二元共享伙伴(Dyad-wise shared partners)、邊沿共享伙伴(Edge-wise shared partners)和測地線距離(Geodesic distances)五個典型統(tǒng)計量作為測量指標,擬合結(jié)果如圖5所示。黑色擬合線經(jīng)過大部分箱線圖的中點,模型具有較好的擬合效果,此外,最后一張圖中的黑色ROC 曲線十分接近左上角,說明模型具有良好的合。
圖5 TERGM 樣本內(nèi)擬合優(yōu)度檢驗
為了驗證時間指數(shù)隨機圖模型(TERGM)的穩(wěn)健性,本研究對2020-2023 年的數(shù)據(jù)分別進行了靜態(tài)指數(shù)隨機圖模型(ERGM)的估計分析(見表6)?;灸P停P?、3、5、7)只包含結(jié)點屬性和二元關(guān)系的外生變量,而全模型(模型2、4、6、8)則包括了更全面的變量集合。模型擬合程度通常通過赤池信息準則(AIC)和貝葉斯信息準則(BIC)來評價,較小的AIC 和BIC 值表明更優(yōu)的模型擬合。比較顯示,在各年份中,全模型的AIC 和BIC 值普遍低于僅包含外生變量的模型,這表明全模型具有更高的解釋力。
盡管2021-2023 年的靜態(tài)ERGM 估計結(jié)果在參數(shù)具體數(shù)值上與TERGM 存在差異,但在符號和顯著性方面與TERGM 結(jié)果高度一致,這說明TERGM 模型的穩(wěn)健性。2020 年的ERGM 結(jié)果在城市民生資源、經(jīng)濟水平、人為舒適度上出現(xiàn)顯著差異,這可能是由2020 年新冠疫情所致。TERGM動態(tài)時序分析中異常被有效彌補,凸顯TERGM在處理動態(tài)網(wǎng)絡(luò)數(shù)據(jù)上的優(yōu)勢。
如前所述,城市資源、經(jīng)濟發(fā)展水平、人口基數(shù)、舒適度等特征對該城市勞動力的流動方向及流動范圍具有一定的影響,已有研究也指出,地區(qū)差異是驅(qū)動勞動力流動的主要因素[17][19],但這種差異性對所有城市的驅(qū)動作用是否均等尚未明確。為此,本文從各個城市個體網(wǎng)絡(luò)層面入手,分析差異度對不同城市勞動力流動驅(qū)動力的異質(zhì)性。個體網(wǎng)絡(luò)(ego network)由一個中心主體(ego)及其相關(guān)聯(lián)的鄰居(alter)構(gòu)成。鑒于勞動力流動網(wǎng)絡(luò)的有向性,本文將個體網(wǎng)絡(luò)細分為流出和流入網(wǎng)絡(luò):前者由中心城市及其流出目的地構(gòu)成,后者由中心城市及其流入來源地組成,如圖6 所示。
圖6 個體網(wǎng)絡(luò)示意圖
本研究選取城市資源、人均GDP、自然舒適度和人為舒適度這四項城市屬性,在Ucinet6 軟件中計算了這些屬性在各城市流出和流入個體網(wǎng)絡(luò)中的相似性。相似性指標的數(shù)值范圍在[-1,1]之間,其中1 表示完全同質(zhì)性(即相似度高),而-1 則表示完全異質(zhì)性(即差異度高)。通過將相似性指標與城市屬性值的相關(guān)性分析繪制在坐標系中,以揭示差異度對于城市間勞動力流動驅(qū)動力的具體影響。
圖7 揭示了流出個體網(wǎng)絡(luò)中“個體-鄰居”異同度與個體城市屬性值之間的關(guān)系。城市位于零線上方表明其勞動力傾向于流向?qū)傩韵嗨频牡貐^(qū),反映了“同質(zhì)性偏好”現(xiàn)象;而零線下方的城市則顯示其勞動力更偏好流向?qū)傩圆煌牡貐^(qū),體現(xiàn)了“異質(zhì)性吸引”模式;接近零線的城市在趨同與趨異模式上較為中性。圖7 的分析揭露了兩個主要規(guī)律:絕大多數(shù)城市的勞動力在城市資源、人均GDP 和人為舒適度這三個維度上,傾向于流向與自身特征不同的地區(qū)。這表明,差異性在勞動力流動決策中發(fā)揮著顯著的驅(qū)動作用,尤其是對于資源稟賦較低的城市而言,勞動力更加趨向于流向與自身存在顯著差異的地區(qū)。第二,對于自然舒適度而言,多數(shù)城市的勞動力更傾向于流向與自身相似的地區(qū),尤其是自然條件較優(yōu)的城市,其勞動力對環(huán)境同質(zhì)性的需求顯著更高。這反映了自然舒適度作為一個重要的生活質(zhì)量指標,在勞動力流動選擇上起到了關(guān)鍵作用。這些發(fā)現(xiàn)為理解城市間勞動力流動的微觀機制提供了新的視角,特別是考慮城市特征差異性對勞動力流動決策的影響時。
圖7 流出個體網(wǎng)絡(luò)中的“個體-鄰居”異同度
圖8 對流入個體網(wǎng)絡(luò)中的“個體-鄰居”相似度與個體城市屬性值之間的關(guān)系進行了探索。與流出個體網(wǎng)絡(luò)相比,流入網(wǎng)絡(luò)中的規(guī)律性特征表現(xiàn)得不那么明顯。在城市資源、人均GDP 和人為舒適度三個維度上,大多數(shù)城市更傾向于吸引來自于資源水平相近的地區(qū)的勞動力。特別是資源水平較高的城市,這種傾向更為顯著。這一現(xiàn)象在表面上似乎與圖7 中揭示的差異化流動規(guī)律相矛盾,但實際上反映了不同統(tǒng)計方法對結(jié)果的影響。百度遷徙數(shù)據(jù)的統(tǒng)計方法是基于流動強度比較,即城市i 到城市j 的流入強度等于城市i 流入j 城市的人數(shù)占j 城市總流入人數(shù)的比例。例如,一個落后地區(qū)A 到發(fā)達地區(qū)B 的勞動力流量可能在A 的總流出中占比較大,但在B 的總流入中卻可能只占很小的比例。這一發(fā)現(xiàn)與TERGM 分析的結(jié)果一致,即發(fā)展水平較高的城市在勞動力流動網(wǎng)絡(luò)中的入度和出度均較大,且高發(fā)展水平城市間的勞動力交換流量和密度遠超過低發(fā)展水平地區(qū)向高發(fā)展水平地區(qū)的流動。這一結(jié)果揭示了勞動力流動網(wǎng)絡(luò)中發(fā)展水平高的城市在吸引和發(fā)送勞動力方面的雙重優(yōu)勢,反映了城市間勞動力流動的復(fù)雜性和動態(tài)性。
圖8 流入個體網(wǎng)絡(luò)中的“個體-鄰居”異同度
本文基于2020-2023 年元宵節(jié)后的百度遷徙數(shù)據(jù),構(gòu)建勞動力流動時間網(wǎng)絡(luò),運用社會網(wǎng)絡(luò)分析及時間指數(shù)隨機圖模型,分析勞動力流動的網(wǎng)絡(luò)拓撲結(jié)構(gòu)及時空分布特征。結(jié)果顯示:
第一、在網(wǎng)絡(luò)結(jié)構(gòu)方面,我國現(xiàn)階段勞動力流動分布東南密集,西北稀疏的總體態(tài)勢并未改變,整體網(wǎng)絡(luò)呈現(xiàn)出以鄭州、武漢為中心,北京、上海、深圳、成都為頂點的菱形結(jié)構(gòu),2020-2023 年,菱形區(qū)域內(nèi)部與外圍的分化愈發(fā)顯著,而菱形區(qū)域內(nèi)部則更為均衡,體現(xiàn)在區(qū)域內(nèi)網(wǎng)絡(luò)密集程度增強但超高流動強度的線路減少,這說明有更多的中部城市發(fā)揮著越來越重要的樞紐作用。從節(jié)點的度分布可以明顯看出“集中性流入“與”分散性流出“的態(tài)勢。城市間的不平衡仍十分明顯,發(fā)展水平較高的城市有著更強的吸引力,而行政地位更高的城市在網(wǎng)絡(luò)中有著更強的控制力,隨著交通便捷性的提高,這種控制力顯現(xiàn)出減弱的趨勢。第二、勞動力網(wǎng)絡(luò)具有自我增強及溢出效應(yīng),流入的勞動力所帶來的信息溝通可能會促進勞動力的回流,進而形成雙向流動;兩個同時與第三方進行勞動力互換的城市之間,也更加傾向于產(chǎn)生勞動力的流動,形成小團體格局。第三、影響勞動力流動的因素多維化,城市民生資源條件優(yōu)越、經(jīng)濟發(fā)展水平高、人口基數(shù)大、就業(yè)機會多、自然與人為舒適度高、收入房價比高的城市對勞動力有著更強的吸引力,而地理距離與文化距離,是勞動力流動的阻力。第四、城市民生資源條件越低、經(jīng)濟發(fā)展水平越落后的城市的勞動力越傾向于流向與自身差異更大的地區(qū),他們的流動選擇往往更加集中;然而勞動力并非只在差異度高的城市間流動,在資源水平較高的城市中,強強聯(lián)合的趨勢同樣十分明顯。
勞動力的流動體現(xiàn)著經(jīng)濟的活力,促進城市間信息的交流、資源的交換、產(chǎn)業(yè)的融合,為城市的發(fā)展提供動力,但勞動力的大規(guī)模流動中也存在著危機,流動的不均衡性使得中小城市勞動力流失情勢嚴峻的同時也給大城市帶來過度擁擠的負擔,因此,在確保勞動力自由流動的同時兼顧資源的優(yōu)化配置,促進地區(qū)間的均衡發(fā)展是各級政府需要關(guān)注的問題,首先,制定城市發(fā)展戰(zhàn)略應(yīng)充分尊重勞動力流動的規(guī)律,順應(yīng)市場經(jīng)濟力量形成的勞動力分布格局,對不同城市群,采取差異化政策。其次,應(yīng)通過豐富中小城市的民生資源、優(yōu)化產(chǎn)業(yè)結(jié)構(gòu)、提高城市舒適度去吸引勞動力回流,而不是通過抑制大城市的資源供給去調(diào)整勞動力分布。最后,西北地區(qū)地廣人稀,地理距離是阻礙勞動力流動的重要因素,但發(fā)達的交通可以在一定程度上彌補地理區(qū)位上的不足,因此,應(yīng)加快西北地區(qū)基礎(chǔ)設(shè)施建設(shè),減少流動成本,促進勞動力的流動。