亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)要素、數(shù)據(jù)勞動(dòng)與中國(guó)制造業(yè)增長(zhǎng)

        2024-05-26 01:21:50于柳箐
        統(tǒng)計(jì)與決策 2024年9期
        關(guān)鍵詞:效應(yīng)

        于柳箐,高 煜,b

        (西北大學(xué)a.經(jīng)濟(jì)管理學(xué)院;b.中國(guó)西部經(jīng)濟(jì)發(fā)展研究中心,西安 710127)

        0 引言

        在加快建設(shè)“數(shù)字中國(guó)”和加快發(fā)展數(shù)字經(jīng)濟(jì)的背景下,充分利用數(shù)據(jù)要素推動(dòng)中國(guó)制造業(yè)增長(zhǎng)以及數(shù)字化轉(zhuǎn)型升級(jí)對(duì)現(xiàn)代化產(chǎn)業(yè)體系的建立尤為重要。數(shù)據(jù)不僅是信息技術(shù)制造業(yè)等新興數(shù)字產(chǎn)業(yè)發(fā)展所必須依賴的要素,還在傳統(tǒng)制造業(yè)數(shù)字化轉(zhuǎn)型與變革過(guò)程中發(fā)揮著極其重要的作用??梢哉f(shuō),制造業(yè)變革或產(chǎn)業(yè)升級(jí)的路徑就是土地、勞動(dòng)力、資本、知識(shí)、數(shù)據(jù)等生產(chǎn)要素主導(dǎo)地位變化的過(guò)程。從而,研究數(shù)據(jù)要素對(duì)制造業(yè)增長(zhǎng)的影響對(duì)于正在邁向制造強(qiáng)國(guó)的中國(guó)而言具有重要意義。當(dāng)前文獻(xiàn)著重考察了數(shù)據(jù)要素對(duì)制造業(yè)全要素生產(chǎn)率提升[1]、高質(zhì)量發(fā)展[2]、綠色發(fā)展[3]等的影響,同時(shí)探究了企業(yè)增長(zhǎng)和效率提升中數(shù)據(jù)要素與勞動(dòng)力要素的結(jié)合效應(yīng)[4,5]。然而,上述文獻(xiàn)雖然在理論上明確了數(shù)據(jù)要素投入效應(yīng)的發(fā)揮需要結(jié)合勞動(dòng)力要素,但未進(jìn)一步指明是何種勞動(dòng)產(chǎn)生作用,且缺少經(jīng)驗(yàn)證據(jù)。另外,在實(shí)證檢驗(yàn)數(shù)據(jù)要素對(duì)制造業(yè)的影響時(shí)主要采用固定效應(yīng)模型,雖然解決了部分不可觀測(cè)因素對(duì)數(shù)據(jù)要素投入效應(yīng)估計(jì)一致性的混淆,但是由于僅控制了少數(shù)變量,因此依然可能存在遺漏變量偏差。

        作為數(shù)字經(jīng)濟(jì)時(shí)代具有關(guān)鍵作用的生產(chǎn)要素,數(shù)據(jù)要素與勞動(dòng)力要素協(xié)同促進(jìn)制造業(yè)增長(zhǎng)的內(nèi)在規(guī)律意義顯著。鑒于此,本文旨在研究數(shù)據(jù)要素如何協(xié)同勞動(dòng)力要素促進(jìn)制造業(yè)增長(zhǎng)。本文基于2012—2019年中國(guó)省級(jí)面板數(shù)據(jù),利用因果森林這一機(jī)器學(xué)習(xí)異質(zhì)性因果推斷方法估計(jì)了數(shù)據(jù)要素影響制造業(yè)增長(zhǎng)的效應(yīng),并進(jìn)一步考察了數(shù)據(jù)要素投入效應(yīng)在擁有不同數(shù)據(jù)勞動(dòng)規(guī)模的地區(qū)制造業(yè)增長(zhǎng)中是否存在異質(zhì)性,以及如何呈現(xiàn)異質(zhì)性。相比現(xiàn)有文獻(xiàn),本文以數(shù)據(jù)挖掘機(jī)制為核心深入分析了數(shù)據(jù)勞動(dòng)對(duì)數(shù)據(jù)要素促進(jìn)制造業(yè)增長(zhǎng)的調(diào)節(jié)機(jī)制;補(bǔ)充了數(shù)據(jù)勞動(dòng)如何發(fā)揮調(diào)節(jié)作用的經(jīng)驗(yàn)證據(jù);利用因果森林高維數(shù)據(jù)擬合和個(gè)體處理效應(yīng)(Individual Treatment Effect,ITE)估計(jì)能力,在控制眾多投入要素變量的同時(shí)進(jìn)行基于個(gè)體的非線性異質(zhì)性因果推斷,不僅有效緩解了遺漏變量偏差問(wèn)題,還使得考察數(shù)據(jù)勞動(dòng)對(duì)數(shù)據(jù)要素促進(jìn)制造業(yè)增長(zhǎng)的非線性調(diào)節(jié)模式成為可能。

        1 機(jī)制分析與研究假設(shè)

        1.1 數(shù)據(jù)挖掘:數(shù)據(jù)要素促進(jìn)制造業(yè)增長(zhǎng)的核心機(jī)制

        數(shù)據(jù)要素已經(jīng)成為數(shù)字經(jīng)濟(jì)時(shí)代企業(yè)生產(chǎn)、經(jīng)營(yíng)管理、研發(fā)創(chuàng)新、營(yíng)銷(xiāo)等決策過(guò)程中的必要投入。但是原始數(shù)據(jù)的積累并不能自動(dòng)轉(zhuǎn)化為用于生產(chǎn)的數(shù)據(jù)資本,與勞動(dòng)力、資本等實(shí)物(有形)生產(chǎn)要素通過(guò)直接投入產(chǎn)生經(jīng)濟(jì)物品不同,數(shù)據(jù)是虛擬(無(wú)形)的,無(wú)法依靠自身的消耗和形變創(chuàng)造價(jià)值,必須經(jīng)過(guò)一定的轉(zhuǎn)換、分析、處理才能成為促進(jìn)企業(yè)增長(zhǎng)的要素投入[6]。作為投入要素的數(shù)據(jù),其本質(zhì)是以0-1(二進(jìn)制)編碼的信息,具有非結(jié)構(gòu)化和價(jià)值稀疏的特征,為了充分發(fā)揮數(shù)據(jù)價(jià)值,需要通過(guò)搜集、存儲(chǔ)、清洗等步驟將低價(jià)值的非結(jié)構(gòu)化形態(tài)轉(zhuǎn)換為可供特定場(chǎng)景使用的高價(jià)值結(jié)構(gòu)化形態(tài),最后經(jīng)過(guò)分析提取出有用的信息[5],這一過(guò)程即數(shù)據(jù)挖掘(Data Mining)。對(duì)產(chǎn)生于日常生產(chǎn)經(jīng)營(yíng)活動(dòng)中數(shù)據(jù)資源①在產(chǎn)品生產(chǎn)、研發(fā)、銷(xiāo)售中,或在人力資源、財(cái)務(wù)管理等活動(dòng)中產(chǎn)生的原始數(shù)據(jù)。的挖掘?qū)⒅浦圃鞓I(yè)企業(yè)形成數(shù)據(jù)-信息驅(qū)動(dòng)決策范式,有利于優(yōu)化生產(chǎn)技術(shù)、激勵(lì)研發(fā)創(chuàng)新、提升管理能力等,進(jìn)而實(shí)現(xiàn)制造業(yè)增長(zhǎng)。

        1.2 數(shù)據(jù)勞動(dòng):數(shù)據(jù)要素促進(jìn)制造業(yè)增長(zhǎng)的調(diào)節(jié)機(jī)制

        數(shù)據(jù)要素的供給源于勞動(dòng)創(chuàng)造,它不是原始的數(shù)據(jù)符號(hào),而是經(jīng)過(guò)挖掘后凝結(jié)了人類(lèi)勞動(dòng)的數(shù)據(jù)產(chǎn)品[7],形成數(shù)據(jù)要素的成本主要來(lái)自人力搜集、處理數(shù)據(jù)的成本[8]。換言之,涵蓋數(shù)據(jù)搜集、存儲(chǔ)、清洗與分析過(guò)程的數(shù)據(jù)挖掘的實(shí)現(xiàn)需要具備相關(guān)技能的勞動(dòng)力全程參與,這反映了利用人力資本將數(shù)據(jù)“提純”的邏輯思想[6]。Abis 和Veldkamp(2021)[9]構(gòu)建了包含數(shù)據(jù)要素的兩階段知識(shí)生產(chǎn)模型,并指出在將原始的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)的過(guò)程中,需要數(shù)據(jù)管理人員的介入,隨后結(jié)構(gòu)化數(shù)據(jù)集與從事數(shù)據(jù)分析的勞動(dòng)力將一同作為知識(shí)生產(chǎn)中的要素。具體來(lái)看,實(shí)現(xiàn)數(shù)據(jù)挖掘的勞動(dòng)(即數(shù)據(jù)勞動(dòng))包括對(duì)數(shù)據(jù)的搜集、管理和分析,相應(yīng)地,從事數(shù)據(jù)勞動(dòng)的人員包括進(jìn)行數(shù)據(jù)搜集與記錄的數(shù)據(jù)搜集人員、進(jìn)行數(shù)據(jù)清洗與存儲(chǔ)的數(shù)據(jù)管理人員和進(jìn)行數(shù)據(jù)分析的數(shù)據(jù)分析人員。對(duì)數(shù)據(jù)的挖掘能夠促進(jìn)制造業(yè)增長(zhǎng),而數(shù)據(jù)挖掘的實(shí)現(xiàn)又依賴于數(shù)據(jù)勞動(dòng)。因此,在擁有不同數(shù)據(jù)勞動(dòng)規(guī)模的地區(qū),數(shù)據(jù)要素促進(jìn)制造業(yè)增長(zhǎng)的效應(yīng)可能不同。數(shù)據(jù)勞動(dòng)供給越充足的地區(qū),數(shù)據(jù)挖掘的作用越能充分顯現(xiàn),數(shù)據(jù)資源中的信息越能被充分提取,從而數(shù)據(jù)要素促進(jìn)制造業(yè)增長(zhǎng)的效應(yīng)越明顯。據(jù)此,本文提出以下兩個(gè)待檢驗(yàn)的假設(shè):

        假設(shè)1:數(shù)據(jù)要素投入可以促進(jìn)中國(guó)制造業(yè)增長(zhǎng)。

        假設(shè)2:數(shù)據(jù)要素對(duì)制造業(yè)增長(zhǎng)的促進(jìn)效應(yīng)受到數(shù)據(jù)勞動(dòng)的調(diào)節(jié),數(shù)據(jù)要素能更好地促進(jìn)擁有更大數(shù)據(jù)勞動(dòng)規(guī)模地區(qū)的制造業(yè)增長(zhǎng)。

        2 研究設(shè)計(jì)

        2.1 因果森林方法概述

        傳統(tǒng)回歸模型無(wú)法有效擬合高維數(shù)據(jù),可能造成遺漏變量偏差,同時(shí)還缺乏有效的異質(zhì)性處理效應(yīng)估計(jì)方法。Wager 和Athey(2018)[10]對(duì)經(jīng)典隨機(jī)森林(Random Forests)算法的節(jié)點(diǎn)分裂規(guī)則、數(shù)據(jù)擬合模式、處理效應(yīng)估計(jì)等方面進(jìn)行了改進(jìn),發(fā)展出因果森林(Causal Forests),不僅能用于高維數(shù)據(jù)因果推斷,還能進(jìn)行個(gè)體異質(zhì)性處理效應(yīng)估計(jì)。在非混淆假設(shè)下,基于半?yún)?shù)部分線性模型利用殘差回歸的推斷,對(duì)于所有的x∈χ,結(jié)合隨機(jī)森林方法可以得到固定的條件平均處理效應(yīng)(τ^):

        其中,Wi代表處理變量,Yi代表因變量,e(x)=P[Wi|Xi=x] 是由隨機(jī)森林計(jì)算的傾向分?jǐn)?shù),m(x)=E[Yi|Xi=x]是由隨機(jī)森林計(jì)算的邊際結(jié)果(marginal outcomes),上標(biāo)(-i) 表示執(zhí)行隨機(jī)森林的袋外(out-of-bag)預(yù)測(cè)①對(duì)于每個(gè)訓(xùn)練示例,所有在訓(xùn)練期間沒(méi)有使用此示例的樹(shù)都被識(shí)別出來(lái),然后僅使用這些樹(shù)對(duì)測(cè)試示例進(jìn)行預(yù)測(cè)。。雖然式(1)對(duì)處理效應(yīng)的估計(jì)是半?yún)?shù)有效的,但只能用于固定處理效應(yīng)的估計(jì),為此,Nie 和Wager(2021)[11]在式(1)的基礎(chǔ)上生成了一個(gè)“R-learner”目標(biāo)函數(shù)(objective function),用于異質(zhì)性處理效應(yīng)的估計(jì):

        其中,Λn(τ(·))是正則化項(xiàng),用于控制學(xué)習(xí)到的函數(shù)^(·)的復(fù)雜性。不同于經(jīng)典隨機(jī)森林僅關(guān)注預(yù)測(cè)誤差是否因節(jié)點(diǎn)分裂而降低,因果森林通過(guò)最大化節(jié)點(diǎn)分裂后處理效應(yīng)的組間差異反映異質(zhì)性處理效應(yīng)。因此,在給定Xi并最小化式(2)后,可為每個(gè)個(gè)體提供一個(gè)相應(yīng)的條件平均處理效應(yīng)估計(jì)^(Xi)。具體來(lái)看,因果森林通過(guò)隨機(jī)森林的袋外預(yù)測(cè)得到估計(jì)值^(·)和^(·),再利用式(3)可得到條件平均處理效應(yīng)估計(jì)值:

        其中,αi(x)為數(shù)據(jù)-自適應(yīng)核(data-adaptive kernel),是利用隨機(jī)森林測(cè)量的第i個(gè)訓(xùn)練示例與測(cè)試點(diǎn)x落入同一葉子的頻率。將隨機(jī)森林看作一種基于核的觀點(diǎn)使得用式(1)和式(2)進(jìn)行處理效應(yīng)估計(jì)成為可能。式(3)實(shí)際上使用羅賓遜變換進(jìn)行了正交化處理[11],即首先訓(xùn)練單獨(dú)的隨機(jī)森林和執(zhí)行袋外預(yù)測(cè)計(jì)算傾向分?jǐn)?shù)和邊際結(jié)果的估計(jì)值,然后計(jì)算殘差處理W-^(x)和殘差結(jié)果Y-(x),最后在這些殘差上訓(xùn)練一個(gè)因果森林。正交化估計(jì)量從Wi中剔除了Xi的影響,相當(dāng)于執(zhí)行了工具變量法,因此正交化對(duì)于在觀測(cè)性研究中獲得準(zhǔn)確的處理效應(yīng)估計(jì)必不可少。

        因果森林不僅能在具有非混淆性假設(shè)的潛在結(jié)果框架下得到一致的處理效應(yīng)估計(jì)量,還能夠有效降低標(biāo)準(zhǔn)誤,提高估計(jì)準(zhǔn)確性。更為重要的是,因果森林具備高維數(shù)據(jù)擬合和個(gè)體處理效應(yīng)估計(jì)能力,彌補(bǔ)了傳統(tǒng)回歸模型的不足[10]。

        2.2 變量設(shè)定

        2.2.1 處理變量

        本文所關(guān)注的是數(shù)據(jù)要素投入與制造業(yè)產(chǎn)出的關(guān)系,因此處理變量是數(shù)據(jù)要素投入規(guī)模。雖然現(xiàn)行的統(tǒng)計(jì)和國(guó)民經(jīng)濟(jì)核算體系中仍然缺少有關(guān)數(shù)據(jù)要素規(guī)模、價(jià)值、存量等的記錄,但是可以借鑒以往評(píng)估無(wú)形資產(chǎn)價(jià)值的經(jīng)典方法,比如市場(chǎng)法、收入法和成本法對(duì)數(shù)據(jù)要素價(jià)值展開(kāi)測(cè)度[5]。然而由于當(dāng)前數(shù)據(jù)要素交易頻率較低,且可參照的相關(guān)資產(chǎn)難以尋找,造成其未來(lái)收益、資產(chǎn)壽命、折舊率等難以準(zhǔn)確衡量,使得市場(chǎng)法和收入法在數(shù)據(jù)要素價(jià)值測(cè)度實(shí)踐中無(wú)法實(shí)現(xiàn)[8],因此只有成本法是目前最具可行性的測(cè)度數(shù)據(jù)要素價(jià)值的方法,即通過(guò)投入在數(shù)據(jù)生產(chǎn)活動(dòng)中的勞動(dòng)力和資本成本間接反映數(shù)據(jù)要素價(jià)值。鑒于此,徐翔等(2024)[8]基于從事數(shù)據(jù)搜集、處理的就業(yè)人員工資與數(shù)據(jù)資本投資數(shù)據(jù)測(cè)度了歷年各省份的數(shù)據(jù)要素規(guī)模存量(datSca)。本文使用這一指標(biāo)作為處理變量。

        2.2.2 結(jié)果變量

        本文的結(jié)果變量是制造業(yè)產(chǎn)出水平,采用主營(yíng)業(yè)務(wù)收入(manIn)衡量。

        2.2.3 調(diào)節(jié)變量

        本文的調(diào)節(jié)變量是數(shù)據(jù)勞動(dòng)規(guī)模。Nguyen和Paczos(2020)[12]指出,并非所有的行業(yè)都與數(shù)據(jù)生產(chǎn)活動(dòng)相關(guān),同時(shí)與數(shù)據(jù)生產(chǎn)相關(guān)的勞動(dòng)力也不會(huì)將所有的工作時(shí)間都用于數(shù)據(jù)生產(chǎn),因此各個(gè)行業(yè)或職業(yè)都存在一個(gè)“數(shù)據(jù)使用強(qiáng)度”。鑒于此,加拿大統(tǒng)計(jì)局對(duì)與數(shù)據(jù)生產(chǎn)相關(guān)的職業(yè)均分配了一個(gè)數(shù)據(jù)生產(chǎn)工作時(shí)間占全部工作時(shí)間的比例區(qū)間,隨后與各職業(yè)人數(shù)相乘估算了數(shù)據(jù)勞動(dòng)規(guī)模。然而這一做法具有較強(qiáng)的主觀性,同時(shí)由于缺少中國(guó)省級(jí)層面的相關(guān)職業(yè)人員數(shù)據(jù),因此本文以行業(yè)就業(yè)人員數(shù)據(jù)為基礎(chǔ)構(gòu)造地區(qū)數(shù)據(jù)勞動(dòng)規(guī)模指標(biāo)(datLab)。具體地,借鑒許憲春等(2022)[5]提出的“供給法”,本文基于數(shù)據(jù)生產(chǎn)活動(dòng)中的勞動(dòng)力與其數(shù)據(jù)生產(chǎn)工作時(shí)間占比估算地區(qū)數(shù)據(jù)勞動(dòng)規(guī)模:第一步,根據(jù)《國(guó)民經(jīng)濟(jì)行業(yè)分類(lèi)》(GB/T 4754-2017)選擇與數(shù)據(jù)生產(chǎn)活動(dòng)相關(guān)的國(guó)民經(jīng)濟(jì)二位數(shù)大類(lèi)行業(yè)j,包括計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè),儀器儀表制造業(yè),軟件和信息技術(shù)服務(wù)業(yè),互聯(lián)網(wǎng)和相關(guān)服務(wù),電信、廣播電視和衛(wèi)星傳輸服務(wù)①根據(jù)徐翔等(2024)[8]的計(jì)算,以上行業(yè)中數(shù)據(jù)生產(chǎn)活動(dòng)占其總生產(chǎn)活動(dòng)的比例均接近或超過(guò)50%。另外,根據(jù)《國(guó)民經(jīng)濟(jì)行業(yè)分類(lèi)》(GB/T 4754-2017),(63)電信、廣播電視和衛(wèi)星傳輸服務(wù),(64)互聯(lián)網(wǎng)和相關(guān)服務(wù),(65)軟件和信息技術(shù)服務(wù)業(yè)是門(mén)類(lèi)行業(yè)(I)信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)下所包含的二位數(shù)大類(lèi)行業(yè)。,以及為工業(yè)互聯(lián)網(wǎng)發(fā)展提供所需裝備的通用設(shè)備制造業(yè)和專(zhuān)用設(shè)備制造業(yè)[2]。第二步,使用徐翔等(2024)[8]計(jì)算的上述行業(yè)j的數(shù)據(jù)生產(chǎn)活動(dòng)占其總生產(chǎn)活動(dòng)的比例αj乘以行業(yè)j在i地區(qū)t年份的就業(yè)人數(shù)Lijt,得到行業(yè)j在各地區(qū)不同年份的數(shù)據(jù)勞動(dòng)投入αjLijt。第三步,加總t年份i地區(qū)內(nèi)所有行業(yè)j的數(shù)據(jù)勞動(dòng)投入得到歷年各地區(qū)數(shù)據(jù)勞動(dòng)規(guī)模指標(biāo),即datLabit=∑jαjLijt。

        2.2.4 控制變量

        由于因果森林具備高維數(shù)據(jù)擬合能力,因此可以通過(guò)控制更多的投入要素變量有效抑制潛在的混淆偏差,進(jìn)而得到數(shù)據(jù)要素影響制造業(yè)增長(zhǎng)的一致估計(jì)。本文在歐陽(yáng)志剛和陳普(2020)[13]的研究基礎(chǔ)上增加了數(shù)據(jù)要素類(lèi)別,同時(shí)在物質(zhì)資本中增加了衡量網(wǎng)絡(luò)基礎(chǔ)設(shè)施和數(shù)據(jù)資本的指標(biāo),在人力資本中增加了衡量數(shù)據(jù)勞動(dòng)的指標(biāo)。最終構(gòu)建了包含7 個(gè)投入要素類(lèi)別、18個(gè)一級(jí)指標(biāo)、30 個(gè)二級(jí)指標(biāo)的投入要素指標(biāo)體系(如表1所示)。

        表1 投入要素指標(biāo)體系與變量描述性統(tǒng)計(jì)

        2.3 數(shù)據(jù)來(lái)源與說(shuō)明

        本文所用樣本為2012—2019 年中國(guó)31 個(gè)省份(不含港澳臺(tái))的面板數(shù)據(jù)。投入要素變量數(shù)據(jù)主要來(lái)自中國(guó)研究數(shù)據(jù)服務(wù)平臺(tái)(CNRDS)以及歷年《中國(guó)統(tǒng)計(jì)年鑒》《中國(guó)科技統(tǒng)計(jì)年鑒》《中國(guó)勞動(dòng)統(tǒng)計(jì)年鑒》《中國(guó)教育統(tǒng)計(jì)年鑒》《中國(guó)固定資產(chǎn)投資統(tǒng)計(jì)年鑒》等,制造業(yè)主營(yíng)業(yè)務(wù)收入數(shù)據(jù)來(lái)自歷年《中國(guó)工業(yè)統(tǒng)計(jì)年鑒》。需要說(shuō)明的是,由于新冠肺炎疫情的影響,中國(guó)制造業(yè)在2020 年后的發(fā)展遭受重大沖擊,可能波及數(shù)據(jù)要素對(duì)制造業(yè)增長(zhǎng)的影響效應(yīng)以及數(shù)據(jù)勞動(dòng)的調(diào)節(jié)作用。與此同時(shí),疫情期間大部分的經(jīng)濟(jì)統(tǒng)計(jì)指標(biāo)均出現(xiàn)異常變動(dòng),不僅會(huì)影響因果森林等機(jī)器學(xué)習(xí)模型的估計(jì)效果[14],還會(huì)影響數(shù)據(jù)要素規(guī)模存量指標(biāo)測(cè)度的精確性。因此,為了確保實(shí)證結(jié)果的可信度,參照近期文獻(xiàn)的普遍做法[8,15],設(shè)定2019年為觀察末期。

        3 實(shí)證結(jié)果與分析

        3.1 數(shù)據(jù)要素對(duì)制造業(yè)增長(zhǎng)的影響

        利用因果森林估計(jì)數(shù)據(jù)要素影響中國(guó)制造業(yè)增長(zhǎng)的效應(yīng)。為了得到更為穩(wěn)健的結(jié)論,本文對(duì)因果森林模型參數(shù)(即超參數(shù))進(jìn)行了不同設(shè)置,結(jié)果如表2 所示。其中,列(1)使用R 語(yǔ)言grf 程序包中casual_forest 函數(shù)的默認(rèn)超參數(shù);列(2)、列(3)將基礎(chǔ)決策樹(shù)的數(shù)量分別設(shè)置為1000和4000 棵;列(4)進(jìn)行聚類(lèi)分析,將處理效應(yīng)的估計(jì)聚類(lèi)到省份層面,以控制不可觀測(cè)的地區(qū)差異。不同省份具有不隨時(shí)間改變的文化、區(qū)位、自然條件等特征,傳統(tǒng)回歸模型通過(guò)“固定效應(yīng)”或“隨機(jī)效應(yīng)”模型來(lái)捕獲聚類(lèi)效應(yīng),但是線性可加性假設(shè)限制了非線性聚類(lèi)效應(yīng)的估計(jì)。為解決這一問(wèn)題,本文使用因果森林聚類(lèi)分析方法,在模型訓(xùn)練時(shí)所有的二次抽樣過(guò)程、節(jié)點(diǎn)分裂、森林預(yù)測(cè)等均在整個(gè)集群上進(jìn)行操作,而不是單個(gè)觀測(cè);列(5)使用交叉驗(yàn)證調(diào)參,即利用機(jī)器學(xué)習(xí)交叉驗(yàn)證法對(duì)因果森林超參數(shù)進(jìn)行自動(dòng)選擇①具體做法是通過(guò)訓(xùn)練擁有不同超參數(shù)設(shè)置的因果森林,得到使式(2)“R-learner”目標(biāo)函數(shù)袋外估計(jì)最小化時(shí)的超參數(shù),并使用該超參數(shù)設(shè)置生成因果森林模型。;列(6)進(jìn)行聚類(lèi)分析的同時(shí)使用交叉驗(yàn)證調(diào)參。

        表2 數(shù)據(jù)要素影響制造業(yè)增長(zhǎng)的效應(yīng)估計(jì)

        從表2可以看出,在基于不同超參數(shù)設(shè)置的因果森林模型中,datSca 系數(shù)均顯著為正,因此說(shuō)明數(shù)據(jù)要素對(duì)中國(guó)制造業(yè)增長(zhǎng)具有顯著的促進(jìn)作用,假設(shè)1得到證實(shí)。需要說(shuō)明的是,由于因果森林進(jìn)行聚類(lèi)分析以及使用交叉驗(yàn)證調(diào)參時(shí)避免了不可觀測(cè)因素的干擾和人為主觀設(shè)定超參數(shù)的弊端,因此后文對(duì)數(shù)據(jù)勞動(dòng)調(diào)節(jié)作用的考察以及穩(wěn)健性檢驗(yàn)均以列(6)為基準(zhǔn)。

        3.2 數(shù)據(jù)勞動(dòng)的調(diào)節(jié)作用

        3.2.1 異質(zhì)性檢驗(yàn)

        據(jù)前文可知,因果森林通過(guò)式(2)在給定Xi時(shí)可以為每個(gè)個(gè)體提供一個(gè)相應(yīng)的條件平均處理效應(yīng)(CATE)估計(jì)τ^(Xi)?;诖耍疚氖褂帽? 列(6)計(jì)算得到各省份數(shù)據(jù)要素影響制造業(yè)增長(zhǎng)效應(yīng)的估計(jì)值,并使用核密度分布進(jìn)行擬合。擬合圖(略)結(jié)果顯示,CATE估計(jì)值的分布并不集中,分散于0.1~0.55,這說(shuō)明數(shù)據(jù)要素對(duì)制造業(yè)增長(zhǎng)的促進(jìn)效應(yīng)在不同省份之間存在差異。

        為確定樣本中是否存在異質(zhì)性處理效應(yīng),本文使用最佳線性預(yù)測(cè)方法進(jìn)行更正式的檢驗(yàn)。將條件平均處理效應(yīng)的袋外因果森林估計(jì)值劃分為兩個(gè)部分,分別為其中是袋外處理效應(yīng)估計(jì)的平均值,隨后將對(duì)Ci和Di進(jìn)行回歸,即設(shè)定如下回歸模型:。Di的系數(shù)β2可解釋為對(duì)處理效應(yīng)異質(zhì)性估計(jì)質(zhì)量的度量,如果顯著為正,那么表明和τ(Xi)之間存在聯(lián)系,換言之,因果森林能夠發(fā)現(xiàn)數(shù)據(jù)中存在異質(zhì)性處理效應(yīng)的假設(shè)得到了支持。從表3可知,當(dāng)進(jìn)行聚類(lèi)分析后,Di的系數(shù)β2顯著為正,說(shuō)明數(shù)據(jù)要素影響制造業(yè)增長(zhǎng)的效應(yīng)的確存在地區(qū)差異,同時(shí)也體現(xiàn)了聚類(lèi)分析的有效性。

        表3 最佳線性預(yù)測(cè)檢驗(yàn)結(jié)果

        3.2.2 調(diào)節(jié)效應(yīng)估計(jì)

        為揭示數(shù)據(jù)要素影響制造業(yè)增長(zhǎng)的效應(yīng)是如何隨著數(shù)據(jù)勞動(dòng)規(guī)模的變化而變化的,本文利用由表2 列(6)得到的各省份數(shù)據(jù)要素影響制造業(yè)增長(zhǎng)效應(yīng)的估計(jì)值(CATE)以及相應(yīng)省份的數(shù)據(jù)勞動(dòng)規(guī)模生成散點(diǎn)圖,并使用線性回歸法與局部多項(xiàng)式回歸法(LOESS)進(jìn)行擬合,如圖1所示。直線擬合顯示,數(shù)據(jù)要素對(duì)制造業(yè)增長(zhǎng)的促進(jìn)效應(yīng)隨著數(shù)據(jù)勞動(dòng)規(guī)模的擴(kuò)大而增強(qiáng)。這說(shuō)明數(shù)據(jù)要素能更好地促進(jìn)擁有更大數(shù)據(jù)勞動(dòng)規(guī)模地區(qū)的制造業(yè)增長(zhǎng),假設(shè)2得證。

        圖1 數(shù)據(jù)勞動(dòng)對(duì)數(shù)據(jù)要素促進(jìn)制造業(yè)增長(zhǎng)效應(yīng)的調(diào)節(jié)作用

        進(jìn)一步地,曲線擬合展現(xiàn)了數(shù)據(jù)勞動(dòng)邊際處理效應(yīng)(Marginal Treatment Effect,MTE)的變化,可以看到,數(shù)據(jù)勞動(dòng)對(duì)數(shù)據(jù)要素促進(jìn)制造業(yè)增長(zhǎng)效應(yīng)的調(diào)節(jié)呈現(xiàn)“倒U”型態(tài)勢(shì),即隨著數(shù)據(jù)勞動(dòng)規(guī)模的擴(kuò)大,數(shù)據(jù)要素投入效應(yīng)的增長(zhǎng)幅度越來(lái)越小。這可能是因?yàn)?,?shù)據(jù)要素促進(jìn)制造業(yè)增長(zhǎng)效應(yīng)的大小取決于從單位數(shù)據(jù)要素內(nèi)挖掘的有用信息的多寡,而從單位數(shù)據(jù)要素內(nèi)挖掘的有用信息的數(shù)量不僅取決于進(jìn)行數(shù)據(jù)搜集、管理和分析的數(shù)據(jù)勞動(dòng)人員數(shù)量,還依賴于他們所應(yīng)用的數(shù)據(jù)抓取、編碼、整合以及機(jī)器學(xué)習(xí)等數(shù)據(jù)挖掘技術(shù)。因而在數(shù)據(jù)挖掘技術(shù)水平的約束下,隨著數(shù)據(jù)勞動(dòng)規(guī)模的持續(xù)擴(kuò)大,從單位數(shù)據(jù)要素內(nèi)挖掘的有用信息的數(shù)量逐漸到達(dá)上限,進(jìn)而新增數(shù)據(jù)勞動(dòng)挖掘的有用信息的數(shù)量逐漸下降至零,從而導(dǎo)致新增數(shù)據(jù)勞動(dòng)對(duì)數(shù)據(jù)要素投入效應(yīng)的提升作用越來(lái)越小。

        3.3 穩(wěn)健性檢驗(yàn)

        (1)更換處理變量。為避免數(shù)據(jù)規(guī)模存量指標(biāo)測(cè)度誤差對(duì)估計(jì)結(jié)果的影響,借鑒徐翔和趙墨非(2020)[6]在研究數(shù)據(jù)資本與經(jīng)濟(jì)增長(zhǎng)路徑時(shí)的做法,選取省際移動(dòng)互聯(lián)網(wǎng)接入流量作為反映地區(qū)數(shù)據(jù)要素規(guī)模的指標(biāo),并將其轉(zhuǎn)換為制造業(yè)層面數(shù)據(jù)。

        (2)小樣本調(diào)參。由于本文使用的是省級(jí)層面的數(shù)據(jù),為避免基于小樣本進(jìn)行因果森林估計(jì)時(shí)可能存在的偏差,采用兩種方案進(jìn)一步優(yōu)化超參數(shù)設(shè)置,以增強(qiáng)結(jié)果的穩(wěn)健性。一是增加用于調(diào)參的樹(shù)的數(shù)量;二是增加基礎(chǔ)決策樹(shù)的數(shù)量以及誠(chéng)實(shí)分割部分,同時(shí)禁止誠(chéng)實(shí)樹(shù)剪枝。

        (3)更換機(jī)器學(xué)習(xí)模型。為避免不同機(jī)器學(xué)習(xí)方法對(duì)因果森林估計(jì)的影響,分別使用廣義回歸森林和廣義提升森林模型計(jì)算得到傾向分?jǐn)?shù)^(x)、邊際結(jié)果(x),隨后將其作為超參數(shù)傳遞至因果森林模型。

        結(jié)果(略)顯示,在更換處理變量、使用適用于小樣本的超參數(shù)、更換計(jì)算傾向分?jǐn)?shù)和邊際結(jié)果的機(jī)器學(xué)習(xí)模型后,因果森林模型對(duì)數(shù)據(jù)要素影響制造業(yè)增長(zhǎng)效應(yīng)的估計(jì)均顯著為正,同時(shí)數(shù)據(jù)勞動(dòng)對(duì)數(shù)據(jù)要素促進(jìn)制造業(yè)增長(zhǎng)效應(yīng)的調(diào)節(jié)模式也與前文一致,說(shuō)明本文的結(jié)論穩(wěn)健。

        4 結(jié)論與啟示

        本文主要研究了數(shù)據(jù)要素能否促進(jìn)制造業(yè)增長(zhǎng)以及數(shù)據(jù)勞動(dòng)如何發(fā)揮調(diào)節(jié)作用的問(wèn)題。以2012—2019年中國(guó)省級(jí)面板數(shù)據(jù)為研究樣本,使用因果森林方法展開(kāi)異質(zhì)性因果推斷,不僅估計(jì)了數(shù)據(jù)要素對(duì)制造業(yè)增長(zhǎng)的影響效應(yīng),還考察了數(shù)據(jù)勞動(dòng)對(duì)數(shù)據(jù)要素促進(jìn)制造業(yè)增長(zhǎng)效應(yīng)的調(diào)節(jié)模式。據(jù)此,得到如下結(jié)論:第一,數(shù)據(jù)要素對(duì)中國(guó)制造業(yè)增長(zhǎng)具有顯著的促進(jìn)作用;第二,數(shù)據(jù)要素能更好地促進(jìn)擁有更大數(shù)據(jù)勞動(dòng)規(guī)模地區(qū)的制造業(yè)增長(zhǎng);第三,隨著數(shù)據(jù)勞動(dòng)規(guī)模的持續(xù)擴(kuò)大,數(shù)據(jù)要素投入效應(yīng)的增長(zhǎng)幅度越來(lái)越小。

        由以上結(jié)論得出如下啟示:首先,政府需要通過(guò)加快數(shù)據(jù)開(kāi)放、數(shù)據(jù)交易基礎(chǔ)設(shè)施建設(shè)、數(shù)據(jù)要素市場(chǎng)化改革等舉措,努力提高數(shù)據(jù)要素供給數(shù)量與質(zhì)量,而制造業(yè)企業(yè)則需要重視數(shù)據(jù)要素在生產(chǎn)經(jīng)營(yíng)活動(dòng)中的作用,加強(qiáng)數(shù)據(jù)要素投入,并積極融入制造業(yè)的數(shù)字化轉(zhuǎn)型升級(jí);其次,政府需要加強(qiáng)數(shù)據(jù)搜集人員、數(shù)據(jù)管理人員、數(shù)據(jù)分析人員等數(shù)據(jù)勞動(dòng)力的培育,而制造業(yè)企業(yè)則需要加快數(shù)據(jù)勞動(dòng)人員的引進(jìn),充分發(fā)揮數(shù)據(jù)挖掘的作用,以提升數(shù)據(jù)要素對(duì)制造業(yè)增長(zhǎng)的促進(jìn)效應(yīng);最后,制造業(yè)企業(yè)在加強(qiáng)數(shù)據(jù)要素投入時(shí),不僅應(yīng)注意數(shù)據(jù)勞動(dòng)人員數(shù)量的增加,還要關(guān)注數(shù)據(jù)勞動(dòng)人員的數(shù)據(jù)搜集、管理、分析等技術(shù)應(yīng)用能力的提高,以進(jìn)一步激發(fā)數(shù)據(jù)挖掘的效用,充分挖掘數(shù)據(jù)資源中的有用信息,從而推動(dòng)數(shù)據(jù)要素促進(jìn)制造業(yè)增長(zhǎng)效應(yīng)的不斷提升。

        猜你喜歡
        效應(yīng)
        鈾對(duì)大型溞的急性毒性效應(yīng)
        懶馬效應(yīng)
        場(chǎng)景效應(yīng)
        雨一直下,“列車(chē)效應(yīng)”在發(fā)威
        決不能讓傷害法官成破窗效應(yīng)
        紅土地(2018年11期)2018-12-19 05:10:56
        死海效應(yīng)
        應(yīng)變效應(yīng)及其應(yīng)用
        福建醫(yī)改的示范效應(yīng)
        福建醫(yī)改的示范效應(yīng)
        偶像效應(yīng)
        国产后入内射在线观看| 国产97在线 | 免费| 99久久精品国产一区二区蜜芽 | av在线不卡一区二区| 欧美a级在线现免费观看| 国产日韩精品中文字无码| 国产精品国产三级国产专播| 中文字幕人妻少妇精品| 久久一道精品一区三区| 免费a级毛片无码av| 欧美人成人亚洲专区中文字幕| 麻豆av一区二区天堂| 日本黄色3级一区二区| 狼人青草久久网伊人| 久久久精品免费观看国产| 精品国产又大又黄又粗av| av免费在线免费观看| 欧美午夜刺激影院| 91在线在线啪永久地址| 在线观看人成网站深夜免费| 久久日日躁夜夜躁狠狠躁| 麻豆精品久久久久久久99蜜桃 | 国产精品久久毛片av大全日韩| 丝袜美腿网站一区二区| 看国产亚洲美女黄色一级片| 内射口爆少妇麻豆| 又爆又大又粗又硬又黄的a片| 欧美在线Aⅴ性色| 日本精品久久不卡一区二区| 亚洲国产成人久久综合| 青青在线精品2022国产| 国产精品午夜福利天堂| 丰满少妇高潮惨叫久久久| 五月婷婷俺也去开心| 日韩欧美亚洲国产一区二区三区| 亚洲一区二区在线观看av| 天天摸夜夜摸夜夜狠狠摸| 国产精品公开免费视频| 亚洲国产综合久久精品| 国产麻豆精品精东影业av网站 | 欧美成人精品三级在线观看|