楊聯(lián)強(qiáng),葉夢琳,程丹丹,劉美月
(安徽大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,合肥 230601)
自改革開放以來,中國經(jīng)濟(jì)迅速發(fā)展,國內(nèi)各種形式的一體化蓬勃興起,各地區(qū)經(jīng)濟(jì)正在成為一個(gè)相互依賴相互聯(lián)系的有機(jī)整體。然而中國東西部的區(qū)域經(jīng)濟(jì)發(fā)展出現(xiàn)較大的不平衡,主要體現(xiàn)在東部發(fā)展較快,但是中西部由于受地理位置的約束,造成經(jīng)濟(jì)發(fā)展遲緩,東部和西部的人均GDP和居民收入存在顯著的差異。[1]以上市公司數(shù)量為例,中國上市公司主要集中在東部地區(qū),中西部地區(qū)上市公司分布相對分散,數(shù)量上也呈現(xiàn)劣勢。調(diào)查發(fā)現(xiàn),中國各地區(qū)上市公司數(shù)量分布存在明顯的階梯型特點(diǎn)。[2]如何選取合適的計(jì)量經(jīng)濟(jì)方法,研究上市公司區(qū)域分布差異性,值得進(jìn)行深入探討。
民營企業(yè)是推動中國經(jīng)濟(jì)發(fā)展不可或缺的力量。例如,去年以來,中國民營上市公司積極應(yīng)對疫情挑戰(zhàn),生產(chǎn)經(jīng)營情況明顯好于國有、外資企業(yè),展現(xiàn)出較強(qiáng)的發(fā)展活力。民營企業(yè)具有收入增長快、營業(yè)成本低、效益恢復(fù)好、研發(fā)強(qiáng)度高、發(fā)展預(yù)期穩(wěn)、公司規(guī)模小、易吸納勞動力等特點(diǎn)。[3]從國有與民營企業(yè)對于區(qū)域人均財(cái)政收入、居民人均可支配收入、人均GDP三個(gè)維度衡量的區(qū)域經(jīng)濟(jì)貢獻(xiàn)看,二者差異顯著。國有企業(yè)僅在增值稅對于區(qū)域人均財(cái)政收入影響方面優(yōu)于民營企業(yè),在所得稅對于區(qū)域人均財(cái)政收入的影響和總資產(chǎn)對于人均GDP影響方面二者近似外,其它所有的解釋變量均是民營企業(yè)優(yōu)于國有企業(yè)。中國的民營企業(yè)不僅在微觀效率上具有優(yōu)勢,在區(qū)域宏觀經(jīng)濟(jì)的貢獻(xiàn)方面,同樣具有明顯的優(yōu)勢。[4]
本文選取各省市民營上市公司數(shù)量為因變量,參照已有研究文獻(xiàn),測度區(qū)域經(jīng)濟(jì)發(fā)展程度的變量,可以從不同維度來衡量民營經(jīng)濟(jì)的貢獻(xiàn)。經(jīng)濟(jì)增長是區(qū)域發(fā)展程度不可或缺的衡量維度之一,而民營企業(yè)的發(fā)展離不開一個(gè)地區(qū)的自然資源、社會資源、發(fā)達(dá)的交通,與企業(yè)相關(guān)的科學(xué)研究更是影響了企業(yè)發(fā)展的未來。故本文選取各省市區(qū)域面積、人口數(shù)、鐵路營業(yè)里程、公路里程、電力消耗量、地級及以上城市數(shù)、城區(qū)面積、地區(qū)生產(chǎn)總值、R&D人員全時(shí)當(dāng)量、R&D經(jīng)費(fèi)、R&D項(xiàng)目數(shù)、有效發(fā)明專利數(shù)、普通高等學(xué)校數(shù)、普通本??普猩鷶?shù)、普通本專科在校學(xué)生數(shù)、技術(shù)市場成交額等作為自變量來分析它們之間的相關(guān)性。[5]然而中國上市公司區(qū)域分布數(shù)量明顯呈現(xiàn)不合理性,并且在某些地區(qū)過于集中在少數(shù)省、市,如廣東和上海。在很大程度上會形成異常值或離群值,如果利用經(jīng)典的均值回歸模型,那么在計(jì)算過程中對每個(gè)觀測值都賦予相同的權(quán)重,由此帶來對異常值的處理不當(dāng),使回歸系數(shù)估計(jì)產(chǎn)生較大偏差,從而大大影響回歸模型的有效性。[6]另外,采用嚴(yán)格的穩(wěn)健回歸模型應(yīng)用于全國各省市民營公司分布數(shù)量差異研究相對匱乏,這為本文提供了立題依據(jù)。鑒于此,本文將選擇合適的計(jì)量經(jīng)濟(jì)模型時(shí),加入模型穩(wěn)健性的理論分析,并創(chuàng)新性的將合適的穩(wěn)健回歸模型應(yīng)用于中國民營上市公司分布與區(qū)域要素的相關(guān)性分析上,從而排除異常值的過渡干擾,更可靠的揭示真實(shí)的相關(guān)性,為相關(guān)的政策建議給出更準(zhǔn)確的數(shù)據(jù)分析結(jié)果支撐。[7]
市公司區(qū)域分布差異涉及多個(gè)方面, 本研究以2017年中國民營企業(yè)上市公司為例,從面積(x1)、人口數(shù)(x2)、鐵路營業(yè)里程(x3)、公路里程(x4)、電力消耗量(x5)、地級及以上城市數(shù)(x6)、城區(qū)面積(x7)、地區(qū)生產(chǎn)總值(x8)、R&D人員全時(shí)當(dāng)量(x9)、R&D經(jīng)費(fèi)(x10)、R&D項(xiàng)目數(shù)(x11)、有效發(fā)明專利數(shù)(x12)、普通高等學(xué)校數(shù)(x13)、普通本專科招生數(shù)(x14)、普通本??圃谛W(xué)生數(shù)(x15)、技術(shù)市場成交額(x16)等多方面進(jìn)行研究, 各變量的描述統(tǒng)計(jì)如表1。各自變量與因變量(y)之間的散點(diǎn)圖如圖1所示。
表1 各自變量描述統(tǒng)計(jì)量
續(xù)表1 各自變量描述統(tǒng)計(jì)量
圖1 變量間的散點(diǎn)圖
本文的數(shù)據(jù)均來自中國統(tǒng)計(jì)年鑒,數(shù)據(jù)的分析、處理和計(jì)算均在SPSS 26.0中完成。
穩(wěn)健回歸是基于異常值提出來的一種用于改良最小二乘估計(jì)的統(tǒng)計(jì)回歸方法,它基于迭代最小二乘法在一定程度上減小了異常值對回歸估計(jì)的影響,從而提高了回歸模型的有效性。[11]對于一個(gè)因變量的變動與多個(gè)解釋變量有關(guān)的線性模型,考慮分別用最小二乘估計(jì)和穩(wěn)健回歸模型來分析一般的多元線性回歸模型。
1.2.1 最小二乘估計(jì)
考慮模型
y=Xβ+u
最小二乘估計(jì)的目標(biāo)函數(shù)為
最小化該目標(biāo)函數(shù)可得正規(guī)方程組
由此可以得到,最小方差無偏估計(jì)
大家知道,線性回歸模型的上述最小二乘估計(jì)量,在噪聲 服從高斯或次高斯分布的條件下,有著最優(yōu)的估計(jì)效率。
1.2.2 穩(wěn)健回歸模型
線性模型的最小二乘估計(jì)雖然在一定條件下有著優(yōu)秀的表現(xiàn),但如果樣本點(diǎn)存在異常值,此時(shí)采用最小二乘估計(jì)卻會產(chǎn)生較大的偏差,也就是說該方法的穩(wěn)健性不夠。因此,再采用穩(wěn)健回歸模型對本文問題進(jìn)行建模分析,看最終的結(jié)果有何差異。選取Huber損失函數(shù)
其中,c為調(diào)和常數(shù),本文取c=1.345。
于是目標(biāo)函數(shù)
(1)
極小化(1)式(即對β求偏導(dǎo),并令其為零)可得:
令權(quán)重
于是
具體迭代步驟描述如下:
(1)取迭代初值:選取最小二乘估計(jì)的參數(shù)向量(X′X)-1X′y作為本次迭代的初值β(k);
(2)求初始?xì)埐睿豪玫踔涤?jì)算初始?xì)埐頴i=yi-Xiβ(k);
(4)令權(quán)重向量w=(w1,w2,…,wn)′,將其化成對角陣W=diag(w),帶入β(k+1)=(X′WX)-1X′Wy,求得β1,進(jìn)而求得新的殘差與權(quán)重向量;
(5)再返回步驟(2),計(jì)算每一步迭代的β(k),若每一個(gè)估計(jì)值都滿足:
則β(k+1)即為所求估計(jì)值(ε為預(yù)先設(shè)定的誤差容忍度)。
以民企上市公司數(shù)量為因變量,面積/平方公里, 人口/萬人, 鐵路營業(yè)里程/公里等為自變量,建立如上的多元線性回歸模型,分別采用最小二乘估計(jì)和穩(wěn)健回歸擬合方程的系數(shù),分析回歸方程的顯著性以及回歸系數(shù)的顯著性,觀察在兩種不同的方法下的差異性,從而理解穩(wěn)健回歸在處理異常值時(shí)的意義所在。下面比較最小二乘法與穩(wěn)健回歸下回歸方程的顯著性與回歸系數(shù)的顯著性。
由最小二乘估計(jì)分析結(jié)果可知,模型R2=0.971,意味著各省市面積/平方公里、人口/萬人、鐵路營業(yè)里程/公里等各解釋變量可以解釋民企上市公司數(shù)量的97.11%變化原因。
首先進(jìn)行回歸方程的顯著性檢驗(yàn),發(fā)現(xiàn)在檢驗(yàn)水平α=0.05的檢驗(yàn)下模型通過F檢驗(yàn)(F=29.450,p=0.000<0.05),即各省市面積/平方公里、人口/萬人、鐵路營業(yè)里程/公里等各解釋變量至少有一項(xiàng)會對民企上市公司數(shù)量產(chǎn)生影響關(guān)系。
再進(jìn)行回歸系數(shù)的顯著性檢驗(yàn),以各省市面積/平方公里為例:面積/平方公里的回歸系數(shù)值為0.000,但是并沒有呈現(xiàn)出顯著性(t=0.210,p=0.837>0.05),意味著面積/平方公里并不會對民企上市公司數(shù)量產(chǎn)生顯著影響關(guān)系。以此類推可以得到下面的結(jié)論:
面積/平方公里, 人口/萬人, 鐵路營業(yè)里程/公里等均不會對民企上市公司數(shù)量產(chǎn)生顯著影響關(guān)系。(下面利用同樣的方法進(jìn)行分析,不再贅述)
然而觀察數(shù)據(jù)表發(fā)現(xiàn)其中存在矛盾:數(shù)據(jù)表中可以看出地區(qū)生產(chǎn)總值高的地區(qū)民企上市公司數(shù)量較多,例如,上海、安徽、新疆的地區(qū)生產(chǎn)總值分別為30 632.99、27 018、10 881.96億元,北京、安徽、新疆的民企上市公司數(shù)量分別為157、60、29所,綜合表中數(shù)據(jù)可判斷出地區(qū)生產(chǎn)總值對民企上市公司數(shù)量呈顯著的正向影響。此外,R&D經(jīng)費(fèi)(全社會研究與實(shí)驗(yàn)發(fā)展經(jīng)費(fèi))支出指統(tǒng)計(jì)年度內(nèi)全社會實(shí)際用于基礎(chǔ)研究、應(yīng)用研究和實(shí)驗(yàn)發(fā)展的經(jīng)費(fèi)支出,即對經(jīng)濟(jì)發(fā)展產(chǎn)生間接影響。另外,由于研究具有不確定性,需要大量科學(xué)技術(shù)支持,常常無法帶來盈利且需要花費(fèi)大量費(fèi)用。故R&D經(jīng)費(fèi)應(yīng)對民企上市公司數(shù)量呈顯著的負(fù)向影響。綜上,由于上述分析與結(jié)論的矛盾性,考慮OLS分析在本次檢驗(yàn)中的不準(zhǔn)確性,因此,下面研究穩(wěn)健回歸分析在本次檢驗(yàn)中的準(zhǔn)確性。
由穩(wěn)健回歸分析結(jié)果可知,回歸方程的顯著性檢驗(yàn):在檢驗(yàn)水平α=0.05的檢驗(yàn)下模型通過F檢驗(yàn)(F=24.861,p=0.000<0.05),即各省市面積/平方公里、人口/萬人、鐵路營業(yè)里程/公里等各解釋變量至少有一項(xiàng)會對民企上市公司數(shù)量產(chǎn)生影響關(guān)系。
回歸系數(shù)的顯著性檢驗(yàn):由上表可知,地區(qū)生產(chǎn)總值/億元、R&D項(xiàng)目數(shù)、有效發(fā)明專利數(shù)/件、技術(shù)市場成交額/萬元會對民企上市公司數(shù)量產(chǎn)生顯著的正向影響關(guān)系,R&D經(jīng)費(fèi)/萬元會對民企上市公司數(shù)量產(chǎn)生顯著的負(fù)向影響關(guān)系,面積/平方公里、人口/萬人、鐵路營業(yè)里程/公里、公路里程/公里、電力消費(fèi)量/億千瓦小時(shí)、R&D人員全時(shí)當(dāng)量/人年、地級及以上城市數(shù)/個(gè)、城區(qū)面積/平方公里、普通高等學(xué)校、普通本??普猩鷶?shù)、普通本??圃谛W(xué)生數(shù)不會對民企上市公司數(shù)量產(chǎn)生顯著影響關(guān)系。
在本文中,地區(qū)生產(chǎn)總值/億元、R&D經(jīng)費(fèi)/萬元、R&D項(xiàng)目數(shù)、有效發(fā)明專利數(shù)/件、以及技術(shù)市場成交額/萬元這幾個(gè)解釋變量在最小二乘估計(jì)下對民企上市公司數(shù)量沒有顯著性影響,而在穩(wěn)健回歸下對民企上市公司數(shù)量產(chǎn)生了顯著性影響,這恰恰說明了穩(wěn)健回歸在處理異常值時(shí)的優(yōu)良性,這種回歸本身具有克服或消除樣本數(shù)據(jù)波動性的功能,相較于最小二乘估計(jì)能夠更好地?cái)M合出被解釋變量與解釋變量的關(guān)系。
最小二乘估計(jì)與穩(wěn)健估計(jì)的本質(zhì)差異在于前者賦予觀測值相同的權(quán)重,后者利用迭代最小二乘法減小異常值對回歸估計(jì)的影響,從而認(rèn)識到穩(wěn)健回歸在處理異常值時(shí)的優(yōu)良性。
由模型分析結(jié)果了解到,地區(qū)生產(chǎn)總值/億元、R&D經(jīng)費(fèi)/萬元、R&D項(xiàng)目數(shù)、有效發(fā)明專利數(shù)/件、以及技術(shù)市場成交額/萬元這幾個(gè)解釋變量在兩種估計(jì)下對民營上市公司數(shù)量產(chǎn)生了不同的影響。從前文對解釋變量的描述性統(tǒng)計(jì)中得知,地區(qū)生產(chǎn)力的發(fā)展與科技的進(jìn)步對經(jīng)濟(jì)的影響是毋庸置疑的。顯然在這組數(shù)據(jù)下,穩(wěn)健回歸的估計(jì)結(jié)果更加接近真實(shí)情況。
因此,在解決此類問題時(shí),需要著重考慮對經(jīng)濟(jì)生產(chǎn)力與科學(xué)技術(shù)進(jìn)步產(chǎn)生顯著影響的解釋變量,如果發(fā)現(xiàn)數(shù)據(jù)存在明顯的異常值,采用穩(wěn)健回歸也許會得到較佳的結(jié)果。[11]綜合本文分析結(jié)果,為了減小區(qū)域經(jīng)濟(jì)發(fā)展差異,促進(jìn)各地協(xié)調(diào)發(fā)展,建議鼓勵(lì)以科技創(chuàng)新驅(qū)動轉(zhuǎn)型升級,助力區(qū)域跨越式發(fā)展;支持民營企業(yè)發(fā)展,促進(jìn)區(qū)域協(xié)調(diào)發(fā)展;踐行綠色發(fā)展理念,增強(qiáng)可持續(xù)發(fā)展能力。[12]