蘇理云,白婷婷,張 彤,王 倩,戴 菲
(重慶理工大學(xué) 理學(xué)院,重慶 400054)
世界各國經(jīng)濟(jì)學(xué)家對于人口過度增長阻礙經(jīng)濟(jì)發(fā)展均持肯定態(tài)度[1]。人口增長對經(jīng)濟(jì)發(fā)展的影響分為2個方面:一方面,人口增長為經(jīng)濟(jì)發(fā)展提供了必要的勞動力;另一方面,人口數(shù)量通過消費(fèi)影響經(jīng)濟(jì)發(fā)展。在《中國發(fā)展報告:社會與發(fā)展——中國社會發(fā)展地區(qū)差距研究》第4章中,胡鞍鋼博士使用多元回歸分析技術(shù),根據(jù)我國31個省市有關(guān)數(shù)據(jù),測算了初始條件人口增長、人口質(zhì)量等因素對經(jīng)濟(jì)的影響[2-4]。得出結(jié)論:人口增長率每降低1個千分點(diǎn),人均GDP增長率可提高0.36~0.59個百分點(diǎn),進(jìn)而推論出:人口自然增長率降低幾個千分點(diǎn)時會明顯促進(jìn)人均GDP的增長[5-6]。這佐證了人口過度增長阻礙經(jīng)濟(jì)發(fā)展這一觀點(diǎn)。
人口的發(fā)展一方面反映了經(jīng)濟(jì)的發(fā)展,另一方面又影響、制約著經(jīng)濟(jì)的發(fā)展[7]。從某種角度而言,一個國家的發(fā)展在根本上取決于具有社會屬性的人,人口素質(zhì)的提高會為國家社會經(jīng)濟(jì)的發(fā)展帶來一定的促進(jìn)作用。經(jīng)濟(jì)全球化時代,低素質(zhì)人口不僅不會促進(jìn)經(jīng)濟(jì)的發(fā)展,還會成為經(jīng)濟(jì)發(fā)展的阻礙[8-9]。雖然現(xiàn)有的研究尚不能準(zhǔn)確反映人口素質(zhì)與經(jīng)濟(jì)增長有關(guān)指標(biāo)的數(shù)量關(guān)系,但控制文盲率有利于經(jīng)濟(jì)發(fā)展。本文中,選取文盲率表示人口素質(zhì),文盲率越低的地區(qū),人口素質(zhì)越高,人才越多,經(jīng)濟(jì)發(fā)展水平在一定程度上就越好;當(dāng)然,除人口素質(zhì)以外,人口結(jié)構(gòu)也會對經(jīng)濟(jì)的發(fā)展產(chǎn)生重要的影響[10]。由于改革開放時期到2014年計劃生育政策的實施,我國人口結(jié)構(gòu)模型極不科學(xué)。受傳統(tǒng)封建思想的影響,使得女性人口逐漸減少,造成了人口性別比不協(xié)調(diào),這在經(jīng)濟(jì)發(fā)展落后地區(qū)尤為突出[11-13]。此外,從目前的人口結(jié)構(gòu)來看,農(nóng)村人口較多,人口城鄉(xiāng)構(gòu)成比例大多小于1,這在貧困地區(qū)尤其明顯,并在一定程度上影響了我國現(xiàn)代化建設(shè)的進(jìn)程。
人口是社會經(jīng)濟(jì)發(fā)展的前提和最終歸宿,經(jīng)濟(jì)的發(fā)展在很大程度上受制于人口數(shù)量、人口質(zhì)量、人口結(jié)構(gòu)及其變化的狀況。盡管如此,由于發(fā)展之間的關(guān)系千差萬別,不同地方人口對經(jīng)濟(jì)發(fā)展的影響有一定的區(qū)別[14-15]。要實現(xiàn)人口對經(jīng)濟(jì)發(fā)展的促進(jìn)影響,必須控制人口密度、人口自然增長率,降低文盲率,優(yōu)化人口結(jié)構(gòu)(即人口性別比、總撫養(yǎng)比、人口城鄉(xiāng)構(gòu)成等),讓社會經(jīng)濟(jì)保持適度的增長[16]。
本研究擬對我國31個省市人口對經(jīng)濟(jì)的影響展開分析,新穎之處在于將聚類分析這一經(jīng)典算法引入了該研究,使文章具有更深遠(yuǎn)的經(jīng)濟(jì)意義。本研究先用聚類方法將全國31個省市劃分為四類,再以聚類中心為基礎(chǔ),最后采用多元線性模型和神經(jīng)網(wǎng)絡(luò)分析方法對四類省市進(jìn)行深入分析。
為了研究人口對經(jīng)濟(jì)發(fā)展的作用,本研究綜合考慮地區(qū)差異因素,故把全國各省市分類研究。選擇了反映經(jīng)濟(jì)和人口的12項指標(biāo),經(jīng)綜合考慮,通過K-均值算法將31個省市聚為四類,用6個經(jīng)濟(jì)指標(biāo)將四類省市經(jīng)濟(jì)狀況做了基本分析,排出優(yōu)劣等級。然后保留人口的6個指標(biāo)與反映經(jīng)濟(jì)發(fā)展的首要因素——人均GDP,根據(jù)分類結(jié)果,利用R軟件建立多元線性回歸模型以及BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行深入分析,并對模型進(jìn)行合理的檢驗和預(yù)測,然后通過神經(jīng)網(wǎng)絡(luò)進(jìn)行探究預(yù)測,將2類結(jié)果進(jìn)行比較,從而深入剖析人口對經(jīng)濟(jì)發(fā)展的影響,對影響經(jīng)濟(jì)發(fā)展的主要人口因素進(jìn)行分析,闡明人口數(shù)量、質(zhì)量以及結(jié)構(gòu)對經(jīng)濟(jì)發(fā)展的作用。通過回歸模型說明諸如人口密度、人口性別比、總撫養(yǎng)比、文盲率、人口城鄉(xiāng)構(gòu)成、人口自然增長率對經(jīng)濟(jì)發(fā)展的影響,對其重要程度給出客觀評價及預(yù)測。
決定經(jīng)濟(jì)發(fā)展的因素眾多,選取的指標(biāo)應(yīng)反映我國經(jīng)濟(jì)的發(fā)展水平、地區(qū)經(jīng)濟(jì)發(fā)展的趨勢,同時應(yīng)考慮指標(biāo)的科學(xué)性、客觀性、合理性和可獲得性。本研究結(jié)合聚類的結(jié)果進(jìn)行篩選,選取了反映經(jīng)濟(jì)發(fā)展情況的一項指標(biāo):人均地區(qū)生產(chǎn)總值作為因變量,保留了聚類分析中的指標(biāo),即人口密度、人口性別比、總撫養(yǎng)比、文盲率、人口城鄉(xiāng)構(gòu)成、人口自然增長率作為自變量。選取的12個指標(biāo),其含義見表1。
表1 人口與經(jīng)濟(jì)綜合評價指標(biāo)體系
本研究搜集了全國31個省市2003—2017年人均地區(qū)生產(chǎn)總值、人口密度、人口性別比、總撫養(yǎng)比、文盲率、人口城鄉(xiāng)構(gòu)成、人口自然增長率等數(shù)據(jù),主要來源于國家數(shù)據(jù)網(wǎng)、國家統(tǒng)計局網(wǎng)、中國就業(yè)網(wǎng)、中國統(tǒng)計年鑒等網(wǎng)站和書籍報刊上,將數(shù)據(jù)進(jìn)行整合分析,并且將經(jīng)濟(jì)增長與人口狀況結(jié)合研究,參考經(jīng)濟(jì)學(xué)的理論基礎(chǔ),然后運(yùn)用R軟件進(jìn)行分析和作圖,更加直觀地分析預(yù)測。
運(yùn)用R軟件對31個省市的相關(guān)數(shù)據(jù)進(jìn)行了k均值聚類分析,得到了聚類分析結(jié)果。
由圖1可知:當(dāng)聚類個數(shù)從4開始之后,折線波動比較平緩,本研究遵循了選取縱坐標(biāo)取值降低有減緩趨勢時聚類個數(shù)這一原則,因此本研究選擇將31個省市聚為四類。
通過各指標(biāo)4個類別的聚類中心繪制曲線(如圖2),對這4個類別做出了以下解讀:聚類后的聚類中心是純粹的數(shù)字,但由于對數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化處理,因此無法根據(jù)聚類中心的數(shù)值把握其真實意義,只能通過正負(fù)來判斷該指標(biāo)是遠(yuǎn)高于平均水平還是遠(yuǎn)低于平均水平(平均水平為0)。
第一類地區(qū)的人均地區(qū)生產(chǎn)總值和居民消費(fèi)水平均遠(yuǎn)高于平均值,物質(zhì)基礎(chǔ)雄厚,城市規(guī)模大,經(jīng)濟(jì)處于成熟階段,因此將其劃分為發(fā)達(dá)地區(qū);第二類地區(qū)的各指標(biāo)均為正值,工農(nóng)業(yè)基礎(chǔ)雄厚,擁有大批科技人才,水電資源、礦產(chǎn)資源豐富,經(jīng)濟(jì)處于成長性階段,因此將其歸納為小康地區(qū);第三類中除死亡率外均為負(fù)值,經(jīng)濟(jì)指標(biāo)均高于第一類,人口指標(biāo)大多低于第一類,其中大多為主要傳統(tǒng)工業(yè)基地,礦產(chǎn)資源豐富,目前在轉(zhuǎn)型階段,發(fā)展優(yōu)于第一類地區(qū),因此劃分為一般地區(qū);第四類省市各指標(biāo)大多為負(fù)值,都低于平均水平,人口出生率和自然增長率遠(yuǎn)高于其他三類,自然條件較差,交通不便,經(jīng)濟(jì)文化較為落后,但資源比較豐富,發(fā)展前景可觀,經(jīng)濟(jì)處于開發(fā)性階段,發(fā)展較為落后,因此將其劃分為落后地區(qū)。
通過圖3可以直觀看出省市的分類,這四類地區(qū)分別為:
第一類:北京市、上海市、天津市
第二類:江蘇省、浙江省、山東省、廣東省
第三類:內(nèi)蒙古自治區(qū)、重慶市、山西省、陜西省、湖南省、湖北省、河南省、河北省、吉林省、黑龍江省、遼寧省、安徽省、福建省、四川省
第四類:西藏自治區(qū)、廣西壯族自治區(qū)、新疆維吾爾族自治區(qū)、寧夏回族自治區(qū)、貴州省、甘肅省、青海省、云南省、海南省、江西省
在該經(jīng)濟(jì)區(qū)域版圖配色中,紅色代表第一類省市,綠色代表第二類省市,藍(lán)色代表第三類省市,紫色代表第四類省市,與上文聚類得出的四類地區(qū)相一致,四類地區(qū)的經(jīng)濟(jì)發(fā)展水平等級呈現(xiàn)逐漸下降的趨勢。
為研究一類省市的經(jīng)濟(jì)發(fā)展與人口因素之間的關(guān)系,首先進(jìn)行相關(guān)分析,變量的相關(guān)系數(shù)如圖4所示。
據(jù)圖中的陰影處可得:因變量y與自變量x1、x3、x5、x6之間存在強(qiáng)相關(guān)性,與x2、x4之間的相關(guān)性很弱,且與x1、x2、x5之間呈正相關(guān),與x3、x4、x6呈負(fù)相關(guān)。此時假定因變量人均GDP與人口自變量之間存在線性相關(guān),建立多元線性回歸模型,得到的回歸模型為
根據(jù)檢驗的結(jié)果發(fā)現(xiàn)自變量的回歸系數(shù)均不顯著,在以AIC準(zhǔn)則為最優(yōu)準(zhǔn)則,尋求最優(yōu)子集時得到的結(jié)果中,逐步回歸剔除了一半自變量,且得到的模型中還有不顯著的系數(shù),這說明線性回歸效果并不好,該類別不適合做線性分析,采取BP神經(jīng)網(wǎng)絡(luò)模型對一類省市再次進(jìn)行分析。
該模型由每組數(shù)據(jù)的各項人口指標(biāo)作為輸入層,以人均GDP作為輸出層,所以輸入層的節(jié)點(diǎn)數(shù)為6,輸出層的節(jié)點(diǎn)數(shù)為1,隱層數(shù)為c(4,2),設(shè)定完參數(shù)后,開始訓(xùn)練網(wǎng)絡(luò),得到了4層網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖,如圖5所示。
根據(jù)圖5可知:所報告的SSE(通過SSE度量)為0.090 469,訓(xùn)練的步數(shù)為34步,考慮到4層的神經(jīng)網(wǎng)絡(luò)模型比較復(fù)雜、訓(xùn)練速遞較快、誤差較小、精度較高,圖中的黑線表示每一層與其相關(guān)權(quán)重直接的關(guān)系。因為前文分析了不適合建立多元回歸模型,在此計算線性模型與神經(jīng)網(wǎng)絡(luò)模型的預(yù)測值,并且分別計算他們均方誤差(MSE),線性模型的均方誤差為7.5,神經(jīng)網(wǎng)絡(luò)模型的均方誤差為0.85,進(jìn)一步說明了線性回歸不適用于此分析,而神經(jīng)網(wǎng)絡(luò)的精確度更高。
通過度量本研究預(yù)測的人均GDP與其真實值之間的相關(guān)性,發(fā)現(xiàn)二者之間的線性相關(guān)程度達(dá)到了83.37%,表明二者之間具有相當(dāng)強(qiáng)的線性關(guān)系。下面分別采用回歸方程以及神經(jīng)網(wǎng)絡(luò)對人均GDP進(jìn)行擬合,將擬合值與真實值進(jìn)行比較。
根據(jù)表2可知:BP神經(jīng)網(wǎng)絡(luò)與回歸模型的擬合值相差不多,與真實值較接近,由于數(shù)據(jù)量的限制,測試集選取了4個個案,通過比較,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)的擬合值更好,同樣回歸模型擬合值與真實值的相關(guān)性也沒有BP神經(jīng)網(wǎng)絡(luò)效果好。因此針對一類地區(qū),采用BP神經(jīng)網(wǎng)絡(luò)效果更強(qiáng),通過交叉檢驗,將得到的預(yù)測誤差值繪制箱線圖(如圖6),平均誤差為0.263 5。
表2 測試集個案的擬合值和真實值
根據(jù)圖6可知無異常值,標(biāo)準(zhǔn)BP算法的預(yù)測結(jié)果,與真實的數(shù)據(jù)都存在一定的誤差,這可能是由于樣本的數(shù)據(jù)量太小,導(dǎo)致最終的結(jié)果存在誤差,但產(chǎn)生的誤差在預(yù)定的誤差范圍內(nèi),精度滿足模型需要,從而使神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確性較高,因此認(rèn)為該BP網(wǎng)絡(luò)具有較好的預(yù)測能力。在對人均GDP進(jìn)行預(yù)測前,首先采用時間網(wǎng)絡(luò)模型對已有的自變量歷史數(shù)據(jù)進(jìn)行預(yù)測,通過對人口指標(biāo)預(yù)測2018—2037年的數(shù)據(jù),再通過神經(jīng)網(wǎng)絡(luò),對因變量人均GDP進(jìn)行預(yù)測。
將預(yù)測自變量的數(shù)據(jù)與原隨機(jī)生成的測試集合并為新的測試集,對人均GDP進(jìn)行預(yù)測,預(yù)測值折線圖如圖7所示。
通過圖7可知:在2010年前后,人均GDP的波動較大,人均GDP的走勢在2019年后一直呈現(xiàn)穩(wěn)步增長的趨勢,人均GDP的增長率也呈穩(wěn)定增長的速度,在已知人口指標(biāo)的情況下,利用BP網(wǎng)絡(luò)模型能夠有效預(yù)測經(jīng)濟(jì)的走勢,同時也使研究經(jīng)濟(jì)和人口的關(guān)系是有效的一種途徑,在實際運(yùn)用中,可以將經(jīng)濟(jì)的指標(biāo)不斷加入模型中,使網(wǎng)絡(luò)模型更加精準(zhǔn)有效。
在對二類省市的經(jīng)濟(jì)發(fā)展與人口因素之間的關(guān)系進(jìn)行分析前,同樣需要進(jìn)行相關(guān)分析,變量的相關(guān)系數(shù)如圖8所示。
據(jù)圖8中的陰影處可得:因變量y與自變量x1、x3、x4之間存在強(qiáng)相關(guān)性,與x2、x6之間的相關(guān)性較弱,此時假定因變量人均GDP與人口自變量之間存在線性相關(guān),建立多元線性回歸模型,得到的回歸模型為
由于普通最小二乘回歸模型的一些系數(shù)不顯著,x2、x6之間相關(guān)性較強(qiáng),需要對模型進(jìn)一步優(yōu)化。根據(jù)AIC準(zhǔn)則為最優(yōu)準(zhǔn)則,尋求最優(yōu)子集時得到的結(jié)果中,逐步回歸后自變量系數(shù)均高度顯著,且得到的模型擬合效果較好,通過檢驗,模型不存在自相關(guān)、共線性、異方差等,這說明線性回歸有一定的成效。此時,最優(yōu)的回歸模型為
為比較回歸模型與神經(jīng)網(wǎng)絡(luò)擬合效果的強(qiáng)弱,采用回歸方程以及神經(jīng)網(wǎng)絡(luò)對人均GDP進(jìn)行擬合,所得到的擬合值與真實值如表3所示。
表3 測試集個案比較
根據(jù)表中的數(shù)據(jù)進(jìn)行比較,發(fā)現(xiàn)回歸擬合值更貼近原始真實值,而BP神經(jīng)網(wǎng)絡(luò)擬合值有很大出入,通過檢驗,BP神經(jīng)網(wǎng)絡(luò)預(yù)測值與原始值之間的相關(guān)性為0.44,相關(guān)性較弱,預(yù)測結(jié)果沒有說服力,同時,通過回歸模型預(yù)測的均方誤差為0.19,而通過BP神經(jīng)網(wǎng)絡(luò)預(yù)測的均方誤差為0.78,因此BP神經(jīng)網(wǎng)絡(luò)針對二類省市的情況下,沒有回歸模型的效果好,因此采用回歸模型對二類省市進(jìn)行預(yù)測,但由于多元線性模型進(jìn)行預(yù)測的實際意義并不大,故而,這里只針對2018年進(jìn)行預(yù)測,預(yù)測2018年的二類省市的人均GDP的聚類中心為0.625 4,比平均值略高,因此可以認(rèn)為二類省市的發(fā)展會越來越好,與前期的人均GDP的聚類中心相比,差距不大,比較平穩(wěn)。
2.4.1 多元線性回歸的初步嘗試
首先,對人口指標(biāo)以及人均GDP進(jìn)行了相關(guān)分析,做出了相關(guān)系數(shù)排列如圖9,可以看出y與x2、x3、x4、x6的相關(guān)性較強(qiáng),相關(guān)系數(shù)絕對值均大于0.6,則這4個自變量與y有較強(qiáng)的相關(guān)性,同時也可以直觀地看出有的自變量之間也存在較強(qiáng)的相關(guān)性。
其次,用普通最小二乘法進(jìn)行多元線性回歸,發(fā)現(xiàn)除常數(shù)項顯著,各自變量系數(shù)均不顯著,可初步判斷出該三類省市不適合進(jìn)行多元線性回歸,然后進(jìn)行了逐步回歸,剔除變量后只留下x2、x6,并且x2不顯著,因此證實了上述想法,該類省市不適合做多元線性回歸。
最后,本研究對預(yù)測的人均GDP與其真實值計算相關(guān)系數(shù)為0.856,SSE值為0.092,可初步推測該模型預(yù)測效果不佳。
2.4.2 基于神經(jīng)網(wǎng)絡(luò)BP算法的研究
通過上述普通最小二乘法建立多元線性回歸模型,發(fā)現(xiàn)預(yù)測效果不佳,因此本研究決定采用BP算法探究人口對經(jīng)濟(jì)的影響。
將數(shù)據(jù)集劃分為一個具有75%案例的訓(xùn)練集(11個)和一個具有25%案例的測試集(4個)。選好訓(xùn)練集后,對于6個人口指標(biāo)和人均GDP之間的關(guān)系建立模型,使用多層前饋神經(jīng)網(wǎng)絡(luò),將隱藏節(jié)點(diǎn)設(shè)置為雙層,即c(4,2);然后使用訓(xùn)練集建立神經(jīng)網(wǎng)絡(luò)模型,通過R軟件得到了網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)(如圖10)??梢杂^測到訓(xùn)練的步數(shù)為109步,誤差平方和即SSE的值為0.012 916,SSE極小,而前文中多元線性回歸SSE為0.092,因此可知神經(jīng)網(wǎng)絡(luò)模型擬合效果較好。
為了評估模型的性能并且與以上的多元線性回歸模型進(jìn)行比較,對剩下的4年數(shù)據(jù)做預(yù)測,通過R軟件度量出后4年真實人均GDP值和預(yù)測人均GDP之間的相關(guān)系數(shù)為0.924,說明二者有很強(qiáng)的線性關(guān)系,模型擬合數(shù)據(jù)極好。這與線性模型的相關(guān)系數(shù)0.856相比提高了很多,因此選擇神經(jīng)網(wǎng)絡(luò)模型對未來人均GDP做預(yù)測。
接下來對該神經(jīng)模型進(jìn)行交叉檢驗,將測試數(shù)據(jù)集分離,基于訓(xùn)練數(shù)據(jù)集擬合一個模型,用測試數(shù)據(jù)集測試模型,然后計算預(yù)測誤差,經(jīng)過10次重復(fù)之后,最后計算平均誤差,觀察該模型的擬合程度,通過計算的平均誤差為0.019 94,將10個預(yù)測誤差值畫箱線圖(如圖11),可知預(yù)測誤差值中沒有異常值,預(yù)測誤差值的范圍集中在0.004~0.039,都是極其小的,因此認(rèn)為該模型擬合數(shù)據(jù)效果非常好,可用于預(yù)測未來數(shù)據(jù)。
2.4.3 未來人均GDP的預(yù)測
1)運(yùn)用時間序列模型預(yù)測未來自變量
由于測試集較少,因此要想做未來20年人均GDP的預(yù)測,必須先進(jìn)行未來20年人口指標(biāo)的預(yù)測。因此本研究選擇用時間序列模型預(yù)測未來自變量,根據(jù)已有15年的人口指標(biāo)對未來20年的人口指標(biāo)進(jìn)行預(yù)測。首先應(yīng)檢測6個自變量序列的平穩(wěn)性,通過平穩(wěn)性檢驗判斷是否為平穩(wěn)序列。如果是平穩(wěn)序列,則開始確定模型;如果是非平穩(wěn)序列,需對非平穩(wěn)序列進(jìn)行差分算子的方法將非平穩(wěn)序列變換為平穩(wěn)序列,這里采用ARIMA模型做自動的模型選擇進(jìn)行擬合,得到了未來20年的6個人口指標(biāo)。
2)運(yùn)用神經(jīng)網(wǎng)絡(luò)模型對未來人均GDP的預(yù)測
本研究通過神經(jīng)網(wǎng)絡(luò)預(yù)測未來20年人均GDP,得到的預(yù)測數(shù)據(jù)以及原始數(shù)據(jù)如圖12所示。橫坐標(biāo)為年份,黑線部分為訓(xùn)練數(shù)據(jù)中的因變量值趨勢,藍(lán)線部分為預(yù)測的人均GDP值。
圖12可以直觀體現(xiàn)出未來三類省市人均GDP在2020年之前處于大幅度增長后又持續(xù)上下波動,2020年之后,人均GDP只有小幅度的波動然后趨于平穩(wěn)。可以初步推斷出,在未來的20年,我國政策和各方面人口結(jié)構(gòu)的優(yōu)化以及人口素質(zhì)的提高會短時間內(nèi)使我國三類城市GDP的增長更加明顯,但是由于產(chǎn)業(yè)轉(zhuǎn)型階段可能會造成小幅度的不穩(wěn)定,而長遠(yuǎn)來看,我國三類省市的人均GDP將會呈現(xiàn)出高水平發(fā)展趨勢。
2.5.1 多元線性回歸模型的建立
首先通過相關(guān)系數(shù)排列圖(圖13)可以看出:y與x3、x5、x6的相關(guān)性較強(qiáng),系數(shù)分別為-0.869、0.811、-0.689,其絕對值均大于0.6,這3個自變量與y有比較高的線性相關(guān)關(guān)系;還能看出有的自變量之間存在較強(qiáng)的相關(guān)關(guān)系,可能存在多重共線性。
本研究最先使用普通最小二乘法建立回歸方程,可以看出只有x4、x5回歸系數(shù)顯著,說明該回歸方程存在不必要的變量,下一步進(jìn)行逐步回歸,根據(jù)AIC最小原則剔除x1、x3后,各回歸系數(shù)均顯著,該回歸方程為
接下來對逐步回歸后的方程進(jìn)行異方差檢驗,檢驗數(shù)據(jù)如表4,可以看出各變量p值均大于0.05,因此認(rèn)為在顯著性水平為0.05時,異方差不顯著。
表4 異方差檢驗數(shù)據(jù)
然后對該回歸方程進(jìn)行殘差正態(tài)性檢驗,p值為0.676 8,再進(jìn)行自相關(guān)檢驗,可以得到DW值為1.932 2,p值為0.928 7,因此在顯著性水平為0.05時,認(rèn)為殘差是正態(tài)分布的,并且自相關(guān)不顯著。
最后對方程進(jìn)行多重共線檢驗,各變量的VIF值如表5,可知自變量x4的VIF值為16.97且大于10,說明逐步回歸方程存在多重共線性。
表5 共線檢驗的VIF值
本研究可以先通過繪制嶺跡圖判斷存在共線性變量,如圖14(a),發(fā)現(xiàn)x2的嶺回歸系數(shù)非常不穩(wěn)定,變化特別大,因此剔除x2再次繪制嶺跡圖如圖14(b),發(fā)現(xiàn)各變量嶺回歸系數(shù)都較為穩(wěn)定,初步判定該方程不存在多重共線性。
然后剔除x2再次進(jìn)行普通最小二乘回歸,回歸方程顯著,各回歸系數(shù)均極其顯著,再次計算VIF值,發(fā)現(xiàn)均小于10,因此證實了上述結(jié)論,該回歸方程的多重共線性已消除,得到最優(yōu)回歸方程如下:
為了進(jìn)一步驗證方程的準(zhǔn)確性,再次對該回歸方程進(jìn)行異方差檢驗、自相關(guān)檢驗和殘差正態(tài)性檢驗,各檢驗均通過,因此該方程為多元線性回歸最優(yōu)方程。
本研究利用此最優(yōu)方程進(jìn)行預(yù)測,發(fā)現(xiàn)預(yù)測值和真實值之間的相關(guān)系數(shù)高達(dá)0.989,SSE值為0.088 3,說明最優(yōu)方程擬合較好。
2.5.2 神經(jīng)網(wǎng)絡(luò)模型的建立
為了進(jìn)一步選擇最優(yōu)的預(yù)測模型進(jìn)行預(yù)測,選擇神經(jīng)網(wǎng)絡(luò)的非線性模型進(jìn)行嘗試,與上述多元線性回歸模型進(jìn)行比較,利用得到的神經(jīng)網(wǎng)絡(luò)模型預(yù)測后4年的人均GDP,發(fā)現(xiàn)該預(yù)測值與真實值之間的相關(guān)系數(shù)為-0.632,SSE值為0.391,說明該數(shù)據(jù)用神經(jīng)網(wǎng)絡(luò)模型極不合理,不應(yīng)該繼續(xù)使用。
2.5.3 運(yùn)用多元線性回歸模型進(jìn)行預(yù)測
通過比較預(yù)測值和真實值相關(guān)系數(shù)以及SSE值,本研究選擇用多元線性回歸模型進(jìn)行預(yù)測,由于多元線性回歸不適合做長期預(yù)測,因此這里只對2018年的人均GDP進(jìn)行預(yù)測,預(yù)測出四類省市人均GDP的聚類中心為-0.473,較往年來說低于全國平均水平,因此認(rèn)為國家各項政策以及經(jīng)濟(jì)措施的施行,四類省市的人均GDP在不斷提高。
1)在探究人口對經(jīng)濟(jì)的關(guān)系過程中,發(fā)現(xiàn)二類省市及四類省市適合做線性回歸,擬合效果較好,而另外兩類省市則適合做神經(jīng)網(wǎng)絡(luò)模型。根據(jù)回歸模型對人口和經(jīng)濟(jì)的關(guān)系做出如下客觀評價:人口性別比、人口城鄉(xiāng)構(gòu)比及人口自然增長率對人均GDP有顯著影響。但是由于地區(qū)發(fā)展階段以及社會背景的差異,人口自然增長率對經(jīng)濟(jì)發(fā)展影響不同。較發(fā)達(dá)地區(qū),人口自然增長率的增加對人均GDP有顯著的促進(jìn)作用;而較為落后且面臨產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)型的地區(qū),過快的人口自然增長率和經(jīng)濟(jì)的發(fā)展是不協(xié)調(diào)的。兩類地區(qū)具有明顯的差距與我國的國情和實際情況相符。通過上述分析發(fā)現(xiàn):人口密度和人均GDP存在弱相關(guān)關(guān)系,在此研究中,人口密度對經(jīng)濟(jì)發(fā)展沒有顯著的影響,這說明該指標(biāo)信息較為片面,隨著社會的發(fā)展,產(chǎn)業(yè)結(jié)構(gòu)和經(jīng)濟(jì)的發(fā)展方式不斷發(fā)生變化,只通過單一的人口密度不能全面體現(xiàn)經(jīng)濟(jì)狀況。
2)針對回歸模型的分析和神經(jīng)網(wǎng)絡(luò)的預(yù)測,人口和經(jīng)濟(jì)的發(fā)展問題歷來是社會最基礎(chǔ)的問題,人口問題始終是制約經(jīng)濟(jì)發(fā)展的關(guān)鍵因素之一,根據(jù)研究結(jié)論,針對人口結(jié)構(gòu)和經(jīng)濟(jì)的可持續(xù)發(fā)展提出幾點(diǎn)建議:適度控制人口增長,我國的人口和經(jīng)濟(jì)的效益關(guān)系朝著和諧的方向發(fā)展,但整體效益不高,且存在明顯的區(qū)域差異,人口是主要的壓力和瓶頸,人口凈增長的壓力仍然巨大,實現(xiàn)經(jīng)濟(jì)的持續(xù)發(fā)展,必須構(gòu)建科教同步發(fā)展的理念;提高人口素質(zhì),保證未來勞動力人口的受教育水平較高,特別注重高技術(shù)人才培養(yǎng),加大教育投資,將人口政策的重點(diǎn)轉(zhuǎn)移到提高人口素質(zhì),發(fā)展多層次教育,適應(yīng)不同的勞動者對知識的需求,并且根據(jù)國家要求,鼓勵促進(jìn)職業(yè)教育,為促進(jìn)社會主義現(xiàn)代化建設(shè)培養(yǎng)具有較高實踐能力的應(yīng)用型人才;合理優(yōu)化產(chǎn)業(yè)人口結(jié)構(gòu),擴(kuò)大第三產(chǎn)業(yè)對于經(jīng)濟(jì)發(fā)展的貢獻(xiàn)度。改革開放以來,我國第一產(chǎn)業(yè)人口加速下降,雖然這一結(jié)構(gòu)不斷趨于合理化,但與發(fā)達(dá)地區(qū)相比,我國第三產(chǎn)業(yè)對經(jīng)濟(jì)的影響還有很大的提升空間,合理的調(diào)整三大產(chǎn)業(yè)人口結(jié)構(gòu)對我國經(jīng)濟(jì)具有顯著的促進(jìn)作用。