張端
摘要:河南省經(jīng)濟(jì)發(fā)展受制因素有很多,大數(shù)據(jù)時(shí)代為數(shù)據(jù)挖掘帶來了很多方便。文章通過SPSS軟件對(duì)部分影響因素進(jìn)行分析總結(jié),對(duì)數(shù)據(jù)做了回歸分析預(yù)測(cè)和主成分分析,發(fā)現(xiàn)人均地區(qū)生產(chǎn)總值、失業(yè)率、財(cái)政支出、就業(yè)率等有直接關(guān)系,為經(jīng)濟(jì)的發(fā)展提供統(tǒng)計(jì)支持。
關(guān)鍵詞:大數(shù)據(jù);回歸預(yù)測(cè)分析;逐步回歸分析
一、引言
大數(shù)據(jù)是以容量大、類型多、為主要特征的數(shù)據(jù)集合,正快速發(fā)展為對(duì)數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進(jìn)行采集、存儲(chǔ)和關(guān)聯(lián)分析的新一代信息技術(shù)和服務(wù)業(yè)態(tài)。目前很多工作的快速處理都是依托了大數(shù)據(jù)帶給人們的便利,讓節(jié)省了大量時(shí)間,得到需要的數(shù)據(jù)。因此,本文在大數(shù)據(jù)的背景下,通過使用回歸分析預(yù)測(cè)法分析影響河南經(jīng)濟(jì)發(fā)展的重要因素,為河南經(jīng)濟(jì)的平穩(wěn)發(fā)展提供啟示和建議。影響經(jīng)濟(jì)發(fā)展的因素有很多,所以本文將采用多元回歸分析預(yù)測(cè)法進(jìn)行分析預(yù)測(cè)。
二、多元回歸分析預(yù)測(cè)法理論
回歸分析預(yù)測(cè)法是在分析市場(chǎng)現(xiàn)象自變量和因變量之間關(guān)系的基礎(chǔ)上,建立變量之間的回歸方程,并將回歸方程作為預(yù)測(cè)模型,根據(jù)自變量在預(yù)測(cè)期的數(shù)量變化來預(yù)測(cè)因變量關(guān)系,分為一元和多元回歸分析預(yù)測(cè)法,影響經(jīng)濟(jì)發(fā)展的因素有多個(gè),本文選取多元回歸分析預(yù)測(cè)法。依據(jù)自變量和因變量的相關(guān)關(guān)系不同,又分為線性回歸預(yù)測(cè)和非線性回歸預(yù)測(cè),本文從多元線性回歸預(yù)測(cè)進(jìn)行分析,分析影響河南省經(jīng)濟(jì)發(fā)展的幾個(gè)重要因素。
多元線性回歸預(yù)測(cè)模型是含有多個(gè)解釋變量的線性回歸模型,其方程可寫為:
Y=β0+β1X1+β2X2+…+βpXp+ε(1)
其中,β0是回歸常數(shù),β1,β2,…βp是總體回歸參數(shù),當(dāng)p=1時(shí),公式為一元線性回歸模型;當(dāng)p≥2時(shí),公式為多元線性回歸模型。ε為隨機(jī)誤差,且ε~N(0,σ2)。
三、數(shù)據(jù)收集
從中國(guó)國(guó)家統(tǒng)計(jì)局官網(wǎng)抽取出2012~2021年影響經(jīng)濟(jì)發(fā)展的固定資產(chǎn)投資、財(cái)政預(yù)算支出、居民消費(fèi)價(jià)格指數(shù)、城鎮(zhèn)失業(yè)率、城鎮(zhèn)就業(yè)人員、進(jìn)出口總額等指標(biāo)(見表1)。將河南省人均地區(qū)生產(chǎn)總值確定為因變量Y,X1,X2,X3,X4,X5,X6,分別表示固定資產(chǎn)投資、財(cái)政預(yù)算支出、居民消費(fèi)價(jià)格、失業(yè)率、就業(yè)人員、進(jìn)出口總額??梢缘玫結(jié)的多元線性回歸預(yù)測(cè)模型:
Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+β7X7+ε
從表格1中可以看出城鎮(zhèn)登記失業(yè)率和城鎮(zhèn)就業(yè)人員有缺失項(xiàng),首先使用軟件對(duì)缺失值進(jìn)行分析。利用已有的數(shù)據(jù)推斷分析缺失值的估計(jì)值,從而更準(zhǔn)確地分析所有數(shù)據(jù)對(duì)經(jīng)濟(jì)發(fā)展的影響,進(jìn)而提高統(tǒng)計(jì)的可信度。
四、相關(guān)性分析
相關(guān)性分析是一種衡量多個(gè)解釋變量與被解釋變量之間相關(guān)密切程度的一種統(tǒng)計(jì)方法,通過SPSS軟件中的相關(guān)性分析,發(fā)現(xiàn)自變量之間的相關(guān)性和自變量與因變量的相關(guān)性。表2顯示了各變量之間的相關(guān)系數(shù),包括自變量和因變量在內(nèi)的7個(gè)變量之間的Pearson相關(guān)系數(shù)及單尾檢驗(yàn)的顯著性水平。其中城鎮(zhèn)固定資產(chǎn)投資、財(cái)政預(yù)算支出、進(jìn)出口總額與人均生產(chǎn)總值的相關(guān)系數(shù)均大于0.90,且顯著相關(guān)的系數(shù)均小于0.01,表明他們具有很強(qiáng)的線性相關(guān)性,城鎮(zhèn)登記失業(yè)率與人均生產(chǎn)總值的相關(guān)系數(shù)為0.668,顯著相關(guān)系數(shù)小于0.01,說明其與人均地區(qū)生產(chǎn)總值有密切的線性相關(guān)性,人均地區(qū)生產(chǎn)總值與這四者之間是否有定量的線性關(guān)系,還需進(jìn)一步驗(yàn)證。然而,各自變量之間存在比較大的相關(guān)系數(shù),有多重共線的可能。
五、多元線性回歸分析
1. 線性趨勢(shì)考察:通過SPSS分析發(fā)現(xiàn)六個(gè)變量與人均地區(qū)生產(chǎn)總值基本呈線性關(guān)系。
2. 模型納入與剔除的變量:采用逐步回歸法即Stepwise,共建立兩個(gè)模型,納入兩個(gè)變量財(cái)政一般預(yù)算支出和城鎮(zhèn)登記失業(yè)率,默認(rèn)納入標(biāo)準(zhǔn),剔除標(biāo)準(zhǔn)。
3. 獨(dú)立性:模型2中Durbin-Watson檢查值為2.083,當(dāng)檢查值分布在0~4之間,越接近2,觀測(cè)值相互獨(dú)立的可能性就越大,多元線性回歸的觀測(cè)值具有相互獨(dú)立性。R值模型1與模型2都比較高接近于1,自變量與因變量之間的回歸關(guān)系比較密切。
4. 方差分析:兩個(gè)模型中的P<0.001,說明至少有一個(gè)自變量解釋了一部分因變量的變異,從而使得回歸變異變大殘差變異減少,模型成功建立。回歸變異平方和/總平方和=R2,因此方差分析和R2,結(jié)果同出一源。
5. 回歸分析的主要結(jié)果:回歸系數(shù)分析
模型中P值均<0.05,在α=0.05的檢驗(yàn)水準(zhǔn)下,可以認(rèn)為偏回歸系數(shù)均不為零,有統(tǒng)計(jì)學(xué)顯著性,均可納入到最終的模型中。
模型中財(cái)政一般預(yù)算支出和城鎮(zhèn)登記失業(yè)率均影響人均地區(qū)生產(chǎn)總值,通過VIF=1.967可知本模型不存在多重共線性。
由上述分析可知,模型2的擬合效果好于模型1,故選取模型2作為線性回歸方程模型,建立線性回歸方差模型,由模型可知,在本研究中影響人均地區(qū)生產(chǎn)總值的最有效的兩個(gè)量是財(cái)政一般預(yù)算支出和城市登記失業(yè)率。財(cái)政一般預(yù)算支出每增加一倍,人均地區(qū)生產(chǎn)總值會(huì)增加約4.932億元;城市登記失業(yè)率每增加一個(gè)百分點(diǎn),人均地區(qū)生產(chǎn)總值會(huì)減少約3929元。
然而,在用逐步回歸法做線性回歸時(shí),幾個(gè)預(yù)定的變量被剔除,納入的變量只有兩個(gè),說明選擇的變量之間的相關(guān)性比較大,所以在今后的研究中數(shù)據(jù)選取要更加結(jié)合實(shí)際情況,使得模型擬合的結(jié)果更具有說服力。
參考文獻(xiàn):
[1]張葉青,陸瑤,李樂蕓.大數(shù)據(jù)應(yīng)用對(duì)中國(guó)企業(yè)市場(chǎng)價(jià)值的影響——來自中國(guó)上市公司年報(bào)文本分析的證據(jù)[J].經(jīng)濟(jì)研究,2021,56(12):42-59.
[2]邱子迅,周亞虹.數(shù)字經(jīng)濟(jì)發(fā)展與地區(qū)全要素生產(chǎn)率——基于國(guó)家級(jí)大數(shù)據(jù)綜合試驗(yàn)區(qū)的分析[J].財(cái)經(jīng)研究,2021,47(07):4-17.
[3]顧劉金.應(yīng)用SPSS軟件實(shí)現(xiàn)多重線性回歸分析[J].預(yù)防醫(yī)學(xué),2018,30(03).
[4]胡良平.多重線性回歸分析的核心內(nèi)容與關(guān)鍵技術(shù)概述[J].四川精神衛(wèi)生,2018,31(01):1-6.
*基金項(xiàng)目:河南省高校人文社會(huì)科學(xué)研究一般項(xiàng)目“大數(shù)據(jù)背景下模型平均與預(yù)測(cè)方法在社會(huì)經(jīng)濟(jì)領(lǐng)域的應(yīng)用研究”(編號(hào):2023-ZDJH-583)。
(作者單位:鄭州信息工程職業(yè)學(xué)院)