吳新林,陳詩雨
(1.湖北第二師范學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,武漢 430205;2.湖北第二師范學(xué)院 大數(shù)據(jù)建模與智能計(jì)算研究所,武漢 430205)
教育經(jīng)費(fèi)的增加與中國(guó)國(guó)內(nèi)生產(chǎn)總值增加有關(guān),經(jīng)濟(jì)發(fā)展水平是教育發(fā)展水平的直接和最終決定因素,是現(xiàn)代教育的根本性的社會(huì)動(dòng)力。增加教育經(jīng)費(fèi)可以為教育提供物質(zhì)條件和基礎(chǔ),這意味著將會(huì)有更多資源流向教育,可以建設(shè)更完善的教育設(shè)施,招聘更優(yōu)秀的教師,從而提高教育產(chǎn)出。通過預(yù)測(cè)教育經(jīng)費(fèi)可幫助人們做出合理決策,及時(shí)調(diào)整教育資源中的分配結(jié)構(gòu)。在研究預(yù)測(cè)的過程中需要用到數(shù)理統(tǒng)計(jì)的相關(guān)方法,如,李海娟分析了數(shù)理統(tǒng)計(jì)在經(jīng)濟(jì)學(xué)中應(yīng)用的意義以及具體的應(yīng)用策略[1],為本研究提供了參考。
本文著眼于利用一元線性回歸模型預(yù)測(cè)教育經(jīng)費(fèi),研究國(guó)內(nèi)生產(chǎn)總值與教育經(jīng)費(fèi)的關(guān)系,引入一元線性回歸模型,為今后的預(yù)測(cè)提供解決思路和方法步驟。對(duì)一元線性回歸模型進(jìn)行預(yù)測(cè)的研究主要分為兩部分,一部分為研究預(yù)測(cè)過程中模型的相關(guān)概念與基本理論、模型的建立與方法步驟,其中,茆詩松等給出了回歸系數(shù)的最小二乘估計(jì),通過求偏導(dǎo)數(shù)并命其為0 可以得到參數(shù)的最小二乘估計(jì)算式[2];李文亮等以濟(jì)源市1991-2000年國(guó)內(nèi)生產(chǎn)總值與固定資產(chǎn)投資關(guān)系為例將一元線性回歸模型在投資方面的預(yù)測(cè)中具體進(jìn)行了應(yīng)用,并展示了一元線性相關(guān)關(guān)系判定中的相關(guān)圖和相關(guān)系數(shù)這兩種方法[3];何福云等將一元線性回歸模型在預(yù)測(cè)工程項(xiàng)目的造價(jià)中進(jìn)行應(yīng)用[4];杜克余等將一元線性回歸在分析農(nóng)業(yè)建設(shè)規(guī)模中進(jìn)行運(yùn)用。[5]唐亞寧等[6]對(duì)一元線性回歸方程的三種顯著性檢驗(yàn)的等價(jià)性進(jìn)行分析;另一部分為利用軟件對(duì)一元線性回歸模型進(jìn)行求解和預(yù)測(cè);張海燕等將Excel軟件應(yīng)用到一元線性回歸問題的求解中。[7]隨著研究的深入,郭志軍等應(yīng)用Excel軟件對(duì)一元線性回歸模型進(jìn)行分析,得出數(shù)據(jù)間的關(guān)系,建立回歸方程[8];楊雄等以成本預(yù)測(cè)為案例,應(yīng)用Excel 對(duì)案例進(jìn)行回歸方程求解,并對(duì)Excel 運(yùn)行結(jié)果中的各參數(shù)進(jìn)行解釋。[9]綜合以上分析可以看出,各學(xué)者將一元線性回歸模型應(yīng)用于不同研究領(lǐng)域,本文一方面結(jié)合2012-2021年期間國(guó)內(nèi)生產(chǎn)總值與全國(guó)教育經(jīng)費(fèi)的樣本數(shù)據(jù)對(duì)一元線性回歸模型進(jìn)行了參數(shù)估計(jì),并對(duì)結(jié)果進(jìn)行了顯著性檢驗(yàn),另一方面,將建立的模型應(yīng)用于教育經(jīng)濟(jì)預(yù)測(cè)問題中,借助Excel軟件對(duì)模型進(jìn)行了求解。
一元線性回歸模型使用的條件是兩個(gè)經(jīng)濟(jì)變量之間需要存在線性相關(guān)關(guān)系,下面將介紹兩種判斷經(jīng)濟(jì)變量之間是否存在線性相關(guān)關(guān)系的方法。
方法1:散點(diǎn)圖法
調(diào)查并收集具有相關(guān)關(guān)系的兩個(gè)現(xiàn)象的相關(guān)資料及數(shù)據(jù),形成一組組成對(duì)的數(shù)據(jù)并在直角坐標(biāo)系中呈現(xiàn)。觀察這些點(diǎn)的分布情況,如果這些點(diǎn)大致分布在一條直線上下,就說明這兩個(gè)變量之間有線性關(guān)系,如果這些點(diǎn)散落分布,不在一條直線附近,說明這兩個(gè)變量之間不是線性相關(guān)。
方法2:相關(guān)系數(shù)
通過計(jì)算相關(guān)系數(shù)也可以來確定相關(guān)關(guān)系,計(jì)算公式為:[2]
在確定了兩個(gè)變量之間有線性相關(guān)關(guān)系后,就可以進(jìn)行線性回歸分析。設(shè)一元線性回歸模型為y?=a?+b?x,稱y關(guān)于x的回歸方程[2],所呈現(xiàn)的圖形稱為回歸直線。給定x=x0后,稱y?0=a?+b?x0為預(yù)測(cè)值。
一般采用最小二乘法估計(jì)模型中的a?,b?,令存在a?,b?使得Q(a,b)最小,將Q(a,b) 分別對(duì)a,b進(jìn)行求偏導(dǎo)并命其為0。解得:
這就是參數(shù)的最小二乘估計(jì),其中:[2]
下面需要判斷本文所使用的回歸方程是否有意義,本文采用F檢驗(yàn)法對(duì)回歸方程進(jìn)行檢驗(yàn)。
在F檢驗(yàn)中[2]:稱y?i=a?+b?xi為xi處的回歸值,又稱yi-y?i為xi處的殘差。數(shù)據(jù)總的波動(dòng)用總偏差平方和表示:。yi的波動(dòng)用回歸平方和表示:。y的觀測(cè)值與回歸值之間的差距用殘差平方和表示:
F 作為檢驗(yàn)問題的檢驗(yàn)統(tǒng)計(jì)量[2]:,對(duì)于整個(gè)給定的顯著性水平α,其拒絕域?yàn)镕≥F1-α(1,n-2) ,整個(gè)檢驗(yàn)也可列成一張方差分析表,如表1所示,檢驗(yàn)也可用p值進(jìn)行。
表1 方差分析表
選取2012-2021年中國(guó)國(guó)內(nèi)生產(chǎn)總值和全國(guó)教育經(jīng)費(fèi)數(shù)據(jù)(如表2所示),建立一元線性回歸模型。中國(guó)統(tǒng)計(jì)年鑒數(shù)據(jù)顯示,2022年國(guó)內(nèi)生產(chǎn)總值為121.0萬億元,下面利用一元線性回歸模型和2022年國(guó)內(nèi)生產(chǎn)總值預(yù)測(cè)2022年全國(guó)教育經(jīng)費(fèi)。(注:截至2023年5月,2022年度全國(guó)教育經(jīng)費(fèi)數(shù)據(jù)尚未官方公布。)
表2 2012-2021年GDP和全國(guó)教育經(jīng)費(fèi)
(1)一元線性相關(guān)關(guān)系的判定
方法1:繪制散點(diǎn)圖
由表2中2012-2021年中國(guó)國(guó)內(nèi)生產(chǎn)總值和全國(guó)教育經(jīng)費(fèi)數(shù)據(jù)繪制散點(diǎn)圖,如圖1所示:
圖1 GDP和全國(guó)教育經(jīng)費(fèi)散點(diǎn)圖
方法2:計(jì)算相關(guān)系數(shù)
由相關(guān)圖(見圖1)和相關(guān)系數(shù)(0.998)可以判斷中國(guó)國(guó)內(nèi)生產(chǎn)總值與全國(guó)教育經(jīng)費(fèi)之間存在高度的線性相關(guān)關(guān)系。
(2)建立一元線性回歸模型
從散點(diǎn)圖我們發(fā)現(xiàn)10個(gè)點(diǎn)基本在一條直線附近,這說明兩個(gè)變量之間存在線性相關(guān)關(guān)系,我們?cè)O(shè)關(guān)于中國(guó)國(guó)內(nèi)生產(chǎn)總值與全國(guó)教育經(jīng)費(fèi)之間的一元線性回歸模型為:y?=a?+b?x,其中,a?、b?為待求的回歸系數(shù)。
(3)最小二乘估計(jì)求回歸系數(shù)
(4)回歸方程的顯著性檢驗(yàn)
這里我們考慮關(guān)于回歸方程的顯著性檢驗(yàn),相關(guān)指標(biāo)計(jì)算結(jié)果如下:
將數(shù)據(jù)移入方差分析表,繼續(xù)進(jìn)行計(jì)算。計(jì)算出國(guó)內(nèi)生產(chǎn)總值和全國(guó)教育經(jīng)費(fèi)的方差分析表,如表3所示。因?yàn)閜值很小,故在顯著性水平0.01下回歸方程是顯著的。
表3 GDP和全國(guó)教育經(jīng)費(fèi)回歸方程的方差分析表
(5)預(yù)測(cè)
建立好模型后就可以進(jìn)行預(yù)測(cè),將每年的國(guó)內(nèi)生產(chǎn)總值代入回歸預(yù)測(cè)模型中可以得到全國(guó)教育經(jīng)費(fèi)的預(yù)測(cè)值。由中國(guó)統(tǒng)計(jì)年鑒得知,2022年的國(guó)內(nèi)生產(chǎn)總值為121.0萬億元,則2022年全國(guó)教育經(jīng)費(fèi)的預(yù)測(cè)值為:y?=0.15+0.05×121=6.2(萬億元)。
Excel 軟件是微軟公司出品的Office 系列軟件中的其中一款,它是一個(gè)功能強(qiáng)大的可以進(jìn)行數(shù)據(jù)管理與分析的軟件,Excel向我們提供了80多個(gè)統(tǒng)計(jì)函數(shù)。本文首先應(yīng)用Excel軟件的SLOPE函數(shù)和INTERCEPT函數(shù)求出回歸方程的斜率和截距,然后應(yīng)用FORECAST函數(shù)進(jìn)行預(yù)測(cè)。其具體求解步驟與方法如下:
(1)SLOPE函數(shù):選擇“y的范圍(因變量)”和“x的范圍(自變量)”,計(jì)算的回歸直線y=a+bx的斜率b。
語法:SLOPE(Known-y's,Known-x's)
(2)INTERCEPT 函數(shù):通過“y的范圍(因變量)”和“x的范圍(自變量)”,計(jì)算回歸直線y=a+bx的截距a。
語法:INTERCEPT(Known-y's,Known-x's)
(3)FORECAST函數(shù):通過指定的x值來預(yù)測(cè)y值。
語法:FORECAST(x,Known-y's,Known-x's)
其中:
X……預(yù)測(cè)中使用的值;
Known-y's……指定已知的y值;
Known-x's……指定已知的x值。
求解步驟如下:
(1)將2012-2021年中國(guó)國(guó)內(nèi)生產(chǎn)總值和全國(guó)教育經(jīng)費(fèi)的數(shù)據(jù)輸入到Excel中。
(2)在單元格F2中插入SLOPE函數(shù),選出因變量數(shù)值區(qū)域及自變量數(shù)值區(qū)域,計(jì)算出斜率b=0.05,過程及結(jié)果如圖2所示。
圖2 SLOPE函數(shù)
(3)在單元格F3中插入INTERCEPT函數(shù),選出因變量數(shù)值區(qū)域及自變量數(shù)值區(qū)域,計(jì)算出截距a=0.24,過程及結(jié)果如圖3所示。
圖3 INTERCEPT函數(shù)
(4)由斜率b和截距a的值可得,一元線性回歸方程為y?=0.24+0.05x。
(5)在單元格C12中插入FORECAST函數(shù),在B12中輸入2022年國(guó)內(nèi)生產(chǎn)總值為121.0萬億元,選擇其為預(yù)測(cè)中使用的X值,再選出因變量數(shù)值區(qū)域及自變量數(shù)值區(qū)域,得到預(yù)測(cè)值為6.12,過程及結(jié)果如圖4所示。
圖4 FORECAST函數(shù)
經(jīng)濟(jì)預(yù)測(cè)是當(dāng)代社會(huì)活動(dòng)中的一個(gè)熱點(diǎn)研究問題,具有廣泛的應(yīng)用價(jià)值。本文研究回歸分析法中的一元線性回歸模型,結(jié)合國(guó)內(nèi)生產(chǎn)總值與教育經(jīng)費(fèi)的相關(guān)數(shù)據(jù),通過分析國(guó)內(nèi)生產(chǎn)總值與教育經(jīng)費(fèi)的相關(guān)性建立回歸模型并應(yīng)用Excel 軟件對(duì)模型進(jìn)行求解與預(yù)測(cè)。根據(jù)預(yù)測(cè)結(jié)果對(duì)教育資源進(jìn)行合理分配與決策。通過對(duì)相關(guān)理論的研究及具體實(shí)例的計(jì)算,給出了求解一元線性回歸模型及其預(yù)測(cè)的詳細(xì)步驟,實(shí)用性較強(qiáng)。結(jié)合本文的研究思路,可以進(jìn)一步將一元線性回歸模型應(yīng)用于投資經(jīng)濟(jì)、航空經(jīng)濟(jì)、物流經(jīng)濟(jì)等不同經(jīng)濟(jì)領(lǐng)域,通過預(yù)測(cè)幫助人們展望未來經(jīng)濟(jì)發(fā)展前景,做出決策并進(jìn)行科學(xué)管理。
湖北第二師范學(xué)院學(xué)報(bào)2023年8期