沙元霞
(大慶師范學(xué)院 數(shù)學(xué)科學(xué)學(xué)院,黑龍江 大慶 163712)
人口預(yù)測(cè)是指根據(jù)現(xiàn)有的人口狀況測(cè)算未來(lái)某個(gè)時(shí)間的人口規(guī)模、水平和趨勢(shì)??刂迫丝谝?guī)模是城市規(guī)劃和土地利用規(guī)劃中的一個(gè)重要指標(biāo),不但會(huì)影響到未來(lái)的經(jīng)濟(jì)發(fā)展和社會(huì)動(dòng)態(tài)的發(fā)展,而且還會(huì)影響到可持續(xù)發(fā)展的生態(tài)環(huán)境[1]。 建立數(shù)學(xué)模型對(duì)人口發(fā)展過(guò)程進(jìn)行描述、分析和預(yù)測(cè),并進(jìn)而研究控制人口增長(zhǎng)和老化的生育策略,以引起社會(huì)各方面的極大關(guān)注,是數(shù)學(xué)在社會(huì)發(fā)展中的重要應(yīng)用領(lǐng)域[2]。
本文將黑龍江省2001年至2007年人口數(shù)據(jù)作為依據(jù)(來(lái)源于“黑龍江統(tǒng)計(jì)年鑒”數(shù)據(jù)),利用統(tǒng)計(jì)回歸的方法進(jìn)行建模,并對(duì)黑龍江人口進(jìn)行分析和預(yù)測(cè);最后對(duì)2012年至2016年黑龍江省的未來(lái)人口數(shù)和人口發(fā)展趨勢(shì)進(jìn)行了預(yù)測(cè)。
表1數(shù)據(jù)來(lái)源于《黑龍江省統(tǒng)計(jì)年鑒——2007》,本文應(yīng)用此數(shù)據(jù)構(gòu)建統(tǒng)計(jì)回歸模型。
表1 2001—2007年黑龍江省人口 (單位:萬(wàn)人)
為了研究這些數(shù)據(jù)中所蘊(yùn)含的規(guī)律性,首先將數(shù)據(jù)用散點(diǎn)圖的形式表現(xiàn)出來(lái),把各個(gè)年份作為橫坐標(biāo),將2001—2007年每年總?cè)丝跀?shù)作為縱坐標(biāo),將這些數(shù)據(jù)點(diǎn)標(biāo)在平面直角坐標(biāo)圖上,分析點(diǎn)的分布情況,如圖1所示。
在圖1中可以看出,數(shù)據(jù)點(diǎn)得分布較有規(guī)律,既可看做分布在一條直線周圍,又可看做分布在一條二次的拋物線附近。所以,為了使模型更加精確,我們將擬合出兩條線,即構(gòu)造兩個(gè)回歸模型,通過(guò)對(duì)比分析的方式,選取其中誤差較小的回歸模型。
圖1 2001—2007年每年總?cè)丝跀?shù)散點(diǎn)圖
1)假設(shè)。假設(shè)變量x和y滿足如下關(guān)系式:y=β0+β1x+ε,其中,β0和β1是未知常數(shù);ε是隨機(jī)誤差,滿足E(ε)=0,var(ε)=σ2。
3)檢驗(yàn)。一般我們采用統(tǒng)計(jì)檢驗(yàn)方法檢驗(yàn),如F檢驗(yàn),如果F和y有線性關(guān)系,則
在給定顯著水平α下,上述F值應(yīng)大于F分布表中的臨界值Fα。進(jìn)行檢測(cè)有F=82.59849≥0.00000=F0.05(1,10),這表明x與y有十分顯著的線性相關(guān)關(guān)系,這說(shuō)明時(shí)間對(duì)人口總數(shù)有顯著影響,回歸系數(shù)效果顯著。
1)假設(shè)。假設(shè)變量x和y滿足如下二元關(guān)系式:y=β0+β1x+β2x2+ε,其中,β0,β1,β2為回歸系數(shù);ε是隨機(jī)誤差。
2)擬合回歸參數(shù)。當(dāng)所設(shè)回歸模型是二次時(shí),仍可以采用最小二乘法去計(jì)算,但考慮到計(jì)算量相對(duì)于一元模型來(lái)說(shuō)非常大,故采用Matlab軟件編程[2]求解。
程序如下:X=[1,1,1;1,2,4;1,3,9;1,4,16;1,5,25;1,6,36;1,7,49]
Y=[3811;3813;3815;3816.8;3820;3830.8;3848.8]
[b,bint,r,rint,stats]=regress(Y,X)
運(yùn)行結(jié)果為:b=3818.3,;-6.6;1.5
bint=[3804.8,3831.8],[-14.3,1.2],[0.6,2.5]
stats=0.9638,53.2075,0.0013
3)將上述得到的回歸系數(shù)帶入所設(shè)模型中得:y=3818.3-6.6x+1.5x2+ε。
4)檢驗(yàn)及分析
①模型所得相關(guān)系數(shù)的平方為0.9638,說(shuō)明因變量y的96.38%可由此模型確定。
②模型的F檢驗(yàn)值為53.2075,遠(yuǎn)超過(guò)F檢驗(yàn)的臨界值。
③p=0.0013遠(yuǎn)小于α=0.05。
④回歸系數(shù)β1的置信區(qū)間包含零點(diǎn),說(shuō)明變量x的效果不顯著,但考慮到β2的置信區(qū)間較好,所以保留一次項(xiàng)。
將以上兩個(gè)模型的預(yù)測(cè)值與實(shí)際值進(jìn)行比較,得2001—2007年的相對(duì)誤差率,如下表所示:
表2 模型一與模型二比較
通過(guò)表中數(shù)據(jù)我們得到:二次回歸模型平均相對(duì)誤差率為0.05%,而一次線性回歸模型的平均相對(duì)誤差率為0.76%,說(shuō)明這兩種模型相比二次回歸模型能做到更好、更準(zhǔn)確的預(yù)測(cè)。
應(yīng)用二次回歸模型預(yù)測(cè)2012年至2016年黑龍江省的人口數(shù)目,如下表所示:
表3 2012—2016年黑龍江省人口的預(yù)測(cè)值 (單位:萬(wàn)人)
上述數(shù)據(jù)表明未來(lái)幾年我省人口的增長(zhǎng)有較穩(wěn)定的狀態(tài),這一結(jié)果可為政府相關(guān)部門制定政策提供參考依據(jù)。同時(shí)可以看到,按此模型隨著時(shí)間的增長(zhǎng),人口的增長(zhǎng)率越來(lái)越大,說(shuō)明我們的模型還存在改進(jìn)的空間,可以將人口老齡化的比率等因素加進(jìn)去,構(gòu)造多元統(tǒng)計(jì)回歸模型[3],以達(dá)到更好的結(jié)果。
[參考文獻(xiàn)]
[1] 劉鑫,徐世英.基于組合預(yù)測(cè)模型的西藏人口分析[J].中央民族大學(xué)學(xué)報(bào):自然科學(xué)版,2008(3):22-24.
[2] 楊松,曾永年,吳桂平,等.改進(jìn)的最優(yōu)組合人口預(yù)測(cè)模型及其應(yīng)用[J].長(zhǎng)江流域資源與環(huán)境,2008(3):14-17.
[3] 宋洪文.應(yīng)用統(tǒng)計(jì)[M].北京:高等教育出版社,2003.