亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于GA-BP模型及時間序列分析的GDP預(yù)測
        ——以四川省為例

        2022-05-16 11:13:58尤旭洋
        統(tǒng)計理論與實踐 2022年4期
        關(guān)鍵詞:個數(shù)差分神經(jīng)元

        尤旭洋

        (四川省社會科學(xué)院,四川 成都 610072)

        一、引言

        預(yù)測在日常生活中十分常見。采用科學(xué)方法預(yù)測,可以使人們掌握事物發(fā)展趨勢,進而規(guī)避許多風(fēng)險。小到衣食住行,大到國家政治經(jīng)濟決策,預(yù)測貫穿哲學(xué)、經(jīng)濟學(xué)、社會學(xué)、人口學(xué)等多方面,如何做到精確預(yù)測是非常重要的工作。GDP作為衡量一個國家或地區(qū)經(jīng)濟發(fā)展的重要指標(biāo),研究其變化規(guī)律尤為重要,本文采用時間序列等方法研究GDP增長趨勢。經(jīng)濟生活中的大部分時間序列是非平穩(wěn)的,GDP數(shù)據(jù)就是典型的非平穩(wěn)時間序列,它的變化受許多因素的影響,很多因素對GDP有長期性、決定性作用,使時間序列變化呈某種趨勢和一定規(guī)律性,還有很多因素,則起到短期的非決定性作用,使時間序列變化呈隨機的不規(guī)則性。GDP預(yù)測具有很強的時效性,本文采用最新數(shù)據(jù),用多種方法預(yù)測四川省GDP的變化趨勢。

        二、利用ARIMA模型預(yù)測四川省GDP

        時間序列數(shù)據(jù)預(yù)處理。先從時間序列的平穩(wěn)性及隨機性方面進行預(yù)處理。根據(jù)四川省歷年GDP總量時序圖,可以看出GDP有明顯的增長趨勢,因此判定該時間序列不滿足平穩(wěn)性。對其進行一階差分預(yù)處理,結(jié)果如圖1所示,仍然不平穩(wěn),做進一步的差分處理,結(jié)果如圖2所示,二階差分后的序列一直圍繞均值波動,于是判定其為二階差分平穩(wěn)序列。

        圖1 四川省GDP一階差分時序圖

        圖2 四川省GDP二階差分時序圖

        白噪聲檢驗。二階差分之后的序列自相關(guān)圖和偏自相關(guān)圖分別如圖3、圖4所示,自相關(guān)系數(shù)圖顯示序列有短期相關(guān)性,說明差分后序列隱藏了很多可供提取的數(shù)據(jù)信息,所以二階差分后序列為平穩(wěn)非白噪聲序列。通過平穩(wěn)性及白噪聲檢驗之后,進行ARIMA模型的定階。

        圖3 四川省GDP自相關(guān)系數(shù)

        由圖3、圖4可知,自相關(guān)系數(shù)圖和偏自相關(guān)系數(shù)圖都符合正弦震蕩衰減的拖尾形態(tài)。接下來進一步確定模型參數(shù),根據(jù)BIC準(zhǔn)則,BIC函數(shù)定義如下:

        圖4 四川省GDP偏自相關(guān)系數(shù)

        N是時間序列的序列長度,擬合的參數(shù)一般不超過N/10,隨著不斷提升模型的參數(shù)p和q,BIC函數(shù)中的第一項序列殘差平方估計量的自然對數(shù)值會減小,第二項會增大,存在某一數(shù)值使得BIC值最小,R2更接近1,盡量選取BIC信息量值最小的參數(shù),建立ARIMA模型??梢杂^察到二階差分后序列的自相關(guān)圖表現(xiàn)出自相關(guān)系數(shù)迅速衰減到零,自相關(guān)圖表現(xiàn)出典型的一階截尾性,即q=1,而偏自相關(guān)系圖表現(xiàn)出非截尾的性質(zhì)。原序列二階差分后平穩(wěn),差分次數(shù)為d=2,因此用 ARIMA(0,2,1)模型擬合原序列。

        部分模型效果如表1所示,選擇建立 ARIMA(0,2,1)模型。可以看出,模型的參數(shù)顯著性較高,預(yù)測值為40046,真實值為40678,誤差百分比為1.6%,預(yù)測效果較好。

        表1 模型不同參數(shù)比較

        三、利用BP模型預(yù)測四川省GDP

        (一)構(gòu)建BP模型

        人工神經(jīng)網(wǎng)絡(luò)模仿的是大腦神經(jīng)元功能,是一種智能仿生模型,可以通過學(xué)習(xí)和訓(xùn)練掌握大量知識,從而對變量進行預(yù)測,得到給定精度下的預(yù)測值。神經(jīng)元的默認(rèn)激勵函數(shù)通常如下:

        單個神經(jīng)元的功能非常有限,但是大量神經(jīng)元相互連接,每一層的神經(jīng)元狀態(tài)都會影響下一層的神經(jīng)元,具有十分強大的功能,并且能夠很好地進行預(yù)測分析。輸入層m個神經(jīng)元節(jié)點到輸出層的n個神經(jīng)元節(jié)點,可以形成從m個自變量映射到n個需要預(yù)測的因變量的函數(shù)。

        人工神經(jīng)網(wǎng)絡(luò)有很多模型,但應(yīng)用最廣泛、最直觀的是多層前饋神經(jīng)網(wǎng)絡(luò)和誤差反向傳播學(xué)習(xí)算法,即BP網(wǎng)絡(luò)。輸出層用于輸出網(wǎng)絡(luò)訓(xùn)練的結(jié)果向量,輸出向量的尺寸應(yīng)根據(jù)具體的應(yīng)用要求進行設(shè)計。設(shè)計時,應(yīng)盡量減少系統(tǒng)的規(guī)模,以減少系統(tǒng)的復(fù)雜性。m個變量就是輸入層選定的自變量輸入信號,然后通過隱藏層的不停處理反饋,進而得出輸出層所需的變量預(yù)測值。因此,需要選取多個可能會對預(yù)測結(jié)果產(chǎn)生影響的自變量指標(biāo)。

        (二)訓(xùn)練數(shù)據(jù)的選擇及預(yù)處理

        選取訓(xùn)練數(shù)據(jù)時,必須基于正確的宏觀經(jīng)濟學(xué)理論,否則選取的自變量也許僅僅有一定的相關(guān)關(guān)系,但并不適宜用這些變量進行預(yù)測。

        GDP的核算方法有生產(chǎn)法、支出法、收入法,其中支出法為:

        GDP=C+I+G+NX

        公式中的I主要與固定資產(chǎn)投資和存貨投資有關(guān),而C與各行各業(yè)的消費購買金額有關(guān),G代表政府購買,NX代表凈出口。

        表2 選擇的自變量指標(biāo)含義

        首先,對原始數(shù)據(jù)進行歸一化處理:

        部分?jǐn)?shù)據(jù)的歸一化處理結(jié)果如表3所示:

        表3 數(shù)據(jù)歸一化

        特別說明本文的創(chuàng)新點之一在于,一般情況下BP網(wǎng)絡(luò)為了增強映射能力和泛化能力都會采用非線性函數(shù),實際上BP模型就是一種非線性預(yù)測的強手段。但是GDP、從業(yè)人口增長等實際生活中的經(jīng)濟指標(biāo),通常更趨向于線性,而不會呈現(xiàn)為指數(shù)形式。從GDP核算公式可以看出兩者是符合某種線性關(guān)系的。因此輸入層和隱藏層的擬合函數(shù)本文均選擇線性擬合函數(shù)purelin,而沒有選用普通的默認(rèn)函數(shù)。下文對線性擬合函數(shù)purelin與默認(rèn)函數(shù)預(yù)測效果進行比較。

        圖5 預(yù)測值與真實值對比

        圖6 GDP誤差變化曲線

        表4 神經(jīng)元節(jié)點數(shù)為15時的一次B P神經(jīng)網(wǎng)絡(luò)GDP預(yù)測結(jié)果

        圖7 學(xué)習(xí)效果曲線圖

        由結(jié)果可知在訓(xùn)練到第8次時,誤差表現(xiàn)已經(jīng)達到訓(xùn)練精度要求,此時停止訓(xùn)練,預(yù)測值誤差穩(wěn)定在2%左右,相關(guān)度R均大于0.99,非常接近1。

        (三)擬合函數(shù)變化對預(yù)測的影響

        圖8 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)進程圖

        采用默認(rèn)函數(shù)預(yù)測,與上文線性函數(shù)預(yù)測效果進行比較??梢钥闯霎?dāng)采用BP模型默認(rèn)的節(jié)點激活函數(shù)進行預(yù)測時,預(yù)測效果很差,不僅預(yù)測值與真實值相差極大,預(yù)測的誤差不降反升,一度達到20.1%,學(xué)習(xí)次數(shù)達到44次,學(xué)習(xí)效果不佳,所以采用線性函數(shù)效果更好。

        圖9 非線性函數(shù)預(yù)測值與真實值對比

        圖10 非線性函數(shù)預(yù)測誤差變化曲線

        表5 神經(jīng)元節(jié)點為非線性函數(shù)時的一次預(yù)測結(jié)果

        (四)網(wǎng)絡(luò)結(jié)構(gòu)變化對預(yù)測的影響

        由于初始輸入層和輸出層的神經(jīng)元個數(shù)是通過經(jīng)驗公式確定,并不一定是最優(yōu)的。所以為進一步探究隱含層神經(jīng)元節(jié)點個數(shù)以達到學(xué)習(xí)效果相對最優(yōu),接下來保持預(yù)測精度、最大迭代次數(shù)、學(xué)習(xí)率等參數(shù)不變,改變節(jié)點個數(shù),比較學(xué)習(xí)次數(shù)多少和誤差大小,結(jié)果如表6所示,不同神經(jīng)元節(jié)點個數(shù)下的人工神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)效果存在一定差別。

        表6 不同神經(jīng)元節(jié)點個數(shù)的學(xué)習(xí)結(jié)果比較

        神經(jīng)元節(jié)點個數(shù)為5-10時,學(xué)習(xí)次數(shù)偏多,學(xué)習(xí)效果不好,誤差偏大,處于欠擬合狀態(tài)。神經(jīng)元節(jié)點個數(shù)大于20時,學(xué)習(xí)次數(shù)良好,但誤差偏大,處于過擬合狀態(tài)。在神經(jīng)元節(jié)點個數(shù)為15左右時,誤差相對最小,學(xué)習(xí)次數(shù)相對較少,能達到預(yù)測誤差要求。

        由此可見,BP預(yù)測的效果雖好但是要基于大量多維的數(shù)據(jù),需要利用所有的歷史數(shù)據(jù)提高人工神經(jīng)網(wǎng)絡(luò)的泛化能力,實際上這種預(yù)測方法適合短期預(yù)測。

        四、利用GA-BP模型預(yù)測四川省GDP

        (一)構(gòu)建GA-BP模型

        BP模型有一些固有的缺點。首先,BP模型的隱含層神經(jīng)元數(shù)量結(jié)構(gòu)是事先規(guī)定好的,僅僅是試出來的最優(yōu)解。其次,BP模型網(wǎng)絡(luò)的初始閾值以及權(quán)值是隨機產(chǎn)生的,沒有選擇的原理,隨著算法不斷迭代更新。最后,BP模型采用梯度下降法,容易陷入局部最優(yōu)解,而找不到全局最優(yōu)解。為解決這些問題,進一步引入GA-BP模型(遺傳-誤差反向傳播算法Genetic Algorithm-Error Back Propagation)進行預(yù)測。遺傳算法(GA)是一種從自然界中的進化過程得到啟發(fā)的算法,是人工智能的一種算法,本質(zhì)上是一種并行處理的全局搜索算法。搜索過程中不斷優(yōu)化,尋求最優(yōu)解。通過類似基因遺傳、片段交叉、基因突變、自然選擇的作用下產(chǎn)生更新迭代,具體操作如下:

        選擇操作:類似于自然選擇過程,更加適應(yīng)要求的個體特征,被遺傳的概率更大。反之,不太適應(yīng)的個體會逐漸被淘汰。

        交叉操作:類似基因交叉,可以產(chǎn)生新的,與之前個體特征都不一樣的新個體,產(chǎn)生的新個體通常相對原個體更先進。為了判斷構(gòu)建的染色體進化效果,必須要引入一個評價方式,我們稱為適應(yīng)度函數(shù),它保證了算法向好的方向進行下去,模擬了物競天擇自然選擇的過程。不同問題需要專門設(shè)計不同的適應(yīng)度函數(shù),最直接的設(shè)定方式是采用問題的目標(biāo)函數(shù),但這個函數(shù)必須基于原來的算法,與原來的誤差有關(guān),實際應(yīng)用時通常?。?/p>

        分母與神經(jīng)網(wǎng)絡(luò)的殘差平方和(SSE)相關(guān),誤差越大,適應(yīng)函數(shù)值越小,表示該個體適應(yīng)度越差,反之,適應(yīng)度良好的個體可以被保留。適應(yīng)度函數(shù)會影響遺傳算法的迭代停止條件?,F(xiàn)實中,對于遺傳算法何時停止迭代的理論研究還不成熟。但是,當(dāng)采用與原來的誤差有關(guān)的目標(biāo)函數(shù)作為適應(yīng)度度量時,可以發(fā)現(xiàn)種群中的個體已趨于穩(wěn)定的狀態(tài)為算法停止迭代條件。遺傳算法迭代的停止條件要視情況而定,何時停止要具體問題具體分析。某種程度上,適應(yīng)度驅(qū)動了遺傳算法的進化。但現(xiàn)實中有些求解問題含有約束條件,而適應(yīng)度缺乏明確表示約束條件的能力。當(dāng)然,目前為止也有一些解決該問題的辦法,但考慮到本文不涉及約束條件,不再深入闡述該問題。

        (二)預(yù)測結(jié)果

        用matlab實現(xiàn)GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測算法結(jié)果如圖11、圖12所示。

        圖11 GA-BP預(yù)測值與真實值對比

        圖12 GA-BP預(yù)測誤差變化曲線

        表7 神經(jīng)元節(jié)點數(shù)為15時的一次GA-BP神經(jīng)網(wǎng)絡(luò)GDP預(yù)測結(jié)果

        訓(xùn)練到第8次時,誤差表現(xiàn)達到訓(xùn)練精度要求,此時停止訓(xùn)練,預(yù)測值誤差穩(wěn)定在2%左右,相關(guān)度R均大于0.99,非常接近1。與原來的BP模型相比,GA-BP模型誤差更小,最為明顯的是誤差下降速度更快。

        (三)GA-BP算法與BP算法對比

        為了進一步比較GA-BP算法與BP算法的預(yù)測效果,改變神經(jīng)元個數(shù),對比兩種神經(jīng)網(wǎng)絡(luò)的預(yù)測誤差是否達到要求的精度,比如要求均方誤差MSE小于0.01。

        由表8可知,設(shè)置目標(biāo)MSE為最大0.01,最大迭代次數(shù)參數(shù)均為1000次,但神經(jīng)元個數(shù)分別為5和10時,BP模型并不能在規(guī)定次數(shù)內(nèi)達到要求精度,此時對應(yīng)的GA-BP模型的預(yù)測達標(biāo)次數(shù)已經(jīng)分別達到21次和24次,達標(biāo)率分別為72%和80%??梢缘贸鼋Y(jié)論:在神經(jīng)元個數(shù)低于經(jīng)過試驗檢驗的最優(yōu)個數(shù)15時,GA-BP模型的預(yù)測效果好于BP模型。設(shè)定神經(jīng)元個數(shù)為20時,也就是高于經(jīng)過試驗檢驗的最優(yōu)個數(shù)15時,GA-BP模型的達標(biāo)率為90%,也高于BP模型75%。綜上所述,在規(guī)定誤差精度時,用GA-BP模型進行預(yù)測可以比BP模型更快速地達到目標(biāo),迭代次數(shù)更少。除此之外,在隱藏層神經(jīng)元個數(shù)增加時,兩種人工神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果都在變好,但此時是否已經(jīng)處于過擬合狀態(tài)還有待考察。

        表8 兩種算法預(yù)測效果對比

        采用Wilcoxon秩和檢驗比較兩種算法的性能,結(jié)果如表9所示,隱藏層神經(jīng)元個數(shù)相同時,GA-BP算法的調(diào)整R2的中位數(shù)比BP算法的調(diào)整后R2要高,說明前者的擬合效果更好。還可以觀察到神經(jīng)元個數(shù)不是經(jīng)驗最優(yōu)15時,通常是GA-BP算法更優(yōu),但是在神經(jīng)元個數(shù)是15時,調(diào)整R2的中位數(shù)差距很小,且在0.9以上,非常接近1,即兩者的效果已經(jīng)沒有統(tǒng)計學(xué)上的差異,因此更推薦GA-BP模型。

        表9 兩種算法預(yù)測R2對比

        五、利用灰色預(yù)測模型預(yù)測四川省GDP

        為了進一步比較其他方法的預(yù)測效果,引入灰色算法預(yù)測模型GM(Gray Model)?;疑惴ㄊ窃跀?shù)據(jù)比較簡單、結(jié)構(gòu)比較單一且不完備的情況下,數(shù)據(jù)的不確定性很強、約束條件很弱,此時需要在原來的基礎(chǔ)上,按照實際屬性和特征進行灰色預(yù)測?;疑珕栴}在現(xiàn)實生活中有很廣泛的應(yīng)用。

        解決實際問題時,一維的灰色預(yù)測通常用GM(1,1),它的灰色微分方程的解是在初始條件基礎(chǔ)上求得的,擬合曲線在坐標(biāo)平面上必然通過[1,x(1)]也就是第一個數(shù)據(jù)點。但由最小二乘法原理可知的,擬合曲線不一定通過第一個點,所以基于初始條件的預(yù)測結(jié)果不一定是精確的。

        圖13 灰色算法預(yù)測GDP值

        后驗差比值為0.1097,系統(tǒng)預(yù)測精度更好。但2015年的預(yù)測值誤差百分比為8.2%,傳統(tǒng)灰色算法預(yù)測GDP的誤差相對傳統(tǒng)的BP算法預(yù)測誤差還是偏大。但灰色算法預(yù)測結(jié)果簡單明了,且相對BP算法更為簡單,適用于相對要求不太精確的預(yù)測過程。

        表10 灰色算法預(yù)測GDP結(jié)果

        六、結(jié)論

        本文在之前研究的基礎(chǔ)上,利用時間序列分析方法、BP人工神經(jīng)網(wǎng)絡(luò)模型,對四川省GDP進行預(yù)測。分析各種方法的優(yōu)越性和不足,探究結(jié)構(gòu)對預(yù)測的影響。時間序列分析預(yù)測方法軟件功能成熟、操作簡單、結(jié)果直觀,有嚴(yán)密的數(shù)理邏輯基礎(chǔ),相對傳統(tǒng)方法預(yù)測誤差較小,現(xiàn)實中應(yīng)用廣泛。時間序列預(yù)測需要大量的歷史數(shù)據(jù),且預(yù)測基于數(shù)據(jù)慣性,很難對拐點變化進行預(yù)測,ARIMA模型很難實現(xiàn)自序列匹配。BP人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測相對時間序列分析方法更加精確,但算法相對復(fù)雜,容易陷入局部極小值,不具有較強的全局搜索能力。GA-BP算法在BP算法的基礎(chǔ)上,在權(quán)值和閾值的更新迭代上加入遺傳算法,更加優(yōu)化,且算法穩(wěn)定性相對BP算法更高。灰色預(yù)測算法雖然較為容易,對數(shù)據(jù)要求較低,但精度不如BP神經(jīng)網(wǎng)絡(luò)模型,可以應(yīng)用于較為粗略的預(yù)測。盡管很多統(tǒng)計軟件都有自帶的建模預(yù)測方法,但都不可能是完美的,預(yù)測過程中需要不斷測試和調(diào)整,甚至建立多個模型加以比較,從而選出最佳參數(shù)和模型。

        猜你喜歡
        個數(shù)差分神經(jīng)元
        《從光子到神經(jīng)元》書評
        自然雜志(2021年6期)2021-12-23 08:24:46
        怎樣數(shù)出小正方體的個數(shù)
        數(shù)列與差分
        等腰三角形個數(shù)探索
        怎樣數(shù)出小木塊的個數(shù)
        怎樣數(shù)出小正方體的個數(shù)
        躍動的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
        基于二次型單神經(jīng)元PID的MPPT控制
        毫米波導(dǎo)引頭預(yù)定回路改進單神經(jīng)元控制
        基于差分隱私的大數(shù)據(jù)隱私保護
        亚洲一区二区三区在线观看| 久久精品国产www456c0m| 人妻无码人妻有码中文字幕| 日本精品免费一区二区三区| 五月天综合在线| 级毛片免费看无码| 亚洲中文字幕日产喷水| 亚洲国产精品成人一区二区在线| 在线播放草猛免费视频| 极品人妻被黑人中出种子| 天天天天躁天天爱天天碰2018| 欧美成人免费高清视频| 人妻少妇久久精品一区二区| 中文字幕久久精品一区二区| 成人欧美一区二区三区黑人| 中文字幕av一区二区三区人妻少妇| 午夜成人无码福利免费视频| 久久精品国产亚洲5555| 一本一道久久a久久精品综合蜜桃| 国产一区二区三区日韩在线观看| 欧美丰满熟妇bbbbbb| 少妇无码太爽了不卡视频在线看 | 青青草国内视频在线观看| 亚洲成人av在线蜜桃| 中文字幕肉感巨大的乳专区| 亚洲依依成人亚洲社区| 国产chinese在线视频| 国产91在线播放九色快色| 老鲁夜夜老鲁| 成年女人免费视频播放体验区 | 波多野结衣乳巨码无在线| 春色成人在线一区av| 男人天堂亚洲一区二区| 精品无码国产一区二区三区麻豆 | 亚洲无码精品免费片| 男女干逼视频免费网站| 中文字幕一区二区中出后入| 国产精品泄火熟女| 精品爆乳一区二区三区无码av| 亚洲熟妇乱子伦在线| 色小姐在线视频中文字幕|