匡后權(quán),吉松濤,曾武佳
(1.四川教育學(xué)院,成都 610041;2.西南財經(jīng)大學(xué),成都 610074;3.四川大學(xué) 經(jīng)濟(jì)學(xué)院,成都 610064)
基于主成分BP神經(jīng)網(wǎng)絡(luò)的西部服務(wù)業(yè)產(chǎn)值預(yù)測
匡后權(quán)1,吉松濤2,曾武佳3
(1.四川教育學(xué)院,成都 610041;2.西南財經(jīng)大學(xué),成都 610074;3.四川大學(xué) 經(jīng)濟(jì)學(xué)院,成都 610064)
文章采用主成分分析和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,采用的1978~2005年服務(wù)業(yè)相關(guān)數(shù)據(jù)和服務(wù)業(yè)產(chǎn)值為訓(xùn)練數(shù)據(jù),通過BP神經(jīng)網(wǎng)絡(luò)建立主成分到服務(wù)業(yè)產(chǎn)值之間的映射關(guān)系。將2006~2007數(shù)據(jù)作為仿真預(yù)測數(shù)據(jù),進(jìn)行樣本仿真。驗證結(jié)果表明:文章采用的方法可以較為準(zhǔn)確地擬合原始樣本,有較高的預(yù)測精度,可以對西部服務(wù)業(yè)產(chǎn)值進(jìn)行較為準(zhǔn)確的預(yù)測。此方法具有一定的理論和現(xiàn)實意義。
主成分;BP神經(jīng)網(wǎng)絡(luò);產(chǎn)值預(yù)測
服務(wù)業(yè)是繼農(nóng)業(yè)、工業(yè)之后興旺發(fā)達(dá)起來的產(chǎn)業(yè),西部12個省、市(區(qū))現(xiàn)代服務(wù)業(yè)多變量大樣本的數(shù)據(jù)為研究提供了豐富的信息,同時許多變量之間可能存在相關(guān)性增加了問題分析的復(fù)雜性,給分析帶來不便。若對12個省市區(qū)5個指標(biāo)進(jìn)行綜合分析比較困難,為了解決輸入變量過多的問題,文章提出了采用主成分BP神經(jīng)網(wǎng)絡(luò)的預(yù)測方法,減少變量數(shù),利用降維的方法把多個指標(biāo)轉(zhuǎn)換成較少的幾個互不相關(guān)的綜合指標(biāo),從而使得研究變得簡單。再用個數(shù)較少的輸入變量作為BP神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行預(yù)測。
主成分分析法是將西部服務(wù)業(yè)產(chǎn)值相關(guān)的影響因素指標(biāo)重新生成一組互不相關(guān)、信息不重疊的幾個綜合指標(biāo),綜合指標(biāo)能最大限度地反映所有影響因素指標(biāo)的信息。人工神經(jīng)網(wǎng)絡(luò)(ANN),是由大量的神經(jīng)處理單元廣泛的相互聯(lián)結(jié)而形成的復(fù)雜網(wǎng)絡(luò),用來模擬腦神經(jīng)系統(tǒng)的結(jié)構(gòu)和功能。它是人腦神經(jīng)的簡化、抽象和模擬。人工神經(jīng)網(wǎng)絡(luò)具有人腦功能的基本特征即學(xué)習(xí),記憶和歸納能力。反向傳播模型也稱BP模型,是一種用于前向多層神經(jīng)網(wǎng)絡(luò)的反向傳播學(xué)習(xí)算法,由D.Rumelhat和MeClelland于1985年提出。它之所以是一種學(xué)習(xí)方法,就是因為用它可以對組成前向多層網(wǎng)絡(luò)的各人工神經(jīng)元之間的連接權(quán)值進(jìn)行不斷修改,從而使該前向多層網(wǎng)絡(luò)能夠?qū)⑤斎胨男畔⒆儞Q成所期望的輸出信息。所以將其稱作為反向?qū)W習(xí)算法,是因為在修改各人工神經(jīng)元的連接權(quán)值時,所依據(jù)的是該網(wǎng)絡(luò)的實際輸出與期望的輸出之差。將這一差值反向一層一層的向回傳播,來決定連接權(quán)值的修改。目前BP算法是研究最多的網(wǎng)絡(luò)形式之一,是前向網(wǎng)絡(luò)得以廣泛應(yīng)用的基礎(chǔ)。它包含輸入層、隱層、輸出層,隱層可以為一層或多層。
西部現(xiàn)代服務(wù)業(yè)產(chǎn)值預(yù)測的實質(zhì)就是對西部服務(wù)業(yè)既有的數(shù)據(jù)進(jìn)行分類和識別,或根據(jù)現(xiàn)有的服務(wù)業(yè)指標(biāo)的相關(guān)值,通過一定的推理,推斷出現(xiàn)代服務(wù)業(yè)的產(chǎn)值。由于神經(jīng)網(wǎng)絡(luò)具有處理復(fù)雜模式及進(jìn)行聯(lián)想,推測和記憶的功能,因而它非常適合應(yīng)用于服務(wù)產(chǎn)值同服務(wù)業(yè)產(chǎn)值的相關(guān)指標(biāo)值之間的關(guān)聯(lián)分析。
采用綜合性與科學(xué)性相結(jié)合,絕對數(shù)指標(biāo)與相對數(shù)指標(biāo)相結(jié)合的原則,同時考慮數(shù)據(jù)的可獲性,選取了與服務(wù)業(yè)產(chǎn)值相關(guān)的5個指標(biāo),包括GDP產(chǎn)值、城鎮(zhèn)化水平、服務(wù)業(yè)就業(yè)人口、工業(yè)總產(chǎn)值、居民總?cè)丝凇?/p>
廣義的現(xiàn)代服務(wù)業(yè)稱為第三產(chǎn)業(yè),本文在統(tǒng)計上,采用的是廣義現(xiàn)代服務(wù)業(yè)的概念,本文統(tǒng)計現(xiàn)代服務(wù)業(yè)包括的主要行業(yè)有:交通運(yùn)輸、倉儲和郵政業(yè),信息傳輸、計算機(jī)服務(wù)和軟件業(yè),批發(fā)和零售業(yè),住宿和餐飲業(yè),金融業(yè),房地產(chǎn)業(yè),租賃和商務(wù)現(xiàn)代服務(wù)業(yè),科學(xué)研究、技術(shù)服務(wù)和地質(zhì)勘查業(yè),水利、環(huán)境和公共設(shè)施管理業(yè),居民服務(wù)和其他現(xiàn)代服務(wù)業(yè),教育,衛(wèi)生、社會保障和社會福利業(yè),文化、體育和娛樂業(yè),公共管理和社會組織等行業(yè)。以上指標(biāo)的原始數(shù)據(jù)均來源于新中國55年統(tǒng)計資料匯編,中國統(tǒng)計年鑒2006~2008年,各個省市統(tǒng)計年鑒,城鎮(zhèn)化水平采用的指標(biāo)是城鎮(zhèn)人口除以總?cè)丝诘玫匠擎?zhèn)化率。
本文運(yùn)用SPSS軟件,將5個指標(biāo)集成綜合變量,將西部各省市的原始指標(biāo)數(shù)據(jù)帶入SPSS軟件進(jìn)行主成分分析。由于原始指標(biāo)數(shù)據(jù)計量單位不同,表現(xiàn)形式不一樣,不能直接進(jìn)行比較,SPSS軟件將對各省份指標(biāo)數(shù)據(jù)自動進(jìn)行標(biāo)準(zhǔn)化處理,以消除對評價結(jié)果的影響。經(jīng)過主成分分析,按照特征根大于1的原則,選取了2個主成分,其累計方差貢獻(xiàn)率達(dá)87.938%,這2個主成分代替原來所有指標(biāo)來描述現(xiàn)代服務(wù)業(yè)發(fā)展水平有87.938%的可靠性。代表了絕大部分信息,可以明顯反映西部各省市現(xiàn)代服務(wù)業(yè)的發(fā)展水平。各主成分特征根和方差貢獻(xiàn)率見表1,其中主成分權(quán)重是各主成分貢獻(xiàn)率在累計方差貢獻(xiàn)率中所占的份額。
表1 特征值、貢獻(xiàn)率和累計貢獻(xiàn)率
表2 主成分得分系數(shù)矩陣
表3 主成分及服務(wù)業(yè)產(chǎn)值歸一化數(shù)據(jù)
表4 預(yù)測效果
各個主成分的系數(shù)等于各個主成分的初始載荷量(見表2),由此可以得到2個主成分的表達(dá)式:
在所有主成分中,第一主成分Y1權(quán)重最大,為66.233%,是最重要的影響因子。該主成分中在GDP產(chǎn)值、服務(wù)業(yè)就業(yè)人口、工業(yè)總產(chǎn)值、居民總?cè)丝诘南禂?shù)較大,的載荷系數(shù)均在0.7以上,顯著地反映了這幾個指標(biāo)的信息。
第二主成分權(quán)重為21.705%,是次重要的影響因子。該主成分Y2與城鎮(zhèn)化水平相關(guān)性最強(qiáng),絕對指標(biāo)的載荷系數(shù)在0.9以上,第一主成分所反應(yīng)的信息進(jìn)行了補(bǔ)充和修正。模型中顯著地反映了現(xiàn)代服務(wù)業(yè)發(fā)展水平中的速度因素。主成分Y1、主成分Y2主要涵蓋所有變量的信息。
下面建立的兩個主成分到產(chǎn)量之間的BP網(wǎng)絡(luò)映射關(guān)系。根據(jù)表2,我們可以計算出主成分的得分矩陣,連同產(chǎn)量數(shù)據(jù)進(jìn)行歸一化后的數(shù)據(jù)見表3。
文章采用的1978~2005年服務(wù)業(yè)相關(guān)數(shù)據(jù)為訓(xùn)練數(shù)據(jù),2006~2007數(shù)據(jù)作為仿真預(yù)測數(shù)據(jù),通過BP神經(jīng)網(wǎng)絡(luò)建立主成分1、主成分2到服務(wù)業(yè)產(chǎn)值之間的映射關(guān)系。
在matlab中調(diào)用newff函數(shù),建立一個3個輸入結(jié)點,1個隱層、5個隱含層結(jié)點、1個輸入結(jié)點的BP網(wǎng)絡(luò)。隱含層采用‘tansig’函數(shù),輸出層采用‘purelin’函數(shù)。訓(xùn)練函數(shù)選擇引入動量因子的學(xué)習(xí)算法'traingdm',精度設(shè)置為0.05。程序中采用的連接權(quán)值和閥值如ABCD所示。其中,aij表示第j個輸入層到第i個隱含層的連接權(quán)值,bj表示第j個隱含的閾值,cj表示第j個隱含層到輸出層的連接權(quán)值,D為輸出層的閾值。
從圖1可以看出,當(dāng)網(wǎng)絡(luò)訓(xùn)練接近3000點時,神經(jīng)網(wǎng)絡(luò)已經(jīng)趨向于收斂。MSE已達(dá)到0.01。到6000步時,MSE達(dá)到0.008,已經(jīng)基本收斂。樣本仿真圖如圖2所示。
從圖2結(jié)果可以看出,整個預(yù)測值與實際值擬合結(jié)果非常吻合。第29、30個樣本點是對2006、2007年進(jìn)行預(yù)測的結(jié)果。表4分析數(shù)據(jù),其絕對誤差分別為204.44和-109.1。相對誤差分別只有1.3%和0.6%,可以看出其構(gòu)造的神經(jīng)網(wǎng)絡(luò)具有較好的仿真預(yù)測性能。
采用主成分BP神經(jīng)網(wǎng)絡(luò)方法可以準(zhǔn)確地擬合原始樣本,有較高的預(yù)測精度,針對服務(wù)業(yè)產(chǎn)值相關(guān)的指標(biāo),可以得到服務(wù)業(yè)產(chǎn)值,尤其是在服務(wù)業(yè)相關(guān)產(chǎn)值具有非線性、波動性、不確定性和復(fù)雜性的特征,此方法具有其他預(yù)測方法無法相比的優(yōu)勢,可以根據(jù)以上網(wǎng)絡(luò)模型,分析服務(wù)業(yè)產(chǎn)值的相關(guān)數(shù)據(jù),可以對服務(wù)業(yè)產(chǎn)出進(jìn)行預(yù)測,具有較為重要的理論和現(xiàn)實意義。
[1]李江帆.中國第三產(chǎn)業(yè)發(fā)展研究[M].北京:人民出版社,2005.
[2]盧紋岱.SPSS for Windows統(tǒng)計分析[M].北京:電子工業(yè)出版社.2007.
[3]趙惠芳,王沖,閆安,徐晟.中部省份現(xiàn)代服務(wù)業(yè)發(fā)展水平評價[J].統(tǒng)計與決策,2007,(21).
[4]周晶晶,賀勇,諸克軍.基于主成分BP神經(jīng)網(wǎng)絡(luò)的油田產(chǎn)量預(yù)測研究[J].統(tǒng)計與決策,2008,(13).
[5]廖恩華.BP網(wǎng)絡(luò)在發(fā)動機(jī)故障診斷中的應(yīng)用研究[J].技術(shù)與管理論壇,2006,(4).
F224.33
A
1002-6487(2011)11-0100-02
四川循環(huán)經(jīng)濟(jì)研究中心資助項目(XHJJ-15)
匡后權(quán)(1978-),女,重慶奉節(jié)人,博士,講師,研究方向:區(qū)域經(jīng)濟(jì)發(fā)展。
(責(zé)任編輯/浩 天)