劉 櫻,李月明,柯紫云
(西安歐亞學(xué)院,陜西 西安 710061)
伴隨 “互聯(lián)網(wǎng)+”行動的興起,互聯(lián)網(wǎng)對于整體社會的影響已進入到新的階段。網(wǎng)絡(luò)規(guī)模持續(xù)擴張,互聯(lián)網(wǎng)用戶人數(shù)日益增長,使得互聯(lián)網(wǎng)的影響不斷擴大,并且成為社會的重要基礎(chǔ)設(shè)施。通過對我國互聯(lián)網(wǎng)用戶人數(shù)的分析預(yù)測,可以對國家和企業(yè)掌握互聯(lián)網(wǎng)的動態(tài)發(fā)展情況進行相關(guān)決策提供十分重要的依據(jù)[1]。
目前,互聯(lián)網(wǎng)用戶人數(shù)預(yù)測模型主要有Bass模型法、回歸分析法、BP神經(jīng)網(wǎng)絡(luò)預(yù)測法等[2-4]。Bass模型法參數(shù)確定運算量大,復(fù)雜度高;回歸分析法需要大量的樣本;BP神經(jīng)網(wǎng)絡(luò)預(yù)測法建立和訓(xùn)練神經(jīng)網(wǎng)絡(luò)的過程復(fù)雜,運算量大。另外,針對互聯(lián)網(wǎng)用戶人數(shù)這種小量且規(guī)律相當(dāng)復(fù)雜的數(shù)據(jù),很多數(shù)據(jù)挖掘技術(shù)很難發(fā)揮其自身優(yōu)勢。
鄧聚龍?zhí)岢龌疑P?GM,Grey Model),是一種用于有效處理小樣本、貧信息、不確定性問題的一種方法[5]?;疑到y(tǒng)理論認為:一切隨機變量或隨機過程都可以看做在一定范圍內(nèi)、一定時段上變化的灰色量或灰過程,處理灰色量,不是對它的統(tǒng)計規(guī)律和概率分布的尋求,而是借助數(shù)據(jù)來探尋數(shù)據(jù)之間的規(guī)律,從而將其變成比較有規(guī)律的數(shù)據(jù)序列,再建立模型進行預(yù)測。文獻[6]應(yīng)用灰色預(yù)測與馬爾可夫鏈理論結(jié)合來預(yù)測交通事故,通過無偏灰色預(yù)測模型擬合系統(tǒng)的發(fā)展變化趨勢,并以此進一步進行馬爾可夫預(yù)測,在逐步預(yù)測中持續(xù)推陳出新,更新原始數(shù)據(jù)。文獻[7]利用灰色新城代謝模型對建筑廢物輸出進行預(yù)測。文獻[8]用灰色預(yù)測模型預(yù)測天然氣消耗。目前,最常用的灰色模型為GM(1,1)模型,此模型在科技[9]、農(nóng)業(yè)[10]、經(jīng)濟[11]、城市化[12]等各個領(lǐng)域被廣泛應(yīng)用。然而,傳統(tǒng)的GM(1,1)灰色預(yù)測模型的精度有時難以達到要求,究其原因主要有:一是發(fā)展系數(shù)和灰色作用量的值依賴于原始序列和背景值的構(gòu)造形式;二是使用GM(1,1)模型預(yù)測時,僅考慮過去的全體數(shù)據(jù),未充分利用新信息,因而導(dǎo)致精度較高的僅僅是原點數(shù)據(jù)以后的1或2個數(shù)據(jù)。
近年來,眾多學(xué)者致力于尋找改進GM(1,1)模型來提高其預(yù)測精度的方法,例如初始條件優(yōu)化的近似指數(shù)序列灰色建模方法[13]。通過這些方法的使用,雖然GM(1,1)模型的預(yù)測精度一定程度上得到提高,但并沒有從根本上對GM(1,1)模型進行改進?;诖?,本文通過重構(gòu)背景值和等維新息的思想對傳統(tǒng)的灰色預(yù)測模型進行兩次改進,建立背景值重構(gòu)的等維新息灰色模型。
灰色模型具有微分、差分、指數(shù)兼容的性質(zhì),即灰色模型是通過建立差分方程,進而推導(dǎo)出微分方程,且最終求得具有指數(shù)性質(zhì)的時間響應(yīng)函數(shù),進而對原始數(shù)據(jù)進行擬合和預(yù)測。GM(1,1)模型有3個基本操作:累加生成(AGO)、灰色建模和反向累加生成(IAGO)。
z(1)={z(1)(1),z(1)(1),…,z(1)(n)},
z(1)(k)=(x(1)(k-1)+x(1)(k))/2
k=2,3,…,n
(1)
設(shè)x(1)滿足:
dx(1)/dt+ax(1)=b
(2)
其中,a代表發(fā)展系數(shù),b代表灰色作用量。對應(yīng)的灰微分方程形式為:
x(0)(k)+az(1)(k)=b,k= 2,3,…,n
(3)
通過最小二乘法估計
(2)式的離散解為:
(4)
將上式累減還原,即可得到預(yù)測值:
(5)
眾所周知,對未來數(shù)據(jù)進行預(yù)測是建模的主要目的,則評判模型效果的核心指標是擬合的精度。越高的模型的精度,展示的是越好的預(yù)測效果。若模型的精度差,則對后期數(shù)據(jù)的分析處理將毫無意義,所以對模型精度的評定是非常有必要的。因此,灰色預(yù)測模型必須先通過精度檢驗再決定其是否可以用于模擬、預(yù)測。模型精度的檢驗參數(shù)主要有2個:絕對誤差A(yù)E(k)、平均相對誤差MAE,分別定義為:
由(4)式可以看出,GM(1,1)模型的模擬及預(yù)測精度取決于發(fā)展系數(shù)a與灰色作用量b,而由(3)式能夠得知,求解a和b的數(shù)值依賴于背景值的構(gòu)造方式。所以影響GM(1,1)模型精度的關(guān)鍵因素之一就是背景值的構(gòu)造方法。
圖1描述的是背景值誤差,在區(qū)間[k-1,k]上對(1)式兩邊同時求積分可得:
圖1 背景值誤差的描述
背景值重構(gòu)的思路[11]:由(4)式可知x(1)(t)為非齊次指數(shù)函數(shù),不妨將x(1)(t)抽象為
x(1)(t)=Bexp (At)+C
(6)
(7)
當(dāng)t=1時,有x(1)(1)=x(0)(1),即
BeA+C=x(0)(1)
又由于
x(0)(k)=x(1)(k)-x(1)(k-1)=BeAk-BeA(k-1)
可得:
(8)
對上式進行化簡得:
最后求得:
A=lnx(0)(k)-lnx(0)(k-1)
(9)
將(9)式代入(8)式得:
(10)
其中L(k)=lnx(0)(k)-lnx(0)(k-1)。
將(9)、(10)式代入(7)式得:
(11)
最后將式(9-11)代入式(6)得到新構(gòu)造的背景值計算公式為:
(12)
其中L(k)=lnx(0)(k)-lnx(0)(k-1),k= 2,3,…,n。
由以上分析可知,重構(gòu)的背景值減小了傳統(tǒng)模型背景值所產(chǎn)生的誤差。
對灰色系統(tǒng)來說,干擾系統(tǒng)的因素和系統(tǒng)的狀態(tài)都會隨著時間的變化而不斷變化。傳統(tǒng)的灰色預(yù)測模型下原點數(shù)據(jù)以后的1~2個數(shù)據(jù)準確度較高,隨著時間推移,離時間原點越遠,模型的預(yù)測精準度越低。所以,系統(tǒng)的變化和狀態(tài)必須由引入已知信息來反映,或在全未知信息的狀態(tài)下,由灰色信息來淡化灰平面的灰度,這種模型通過及時地加入了新的已知信息或灰色信息、刪除舊的數(shù)據(jù),因而可以較準確地反映系統(tǒng)的變化狀態(tài),故稱為新息灰色模型[14-16]。但是灰色GM(1,1)模型長期預(yù)測的有效性受時間序列長短和數(shù)據(jù)變化的顯著影響,若數(shù)據(jù)序列太短,則長期的預(yù)測模型難以建立;序列太長,系統(tǒng)受干擾的成分變大,將增多不穩(wěn)定因素,系統(tǒng)預(yù)測精度下降。因此通過在GM(1,1)模型中引入等維約束條件,構(gòu)建等維新息GM(1,1)模型,能夠彌補灰色系統(tǒng)模型的不足,使得預(yù)測預(yù)報的精度有效提高[17]。
自1997年以來,CNNIC開展統(tǒng)計調(diào)查工作已有22年,并于每年1月、7月分別發(fā)布統(tǒng)計報告2次,發(fā)布我國因特網(wǎng)上用戶人數(shù)、信息流量分布、用戶分布、上網(wǎng)計算機數(shù)、域名注冊等方面的統(tǒng)計信息情況。這給我國信息化發(fā)展提供了重要的咨詢,同時給政府、機構(gòu)和企業(yè)各界提供了關(guān)鍵的決策參考。根據(jù)中國互聯(lián)網(wǎng)信息中心(CNNIK)第44次發(fā)布的《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》[1],截至2018年12月,中國網(wǎng)民規(guī)模達8.26億,互聯(lián)網(wǎng)普及率達61.2%。本文選取CNNIC于2019年7月發(fā)布的第44次報告數(shù)據(jù)(見表1),以我國互聯(lián)網(wǎng)用戶人數(shù)為例進行分析。取2010-2015年的數(shù)據(jù)組成原始序列,在3種不同方案下運用MATLAB 預(yù)測2016-2018年的互聯(lián)網(wǎng)用戶人數(shù)。
表1 2007-2015年我國互聯(lián)網(wǎng)用戶人數(shù)
灰色GM(1,1)模型。利用灰色系統(tǒng)建模方法,對2010-2015年的數(shù)據(jù)構(gòu)建灰色GM(1,1)模型。解得:a=-0.145 1,b=27 116。由此得到我國互聯(lián)網(wǎng)用戶人數(shù)的傳統(tǒng)灰色GM(1,1)模型為:
表2 傳統(tǒng)GM(1,1)模型的預(yù)測結(jié)果
背景值重構(gòu)的GM(1,1)模型。對2010-2015年的數(shù)據(jù)構(gòu)建背景值重構(gòu)的GM(1,1)模型,解得:a1=-0.133 1,b1=27 960。得到我國互聯(lián)網(wǎng)用戶人數(shù)的背景值重構(gòu)的GM(1,1)模型為:
表3 背景值重構(gòu)的GM(1,1)模型的預(yù)測結(jié)果
由表2~表4可以看出,背景值重構(gòu)的等維新息灰色預(yù)測模型的預(yù)測精度最高,它的平均相對誤差約比背景值重構(gòu)的GM(1,1)模型減少約2.30%,比傳統(tǒng)GM(1,1)模型減少5.83%,效果較好。
表4 背景值重構(gòu)的等維新息GM(1,1)模型的預(yù)測結(jié)果
對比各模型預(yù)測值與實際值可知,在互聯(lián)網(wǎng)用戶人數(shù)預(yù)測過程中,傳統(tǒng)GM(1,1)模型的預(yù)測結(jié)果只能反映用戶人數(shù)的大致趨勢;背景值重構(gòu)的GM(1,1)模型在傳統(tǒng)GM(1,1)模型基礎(chǔ)上做了改進,預(yù)測精度高于GM(1,1)模型;而背景值重構(gòu)的等維新息GM(1,1)模型則是將2013年的實際值加入到系統(tǒng)中,去除了老數(shù)據(jù),使預(yù)測精度進一步提高。因此,背景值重構(gòu)的等維新息GM(1,1)模型可以更好地預(yù)測互聯(lián)網(wǎng)用戶人數(shù)。
本文在白化方程上利用積分重構(gòu)的方式構(gòu)造了GM(1,1)模型的背景值,減少了傳統(tǒng)背景值對模型造成的誤差,提高了模型的精度。接著在背景值重構(gòu)的前提下,實時地加入了新的信息,建立等維新息GM(1,1)模型。結(jié)合第37次中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告的數(shù)據(jù),通過仿真分析對互聯(lián)網(wǎng)用戶人數(shù)進行灰色建模并進行預(yù)測,結(jié)果表明:使用背景值重構(gòu)的等維新息GM(1,1)模型的預(yù)測準確率明顯高于背景值重構(gòu)的GM(1,1)模型和傳統(tǒng)GM(1,1)模型。