朱苗苗,牛國鋒,樂德廣
(常熟理工學院 計算機科學與工程學院,江蘇 常熟 215500)
如今,互聯(lián)網已經成為人們生活中不可或缺的一部分,它的出現不僅改變了人們傳統(tǒng)的交流方式,開闊了人們的視野,而且改變了傳統(tǒng)企業(yè)的營運模式,催生出大量新興企業(yè),對人們的生活和社會發(fā)展帶來了巨大的影響。分析預測互聯(lián)網上網人數,可以全局掌握網絡的應用情況,為網絡建設、應用、管理及與網絡相關的各種技術和業(yè)務提供決策依據[1]。
Verhulst預測理論是1837年德國生物學家Verhulst在研究生物繁殖規(guī)律時提出的。其基本思想是生物個體數量是呈指數增長的,受周圍環(huán)境的限制,增長速度逐漸放慢,最終穩(wěn)定在一個固定值。Verhulst模型主要用來描述具有飽和狀態(tài)的過程,即“S”型過程,常用于人口預測、生物生長、繁殖預測及產品經濟壽命預測等[2]。
本文在分析最近幾年我國互聯(lián)網上網人數實測數據的基礎上,根據數據本身所具有的特征,引入灰色Verhulst預測理論,通過分析建立了我國互聯(lián)網上網人數的灰色Verhulst動態(tài)模型,并通過所建立的模型對2000~2005年我國互聯(lián)網上網人數進行實例驗證和誤差檢驗。檢驗結果表明,所建立的灰色Verhulst預測模型對實測數據的預測優(yōu)于GM(1,1)模型、線性回歸、指數曲線等其他方法。
灰色系統(tǒng)是指既含有已知信息、又含有未知信息的系統(tǒng),因為它具有對各種現象進行分析判斷的能力、對宏觀系統(tǒng)進行規(guī)劃與決策的功能,其立足點是對系統(tǒng)輸出序列進行研究,而不過多地涉及系統(tǒng)輸入序列的研究,對原始數據序列長度要求也不高。它的特點是所需信息量少,不僅能夠將無序離散的原始序列轉化為有序序列,而且預測精度高,能夠保持原系統(tǒng)的特點特征,較好地反映系統(tǒng)的實際情況[2]。
灰色Verhulst模型主要是用來描述非單調的擺動發(fā)展序列或具有飽和狀態(tài)的S型序列。表1和圖1分別顯示了從2000~2005年我國互聯(lián)網上網人數的統(tǒng)計。從圖1可以很明顯地看出,自從2000年以來,我國互聯(lián)網上網人數一直保持著比較強勁的增長勢頭,并在一定時間段上是呈部分“S”型變化的,所以在一定程度上互聯(lián)網上網人數的變化情況可以通過建立灰色Verhulst模型進行預測。
設在一個模型預測中,原始數據數列為X(1),為了弱化呈離散狀態(tài)的原始數據,對原始時間序列進行數據的一次累減處理,經過處理的時間序列稱為生成累減序列X(0)=(x(0)(1),x(0)(2),…,x(0)(n));然后通過對原始數據序列累加生成的遞增序列實行緊鄰均值生成Z(1),同時令X(0)(1)=X(1)(1),這時所建立的灰色模型為[3]:
相應的白化方程為:
解得:
所求的灰色Verhulst模型時間響應式為:
式(4)中,k為時間序數,a、b都為待求系數,a為發(fā)展系數,其大小及符號反映 X(1)及 X(0)的發(fā)展態(tài)勢,b為系統(tǒng)的輸入,其內涵是具有灰色信息覆蓋的系統(tǒng)作用量[4],不能直接觀測得到,在灰色理論中,a、b的值可以用最小二乘法求取,即:
其中,Z(1)為由原始數據進行累加生成的緊鄰均值生成序列 ,即:
式(5)中,Y=[x(0)(2),x(0)(3),…,x(0)(K)]T。
然后將所求的a、b值分別代入式(4)中,即求得原始數據序列的預測值。
互聯(lián)網上網人數預測對于整個互聯(lián)網發(fā)展和相對業(yè)務決策有著至關重要的意義。近年來對于互聯(lián)網上網人數的預測方法比較多,有線性回歸、指數曲線等方法。雖然這種方法能夠簡單、直觀地得到預測結果,但由于它一般采用線性或者指數形式,而不完全符合某些事物的發(fā)展趨勢,所以預測精度存在一定的缺陷。同樣對于參考文獻 [2]所介紹的GM(1,1)模型方法,由于GM(1,1)模型適用于具有較強指數規(guī)律的序列,只能描述單調的變化過程,預測精度同樣也存在一定的缺陷。下面根據表1中的原始數據,利用本文所建立的Verhulst模型對我國近幾年來的互聯(lián)網上網人數進行預測。
(1)根據表1中的數據,其原始數列:
(2)X(1)的一次累減(1-IAGO)序列:
(3)緊鄰均值生成序列:
(4)求得 B及 Y:
(5)將 B和 Y分別代入式(5)中,通過 MATLAB軟件求得 a和 b,即:
(6)取X(1)(0)=X(1)(1)=4 456
根據式(4),求得Verhulst互聯(lián)網上網人數預測時間響應式為:
(7)由此可以對2000~2005年我國互聯(lián)網上網人數進行模擬、預測:
(8)原始數據和預測數據比對,比對結果如圖2所示。
一種模型要經過多種檢驗才能判斷其是否合理、合格,也只有通過檢驗的模型才能用來做預測[5]。本節(jié)中,為了驗證所建灰色模型是否能更準確對互聯(lián)網上網人數進行預測,針對表2中的數據分別采用殘差檢驗法和后殘差檢驗法進行檢驗。
表2 2000~2005我國互聯(lián)網上網人數預測結果
根據計算出來的預測值和原始數據求出殘差和相對誤差:
殘 差 :q(1)(k)=x(1)(k)-x?(1)(k)
相對誤差:e(k)=|q(1)(k)/x(1)(k)|×100%
通過上述檢驗方法,分別對本文的Verhulst模型和GM(1,1)模型計算出誤差檢驗結果,表3顯示了Verhulst模型和 GM(1,1)模型預測結果對比。
表3 Verhulst模型和GM(1,1)模型預測結果對比
從表3可以看出,即使參考文獻[2]中通過建立殘差對GM(1,1)模型進行修正,其預測結果也沒有本文所介紹的Verhulst模型預測精度高。
表4 預測精度等級衡量
通過以上方法對所建立的互聯(lián)網上網人數模型進行檢驗擬合,其結果顯示:本文所建立的灰色Verhulst動態(tài)模型后檢驗比值 C=0.030 8、P=1,根據表 4判斷依據,此模型預測效果為好。
合理科學地對我國互聯(lián)網上網人數進行預測,可以為網絡產業(yè)的發(fā)展提供科學有效的參考,同時,對于整個社會經濟的發(fā)展也具有重要的意義。
本文通過分析研究動態(tài)Verhulst模型的思想、特征和我國互聯(lián)網上網人數逐年增長,并在一定時間段上原始數據呈部分“S”型變化的趨勢前提下,提出將Verhulst模型應用于我國互聯(lián)網上網人數的預測。通過建立模型和結果檢驗,證明此方法具有方法簡單、預測精度高、可進行中長期預測等特點,是一種值得推廣的預測方法。
雖然通過此模型的建立,模擬的精度還是比較高的,但是根據灰色理論研究的原理和方法,若想提高預測精度、保證結果的可靠性,可以將Verhulst模型與其他預測方法結合使用,同時應該根據不斷得到的新數據對預測模型進行不斷的修正,因為隨著時間的推移和一些外界因素的影響,數據的變化趨勢會發(fā)生一定的變化,只有這樣才能夠更加準確地對我國互聯(lián)網上網人數進行科學準確的預測,從而產生一系列的實用價值。
[1]陳晶晶,毛謙,劉國輝.我國互聯(lián)網互用數預測研究[J].光通信研究,2007(1).
[2]連飛.基于 GM(1,1)模型的我國互聯(lián)網上網人數灰色預測[J].統(tǒng) 計 與 咨 詢 ,2007(4).
[3]鄧聚龍.灰色系統(tǒng)理論教程[M].武漢:華中理工大學出版社,1999.
[4]WU W Y,CHEN S P.A prediction method using the Grey model GMC(1,n)combined with the grey relational analysis: a case study on Internet access population forecast[J].Applied Mathematics and Computation, 2005,169(1).
[5]蒿建華.灰色模型在人口預測中的應用[J].西安文理學院學報,2008,11(3).