王盼盼+郭林豪+王林枝+馬寨璞
摘 要:水溫是影響水質(zhì)的重要因素之一,為了更好地預(yù)測(cè)水溫的變化趨勢(shì),為水質(zhì)管理及漁業(yè)生產(chǎn)提供科學(xué)依據(jù),本文以太湖梅梁灣湖區(qū)為例,選取梅梁灣1995年1月-2005年12月的水溫?cái)?shù)據(jù),構(gòu)建季節(jié)性時(shí)間序列模型,并以2006年的水溫?cái)?shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果顯示了模型擬合效果較好,預(yù)測(cè)值與實(shí)測(cè)值相對(duì)誤差較小,表明季節(jié)性時(shí)間序列在水溫預(yù)測(cè)方面有較好的應(yīng)用性。
關(guān)鍵詞:季節(jié)性;時(shí)間序列;水溫;漁業(yè)
由于自然和人為因素的影響,對(duì)湖泊的水質(zhì)造成了不同形式的危害。一旦湖泊發(fā)生富營(yíng)養(yǎng)化,就會(huì)導(dǎo)致藻類及其他水生生物過(guò)量繁殖,造成水質(zhì)惡化。這不僅對(duì)生態(tài)環(huán)境造成一定程度的破壞,而且對(duì)漁業(yè)的生產(chǎn)也會(huì)產(chǎn)生影響。然而,水中各影響因子之間關(guān)系比較復(fù)雜并且呈非線性,各因子對(duì)影響富營(yíng)養(yǎng)化程度的大小不一,其中水溫作為影響藻類生長(zhǎng)和繁殖的基本因子,與細(xì)胞內(nèi)酶反應(yīng)速率和植物的新陳代謝有密切的關(guān)系[1]。Agawin等認(rèn)為水溫升高對(duì)藻類數(shù)量的增加有主導(dǎo)作用,在其他環(huán)境條件適宜的情況下,溫度每升高10 ℃都會(huì)引起藻類活動(dòng)強(qiáng)度增加2倍[2]。所以了解水溫變化趨勢(shì)在一定程度上可以為預(yù)測(cè)湖泊水質(zhì)提供科學(xué)依據(jù),同時(shí)對(duì)漁業(yè)生產(chǎn)提供科學(xué)指導(dǎo)。
水溫?cái)?shù)據(jù)是隨著時(shí)間的推移而記錄下的一系列的數(shù)據(jù),它們往往具有季節(jié)性和周期性。對(duì)于這種序列的數(shù)據(jù),我們往往稱為季節(jié)性序列。而處理這種序列數(shù)據(jù)的方法之一就是建立季節(jié)時(shí)間序列模型,即SARIMA模型,此模型主要應(yīng)用于有長(zhǎng)期趨勢(shì)與季節(jié)性波動(dòng)的時(shí)間序列的分析預(yù)測(cè)中。本文將以太湖梅梁灣湖區(qū)1995年1月-2005年12月水溫?cái)?shù)據(jù)為基礎(chǔ),建立季節(jié)時(shí)間序列模型,并以2006年各月水溫?cái)?shù)據(jù)為依據(jù),對(duì)建立的SARIMA模型預(yù)測(cè)值進(jìn)行驗(yàn)證,為水溫及水質(zhì)預(yù)測(cè)提供新思路。
1 SARIMA模型概述
SARIMA模型又叫季節(jié)性差分自回歸移動(dòng)平均模型(Seasonal Autoregressive Integrated Moving Average),存在明顯的周期變化,這種周期變化主要是由于季節(jié)變化引起的。此模型的基本構(gòu)成為SARIMA (p,d,q)(P,D,Q),共六個(gè)參數(shù)需要確定。其中P、D、Q主要描述季節(jié)性的變化,p、d、q用來(lái)描述去除季節(jié)性的變化,分別代表自回歸、差分、移動(dòng)平均。SARIMA模型在國(guó)內(nèi)外不同領(lǐng)域均有廣泛的應(yīng)用,例如:Kutluk Kagan Sume等對(duì)開(kāi)塞利及附近地區(qū)的電力需求應(yīng)用SARIMA模型進(jìn)行了預(yù)測(cè)[3];王瑩等用SARIMA模型對(duì)北京地鐵進(jìn)站的客流量進(jìn)行了預(yù)測(cè)[4];劉濤等將SARIMA模型應(yīng)用于山東省手足口病發(fā)病趨勢(shì)的研究[5];田苗等基于條件植被溫度指數(shù),用SARIMA模型對(duì)關(guān)中平原進(jìn)行了干旱預(yù)測(cè)[6]。以上模型均很好地?cái)M合了數(shù)據(jù)趨勢(shì),預(yù)測(cè)結(jié)果與實(shí)際情況較吻合。
2 研究區(qū)概況
太湖是我國(guó)東部近海區(qū)域最大的湖泊,是我國(guó)第二大淡水湖泊。湖泊面積隨著自然和人為因素的影響已經(jīng)逐漸縮減到2 427.8 km2,位于北緯30°55'40"~31°32'58"和東經(jīng)119°52'32"~120°36'10"之間。梅梁灣是太湖北部的一個(gè)湖灣,面積約129.3 km2,平均水深2.3 m,是無(wú)錫市主要水源地及旅游區(qū)。梅梁灣東北部有梁溪河、五里湖注入,西北部與武進(jìn)港、直湖港有水力聯(lián)系[7]。由于入湖河道及沿岸的污染影響,梅梁灣內(nèi)藍(lán)藻水華現(xiàn)象嚴(yán)重。圖1為太湖區(qū)域的輪廓圖,方框中的區(qū)域?yàn)槊妨簽澈^(qū)。
3 數(shù)據(jù)來(lái)源
本文選取梅梁灣監(jiān)測(cè)點(diǎn)1995年1月-2005年12月的水溫監(jiān)測(cè)數(shù)據(jù)(由中國(guó)科學(xué)院太湖湖泊生態(tài)系統(tǒng)研究站提供)。數(shù)據(jù)為每月一次,共132個(gè)樣本數(shù)據(jù)。
4 梅梁灣湖區(qū)水溫季節(jié)時(shí)間序列模型建立
4.1 數(shù)據(jù)的預(yù)處理
首先我們對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,通過(guò)探索性分析,防止數(shù)據(jù)在建立SARIMA模型時(shí)存在由于錄入錯(cuò)誤、缺失以及不相等的觀測(cè)區(qū)間或者不相關(guān)的時(shí)間等而出現(xiàn)的問(wèn)題[8]。因?yàn)镾ARIMA模型是對(duì)序列相鄰時(shí)期的觀測(cè)值之間的相關(guān)關(guān)系進(jìn)行的建模,不能應(yīng)用于有缺失值的時(shí)間序列。對(duì)于數(shù)據(jù)中出現(xiàn)的缺失值,本文采取臨近年份之間的平均值來(lái)代替。而對(duì)于間隔不等的時(shí)間序列可以用差值法來(lái)轉(zhuǎn)換成等間隔的時(shí)間序列,本文中時(shí)間序列相等,為每月一次。
時(shí)間序列的確定性分析:
(1)對(duì)梅梁灣1995年1月-2005年12月的各月水溫?cái)?shù)據(jù)做時(shí)間序列圖,如圖2(左)所示,可以看出該序列存在季節(jié)性周期波動(dòng),但是趨勢(shì)性并不明顯。
(2)計(jì)算觀測(cè)序列的樣本相關(guān)系數(shù)和樣本偏相關(guān)系數(shù)。在時(shí)間序列中,相鄰兩個(gè)時(shí)間點(diǎn)的觀測(cè)值具有一定的相關(guān)性,即所謂的自相關(guān);它們的相關(guān)系數(shù)則成為自相關(guān)系數(shù)(ACF)。而偏相關(guān)系數(shù)(PACF)指的是在給定中間觀測(cè)值的條件下,時(shí)間序列的觀測(cè)值與過(guò)去觀測(cè)值的線性相關(guān)性的系數(shù)。梅梁灣樣本數(shù)據(jù)的自相關(guān)函數(shù)和偏相關(guān)函數(shù)圖如圖2(中、右)所示,由此可以看出序列為非平穩(wěn)狀態(tài),所以需要對(duì)此序列進(jìn)行差分,從而轉(zhuǎn)換為平穩(wěn)序列,繼續(xù)建立模型。
4.2 模型識(shí)別
所謂差分(Difference),即是用原序列的每一個(gè)觀測(cè)值減去前面一個(gè)觀測(cè)值,所形成的就是對(duì)原序列的一階差分。通過(guò)以上對(duì)梅梁灣1995年-2005年的水溫?cái)?shù)據(jù)的分析得出此序列為季節(jié)性時(shí)間序列,故需對(duì)原序列進(jìn)行一階季節(jié)性差分,從而消除其季節(jié)性因素,使序列得以平穩(wěn)。差分后的序列圖以及自相關(guān)和偏相關(guān)圖如圖3所示。一階季節(jié)性差分后的序列圖的季節(jié)性已不明顯,但是自相關(guān)圖和偏相關(guān)圖的滯后12階處有明顯的峰值,說(shuō)明此差分序列仍然存在一定周期性,故繼續(xù)進(jìn)行單位根檢驗(yàn)。所得結(jié)果如圖4所示,ADF值= -9.664 849,小于三個(gè)顯著性水平下的值,所以拒絕原假設(shè),此序列沒(méi)有單位根,認(rèn)為是平穩(wěn)序列,可以建立SARIMA模型。
4.3 參數(shù)估計(jì)
模式識(shí)別之后,便可以對(duì)模型進(jìn)行初步定階。但是符合模型模式的參數(shù)并不唯一,所以要考慮到所有可能的參數(shù)值。由于一階季節(jié)性差分后序列達(dá)到平穩(wěn)狀態(tài),所以不難確定d=0,D=1。對(duì)于p,q,P,Q的可能取值,可以由低階到高階擬合模型,根據(jù)BIC準(zhǔn)則來(lái)確定最終的最優(yōu)模型的參數(shù)。本文經(jīng)過(guò)篩選,最小的BIC的值為1.664,最優(yōu)模型為SARIMA(0,0,0)(1,1,1)。該模型的統(tǒng)計(jì)量結(jié)果見(jiàn)表1,R方值為0.936,說(shuō)明擬合較好,顯著性的值大于0.05,表明殘差錯(cuò)誤是隨機(jī)的。
4.4 模型診斷與檢驗(yàn)
根據(jù)模型SARIMA(0,0,0)(1,1,1)擬合得到的殘差自相關(guān)及偏相關(guān)圖見(jiàn)圖5,從圖中可以看出殘差序列基本不存在相關(guān)性,位于置信區(qū)間內(nèi),可以看做白噪聲序列,故本文所建立的SARIMA(0,0,0)(1,1,1)模型是比較可靠的。
4.5 模型預(yù)測(cè)結(jié)果及分析
對(duì)模型進(jìn)行檢驗(yàn)之后就可以用所建立的SARIMA(0,0,0)(1,1,1)對(duì)梅梁灣1995年1月-2005年12月的水溫?cái)?shù)據(jù)進(jìn)行擬合,以及對(duì)2006年各月水溫進(jìn)行預(yù)測(cè),如圖6所示,從圖中可以看出擬合情況與原序列較吻合。表2記錄了2006年各月水溫的預(yù)測(cè)值以及當(dāng)年的實(shí)測(cè)值,為了更好地驗(yàn)證模型SARIMA(0,0,0)(1,1,1)的預(yù)測(cè)準(zhǔn)確性,本文以相對(duì)誤差的大小作為衡量標(biāo)準(zhǔn)。經(jīng)計(jì)算,相對(duì)誤差大都在15%以下,且誤差為零的有2個(gè),誤差小于5%的有3個(gè),誤差在5%~10%的有2個(gè),誤差在10%~15%的有3個(gè),誤差在15%~20%的有1個(gè),誤差超過(guò)20%的有1個(gè),總體來(lái)說(shuō)平均相對(duì)誤差為7.9%。所以本文建立的季節(jié)時(shí)間序列模型有較好的預(yù)測(cè)效果,相對(duì)誤差在允許的范圍內(nèi)。圖5 模型SARIMA(0,0,0)(1,1,1)殘差序列自相關(guān)和偏相關(guān)圖.
5 結(jié)論
本文對(duì)太湖梅梁灣湖區(qū)建立的季節(jié)性時(shí)間序列模型能夠很好地?cái)M合水溫序列趨勢(shì),同時(shí)經(jīng)過(guò)2006年實(shí)測(cè)水溫?cái)?shù)據(jù)的驗(yàn)證,表明SARIMA模型的預(yù)測(cè)效果較為理想,能夠適用梅梁灣湖區(qū)的水溫預(yù)測(cè)。
時(shí)間序列應(yīng)用領(lǐng)域比較廣泛,但是將季節(jié)時(shí)間序列應(yīng)用于湖泊的管理及水質(zhì)預(yù)測(cè)還不是很多,由此為研究水生態(tài)及漁業(yè)生產(chǎn)的科學(xué)管理提供了一種新思路。
參考文獻(xiàn):
[1] 田志富.基于RDA的白洋淀浮游植物群落結(jié)構(gòu)動(dòng)態(tài)特征分析[D].保定:河北大學(xué),2012
[2] N S Agawin, C M Duarte, S Agusti. Nutrient and Temperature Control of the Contribution of Picoplankton to Phytoplankton Biomass and Production[J].Limnology and Oceanography,2000,45(3): 591-600
[3] Kutluk Kagan Sumer, Ozlem Goktas, Aycan.Hepsag.The Application of Seasonal Latent Variable in Forecasting Electricity Demand as an Alternative Method[J].Energy policy,2009,37(4):1317-1322
[4] 王瑩,韓寶明,張琦,等.基于SARIMA模型的北京地鐵進(jìn)站客流量預(yù)測(cè)[J].交通運(yùn)輸系統(tǒng)工程與信息,2015(06):205-211
[5] 劉濤,王顯軍,姜寶法,等.SARIMA模型預(yù)測(cè)山東省手足口病發(fā)病趨勢(shì)[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2013,30(05):697-700
[6] 田苗,王鵬新,韓萍,等.基于SARIMA模型和條件植被溫度指數(shù)的干旱預(yù)測(cè)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2013,44(02):109-116
[7] 陳鳴,陸衛(wèi)鮮,郁建橋,等.太湖梅梁灣水污染及藍(lán)藻分析計(jì)算[J].河海大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,38(6):634-638
[8] 格雷特,李洪成.時(shí)間序列預(yù)測(cè)實(shí)踐教程[M].北京:清華大學(xué)出版社,2012