韓心婭+沈翀+沈婷婷+程宗毛
摘要:本文針對(duì)東海一點(diǎn)的9年海表溫度遙感數(shù)據(jù)集的序列(2003-2011)進(jìn)行處理,首先通過(guò)SPSS初步檢驗(yàn)出所處理的溫度數(shù)據(jù)滿(mǎn)足正態(tài)性。然后通過(guò)Mann-Kendall秩次相關(guān)檢驗(yàn)研究了數(shù)據(jù)點(diǎn)溫度的趨勢(shì)性和突變性。通過(guò)周期存在性檢驗(yàn)取定四個(gè)周期。用傅里葉函數(shù)描述周期成份,各自系數(shù)分別通過(guò)參數(shù)估計(jì)得到。對(duì)比測(cè)試數(shù)據(jù)的周期項(xiàng)和原始數(shù)據(jù)圖表得結(jié)果有效。該隨機(jī)序列的自相關(guān)是拖尾的,而偏相關(guān)是一階截尾的,故可建立AR(3)模型,分析得序列是白噪聲序列。
關(guān)鍵詞:海表溫度;Mann-Kendall方法;趨勢(shì)性;突變性;周期成分
1.引言:時(shí)間序列分析是概率統(tǒng)計(jì)學(xué)科中的一個(gè)分支,隨著基本理論的更加深入和完善,以及統(tǒng)計(jì)軟件技術(shù)的發(fā)展,使其在氣象水文等領(lǐng)域有了更加廣泛的應(yīng)用。海表溫度不僅是描述海洋表層熱狀況的重要指標(biāo),其異常情況還是海洋影響大氣環(huán)流、氣候變化的主要因子。所以海表溫度一直都是諸多學(xué)者觀(guān)察、研究和預(yù)測(cè)的重要研究對(duì)象。趨勢(shì)性、突變性和周期性是時(shí)間序列數(shù)據(jù)的基本特征, Mann-Kendall方法作為一種非參數(shù)統(tǒng)計(jì)檢驗(yàn)方法,其優(yōu)點(diǎn)在于樣本不需遵從一定的分布,也不會(huì)受少數(shù)異常值的干擾,計(jì)算相對(duì)方便。近幾年被廣泛用于氣溫、降水量變化 、植被變化等自然界變化的趨勢(shì)分析中,考慮到海表溫度的變化規(guī)律也有相似的性質(zhì)。因此,本文選擇通過(guò)處理海表溫度使其可以顯示出正態(tài)性,而后引入該M-K方法測(cè)試數(shù)據(jù)在一定時(shí)間段內(nèi)是否異常,在此基礎(chǔ)上再進(jìn)一步提取海表溫度集的周期成分,確立時(shí)間序列模型。
2.數(shù)據(jù)預(yù)處理
本文考慮建立合理的分析模型提取海洋表層溫度數(shù)據(jù)的趨勢(shì)性、周期性和突變性特征,通過(guò)誤差分析比較不同提取方法的優(yōu)缺點(diǎn),為預(yù)測(cè)海表溫度未來(lái)的變化提供更加有效的依據(jù)。此外,將溫度數(shù)據(jù)集進(jìn)行合理的區(qū)間劃分,使得每個(gè)區(qū)間內(nèi)的統(tǒng)計(jì)數(shù)據(jù)復(fù)合最優(yōu)的正態(tài)分布統(tǒng)計(jì),并給出正態(tài)分布的檢驗(yàn)方法、統(tǒng)計(jì)區(qū)間的上下節(jié)點(diǎn)及統(tǒng)計(jì)分布模型的相關(guān)參數(shù)。
本文采用了東海海表上2003年至2011年一研究點(diǎn)的溫度遙感數(shù)據(jù)集,從1開(kāi)始編號(hào),共計(jì)數(shù)據(jù)3287個(gè)。計(jì)一年為365天,這組數(shù)據(jù)記錄了9年里每一天的溫度,但是由于2004年和2008年是閏年,為減小不同年份的對(duì)比差異,將這兩年2月29日的溫度數(shù)據(jù)剔除。推算可得這兩個(gè)時(shí)間點(diǎn)的溫度數(shù)據(jù)對(duì)應(yīng)的序號(hào)分別為425和1886,剔除后數(shù)據(jù)長(zhǎng)度變?yōu)?285。
幾乎所有的科研數(shù)據(jù)都必須滿(mǎn)足正態(tài)性才能進(jìn)行分析,因此要對(duì)數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn),以保證后續(xù)分析的可靠性。本文利用SPSS對(duì)每個(gè)點(diǎn)每一年的溫度數(shù)據(jù)進(jìn)行了直方圖和正態(tài)曲線(xiàn)繪制,具體將東海2003年的情況呈現(xiàn)如下:
觀(guān)察圖1可得數(shù)據(jù)呈正態(tài)分布。圖2給出了K-S檢驗(yàn)的具體結(jié)果,由于概率p值為0.227,大于0.05,故不能拒絕K-S檢驗(yàn)的原假設(shè),即數(shù)據(jù)滿(mǎn)足正態(tài)性。這為接下來(lái)的探討提供了一定的支持和幫助。
3.海表溫度基本特征分析
3.1 Mann-Kendall方法簡(jiǎn)介。Mann-Kendall方法由于最初由H.B. Mann和M.G.Kendall提出原理并發(fā)展了該方法。當(dāng)時(shí)這一方法僅用于檢測(cè)序列的變化趨勢(shì),后來(lái)經(jīng)他人進(jìn)一步完善和改進(jìn),才形成目前的計(jì)算格式。該方法既可以檢測(cè)序列的變化趨勢(shì),也可以進(jìn)行突變點(diǎn)檢驗(yàn)。
3.2 Mann-Kendall方法應(yīng)用
3.2.1 研究點(diǎn)海表溫度的日變化趨勢(shì)與突變情況。在對(duì)東海表溫度的數(shù)據(jù)的趨勢(shì)性和突變性信息進(jìn)行提取時(shí),本文主要采用M-K方法,通過(guò)matlab軟件編寫(xiě)程序,我們得到下述結(jié)果:
①趨勢(shì)變化:
②突變情況:
③結(jié)果分析:一般而言M-K方法計(jì)算的趨勢(shì)符合正態(tài)分布,且Z= 4.381>1.96,則說(shuō)明該點(diǎn)海表溫度的日變化趨勢(shì)有明顯上升趨勢(shì)。UFK和UBK在95%的信度線(xiàn)之間沒(méi)有交點(diǎn),說(shuō)明該點(diǎn)溫度在這段期間內(nèi)沒(méi)有突變。
3.2.2 研究點(diǎn)海表溫度的年變化趨勢(shì)與突變情況
①趨勢(shì)變化:
②突變情況:
③結(jié)果分析:Z statistic = 0.31277<1.96,說(shuō)明該點(diǎn)溫度的年變化趨勢(shì)有上升但不明顯。UFK和UBK在95%的信度線(xiàn)之間有交點(diǎn),且致在8-9年之間,說(shuō)明該點(diǎn)海表溫度在第八年左右發(fā)生突變,且該點(diǎn)表溫度由下降趨勢(shì)轉(zhuǎn)為上升趨勢(shì)。
3.3 周期成分識(shí)別
3.3.1 周期顯著性判斷。首先我們用方差分析法判斷時(shí)間序列中是否存在顯著周期。在分析周期之前,事先并不知道這一序列的周期是多少,所以要根據(jù)序列長(zhǎng)度,列出可能存在的周期。若時(shí)間序列總長(zhǎng)度為n,則可能存在的周期為。將周期為T(mén)的時(shí)間序列進(jìn)行分組,對(duì)應(yīng)可以分為組數(shù)據(jù),根據(jù)
可知第i組的平均值為:
上式中ni表示第i組內(nèi)的數(shù)據(jù)個(gè)數(shù)。
將時(shí)間序列分別按每一個(gè)可能的周期進(jìn)行分組,計(jì)算相應(yīng)的組內(nèi)離差平方和SE及組間離差平方和SA:
上式中表示第i組的平均值,表示總平均值。
可以證明服從自由度為的F分布。給定顯著性水平,查分布表可以得到的值,如果,則此周期為顯著周期。由于與真實(shí)周期相鄰的值有可能通過(guò)顯著性檢驗(yàn),我們?nèi)∵B續(xù)通過(guò)F檢驗(yàn)的T值中使F值最大的對(duì)應(yīng)T值作為主周期。用測(cè)試數(shù)據(jù)測(cè)試檢驗(yàn)周期的存在和判定周期:
從圖5中可以看出當(dāng)t=52,103,154,206時(shí)F值最大,故我們?nèi)《ㄟ@四個(gè)周期。
3.3.2 周期提取。周期確定后, 周期成份Pt可用如下形式也即傅里葉函數(shù)描述:
上式中d表示有效諧波數(shù)即主周期的個(gè)數(shù),Ti表示第i個(gè)諧波對(duì)應(yīng)的周期,ai和bi為參數(shù),計(jì)算式為:
根據(jù)傅里葉函數(shù)求系數(shù)的公式,對(duì)其參數(shù)進(jìn)行估計(jì)得到:
從而得出測(cè)試數(shù)據(jù)的周期項(xiàng)和原始數(shù)據(jù)的對(duì)比圖,從而計(jì)算得到隨機(jī)項(xiàng)圖,具體如下所示:
用Eviews對(duì)隨機(jī)項(xiàng)做ADF檢驗(yàn),檢驗(yàn)結(jié)果如下表所示:
從上圖中可以看出,該隨機(jī)序列通過(guò)ADF檢驗(yàn),是一組平穩(wěn)序列。再對(duì)隨機(jī)序列進(jìn)行相關(guān)分析,看其是否相關(guān),從而判定它是否是白噪聲。
從圖9可以看出,該隨機(jī)序列的自相關(guān)是拖尾的,而偏相關(guān)是一階截尾的,故可建立AR(3)模型,模型建立結(jié)果和殘差序列如下所示:
由圖11和圖12可知,該殘差序列在5%的置信區(qū)間內(nèi)平穩(wěn)且不相關(guān),故為白噪聲序列。
總結(jié):本文通過(guò)SPSS初步檢驗(yàn)出所處理的溫度數(shù)據(jù)滿(mǎn)足正態(tài)性。繼而通過(guò)Mann-Kendall秩次相關(guān)檢驗(yàn)發(fā)現(xiàn)東海表層溫度的年變化趨勢(shì)雖然在第八年有突變,海表溫度由下降趨勢(shì)轉(zhuǎn)為上升趨勢(shì),但近9年整體無(wú)明顯變化的趨勢(shì)。而在日變化趨勢(shì)上則有明顯的上升趨勢(shì)。周期存在性檢驗(yàn)中,t=52,103,154,206時(shí)F值最大,故我們?nèi)《ㄟ@四個(gè)周期。周期成份可用傅里葉函數(shù)來(lái)描述,4個(gè)周期下系數(shù)則可分別通過(guò)參數(shù)估計(jì)得到。測(cè)試數(shù)據(jù)的周期項(xiàng)和原始數(shù)據(jù)對(duì)比圖表明所得結(jié)果有效。該隨機(jī)序列的自相關(guān)是拖尾的,而偏相關(guān)是一階截尾的,故可建立AR(3)模型,分析得序列是白噪聲序列。