于文靜,余 潔,徐凌宇
(上海大學(xué) 計(jì)算機(jī)工程與科學(xué)學(xué)院,上海 200444)
海洋系統(tǒng)是一個(gè)動(dòng)態(tài)的復(fù)雜系統(tǒng),在演化過(guò)程中,海洋系統(tǒng)動(dòng)力學(xué)特征往往呈現(xiàn)出復(fù)雜性和非線性。海洋表面溫度(sea surface temperature,SST)是一個(gè)重要的海洋環(huán)境參數(shù),幾乎所有的海洋過(guò)程,特別是海洋動(dòng)力過(guò)程都直接或間接地與溫度有關(guān)。SST時(shí)間序列具有明顯的季節(jié)性,長(zhǎng)記憶性行為是復(fù)雜系統(tǒng)內(nèi)在機(jī)制的綜合表現(xiàn),是探索時(shí)空耦合系統(tǒng)的深層動(dòng)力機(jī)制的有效工具。因此對(duì)SST時(shí)間序列的復(fù)雜性及相關(guān)性進(jìn)行研究,對(duì)揭示海洋的特性和機(jī)理具有非常重要的意義[1-3]。
樣本熵[4]是一種衡量時(shí)間序列復(fù)雜度的方法,廣泛應(yīng)用在生理信號(hào)、腦電信號(hào)、振動(dòng)信號(hào)等復(fù)雜度分析中[5-6]。但是樣本熵在衡量時(shí)間序列復(fù)雜度時(shí),熵值的大小有時(shí)和系統(tǒng)復(fù)雜度的增加沒(méi)有關(guān)系[7],因此文中提出了一種樣本熵的改進(jìn)算法——二維熵。相比于樣本熵,二維熵在計(jì)算向量的相似性時(shí),不僅僅考慮向量之間的模式相似性,還考慮了向量之間的時(shí)間距離對(duì)相似性的影響。同時(shí),二維熵在最后計(jì)算熵值的模型中,考慮了序列中向量的自相似程度對(duì)時(shí)間序列復(fù)雜性的影響。因此二維熵在計(jì)算時(shí)間序列的復(fù)雜性時(shí)更加合理。
相關(guān)性的分析最早是由英國(guó)水文學(xué)家H.E.Hurst[8]于1954年提出的,通過(guò)重標(biāo)極差(R/S)分析法構(gòu)建Hurst指數(shù)來(lái)度量時(shí)間序列的長(zhǎng)程相關(guān)性。1992年,C.K.Peng等在《Nature》上提出的基于隨機(jī)游走理論的標(biāo)準(zhǔn)標(biāo)度分析法[9],計(jì)算出波動(dòng)指數(shù)可以刻畫時(shí)間序列的長(zhǎng)程相關(guān)性和短程相關(guān)性。但這兩種方法都是基于平穩(wěn)時(shí)間序列建立的,而現(xiàn)實(shí)世界中大多數(shù)的時(shí)間序列都是非平穩(wěn)的。對(duì)于非平穩(wěn)的時(shí)間序列,C.K.Peng等于1994年在研究DNA序列時(shí)提出了去趨勢(shì)波動(dòng)分析法(detrended fluctuation analysis,DFA)[10],能夠有效減小序列局部趨勢(shì)導(dǎo)致的非平穩(wěn)性。DFA分析方法已成功應(yīng)用在金融市場(chǎng)、情感心電信號(hào)、氣溫變化、降雨演變中等[11-15]。
二維熵的定義和樣本熵類似,二維熵參數(shù)用N,m,r,k表示。其中,N為序列長(zhǎng)度,m為嵌入維數(shù),r為相似容限,k為時(shí)間衰減系數(shù),具體算法如下:
設(shè)原始時(shí)間序列U(i)為由N個(gè)點(diǎn)構(gòu)成的序列,根據(jù)預(yù)先設(shè)定的嵌入維數(shù)m將原始時(shí)間序列重構(gòu)成一組m維向量,每個(gè)向量代表從第i個(gè)點(diǎn)開(kāi)始連續(xù)的m個(gè)u的值:
i=1,2,…,N-m+1
(1)
(2)
(3)
(4)
(5)
將維數(shù)m增加1,重復(fù)上述步驟,得到Bm+1(r,k)。
二維熵在計(jì)算時(shí)間序列的復(fù)雜度時(shí)不僅考慮新信息的產(chǎn)生率還考慮向量自相似程度,故二維熵的計(jì)算模型如下:
Bm+1(r,k)]
(6)
Bm+1(r,k)]
(7)
根據(jù)Pincus建議,實(shí)驗(yàn)中將m設(shè)為2,r為0.2SD,SD為時(shí)間序列的標(biāo)準(zhǔn)差;同時(shí)將衰減系數(shù)k設(shè)為0.01。
給定一個(gè)時(shí)間序列X={x(i),i=1,2,…,N},N是時(shí)間序列的長(zhǎng)度,DFA算法[16]主要包含以下幾個(gè)步驟:
(1)運(yùn)用以下公式,構(gòu)造序列的輪廓序列。
(8)
(2)重構(gòu)序列Y={Y(k),k=1,2,…,N},將它劃分成長(zhǎng)度為s的互相不重疊的窗口,窗口個(gè)數(shù)為Ns=int(N/s)。
(3)分別在每個(gè)窗口v中,用最小二乘法擬合數(shù)據(jù),則可獲得局部趨勢(shì)記為yv(k)。而擬合多項(xiàng)式的階數(shù)可根據(jù)實(shí)際情況確定,主要用于去除線性的,二次的或者更高次的趨勢(shì)。將去除趨勢(shì)后的序列記作:
Ys(k)=Y(k)-yv(k)
(9)
(4)計(jì)算去除趨勢(shì)后每個(gè)窗口內(nèi)的局部波動(dòng)。
(10)
其中,v=1,2,…,Ns,表示正向順序的窗口。
(5)由于步驟2中N不一定能被s整除,故在序列尾部存在一小部分?jǐn)?shù)據(jù)沒(méi)有被分析。為了克服這個(gè)問(wèn)題,將序列進(jìn)行逆序操作,重復(fù)步驟3、4,這樣就得到2Ns個(gè)窗口。
(11)
對(duì)于給定的窗口長(zhǎng)度值s(或稱為標(biāo)度),可以得到對(duì)應(yīng)的波動(dòng)函數(shù)值F(s),設(shè)F(s)與s具有冪律關(guān)系,即
F(s)~sα
(12)
其中,指數(shù)α稱為標(biāo)度指數(shù)。
根據(jù)式12可知logF(s)~αlog[s],則在(s,F(s))的雙對(duì)數(shù)圖中,可以用最小二乘法擬合得到標(biāo)度指數(shù)α,可知α的數(shù)值大小可以反映序列的相關(guān)性,如表1所示。
表1 標(biāo)度指數(shù)α的含義
實(shí)驗(yàn)數(shù)據(jù)來(lái)自國(guó)家海洋信息中心,衛(wèi)星遙感中國(guó)近海的SST實(shí)測(cè)數(shù)據(jù)。數(shù)據(jù)觀測(cè)點(diǎn)位于中國(guó)東部海域130.125°E經(jīng)度上31個(gè)不同緯度。時(shí)間分辨率為1天,時(shí)間跨度為1994年1月1日至2016年12月31日,數(shù)據(jù)點(diǎn)長(zhǎng)度為8 401。主要選取了位于低緯度第1個(gè)觀測(cè)點(diǎn)和中緯度第16個(gè)觀測(cè)點(diǎn)以及高緯度第31個(gè)觀測(cè)點(diǎn)的SST進(jìn)行相關(guān)性及復(fù)雜性研究。
三個(gè)觀測(cè)點(diǎn)的SST從1994年1月1日至2016年12月31日的時(shí)間序列如圖1所示。可以看出,低緯度第1個(gè)觀測(cè)點(diǎn)序列溫差變化小于第16個(gè)觀測(cè)點(diǎn)以及第31個(gè)觀測(cè)點(diǎn)的溫差變化,且第1個(gè)觀測(cè)點(diǎn)的SST時(shí)間序列變化更復(fù)雜。第16個(gè)觀測(cè)點(diǎn)以及第31個(gè)觀測(cè)點(diǎn)的周期性更加明顯。
接下來(lái)用二維熵度量這三個(gè)觀測(cè)點(diǎn)每一年SST時(shí)間序列的復(fù)雜度,如圖2所示??梢钥闯?,低緯度第1個(gè)觀測(cè)點(diǎn)每一年的SST時(shí)間序列的復(fù)雜度大于中緯度第16個(gè)觀測(cè)點(diǎn)以及高緯度第31個(gè)觀測(cè)點(diǎn)每一年的SST時(shí)間序列的復(fù)雜度。并且在2007年及以后三個(gè)觀測(cè)點(diǎn)的SST時(shí)間序列的復(fù)雜度趨勢(shì)都是降低的。
圖1 三個(gè)觀測(cè)點(diǎn)的SST時(shí)間序列
圖2 三個(gè)觀測(cè)點(diǎn)每一年SST的復(fù)雜度
實(shí)際上從圖1中可以看出第1個(gè)觀測(cè)點(diǎn)SST時(shí)間序列的波動(dòng)比較明顯,相應(yīng)的季節(jié)性等趨勢(shì)不明顯;而第16個(gè)觀測(cè)點(diǎn)和第31個(gè)觀測(cè)點(diǎn)的季節(jié)性都比較明顯,相應(yīng)的受其他因素影響的波動(dòng)趨勢(shì)就比較弱,序列看起來(lái)有規(guī)則,所以序列的復(fù)雜度相應(yīng)就小。而低緯度區(qū)除了季節(jié)性會(huì)影響海表面溫,其他因素,如太陽(yáng)輻射和海洋大氣熱交換等影響更加明顯。但是高緯度地區(qū)季節(jié)性因素相對(duì)來(lái)說(shuō)對(duì)SST的影響性更大。
然后用DFA方法來(lái)研究三個(gè)觀測(cè)點(diǎn)的長(zhǎng)相關(guān)性。三個(gè)觀測(cè)點(diǎn)每年的SST時(shí)間序列的DFA標(biāo)度指數(shù)α如圖3所示,每個(gè)觀測(cè)點(diǎn)23年的SST時(shí)間序列的長(zhǎng)相關(guān)性如圖4所示。
圖3 三個(gè)觀測(cè)點(diǎn)每年SST時(shí)間序列的DFA標(biāo)度指數(shù)
從圖3可以看出,高緯度第31個(gè)觀測(cè)點(diǎn)獲得的SST時(shí)間序列每一年的DFA標(biāo)度指數(shù)α比其他兩個(gè)觀測(cè)點(diǎn)的標(biāo)度指數(shù)都要高,且α值在1上下浮動(dòng),表明第31個(gè)觀測(cè)點(diǎn)的SST時(shí)間序列具有較強(qiáng)的非平穩(wěn)性和長(zhǎng)記憶性。而第1個(gè)觀測(cè)點(diǎn)的SST的DFA標(biāo)度指數(shù)在0.5上下浮動(dòng),表明這個(gè)緯度每年的SST時(shí)間序列呈現(xiàn)出不同的特點(diǎn),有時(shí)具有長(zhǎng)記憶性,有時(shí)具有反記憶性。這個(gè)結(jié)果和復(fù)雜度結(jié)果相似,對(duì)于高緯度地區(qū)的SST的季節(jié)性比較明顯,所以序列會(huì)呈現(xiàn)出長(zhǎng)記憶性特征。而低緯度地區(qū)影響SST序列的因素比較多,當(dāng)季節(jié)性因素影響較強(qiáng)時(shí),序列會(huì)呈現(xiàn)出長(zhǎng)記憶性;當(dāng)其他因素影響更強(qiáng)時(shí),序列會(huì)表現(xiàn)出隨機(jī)性或者反記憶性。第16個(gè)觀測(cè)點(diǎn)所在的中緯度地區(qū)的SST序列的季節(jié)性更加明顯,同時(shí)其他因素對(duì)SST的影響也比第31個(gè)觀測(cè)點(diǎn)強(qiáng),所以第16個(gè)觀測(cè)點(diǎn)SST的相關(guān)性在第1個(gè)觀測(cè)點(diǎn)和第31個(gè)觀測(cè)點(diǎn)之間波動(dòng)。
圖4 三個(gè)觀測(cè)點(diǎn)23年的SST的DFA標(biāo)度指數(shù)
圖4是這三個(gè)觀測(cè)點(diǎn)23年來(lái)(1994-2016年)的SST時(shí)間序列的波動(dòng)函數(shù)值F(s)與窗口長(zhǎng)度s之間的函數(shù)關(guān)系,直線是兩者最小二乘法的擬合直線??梢钥闯?,對(duì)于長(zhǎng)時(shí)間序列,這三個(gè)觀測(cè)點(diǎn)的DFA標(biāo)度指數(shù)α都大于0.5,且高緯度地區(qū)第31個(gè)觀測(cè)點(diǎn)的α大于中緯度地區(qū)第16個(gè)觀測(cè)點(diǎn)的α以及低緯度地區(qū)第1個(gè)觀測(cè)點(diǎn)的α。這三個(gè)觀測(cè)點(diǎn)的SST長(zhǎng)時(shí)間序列呈現(xiàn)出長(zhǎng)記憶性且具有非平穩(wěn)性。這是因?yàn)闀r(shí)間足夠長(zhǎng)時(shí),序列的季節(jié)性特征就相對(duì)更加明顯,序列的長(zhǎng)期記憶性就強(qiáng)。
主要研究了海表面溫(SST)時(shí)間序列的復(fù)雜性與相關(guān)性。根據(jù)一種改進(jìn)的樣本熵方法——二維熵方法來(lái)研究SST的復(fù)雜性;使用DFA方法研究SST的相關(guān)性。實(shí)驗(yàn)結(jié)果表明,周期性明顯的高緯度地區(qū)的SST時(shí)間序列的復(fù)雜度低于低緯度地區(qū)SST時(shí)間序列的復(fù)雜性。因?yàn)橛绊懙途暥鹊貐^(qū)的SST的因素較多,序列波動(dòng)的周期性不明顯,序列相對(duì)來(lái)說(shuō)比較復(fù)雜。相對(duì)不復(fù)雜的高緯度地區(qū)SST時(shí)間序列長(zhǎng)記憶性更加明顯,且顯示出較強(qiáng)的非平穩(wěn)性。而相對(duì)復(fù)雜的低緯度地區(qū)SST時(shí)間序列呈現(xiàn)出反記憶性及長(zhǎng)記憶性不同的特點(diǎn)。然而當(dāng)序列的長(zhǎng)度足夠長(zhǎng)時(shí),不同緯度下的SST時(shí)間序列都呈現(xiàn)出明顯的長(zhǎng)記憶性及非平穩(wěn)性。