曹偉征,纏佳悅,張玉國,劉 東
(1.黑龍江省水文局,哈爾濱 150001;2.東北農(nóng)業(yè)大學(xué)水利與土木工程學(xué)院,哈爾濱 150030)
隨著城市化進程的加快,人類活動對河網(wǎng)水系造成干擾愈加強烈,大量河道被城市建設(shè)用地所取代。因此,開展城市化對流域水系與水文過程的影響研究,對于提高區(qū)域防洪排澇能力[1]、建設(shè)海綿城市和生態(tài)城市具有重要意義。
近年來,國內(nèi)外將熵理論逐步應(yīng)用于城市水文系統(tǒng)復(fù)雜性的分析中[2]。1997年模糊集合概念被提出后,各國作者們先后提出模糊熵的概念[3]。2002年Costa等[4]學(xué)者發(fā)展出多尺度熵的概念,在此基礎(chǔ)上,鄭近德等[5]于2014年提出多尺度模糊熵(Multi-scale Fuzzy Entropy,MFE)的理論,用以分析不同尺度因子情況下時間序列的復(fù)雜程度。該算法現(xiàn)已成功應(yīng)用于機械故障診斷[6]、人體步態(tài)型號分類[7]等方面。但流域徑流易受人為因素干擾,若僅采用多尺度模糊熵進行分析會對其分析效果產(chǎn)生影響,因此,將數(shù)據(jù)預(yù)處理與多尺度模糊熵算法相結(jié)合,可在復(fù)雜性分析中大幅提升準(zhǔn)確程度與適用性。
2006年,F(xiàn)rei等人[8]提出了ITD法,該方法可將復(fù)雜信號分解為一系列不同頻率段的PR分量之和[9]。現(xiàn)已成功應(yīng)用于信號識別[10]、機械故障診斷[11,12]等方面的數(shù)據(jù)預(yù)處理中,但其較少應(yīng)用于水文序列復(fù)雜性測度中。本文構(gòu)建基于ITD耦合MFE的復(fù)雜性測度模型,分析哈爾濱主城區(qū)無資料子流域模擬徑流復(fù)雜性特征。
ITD將復(fù)雜信號分解為一個單調(diào)趨勢分量和一系列固有旋轉(zhuǎn)分量,結(jié)合簡單的單波分析即可分辨關(guān)鍵信息,省去了傳統(tǒng)方法中信號篩選和差值過程,是一種高效、精準(zhǔn)地復(fù)雜性測度方法[11]。
(1)計算信號Yt,(t為時間序列,t≥0),α為基線提取算子,將α作用于起始信號得:
Yt=αgYt+(1-α)gYt=Lt+Ht
(1)
式中:Lt=αX為基線信號,即為起始信號的低頻分量;Ht為起始信號的固有旋轉(zhuǎn)分量(PR)即為高頻分量。
(2)計算信號Yt的極值Yk(k=1,2,…,N,N是極值的個數(shù)),及對應(yīng)時間βk。
(2)
k=1,2,…,N-2
式中:0<ε<1,一般取,ε=0.5[13]。
(3)定義信號的分段線性基線提取算子如下[9]:
(3)
(4)將基線信號Lt作為起始信號,重復(fù)(1)~(3)的過程直至將起始信號分解為單調(diào)函數(shù)或常函數(shù)形式。
Yt=αYt+HYt=[H(1+ε)+Lα2]Yt=L=
(4)
式中:HαkYt是第k+1個合理旋轉(zhuǎn)分量;αpYt為殘余項或單調(diào)趨勢項。
(5)加和Yt分解后n個PR分量和一個單調(diào)或常函數(shù)。
(5)
上面計算結(jié)果表明,ITD方法通過對信號中任意相鄰的兩個極值點進行線性變化來對基線信號分段處理[14],使時間尺度待分解信息得到了極大的保留,提升計算精度,減少迭代次數(shù)[15]。進而得到更高的效率。
1.2.1 模糊熵的定義
(1)設(shè)取N點時間序列為{v(i):1≤i≤N},按順序重構(gòu)一組m維向量[16]
(6)
i=1,2,…,N-m+1
(7)
maxk∈{0,m-1}{|v(i+k)-v0(i)-[v(j+k)-v0(j)]|}
(8)
i,j=1~N-m,j≠i
(9)
(4)定義函數(shù)。
(10)
(5)類似地,按序列順序重構(gòu)一組m+1維矢量,定義函數(shù):
(11)
(6)定義模糊熵為:
FuzzyEn(m,n,r)=limN→[lnφm(n,r)-lnφm+1(n,r)]
(12)
當(dāng)N有限數(shù)時,按上述(1)~(7)得出長度為N時的上述表達式:
FuzzyEn(m,n,r,N)=lnφm(n,r)-lnφm+1(n,r)
(13)
模糊熵的物理性質(zhì)類似于樣本熵和近似熵,均可利用新模式產(chǎn)生的概率衡量復(fù)雜度。當(dāng)熵值越低時,說明新模式產(chǎn)生的概率越小,復(fù)雜程度就越低[17]。
1.2.2 多尺度模糊熵
多尺度模糊熵與多尺度熵計算方法相似[18]。計算方法如下:
(1)將原始序列N,給定嵌入維數(shù)m和相似容限r(nóng),在此基礎(chǔ)之上建立新的粗粒向量:
(14)
式中:τ是尺度因子,當(dāng)取值為1時,yj(1)表示原序列。
(2)建立粗粒序列后求出模糊熵,并得出尺度因子函數(shù)。多尺度模糊熵是時間序列在不同尺度因子下的模糊熵[16]。
根據(jù)多尺度模糊熵的定義可知在多尺度模糊熵計算中有許多相關(guān)參數(shù)需確定如:嵌入維數(shù)m、相似容限r(nóng)、模糊函數(shù)的梯度n、數(shù)據(jù)長度N和尺度因子τ[19]。
(1)嵌入維數(shù)m。m的取值決定信息的表現(xiàn)程度,其值越大,序列在進行重構(gòu)時信息越翔實。但m值過大會導(dǎo)致計算數(shù)據(jù)長度過長(N=10m~30m)[20],因此一般選取2~3,本文m取3。
(2)相似容限r(nóng)。表示模糊函數(shù)邊界的寬度。其值會影響信息的統(tǒng)計程度,過大會導(dǎo)致丟失信息,過小則會影響結(jié)果對噪聲的敏感性進而導(dǎo)致統(tǒng)計結(jié)果不理想[21]。因此一般取0.1~0.25SD(SD是原始數(shù)據(jù)的標(biāo)準(zhǔn)差)本文取r=0.15SD。
(3)模糊函數(shù)的梯度n,n的取值決定了r的梯度,其在計算模糊熵向量相似性的過程中起著權(quán)杖的作用[22]。n>1時,計入較近向量對其相似度的貢獻更多,如果過大會使信息喪失。n<1則會相反。一般取較小的整數(shù)值如2或3等,本文取2。
(4)數(shù)據(jù)長度N,本文取N=3600。
(5)尺度因子τ,為保障N/τ具有一定長度,使模糊熵值不受數(shù)據(jù)長度的影響,一般令τ的最大值大于10即可[23]。
綜上可得ITD-MFE算法流程圖如圖1所示。
圖1 基于ITD算法下的多尺度模糊熵復(fù)雜性分析Fig.1 Based on ITD and multiscale fuzzy entropy complexity analysis
哈爾濱市位于中國東北地區(qū),是黑龍江省的省會,是東北交通、政治、經(jīng)濟、文化、金融中心之一[24]。市轄區(qū)面積10 198 km2,是中國陸地管轄面積最大的省轄市。全市地形總體平坦,東南比西北略高,夏季短暫多雨、冬季漫長寒冷,屬溫帶大陸性季風(fēng)氣候。由于環(huán)境變化與高強度人類活動的影響,流域變化的誘因逐漸增多、復(fù)雜,開展流域復(fù)雜度分析,探究復(fù)雜度的影響因素,可為流域內(nèi)水資源管理、洪水預(yù)警、水污染防治等工作提供技術(shù)指導(dǎo)。本文選取范圍界定為哈爾濱市主城區(qū)內(nèi)的8個子流域,分別為運糧河流域、廟臺溝流域、東風(fēng)溝流域、肇蘭新河流域、馬家溝流域、何家溝流域、信義溝流域、懷家溝流域。如圖2所示,運用GIS技術(shù)生成哈爾濱主城區(qū)子流域概況圖。
圖2 哈爾濱主城區(qū)子流域概況Fig.2 Outline of the sub-basin of the main urban area of Harbin
從哈爾濱水務(wù)局收集到“哈爾濱市主城區(qū)城市化對流域水系與水文過程的影響研究”項目研究報告,從中提取運糧河等8個子流域1990-2010年的逐日模擬徑流量,進而整理得到各子流域逐月模擬徑流量。
2.3.1 ITD-MFE下子流域模擬徑流復(fù)雜性
為充分考慮哈爾濱主城區(qū)無資料子流域徑流復(fù)雜動態(tài)變化,采用多尺度模糊熵計算去趨勢后的哈爾濱市主城區(qū)無資料子流域內(nèi)各模擬徑流序列復(fù)雜度。首先粗?;叨纫蜃?τ=1,2,3,4,5,6,7,8,9,10)[25],進而確定粗?;蟾鲝搅餍蛄械哪:?,最終測度值即為不同尺度下模糊熵的和值。計算結(jié)果如表1所示。
哈爾濱市主城區(qū)8個子流域模擬徑流復(fù)雜度在1.511 4~1.650 9之間,運糧河流域出現(xiàn)最大值(1.650 9),肇蘭新河流域出現(xiàn)最小值(1.511 4),具有一定的空間差異。根據(jù)文獻[16]的劃分標(biāo)準(zhǔn),將復(fù)雜度劃分為3個等級,即Ⅰ級(1.65~1.57)、Ⅱ級(1.57~1.54)和Ⅲ級(1.54~1.51),等級越低,復(fù)雜程度越低。為詳細(xì)地展現(xiàn)復(fù)雜性的空間差異,結(jié)合表1結(jié)果與8個子流域地理位置,利用GIS技術(shù)繪制模擬徑流序列復(fù)雜性分布圖,如圖3所示。由圖3可知,各模擬徑流序列復(fù)雜性呈“南高北低”特點,與哈爾濱地勢規(guī)律相符。研究表明,復(fù)雜性越高預(yù)報風(fēng)險能力越低[26],因此南部地區(qū)風(fēng)險預(yù)告能力高于北部地區(qū)。哈爾濱市主城區(qū)南部地區(qū)由于受多種因素影響,影響因子之間存在相互作用,導(dǎo)致不確定性較大,其模擬徑流復(fù)雜性較高。北部地區(qū)影響因子相對較少,彼此之間影響比較薄弱,其模擬徑流復(fù)雜性相對較低。
表1 不同τ值下各月徑流序列的多尺度模糊熵值Tab.1 Multi-scale fuzzy entropy of monthly rain series under different τ values
圖3 各流域內(nèi)模擬徑流序列復(fù)雜性分布Fig.3 Distribution of complexity of simulated runoff sequences in data-free sub-basin of Harbin
2.3.2 子流域內(nèi)各模擬徑流序列復(fù)雜性
為了評估ITD-MFE算法性能,選取排列熵(Permutation entropy,PE)、小波熵(Wavelet entropy,WE)作為對比算法與ITD-MFE進行結(jié)果比較,結(jié)果如表2所示。由表2可見,各子流域模擬徑流量不同,各方法下熵值結(jié)果相差不大、熵值范圍不同很難判斷方法優(yōu)劣。因此引入噪聲來衡量各方法的穩(wěn)定性。
噪聲是水文勘測過程中,由于環(huán)境變化、方法錯誤、儀器操作偏差導(dǎo)致的一系列對真實值的干擾,是水文序列研究中高頻問題之一[27]。噪聲同樣也影響著復(fù)雜度的計算,為了檢驗ITD-MFE在噪聲下的穩(wěn)定性,分別在各分區(qū)模擬徑流序列中加入白噪聲和有色噪聲[28],計算加入噪聲前后復(fù)雜度之間的相關(guān)系數(shù)值,對比分析PE、WE、ITD-MFE在噪聲下的穩(wěn)定性。
表2 哈爾濱主城區(qū)無資料子流域徑流復(fù)雜性測度結(jié)果Tab.2 Measurement results of runoff complexity of data-free sub-basins in Harbin
表3 加入噪聲后各子流域模擬徑流序列的復(fù)雜度Tab.3 Results of complexity measurement after adding noise to sub-basin simulated runoff series
由表4可見,ITD-MFE算法加入白噪聲后復(fù)雜度與原序列復(fù)雜度的相關(guān)系數(shù)為0.800 7,加入有色噪聲后的相關(guān)系數(shù)為0.711 9,表明ITD-MFE算法能有效避免,信號篩選和數(shù)值差值過程,體現(xiàn)了在模擬徑流復(fù)雜性過程中優(yōu)越的抗噪性能。小波熵在白噪聲干擾時相關(guān)系數(shù)僅達到0.425 2,樣本熵相關(guān)系數(shù)為0.394 5。雖然它們的相關(guān)系數(shù)均低于ITD-MFE,但仍在可接受范圍內(nèi)。但是當(dāng)小波熵加入有色噪聲后其相關(guān)系數(shù)僅達到0.359 0,樣本熵相關(guān)系數(shù)為0.332 1。ITD-MFE的相關(guān)系數(shù)明顯高于另外兩種算法,說明ITD-MFE的穩(wěn)定性更強,因此該算法在計算復(fù)雜性時更具有優(yōu)勢,能更科學(xué)地分析不同尺度下時間序列的復(fù)雜性研究。
表4 加入噪聲后復(fù)雜性測度與原序列的相關(guān)系數(shù)Tab.4 Correlation coefficient between complexity measure and original sequence after adding noise
本文運用ITD-MFE方法,對哈爾濱主城區(qū)無資料子流域徑流復(fù)雜性變化進行分析。通過復(fù)雜性計算結(jié)果呈現(xiàn)出東高西低的走勢。對比加入白噪聲和有色噪聲后ITD-MFE、PE、WE的穩(wěn)定性發(fā)現(xiàn),ITD-MFE對復(fù)雜性計算更具優(yōu)勢。其結(jié)果能較好地反映哈爾濱市主城區(qū)無資料子流域測度,為分析水文序列復(fù)雜性提供了一種研究思路。
□