何 露,王士軍, ,谷艷昌, ,龐 瓊, ,吳云星,
(1.南京水利科學(xué)研究院,江蘇 南京 210029;2.水利部大壩安全管理中心,江蘇 南京 210029)
我國現(xiàn)有水庫大壩98 002 座,其中90%以上為土石壩。據(jù)《全國水庫垮壩登記冊》資料顯示,自1954 年以來,我國土石壩潰決數(shù)量占所有壩型潰壩數(shù)量的98%以上。土石壩潰壩原因包括漫頂、滲透破壞、基礎(chǔ)抗剪強(qiáng)度不足等。其中,滲流破壞導(dǎo)致的事故占37.1%。壩體滲壓水位是評價(jià)土石壩滲流特性的重要物理量[1-5],土石壩壩體滲壓水位極值預(yù)測,是監(jiān)控與判斷土石壩滲流安全的主要途徑之一。
國內(nèi)外對土石壩滲壓水位極值的預(yù)測開展了一系列研究,為早期識別大壩隱患,基于實(shí)測資料分析的預(yù)測方法準(zhǔn)確度不斷提高。目前用于該極值預(yù)測的方法主要有線性回歸法、神經(jīng)網(wǎng)絡(luò)法和其他機(jī)器學(xué)習(xí)算法等[6]。此類方法共同的特點(diǎn)是,使用時(shí)需給出正確的自變量。當(dāng)滲流水位極值與上游水位相關(guān)性不明確時(shí),此類方法的預(yù)測精度將難以保證。混沌理論的特點(diǎn)是可對時(shí)間序列進(jìn)行相空間重構(gòu),本文引入混沌理論用于建立無自變量的預(yù)測模型,開展基于混沌理論和隨機(jī)過程的土石壩滲壓水位極值無自變量預(yù)測模型研究,為自變量不明確的測值序列提供預(yù)測方法。
土石壩滲壓水位的變化具有以下特點(diǎn):(1)土顆??紫端畨毫Φ南⒒蚍e聚都是漸進(jìn)的過程,壩內(nèi)滲壓水位的變化相較上、下游水位都有一定的滯后性;(2)筑壩土石料或地質(zhì)條件的非均一性及滲流機(jī)理的復(fù)雜性,滲壓水位與上、下游水位間關(guān)系為非線性;(3)壩體材料、上游泥沙淤積情況和邊界條件都有變異性,滲流場系統(tǒng)持續(xù)變化,可能具有混沌性。混沌性是指土石壩滲流系統(tǒng)具有內(nèi)在隨機(jī)性,原因是系統(tǒng)中各影響要素的相互作用,各要素間并不完全相互獨(dú)立。上、下游水位,泥沙淤積情況,筑壩材料,地質(zhì)情況可能導(dǎo)致不同的滲壓水位變化趨勢?;煦缧詫Τ跏紬l件具有敏感依賴性,影響因素的細(xì)微變化,會導(dǎo)致系統(tǒng)結(jié)果以指數(shù)倍變化,這樣的變化方式是貌似無序性,實(shí)則有序性的體現(xiàn)。
基于實(shí)測資料,對土石壩滲壓水位極值進(jìn)行預(yù)測,首先要對水位序列的特征進(jìn)行判斷。當(dāng)要使用混沌理論對水位序列進(jìn)行預(yù)測時(shí),需對序列的混沌特性進(jìn)行鑒別。當(dāng)要使用隨機(jī)過程評估預(yù)測模型誤差時(shí),也需對誤差序列的隨機(jī)特性進(jìn)行檢驗(yàn)。
如上文所述,混沌性是無序與有序相交融[6-7],其無序性在于系統(tǒng)局部不穩(wěn)定性。不穩(wěn)定的局部系統(tǒng)軌道在空間中無數(shù)次交疊,形成了奇怪吸引子,幾何姿態(tài)奇特。奇怪吸引子的真實(shí)維數(shù)很難知曉,因此,為研究混沌時(shí)間序列,需對該序列的相空間進(jìn)行重構(gòu)。其有序性在于,混沌系統(tǒng)軌道的變化速度可以用特征值來衡量[8-10],比如Lyapunov 指數(shù)等[11]??衫孟到y(tǒng)的有序性,對滲壓水位的變化進(jìn)行預(yù)測。
要分析滲壓水位這一混沌時(shí)間序列,相空間重構(gòu)是基礎(chǔ)。重構(gòu)相空間所需的參數(shù)是時(shí)延 τ和嵌入維m,其確定方法主要分為兩類:一類將 τ和m看作互不影響的物理量,分別選取,此類方法有自相關(guān)法、假近鄰法等;另一類認(rèn)為 τ和m不應(yīng)相互獨(dú)立,而是相互關(guān)聯(lián),此類方法有嵌入窗法、C-C 法等。本文使用C-C 法進(jìn)行相空間重構(gòu)。
為衡量滲流系統(tǒng)的動(dòng)力學(xué)特性,要對系統(tǒng)的特征量進(jìn)行研究。Lyapunov 指數(shù)是混沌系統(tǒng)的特征量之一[11-12],準(zhǔn)確求得Lyapunov 指數(shù)是研究系統(tǒng)性質(zhì)和對系統(tǒng)進(jìn)行預(yù)測的關(guān)鍵。Lyapunov 指數(shù)是描述系統(tǒng)軌道分離或靠近的物理量。當(dāng)時(shí)間序列有限且包含噪聲,只需求最大Lyapunov 指數(shù)時(shí),優(yōu)選小數(shù)據(jù)量法。Grebegi 證明只要最大的Lyapunov 指數(shù)大于零,就可以肯定混沌的存在。根據(jù)該指數(shù),可對混沌序列進(jìn)行預(yù)測[13]。預(yù)測要建立合適的相空間,因預(yù)測時(shí)間T和延遲時(shí)間 τ屬于同量級,與滲流序列時(shí)間長度相比,T和τ都很小,所以有空間近鄰等距假設(shè)。對于時(shí)間序列{x(ti)}(i=1,2,···,m),在預(yù)測步長T≤τ時(shí),X(tm+T)的s維分量中,只有x(tm+T)是未知的,則預(yù)測式為
式中:s為向量維度,只有一個(gè)未知量x(tm+T),即為預(yù)測值。
土石壩滲壓水位預(yù)測模型誤差序列的隨機(jī)性,是有序性系統(tǒng)中的不規(guī)則變化,此類誤差的特點(diǎn)是將來誤差值不受過去誤差值的影響[13-14],無內(nèi)在系統(tǒng)性。此特征與隨機(jī)過程中馬爾可夫過程的核心特征相吻合[15-16],所以本文選用馬爾可夫過程對該模型的隨機(jī)性進(jìn)行模擬和預(yù)測。馬爾可夫過程中,時(shí)間與狀態(tài)皆為離散集的稱為馬氏鏈。使用馬氏鏈前需鑒別序列馬氏性。
一步轉(zhuǎn)移的齊次馬氏鏈應(yīng)用最為廣泛,指標(biāo)序列各狀態(tài)間轉(zhuǎn)移概率是必需參數(shù),其具體數(shù)值通常根據(jù)實(shí)測資料估計(jì)得出。設(shè)可討論的馬爾可夫指標(biāo)值序列X1,X2,···,Xn,有m種可能狀態(tài),記為E={1,2,···,m},fij表示從狀態(tài)a經(jīng)過一步轉(zhuǎn)移到狀態(tài)b的頻數(shù),一步的步長可以是1,2,···,m個(gè)時(shí)間單位。由fij組成的矩陣稱為轉(zhuǎn)移頻數(shù)矩陣。轉(zhuǎn)移頻率由轉(zhuǎn)移頻數(shù)矩陣計(jì)算得出,即將i行j列元素除以該行各元素之和。
對隨機(jī)序列進(jìn)行馬氏性檢驗(yàn),是利用馬氏鏈模型分析和解決問題的必要前提。對離散序列的馬氏鏈,可用統(tǒng)計(jì)量 χ2來檢驗(yàn)其馬氏性。統(tǒng)計(jì)量 χ2服從自由度為(m?1)2的χ2分布。給定顯著性水平α,查卡方檢驗(yàn)臨界值表,即可檢驗(yàn)序列馬氏性。
設(shè)馬氏鏈的狀態(tài)空間為E,Pij(n)是n步轉(zhuǎn){移概率},若對一切i,j∈E,存在不依賴于i的常數(shù) πj,使得,則稱此馬氏鏈具有遍歷性,式中為此鏈的平穩(wěn)分布。
存在定理:E含義同上,如果存在正整數(shù)n0,使對一切i,j∈E都有Pij(n0)非負(fù),則此馬氏鏈?zhǔn)潜闅v的,且求得的{}是唯一解??衫闷椒€(wěn)分布評價(jià)預(yù)測模型的誤差序列。
基于上述論述,建立基于混沌理論和隨機(jī)過程的土石壩滲壓水位極值無自變量預(yù)測模型的方法如下:
(1)利用C-C 法求得時(shí)延和嵌入維,重構(gòu)測值序列的相空間。
(2)計(jì)算測值序列空間的最大Lyapunov 指數(shù),若該指數(shù)為正值,則可判斷測值序列為混沌序列,可基于混沌理論進(jìn)行預(yù)測。
(3)利用求得的最大Lyapunov 指數(shù),根據(jù)預(yù)測式(1)進(jìn)行預(yù)測。
(5)按上述分級指標(biāo),對資料序列中的各指標(biāo)劃分狀態(tài),然后對狀態(tài)、步長、轉(zhuǎn)移概率進(jìn)行統(tǒng)計(jì),得到馬氏鏈轉(zhuǎn)移概率矩陣。
(6)對序列進(jìn)行馬氏性檢驗(yàn),基于序列的一步轉(zhuǎn)移頻數(shù)矩陣、一步轉(zhuǎn)移頻率矩陣計(jì)算統(tǒng)計(jì)量χ2值,計(jì)算式為
(7)分析該馬氏鏈的遍歷性、平穩(wěn)分布,評價(jià)預(yù)測模型。
選取某土石壩下游坡測點(diǎn)B的測值序列為算例,開展基于滲壓水位實(shí)測資料的極值預(yù)測分析,測點(diǎn)B位置見圖1。測值數(shù)據(jù)序列起止時(shí)間分別為2003 年10 月、2009 年10 月。選出時(shí)間序列中測值的每月極大值,組成72 個(gè)極大值的時(shí)間序列。將該時(shí)間序列分為2003 年10 月至2008 年4 月、2008 年5 月至2009 年10 月兩段,前一段測值序列用于建立預(yù)測模型,后一段用于檢驗(yàn)預(yù)測模型。
圖1 測點(diǎn)位置(單位:m)Fig.1 Location map of measuring points (unit:m)
3.1.1 線性回歸預(yù)測模型 土石壩滲壓水位極值的最主要影響因素是上游水位,且上游水位對滲壓水位測值的影響有滯后性,所以選擇與滲壓水位相對應(yīng)的當(dāng)日上游水位和前一周平均上游水位作為自變量x1,x2,滲壓水位測值作為因變量y,建立線性回歸方程如式(3),回歸系數(shù)為0.26,表明該模型擬合效果欠佳,預(yù)測效果較差。原因可能是線性回歸模型無法模擬因變量與自變量間的非線性關(guān)系,或是因變量與自變量相關(guān)性不明顯。
3.1.2 神經(jīng)網(wǎng)絡(luò)預(yù)測模型 選擇與上文相同的自變量和因變量,利用BP 神經(jīng)網(wǎng)絡(luò)建立滲壓水位序列的非線性預(yù)測模型?;貧w系數(shù)為0.57,BP 網(wǎng)絡(luò)擬合值與實(shí)測值的對比見圖2。由圖2 可見,該網(wǎng)絡(luò)預(yù)測效果欠佳。較低的回歸系數(shù)表明自變量對因變量的影響較小,因變量與自變量間的相關(guān)性不明顯,這是該模型預(yù)測精度低的可能原因。因此,下面建立無自變量的預(yù)測模型,以證實(shí)該可能原因。
圖2 BP 網(wǎng)絡(luò)預(yù)測值與實(shí)測值的對比Fig.2 Comparison between predicted value and measured value of BP network
3.1.3 基于混沌理論的預(yù)測模型 利用混沌理論建立滲壓水位序列的預(yù)測模型,首先用C-C 法計(jì)算重構(gòu)相空間的時(shí)延τ和嵌入維m。圖3 中選取S(t)的第1 個(gè)局部極小點(diǎn)即為τ,τ為4。C(t)的全局最小點(diǎn)即為嵌入窗,根據(jù)嵌入窗與嵌入維的關(guān)系計(jì)算可得,嵌入維m為2。
圖3 C-C 法重構(gòu)相空間參數(shù)確定Fig.3 Parameter determination of phase space reconstruction by C-C method
根據(jù)時(shí)延、嵌入維構(gòu)造滲壓水位序列的相空間,該重構(gòu)相空間即為預(yù)測空間。計(jì)算該時(shí)間序列的最大Lyapunov 指數(shù),值為0.934 8。最大Lyapunov 指數(shù)大于0,可以肯定該時(shí)間序列為混沌時(shí)間序列。利用式(1)對2008 年5 月至2009 年10 月的滲壓水位進(jìn)行預(yù)測(預(yù)測時(shí)間小于時(shí)延),滲壓水位預(yù)測結(jié)果見圖4。混沌模型與神經(jīng)網(wǎng)絡(luò)模型的絕對誤差對比見表1。
圖4 混沌模型預(yù)測值與實(shí)測值的對比Fig.4 Comparison between predicted value and measured value of chaos model
由圖4 可見,基于混沌理論的預(yù)測模型的規(guī)律更接近實(shí)測值規(guī)律,顯著優(yōu)于前文兩模型。由表1 絕對誤差的對比可知,混沌模型的最大絕對誤差為2.24 m,神經(jīng)網(wǎng)絡(luò)模型和多元回歸模型的最大絕對誤差分別為3.52 m、3.21 m,最大誤差顯著降低。數(shù)據(jù)對比證實(shí)了因變量與自變量間的相關(guān)性不明顯是模型預(yù)測精度的原因之一。解決這種原因?qū)е碌念A(yù)測精度欠佳,本文提出的無自變量預(yù)測模型有其優(yōu)越性。
分析基于混沌理論的預(yù)測模型的誤差序列,將實(shí)測值與混沌模型預(yù)測值作差,所得18 個(gè)差值如表1所示。
3.2.1 狀態(tài)分類 18 個(gè)相對誤差的均值為1.50%,均方差為4.80%,按照前文所述方法,α2,α3分別取0.3、0.6,區(qū)間及狀態(tài)的對應(yīng)關(guān)系見表2。
3.2.2 馬氏性檢驗(yàn) 按表2 所建立的分級指標(biāo),資料序列中各月相對誤差所對應(yīng)的狀態(tài)如表1 中最后一欄所示。根據(jù)表1 提供的資料,可對18 個(gè)月的相對誤差序列作馬氏性檢驗(yàn)。可算得步長為1 的一步轉(zhuǎn)移頻數(shù)矩陣和頻率矩陣如下:
表1 模型誤差序列及其狀態(tài)Tab.1 Errors of sequence and their states
表2 相對誤差分級Tab.2 Relative error classification table
根據(jù)fij、pij值計(jì)算可得:統(tǒng)計(jì)量 χ2的值為9.88。給定顯著性水平α=0.05,查卡方檢驗(yàn)臨界值表可得分位點(diǎn),故相對誤差序列滿足馬氏性。
3.2.3 平穩(wěn)分布與各狀態(tài)重現(xiàn)期 以2008 年5 月至2009 年10 月的相對誤差序列中,相依性較強(qiáng)的步長為1 的馬氏鏈為例分析可知,此鏈的狀態(tài)互通,且是非周期的,其全部3 個(gè)狀態(tài)構(gòu)成一個(gè)閉集,狀態(tài)空間無真子閉集,故此鏈為不可約正常反鏈,是遍歷的。因此,此鏈存在唯一的平穩(wěn)分布。依照步長為1 的轉(zhuǎn)移概率矩陣,可得到平穩(wěn)分布與各狀態(tài)的重現(xiàn)期。
狀態(tài)Ⅰ、Ⅱ、Ⅲ的重現(xiàn)期分別是98.7、66.0 和123.9 d。由此可見,狀態(tài)Ⅱ出現(xiàn)的機(jī)會最多,狀態(tài)Ⅲ出現(xiàn)的可能性最小,狀態(tài)Ⅰ出現(xiàn)的機(jī)會較大。結(jié)合3 種狀態(tài)的分類標(biāo)準(zhǔn)可說明,混沌理論預(yù)測模型的相對誤差主要出現(xiàn)在[0.06%,4.37%],次之出現(xiàn)在[?6.66%,0.06%],較少出現(xiàn)在[4.37%,13.39%]。據(jù)此可評價(jià):混沌理論預(yù)測模型的精度較好。
(1)當(dāng)滲壓水位極值序列與上游水位序列相關(guān)性弱時(shí),線性回歸模型和神經(jīng)網(wǎng)絡(luò)模型這兩種常規(guī)預(yù)測方法的擬合及預(yù)測效果欠佳,提出一種僅考慮測值序列、不考慮自變量的滲壓水位極值預(yù)測方法,提高了預(yù)測精度。
(2)本文建立的基于混沌理論的無自變量預(yù)測模型,因僅有極值序列而無法使用復(fù)相關(guān)系數(shù)、回歸系數(shù)等常規(guī)評價(jià)手段對模型進(jìn)行評價(jià)。為解決該問題,提出基于隨機(jī)過程評價(jià)預(yù)測模型的誤差序列,評價(jià)結(jié)果合理,為無自變量的預(yù)測模型提供一種新的評價(jià)方法。
(3)實(shí)踐表明,基于混沌理論的預(yù)測方法,及基于隨機(jī)過程的相應(yīng)評價(jià)方法相結(jié)合,可形成精度較高、實(shí)用性強(qiáng)的無自變量預(yù)測方法,彌補(bǔ)常規(guī)預(yù)測方法的弱預(yù)測能力區(qū)域,為自變量不明確的土石壩滲流極值序列提供了一種可靠的建模方法。