邵 佳
(安徽省交通航務(wù)工程有限公司,安徽 合肥 235200)
涇河是黃河二級(jí)支流,始于寧夏涇源六盤山,流域總面積為45 421 km2,是渭河最大的支流之一,占渭河流域面積的33.7%,河道全長(zhǎng)高達(dá)455.1 km。涇河流域?qū)儆跍貛Т箨憵夂?,降雨總量偏少,但過(guò)于集中。據(jù)初步統(tǒng)計(jì),流域在1951—2019 年之間年均降水量約為517.9 mm,多集中在7~9 月之間,涇河流域年均流量為16.25 億m3,集水面積約為43 216 km2。
涇河流域的張家山水文站上游河段,作為黃河水沙聯(lián)合典型流域,流經(jīng)黃土高原,具有河段比降明顯、河床沖刷嚴(yán)重、流速快、四周植被覆蓋率低等特點(diǎn)。參照張家山水文站監(jiān)測(cè)數(shù)據(jù),獲取張家山上游涇河流域近一年徑流量及輸沙量,分析其變化過(guò)程??紤]該流域汛期徑流量占比大,且輸沙量多的問(wèn)題,研究擇取汛期徑流量與輸沙量之和(6~10 月),作為水沙聯(lián)合分布模型數(shù)據(jù)依據(jù),流域水系如圖1 所示。
圖1 涇河流域水系圖
廣義極值分布、對(duì)數(shù)正態(tài)分布、P-Ⅲ分布、Gamma分布是水文分析中的常用概率分布類型。用上述4 種分布擬合張家山水文站徑流量與輸沙量邊緣分布,以AIC準(zhǔn)則選擇最優(yōu)的邊緣分布;基于Copula 函數(shù)建立水沙聯(lián)合分布模型,以AIC 準(zhǔn)則選擇最優(yōu)的聯(lián)合分布?;诖耍?jì)算徑流量與輸沙量的聯(lián)合“或”重現(xiàn)期下的“最大可能組合”聯(lián)合設(shè)計(jì)值,應(yīng)用蒙特卡洛方法評(píng)估樣本不確定性對(duì)水沙聯(lián)合設(shè)計(jì)值的影響,利用二維自適應(yīng)核密度估計(jì)方法計(jì)算該聯(lián)合設(shè)計(jì)值的置信區(qū)間;為進(jìn)一步分析該聯(lián)合設(shè)計(jì)值的不確定性隨重現(xiàn)期變化的關(guān)系,采用聯(lián)合熵量化不同重現(xiàn)期下該聯(lián)合設(shè)計(jì)值的不確定性。四種邊緣分布概率密度函數(shù)如下式:
式中:Γ(α)表示α 的伽瑪函數(shù);α 為形狀參數(shù);β 為尺度參數(shù);x0表示分布函數(shù)的位置未知參數(shù)。
式中:α 為形狀參數(shù);β 為尺度參數(shù);ξ 表示分布函數(shù)的位置參數(shù)。
式中:α 為形狀參數(shù),β 稱為尺度參數(shù)。
式中:μ 為函數(shù)的平均值;σ 為函數(shù)的標(biāo)準(zhǔn)差。
為便于研究,將X和Y設(shè)定為該流域年徑流量和年輸沙量,設(shè)計(jì)為x和y。參照上述四個(gè)密度函數(shù),邊緣分布值假設(shè)為Fx(x)和Fy(y)。根據(jù)條件分布定理,X和Y聯(lián)合分布函數(shù)可用平面Copula 函數(shù)C指代。由此可列出算式:
F(x,y)=Cθ(θ 為Copula 函數(shù)的參數(shù))(Fx(x),F(xiàn)y(y))
重現(xiàn)期是水工領(lǐng)域的概念,是評(píng)估流域量級(jí)的重要指標(biāo)。學(xué)術(shù)界將重現(xiàn)期分為“或”“且”和二次重現(xiàn)三種。限于篇幅,本文著重研究“或”重現(xiàn)期。
當(dāng)給定重現(xiàn)期T時(shí),臨界概率水平為p,求得值為唯一解,此方式被廣泛應(yīng)用水工建設(shè)。針對(duì)兩種變量,求解相對(duì)復(fù)雜。當(dāng)給定水沙聯(lián)合TOR時(shí),理論上包含數(shù)種流量和沙量組合方式,并且滿足二維坐標(biāo)標(biāo)準(zhǔn),可用等值線描述。水沙聯(lián)合等值線所有點(diǎn)位均可代表一種組合方式,并且取相同的TOR值。但是,為讓研究數(shù)據(jù)貼近實(shí)際,需找尋一組最大可能組合,即聯(lián)合概率密度函數(shù)取值最大時(shí)的設(shè)計(jì)值。
為測(cè)定張家山水文站上游涇河流域水沙聯(lián)合序列之間的關(guān)系,上文采用Kendall 秩的相關(guān)檢驗(yàn)法,將水文站監(jiān)測(cè)數(shù)據(jù)輸入水沙聯(lián)合分布模型,得出P值約為8.003×10-9。P值遠(yuǎn)小于0.05,因此原假設(shè)不成立,初步認(rèn)為該流域水沙聯(lián)合分布特征,在二維序列上具有顯著的相關(guān)性,有必要研究涇河流域水沙耦合關(guān)系,全面分析徑流量和泥沙量的內(nèi)在關(guān)聯(lián),健全水沙分布模型。
應(yīng)用上文四個(gè)密度函數(shù)測(cè)試流域邊緣分布參數(shù)值,徑流量分布密度函數(shù)及概率密度函數(shù)見圖2。
圖2 徑流量分布密度函數(shù)及概率密度函數(shù)
輸沙量分布密度函數(shù)及概率密度函數(shù)見圖3。
圖3 輸沙量分布密度函數(shù)及概率密度函數(shù)
參照上圖,采用K-S 檢驗(yàn)法對(duì)水沙聯(lián)合邊緣分布特征進(jìn)行假設(shè),擇取最優(yōu)邊緣分布數(shù)據(jù)。結(jié)果表明,該流域從預(yù)設(shè)的四種水沙聯(lián)合分布特征中的P值均大于0.05,與原假設(shè)設(shè)定相符,初步認(rèn)為該結(jié)論驗(yàn)證原假設(shè),意味著徑流量和輸沙量最優(yōu)擬合狀態(tài)均屬于正態(tài)分布趨勢(shì)。
本研究采用蒙特卡洛統(tǒng)計(jì)理論,分析分布特征計(jì)算的不確定性。抽調(diào)多例樣本,采用重復(fù)抽樣法,判斷不確定性對(duì)水沙聯(lián)合設(shè)計(jì)的影響。具體流程為:基于Copula函數(shù)聯(lián)合分布模型總體架構(gòu),調(diào)取二維樣本,用蒙特卡洛統(tǒng)計(jì)法隨機(jī)模擬1 000 次;應(yīng)用觀測(cè)值的水沙聯(lián)合分布模型相同估算參數(shù)方法,模擬樣本聯(lián)合分布模型,得到1 000 組數(shù)據(jù),評(píng)估置信水平下的估計(jì)區(qū)間;所有數(shù)據(jù)中,以20 a 為重現(xiàn)期起始點(diǎn),按照10 a 一梯度上升到100 a,判斷最大可能組合的水沙聯(lián)合設(shè)計(jì)值。
信息熵可描述隨機(jī)變量的分散程度,是信息最為基本的組成單位。常規(guī)條件下,信息熵可針對(duì)一維數(shù)據(jù),也可應(yīng)對(duì)多維情況,將測(cè)的數(shù)據(jù)定義為聯(lián)合信息熵。由于信息熵可作為判斷變量的重要依據(jù),可認(rèn)為信息熵越大隨機(jī)變量的分散程度越大,也就是不確定性越明顯。
測(cè)驗(yàn)過(guò)程中,需解決識(shí)別問(wèn)題。從本質(zhì)上講,不確定性理論發(fā)展迭代了傳統(tǒng)優(yōu)參識(shí)別系統(tǒng)。為尋得最有可靠模型參數(shù),不確定思想在統(tǒng)計(jì)學(xué)基礎(chǔ)上可通過(guò)大量參數(shù)分布獲取更具現(xiàn)實(shí)意義的結(jié)論。采用蒙特卡洛統(tǒng)計(jì)法研究不確定性,獲取模型參數(shù)置信水平下的參考范圍,為理解水沙聯(lián)合模型提供了技術(shù)支撐。
根據(jù)表1,張家山站水沙聯(lián)合分布模型存在明顯的不確定性,聯(lián)合分布參數(shù)變幅高達(dá)55.64%。據(jù)此繪制“或”重現(xiàn)期等值線圖(見圖4),根據(jù)圖中克制,涇河流域水沙聯(lián)合分布模型給出不同程度徑流量和輸沙量遭遇組合的重現(xiàn)期。工程中多選用“或”重現(xiàn)期作為風(fēng)險(xiǎn)控制參量,或安全評(píng)價(jià)標(biāo)準(zhǔn)。通過(guò)計(jì)算泥沙頻率和洪水頻率組合,確定流域不同時(shí)段的最大或最小淤積量。水沙聯(lián)合重現(xiàn)期與設(shè)計(jì)值是否準(zhǔn)確決定著流域工程是否經(jīng)濟(jì)、安全且科學(xué),既關(guān)乎周邊生態(tài),還關(guān)乎工程社會(huì)效益。設(shè)計(jì)過(guò)程中需合理評(píng)估設(shè)計(jì)標(biāo)準(zhǔn),降低誤差值,求解最優(yōu)解,為工程合理建設(shè)提供參考。
表1 水沙聯(lián)合分布模型參數(shù)估計(jì)區(qū)間
圖4 等值線圖
針對(duì)信息熵,可將其作為評(píng)價(jià)不確定性的指標(biāo),信息熵與不確定呈正相關(guān)關(guān)系。張家山站聯(lián)合設(shè)計(jì)值存在明顯的不確定性,在重現(xiàn)期影響下,聯(lián)合熵呈現(xiàn)明顯增加的趨勢(shì)(需要重現(xiàn)表述),意味著聯(lián)合設(shè)計(jì)值具有顯著的不可控性。
考慮到?jīng)芎恿饔蛩亮魇?yán)重的問(wèn)題,建立了水沙聯(lián)合分布模型,對(duì)水沙組合潛在風(fēng)險(xiǎn)進(jìn)行評(píng)估,從中尋求最優(yōu)解。隨后基于蒙特卡洛方法對(duì)分布模型的不確定性進(jìn)行評(píng)估,計(jì)算百年內(nèi)重現(xiàn)期的最大可能組合下的最優(yōu)設(shè)計(jì)值,并分析其信息熵。結(jié)果表明,涇河流域水沙聯(lián)合分布模型及水沙聯(lián)合設(shè)計(jì)值存在高度不確定性(需要重現(xiàn)表述),意味著涇河流域設(shè)計(jì)值面臨巨大挑戰(zhàn),在重現(xiàn)期年限增長(zhǎng)的同時(shí),設(shè)計(jì)值不確定性將進(jìn)一步提升,將對(duì)水工建設(shè)提出更高的要求。