張代青,于國榮
(昆明理工大學電力工程學院, 云南 昆明 650500)
?
河川徑流情勢主成分分析
張代青,于國榮
(昆明理工大學電力工程學院, 云南 昆明650500)
摘要:為了獲得正確、可靠的河川徑流情勢,有效開發(fā)利用河流水能資源,以撫河流域為案例,分析了撫河12個水文站的日均流量、最小日平均流量、最大(小)月平均流量、基流指數(shù)、小于或等于年均流量5%的持續(xù)天數(shù)、大于或等于90 d的日均流量、日均流量標準偏差、年均流量變異系數(shù)等10個變量的徑流樣本主成分,計算了主成分的貢獻率、累計貢獻率、得分和樣本綜合得分,評價了撫河干支流徑流情勢。結(jié)果表明:第一主成分反映河川徑流的閾值變幅、離散程度和對稱狀況,第二主成分反映河川徑流的基流指數(shù)和變異系數(shù),這2個主成分的貢獻率依次降低。這些研究成果旨在為河流管理部門了解不同干支流河川徑流情勢、規(guī)劃流域水能資源開發(fā)方案和維持河流良好水環(huán)境等提供技術支持和可靠的數(shù)據(jù)支撐。
關鍵詞:主成分分析; 徑流情勢; 撫河流域
河川徑流是流域水循環(huán)的基本環(huán)節(jié),是可供人類長期開發(fā)利用的淡水資源[1]。為了合理開發(fā)和高效利用河川徑流,在工程規(guī)劃、設計、管理和科研階段,需要進行河川徑流計算,以量化河川徑流情勢,為確定工程設計規(guī)模、確保工程順利施工、維護工程運行安全、獲取工程運營效益和保護流域生態(tài)環(huán)境等,提供設計或?qū)嶋H代表年徑流過程等徑流數(shù)據(jù)。對于長期實測徑流資料,可直接采用長系列操作法、設計代表年法和實際代表年法等計算設計年徑流及其年內(nèi)分配過程;對于短期實測徑流資料甚至缺乏徑流資料,采用參數(shù)等值線圖法、水文比擬法和經(jīng)驗公式法等間接推求設計年徑流及其年內(nèi)分配過程[2]。但在實際應用中,往往由于許多中小型流域干支流的設計代表站或者可參證站只有斷斷續(xù)續(xù)的幾年實測徑流資料甚至根本沒有資料,導致采用參數(shù)等值線圖法、水文比擬法和經(jīng)驗公式法預估河川徑流情勢精度太低,或者根本無法預估河川徑流情勢,這將直接影響中小型流域的水資源開發(fā)和利用。為了解決這類實際問題,筆者嘗試探討一種理論技術方法,旨在從宏觀角度分析計算和綜合評價河川徑流情勢。
所謂河川徑流,是指匯集地表和地下而進入河道的水流,包括地表徑流和地下徑流。河川徑流情勢是指河川徑流各水文要素隨時間、空間的變化情況,其水文要素包括水位、流速和流量等,變化情況包括河川徑流的年際變化、年內(nèi)分配、洪水和枯水過程。根據(jù)我國河流豐、平、枯水期的徑流變化特征及國外研究成果[3],影響河川年均徑流情勢的主要因素包括年均日流量、年最大(小)日流量、年均日流量與流域面積之比、年最大(小)月平均流量、基流指數(shù)、基流分布指數(shù)、流域面積、河網(wǎng)密度、小于或等于年均流量5%的天數(shù)、小于或等于年均流量5%的最長持續(xù)天數(shù)、大于或等于90 d的日流量、年均日流量的標準偏差、年均流量的變異系數(shù)、缺水量、最大供水率、地表開發(fā)利用率等42個指標,詳見參考文獻[3]。
主成分分析法(principal components analysis,PCA)[4]是利用降維思想簡化數(shù)據(jù)集的經(jīng)典統(tǒng)計技術方法,該方法通過保留數(shù)據(jù)集的低階主成分,忽略高階主成分的方式,將數(shù)據(jù)集的最重要方面保留在低階成分中,以達到減少數(shù)據(jù)集維數(shù),同時保持數(shù)據(jù)集中對方差貢獻最大特征的目的。實際應用中,發(fā)現(xiàn)其中許多指標具有交叉重疊現(xiàn)象,意味著可能只需應用幾個能反映徑流情勢綜合信息的新自變量即可解決問題,因此可以嘗試應用主成分分析法來分析計算和綜合評價河川徑流情勢。目前,主成分分析法已廣泛應用于許多領域的數(shù)據(jù)分析及模型建立的綜合評價中[5-10],取得的研究成果證明了該方法具有很好的應用前景?;谝陨涎芯勘尘?筆者在介紹主成分分析法的基礎上,嘗試應用主成分分析法計算和綜合評價河川徑流情勢,旨在為解決這類傳統(tǒng)的水文分析及水文計算問題尋找一種簡單明了的新途徑。
1.1基本原理
主成分分析法由卡爾·皮爾遜[11]于1901年提出,也稱主分量分析法,是一種利用降維技術減少變量個數(shù)的統(tǒng)計分析方法,通常是將涉及太多變量的問題轉(zhuǎn)化為少數(shù)幾個綜合變量的問題,從而降低分析問題的復雜性和減少統(tǒng)計分析的工作量。其基本原理可表述如下:
假定有n個樣本,每個樣本共有p個變量,構成一個n×p階的數(shù)據(jù)矩陣X為
(1)
當p較大時,在p維空間中分析問題較復雜。為了減少問題的復雜性,利用降維技術以較少的幾個綜合變量代替原來較多的p個變量,并且使這些較少的幾個綜合變量既能盡量多地反映原來較多變量所反映的信息,又彼此相互獨立。為此可給出定義:對n個樣本中的任一樣本,記(x1,x2,…,xp)為原變量,(y1,y2,…,ym)(m≤p)為新變量,且原變量與新變量有下列函數(shù)關系:
(2)
式中,系數(shù)zij(i=1,2,…,m;j=1,2,…,p)稱為新變量(y1,y2,…,ym)上的載荷,其確定原則為:①yi與yj(i≠j;i,j=1,2,…,m)相互無關;②y1為x1,x2,…,xp的一切線性組合中方差最大者,y2為與y1不相關的x1,x2,…,xp的所有線性組合中方差最大者,依此類推,ym為與y1,y2,…,ym-1都不相關的x1,x2,…,xp的所有線性組合中方差最大者。新變量(y1,y2,…,ym)分別稱為原變量(x1,x2,…,xp)的第一,第二,…,第m主成分。
從以上分析可知,主成分分析的實質(zhì)是確定原來變量xj(j=1,2,…,p)在m個主成分yi(i=1,2,…,m)上的載荷zij,且載荷zij分別是相關矩陣X的m個較大的特征值所對應的特征向量,這可從數(shù)學上得到證明。
1.2計算步驟
根據(jù)主成分分析法的基本原理,利用計算機語言編程或者應用SPSS軟件可實現(xiàn)主成分分析。計算步驟如下:
步驟1:計算相關系數(shù)矩陣
首先計算相關系數(shù)矩陣R,由原變量xi(i=1,2,…,p)與xj(j=1,2,…,p)兩向量之間的相關系數(shù)rij(i,j=1,2,…,p)組成,rij的計算公式為
(3)
根據(jù)式(3)及兩變量之間的相關系數(shù)的關系,顯然有rij=rji,計算的相關系數(shù)rij即得相關系數(shù)矩陣R為
(4)
步驟2:計算特征值與特征向量
步驟3:計算貢獻率及累計貢獻率
主成分貢獻率ei是指主成分的方差占總方差的比率,反映了原來p個變量有多大的信息和多大的綜合能力,也表示了各主成分的相對重要性。主成分的貢獻率可用特征值的相對比率來計算,計算公式為
(5)
(6)
在實際應用中,應該提取主成分的個數(shù)、主成分的累計貢獻率的取值一般遵守各主成分對應的特征值大于1且主成分累計貢獻率大于或等于85%的提取原則,最常見的情況是主成分提取個數(shù)為2~4個。
步驟4:計算主成分載荷及樣本得分
主成分載荷是反映主成分yi(i=1,2,…,m)與原變量xj(j=1,2,…,p)之間相互關聯(lián)程度的系數(shù),實際是指式(2)中的zij,計算公式為
(7)
首先計算n個樣本中各主成分yi(i=1,2,…,m)的得分,主成分得分Fij(i=1,2,…,n;j=1,2,…,p)等于其載荷與原變量xj(j=1,2,…,p)中心化后的值的乘積之和;然后根據(jù)計算的各主成分得分Fij計算各樣本的綜合得分Fi(i=1,2,…,n),Fi為每個主成分得分與其對應的方差貢獻率的乘積之和,通過比較各樣本綜合得分的大小,可對各樣本進行排序和主次地位評價。Fi的計算公式為
(8)
撫河是江西省第二大河,是鄱陽湖水系的主要河流之一,是撫州地區(qū)的生命河。撫河流域(115°30′E~117°10′E,26°30′N~28°37′N)位于江西省東部,南北長240 km,東西平均寬70 km,流域面積15 811 km2。該流域由干流和8條主要支流組成,干流全長348 km,水系分布及站點位置見圖1。
圖1 撫河流域水系分布
撫河流域水資源較豐富,但隨著流域經(jīng)濟的快速發(fā)展、人口的急劇增加和人類活動的日益加劇,生命、生活、生態(tài)和生產(chǎn)需水之間沖突日益尖銳。為緩解這些沖突,江西省已開展一些水量分配研究[12-14],為了有效實施各種水量分配方案,應該首先了解和熟悉該流域的干支流徑流情勢,否則,水量分配方案將成為“巧婦難為無米之炊”。根據(jù)撫河干支流的相關實測數(shù)據(jù),應用主成分分析法探討其河川徑流情勢。
表1 撫河流域干支流12個水文站對應的10個指標的標準化矩陣
表2 相關系數(shù)矩陣
表3 特征值
表4 特征向量
2.1資料預處理
選取撫河流域干支流12個水文站10年的日平均實測流量、集水面積等數(shù)據(jù)為分析資料,求出各水文站的日平均流量(x1)、最小日平均流量(x2)、日平均流量/集水面積(x3)、最小月平均流量/年平均流量(x4)、最大月平均流量(x5)、最小月平均流量(x6)、大于或等于90 d的日平均流量(x7)、小于或等于年均流量5%的最長持續(xù)天數(shù)(x8)、日平均流量的標準偏差(x9)、年平均流量的變異系數(shù)(x10)等引言中提出的42個指標,應用主成分分析法初步識別其主成分,按照其重要性程度擬定10個指標,利用Matlab程序?qū)崿F(xiàn)主成分分析,10個指標的標準化矩陣見表1。
2.2主成分分析
根據(jù)公式(4)~(6),計算相關系數(shù)矩陣見表2,求解相關系數(shù)矩陣構成的特征方程得特征值和特征向量見表3~4,計算主成分貢獻率及累計貢獻率見表5。
由表5可知,第一、第二主成分的累計貢獻率已高達87.32%,故只需求出第一、第二主成分y1、y2即可。根據(jù)計算的特征值λ1、λ2及對應的特征向量α1、α2,應用式(7)~(8)計算主成分y1、y2的載荷見表6,計算樣本綜合得分見表7。
表6 第一、二主成分載荷計算結(jié)果
表7 主成分及樣本綜合得分與排序
2.3結(jié)果與分析
根據(jù)表5~7,以上主成分分析結(jié)果如下:
a. 撫河流域干支流徑流的10個指標反映的信息,基本上可用2個主成分代替。這是因為第一主成分(y1)包含的信息量約占61.91%,第二主成分(y2)包含的信息量約占25.41%,兩個主成分包含的信息量約占87.32%,已超過主成分分析法公認采用的85%。
b. 第一主成分與x1、x2、x5、x6、x7、x9呈現(xiàn)出較強的負相關,與x3、x4、x10呈現(xiàn)出較弱的正相關,與x8呈現(xiàn)出最弱的正相關,說明第一主成分是河川徑流閾值變幅、離散和對稱狀況的綜合體現(xiàn)。從第一主成分的得分及其排序來看,排在前5位的都是支流,且先后順序依次為雙田、新斜、黎川、馬口和蕪頭。這表明,這5條支流的徑流情勢變化比較劇烈,即在最小供水量、供水保證率、供水持續(xù)時間等方面表現(xiàn)為比較不穩(wěn)定,其中雙田水文站所在支流最不穩(wěn)定。
c. 第二主成分與x8、x10呈現(xiàn)出較強的正相關,與x3、x4呈現(xiàn)出較強的負相關,與x1、x2、x5、x6、x7、x9呈現(xiàn)出很弱的負相關,說明第二主成分主要反映了該流域干支流徑流的基流指數(shù)和變異系數(shù)。從第二主成分的得分及其排序來看,排在前5位的干支流依次為蕪頭、新斜、李家渡、馬口和南城。這表明,這5條干支流的基流較穩(wěn)定、年內(nèi)徑流變異性較小,絕對來水量按時間分布較均勻,其中蕪頭水文站所在支流表現(xiàn)最佳。
d. 從表7可知,在所選取的12個水文站中,樣本綜合得分從高到低依次排序為新斜、蕪頭、馬口、雙田、黎川、沙子嶺、桃坡、洪門、南城、婁家村、廖家灣和李家渡。即從該流域多年徑流情勢來看,新斜水文站所在支流表現(xiàn)為最不穩(wěn)定,其次為蕪頭,再次為馬口,最穩(wěn)定為所在干流的李家渡水文站,這與新斜站位于支流上游導致來水不穩(wěn)定、李家渡站位于干流出口導致來水最穩(wěn)定的實際情況一致。
a. 主成分分析法用于河川徑流情勢分析,既能正確識別原來太多變量中的主要成分,又能高度濃縮原來太多變量中的綜合信息,還能反映各主成分與原變量之間相關性的正、負和強、弱,具有有效識別主要成分和高度概括綜合信息等優(yōu)點。
b. 主成分分析法用于河川徑流情勢分析,通過選用少數(shù)幾個主成分代替流域徑流狀況的多個指標,從定量角度描述河川徑流的情勢,綜合評價河川徑流的穩(wěn)定性及流域綜合供水的穩(wěn)定程度,具有簡化計算、簡單明了等優(yōu)點。
c. 主成分分析法用于河川徑流情勢評價,既能正確評價不同干支流樣本徑流的離散性、對稱性和穩(wěn)定性等,又能為整個流域干支流徑流情勢的變化特征進行優(yōu)劣排序,可為河流管理部門合理決策河流水能資源開發(fā)方案提供技術支持和方法參考。
參考文獻:
[1] 王亮.灤河流域內(nèi)蒙段徑流插補預測分析及徑流變化影響評價研究[D].呼和浩特: 內(nèi)蒙古農(nóng)業(yè)大學,2011.
[2] 詹道江,徐向陽,陳元芳.工程水文學[M].北京: 中國水利水電出版社,2010:165-182.
[3] ALCAZAR J,PALAU A,VEGA-GARCLA C.A neural net model for environmental flow estimation at the Ebro River Basin,Spain[J].Journal of Hydrology,2008,349(1):44-55.
[4] 趙海霞,武建.淺析主成分分析方法[J].科技信息,2009(2): 87.(ZHAO Haixia,WU Jian.Brif analysis on the principal component analysis method[J].Journal of Science & Technology Information,2009(2): 87.(in Chinese))
[5] 童其慧.主成分分析方法在指標綜合評價中的應用[J].北京理工大學學報(社會科學版),2002,4(1): 59-61.(TONG Qihui.The application of primary element analyzing methods in the index synthetic evaluation [J].Journal of Beijing Institute of Technology(Social Sciences Edition),2002,4 (1): 59-61.(in Chinese))
[6] 盛周君,孫世群,王京城.基于主成分分析的河流水環(huán)境質(zhì)量評價研究[J].環(huán)境科學與管理,2007,32(12): 172-175.(SHENG Zhoujun,SUN Shiqun,WANG Jingcheng.Comprehensive evaluation of river water environmental quality based on principal component analysis[J].Journal of Environmental Science & Management,2007,32(12): 172-175.(in Chinese))
[7] 顧大環(huán),趙建強.主成分分析法在江蘇省工業(yè)經(jīng)濟效益評價中的應用[J].徐州教育學院學報,2008,23(3): 183-185.(GU Dahuan,ZHAO Jianqiang.The application of principal component analysis method in industrial economic benefit evaluation of Jiangsu Province[J].Journal of Xuzhou Education College,2008,23 (3): 183-185.(in Chinese))
[8] 趙磊,李繼海,朱大洲,等.5種鹿茸營養(yǎng)成分的主成分分析[J].光譜學與光譜分析,2010,30(9): 2571-2575.(ZHAO Lei,LI Jihai,ZHU Dazhou,et al.Principal component analysis of nutrients in five kinds of velvet antler [J].Spectroscopy & Spectral Analysis,2010,30 (9): 2571-2575.(in Chinese))
[9] 歐建鋒,葉健,程吉林.主成分分析法在江蘇水利現(xiàn)代化評價中的應用[J].人民長江,2010,41(2): 97-100.(OU Jianfeng,YE Jian,CHENG Jilin.Application of main component analysis method in comprehensive evaluation for water conservancy modernization in Jiangsu Province[J].Yangtze River,2010,41 (2): 97-100.(in Chinese))
[10] 呂王勇,陳美香,王波.基于主成分的區(qū)域水資源與社會經(jīng)濟的協(xié)調(diào)度評價[J].水資源與水工程學報,2011,22(1): 182-125.(LYU Wangyong,CHEN Meixiang,WANG Bo.Coordination evaluation between regional water resources and socio-economic based on principal component [J].Journal of Water Resources and Water Engineering,2011,22 (1): 182-125.(in Chinese))
[11] 譚芳,崔遠來,王建漳.灌溉水利用率影響因素的主成分分析: 以漳河灌區(qū)為例[J].中國農(nóng)村水利水電,2009(2): 70-73.(TAN Fang,CUI Yuanlai,WANG Jianzhang.Impact factors of irrigation water use efficiency based on principal component analysis case from Zhang River Irrigation District [J].China Rural Water and Hydropower,2009(2): 70-73.(in Chinese))
[12] 楊永生,許新發(fā),祝水貴,等.江西撫河流域水量分配方案研究[J].中國水利,2006(9): 19-22.(YANG Yongsheng,XU Xinfa,ZHU Shuigui,et al.Water allocation study on Fu River Basin of Jiangxi[J].China Water Resources,2006(9):19-22.(in Chinese))
[13] 楊永生,張戴軍.撫河流域水量分配原則及方法解析[J].江西水利科技,2006,32(3): 169-172.(YANG Yongsheng,ZHANG Daijun.Discussion of the distribution principle and the method of the water quantity about Fuhe River basin[J].Jiangxi Hydraulic Science & Technology,2006,32 (3): 169-172.(in Chinese))
[14] 桂發(fā)亮,胡鐵松,許新發(fā).撫河流域區(qū)域間的水權初始分配[J].武漢大學學報(工學版),2007,40(3): 27-30.(GUI Faliang,HU Tiesong,XU Xinfa.Inter-regional water right distribution of Fuhe River in China [J].Engineering Journal of Wuhan University,2007,40 (3): 27-30.(in Chinese))
DOI:10.3880/j.issn.1004-6933.2016.04.006
作者簡介:張代青(1974—),男,講師,博士,主要從事水資源保護、規(guī)劃與管理研究。E-mail:dqzhang2014@126.com
中圖分類號:TV213
文獻標志碼:A
文章編號:1004-6933(2016)04-0039-06
(收稿日期:2015-06-03編輯:王芳)
Principal component analysis of runoff regimes of rivers
ZHANG Daiqing, YU Guorong
(Faculty of Electric Power Engineering, Kunming University of Science and Technology, Kunming 650500, China)
Abstract:In order to obtain correct and reliable runoff regimes, and to effectively develop and utilize hydropower resources of rivers, using the Fuhe River Basin as an example, we analyzed the principal components involving ten variables of runoff samples from 12 hydrological stations on the Fuhe River. The variables included daily mean flow, minimum daily mean flow, maximum and minimum monthly mean flows, base flow index, number of days during which the streamflow is equal to or lower than 5% of annual mean flow, daily mean flow for a period of 90 days or one exceeding 90 days, standard deviation of daily mean flow, and coefficient of variation of the annual mean flow. We calculated the contribution rates of the principal components, the cumulative contribution rates, and scores of samples and their comprehensive scores, and evaluated the runoff regimes of the main stream and tributaries of the river. The results show that the first principal component reflects the threshold value range of runoff, discrete degree, and symmetry conditions; the second principal component reflects the base flow index and the coefficient of variation of runoff, and the contribution rates of the two principal components decrease successively. These research results can provide river management departments with technical support and a reliable data basis for understanding runoff regimes of different main streams and tributaries, planning programs for development of hydropower resources in river basins, and maintaining a healthy water environment for rivers.
Key words:principal component analysis; runoff regime; Fuhe River Basin