樊宇堃,蔡琦,王春浩
(河海大學(xué)水文水資源學(xué)院,江蘇 南京 210098)
近年來,隨著全球生態(tài)環(huán)境問題的日益突出,人類對水體污染問題也日益重視。河流的水質(zhì)狀況受其流域的人類活動、經(jīng)濟(jì)發(fā)展等影響具有時空差異性,因此需要對水體污染物時空互補(bǔ)特性進(jìn)行動態(tài)分析。水質(zhì)評價對水資源規(guī)劃、管理與保護(hù)有著十分重要的作用,通過對水質(zhì)的評價可發(fā)現(xiàn)水體污染程度及水質(zhì)變化的規(guī)律,有利于制定相應(yīng)的治理方案。黃河作為中國北方主要水源之一,其水質(zhì)問題一直受到學(xué)術(shù)界的廣泛關(guān)注。
目前,為充分了解水質(zhì)信息,國內(nèi)外學(xué)者為不同區(qū)域的水體進(jìn)行水質(zhì)分析,主要采用多元統(tǒng)計分析方法,如成分分析法、線性回歸法、聚類分析算法、多元方差分析法等等。這些方法廣泛應(yīng)用于黃河流域、淮河流域、太湖、尼羅河流域以及部分城區(qū)等水體水質(zhì)的時空分布特性分析中,申洪鑫等運用單因子污染指數(shù)法、內(nèi)梅羅污染指數(shù)法和因子分析法對大汶河流域水質(zhì)狀況和污染源進(jìn)行評價與分析;李義祿等綜合利用GIS平臺系統(tǒng)及多種多元統(tǒng)計技術(shù)對蘇州古城區(qū)水體污染時空分布特征及污染源進(jìn)行解析;張彥等通過M-K 檢驗和聚類分析對河南省2009-2017年水體污染物時空分布特征進(jìn)行解析;明星等結(jié)合主成分與聚類的復(fù)合分析模型以及spss 統(tǒng)計分析軟件得出我國各地區(qū)廢水中污染物排放特征,并提出重點的針對治理措施,以利于各地區(qū)的污染控制與防治;李春暉、楊志峰通過單因子評價法揭示了黃河干流多年來水體污染的時空變化規(guī)律,并舉例對干流各站點的水質(zhì)水量進(jìn)行聯(lián)合評價;孫藝珂等使用主成分分析法賦權(quán),并提出改進(jìn)的內(nèi)梅羅指數(shù)法,從而建立了改進(jìn)的綜合水質(zhì)指數(shù)法;顏劍波等應(yīng)用多元回歸分析,預(yù)測出三門峽斷面主要污染物濃度;徐發(fā)凱等基于綜合污染指數(shù)法,結(jié)合單因子污染指數(shù)法及累積距平法等多種統(tǒng)計分析方法,定量分析了黃河流域蘭州和白銀段7 個監(jiān)測斷面水質(zhì)時空變化特征。另外,相關(guān)的統(tǒng)計分析方法在國外河流流域水質(zhì)時空分布特征方面也有運用。綜上所述,目前多元統(tǒng)計分析方法在流域時空特性分析中應(yīng)用較多,但大多為對個別斷面進(jìn)行分析,缺少對于黃河流域較為全面的分析。
因此,文章選用K-means 聚類算法對黃河流域的7 個主要監(jiān)測斷面2004-2018 年污染物數(shù)據(jù)進(jìn)行聚類分析,得出黃河流域水體污染物在時間上的變化特征。此項研究對于黃河流域的水污染治理有著指導(dǎo)意義,可以為相關(guān)部門提供決策依據(jù)。
黃河流域位于東經(jīng)95°54′~119°13′,北緯32°09′~41°50′,是連接青藏高原、黃土高原、華北平原的重要生態(tài)廊道。黃河發(fā)源于青藏高原巴顏喀拉山北麓的約古宗列盆地,流經(jīng)青海、四川、甘肅、寧夏、內(nèi)蒙古、陜西、山西、河南、山東9 省區(qū),從山東省注入渤海,全長5 464 km,流域面積79.50 萬km2,直接影響全國近1/10的國土面積和近1/5的人口的生態(tài)及用水需求。
小浪底水利樞紐位于河南省洛陽市以北40 km 的黃河干流上,控制流域面積占黃河流域面積的92.30%,是以防洪為主;兼顧防凌、減淤、灌溉和發(fā)電綜合利用的特大型水利工程。小浪底庫區(qū)河段為峽谷型河道,從三門峽至小浪底流程130 km,區(qū)間流域面積5 756 km2,有較多支流、支溝、毛溝匯入,其中較大支流有北岸的西陽河、逢石河、亳清河、板澗河和南岸的畛河、青河等18條,比降一般較陡,多數(shù)分布在庫中區(qū)和庫前區(qū)。
研究數(shù)據(jù)主要來源于中華人民共和國生態(tài)環(huán)境部發(fā)布的黃河主要監(jiān)測斷面水質(zhì)情況,選取了沿黃河干流的河南濟(jì)源小浪底監(jiān)測斷面,COD(化學(xué)需氧量)、DO(溶解氧)和NH3-N(氮氧含量)三個水質(zhì)監(jiān)測指標(biāo),水質(zhì)監(jiān)測數(shù)據(jù)為2004-2018 年的原始水質(zhì)監(jiān)測數(shù)據(jù),監(jiān)測頻率為每日1 次,通過對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理將水質(zhì)監(jiān)測數(shù)據(jù)整理為標(biāo)準(zhǔn)化數(shù)據(jù),據(jù)此來對黃河流域主要水體污染物進(jìn)行年際時空互補(bǔ)特性分析。
數(shù)據(jù)標(biāo)準(zhǔn)化的方法有很多種,常用的有“最小—最大標(biāo)準(zhǔn)化”“Z-score 標(biāo)準(zhǔn)化”和“按小數(shù)定標(biāo)標(biāo)準(zhǔn)化”等。經(jīng)過上述標(biāo)準(zhǔn)化處理,原始數(shù)據(jù)轉(zhuǎn)換為無量綱化指標(biāo)測評值,即各指標(biāo)值都處于同一個數(shù)量級別上,可進(jìn)行綜合測評分析。
文章選取“最小—最大標(biāo)準(zhǔn)化”方法對原始數(shù)據(jù)進(jìn)行處理分析,其方法是對原始數(shù)據(jù)進(jìn)行線性變換。具體如下所示:
式(1)中:Dmax和Dmin分別為屬性D的最大值和最小值,將D 的一個原始值Draw 通過Min-Max 標(biāo)準(zhǔn)化映射成在區(qū)間[0,1]中的值Dnew。
水體主要污染物指標(biāo)CODMn、NH3-N、DO 在短期內(nèi)易受環(huán)境變化等諸多因素影響而變化顯著,且指標(biāo)間的相對大小關(guān)系短期特性差異較大,因此根據(jù)短期水體特征分析中長期水體特征變化之前篩選出典型日是非常必要的??梢愿鶕?jù)篩選出的不同測站2004-2018 年的典型日對該站的所有數(shù)據(jù)進(jìn)行分類并統(tǒng)計其變化特征與指標(biāo)數(shù)值突變點,進(jìn)一步分析水體污染物的時間變化特征。
在大規(guī)模數(shù)據(jù)處理與分析中,機(jī)器學(xué)習(xí)具有精確、高效的特點。因此,文章將使用機(jī)器學(xué)習(xí)的方法對各類典型日進(jìn)行智能劃分。由于各測站的水體污染物典型日在分類前無法獲取,因此,文章將選用已廣泛應(yīng)用的無監(jiān)督分類算法K-means,其核心思想是針對給定的樣本集合,以樣本之間的歐氏距離為依據(jù),將樣本集合劃分為K個類別。歐氏距離越近,樣本間相似度越大。各類之間遵循類內(nèi)的樣本間距盡可能小,類與類之間樣本間距盡可能大的原則。水體主要污染物指標(biāo)典型日具體篩選流程如圖1所示:
圖1 K-means算法篩選典型日流程圖
Mann-Kendall 檢驗(簡稱M-K 檢驗)是一種非參數(shù)統(tǒng)計檢驗方法,最初由Mann 于1945 年提出,它不需要假定樣本服從某種分布,且不受少數(shù)異常值的干擾,在全球氣候變化及其影響的研究方面得到了廣泛應(yīng)用。
原假設(shè)H0:序列無趨勢性變化;備擇假設(shè)H1:序列有趨勢性變化。
對于樣本容量為n的時間序列X,構(gòu)造如下統(tǒng)計量:
在選定顯著性水平a 之后,查正態(tài)分布表得到Ma/2,若|M| <Ma/2,則拒絕序列無趨勢性變化的原假設(shè),即推斷出在顯著性水平a下,序列存在向上或向下的趨勢(M >Ma/2表示序列呈上升趨勢,M <Ma/2表示序列呈下降趨勢);否則,接受序列無趨勢性變化的假設(shè)。
根據(jù)2004-2018年濟(jì)源小浪底監(jiān)測站點的水質(zhì)監(jiān)測數(shù)據(jù),濟(jì)源小浪底的CODMn(高錳酸鹽指數(shù))質(zhì)量濃度最大為6.90 mg/L,超過了II類水質(zhì)標(biāo)準(zhǔn)的2.3倍,濟(jì)源小浪底的CODMn質(zhì)量濃度最小為1.20 mg/L,達(dá)到了I水質(zhì)標(biāo)準(zhǔn)。CODMn質(zhì)量濃度達(dá)到I類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有4 個,占比11.79%;II 類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有566個,占比79.49%;Ⅲ類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有61個,占比8.58%;IV 類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有1 個,占比0.14%。濟(jì)源小浪底的NH3-N質(zhì)量濃度最大為1.81 mg/L,超過了II類水質(zhì)標(biāo)準(zhǔn)的3.60倍,濟(jì)源小浪底的NH3-N質(zhì)量濃度最小為0.03 mg/L,達(dá)到了I水質(zhì)標(biāo)準(zhǔn)。NH3-N質(zhì)量濃度達(dá)到I類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有218 個,占比30.83%;II 類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有341個,占比48.24%;Ⅲ類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有92個,占比13.01%;IV 類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有51 個,占比7.21%,V 類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有5 個,占比0.71%。濟(jì)源小浪底的DO 質(zhì)量濃度最大為14.10 mg/L,超過了II 類水質(zhì)標(biāo)準(zhǔn)的2.35 倍,濟(jì)源小浪底的DO 質(zhì)量濃度最小為1.25 mg/L,達(dá)到了I 水質(zhì)標(biāo)準(zhǔn)。DO 質(zhì)量濃度達(dá)到I 類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有338 個,占比47.47%;II 類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有132 個,占比18.54%;Ⅲ類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有100 個,占比14.04%;IV類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有108 個,占比15.17%,V 類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有30 個,占比4.22%,劣V 類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)有4個,占比0.56%??傮w來說,濟(jì)源小浪底監(jiān)測站點的水體污染物的平均質(zhì)量濃度較低,CODMn平均質(zhì)量濃度達(dá)到了II類水質(zhì)標(biāo)準(zhǔn),NH3-N平均質(zhì)量濃度達(dá)到了II類水質(zhì)標(biāo)準(zhǔn),DO平均質(zhì)量濃度達(dá)到了II類水質(zhì)標(biāo)準(zhǔn),但近年來仍有部分時期的水體污染物質(zhì)量濃度超過了Ⅲ類水質(zhì)標(biāo)準(zhǔn),水質(zhì)有待進(jìn)一步的加強(qiáng)。
4.2.1 典型日篩選與分析
根據(jù)河南小浪底監(jiān)測斷面2004-2018年的逐日數(shù)據(jù),利用基于K-means算法的典型日篩選模型進(jìn)行聚類與分析,得到了該監(jiān)測斷面的四類典型日(圖2)。
圖2 典型日篩選結(jié)果圖
根據(jù)典型日分類結(jié)果可知:分類模型從2004-2018年逐日標(biāo)準(zhǔn)化數(shù)據(jù)中篩選出了4類典型日,典型日數(shù)據(jù)特征分別為:
第一類典型日(a)溶解氧含量最高,高錳酸鹽指數(shù)與氨氮指數(shù)較低,三者數(shù)據(jù)差值較大,表征水質(zhì)污染情況較輕,水質(zhì)情況良好。
第二類典型日(b)高錳酸鹽指數(shù)最高,溶解氧指數(shù)其次,氨氮指數(shù)最低。突出特征為高錳酸鹽指數(shù)較其他兩指標(biāo)表現(xiàn)異常,表征此類典型日受有機(jī)物污染較為嚴(yán)重,水質(zhì)情況較差。
第三類典型日(c)溶解氧含量最高,氨氮指數(shù)略低于溶解氧指數(shù),高錳酸鹽指數(shù)最低。此類典型日盡管溶解氧指數(shù)較高,但另外二者較其他典型日數(shù)據(jù)提升較明顯,表征此時水體中有機(jī)物含量與富營養(yǎng)化較嚴(yán)重,水質(zhì)情況較差。
第四類典型日(d)溶解氧含量最高,高錳酸鹽指數(shù)其次,氨氮指數(shù)最低。表征水質(zhì)有輕微有機(jī)物污染,但水質(zhì)情況總體良好。
根據(jù)典型日數(shù)量年際變化圖可知:第一類典型日與第四類典型日的天數(shù)在15d間呈上升趨勢,第二類典型日與第三類典型日的天數(shù)則呈明顯下降趨勢,其中,第三類典型日在2015—2018年中數(shù)量變?yōu)?,第二類典型日在2017年中數(shù)量下降為0。
4.2.2 三項指標(biāo)M-K檢驗結(jié)果
將黃河小浪底標(biāo)準(zhǔn)化數(shù)據(jù)當(dāng)中的各指標(biāo)值進(jìn)行M-K 檢驗,得到三項指標(biāo)的UFk-UBk關(guān)系圖(圖4)。
圖4 M-K檢驗結(jié)果圖
由UFk 曲線及UBk 的變化趨勢可知:2004-2018 年間DO指數(shù)呈明顯的上升趨勢,而NH3-N 與CODMn指數(shù)則呈下降趨勢。由圖中兩曲線的交線與臨界線的關(guān)系可以得出:DO 指數(shù)與CODMn指數(shù)沒有明顯的突變,而NH3-N指數(shù)在2008年6月前后有明顯的突變。
圖3 典型日數(shù)量年際變化圖
通過對2004-2018 年小浪底水質(zhì)變化分析,可得出以下結(jié)論:
濟(jì)源小浪底監(jiān)測站點的水體污染物的平均質(zhì)量濃度整體較低,水質(zhì)較好。水體污染物CODMn、NH3-N和DO平均質(zhì)量濃度都達(dá)到了II類水質(zhì)標(biāo)準(zhǔn),CODMn質(zhì)量濃度超過Ⅲ類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)占比91.28%,NH3-N 質(zhì)量濃度超過Ⅲ類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)占比79.07%,DO質(zhì)量濃度超過Ⅲ類水質(zhì)標(biāo)準(zhǔn)的監(jiān)測天數(shù)占比66.01%。
M-K檢驗和典型日分析結(jié)果具有一致性,均可表明濟(jì)源小浪底監(jiān)測站點的水體污染物整體上趨勢呈現(xiàn)顯著減小趨勢,2004-2018年間DO指數(shù)呈明顯的上升趨勢,而NH3-N與CODMn指數(shù)則呈下降趨勢。在2015 年到2018 年水質(zhì)達(dá)到較好的情況,其中NH3-N 與CODMn指數(shù)大幅降低,溶氧量指數(shù)保持較高水平。
值得注意的是,盡管2004-2018 年間水質(zhì)呈現(xiàn)變好趨勢,但近年來仍有部分時期的水體污染物質(zhì)量濃度超過了Ⅲ類水質(zhì)標(biāo)準(zhǔn),水質(zhì)仍有待進(jìn)一步的提升。