杜俊鵬,呂 軍,吳計生,趙立勇,魏春鳳,張 宇
(1.松遼水資源保護科學研究所,吉林 長春 130021;2.吉林省潤佳水利工程咨詢有限公司,吉林 長春 130032)
水質(zhì)評價的方法有很多,從上世紀70年代開始,學者們通過各種不同的方法來評價河流水質(zhì)情況。具體的方法有:單因子評價法、指數(shù)評價法、模糊評價法、神經(jīng)網(wǎng)絡(luò)評價法、主成分分析法、聚類分析法、灰色評價法、物元分析評價法等。其中主成分分析法是利用降維思想,在損失很少原始信息的前提下把多個指標轉(zhuǎn)化為幾個綜合指標的多元統(tǒng)計方法。聚類分析是一種建立分類的多元統(tǒng)計分析方法,它能夠?qū)⒁慌鷺颖?或變量)數(shù)據(jù)根據(jù)其諸多特征,按照性質(zhì)上的親疏程度在沒有先驗知識的情況下進行自動分類,產(chǎn)生多個分類結(jié)果,類內(nèi)部個體特征具有相似性,不同類間個體特征的差異性較大。[1-7]
長春市經(jīng)濟技術(shù)開發(fā)區(qū)簡稱經(jīng)開區(qū)是1992年成立,1993年經(jīng)國務(wù)院批準的國家級經(jīng)濟技術(shù)開發(fā)區(qū)。地處長春市東部,位于長春向東北拓展的工業(yè)主軸線。行政面積112km2,分為南北兩區(qū),轄四街一鎮(zhèn),常住人口40萬人,共有各類市場主體4萬戶。經(jīng)開區(qū)內(nèi)共有河流16條、人工湖1處。其中:伊通河流域分別為伊通河右岸(衛(wèi)星路——自由大路段),全長約3570m;新開河右岸(東榮大路-金錢小白橋段)及東新開河(東前屯入口-洋浦大街段),全長約4470m;小河沿子河右岸(新城大街-伊通河段),全長約5120m;鯰魚溝(繞城高速-伊通河段),全長約5770m。飲馬河流域分別為霧開河支流干霧海河,全長約8050m;干霧海河支流中山溝,全長約6969m;干霧海河支流南陽溝,全長約470m;興隆山隆東溝,全長約1350m。北海公園人工湖水域面積2887.85m2。全區(qū)共布置地表水監(jiān)測點27個,監(jiān)測項目為PH、溶解氧、COD、高錳酸鉀指數(shù)、氨氮、總磷,監(jiān)測數(shù)據(jù)由經(jīng)開區(qū)河長制辦公室提供,為2019年經(jīng)開區(qū)全年平均地表水監(jiān)測數(shù)據(jù)。
本文采用主成分分析法和系統(tǒng)聚類分析法相結(jié)合,具體如下。
步驟1:數(shù)據(jù)標準化。對原始數(shù)據(jù)進行標準化,以消除數(shù)據(jù)量綱及數(shù)量級的影響。
步驟2:根據(jù)標準化后的數(shù)據(jù)計算相關(guān)系數(shù)矩陣。
步驟3:計算相關(guān)系數(shù)矩陣的特征值與特征向量。相關(guān)系數(shù)矩陣的特征值λi其實就是主成分F的方差,一般選取特征根大于1的主成分進行分析。
步驟4:計算方差貢獻率并確定主成分。
步驟6:計算各主成分表達式Fi即主成分荷載值lij與對應(yīng)的標準化后的指標值xij相乘。
步驟7:計算主成分綜合得分值F。即各主成分得分值Fi與相應(yīng)權(quán)重的乘積之和,對應(yīng)權(quán)重為對應(yīng)特征值在選取總特征值中的占比。
通過主成分分析法,可得各監(jiān)測斷面主成分得分值和總得分值。得分值越高,說明該斷面污染越嚴重。
步驟1:首先對原始數(shù)據(jù)進行預處理,即標準化處理。
步驟2:根據(jù)標準化后的數(shù)據(jù)計算相關(guān)系數(shù)矩陣。利用標準化后的數(shù)據(jù),計算各變量之間相關(guān)系數(shù),對相關(guān)系數(shù)矩陣逐層分析,步驟1和步驟2與主成分分析法一樣。
步驟3:對不同變量類型下個體距離采用平方歐氏距離計算,個體與小類、小類與小類間距離采用組間平均距離計算,逐步計算至各類對象歸為一類,繪制聚類分析譜系圖。
通過系統(tǒng)聚類分析譜系圖,可以看出哪幾類變量或者樣本具有較大的關(guān)聯(lián)性,從而對變量進行分類分析,對樣本進行分類管理。
通過主成分分析和系統(tǒng)聚類分析,利用SPSS軟件,對經(jīng)開區(qū)水質(zhì)監(jiān)測斷面進行水質(zhì)評價,具體如下。首先對監(jiān)測的27個水質(zhì)斷面進行標準化處理,見表1。
表1 標準化數(shù)據(jù)表
接著計算相關(guān)系數(shù)矩陣見表2。從相關(guān)系數(shù)矩陣表可以看出,大部分相關(guān)系數(shù)大于0.3,說明各部分變量的相關(guān)性是比較強的,它們存在信息上的重疊,因此對原始數(shù)據(jù)進行主成分分析是比較合適的。并且從表中可以看出,COD與高錳酸鹽指數(shù)的相關(guān)性最強,系數(shù)達到0.878,氨氮與總磷的相關(guān)性也較強,系數(shù)達到0.716。
表2 相關(guān)系數(shù)矩陣表
接下來通過KMO和巴特利特檢驗進一步說明研究方法的正確性。見表3,從表3可以得出KMO值為0.701,巴特利特球形度檢驗顯著性為0.000。通常我們認為KMO檢驗結(jié)果在0.5~0.7之間,同時巴特利特檢驗結(jié)果的顯著性小于0.05,則表示原始數(shù)據(jù)適宜進行主成分分析。KMO檢驗結(jié)果大于0.7則非常適合主成分分析,低于0.5則不適合用主成分分析[8]。因此本項目是非常適合用主成分分成來進行水質(zhì)評價的。
表3 KMO和巴特利特檢驗表
計算特征值與特征向量,見表4。查閱相關(guān)文獻知,當特征值小于1時,表示該主成分的解釋力度還不如直接引入原變量平均值的解釋力度大[9-10],因此考慮將特征值大于1作為納入標準。本例中選用兩個特征值,分別為λ1=3.201,λ2=1.138,此時累積方差貢獻率為72.316%,也就是說通過選取兩個主成分,就可以表達原始指標絕大部分的信息。并且可以進一步知道,第一主成分的影響最大,方差百分比為53.356%。
計算主成分荷載值,即特征向量。見表5。從主成分荷載矩陣可以看出,錳酸鹽指數(shù)、COD、總磷、總氮在第一主成分荷載較大,PH在第二主成分荷載較大。負值代表的是負相關(guān)。因此可以得出高錳酸鹽指數(shù)、COD、總磷和氨氮是主要的污染因子。
表4 總方差解釋表
表5 主成分荷載矩陣表(特征向量)
接著從系統(tǒng)聚類分析法,來分析各個變量的相關(guān)性。通過SPSS軟件繪制生成譜系圖,如圖1所示,從譜系圖可以看出,COD與高錳酸鉀的關(guān)聯(lián)性較強,氨氮和總磷的關(guān)聯(lián)性較強,溶解氧與任何一個變量的關(guān)聯(lián)性都較差,這也從另一種方法驗證了相關(guān)系數(shù)矩陣表和主成分荷載矩陣表即主成分分析法的正確性,更加直觀、形象的展示了各個變量之間的親疏關(guān)系。
圖1 評價聯(lián)接(組間)譜系圖
表6 各監(jiān)測斷面主成分綜合得分值和單因子水質(zhì)綜合評價對比表
通過相關(guān)系數(shù)矩陣表、主成分荷載矩陣表和譜系圖可以得到,高錳酸鹽指數(shù)、COD、總磷和氨氮為主要的污染因子,并且高錳酸鉀指數(shù)和COD的關(guān)聯(lián)度較大,總磷和氨氮的關(guān)聯(lián)度較大。通過計算各個監(jiān)測斷面的主成分綜合得分值,在與單因子水質(zhì)評價進行比較,見表6,可以看出經(jīng)開區(qū)河流水質(zhì)總體較差,大多數(shù)為Ⅴ類水體。水質(zhì)最好的監(jiān)測斷面為伊通河(衛(wèi)星大橋斷面)、伊通河(自由大橋斷面)水質(zhì)為Ⅲ類。鯰魚溝(地表水末端)斷面、小稗子溝(入境斷面)、小稗子溝(匯入東新開河前斷面,竇開河為小稗子溝支流,匯入小稗子溝斷面)水質(zhì)最差。本文的研究思路,可以為其他河流的水質(zhì)評價提供參考依據(jù),為水資源管理、水污染防治提供科學方法。接下來作者將用神經(jīng)網(wǎng)絡(luò)法、灰色評價法等多種方法對水質(zhì)進一步評價,從更多方面完善其工作。