吉祝美,方 里,張 俊 ,馬晶晶
(江蘇省鹽城市環(huán)境監(jiān)測(cè)中心站, 江蘇 鹽城 224001)
河流監(jiān)測(cè)一般按照GB 3838—2002《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》確定的24個(gè)基本項(xiàng)目進(jìn)行分析,由于項(xiàng)目眾多,要將所有項(xiàng)目全面評(píng)價(jià)到位顯得比較困難。由于這些項(xiàng)目相互之間有一定的相關(guān)性,我們就可以運(yùn)用主成分分析法選取少數(shù)幾個(gè)互相無關(guān)的指標(biāo)來代替它們進(jìn)行評(píng)價(jià)。主成分分析方法(PCA法)是一種將多維因子納入同一系統(tǒng)中進(jìn)行定量化研究、理論比較完善的多元統(tǒng)計(jì)分析方法,在解決很多實(shí)際問題時(shí)取得了較好的效果[1-2]。
主成分分析法是一種降維處理技術(shù)的數(shù)學(xué)變換方法,其基本思想就是設(shè)法將原來眾多且具有一定相關(guān)性的指標(biāo),轉(zhuǎn)化成少數(shù)幾個(gè)綜合指標(biāo)。該方法主要研究如何通過少數(shù)幾個(gè)主成分來揭示多個(gè)變量間的內(nèi)部結(jié)構(gòu),即從原始變量中導(dǎo)出少數(shù)幾個(gè)主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關(guān)。
進(jìn)行主成分分析的主要計(jì)算步驟為[3-5]:
(1)根據(jù)研究問題選取指標(biāo)與數(shù)據(jù)。
(2)進(jìn)行指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化,以消除不同指標(biāo)之間的量綱影響。
(3)進(jìn)行指標(biāo)之間的相關(guān)性判定,確定待分析的原始變量是否適合進(jìn)行因子分析。
(4)確定主成分的個(gè)數(shù)m。主成分個(gè)數(shù)提取原則:①只取特征根λ>1時(shí)對(duì)應(yīng)的主成分;② 累計(jì)百分比達(dá)到80% ~85%以上的λ值對(duì)應(yīng)的主成分;③根據(jù)特征根變化的突變點(diǎn)決定主成分的數(shù)量。
(5)確定主成分Fi的表達(dá)式。
(6)進(jìn)行主成分Fi的命名。
(7)計(jì)算綜合主成分值并進(jìn)行評(píng)價(jià)與研究。
在“分析”菜單“降維”中選擇“因子分析”命令,在彈出的“因子分析”對(duì)話框(圖1)中,從對(duì)話框左側(cè)的變量列表中選擇需要分析的變量,使之添加到變量框中。
圖1 “因子分析”對(duì)話框
分別單擊“描述”、“抽取”、“旋轉(zhuǎn)”、“得分”及“選項(xiàng)”按鈕,彈出“因子分析:描述統(tǒng)計(jì)”對(duì)話框(圖2)、“因子分析:抽取”對(duì)話框(圖3)、“因子分析:旋轉(zhuǎn)”對(duì)話框(圖4)、“因子分析:因子得分”對(duì)話框(圖5)、“因子分析:選項(xiàng)”對(duì)話框(圖6),按圖中顯示勾選相關(guān)復(fù)選框后,單擊繼續(xù)按鈕返回“因子分析”對(duì)話框,在“因子分析”對(duì)話框點(diǎn)擊“確定”按鈕,完成計(jì)算,SPSS很快給出計(jì)算結(jié)果(圖7)。
圖2 “因子分析:描述統(tǒng)計(jì)”對(duì)話框
圖3 “因子分析:抽取”對(duì)話框
圖4 “因子分析:旋轉(zhuǎn)”對(duì)話框
圖5 “因子分析:因子得分”對(duì)話框
圖6 “因子分析:選項(xiàng)”對(duì)話框
圖7 主成分分析的結(jié)果
在因子分析時(shí),SPSS會(huì)自動(dòng)對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,所以得到的變量都是經(jīng)過標(biāo)準(zhǔn)化處理后的變量。但SPSS并不直接給出標(biāo)準(zhǔn)化后的數(shù)據(jù),如需要得到標(biāo)準(zhǔn)化數(shù)據(jù),則需調(diào)用描述過程進(jìn)行計(jì)算。具體方法是在“分析”菜單“描述統(tǒng)計(jì)”中選擇“描述”命令,在彈出的“描述性”對(duì)話框(圖8)中,從對(duì)話框左側(cè)的變量列表中選擇需要分析的變量,使之添加到變量框中,并勾選“將標(biāo)準(zhǔn)化得分另存為變量”選項(xiàng)。點(diǎn)擊“確定”后得到標(biāo)準(zhǔn)化數(shù)據(jù)。
圖8 “描述性”對(duì)話框
串場(chǎng)河是里下河地區(qū)與沿海墾區(qū)之間縱貫?zāi)媳钡娜斯ず拥?。南起海安三里閘,經(jīng)富安、安豐、東臺(tái)、劉莊、鹽城、上岡,至阜寧入射陽河,沿途穿斗龍港、新洋港、黃沙港等,是里下河地區(qū)各河(港)排水入海的總調(diào)節(jié)河道,也是里下河地區(qū)和沿海墾區(qū)的分界線。串場(chǎng)河基本反映了鹽城市阜寧縣城以南大部分水域的水質(zhì)狀況,所有串場(chǎng)河以西的河水都要與串場(chǎng)河交匯,對(duì)串場(chǎng)河的水質(zhì)有一定影,串場(chǎng)河水質(zhì)對(duì)反映鹽城市水質(zhì)狀況有一定的代表性。共設(shè)8個(gè)監(jiān)測(cè)斷面開展串場(chǎng)河水質(zhì)例行監(jiān)測(cè)(圖9)。2011年各斷面年均值見表1。
圖9 監(jiān)測(cè)點(diǎn)位示意圖
將監(jiān)測(cè)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后得到的標(biāo)準(zhǔn)化數(shù)據(jù)見表2,標(biāo)準(zhǔn)化處理后各行數(shù)據(jù)平均值等于零,標(biāo)準(zhǔn)差等于1。
表1 2011年各監(jiān)測(cè)斷面8個(gè)評(píng)價(jià)指標(biāo)的年均值 mg/L
表2 標(biāo)準(zhǔn)化處理后的數(shù)據(jù)
利用SPSS軟件分別對(duì)溶解氧(X1)、高錳酸鹽指數(shù)(X2)、五日生化需氧量(X3)、氨氮(X4)、石油類(X5)、揮發(fā)酚(X6)、化學(xué)需氧量(X7)、總磷(X8)8個(gè)評(píng)價(jià)指標(biāo)的相關(guān)系數(shù)和特征值進(jìn)行分析并根據(jù)累計(jì)貢獻(xiàn)率確定主成分個(gè)數(shù)。相關(guān)系數(shù)矩陣見圖10。
從相關(guān)系數(shù)矩陣中看出,大部分相關(guān)系數(shù)大于0.3,可見許多變量之間直接的相關(guān)性比較強(qiáng),證明
,他們存在信息上的重疊,則這些原始變量適合進(jìn)行因子分析。生化需要量與溶解氧、氨氮及總磷有很強(qiáng)的相關(guān)性(其中與溶解氧成負(fù)相關(guān)),相關(guān)系數(shù)分別達(dá)到 0.821、0.900 和 0.798。
根據(jù)主成分分析法中主成分個(gè)數(shù)選取原則,從圖11可見特征值λ>1時(shí)有兩個(gè)成分:λ1=3.877,λ2=2.612,此時(shí)累計(jì)百分比達(dá)到81.111%,同時(shí)通過圖12分析特征根衰減的突變,可以確定應(yīng)提取2個(gè)主成分,即k=2(SPSS軟件自動(dòng)提取了2個(gè)主成分)。
圖10 相關(guān)系數(shù)矩陣
圖11 主成分方差與方差貢獻(xiàn)
圖12 特征根數(shù)值衰減折線
從初始因子荷載矩陣(圖13)可知,生化需要量、氨氮、總磷在第一主成分上有較高載荷,說明第一主成分基本反映了這些指標(biāo)的信息,高錳酸鹽指數(shù)和石油類指標(biāo)在第二主成分上有較高載荷,第二主成分主要反映的是這兩個(gè)指標(biāo)的信息。
初始因子荷載矩陣由SPSS直接得到,而主成分荷載矩陣(表3)需用初始因子荷載矩陣中數(shù)據(jù)除以主成分相對(duì)應(yīng)特征值的平方根,得到2個(gè)主成分中每個(gè)指標(biāo)對(duì)應(yīng)的系數(shù),才得到相應(yīng)的主成分荷載值。
表3 主成分載荷矩陣
根據(jù)以上分析結(jié)果,得知:
F1為第一主成分,代表生化需要量、氨氮、總磷三個(gè)評(píng)價(jià)指標(biāo);F2為第二主成分,代表了高錳酸鹽指數(shù)和石油類兩個(gè)評(píng)價(jià)指標(biāo)。
根據(jù) λ1=3.877 ,λ2=2.612,得到相應(yīng)的主成分表達(dá)式(綜合評(píng)價(jià)函數(shù))如下:
根據(jù)綜合評(píng)價(jià)函數(shù),計(jì)算各監(jiān)測(cè)斷面和整條河流的水質(zhì)污染綜合得分,計(jì)算結(jié)果見表4,給出水質(zhì)污染程度的定量化描述,得分越大,表明污染越嚴(yán)重。
由表4可以看出,2011年串場(chǎng)河的水質(zhì)污染程度排序?yàn)?
黃海大橋>新興公路橋>溝墩大橋>啤酒廠>李舍>廉貽大橋>白駒鎮(zhèn)北
從第一主成分F1得分的排名來看,黃海大橋得分遠(yuǎn)高于其他監(jiān)測(cè)斷面,說明該處生化需氧量、氨氮和總磷含量相對(duì)較高;從第二主成分F2得分排名來看,溝墩大橋和啤酒廠得分較高,說明此兩處高錳酸鹽指數(shù)和石油類污染較重。從水質(zhì)監(jiān)測(cè)數(shù)據(jù)來看,證實(shí)主成分分析結(jié)果較真實(shí)地反映了實(shí)際情況。
表4 各監(jiān)測(cè)斷面水質(zhì)綜合評(píng)價(jià)結(jié)果
借助SPSS軟件,采用主成分分析法研究串場(chǎng)河水質(zhì)特征,結(jié)果表明:從原始水質(zhì)數(shù)據(jù)中提取占總方差的81.111%的2個(gè)因子來反映水體的污染程度,經(jīng)過分析識(shí)別得到串場(chǎng)河的2個(gè)主成分因子:生化需氧量、氨氮和總磷;高錳酸鹽指數(shù)和石油類。結(jié)果與實(shí)際情況相吻合,說明主成分分析法是一種有效的水質(zhì)評(píng)價(jià)方法。同時(shí),在水質(zhì)綜合評(píng)價(jià)時(shí),可以根據(jù)主成分分析法得出的結(jié)論,重點(diǎn)考慮排名靠前的指標(biāo),刪除那些次要的指標(biāo),確定造成污染的主要成分。這樣不僅避免了人為選擇指標(biāo)的隨意性,更節(jié)省了監(jiān)測(cè)所需的人力物力,使評(píng)價(jià)方法更加科學(xué)與準(zhǔn)確。
[1]龐鴻賓.節(jié)水農(nóng)業(yè)工程技術(shù)[M].鄭州:河南科學(xué)技術(shù)出版社,2000:40-63.
[2]Huang B R,F(xiàn)ry J D.Root anatomical physiological and Morphological responses to drought stress for fescue cultivars[J].Crop Sci,1998(38):1017 - 1022.
[3]王艾,馮紹元,鄭艷.主成分分析法在溫榆河水質(zhì)評(píng)價(jià)中的初步應(yīng)用[J].北京水務(wù),2011,(2):49-52.
[4]魯斐,李磊.主成分分析法在遼河水質(zhì)評(píng)價(jià)中的應(yīng)用[J].水利科技與經(jīng)濟(jì),2009,12(10):660 -662.
[5]方紅衛(wèi),孫世群,朱雨龍,等.主成分分析法在水質(zhì)評(píng)價(jià)中的應(yīng)用及分析[J].環(huán)境科學(xué)與管理,2009,34(12):152-154.