文_樓玨璟 太倉市環(huán)境監(jiān)測站
主成分分析作為一種常用的多指標(biāo)統(tǒng)計方法,它將原來多個變量轉(zhuǎn)化為少數(shù)幾個綜合指標(biāo),從數(shù)學(xué)的角度說,是一種降維處理技術(shù)。主成分分析能夠在最大限度地保留原始數(shù)據(jù)信息的基礎(chǔ)上,對高維變量進(jìn)行綜合和簡化,并且能夠客觀地確定各個指標(biāo)的權(quán)重,避免了主觀隨意性,有一定的優(yōu)越性,已經(jīng)被廣泛地應(yīng)用于環(huán)境領(lǐng)域。
在環(huán)境評價中,主成分分析與環(huán)境標(biāo)準(zhǔn)相結(jié)合時,主要有兩種方法。盛周君,丁春等將環(huán)境標(biāo)準(zhǔn)加入評價樣本中同時進(jìn)行主成分分析;李俊,盧文喜等將環(huán)境標(biāo)準(zhǔn)單獨(dú)作為一個樣本進(jìn)行主成分分析,以環(huán)境標(biāo)準(zhǔn)的主成分綜合得分作為評價樣本等級的判定依據(jù)。本文將這兩種方法應(yīng)用于A市河流水質(zhì)評價中,就這兩種方法的可靠性進(jìn)行對比分析。
根據(jù)主成分分析的基本原理,可以把主成分分析的計算步驟歸納如下:
由于主成分分析中各個因子的量綱、大小以及評價指標(biāo)往往差別很大,可比性較差,為了消除這些影響,因此首先進(jìn)行標(biāo)準(zhǔn)化,使其具有良好的可比性。對樣本變量 作變換,標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣記為數(shù)據(jù)標(biāo)準(zhǔn)化主要包括同趨化和無量綱化兩個方面。同趨化主要解決不同性質(zhì)數(shù)據(jù)問題,使所有指標(biāo)對評價結(jié)果的作用同趨化;無量綱化主要解決數(shù)據(jù)的可比性問題。
計算相關(guān)系數(shù)矩陣R的特征值λj,相應(yīng)的單位特征向量lij及主成分載荷因子矩陣。特征值是各個主成分的方差,主要說明的是各個主成分在描述被評價對象上所起作用的大小,方差越大,則對評價對象作用越明顯。每一特征向量則是對應(yīng)主成分的線性表達(dá)式中原始指標(biāo)的組合系數(shù),說明了主成分與指標(biāo)間的定量關(guān)系。載荷因子揭示了主成分與指標(biāo)之間的密切程度,即每個主成分主要替代了何種指標(biāo)的作用。
選取主成分的個數(shù)取決于主成分的累計方差貢獻(xiàn)率,通常選取累計貢獻(xiàn)率大于85%以上等主成分,這些主成分更好地保留了原來因子的信息,減少了因子數(shù)量,從而起到篩選因子的作用。
將各個樣本的標(biāo)準(zhǔn)化數(shù)據(jù)分別代入各主成分的表達(dá)式中,計算得到各主成分的分值,以各主成分的方差貢獻(xiàn)率為權(quán)重求和,得到各樣本的綜合評價分值,分值越大,污染越嚴(yán)重。
本次分析選取2016年A市22個河流水環(huán)境例行監(jiān)測斷面數(shù)據(jù),河流水質(zhì)監(jiān)測斷面包括2個國家“水十條”考核斷面、4個省級考核斷面、1個城市內(nèi)河斷面、3個市級考核斷面、12個市控斷面。選取9個監(jiān)測指標(biāo)為研究對象,利用主成分分析法對各個監(jiān)測斷面的水質(zhì)進(jìn)行評價,包括X1(溶解氧)、X2(高錳酸鹽指數(shù))、X3(生化需氧量)、X4(氨氮)、X5(化學(xué)需氧量)、X6(總氮)、X7(總磷)。
運(yùn)用SPSS軟件對A市22個河流水環(huán)境7個指標(biāo)的例行監(jiān)測斷面數(shù)據(jù)進(jìn)行主成分分析,構(gòu)造2個樣本,樣本1為2016年A市22個河流水環(huán)境例行監(jiān)測斷面數(shù)據(jù),樣本2為監(jiān)測數(shù)據(jù)與五類水質(zhì)標(biāo)準(zhǔn)數(shù)據(jù)共同組成。
從表1可以看出樣本1中第一主成分的高錳酸鹽指數(shù)、氨氮、總氮相關(guān)系數(shù)較高,是影響水質(zhì)的主要因子,第二主成分的溶解氧、化學(xué)需氧量相關(guān)系數(shù)較高。從表2可以看出,樣本2中第一主成分的高錳酸鹽指數(shù)、溶解氧、總磷相關(guān)系數(shù)較高,第二主成分中總氮、化學(xué)需氧量的相關(guān)系數(shù)較高。
這兩種方法提取出的主成分代表了原有指標(biāo)的大部分信息,可以替代原有指標(biāo)進(jìn)行水質(zhì)評價。
表1 樣本1的特征值與累計貢獻(xiàn)率
表2 樣本2的特征值與累計貢獻(xiàn)率
根據(jù)各主成分貢獻(xiàn)率,得出其在綜合得分中的權(quán)重,綜合得分表達(dá)式:
樣本1:Z=0.9029Z1+0.0971Z2
樣本2:Z=0.7757Z1+0.2243Z2
根據(jù)評價時段內(nèi)該斷面參評的指標(biāo)中類別最高的一項來確定河流水質(zhì)等級,2016年國家“水十條”考核斷面A斷面水質(zhì)符合Ⅱ類水水質(zhì)要求,水質(zhì)狀況為優(yōu);B斷面水質(zhì)符合Ⅲ類水水質(zhì)要求,水質(zhì)狀況為良好。
根據(jù)樣本1、樣本2評價結(jié)果,各監(jiān)測斷面污染程度對比。根據(jù)圖1可以看出,兩種評價方法的評價結(jié)果基本相同,監(jiān)測斷面的污染程度排序與監(jiān)測結(jié)果實(shí)際情況符合,兩種方法均可反應(yīng)水質(zhì)污染程度。因此,無論是單獨(dú)對評價樣本進(jìn)行主成分分析,還是將評價標(biāo)準(zhǔn)加入樣本中進(jìn)行主成分分析,水質(zhì)污染程度評價結(jié)果基本相同,不影響評價結(jié)果,污染程度與實(shí)際監(jiān)測結(jié)果相符,在水環(huán)境質(zhì)量評價工作中均具有一定的可靠性。
圖1 兩種樣本評價結(jié)果對比
主成分分析可以減少原始數(shù)據(jù)信息損失,簡化數(shù)據(jù)結(jié)構(gòu),避免主觀隨意性。但由于其核心思想是提取變異程度較大的變量,更多反映的是不同年份污染物在含量上的差異,可以反映出環(huán)境質(zhì)量的變化趨勢。本文采用兩種主成分分析法對A市城市河流水質(zhì)進(jìn)行評價分析,對比顯示兩種方法都能正確評價反映出水質(zhì)污染程度,得出的評價結(jié)果與事實(shí)較為接近。