王 臻
(福建省海洋環(huán)境與漁業(yè)資源監(jiān)測中心 福州 350003)
基于主成分-聚類分析法的沙埕港海域水質狀況評價*
王 臻
(福建省海洋環(huán)境與漁業(yè)資源監(jiān)測中心 福州 350003)
通過對2012年沙埕港海域水質調查數(shù)據(jù)的主成分分析,并利用聚類法,對12個調查站位進行分類。根據(jù)分析結果對水質狀況進行評價。結果顯示沙埕港水質污染情況總體是從灣中部往灣頂和灣口逐漸加重。中部區(qū)域主要污染因子為無機污染物,灣頂和灣口的主要污染因子為油類和重金屬。主成分-聚類分析較為客觀地反映了實際情況,可較好地應用于海洋環(huán)境評價。
主成分分析;聚類分析;沙埕港;水質;評價
沙埕港位于福建北部的福鼎市,與浙江蒼南縣接壤,是福建省重要漁港之一。港道彎曲狹長,深入內(nèi)陸,水深無礁,久不淤積,不起風浪,航道穩(wěn)定,是我國東南沿海的天然良港。沙埕港周邊無大河匯入,流入灣內(nèi)的河流有水北溪、照蘭溪、大岳溪、百步溪及店下溪等11條,其中9條流入灣頂,2條匯注港灣中下段,均屬山溪性河流[1]。2009年福鼎市政府以沙埕港為中心,實施漁業(yè)興市和加大對臺貿(mào)易,投資上億元用于港口建設。由于深度開發(fā)而造成的沙埕港海域水質污染狀況日趨嚴重。本文利用主成分-聚類分析法對沙埕港海域水質污染狀況進行評價,客觀反映水質實際污染情況,對行政主管部門優(yōu)化海洋產(chǎn)業(yè)結構,創(chuàng)建海洋生態(tài)文明提供科學依據(jù)。
1.1 樣品采集和調查方法
2012年在沙埕港海域布設調查站位12個(圖1),分別于1月、5月、8月、10月對其表層海水水質進行采樣調查。樣品采集方法按照GB 17378.3-2007《海洋監(jiān)測規(guī)范第3部分樣品采集、儲存和運輸》[2]執(zhí)行,樣品測定方法依據(jù)GB 17378.4-2007《海洋監(jiān)測規(guī)范第4部分:海水分析》[3]執(zhí)行。調查及評價指標為p H、懸浮物、溶解氧、化學耗氧量、活性磷酸鹽、亞硝酸鹽-氮、硝酸鹽-氮、氨-氮、石油類、銅、鉛、鎘,總汞、砷。
圖1 調查站位圖
1.2 主成分—聚類分析法
主成分分析是采取一種數(shù)學降維的方法,找出幾個綜合變量來代替原來眾多的變量,使這些綜合變量能盡可能地代表原來變量的信息量,而且彼此之間互不相關。其分析步驟為:① 原始數(shù)據(jù)標準化處理;② 計算各因子相關關系矩陣;③ 求解矩陣特征根和特征向量;④ 選擇主成分,寫出主成分表達式;⑤ 計算主成分得分;⑥ 依據(jù)得分數(shù)據(jù),用回歸方法得出評價結果;⑦ 對評價結果進行聚類分析。
2.1 調查結果
調查結果描述統(tǒng)計分析見表1。
表1 調查結果描述統(tǒng)計分析 mg/L
2.2 主成分-聚類分析
本文利用spss13.0軟件對調查數(shù)據(jù)進行運算和分析,將數(shù)據(jù)進行標準化后計算相關系數(shù)矩陣,結果見表2。
表2 各指標相關系數(shù)矩陣
由表2看出,原始數(shù)據(jù)中COD和p H之間,懸浮物和溶解氧、化學需氧量等指標之間都存在很強的相關性,因此,該組數(shù)據(jù)滿足降維的條件。對數(shù)據(jù)進行主成分分析,對數(shù)據(jù)矩陣求解特征值,結果見表3。
表3 各成分特征值
續(xù)表
由表3看出,前3個主成分的特征值均大于1,且累計貢獻率達到83.362%(大于80%),因此,用前3個主成分的信息損失率為16.638%,基本可以反映原始數(shù)據(jù)的信息。
由表4可知,第一主成分中,p H、SS、COD、DIP、DIN、DO、As載荷較高,可以認為該主成分代表了影響水質的無機因子。第二主成分中,Cu、Pb、Cd、Hg荷載較高,可以認為該成分代表了影響水質的重金屬因子。第三主成分Oils荷載較高,因此該成分代表了以油類為主的有機因子。
表4 因子載荷矩陣
計算出各因子在前3個成分上的得分系數(shù),并通過回歸分析,得出各調查站位在前3個主成分上的得分及調查站位綜合得分,見表5和表6。
表5 因子得分系數(shù)矩陣
表6 各調查站點在主成分中的得分
由表6的綜合評價得分可以看出,沙埕港水質SC04最好,而SC11最差。本文在參考了多篇相關研究報告[4-9],并根據(jù)實際情況選擇Q型聚類方式,小類與小類間親疏程度的度量使用組間平均連鎖法,測量間距為歐幾里得距離平方和,根據(jù)表6中各調查站點在主成分中的得分,按照站點距離進行聚類,畫出聚類譜系圖(圖2)。
圖2 聚類譜系圖
由圖2可以看出全部站點按照樣本距離遠近被分為若干個相似的小類,最后聚為一類。若選用某個固定距離作為閾值,則可將各站位按照需要分為幾個大類。沙埕港水體污染特征比較復雜,為了更好地體現(xiàn)各區(qū)域污染情況的共性特征,本文以距離24作為閾值 (圖2中虛線表示),將各調查站點分為三大類。由此可以看出,第一大類包含站位SC03~SC010,這類站位主要位于沙埕港中部,主航道附近,主要污染因子是無機污染物。第二大類包含站位SC11、SC12站位,這類站位位于灣口區(qū)域,主要污染因子是重金屬。第三大類包含站位SC01、SC02,位于灣頂區(qū)域,主要污染因子為油類和重金屬。
(1)沙埕港水質污染情況總體是從灣中部往灣頂和灣口逐漸加重,腰嶼、青嶼和牛嶼之間海域水質最好,沙埕鎮(zhèn)和霞關鎮(zhèn)之間海域水質最差。沙埕港中部區(qū)域主要污染因子為無機污染物,灣頂和灣口的主要污染因子為油類和重金屬。
(2)主成分-聚類分析方法選取了特征值較大的幾個主成分對調查站點進行分類,客觀地反映了沙埕港水質的污染狀況,具有不受個別評價因子和人的主觀分類影響等優(yōu)點,是進行海洋環(huán)境評價的良好方法。
[1] 劉蒼字,郭成濤.福建沙埕港的沉積特征與泥沙來源研究[J].地理學報,1992,47(4):344-352.
[2] 中華人民共和國國家質量監(jiān)督檢驗檢疫總局.GB 17378.3-2007海洋監(jiān)測規(guī)范第3部分樣品采集、貯存和運輸[S].北京:中國標準出版社,2007.
[3] 中華人民共和國國家質量監(jiān)督檢驗檢疫總局.GB 17378.5-2007海洋監(jiān)測規(guī)范第5部分:沉積物分析[S].北京:中國標準出版社,2007.
[4] 林小蘋,黃長江,林福榮,等.海水富營養(yǎng)化評價的主成分-聚類分析方法[J].數(shù)學的實踐與認識, 2004,34(12):69-74.
[5] 張妍,尚金城,于相毅.主成分-聚類復合模型在水環(huán)境管理中的應用:以松花江吉林段為例[J].水科學進展,2005,16(4):592-595.
[6] 謝賢健,蘭代萍.基于因子分析法的沱江流域地表水水質的綜合評價[J].安徽農(nóng)業(yè)科學,2009,37 (3):1304-1306.
[7] 盧敦,張麗.聚類分析與因子分析在天津港富營養(yǎng)化分析中的應用[J].數(shù)學的實踐和認識,2010,40 (11):72-79.
[8] 呂晉,鄔紅娟,林濟東.主成分及聚類分析在水生態(tài)系統(tǒng)區(qū)劃中的應用[J].武漢大學學報:理學版, 2005,51(4):461-466.
[9] 陳斯婷,耿安朝.海洋環(huán)境影響評價技術研究初探[J].海洋開發(fā)與管理,2011,28(9):84-89.
福建省海洋與漁業(yè)廳主要海灣環(huán)境監(jiān)測專項(閩海漁2012166號).