何先平,胡丹,劉建
(長江大學(xué)信息與數(shù)學(xué)學(xué)院,湖北 荊州434023)
近年來,隨著中國經(jīng)濟(jì)的高速發(fā)展,環(huán)境問題也日益突出,霧霾天氣等問題時常影響著中國各地。人們在享有工業(yè)文明社會帶來的生產(chǎn)生活等方面的進(jìn)步的同時,也開始反思人與自然的關(guān)系。因此如何分析研究污染的分類并進(jìn)行解釋顯得十分重要,其分析結(jié)果可為決策者提供參考依據(jù),從而更加即時和有效地調(diào)節(jié)污染防治政策。
設(shè)有n個樣品,每樣品觀測p個指標(biāo),原始數(shù)據(jù)陣為:
數(shù)據(jù)變換方法的具體步驟如下:
1)對數(shù)據(jù)陣分別按行和列求和,再求總和:
2)化數(shù)據(jù)陣X為規(guī)格化的“概率”矩陣P:
易得出0≤pij≤1,且因而pij可理解為數(shù)據(jù)xij出現(xiàn)的“概率”,稱P為對應(yīng)陣。
3)從對應(yīng)陣P出發(fā)計算變量的協(xié)方差陣(考慮R型因子分析),把P矩陣中的n個行作為p維空間中的n個樣品點(diǎn)。令Z=(zij)n×p,則變量間的協(xié)方差陣為:
4)從P出發(fā)計算樣品間的協(xié)方差陣(考慮Q型因子分析),用類似方法可得出n個樣品間的協(xié)方差為:
5)進(jìn)行數(shù)據(jù)的對應(yīng)變換。令Z=(zij)n×p,式(4)為從同時研究R型和Q型因子分析的角度導(dǎo)出的數(shù)據(jù)變換公式[1]:
式中,pi.和p.j分別為矩陣P的行和與列和。
將原始數(shù)據(jù)陣X變換為Z矩陣之后,變量點(diǎn)和樣品點(diǎn)的協(xié)方差陣分別為SR=ZTZ和SQ=ZZT。這2個矩陣存在明顯的簡單對應(yīng)關(guān)系,而將原始數(shù)據(jù)xij變換為zij后,zij關(guān)于i,j是對等的,即zij對變量和樣品是對等的。
因此,可以把變量點(diǎn)和樣品點(diǎn)同時放到反映同一因子軸所確定的平面上,根據(jù)接近程度對變量點(diǎn)和樣品點(diǎn)同時進(jìn)行分類[5]。
根據(jù) 《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》(GB3095-2012)和 《環(huán)境空氣質(zhì)量指數(shù)(AQI)技術(shù)規(guī)定(試行)》(HJ633-2012)的有關(guān)規(guī)定,湖北省省市級環(huán)保部門公開發(fā)布了相關(guān)的實(shí)時監(jiān)測數(shù)據(jù)。
筆者分析所用數(shù)據(jù)來源于湖北省武漢市2014年8月25日上午9∶00的空氣質(zhì)量實(shí)時監(jiān)測數(shù)據(jù),所使用的數(shù)據(jù)考慮2個屬性變量,分別是取樣點(diǎn)和大氣污染物(其中包含多個子變量,是污染物的具體成分)。以下為涉及大氣污染物的說明[3]:
1)二氧化硫(SO2)是最常見的硫氧化物,大氣主要污染物之一。二氧化硫主要來源于自然界含硫礦石的分解、火山噴發(fā)、工廠排出的尾氣、含硫燃料的燃燒等。
2)二氧化氮(NO2)又稱為過氧化氮,是氮氧化物之一,室溫下為有刺激性氣味的棕紅色氣體,二氧化氮在臭氧的形成過程中起著重要作用。人為產(chǎn)生的二氧化氮主要來自高溫燃燒過程的釋放,比如機(jī)動車、電廠廢氣的排放等,二氧化氮還是酸雨的主要成因之一。
3)環(huán)境空氣中空氣動力學(xué)當(dāng)量直徑小于等于10μm的顆粒物稱為PM10,又稱為可吸入顆粒物。一些可吸入顆粒物來自污染源的直接排放,比如煙囪與車輛。另一些則是由環(huán)境空氣中硫氧化物、氮氧化物、揮發(fā)性有機(jī)化合物及其它化合物互相作用形成的細(xì)小顆粒物。
4)一氧化碳(CO)是一種無色、無味、無嗅的窒息性氣體,即通常所說的能引起人體中毒的 “煤氣”。它屬于常見的碳氧化物,主要來源于含碳燃料的不完全燃燒、汽車尾氣、工廠排放和人群吸煙等,是大氣主要污染物之一。
5)對流層臭氧(O3)(通常被稱為 “有害”臭氧)是人為產(chǎn)物,它是內(nèi)燃機(jī)和發(fā)電廠造成的空氣污染所引起的。汽車廢氣和工業(yè)排放物會釋放出一系列氮氧化物氣體(NOx)和揮發(fā)性有機(jī)化合物(VOC),這些都是燃燒汽油和煤的副產(chǎn)物。在高溫條件下,NOx和VOC與氧發(fā)生化學(xué)反應(yīng),形成臭氧。
6)細(xì)顆粒物(PM2.5)指環(huán)境空氣中空氣動力學(xué)當(dāng)量直徑小于等于2.5μm的顆粒物。PM2.5的成分很復(fù)雜,按其來源分為自然源和人為源2種:自然源包括土壤揚(yáng)塵、植物花粉、孢子、細(xì)菌等,人為源主要包括化石燃料的燃燒、汽車尾氣和工廠排放等。
把取樣點(diǎn)和氣體成分作為2個屬性變量,氣體成分考慮到SO2、NO2、PM10、CO、O3、PM2.5共6種大氣污染物,取樣點(diǎn)考慮到9個不同的地點(diǎn)。使用SPSS統(tǒng)計軟件中對應(yīng)分析過程處理表1數(shù)據(jù)可得輸出結(jié)果,并繪制各樣本采集點(diǎn)與污染物之間的關(guān)系圖。
表1 原始數(shù)據(jù)表
表2給出慣量和卡方統(tǒng)計量的分解,總卡方為356.812,總慣量為0.036,第一維與第二維的貢獻(xiàn)率之和已達(dá)82%,因此行和列的類目之間的聯(lián)系實(shí)質(zhì)上可用二維表示[1]。
圖1是9個樣品點(diǎn)和6個變量點(diǎn)在相同坐標(biāo)系上繪制的散布圖。綜合對應(yīng)分析法,從圖1中可以看出,武漢市的大氣污染情況可以分成4類,這4類地區(qū)的劃分上接近于圖1中4個象限的劃分[2]。
表2 統(tǒng)計結(jié)果
1)第1類(第1象限中)包含取樣點(diǎn)武昌紫陽、青山鋼花,變量為PM2.5、PM10。說明這2個區(qū)域的大氣結(jié)構(gòu)相似,且都PM2.5、PM10含量較高。原因是武漢青山的鋼鐵產(chǎn)業(yè)生產(chǎn)中所產(chǎn)生的大量硫化物氣體超標(biāo)排放較嚴(yán)重,紫陽路附近的武昌火車站、武昌造船廠在生產(chǎn)運(yùn)輸中產(chǎn)生的較多粉塵和有毒氣體是引起顆粒物嚴(yán)重超標(biāo)的主因。
2)第2類(第2象限邊緣)包含取樣點(diǎn)沉湖七壕和變量03。說明這個區(qū)域03含量較高。沉湖是國家級濕地保護(hù)區(qū)而采樣時間在暑假期間,大量游客往來造成的大量汽車尾氣排放可能是此處臭氧污染較為明顯的主因。
3)第3類(第3象限和第4象限中距離坐標(biāo)原點(diǎn)較近處,而東湖高新劃入該類是因?yàn)樵擖c(diǎn)距離6種污染物所示點(diǎn)中的CO點(diǎn)最短)中包含取樣點(diǎn)有吳家山、沌口新區(qū)、東湖高新、漢陽月湖、漢口花橋、武昌紫陽和漢口江灘,說明這6個區(qū)域的大氣結(jié)構(gòu)相似,且都CO含量較高。主要原因是這幾個地區(qū)中前3個地區(qū)是是國家級經(jīng)濟(jì)開發(fā)區(qū),而后3個區(qū)域位于武漢市中心,因此該類區(qū)域內(nèi)交通發(fā)達(dá),車流量巨大,因而汽車尾氣中的一氧化碳排放量較大。雖然該組中僅包含變量CO,但PM2.5、PM10這2點(diǎn)在圖中距該組中站點(diǎn)也較近,對其影響明顯,因此說明該類地區(qū)的顆粒物也有較明顯的超標(biāo)情況。
4)第4類(第4象限中距離坐標(biāo)原點(diǎn)遠(yuǎn)處)中包含變量為NO2、SO2。由圖1可見,這2種污染物距離武昌紫陽和青山鋼花最近,因此對其影響最明顯。這2個地區(qū)是武漢最大的重工業(yè)集中區(qū)域,有大量的鋼鐵、造船等重工業(yè)生產(chǎn),而2處均有大型火車站也是這2個地區(qū)同時具有顆粒物污染和硫化物、氮化物超標(biāo)嚴(yán)重這些特點(diǎn)的另外一個原因。
圖1 行、列坐標(biāo)的散布圖
從上述分析中筆者給出對污染治理的建議:①要針對各個地區(qū)的特點(diǎn),采取相應(yīng)環(huán)境治理的特點(diǎn);②對有空氣污染物相似的地區(qū)可以采取聯(lián)合治理的措施;③對一些不可避免的生產(chǎn)造成的污染,如化工污染,要從技術(shù)層面生產(chǎn)工藝上減少污染,而不是簡單的廠區(qū)外遷;④針對工業(yè)產(chǎn)區(qū),可以對工廠采取減排、限排、提高生產(chǎn)工藝的方式減少廢氣排放:東湖高新、沌口新區(qū)、吳家山3個地區(qū)同為國家級經(jīng)濟(jì)開發(fā)區(qū),座落其中的大量生產(chǎn)企業(yè)可以通過減少煤炭等含硫量高能源的使用,換代新能源等方式來減少一氧化碳排量;漢口花橋、漢陽月湖、漢口江灘可以限制排放不達(dá)標(biāo)的交通工具的通行,大力發(fā)展地鐵、電動汽車等清潔能源的公共交通工具以同時減少粉塵和一氧化碳的產(chǎn)生;沉湖濕地保護(hù)區(qū)內(nèi)的臭氧含量較高問題,也可通過此法改善。武昌紫陽、青山鋼花等地由于有重要的重工業(yè)生產(chǎn),雖不能短期內(nèi)徹底改換新型設(shè)備和搬遷生產(chǎn)場地,但可以通過適當(dāng)栽培綠色植被和不間斷的對路面進(jìn)行灑水作業(yè),從而減少粉塵的產(chǎn)生,而通過逐步的工藝改進(jìn)也減少硫化物和氮化物的產(chǎn)生。
使用SPSS統(tǒng)計軟件中的因子分析過程,可得表3中的輸出結(jié)果。表3中顯示前2個主成分的特征值大于1,但它們的累計貢獻(xiàn)率僅為69.621%。通過4次最大旋轉(zhuǎn)后得到表4結(jié)果,即得6個變量在4個因子上的新的因子載荷[4]。結(jié)果顯示,因子F1支配的變量有SO2、NO2、PM10,因子F2支配的變量有NO2、PM10、O3,因子F3支配的變量有CO,因子F4支配的變量有PM2.5。
表3 主成分信息
表4 旋轉(zhuǎn)后的因子載荷矩陣
通過比較對應(yīng)分析法所得結(jié)果,明顯可見表3各正交因子的載荷不滿足結(jié)構(gòu)簡化的要求,通過最大正交旋轉(zhuǎn)后,雖然各因子可以明顯顯示其代表的污染物,即SO2為F1這類載荷的典型代表,O3為F2這類載荷的典型代表,CO為F3這類載荷的典型代表,PM2.5為F4這類載荷的典型代表,但結(jié)果并不能清晰的表明各因子對其他污染物的影響,也不能明確的表現(xiàn)出各污染物之間相互關(guān)系以及采樣點(diǎn)不同所帶來的影響。
由此可見,常用于環(huán)境污染問題研究中的因子分析法一般側(cè)重于對采樣點(diǎn)污染程度進(jìn)行評價、分級,對采樣點(diǎn)污染的相似性進(jìn)行分類研究。而通過對比對應(yīng)分析法和因子分析法在處理同樣本數(shù)據(jù)的情況下,對應(yīng)分析法在尋求建立變量和樣品間的關(guān)系時,明顯優(yōu)于因子分析法,相較因子分析法結(jié)果更簡明準(zhǔn)確并省去了大量的計算和檢驗(yàn)過程,所以表明其更適于分析研究這類環(huán)境污染問題。
筆者運(yùn)用對應(yīng)分析方法對武漢市幾個采樣點(diǎn)大氣數(shù)據(jù)進(jìn)行實(shí)證分析,將取樣點(diǎn)和環(huán)境變量同時反映到相同的因子軸上,從而揭示了所研究的取樣點(diǎn)和變量間的內(nèi)在聯(lián)系,對環(huán)境污染的成因進(jìn)行解釋和推斷,為污染治理提供參考,有利于針對特定的問題提出具體解決方案,是一種較好的環(huán)境污染研究方法。現(xiàn)階段全國興建了不少自動化環(huán)境監(jiān)測站,采集并公開了大量的城市空氣質(zhì)量數(shù)據(jù),使得使用該方法進(jìn)行長期和全面的分析研究具備了很好的實(shí)施條件,并為充分利用這些數(shù)據(jù)資源提供了一個可行的方向。
[1]高惠璇.應(yīng)用多元統(tǒng)計分析 [M].北京:北京大學(xué)出版社,2005:324~342.
[2]達(dá)摩達(dá)爾·N·古扎拉蒂.計量經(jīng)濟(jì)學(xué)基礎(chǔ) [M].費(fèi)劍平,孫春霞等譯.北京:人民大學(xué)出版社,2005:274~298.
[3]申明金,胡永金.環(huán)境污染研究的對應(yīng)分析方法及其應(yīng)用 [J].大連民族學(xué)院學(xué)報,2005(5):30~32.
[4]吳誠鷗,秦偉良.近代實(shí)用多元統(tǒng)計分析 [M].北京:氣象出版社,2007:151~183.
[5]茆詩松,程依明.概率論與數(shù)理統(tǒng)計教程 [M].第2版.北京:高等教育出版社,2011:253~261.