鄭煜,鄧蘭
基于PLS1的哈爾濱市PM2.5與空氣污染物相關(guān)性分析
鄭煜,鄧蘭
東北林業(yè)大學(xué),黑龍江 哈爾濱 150040
以往對PM2.5的研究多集中在氣象因子或單一空氣污染物對PM2.5質(zhì)量濃度變化的影響,未考慮多種空氣污染物對PM2.5質(zhì)量濃度的協(xié)同作用。通過哈爾濱市環(huán)保局發(fā)布的2014年1月份(共31 d)市區(qū)內(nèi)主要空氣污染物SO2、NO2、PM10、CO、O3、PM2.5的質(zhì)量濃度數(shù)據(jù),運(yùn)用相關(guān)性分析、PLS1和通徑分析方法,研究哈爾濱市區(qū)內(nèi)主要空氣污染物對PM2.5質(zhì)量濃度變化的直接影響、通過其他空氣污染物的間接影響及污染物之間的協(xié)同作用。結(jié)果表明,SO2、NO2、PM10、CO與PM2.5質(zhì)量濃度顯著性相關(guān),O3與PM2.5質(zhì)量濃度相關(guān)性不顯著,SO2、NO2、PM10、CO之間存在嚴(yán)重的復(fù)相關(guān)性。依據(jù)相關(guān)性分析結(jié)果,建立了SO2、NO2、PM10、CO對PM2.5質(zhì)量濃度的PSL1模型,模型的擬合優(yōu)度r2為0.852,模型擬合良好。對所建立的模型進(jìn)行通徑分析,結(jié)果顯示,SO2、NO2、PM10、CO對PM2.5質(zhì)量濃度變化的直接作用分別為0.005、-0.142、-0.140、1.191,CO對PM2.5質(zhì)量濃度變化的直接影響作用最大。SO2、NO2、PM10通過CO對PM2.5質(zhì)量濃度變化的間接作用分別為0.706、1.011、1.118均大于它們對PM2.5質(zhì)量濃度變化的直接作用。SO2、NO2、PM10、CO對PM2.5質(zhì)量濃度變化的總決定系數(shù)為85.9%。CO是主要空氣污染物中影響PM2.5質(zhì)量濃度變化的主要因素,降低冬季煤炭供暖期CO的排放量,有利于提高空氣環(huán)境質(zhì)量,降低對人體的健康危害。
PM2.5;CO;PLS1;通徑分析;空氣污染物
近年來,空氣質(zhì)量問題越來越受到人們的關(guān)注,尤其是對空氣能見度和人類健康造成嚴(yán)重影響的灰霾現(xiàn)象(魏香玉等,2009;王晨波等,2013;宋宇等,2003)。2012年2月29日,環(huán)境保護(hù)部公布了新修訂的《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》,在新標(biāo)準(zhǔn)中首次將對危害人類健康的細(xì)顆粒物PM2.5確立為產(chǎn)生灰霾的主要因素(王瑋等,2000)。PM2.5是指存在于大氣中,空氣動(dòng)力學(xué)直徑小于或等于2.5 μm的可入肺顆粒,主要是由空氣中的氣態(tài)污染物與直接排放到空氣中的一次微粒經(jīng)過一系列化學(xué)或光化學(xué)反應(yīng)而生成的二次微粒,屬于二次反應(yīng)生成的復(fù)合型污染物(錢婧等,2013;廖乾邑等,2013)。雖然PM2.5在大氣成分中所占的比例很小,但由于其的粒徑小,能夠在大氣中停留較長時(shí)間,輸送距離較遠(yuǎn),并富含有大量的有毒有害物質(zhì),極易富集于肺部,對大氣環(huán)境和人體健康均存在著極大的威脅(陳武等,2012;郭濤等,2012;楊維等,2013)。因此,研究哈爾濱市冬季空氣中PM2.5及空氣污染物之間的關(guān)系,有利于找到影響冬季灰霾天氣增多的原因。
現(xiàn)今對PM2.5與空氣污染物或氣象因子相關(guān)關(guān)系的分析,一般采用的是相關(guān)性分析、主成分分析、因子分析等多元統(tǒng)計(jì)分析的方法(史宇等,2013;黃虹等,2009;潘傳信等,2013;孟曉艷等,2013)。由于這些研究方法只對PM2.5與空氣污染物間的相關(guān)性進(jìn)行了分析,忽略了污染物自身間的多重復(fù)相關(guān)性,導(dǎo)致在建立PM2.5與空氣污染物間的線性回歸模型時(shí),破壞了參數(shù)估計(jì),擴(kuò)大了模型誤差,使模型喪失了穩(wěn)定性,致使所建立的模型失效。若對這樣的數(shù)據(jù)強(qiáng)行建立模型,自變量的系數(shù)往往也很難解釋。而偏最小二乘回歸方法(PLS)能夠在自變量存在嚴(yán)重多重復(fù)相關(guān)性及樣本點(diǎn)個(gè)數(shù)少于變量個(gè)數(shù)的條件下進(jìn)行回歸建模,模型中將包含所有的原有自變量,并且每個(gè)自變量的回歸系數(shù)將更容易被解釋。同時(shí)利用通徑分析方法把因變量與自變量之間的相關(guān)關(guān)系劃分為直接作用及通過其他變量的間接作用,能夠更好的分析各變量之間的相互作用關(guān)系。
本文利用哈爾濱市環(huán)保局發(fā)布的2014年1月份(共31 d)市區(qū)內(nèi)主要空氣污染物SO2、NO2、
PM10、CO、O3、PM2.5的質(zhì)量濃度數(shù)據(jù)為研究對象,通過相關(guān)性分析,運(yùn)用PLS1方法建立了主要空氣污染物對PM2.5質(zhì)量濃度的PSL1模型。對所建立的PLS1模型運(yùn)用通徑分析方法,更進(jìn)一步的得出各主要空氣污染物對PM2.5質(zhì)量濃度的直接影響作用及通過其他污染物對PM2.5質(zhì)量濃度的間接影響作用的大小,有利于找到影響PM2.5質(zhì)量濃度變化的內(nèi)在因素,為如何選擇降低PM2.5的質(zhì)量濃度的方法提供理論支持。
1.1研究區(qū)概況
哈爾濱市位于東經(jīng)125°42′~130°10′,北緯44°04′~46°40′之間,是東北地區(qū)北部的政治、經(jīng)濟(jì)、文化和交通中心,是中國省轄市中陸地管轄面積最大、管轄人口居第二位的特大城市。氣候?qū)儆谥袦貛Т箨懠撅L(fēng)氣候,冬長夏短,冬季寒冷漫長,冬季1月平均氣溫約零下19 ℃。哈爾濱市2013年空氣質(zhì)量超標(biāo)天數(shù)為171 d,其中冬季超標(biāo)天數(shù)為87 d,首要污染物均為PM2.5。2014年1月份及2月份空氣質(zhì)量超標(biāo)天數(shù)為47 d,首要污染物為PM2.5,均超年二級(jí)標(biāo)準(zhǔn)2倍以上。哈爾濱市冬季面臨著嚴(yán)重的空氣環(huán)境污染問題。
1.2數(shù)據(jù)來源
本文所用數(shù)據(jù)為:2014年1月1日至1月31日(共31 d)哈爾濱市環(huán)保局發(fā)布的哈爾濱市南崗學(xué)府路監(jiān)測點(diǎn)位監(jiān)測的空氣環(huán)境質(zhì)量日報(bào)數(shù)據(jù),數(shù)據(jù)共7項(xiàng),包括SO2、NO2、PM10、CO、PM2.5平均質(zhì)量濃度及臭氧一小時(shí)平均質(zhì)量濃度(O3(1h))、臭氧八小時(shí)平均質(zhì)量濃度(O3(8h))。哈爾濱市南崗學(xué)府路屬于哈爾濱市商業(yè)及人居密集區(qū),位于哈爾濱市中心,能夠代表哈爾濱市區(qū)內(nèi)空氣環(huán)境質(zhì)量。
1.3研究方法
1.3.1 相關(guān)性分析
在實(shí)際生產(chǎn)生活和科研的過程中,經(jīng)常會(huì)遇到多個(gè)因素同時(shí)對一個(gè)事物或現(xiàn)象產(chǎn)生影響的情況,由于多變量間一般都存在一定的相關(guān)性,或強(qiáng)或弱,使得信息在一定程度上產(chǎn)生重疊,阻礙對事物或現(xiàn)象的深入分析。相關(guān)性分析是對兩種或兩種以上的事物或現(xiàn)象是否具有相關(guān)性及其相關(guān)性的強(qiáng)弱進(jìn)行分析的一種統(tǒng)計(jì)方法。
1.3.2 單因變量偏最小二乘回歸(PLS1)原理及方法
(1)t1和u1應(yīng)盡可能多地?cái)y帶它們各自數(shù)據(jù)表中的變異信息;
(2)t1和u1的相關(guān)程度能夠達(dá)到最大。
在第一個(gè)成分t1和u1被提取后,偏最小二乘回歸分別實(shí)施X對t1的回歸以及Y對t1的回歸,如果回歸方程已經(jīng)達(dá)到滿意的精度,則算法終止;否則,將利用X被t1解釋后的殘余信息以及Y被t1解釋后的殘余信息進(jìn)行第二輪的成分提取。如此往復(fù),直到能達(dá)到一個(gè)較滿意的精度為止。若最終對X共提取了m個(gè)成分t1,t2,…,tm,偏最小二乘回歸將通過實(shí)施Y對t1,t2,…,tm的回歸,然后再表達(dá)成Y關(guān)于原變量x1,x2,…,xp的回歸方程,至此偏最小二乘回歸建模完成。
根據(jù)上述原理,偏最小二乘回歸的算法可歸納為如下步驟:
(1)將X與Y進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化后的自變量矩陣E0和因變量矩陣F0。
(2)從E0中抽取一個(gè)成分,t1=E0W1,其中:
實(shí)施E0在t1上的回歸:E0=t1P1?+E1,即:E1=E0-t1P1,其中:
檢查收斂性,若Y對tj的回歸方程已達(dá)到滿意的精度,則進(jìn)行下一步;否則,令:E1=E0,回到第(2)步,對殘余矩陣進(jìn)行回歸分析。
(3)在第h步(h=2,…,m),方程滿足精度要求,這時(shí)得到用個(gè)成分t1,t2,…,tm,實(shí)施F0在t1,t2,…,tm上的回歸,得:
由于t1,t2,…,tm均是E0的線性組合,因此可寫成E0的線性組合形式,即:,其中:
(4)按照標(biāo)準(zhǔn)化的逆過程,將的回歸方程還原為Y對X的回歸方程。
1.3.3 通徑分析
通徑分析是1921年由數(shù)量遺傳學(xué)家Sewall Wright提出的,并經(jīng)遺傳育種學(xué)者不斷改進(jìn)和完善而形成的一種標(biāo)準(zhǔn)化的多元線性回歸分析方法。它不是一般的標(biāo)準(zhǔn)化多元線性回歸分析,不是用來預(yù)測和控制的,也不是相關(guān)分析,而是把自變量與因變量之間的相關(guān)關(guān)系劃分成直接作用和通過其他變量的間接作用的一種統(tǒng)計(jì)分析方法。通過對所建立模型的通徑分析,能夠告訴我們在沒有其他變量摻雜進(jìn)去的情況下,xi對y的本質(zhì)作用的大小,得到某個(gè)自變量決定y的最佳路徑,具有決策的意義。通徑分析是由標(biāo)準(zhǔn)化線性回歸的正則方程來表達(dá)的:
其中xxr為pxxx,,,21…的相關(guān)陣,,xyr為x對y的相關(guān)陣,即。對于p=4,有
上式第一個(gè)方程表明,x1對y的直接影響, x1通過x2對y的間接影響為r12,x1通過x3對y的間接影響為r13,x1通過x4對y的間接影響為,四者之和為x對y的總影響力r,即r由1y1yx1的直接影響和三個(gè)間接影響組成。
在通徑分析中,各條路徑也有其相應(yīng)的決定系數(shù),它由如下分解得出:
2.1相關(guān)性分析
以PM2.5(y)、SO2(x1)、NO2(x2)、PM10(x3)、CO(x4)、O3(1h)(x5)、O3(8h)(x6)為解釋變量,運(yùn)用SPSS軟件對哈爾濱市2014年1月1日至1月31日AQI日報(bào)數(shù)據(jù)進(jìn)行相關(guān)性分析及多重共線性分析,結(jié)果見表1和表2。
表1 相關(guān)性分析結(jié)果Table 1 The results of correlation analysis
表2 多重共線性分析結(jié)果Table 2 The results of multi-colinearity
由表1可知,PM2.5與SO2、NO2、PM10、CO具有強(qiáng)相關(guān)性,PM2.5與O3(1h)、O3(8h)相關(guān)性不顯著。由表2可知,CO膨脹因子VIF超過10,且SO2、NO2、PM10、CO的容差均接近于0,說明SO2、NO2、PM10、CO之間存在嚴(yán)重的多重復(fù)相關(guān)性。
2.2PM2.5的PLS1回歸模型的建立
結(jié)合相關(guān)性分析結(jié)果,利用哈爾濱市2014年1月16日至1月31日哈爾濱市AQI日報(bào)數(shù)據(jù),以PM2.5(y)為因變量,SO2(x1)、NO2(x2)、PM10(x3)、CO(x4)為自變量,運(yùn)用DPS軟件建立SO2、NO2、PM10、CO對PM2.5的PSL1回歸模型,模型公式如下:
經(jīng)檢驗(yàn),模型的擬合優(yōu)度r-2為0.852,模型擬合良好。
2.3PM2.5的PLS1回歸模型的通徑分析
根據(jù)相關(guān)性分析結(jié)果,由通徑分析方法得到回
歸模型(1)的正則方程為:
運(yùn)用Excel軟件對回歸模型(1)中因變量y與自變量xi(i=1,2,3,4)進(jìn)行通徑分析,結(jié)果見表3。
表3 通徑分析結(jié)果Table 3 The results of path analysis
由表3可以得出:
xi對y的直接決定系數(shù):
xi的各相關(guān)路徑y(tǒng)的間接決定系數(shù):
xi對y的總決定系數(shù):
剩余因素ε對y的直接影響作用:
剩余因素ε的決定系數(shù):
PM2.5的PSL1回歸模型的通徑分析表明:
(1)對PM2.5的直接作用中,SO2對PM2.5的直接作用最小為0.005,CO對PM2.5的直接作用最大為1.191,NO2、PM10對PM2.5的直接作用分別為-0.412、-0.14。
(2)對PM2.5的間接作用中,SO2、NO2、PM10通過CO對PM2.5的間接作用分別為0.706、1.011、1.118,均大于它們對PM2.5的直接作用值。
(3)對PM2.5的總作用中,CO對PM2.5的總作用最大,為0.924;PM10對PM2.5的總作用其次,為0.867;對PM2.5的總作用最小的是SO2,為0.738;NO2對PM2.5的總作用為0.761。
(4)對影響PM2.5質(zhì)量濃度的主要污染物中,SO2、NO2、PM10、CO對PM2.5的決策系數(shù)分別為0.5%、-23.6%、-26.2%、82.6%。
(5)剩余因素ε對PM2.5濃度影響的決策系數(shù)為10.5%,對PM2.5的直接作用為0.324。
由以上分析可知,SO2、NO2、PM10、CO對PM2.5濃度影響的總決定系數(shù)達(dá)到89.5%,其中CO對PM2.5的直接作用最大,SO2、NO2、PM10對PM2.5的直接作用均小于它們通過CO對PM2.5的間接作用。因此,CO對哈爾濱市PM2.5濃度的變化起到了重要的影響。
PM2.5、SO2、NO2、PM10、CO之間具有顯著性相關(guān)關(guān)系,CO與PM2.5質(zhì)量濃度之間相關(guān)性最強(qiáng)。在數(shù)據(jù)量少及SO2、NO2、PM10、CO之間具有多重復(fù)共線性的前提下,建立了PM2.5與SO2、NO2、PM10、CO的PLS1模型,通過對PLS1模型的通徑分析得出影響PM2.5質(zhì)量濃度變化的主要空氣污染物是CO。CO對PM2.5質(zhì)量濃度的直接作用及SO2、NO2、PM10質(zhì)量濃度通過CO對PM2.5質(zhì)量濃度的間接作用均最大,因而逐步提高供暖過程中煤炭的充分燃燒率,減少CO的排放量,有利于降低冬季PM2.5質(zhì)量濃度,提高空氣環(huán)境質(zhì)量。
PLS1方法解決了目前PM2.5相關(guān)數(shù)據(jù)量較少,且影響PM2.5質(zhì)量濃度變化的各自變量之間嚴(yán)重的復(fù)相關(guān)性問題,更好的解釋了回歸模型中各變量的系數(shù)。通徑分析方法進(jìn)一步的分析了回歸模型中SO2、NO2、PM10、CO對PM2.5質(zhì)量濃度變化的直接作用及通過其他自變量的間接作用,更細(xì)致的分析了影響PM2.5質(zhì)量濃度變化的因素,也為其他地區(qū)制定有效的降低PM2.5質(zhì)量濃度的方法提供了理論依據(jù)和技術(shù)支持。
陳武, 董發(fā)勤, 鄧躍全, 等. 2012. 銀川市城郊 PM2.5質(zhì)量濃度日變化規(guī)律與組成特性分析[J]. 礦物學(xué)報(bào), 增刊: 131-132.
郭濤, 馬永亮, 賀克斌. 2009. 區(qū)域大氣環(huán)境中PM2.5/PM10空間分布研究[J]. 環(huán)境工程學(xué)報(bào), 3(1): 147-150.
廖乾邑, 張巍, 陳建文, 等. 2013. 環(huán)境空氣背景值中PM2.5和PM10的相關(guān)性分析[J]. 四川環(huán)境, (2): 16-19.
錢婧, 韓婧, 阮幸. 2014. 西安市冬季重污染天PM2.5高分辨率及其中碳
氣溶膠污染特征分析[J]. 生態(tài)環(huán)境學(xué)報(bào), 23(3): 464-471.
史宇, 張建輝, 羅海江, 等. 2013. 北京市2012-2013年秋冬季大氣顆粒物污染特征分析[J]. 生態(tài)環(huán)境學(xué)報(bào), 22(9): 1571-1577.
宋宇, 唐孝炎, 方晨, 等. 2003. 北京市能見度下降與顆粒物污染的關(guān)系[J]. 環(huán)境科學(xué)學(xué)報(bào), 23(4): 468-471.
王晨波. 2013. PM2.5濃度對能見度影響分析[J]. 科技信息, (15): 439-440.
王瑋, 湯大鋼, 劉紅杰. 2000. 中國PM2.5污染狀況和污染特征的研究[J].環(huán)境科學(xué)研究, 13(1): 1-5.
魏玉香, 銀燕, 楊衛(wèi)芬, 等. 2009. 南京地區(qū)PM2.5污染特征及其影響因素分析[J]. 環(huán)境科學(xué)與管理, 34(9): 29-34.
楊維, 趙文吉, 宮兆寧, 等. 2013. 北京城區(qū)可吸入顆粒物分布特性與呼吸系統(tǒng)疾病關(guān)分析[J]. 環(huán)境科學(xué), 34(1): 237-243.
Correlation Analysis Based on PSL1 between PM2.5 and Air Pollutants in Harbin City
ZHENG Yu, DENG Lan
Northeast Forestry University, Haerbin 150040, China
In recent years, the environmental quality of air get the more attention of people, especially for visibility and great harm to human health of the fine particulate matter PM2.5. On the past studies the meteorological factors of PM2.5or single air pollutants of PM2.5mass concentration of change were focused on the influence of a variety of air pollutants on PM2.5mass concentration of synergy was not considered. Through the Harbin city environmental protection bureau released in January 2014, (a total of 31 days) within the city the main air pollutants SO2, NO2, PM10, CO, O3, the mass concentration of PM2.5data, using correlation analysis, PLS1 and size analysis method, study the main air pollutants in Harbin concentration changes directly affect the quality of PM2.5, indirect effects through other air pollutants and synergy between pollutants. The results show that, SO2, NO2, PM10, CO and PM2.5mass concentration significantly related to O3and no significant correlation between PM2.5mass concentrations, SO2, NO2, PM10, CO of mass concentration of PM2.5PSL1 model, model of goodness of-fit-R2is 0.852, the model fitting is good. Size analysis of the established model, the results showed that SO2, NO2, PM10, CO a direct affect on quality of PM2.5concentration change were 0.005, -0.142, -0.140, 1.191 respectively, CO concentration changes directly affect the quality of PM2.5. SO2, NO2and PM10through CO have indirect effects on PM2.5concentration change were 0.706, 1.011, 1.118 respectively were greater than a direct effect on quality of PM2.5concentrations change them. SO2, NO2, PM10, CO of PM2.5mass concentration changes of total decision coefficient was 85.9%. CO was a major air pollutant in the main factors influencing the quality of PM2.5concentration change, reduce CO emissions from coal in winter heating period, to improve the air environmental quality, reduce the harm to the health of human body.
PM2.5; carbon monoxide; PLS1; path analysis; air pollutants
X16
A
1674-5906(2014)12-1953-05
黑龍江省自然科學(xué)基金項(xiàng)目(G201117)
鄭煜(1962年生),女,教授,研究方向?yàn)楦怕收撆c數(shù)理統(tǒng)計(jì)。E-mail:zhengyu62@126.com
2014-09-24
鄭煜,鄧蘭. 基于PLS1的哈爾濱市PM2.5與空氣污染物相關(guān)性分析[J]. 生態(tài)環(huán)境學(xué)報(bào), 2014, 23(12): 1953-1957.
ZHENG Yu, DENG Lan. Correlation Analysis Based on PSL1 between PM2.5 and Air Pollutants in Harbin City [J]. Ecology and Environmental Sciences, 2014, 23(12): 1953-1957.