張賓++陳永佳
摘 要:文章首先運用K均值聚類分析法對全國主要城市2016年的空氣質(zhì)量進行分類,將113個城市分為三類;其次,運用主成分分析對每一類城市影響空氣質(zhì)量的主要因素進行分析,研究表明城市空氣質(zhì)量主要是受兩個方面不同程度的影響,分別為粉塵污染(如;居民生活排放的煙塵、建筑垃圾揚塵等)和氣體污染(如:汽車尾氣、化石燃料燃燒產(chǎn)物等)。
關(guān)鍵詞:空氣質(zhì)量 聚類分析 主成分分析 影響因素
中圖分類號:O212.4 文獻標識碼:A
文章編號:1004-4914(2017)09-034-02
一、引言
近年來,隨著霧霾天氣對人類健康和生活的影響不斷加深,對空氣質(zhì)量影響因素的分析及尋找霧霾防范措施成為社會關(guān)注的熱點問題。目前國內(nèi)關(guān)于空氣質(zhì)量及霧霾的影響因素研究主要針對個別大型城市,也有學者從全國主要城市出發(fā)去分析空氣質(zhì)量的影響因素,不過由于我國經(jīng)濟發(fā)展及工業(yè)分布不均衡的特點,對全國主要城市的空氣質(zhì)量研究需要細化分類,具體分析各類城市空氣質(zhì)量的影響因素,故本文選取我國113個空氣質(zhì)量重點城市運用K均值聚類方法和主成分分析方法進行影響因素研究,從而為霧霾治理提供有效的建議。本文所分析的城市空氣質(zhì)量指標包括二氧化硫年平均濃度、二氧化氮年平均濃度、可吸入顆粒物年平均濃度、一氧化碳日均值95百分位濃度、臭氧最大8小時百分位濃度和細顆粒物年平均濃度等6個指標數(shù)據(jù),數(shù)據(jù)來源于國家統(tǒng)計局統(tǒng)計年鑒,通過定量分析和定性分析結(jié)合,對113個空氣質(zhì)量重點城市進行研究。
二、研究方法
(一)K均值聚類分析
K均值作為聚類分析中的一種基本的劃分方法,是一種快速聚類的方法,采用該方法得出來的結(jié)果簡單易懂,對計算機的性能要求不高,所以可以廣泛運用。然而這種算法依賴于初始值的選擇以及數(shù)據(jù)的輸入順序并且一些結(jié)果不能夠滿足需要。K均值聚類方法的一般步驟為:
1.選擇某些記錄作為凝聚點,將所有的樣本分成K個初始類。
2.首先,通過歐幾里得距離將這些樣本按就近原則將記錄在離中心最近的類中,然后,計算出各個初始分類的中心位置(均值),最后,用計算出的中心位置重新進行聚類。
3.將第二步反復(fù)循環(huán),直到樣本不可以再分,且聚類中心收斂為止。
(二)主成分分析
主成分分析主要是通過降維的方法,將多個不同指標轉(zhuǎn)化成為幾個相同的綜合指標。主成分分析方法首先將原始數(shù)據(jù)進行標準化;其次建立變量之間的相關(guān)系數(shù)矩陣;然后,求此相關(guān)系數(shù)矩陣R的特征值和特征向量;最后寫出主成分并且進行分析。
三、空氣質(zhì)量影響因素分析
由于所選數(shù)據(jù)較多,各個城市的空氣質(zhì)量指標值不盡相同,以至于某些城市同一變量之間的差異比較大,并且城市空氣質(zhì)量之間所存在的規(guī)律特征也不明顯,所以對113個主要城市整體的空氣質(zhì)量影響因素進行分析不具有代表性,且準確性較差。為了使得所分析的數(shù)據(jù)更具代表性以及分析過程更加方便,分析結(jié)果更加準確,我們運用聚類分析法把113個城市按照空氣質(zhì)量指標的相近程度進行分類。經(jīng)過多次不同的試驗表明,三類以上的話會出現(xiàn)某一類或者兩類只包含一個城市,其他類包含的城市相對比較多的現(xiàn)象,所以相比之下分為三類比較合理(聚類中心見表1)。對113個城市的空氣質(zhì)量數(shù)據(jù)進行K均值聚類分析,將113個城市分成三類,第一類包括:石家莊、唐山、邯鄲、保定、臨汾、安陽、焦作七所城市,主要集中在河北及河南北部地區(qū),空氣質(zhì)量最差;第二類包括:沈陽、大連、長春、南京、連云港、武漢、成都、重慶等72所城市,主要集中在黃河以北區(qū)域,空氣質(zhì)量中等;第三類包括:北京、呼和浩特、太原、鄭州、張家界、烏魯木齊、天津等34所城市,主要集中在沿海和南方一帶,空氣質(zhì)量最好。
由于三類城市的空氣質(zhì)量指標差別很大,所以分別對這三類城市進行主成分分析來具體量化每類城市空氣質(zhì)量影響因素的特點。
由表2可以看出,三類城市的前兩個主成分的方差累計貢獻率分別為89.574%,77.056%和68.988%,所以選擇前兩個主成份就可以了。下面通過計算主成分得分來量化各變量的載荷。
從表3可以看出對于第一類城市,影響主成分的指標是細顆粒物年平均濃度、可吸入顆粒物年平均濃度、二氧化氮年平均濃度和臭氧最大8小時百分位濃度,影響主成(下轉(zhuǎn)第39頁)(上接第34頁)分的指標是二氧化硫年平均濃度和一氧化碳日均值95百分位濃度。對于第二類城市,影響主成分的指標是可吸入顆粒物年平均濃度和細顆粒物年平均濃度,影響主成分的指標是二氧化氮年平均濃度、臭氧最大8小時百分位濃度和一氧化碳日均值95百分位濃度和二氧化硫年平均濃度。而對于第三類城市,影響主成分的指標是細顆粒物年平均濃度、可吸入顆粒物年平均濃度、二氧化氮年平均濃度和臭氧最大8小時百分位濃度,影響主成分的指標是二氧化硫年平均濃度和一氧化碳日均值95百分位濃度。
綜合三類城市的主成分分析結(jié)果,我們發(fā)現(xiàn)細顆粒物年平均濃度和可吸入顆粒物年平均濃度對第一主成分影響較大,二氧化硫年平均濃度和一氧化碳日均值95百分位濃度對第二主成分影響較大。
四、結(jié)論
綜合以上兩種方法的分析結(jié)論可以發(fā)現(xiàn),第一類、第三類城市處于黃河以北、京津冀、長江三角洲一帶,這些城市的重工業(yè)發(fā)展較快,細顆粒物、可吸入顆粒物以及含二氧化硫、一氧化碳的廢水、廢氣排放量較大,所以空氣質(zhì)量與第二類城市相比較差,因此霧霾天氣頻頻出現(xiàn)。
[基金來源:湖北民族學院青年科研基金(MY2017Q21),高維精度矩陣的收縮估計及應(yīng)用研究。]
參考文獻:
[1] 王庚辰,謝驊,萬小偉等.北京地區(qū)氣溶膠質(zhì)量濃度及組分隨高度的變化[J].環(huán)境科學研究,2004(01)37~40
[2] 董雪玲,劉大錳,袁楊森等.北京市2005年夏季大氣顆粒物污染特征及影響因素[J].環(huán)境工程學報,2007(09)100~104
[3] 鄒本東,徐子優(yōu),華蕾等.因子分析法解析北京市大氣顆粒物PM10的來源[J].中國環(huán)境監(jiān)測,2007(02)79~85
[4] 張云海,馬雁軍,劉寧微等.沈陽地區(qū)霾的環(huán)境特征研究[J].生態(tài)環(huán)境學報,2010,19(11):2636~2641
[5] 魏建蘇,孫燕,嚴文蓮等.南京霾天氣的特征分析與影響因子初探[J].氣象科學,2010,30(6):427~433
[6] 孫華臣,盧華.中東部地區(qū)霧霾天氣的成因及對策[J].宏觀經(jīng)濟管理,2013(6):48-50
[7] 劉瀏.我國城市空氣質(zhì)量與影響因子分析——以79個地級以上城市2008年統(tǒng)計數(shù)據(jù)為依據(jù)[J].蘇州科技學院學報(工程技術(shù)版),2011,24(1):10-14
[8] 殷挺凱.霧霾災(zāi)害的成因分析及防治措施[J].經(jīng)濟研究導刊,2013(13):259-260
[9] 趙大順.淺析霧霾天氣成因及治理措施[J].知識經(jīng)濟,2013(7):104-104
[10] 袁東,臺斌.城市霧霾污染的成因及治理措施分析[J].齊魯師范學院學報,2014(4):113-119
[11] 趙倩.霧霾現(xiàn)象的主成分分析及治理的演化博弈模型[D].西北師范大學,2015
(作者單位:1.湖北民族學院教育學院;2.湖北民族學院理學院 湖北恩施 445000)
[第一作者簡介:張賓(1984—),男,河南焦作人,漢族,講師,在讀博士生,主要研究為高維統(tǒng)計推斷及數(shù)據(jù)挖掘。](責編:玉山)endprint