尤游
(安徽機(jī)電職業(yè)技術(shù)學(xué)院公共基礎(chǔ)教學(xué)部,安徽 蕪湖 241000)
隨著工業(yè)化、城鎮(zhèn)化進(jìn)程的逐漸加快和經(jīng)濟(jì)的高速發(fā)展,生態(tài)環(huán)境的安全問(wèn)題越來(lái)越受到全社會(huì)的關(guān)注和重視.2018年習(xí)近平總書(shū)記在全國(guó)生態(tài)環(huán)境保護(hù)大會(huì)上強(qiáng)調(diào)要“加快構(gòu)建生態(tài)文明體系”“全面推動(dòng)綠色發(fā)展”“堅(jiān)決打贏藍(lán)天保衛(wèi)戰(zhàn)是重中之重”.在整個(gè)生態(tài)文明體系中,空氣質(zhì)量是最重要的生態(tài)指標(biāo)[1],空氣質(zhì)量的好壞嚴(yán)重影響城市的知名度和投資競(jìng)爭(zhēng)力.近年來(lái),城市霧霾天氣頻繁出現(xiàn),已經(jīng)嚴(yán)重威脅人們的日常生活和身心健康.為此,構(gòu)建科學(xué)便捷的空氣質(zhì)量評(píng)價(jià)模型可以幫助實(shí)現(xiàn)對(duì)城市空氣質(zhì)量的可視化質(zhì)量預(yù)測(cè),為大氣污染防控治理提供理論參考依據(jù),同時(shí)也能推動(dòng)城市綠色經(jīng)濟(jì)發(fā)展和可持續(xù)發(fā)展,促進(jìn)生態(tài)文明建設(shè)[2-3].
針對(duì)城市空氣質(zhì)量評(píng)價(jià),目前國(guó)內(nèi)有不少學(xué)者已展開(kāi)研究,并取得了一些成果.如張茹等[3]以徐州市為例,分別運(yùn)用層次分析法和主成分分析法來(lái)對(duì)比評(píng)價(jià)城市空氣質(zhì)量;陳穎等[4]以山西省11個(gè)地級(jí)市為例,基于聚類(lèi)分析和主成分分析構(gòu)建城市空氣質(zhì)量評(píng)價(jià)模型;鄭霞等[5]以長(zhǎng)沙市為例,提出一種基于組合賦權(quán)集對(duì)分析的空氣質(zhì)量評(píng)價(jià)方法,仿真結(jié)果表明該方法評(píng)價(jià)結(jié)果波動(dòng)性小、穩(wěn)定性強(qiáng);候甜甜等[6]利用主成分分析選取影響空氣質(zhì)量的主要因素,然后進(jìn)行費(fèi)希爾(Fisher)判別分析,最終構(gòu)建主成分的費(fèi)希爾判別分析模型.以上文獻(xiàn)主要針對(duì)某個(gè)城市或某個(gè)省來(lái)討論,未能覆蓋大型的城市群.隨著城市化進(jìn)程的推進(jìn)和發(fā)展逐漸進(jìn)入成熟階段,城市群已成為當(dāng)今世界城市化與區(qū)域發(fā)展的新趨勢(shì)[7],研究城市群的空氣質(zhì)量對(duì)區(qū)域經(jīng)濟(jì)和環(huán)境的協(xié)調(diào)發(fā)展有重要的促進(jìn)作用.
長(zhǎng)三角城市群作為國(guó)內(nèi)最具代表性的城市群之一,研究其區(qū)域大氣環(huán)境,深化城市間聯(lián)防聯(lián)控,有利于推動(dòng)長(zhǎng)三角區(qū)域的高質(zhì)量一體化發(fā)展.文章在前人研究的基礎(chǔ)上,以長(zhǎng)三角城市群為研究對(duì)象,選取6種污染物(SO2、NO2、PM10、CO、O3、PM2.5)濃度和空氣質(zhì)量達(dá)到和好于二級(jí)的天數(shù)比例作為影響城市空氣質(zhì)量的指標(biāo).考慮到待分類(lèi)對(duì)象的不確定性,首先選用模糊C均值聚類(lèi)(FCM)算法對(duì)城市空氣質(zhì)量進(jìn)行聚類(lèi)得到分類(lèi)類(lèi)別,但由于分類(lèi)類(lèi)別屬于離散型變量,想要構(gòu)建其與多個(gè)連續(xù)性自變量之間的關(guān)系則需要借助于判別分析[8],所以文章進(jìn)一步引入Fisher判別法來(lái)構(gòu)建線(xiàn)性判別函數(shù),并依據(jù)距離判別法進(jìn)行回判和效果檢驗(yàn),同時(shí)獲得其他待判城市的判別結(jié)果.
長(zhǎng)三角城市群位于我國(guó)華東地區(qū),由浙江、江蘇、安徽和上海三省一市主要的地級(jí)市組成,具體包括浙江省的杭州、寧波、溫州、嘉興、湖州、紹興、金華、衢州、舟山、臺(tái)州、麗水,江蘇省的南京、無(wú)錫、徐州、常州、蘇州、南通、連云港、淮安、鹽城、揚(yáng)州、鎮(zhèn)江、泰州、宿遷,安徽省的合肥、淮北、亳州、宿州、蚌埠、阜陽(yáng)、淮南、滁州、六安、馬鞍山、蕪湖、宣城、銅陵、池州、安慶、黃山和上海等41個(gè)城市.
長(zhǎng)三角城市群總?cè)丝诩s2.2億,該地區(qū)經(jīng)濟(jì)發(fā)展活躍,制造業(yè)發(fā)達(dá),城鎮(zhèn)化率高,創(chuàng)造的GDP總量約占全國(guó)總值的25%,是我國(guó)經(jīng)濟(jì)發(fā)展最活躍的區(qū)域之一,也是我國(guó)“一帶一路”與長(zhǎng)江經(jīng)濟(jì)帶的重要交匯地帶.
2020年8月習(xí)近平總書(shū)記在扎實(shí)推進(jìn)長(zhǎng)三角一體化發(fā)展座談會(huì)上強(qiáng)調(diào),要緊扣“一體化”和“高質(zhì)量”兩個(gè)關(guān)鍵詞抓好重點(diǎn)工作,推動(dòng)長(zhǎng)三角一體化發(fā)展不斷取得成效.其中長(zhǎng)三角一體化發(fā)展具體包括經(jīng)濟(jì)一體化、科技一體化、設(shè)施一體化和生態(tài)一體化[9].目前長(zhǎng)三角一體化已經(jīng)上升為國(guó)家戰(zhàn)略,伴隨著區(qū)域經(jīng)濟(jì)的高速發(fā)展,引發(fā)的大氣污染問(wèn)題也日益突出.根據(jù)《2020年中國(guó)生態(tài)環(huán)境狀況公報(bào)》顯示,長(zhǎng)三角城市群中有34個(gè)城市優(yōu)良天數(shù)比例在80%~100%之間,7個(gè)城市優(yōu)良天數(shù)比例在50%~80%之間,平均超標(biāo)天數(shù)比例約為14.8%.在全國(guó)168個(gè)主要城市空氣質(zhì)量排名中,長(zhǎng)三角城市群的省會(huì)城市杭州、南京、合肥以及上海排名均在80名以后,相比較其他空氣優(yōu)良城市其大氣環(huán)境還需要進(jìn)一步的改善[10].
本研究以長(zhǎng)三角城市群41個(gè)城市為研究對(duì)象,選取X1,X2,...,X77個(gè)指標(biāo),分別為二氧化硫(SO2)年平均濃度(ug/m3)、二氧化氮(NO2)年平均濃度(ug/m3)、可吸入顆粒物(PM10)年平均濃度(ug/m3)、一氧化碳(CO)日均值第95百分位濃度(mg/m3)、臭氧(O3)日最大8小時(shí)第90百分位濃度(ug/m3)、細(xì)顆粒物(PM2.5)年平均濃度(ug/m3)和空氣質(zhì)量達(dá)到和好于二級(jí)的天數(shù)比例(%).
文中數(shù)據(jù)來(lái)源于2021年浙江省、江蘇省、安徽省統(tǒng)計(jì)年鑒以及中國(guó)統(tǒng)計(jì)年鑒和相關(guān)氣象網(wǎng)站(http://www.tianqihoubao.com/),通過(guò)查詢(xún)整理獲得長(zhǎng)三角城市群2020年全年空氣質(zhì)量指標(biāo)數(shù)據(jù).依據(jù)統(tǒng)計(jì)結(jié)果并結(jié)合《2020年中國(guó)生態(tài)環(huán)境狀況公報(bào)》可以獲得長(zhǎng)三角城市群空氣質(zhì)量的總體情況.41個(gè)城市的空氣平均優(yōu)良天數(shù)比例為85.2%,而2020年全國(guó)168個(gè)地級(jí)及以上城市平均優(yōu)良天數(shù)比例為80.7%,且2020年公布的168個(gè)城市環(huán)境空氣質(zhì)量排名前20名城市中包含長(zhǎng)三角地區(qū)的舟山市、黃山市、麗水市和臺(tái)州市.
模糊C均值聚類(lèi)是由Bezdek于1981年提出的聚類(lèi)算法,該算法基于隸屬度大小來(lái)量化樣本屬于某個(gè)聚類(lèi)的程度,進(jìn)一步優(yōu)化目標(biāo)函數(shù)獲得最小值.設(shè)樣本數(shù)據(jù)集為X={x1,x2,...,xn},其中每個(gè)樣本xi對(duì)應(yīng)有t個(gè)指標(biāo)屬性,將樣本集分為s(1
(1)
其中Ω={wij}s×n為隸屬度矩陣;λ表示模糊加權(quán)因子,一般認(rèn)為1.15≤λ≤2.15算法效果最好,常見(jiàn)的λ取值為2[11-12];‖xi-vj‖表示樣本xi到聚類(lèi)中心vj的歐式距離.
模糊C均值聚類(lèi)算法的核心是通過(guò)不斷迭代獲得目標(biāo)函數(shù)的最小值,從而得到最優(yōu)的隸屬度矩陣Ω*和最佳聚類(lèi)中心V*.具體計(jì)算流程如下[12-14]:
Step1:導(dǎo)入樣本數(shù)據(jù)并標(biāo)準(zhǔn)化,確定聚類(lèi)個(gè)數(shù)s和模糊加權(quán)因子λ,設(shè)定最大迭代次數(shù)θmax和目標(biāo)函數(shù)的終止閾值ε,初始化隸屬度矩陣Ω(0);
Step4:根據(jù)給定的終止閾值ε,判斷是否‖ΔW‖≤ε或者迭代次數(shù)超過(guò)θmax,如果滿(mǎn)足條件則迭代終止,認(rèn)為此時(shí)算法收斂,目標(biāo)函數(shù)Φλ(Ω,V)達(dá)到最優(yōu),可根據(jù)最優(yōu)的Ω*,V*確定樣品的類(lèi)別;如果不滿(mǎn)足條件則返回到Step2繼續(xù)迭代,直至滿(mǎn)足條件;
Fisher判別的核心思想是投影[14],試圖尋找一個(gè)最優(yōu)投影向量或者最優(yōu)判別函數(shù),使得樣本數(shù)據(jù)投影到該方向上,基于組內(nèi)離散度盡可能小而組間離散度盡可能大的原則確定判別函數(shù),再根據(jù)判別函數(shù)確定樣品類(lèi)別.假設(shè)有l(wèi)個(gè)總體G1,G2,...,Gl,觀測(cè)樣本為xi1,xi2,...,xiqi(i=1,2,...,l),則樣本數(shù)據(jù)xij的組間離差平方和和組內(nèi)離差平方和分別為[14-15]
(2)
(3)
根據(jù)方差分析理論得當(dāng)目標(biāo)函數(shù)f(p)=(p′SSAxp)/(p′SSExp)取得最大值時(shí),此時(shí)得到的投影向量p最佳.為保證解的唯一性[16],假定SSAx/SSEx為單位矩陣E,求偏導(dǎo)推出
(SSEx)-1·SSAxp=λp
(4)
基于長(zhǎng)三角41個(gè)城市樣本數(shù)據(jù),利用MATLAB2016進(jìn)行模糊聚類(lèi).這里確定3個(gè)聚類(lèi),設(shè)定模糊加權(quán)因子為2,最大迭代次數(shù)為100,目標(biāo)函數(shù)的終止閾值為10-5.經(jīng)過(guò)23次迭代后目標(biāo)函數(shù)獲得最小值,根據(jù)隸屬度最大原則得到FCM聚類(lèi)結(jié)果如表1所示.
表1 41個(gè)城市模糊C均值聚類(lèi)結(jié)果
根據(jù)《2020中國(guó)生態(tài)環(huán)境狀況公報(bào)》公布的全國(guó)168個(gè)城市空氣質(zhì)量排名,其中前20名中有舟山、黃山、麗水、臺(tái)州4個(gè)城市全部聚類(lèi)為第一類(lèi),說(shuō)明第一類(lèi)空氣質(zhì)量最好;再根據(jù)各省發(fā)布的2020年生態(tài)環(huán)境狀況公報(bào)可知,第三類(lèi)空氣質(zhì)量較差,第二類(lèi)居中,聚類(lèi)結(jié)果符合實(shí)際.
基于上述聚類(lèi)結(jié)果,接下來(lái)依據(jù)41個(gè)城市的空氣質(zhì)量指標(biāo)數(shù)據(jù)進(jìn)行回判并對(duì)待判城市進(jìn)行聚類(lèi)評(píng)價(jià).得到的判別式函數(shù)分別為
y1=0.005 9x1-0.011 2x2+0.017 2x3+0.999x4-0.005 1x5+0.000 863x6-0.039 2x7
y2=0.010 1x1+0.019 5x2-0.010 2x3+0.999 7x4+0.005 1x5+0.004 2x6+0.005 8x7
類(lèi)均值投影矩陣代表3個(gè)類(lèi)的類(lèi)中心位置,如表2所示.由程序運(yùn)行結(jié)果可以讀出兩個(gè)判別式的貢獻(xiàn)率分別為83.14%和16.86%,且由表2混淆矩陣可看出訓(xùn)練樣本中第一類(lèi)的12個(gè)城市和第二類(lèi)的20個(gè)城市均得到正確判別,第三類(lèi)的9個(gè)城市中僅有1個(gè)城市錯(cuò)判,即第三類(lèi)的“淮安市”誤判到第二類(lèi),回判綜合正確率為97.6%,誤判率僅為2.4%.由此可見(jiàn)模糊聚類(lèi)結(jié)果可信度較高.
表2 判別分析對(duì)應(yīng)的混淆矩陣和投影矩陣
另外從三類(lèi)的2個(gè)判別式得分繪制出的散點(diǎn)圖來(lái)看,3個(gè)類(lèi)別的分離效果較好,具體如圖1所示,進(jìn)一步驗(yàn)證樣本城市空氣質(zhì)量等級(jí)分類(lèi)結(jié)果是合理的.
圖1 判別式得分對(duì)應(yīng)的散點(diǎn)圖
這里選取太原、福州、南昌、濟(jì)南、鄭州、武漢、長(zhǎng)沙和昆明8個(gè)城市為待判城市,分別導(dǎo)入空氣質(zhì)量指標(biāo)數(shù)據(jù),通過(guò)代入判別函數(shù)獲得投影數(shù)據(jù)矩陣,再根據(jù)3個(gè)類(lèi)的類(lèi)均值投影矩陣,分別計(jì)算對(duì)應(yīng)的歐氏距離,根據(jù)距離最小原則就能判別8個(gè)城市的類(lèi)別.
具體計(jì)算結(jié)果如表3所示,這里di表示待判城市的投影向量與第i類(lèi)類(lèi)中心的歐氏距離.從而獲得8個(gè)待判城市的類(lèi)別結(jié)果依次是第三類(lèi)、第一類(lèi)、第二類(lèi)、第三類(lèi)、第三類(lèi)、第二類(lèi)、第二類(lèi)和第一類(lèi),該判別結(jié)果與生態(tài)環(huán)境部公布的全國(guó)城市空氣質(zhì)量排名相吻合.其中福州市和昆明市屬于空氣質(zhì)量排名前20名城市,判為第一類(lèi),空氣質(zhì)量最好;太原和濟(jì)南屬于空氣質(zhì)量排名后20名城市,屬于第三類(lèi),空氣質(zhì)量最差.根據(jù)上述判別式函數(shù),也可以判別其他城市的類(lèi)別,以實(shí)現(xiàn)對(duì)城市空氣質(zhì)量的精準(zhǔn)防控.
表3 待判城市判別結(jié)果
由于樣本城市空氣質(zhì)量類(lèi)屬的不確定性,模糊C均值聚類(lèi)算法可以基于隸屬度的大小快速的對(duì)樣本城市進(jìn)行空氣質(zhì)量等級(jí)歸類(lèi),缺點(diǎn)在于不能評(píng)價(jià)聚類(lèi)結(jié)果的優(yōu)劣性,且不能對(duì)非樣本城市進(jìn)行聚類(lèi)[17].所以文中引入Fisher判別法,在聚類(lèi)分析的基礎(chǔ)上,依據(jù)判別式函數(shù)來(lái)評(píng)判聚類(lèi)分析的可靠性,進(jìn)一步判別待判城市的空氣質(zhì)量等級(jí),兩者結(jié)合對(duì)城市空氣質(zhì)量進(jìn)行判別,可以提高空氣質(zhì)量分類(lèi)評(píng)價(jià)的準(zhǔn)確性.文中通過(guò)收集2020年長(zhǎng)三角地區(qū)41個(gè)城市的空氣質(zhì)量相關(guān)指標(biāo)數(shù)據(jù),對(duì)41個(gè)樣本城市的空氣質(zhì)量進(jìn)行等級(jí)評(píng)價(jià),并對(duì)照《2020中國(guó)生態(tài)環(huán)境狀況公報(bào)》進(jìn)行類(lèi)比,分析驗(yàn)證其評(píng)價(jià)結(jié)果合理,具有一定的參考價(jià)值.以此可以對(duì)其他待判城市進(jìn)行快速判別,該模型有利于提高環(huán)保部門(mén)對(duì)大氣污染的風(fēng)險(xiǎn)信息研判和預(yù)警能力.