李 萍,趙莎莎
隨著社會城市化、工業(yè)化的迅猛發(fā)展,空氣污染問題越來越嚴重,影響空氣污染的六大因素有SO2,NO2,O3,CO,PM2.5 以及 PM10[1-3].空氣質量指數(shù)(AQI)從2012年上半年出臺開始,近年來一直作為我國空氣質量的評價標準.AQI即是根據(jù)空氣質量標準,將六種空氣污染物濃度簡化為單一概念性指數(shù)值形式,根據(jù)AQI的值,將空氣質量分為六個等級,分別為優(yōu),良,輕度污染,中度污染,重度污染和嚴重污染.然后不同國家的AQI計算細節(jié)方面存在著差異性,美國采用NowCast計算方法計算PM2.5與PM10分指數(shù),能快速響應變化的空氣質量狀況,而中國對這兩種分指數(shù)進行計算時使用的是24小時的平均值.不管是哪種方法,在對空氣質量進行評價時都要通過與AQI的濃度限值參照表以及API的濃度限值參照表進行對比才能得出具體的等級值,操作較為復雜,而且,無法反映各污染物濃度之間的復雜關系.
因此,本文提出基于覆蓋網(wǎng)絡的空氣質量評價模型,首先將不同時間點監(jiān)測到的六種污染物濃度值投影到一個超球面上,把不同的時間點看成是不同的訓練樣本.其次,利用覆蓋算法把這些樣本點分成不同的覆蓋,每個覆蓋代表同等級的空氣質量.最后,將測試樣本投影的同一個球面上,通過計算測試樣本的污染物濃度與訓練樣本污染物濃度之間的距離來判斷測試樣本的類別,即是空氣質量等級.本文利用覆蓋網(wǎng)絡對阜陽地區(qū)的空氣質量進行評價,得出較滿意的結果.
覆蓋算法是由張鈴等人提出,利用覆蓋算法構造k分類的覆蓋網(wǎng)絡,即是一種構造性的神經(jīng)網(wǎng)絡學習算法,該方法旨在樣本集S上尋找一組覆蓋領域,使得每個覆蓋中的樣本點屬于同一類別,這組覆蓋領域能將不同類別的樣本點分割開來[4].覆蓋算法的主要思想[5]:首先,把訓練樣本投影到一個超球面上,其次,隨機選擇一個點作為中心點,根據(jù)樣本點的分布,求出半徑值,構造覆蓋領域,使得該領域中的所有點屬于同一個類別,將所有已被覆蓋的樣本點移除,繼續(xù)構造新的覆蓋,直到所有樣本點均被覆蓋領域覆蓋住,這樣就得到了一組覆蓋,每一個覆蓋相當于是一個神經(jīng)元.
覆蓋算法流程如圖1所示.
圖1 覆蓋算法流程圖
本文從阜陽地區(qū)的空氣質量歷史數(shù)據(jù)中選出2016年6月1日到2017年5月31日的空氣質量數(shù)據(jù)作為訓練樣本,把2017年6月1日到2017年6月30日的空氣質量數(shù)據(jù)作為測試樣本,通過覆蓋算法,利用訓練樣本,得出空氣質量評價模型.在該評價模型中空氣質量共分為六個等級,分別是優(yōu),良,輕度污染,中度污染,重度污染和嚴重污染.通過訓練得到模型的主要組成部分覆蓋中心點以及覆蓋半徑,總共訓練處129個覆蓋,由覆蓋的中心和半徑構成.每個覆蓋屬于固定的類別.通過比較測試數(shù)據(jù)與各個覆蓋的位置,對測試數(shù)據(jù)進行標記,如果測試數(shù)據(jù)位于某一覆蓋內,那么被標記為與該覆蓋相同的類別,如果測試數(shù)據(jù)位于所以覆蓋的外部,則按照就近原則對其進行標記.得出測試結果如表1所示,其中r表示2017年6月1日到2017年6月30日的實際空氣質量等級,t表示用本文提到的模型所得的這三十天的空氣質量等級.由表1可知,對于三十天的空氣質量等級進行比較,發(fā)現(xiàn)只有兩天的空氣質量等級不一致,但是差別不大,僅僅相差一個檔次,實際是輕度污染,測出的結果是良.模型測出的其余二十八天的空氣質量等級與AQI計算得到的實際空氣質量等級完全一致.總之,利用本文所提供的方法對阜陽地區(qū)的空氣質量進行評價,得出的評價結果與AQI的計算方法相比相似度極高,正確率可達百分之九十以上,避免了計算AQI的繁瑣步驟.
表1 測試結果
本文提出基于覆蓋網(wǎng)絡的空氣質量評價模型,通過將不同時間點監(jiān)測到的六種污染物濃度值投影到一個超球面上,利用覆蓋算法把這些樣本點分成不同的覆蓋,每個覆蓋代表同等級的空氣質量,通過計算測試樣本的污染物濃度與訓練樣本污染物濃度之間的距離來判斷測試樣本的空氣質量等級.本文利用覆蓋網(wǎng)絡對阜陽地區(qū)的空氣質量進行評價,與AQI方法得出的空氣質量極為相似,對空氣質量評價具有一定的實際意義.