崔 亞
(西安職業(yè)技術(shù)學(xué)院 基礎(chǔ)課教學(xué)部,陜西 西安 710077)
隨著大氣污染越來(lái)越嚴(yán)重,需利用國(guó)控點(diǎn)和自建點(diǎn)對(duì)“兩塵四氣”的濃度進(jìn)行實(shí)時(shí)監(jiān)測(cè)??紤]到國(guó)控點(diǎn)數(shù)據(jù)較為準(zhǔn)確,但國(guó)控點(diǎn)的布控較少,數(shù)據(jù)發(fā)布時(shí)間滯后較長(zhǎng)且花費(fèi)較大,而自建點(diǎn)花費(fèi)小,能實(shí)時(shí)網(wǎng)格化監(jiān)控,但數(shù)據(jù)不準(zhǔn)確。本研究對(duì)國(guó)控點(diǎn)數(shù)據(jù)和自建點(diǎn)數(shù)據(jù)進(jìn)行探索性數(shù)據(jù)分析;對(duì)兩個(gè)監(jiān)測(cè)點(diǎn)數(shù)據(jù)造成差異的因素進(jìn)行分析;根據(jù)國(guó)控點(diǎn)數(shù)據(jù)建立相關(guān)的數(shù)學(xué)模型,并對(duì)自建點(diǎn)數(shù)據(jù)進(jìn)行校準(zhǔn)。
(1) 假設(shè)國(guó)控點(diǎn)的數(shù)據(jù)為標(biāo)準(zhǔn)值,不受天氣等因素干擾。(2) 假設(shè)自建點(diǎn)對(duì)溫度、濕度、風(fēng)速、氣壓、降水的檢測(cè)值相對(duì)標(biāo)準(zhǔn)。(3) 假設(shè)自建點(diǎn)的數(shù)據(jù)沒(méi)有異常值。
為了對(duì)自建點(diǎn)數(shù)據(jù)與國(guó)控點(diǎn)數(shù)據(jù)進(jìn)行探索性數(shù)據(jù)分析,本研究將自建點(diǎn)數(shù)據(jù)與國(guó)控點(diǎn)數(shù)據(jù)進(jìn)行了預(yù)處理,用MATLAB 軟件編程得到了數(shù)據(jù)行數(shù)一樣的兩個(gè)表,分別為自建點(diǎn)數(shù)據(jù)表和國(guó)控點(diǎn)數(shù)據(jù)表。
利用SPSS 軟件分別對(duì)了國(guó)控點(diǎn)數(shù)據(jù)、自建點(diǎn)數(shù)據(jù)進(jìn)行描述統(tǒng)計(jì)量[2]見(jiàn)圖1 和圖2,其中統(tǒng)計(jì)數(shù)據(jù)有效值為3 954,每項(xiàng)的最高點(diǎn)和最低點(diǎn)對(duì)應(yīng)數(shù)據(jù)的最大值和最小值;標(biāo)記*為數(shù)據(jù)的均值;箱型的上邊和下邊對(duì)應(yīng)均值±標(biāo)準(zhǔn)差/2 的值。
圖1 國(guó)控點(diǎn)數(shù)據(jù)統(tǒng)計(jì)量
圖2 自控點(diǎn)數(shù)據(jù)統(tǒng)計(jì)量
表1 雙因素線性回歸模型與全因素線性回歸模型統(tǒng)計(jì)結(jié)果匯總
根據(jù)SPSS 的描述性數(shù)據(jù)統(tǒng)計(jì),在統(tǒng)計(jì)數(shù)據(jù)有效值為3954 且國(guó)控點(diǎn)數(shù)據(jù)與自建點(diǎn)數(shù)據(jù)均同時(shí)測(cè)得的情況下對(duì)“兩塵四氣”分別對(duì)比分析,得到如下結(jié)論:自建點(diǎn)的PM2.5,PM10,CO,NO2的方差均大于國(guó)控點(diǎn)的PM2.5,PM10,CO,NO2的方差,自建點(diǎn)的SO2,O3的方差均小于國(guó)控點(diǎn)的PM2.5,PM10,NO2的方差。由此可知自建點(diǎn)除SO2和O3的離散程度小于國(guó)控點(diǎn),其余的離散程度均大于國(guó)控點(diǎn)[3],因此自建點(diǎn)的SO2和O3具有一定的可靠性。
分別對(duì)自測(cè)點(diǎn)數(shù)據(jù)(Z)與國(guó)控點(diǎn)(G)數(shù)據(jù)進(jìn)行配對(duì)樣本T 檢測(cè)。根據(jù)SPSS 軟件配對(duì)樣本T 檢測(cè)得:自建點(diǎn)PM2.5 與國(guó)控點(diǎn)PM2.5 的數(shù)據(jù)量為3 954,兩者之間的相關(guān)系數(shù)為0.871,相關(guān)系數(shù)的估計(jì)標(biāo)準(zhǔn)差為0;自建點(diǎn)PM10 與國(guó)控點(diǎn)PM10 的數(shù)據(jù)量為3 954,兩者之間的相關(guān)系數(shù)為0.628,相關(guān)系數(shù)的估計(jì)標(biāo)準(zhǔn)差為0;自建點(diǎn)CO 與國(guó)控點(diǎn)CO 數(shù)據(jù)量為3 954,兩者之間的相關(guān)系數(shù)為0.325,相關(guān)系數(shù)的估計(jì)標(biāo)準(zhǔn)差為0;自建點(diǎn)NO2與國(guó)控點(diǎn)NO2數(shù)據(jù)量為3 954,兩者之間的相關(guān)系數(shù)為0.381,相關(guān)系數(shù)的估計(jì)標(biāo)準(zhǔn)差為0;自建點(diǎn)SO2與國(guó)控點(diǎn)SO2的數(shù)據(jù)量為3 954,兩者之間的相關(guān)系數(shù)為0.041,相關(guān)系數(shù)的估計(jì)標(biāo)準(zhǔn)差為0.01;自建點(diǎn)O3與國(guó)控點(diǎn)O3的數(shù)據(jù)量為3 954,兩者之間的相關(guān)系數(shù)為0.4,相關(guān)系數(shù)的估計(jì)標(biāo)準(zhǔn)差為0。
我們發(fā)現(xiàn),自測(cè)點(diǎn)PM2.5 和PM10 與國(guó)控點(diǎn)PM2.5和PM10 強(qiáng)相關(guān)(相關(guān)系數(shù)大于0.5),除SO2所有數(shù)據(jù)都不是正態(tài)分布,是存在顯著性差異的[5]。
通過(guò)以上數(shù)據(jù)分析,發(fā)現(xiàn)自建點(diǎn)數(shù)據(jù)與國(guó)控點(diǎn)數(shù)據(jù)存在著一定的差異性,接下來(lái)對(duì)造成差異性的因素進(jìn)行回歸性分析[7]。
由表2 可知:模型PM2.5、PM10 和SO2的R 值大,說(shuō)明擬合優(yōu)度大,用雙因素線性回歸模型擬合更好。模型CO、NO2、O3的R 值大,說(shuō)明擬合優(yōu)度大[8],用全因素線性回歸模型擬合更好。
表2 多元性線性回歸模型系數(shù)匯總表
我們分別以國(guó)控點(diǎn)的 PM2.5、PM10、CO、NO2、SO2、O3作為因變量,以自建點(diǎn)的全部變量作為自變量,通過(guò)以上分析,我們建立如下的多元線性回歸模型:
式中y 為因變量,xi為自變量,ai為系數(shù),b 為常數(shù)。
選用了國(guó)控?cái)?shù)據(jù)與自建數(shù)據(jù)中2/3 數(shù)據(jù),利用SPSS 得出多元線性回歸模型[10]。
依據(jù)以上模型系數(shù)匯總表,可以分別得出PM2.5、PM10、CO、NO2、SO2、O3的線性回歸模型[10],匯總?cè)缦拢篜M2.5 模型:PM2.5 = 0.729x1 + 0.022x2 + 3.946x3+ 0.106x4 + 0.010x5 + 0.041x6 + 0.720x7 - 0.090x8 -0.043x9 + 0.233x10 - 0.260x11 + 98.224 ;PM10 模型:PM10 = 0.807x1 + 0.050x2 + 43.970x3 + 0.303x4 +0.057x5 + 0.059x6 - 3.094x7 - 0.269x8 - 0.101x9 +0.103x10 - 0.966x11 + 326.699 ;CO 模 型:CO =0.014x1 - 0.004x2 + 0.700x3 + 0.001x4 - 0.174x7 -0.005x8 + 0.011x10 + 0.001x11 + 5.127 ;NO2模型:NO2= 0.552x1 - 0.228x2 - 24.337x3 + 0.475x4 +0.079x5 - 0.110x6 - 14.319x7 - 0.093x8 - 0.045x9 -0.957x10 - 0.462x11 + 164.083 ;SO2模 型:SO2=0.076x1 - 0.056x2 + 65.467x3 - 0.154x4 - 0.107x5 +0.226x6 - 1.894x7 + 0.028x8 + 0.030x9 + 0.456x10 +0.012x11 - 44.861 ;O3模型:O3= 0.260x1 - 0.134x2 -59.467x3 - 0.330x4 + 0.129x5 + 0.185x6 + 17.902x7 +0.226x8 + 0.010x9 + 1.897x10 - 0.285x11 - 159.526。
為了驗(yàn)證上述模型的準(zhǔn)確性,選取國(guó)控點(diǎn)數(shù)據(jù)與自建點(diǎn)數(shù)據(jù)的后1/3 數(shù)據(jù)作為樣本來(lái)檢驗(yàn)[11-12],得出檢驗(yàn)結(jié)果。下面通過(guò)一些例子介紹一下檢驗(yàn)數(shù)據(jù)的校準(zhǔn)結(jié)果。
(1) 以2019 年3 月24 日20 時(shí)為例,校準(zhǔn)前數(shù)據(jù)PM2.5:88,PM10:121,CO:1.16,NO2:45,SO2:19,O3:108,校準(zhǔn)后數(shù)據(jù)PM2.5:87,PM10:121,CO:1.3,NO2:52,SO2:23,O3:77;(2) 以2019 年3 月24 日22 時(shí)為例,校準(zhǔn)前數(shù)據(jù)PM2.5:81,PM10:123,CO:1.19,NO2:53,SO2:19,O3:88,校準(zhǔn)后數(shù)據(jù)PM2.5:89,PM10:121,CO:1.4,NO2:53,SO2:19,O3:75;(3) 以2019 年3 月25 日2 時(shí)為例,校準(zhǔn)前數(shù)據(jù)PM2.5:86,PM10:116,CO:1.22,NO:30,SO2:24,O3:87,校準(zhǔn)后數(shù)據(jù)PM2.5:90,PM10:113,CO:1.3,NO2:38,SO2:14,O3:84;(4) 以2019 年3 月25 日3 時(shí)為例,校準(zhǔn)前數(shù)據(jù)PM2.5:88,PM10:110,CO:1.27,NO2:23,SO2:21,O3:91,校準(zhǔn)后數(shù)據(jù)PM2.5:88,PM10:109,CO:1.4,NO2:40,SO2:15,O3:77。
通過(guò)SPSS 將檢驗(yàn)數(shù)據(jù)結(jié)果與國(guó)控點(diǎn)的數(shù)據(jù)進(jìn)行相關(guān)性分析[13]得出:每個(gè)數(shù)據(jù)的Pearson 均大于0.5,說(shuō)明該模型算的結(jié)果誤差很小[14],該多元線性回歸模型具有一定可靠性。
通過(guò)上述模型的驗(yàn)證,得出所建模型的可靠性和準(zhǔn)確性,故將自建點(diǎn)中的數(shù)據(jù)分別帶到我們建立的模型中,用EXCEL 軟件計(jì)算出自建點(diǎn)校準(zhǔn)后的數(shù)據(jù)[15]。下面以部分計(jì)算數(shù)據(jù)結(jié)果為例進(jìn)行介紹。
(1) 以2018 年11 月14 日10:02 時(shí)為例,自建點(diǎn) 原 數(shù) 據(jù)PM2.5:50,PM10:98,CO:0.8,NO2:62,SO2:15,O3:46,校準(zhǔn)后數(shù)據(jù)PM2.5:43,PM10:83,CO:0.6,NO2:65,SO2:35,O3:33;(2) 以2018 年11 月14 日10:10 時(shí)為例,自建點(diǎn)原數(shù)據(jù)PM2.5:49,PM10:94,CO:0.7,NO2:59,SO2:15,O3:50,校準(zhǔn)后數(shù)據(jù)PM2.5:42,PM10:75,CO:0.4,NO2:53,SO2:20,O3:58;(3) 以2018 年11 月14 日10:24 時(shí)為例,自建點(diǎn)原數(shù)據(jù)PM2.5:48,PM10:93,CO:0.7,NO2:57,SO2:15,O3:54,校 準(zhǔn) 后 數(shù) 據(jù)PM2.5:42,PM10:74,CO:0.4,NO2:47,SO2:18,O3:66;(4) 以2018 年11 月14 日10:42 時(shí)為例,自建點(diǎn)原數(shù)據(jù)PM2.5:42,PM10:85,CO:0.7,NO2:55,SO2:15,O3:57,校準(zhǔn)后數(shù)據(jù)PM2.5:38,PM10:76,CO:0.6,NO2:57,SO2:28,O3:56。
該模型較準(zhǔn)確的對(duì)國(guó)控點(diǎn)數(shù)據(jù)與自建點(diǎn)數(shù)據(jù)所產(chǎn)生的差異進(jìn)行了分析和校準(zhǔn);模型相對(duì)簡(jiǎn)單,便于計(jì)算;該模型還可直接用于以后時(shí)間自建點(diǎn)對(duì)空氣質(zhì)量采集數(shù)據(jù)的研究。