周淑玲
(福建省福州環(huán)境監(jiān)測中心站,福建 福州 350011)
空間插值技術(shù)始于20世紀(jì)50年代,是根據(jù)已有的空間數(shù)據(jù)預(yù)估未知空間數(shù)據(jù)的方法,對于獲取已知采樣點周邊空白區(qū)域環(huán)境屬性有重要意義。隨著空間插值技術(shù)的發(fā)展,不斷衍生出各種插值方法,而不同方法間的對比研究也越來越受到重視。張海平等對不同空間插值方法進行了實驗對比,并提出了各方法的適用性建議[1]。李金潔等對西南地區(qū)月降雨量的多種插值方法對比結(jié)果顯示,整體上克里金插值效果明顯優(yōu)于反距離加權(quán)法[2]。近年來,隨著大氣環(huán)境質(zhì)量受到越來越多關(guān)注,更多學(xué)者開始研究利用空間插值方法估計大氣污染物濃度的空間分布特點。Wu等對美國南加州森林大火前后PM10濃度變化進行了研究,結(jié)果表明,反距離權(quán)重插值法預(yù)測結(jié)果比克里金更好[3]。丁卉等基于珠三角地區(qū)大氣環(huán)境自動監(jiān)測站的主要污染物數(shù)據(jù),對三種空間插值方法進行比較分析,其研究結(jié)果顯示克里金法插值效果最佳[4]。
本文基于福州市城區(qū)空氣自動監(jiān)測站數(shù)據(jù),對PM10濃度監(jiān)測數(shù)據(jù)進行數(shù)據(jù)探索性分析,并采用反距離權(quán)重法、徑向基函數(shù)法和普通克里金插值法對福州市城區(qū)PM10濃度進行插值,最后運用交叉驗證對插值后PM10濃度實測值與預(yù)測值進行誤差計算,對比分析了各種空間插值方法的效果,為福州市PM10濃度的空間插值提供決策依據(jù)。
本研究使用的PM10質(zhì)量濃度數(shù)據(jù)取自2019年1月1日至12月31日福州22個空氣自動監(jiān)測點,包含5個國控監(jiān)測點、7個市控監(jiān)測點、10個區(qū)控監(jiān)測點(詳見圖1)。選取1月、4月、7月、10月分別代表一年四季,對PM10的濃度進行空間插值分析,分別計算4個代表月份的PM10質(zhì)量濃度均值及均方差(表1)。結(jié)果顯示,福州市夏季PM10濃度均值及均方差分別為35.35μg/m3、11.85μg/m3,都明顯低于其他季節(jié),呈現(xiàn)明顯的季節(jié)性特征。
表1 福州市城區(qū)PM10濃度數(shù)據(jù)統(tǒng)計結(jié)果 單位:μg/m3
圖1 福州市城區(qū)PM10自動監(jiān)測站點空間分布
為了更好地認識研究對象,并在插值過程中做出更好的決策,從而提高空間插值準(zhǔn)確率,在空間插值前需對已有樣點數(shù)據(jù)進行分析,主要是對數(shù)據(jù)的分布特征進行探究。常用的有直方圖分布、正態(tài)QQ分布圖、趨勢分析等數(shù)據(jù)分析方法,其中直方圖是顯示數(shù)據(jù)概率分布特征的統(tǒng)計指標(biāo),正態(tài)QQ分布圖用于檢查數(shù)據(jù)的正態(tài)分布情況,而趨勢面分析則能夠發(fā)現(xiàn)數(shù)據(jù)是否在某個方向上有分布趨勢。本文應(yīng)用這三種常用方法分別對四個季度的樣點數(shù)據(jù)進行分析,PM10樣點直方圖結(jié)果顯示,PM10濃度日均值為67.455μg/m3,中位數(shù)值為67.5μg/m3,二者較為接近,偏度為0.03,接近于0,接近正態(tài)分布。正態(tài)QQ分布圖(圖2)中樣點分布基本接近45°參考線,數(shù)據(jù)整體分布傾向于標(biāo)準(zhǔn)正態(tài)分布,故后續(xù)進行克里金插值時無需進行數(shù)據(jù)變換。趨勢面分析圖(圖3)顯示,PM10在南-北方向和西-東方向均呈現(xiàn)平緩、再逐漸降低的趨勢。
圖2 PM10樣點正態(tài)QQ分布圖
空間插值是根據(jù)已有空間數(shù)據(jù)預(yù)估未知空間數(shù)據(jù)的方法,根據(jù)其數(shù)學(xué)本質(zhì)不同,可分為確定性空間插值和地統(tǒng)計空間插值。本文選取了應(yīng)用較為廣泛的反距離權(quán)重插值法、徑向基函數(shù)法這兩種確定性插值方法,以及普通克里金插值的地統(tǒng)計插值方法。利用地理信息的ArcGIS軟件實現(xiàn)空間插值。
(X軸為東方,Y軸為北方,Z軸為數(shù)據(jù)值,垂直的黑線高度表示數(shù)據(jù)的大小)
2.2.1 反距離權(quán)重法(Inverse Distance Weighting,IDW)
反距離權(quán)重法是空間插值方法中最簡單,也是應(yīng)用較多的一種。它假定空間中任意點均有其影響力,并且距離越近,影響力越大,即基于距離較近的事物要比距離較遠的事物更相似的假設(shè)。相對于距離預(yù)測位置較遠的實測值,距離預(yù)測位置較近的實測值對預(yù)估值的影響更大。因此,通過給已知點賦權(quán)重值來預(yù)測未知點,權(quán)重值隨著距離增大而減小,所以稱之為反距離權(quán)重法。
2.2.2 徑向基函數(shù)法(Radial Basis Function,RBF)
徑向基函數(shù)法指某種沿徑向?qū)ΨQ的標(biāo)量函數(shù),由于距離是徑向同性的,因此通常定義為樣本到數(shù)據(jù)中心之間歐氏距離的單調(diào)函數(shù)。
函數(shù)的形式為:
(1)
其中,Xi是函數(shù)的中心,φ以輸入空間的點X與Xi中心的距離為自變量,因此稱為徑向基函數(shù)。
2.2.3 普通克里金插值(Ordinary Kriging,OK)
普通克里金插值的應(yīng)用范圍極為廣泛,其基本原理是基于數(shù)據(jù)滿足正態(tài)分布的假設(shè),首先計算樣本的變異函數(shù),在此基礎(chǔ)上,選擇對應(yīng)的理論模型進行模擬,最后應(yīng)用模擬的變異函數(shù)對未知點進行預(yù)測[5]。
由于反距離權(quán)重插值法和徑向基函數(shù)法的實測值與預(yù)測值無任何誤差,因此,為了定量分析3種插值方法的精確性,采用交叉驗證對插值結(jié)果進行分析,首先逐一剔除某一站點數(shù)據(jù),然后利用其他站點數(shù)據(jù)來模擬生成該站點的預(yù)測值,最后通過對比預(yù)測值與實測值,從而了解空間插值的誤差情況。采用平均誤差(ME)、均方根誤差(RMS)、平均相對誤差(MRE)三個評價指標(biāo)對空間插值結(jié)果進行評價。通過計算實測值與預(yù)測值間的相關(guān)系數(shù)(R)來評估空間插值結(jié)果的可靠性。
平均誤差(ME)是實測值與預(yù)測值之間差值的平均值,反映預(yù)測誤差的整體分布情況,計算公式如下:
(2)
均方根誤差(RMS)指模型預(yù)測結(jié)果與實測值的偏離程度,值越小,說明預(yù)測結(jié)果越接近實測值,計算公式如下:
(3)
平均相對誤差(MRE)是指預(yù)測值與實測值的絕對偏差相對實測值的百分率,反映了預(yù)測值相對實測值的準(zhǔn)確度,計算公式如下:
(4)
相關(guān)系數(shù)用于評價兩個連續(xù)變量的相關(guān)程度:
(5)
利用福州市城區(qū)22個大氣環(huán)境自動監(jiān)測站的PM10濃度監(jiān)測數(shù)據(jù),基于反距離權(quán)重插值法、徑向基函數(shù)法、普通克里金法對福州市城區(qū)PM10濃度進行空間插值。分別計算三種插值方法PM10實測值與預(yù)測值的相關(guān)系數(shù)(表2),從表2可以看出,三種方法預(yù)測值與實測值的相關(guān)系數(shù)都很高,其中普通克里金法最高,達0.933,而反距離權(quán)重法最低,為0.917。且三種插值方法反映顯著性水平的P值均小于0.01,說明三種方法的預(yù)測值與實測值具有顯著相關(guān)性,結(jié)果可靠。
表2 空間插值預(yù)測值與實測值的相關(guān)系數(shù)
對空間插值結(jié)果進行交叉驗證,得到不同空間插值方法的整體結(jié)果(表3)。從表3可以看出,三種空間插值方法中,徑向基函數(shù)法和普通克里金插值的平均誤差(ME)為正,而反距離權(quán)重插值法的平均誤差(ME)為負,說明徑向基函數(shù)法和普通克里金法的插值結(jié)果整體上是略高于實測值,反距離權(quán)重插值法則是低于實測值,且普通克里金法的平均誤差最小,僅為0.06μg/m3。從均方根誤差(RMS)結(jié)果看,普通克里金法的RMS為6.97μg/m3,是三種方法中最小的,說明其插值結(jié)果最接近于實測值,插值精度最高,而反距離權(quán)重法的插值結(jié)果偏離實測值最多。從平均相對誤差(MRE)看,普通克里金為0.126,仍是三種方法中最小的,可見相對于測量值來說,簡單克里金法的插值結(jié)果也是最為準(zhǔn)確的。
表3 三種空間插值方法的交叉驗證結(jié)果
綜上可見,整體上,普通克里金法的空間插值效果最理想,其次是徑向基函數(shù)法,而反距離權(quán)重法則最差。普通克里金法在插值過程中既考慮了未知點與已知站點位置的相關(guān)性,同時還考慮了變量之間的空間相關(guān)性[6],并且引入變異函數(shù),使得整體插值效果最優(yōu)、插值誤差最小。
簡單克里金法雖然是三種方法中插值精度最高的,但是其RMS值也達到6.97,說明方法的精度還不是非常理想,這主要是因為PM10的分布不是簡單的空間分布,還受溫度、濕度、氣壓等大氣因素的影響[7],由于本文主要是比較幾種插值方法,所以并未將這些因素考慮進來。
對三種插值方法,按月份統(tǒng)計插值結(jié)果(表4,圖4),從圖4可以看出,三種插值方法在任一月份的均方根誤差都是普通克里金法最低,徑向基函數(shù)法次之,而反距離權(quán)重法最高。可見,三種插值方法的優(yōu)劣排名并未受季節(jié)的影響。
反距離權(quán)重法 徑向基函數(shù)法 普通克里金法
表4 三種空間插值方法的月插值結(jié)果
圖4 三種空間插值方法的均方根誤差圖
研究發(fā)現(xiàn),夏季的插值結(jié)果是四季中最好的,其均方根誤差明顯小于其他季節(jié),特別是普通克里金法的MRE僅為4.23μg/m3,而冬、春季的插值結(jié)果偏離實測值較多,插值結(jié)果較差??梢奝M10的季節(jié)性分布特征對空間插值結(jié)果有顯著影響。夏季是福州市一年中氣溫最高并且濕度較大的時期,氣溫越高、濕度越大,有利于氣體擴散[8],PM10濃度就低,同時空氣擴散快,各監(jiān)測站點間濃度差異小,均方根誤差也低,空間數(shù)據(jù)分布較為均勻,因此空間插值效果也最好。
從誤差分布圖(圖5)可以看出,7月插值結(jié)果的誤差分布較其他月份明顯更集中,且是緊密分布在0點兩側(cè),而1月誤差分布則明顯偏離在0點的右側(cè),預(yù)測值整體高于實測值,10月則偏離在0點的左側(cè),預(yù)測值整體低于實測值。因此,在進行插值時可考慮對結(jié)果進行整體的偏移,以降低插值誤差。
此外,從表4中可以看出,夏季徑向基函數(shù)法與普通克里金法的插值結(jié)果MRE分別為4.24μg/m3、4.23μg/m3,二者較為接近,說明PM10濃度低且分布較為均勻時,徑向基函數(shù)法只是略遜于普通克里金法,但是考慮到普通克里金插值對數(shù)據(jù)要求高,且算法更為復(fù)雜,此時可選擇徑向基函數(shù)法。
從PM10濃度插值空間分布圖(圖6)可以看出,三種插值方法的PM10濃度分布趨勢是一致的,4月26日PM10濃度分布圖(圖6a)以三坊七巷為中心,往外濃度不段上升,其次是在東南面也有一個PM10濃度低值片區(qū);4月27日(圖6b)PM10濃度形成西北-東南條帶濃度低,而東北、西南片區(qū)濃度高的趨勢。此外,從圖中可見,普通克里金插值的PM10濃度空間分布圖局部存在塊狀想象,平滑性最差,可觀性低,這是克里金插值過程中充分考慮了數(shù)據(jù)點之間的空間相關(guān)性導(dǎo)致的,而反距離法的插值圖數(shù)據(jù)不合理現(xiàn)象最為明顯,即出現(xiàn)多個孤立點數(shù)據(jù)異于周圍數(shù)據(jù)(圖中圓圈處),不符合空氣質(zhì)量的分布規(guī)律,這是因為IDW插值過程中只考慮了距離這個因素,使得插值結(jié)果易受數(shù)據(jù)集群影響[5]。因此在插值結(jié)果相近的情況下,考慮插值結(jié)果的可觀性,可優(yōu)先選擇徑向基函數(shù)法進行插值。
(a)反距離權(quán)重法
①三種插值方法的計算結(jié)果表明,福州市城區(qū)PM10濃度空間插值預(yù)測值與實測值相關(guān)系數(shù)都很高,特別是普通克里金法最高,達到0.933。且三種插值方法反映顯著性水平的P值均小于0.01,說明三種方法的預(yù)測值與實測值具有顯著相關(guān)性,結(jié)果可靠。
②通過交叉驗證,從統(tǒng)計插值結(jié)果的平均誤差(ME)、均方根誤差(RMS)、平均相對誤差(MRE)看,普通克里金法的空間插值效果最理想,其次是徑向基函數(shù)法,而反距離權(quán)重插值法則最差。
③PM10的季節(jié)性分布特征對空間插值結(jié)果有顯著影響。三種插值方法中,夏季插值結(jié)果均明顯優(yōu)于其他季節(jié),這是因為PM10濃度低,均方根誤差也低時,空間數(shù)據(jù)分布較為均勻,因此空間插值效果也最佳。而夏季徑向基函數(shù)法插值結(jié)果只略遜于普通克里金法,此時可選擇徑向基函數(shù)法。
④三種插值方法的PM10濃度空間分布趨勢較為一致,但是普通克里金插值的PM10濃度空間分布圖局部存在塊狀現(xiàn)象,可觀性低,而反距離法的插值圖數(shù)據(jù)不合理現(xiàn)象最為明顯,因此在插值結(jié)果相近的情況下,考慮插值結(jié)果的可觀性,可選擇徑向基函數(shù)法進行插值。