李翔宇,李 曌,包艷英,李 利,李玉璞
1.大連市環(huán)境監(jiān)測中心,遼寧 大連 116023 2.中國環(huán)境監(jiān)測總站,國家環(huán)境保護環(huán)境監(jiān)測質(zhì)量控制重點實驗室,北京 100012 3.海軍大連艦艇學院,信息系統(tǒng)系,遼寧 大連 116018
《水污染防治行動計劃》[1]中規(guī)定了近岸海域水質(zhì)優(yōu)良(一、二類)比例目標,在計算海水優(yōu)良比例時,一般按照點位法或面積法進行計算。點位比例計算簡單直接,責任明確,但評價結(jié)果不連續(xù),與環(huán)境要素的管理目標不相吻合。面積比例計算一般采用代表面積法或者插值面積法,代表面積法(即通過核算,給每個監(jiān)測點位賦以固定的面積)與污染物實際擴散規(guī)律不相適應,相鄰點位評價結(jié)果不連續(xù)[2];插值面積法可以反映近岸海域水質(zhì)空間分布情況,評價結(jié)果相對連續(xù),可以作為點位比例法的有效補充。插值方法的選擇十分重要,目前常用的空間插值方法有反距離加權(quán)插值法(IDW)、克里金插值法(Kringing)、樣條函數(shù)法(Spline)和趨勢面法(Trend Surface)等[3-6]。多項研究表明[7-9],IDW插值方法在海水污染物分布空間表達方面有一定優(yōu)勢。付瑞全等[7]基于ArcGIS軟件空間插值模塊采用IDW插值法實現(xiàn)了海水污染面積計算,但并未給出具體的插值參數(shù)建議;李俊龍等[8]分別采用IDW法、Spline法和克里格法等3種方法13種模型進行了全國近岸海域海水水質(zhì)模擬,并通過交叉驗證得出IDW(p=2)最適宜模擬全國近岸海域(299個點位)水質(zhì)分布的結(jié)論,提出不同區(qū)域、不同要素有待進一步研究;李冕等[9]對IDW插值模型進行改進,給出一種自適應凸包選點的插值方法,認為該法能較好地反映海水水質(zhì)質(zhì)量趨勢。對于空間插值來說,沒有絕對最佳的插值方法[3],要針對研究區(qū)的情況,對數(shù)據(jù)樣本進行反復試驗,得到理想的插值效果。
筆者重點研究了傳統(tǒng)IDW插值具體參數(shù)(冪參數(shù)、參與插值的周圍點的數(shù)量、插值網(wǎng)格大小)的選取,比較了IDW方法在點位密度不同的開放海域和近封閉內(nèi)海海域的適用性,并將IDW插值法水質(zhì)類別綜合評價結(jié)果與常用的點位法和代表面積法評價結(jié)果進行比較分析,指出了方法應用的注意事項及局限性,為有類似評價需求的用戶提供參考和借鑒。
以全國近岸海域和渤海海域為研究區(qū)(分別代表開放海域與近封閉內(nèi)海海域)。全國近岸海域布設(shè)413個國控監(jiān)測點位(圖1),平均點位密度約為13.8個/萬km2(統(tǒng)計數(shù)據(jù)不包含港、澳、臺地區(qū),下同);渤海海域布設(shè)163個監(jiān)測點位(圖2),平均點位密度約為21.2個/萬km2。2個研究區(qū)監(jiān)測點位分布特點均為臨岸較密,離岸較疏,渤海海域的監(jiān)測點位比全國近岸海域的監(jiān)測點位更為密集。
海水水質(zhì)數(shù)據(jù)來源于全國近岸海域環(huán)境監(jiān)測網(wǎng)某水期監(jiān)測數(shù)據(jù),共有29個監(jiān)測項目:pH、溶解氧、化學需氧量、生化需氧量、無機氮、非離子氨、活性磷酸鹽、汞、鉛、鎘、六價鉻、總鉻、砷、銅、鋅、硒、鎳、氰化物、硫化物、揮發(fā)性酚、石油類、六六六、滴滴涕、馬拉硫磷、甲基對硫磷、苯并(a)芘、陰離子表面活性劑、糞大腸菌群和大腸菌群等。
圖1 全國近岸海域評價區(qū)域監(jiān)測點位分布Fig.1 Assessment range of China coastal area and the distribution of monitoring points
圖2 渤海海域監(jiān)測點位分布Fig.2 Assessment range of the Bohai Sea area and the distribution of monitoring points
IDW插值算法是基于地理學第一定律相近相似的原理,認為每個采樣點都對鄰近區(qū)域的插值點有一定的影響,且影響的大小隨距離的增大而減小。一般公式為
(1)
(2)
(3)
IDW法屬于精確插值方法,即插值后表面通過采樣點,該特征可以保證插值結(jié)果在采樣點位處與實際監(jiān)測值一致。
從公式可以看出,在樣本點位固定的情況下,對一個點進行IDW插值時涉及的參數(shù)主要是冪參數(shù)(p)和參與插值的采樣點數(shù)量(N)。對一個區(qū)域進行插值并展示時,還應涉及插值網(wǎng)格的大小。
目前中國采用的海水點位水質(zhì)類別評價方法為單因子指數(shù)法[10]。插值法海域水質(zhì)類別綜合評價與單因子指數(shù)法理論一致,不同的是將“點”擴展到“面”。步驟如下:①單指標空間插值,即針對每項監(jiān)測指標,對所有監(jiān)測點位的監(jiān)測結(jié)果進行空間插值,獲得每項指標濃度的連續(xù)空間分布柵格數(shù)據(jù)集;②單指標水質(zhì)分類,依據(jù)《海水水質(zhì)標準》(GB 3097—1997)[11]對單指標插值結(jié)果進行水質(zhì)類別分類賦值,以1、2、3、4、5分別代表一類、二類、三類、四類、劣四類海水,獲得每項指標水質(zhì)類別的空間分布柵格數(shù)據(jù)集;③多指標水質(zhì)類別判定,通過柵格數(shù)據(jù)疊加分析,取某處最差水質(zhì)類別(多層柵格數(shù)據(jù)同一位置的最大值)作為該處最終水質(zhì)類別,獲得評價區(qū)域內(nèi)的海水水質(zhì)類別空間分布情況;④通過統(tǒng)計各水質(zhì)類別柵格數(shù)量計算其面積及所占比例,輸出近岸海域水質(zhì)類別空間分布圖。
單指標空間插值、單指標水質(zhì)分類和多指標水質(zhì)類別判定采用ArcGIS 10.2;數(shù)據(jù)的統(tǒng)計及相關(guān)分析采用SPSS 19.0。矢量數(shù)據(jù)采用GCS_WGS_1984坐標系統(tǒng),Albers正軸割圓錐等面積投影,中央經(jīng)線為105°,標準緯線為25°和47°。
2.3.1 冪參數(shù)的選擇
采樣點在插值計算過程中所占權(quán)重的大小受p(正實數(shù))的影響,隨著采樣點與插值點之間距離的增加,采樣點對插值點影響的權(quán)重按指數(shù)規(guī)律減小。冪值大,較近點的影響較大;冪值小,較遠點的影響增大。
2008—2017年的全國近岸海域環(huán)境質(zhì)量公報顯示,無機氮和活性磷酸鹽是中國近岸海域海水中的主要污染物,選用代表性較強的無機氮測值進行不同冪參數(shù)插值實驗,并采用10折交叉驗證法[12]驗證各插值模型的預測效果。采用模擬值與實測值的平均誤差(ME)、平均絕對誤差(MAE)、均方根誤差(RMSE)和Pearson相關(guān)系數(shù)等指標評價插值模型的精度。ME反映總體模擬值誤差的大小,MAE反映模擬值存在的可能誤差范圍,RMSE反映模擬值的靈敏度和極值效應,相關(guān)系數(shù)反映預測值和模擬值之間的吻合程度[8]。
10折交叉驗證法的原理是使用系統(tǒng)抽樣法把數(shù)據(jù)集平均分為10份(做法是將所有點位以緯度為第一字段、經(jīng)度為第二字段進行升序排列,并循環(huán)進行1~10編碼,該法基本可以保證編號一致的點位均勻分布,將編號一致的數(shù)據(jù)集視為同一份數(shù)據(jù))。每次從10份數(shù)據(jù)集中拿出1份作為驗證集,剩下的9份數(shù)據(jù)集作為訓練集,對每份訓練集進行IDW插值實驗。
2.3.2 參與插值的周圍采樣點的數(shù)量選擇
參與插值的采樣點數(shù)量與相鄰點位的數(shù)量相關(guān),通過監(jiān)測點位所構(gòu)成的泰森多邊形判斷一個離散點與哪些離散點相鄰,每個泰森多邊形的邊數(shù)代表了相鄰點位的個數(shù)。選取相鄰點位個數(shù)出現(xiàn)頻率最高的作為插值采樣點數(shù)量參數(shù),基本可以保證待插值點周圍各個方向的近距離點位均參與插值。
2.3.3 插值柵格大小的選擇
柵格的大小決定了插值結(jié)果對水質(zhì)類別反映的精細程度,也影響插值運算效率。通過一系列柵格大小梯度實驗,對比選取能較好反映水質(zhì)類別分布情況且運算效率較高的柵格值。
3.1.1 冪參數(shù)
冪參數(shù)p依次選取0.5、1、2、3、4、5、6進行2個研究區(qū)無機氮插值實驗,并進行誤差分析,詳見表1和表2。
表1 全國近岸海域10折交叉驗證誤差結(jié)果Table 1 The precision analysis of China coastal area with 10% off cross-certification
表2 渤海海域10折交叉驗證誤差結(jié)果Table 2 The precision analysis of the Bohai Sea area with 10% off cross-certification
對全國近岸海域來說:
ME:p(1)
MAE:p(3)
RMSE:p(3)
相關(guān)系數(shù):p(3) >p(2) >p(4) >p(5) >p(1) >p(6) >p(0.5)。
對渤海海域來說:
ME:p(4)
MAE:p(1)
RMSE:p(2)
相關(guān)系數(shù):p(3) >p(2) >p(4) >p(5) >p(6) >p(1) >p(0.5)。
2個研究區(qū)各模型的預測值與實測值在置信度0.01水平上均顯著性相關(guān),說明IDW插值結(jié)果與實測結(jié)果相吻合,能夠反映海水污染物的水平分布情況。
為便于查看,放大2個研究區(qū)典型部分來對比不同冪參數(shù)的無機氮插值效果(圖3)。可以看出,p取值為0.5時,過于強調(diào)較遠點的影響,各類水質(zhì)邊界不平滑,部分區(qū)域插值結(jié)果失真(如遼東灣東北部區(qū)域二類海水與四類海水直接相鄰,缺乏過渡);p取值為1時,上述情況略有改善,海水類別跳躍分布現(xiàn)象仍然存在,并且出現(xiàn)圍繞監(jiān)測點的牛眼現(xiàn)象;p取值為2或3時,各類水質(zhì)邊界趨于平滑,能較好反映各類水質(zhì)過渡情況;p≥4時,插值效果較之前變化越來越不顯著,但仍可以看出,隨著p取值增大,各類水質(zhì)邊界更加平滑,但過于強調(diào)較近點的影響,當一個區(qū)域缺少點位時,評價結(jié)果開始從周圍向這些區(qū)域過度擠壓(如長江口鄰近海域三、四類海水面積幾乎被擠壓殆盡,渤海普蘭店灣附近二、三、四類海水也存在同樣的情況)。
綜合考慮各模型誤差結(jié)果及圖上效果,全國近岸海域冪參數(shù)取值為3,渤海海域冪參數(shù)取值為2。從表1和表2可以看出,雖然渤海海域點位密度較大,但全國近岸海域插值結(jié)果誤差分析多項指標均優(yōu)于渤海海域,這說明IDW法在開放海域的模擬效果整體優(yōu)于近封閉海域。究其原因,海域水質(zhì)變化雖然都呈現(xiàn)近岸到遠海逐漸變好的趨勢,但是對于開放海域來說,基本是單一方向的變化,對于近封閉海域來說則是從四周向中間的多方向變化,點位監(jiān)測值規(guī)律性較差,影響了插值效果。
3.1.2 參與插值的周圍采樣點數(shù)量
根據(jù)監(jiān)測點位的分布情況,建立泰森多邊形。2個研究區(qū)每個監(jiān)測點位相鄰點的數(shù)量(N)從1個到8個不等,全國近岸海域以4個為最多,渤海海域以5個為最多,見表3。可將全國近岸海域參與插值的周圍采樣點數(shù)量設(shè)置為N=4,渤海海域設(shè)置為N=5。
圖3 不同p值所對應的無機氮水質(zhì)類別插值結(jié)果Fig.3 Spatial interpolation results of dissolved inorganic nitrogen(DIN) with different power
表3 監(jiān)測點位構(gòu)成的泰森多邊形相鄰點位統(tǒng)計Table 3 The neighbor point statistics using Thiessen polygons created by monitoring points
3.1.3 插值柵格大小
分別將柵格大小(C)設(shè)置為1 000、500、200、100 m,比較評價范圍吻合程度、統(tǒng)計結(jié)果的穩(wěn)定性及運行效率等(表4)。
柵格大小為1 000 m時,鋸齒化情況嚴重,一些海灣和島嶼的陸上部分被侵占,隨著柵格取值的減小,鋸齒化情況不斷改善,直至柵格大小為200、100 m時,各類別之間的界線平滑,插值結(jié)果與評價范圍吻合較好。統(tǒng)計結(jié)果的穩(wěn)定性方面,從表4可以看出,隨著柵格變小,插值后各類別海水面積占比之間的差異也逐漸變小,柵格大小為200、100 m時,差異基本可忽略不計,這種差異對于評價范圍及其子集之間統(tǒng)計結(jié)果的穩(wěn)定有重要意義,如全國與各省(區(qū)、市),各省(區(qū)、市)與各市,差異越小,越有利。運行效率方面,隨著柵格的變小,運行效率不斷降低,但均在可接受的范圍內(nèi)。
因此,對全國或海區(qū)進行評價時,為能較好反映小水域詳細的水質(zhì)狀況,保證插值結(jié)果的穩(wěn)定性,同時確保較高的處理效率,柵格大小設(shè)置為200 m左右為宜。
當對河口、海灣等小區(qū)域進行單獨評價或監(jiān)測點位密度更大時,也可將柵格設(shè)置的更小。同一次評價單個指標圖層柵格大小必須保持一致,以便進行多圖層疊加。
表4 不同柵格大小對應的各類別海水面積比例差值Table 4 The interpolation results comparison to different cell sizes %
利用IDW插值法評價全國近岸海域和渤海海域水質(zhì)類別空間分布(29個監(jiān)測項目)。其中全國近岸海域插值參數(shù)設(shè)置為p=3,N=4,C=200 m;渤海海域插值參數(shù)設(shè)置為p=2,N=5,C=200 m。統(tǒng)計海水優(yōu)良面積比例,并與常用的點位法和代表面積法的統(tǒng)計結(jié)果進行比較,結(jié)果見表5。
表5 不同方法獲得近岸海域海水優(yōu)良比例對比Table 5 The percentage of the first and second class seawater by different methods %
3種方法中,IDW插值法優(yōu)良比例值高于點位法,低于代表面積法(泰森多邊形)。點位法優(yōu)良比例相對較低的原因是該法認為每個點位權(quán)重是一樣的,但監(jiān)測點位分布不均勻,對評價區(qū)域而言,密集區(qū)域的單個點位影響范圍小于稀疏區(qū)域,而水質(zhì)較差點位主要分布在靠近陸地的點位的密集區(qū)域,因此監(jiān)測點位分布均勻性越差,兩者差異越大。
2種面積法水質(zhì)類別統(tǒng)計結(jié)果非常接近,但從空間分布直觀展示效果來看(以渤海海域為例,圖4),IDW插值法更為流暢,更符合污染物擴散規(guī)律。
圖4 水質(zhì)類別空間分布效果對比Fig.4 The seawater quality spatial distribution using IDW interpolation and thiessen polygon
3.3.1 方法應用注意事項
3.3.1.1 基礎(chǔ)數(shù)據(jù)監(jiān)測不全的處理
當某點位存在部分評價項目未監(jiān)測的情況時,該點位不應參與該缺失項目插值。需要在數(shù)據(jù)資料準備階段,將表中相關(guān)單元格設(shè)置為<空>值(注意并非賦為0值)。
3.3.1.2 插值范圍及掩膜范圍
插值范圍的設(shè)置是為了劃定數(shù)據(jù)分析范圍,應不小于插值點位外接多邊形范圍(保證相關(guān)點位均參與插值)及評價區(qū)域范圍(保證評價區(qū)域內(nèi)全部被插值)。一般可設(shè)置為評價區(qū)域范圍圖層,也可根據(jù)上述原則另行繪制。
若不設(shè)置插值范圍,則默認輸出區(qū)域為所有點位的外接矩形,當評價區(qū)域涉及海灣時,由于監(jiān)測點位位于海灣內(nèi)部,不能將評價區(qū)域完全包含,會出現(xiàn)插值不完全現(xiàn)象,部分評價區(qū)域存在空白,設(shè)置插值范圍后避免了此類問題。
掩膜范圍的設(shè)置主要是因為插值輸出數(shù)據(jù)集的范圍通常會大于評價區(qū)域范圍,為獲得以評價區(qū)域為邊界的插值結(jié)果,需要對其進行掩膜處理,也就是使用評價區(qū)域?qū)Σ逯到Y(jié)果進行裁剪。掩膜范圍應設(shè)置為評價范圍圖層。
3.3.1.3 跨島問題的處理
為去除半島及島嶼兩側(cè)點位之間的相互影響,需要對其進行阻斷,使其無法參與對方區(qū)域的插值運算,這個目標可通過繪制限制采樣點搜索的隔斷線,并指定為障礙參數(shù)來實現(xiàn)。隔斷線繪制的原則是插值點與用來進行插值的采樣點之間地理上應相互通視。圖5展示的是廣東東海島附近海域插值結(jié)果。東海島南側(cè)2個點位均為一類水質(zhì),北側(cè)1個點位為四類水質(zhì),未設(shè)置隔斷線時,東海島南側(cè)海域受北側(cè)四類水質(zhì)點位的影響,臨岸有一部分區(qū)域為二類海水,這與實際情況相悖;設(shè)置隔斷線后,南側(cè)海域均為一類水質(zhì),使插值結(jié)果更接近實際。需要注意的是,使用隔斷線會顯著增加系統(tǒng)處理時間,因此,隔斷線不是越多越好,可根據(jù)實際需要進行設(shè)置。
圖5 設(shè)置隔斷線對評價結(jié)果的影響對比Fig.5 The comparison with or without barrier
3.3.2 方法局限性
IDW插值法的特征之一是會產(chǎn)生圍繞觀測點位置的“牛眼”,這不符合海水污染物的局部擴散規(guī)律。
IDW插值法的特征之二是其預測值處于所輸入的采樣數(shù)據(jù)的最小值與最大值之間。這個特點雖然保證了插值結(jié)果不會出現(xiàn)過高或過低的超失真情況,但同時也抑制了污染物空間分布預測向高值或低值推進的趨勢。研究中對各驗證集預測值及對應實測值的水質(zhì)類別進行對比分析,發(fā)現(xiàn)分布在內(nèi)側(cè)或者外側(cè)、測值明顯高于或者明顯低于周圍點位的測值容易產(chǎn)生預測錯誤,這主要是由于該特征所決定的。
IDW插值法公式與任何物理過程都不關(guān)聯(lián),但海水有海流、潮汐、潮流、波浪等流動特性,且具有很強的季節(jié)性,污染物的擴散極為復雜,該法未將水動力條件考慮在內(nèi)。
關(guān)于IDW插值參數(shù)的選取,應隨不同區(qū)域、不同點位分布而不同。冪參數(shù)(p)可通過多冪值實驗,利用交叉驗證誤差分析選取適宜的值;參與插值的周圍采樣點數(shù)量(N)可通過構(gòu)建泰森多邊形統(tǒng)計相鄰點位個數(shù)出現(xiàn)頻率最高的值確定,點位密度小,N較小,點位密度大,N較大;插值柵格大小(C)需綜合考慮評價范圍大小、評價結(jié)果穩(wěn)定性和運行效率選定。針對目前研究區(qū)范圍及監(jiān)測點位的分布情況,全國近岸海域參數(shù)設(shè)置為p=3,N=4,C=200 m較為適宜;渤海海域設(shè)置為p=2,N=5,C=200 m較為適宜。
IDW插值方法在開放海域和近封閉內(nèi)海海域均適用,但在開放海域的模擬結(jié)果好于近封閉海域。
海域水質(zhì)面積評價的IDW插值法與代表面積法統(tǒng)計結(jié)果接近,但前者在空間分布展示上更接近實際;點位分布的均勻性決定點位法與面積法評價結(jié)果的接近程度,點位分布越均勻,兩者越接近。