沈煥鋒,李同文
1. 武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079; 2. 地球空間信息技術(shù)協(xié)同創(chuàng)新中心,湖北 武漢 430079
隨著經(jīng)濟(jì)的快速發(fā)展,細(xì)顆粒物(fine particulate matter,PM2.5)污染已成為全球范圍內(nèi)的重大環(huán)境問題。2016年世界衛(wèi)生組織發(fā)布的報(bào)告顯示,全球92%的人口暴露于年均>10 μg/m3的大氣PM2.5污染中[1],公眾健康受到極大的威脅。因此,對(duì)大氣PM2.5污染進(jìn)行動(dòng)態(tài)監(jiān)測(cè)至關(guān)重要。地面站點(diǎn)監(jiān)測(cè)是獲取大氣PM2.5污染狀況最為直接的手段[2-3],然而,監(jiān)測(cè)站點(diǎn)建設(shè)成本高昂、實(shí)施難度較大,空間分布相對(duì)較為稀疏,難以實(shí)現(xiàn)大范圍空間連續(xù)監(jiān)測(cè)。
遙感衛(wèi)星能夠提供大范圍的觀測(cè)數(shù)據(jù),有效彌補(bǔ)了地面監(jiān)測(cè)站點(diǎn)分布稀疏這一不足[4-5]。利用衛(wèi)星遙感技術(shù)監(jiān)測(cè)氣溶膠的研究始于20世紀(jì)七、八十年代[6],而大氣PM2.5遙感定量反演則是在近十幾年取得了蓬勃的發(fā)展。初期,主要利用簡(jiǎn)單回歸方法及大氣模式對(duì)PM2.5遙感反演進(jìn)行探究,文獻(xiàn)[7]利用化學(xué)傳輸模型與衛(wèi)星觀測(cè)數(shù)據(jù)繪制了2001—2006年全球大氣PM2.5平均濃度分布圖,引發(fā)了國(guó)際社會(huì)的廣泛關(guān)注;其后,隨著地面監(jiān)測(cè)網(wǎng)的發(fā)展,基于統(tǒng)計(jì)模型的反演方法發(fā)展十分迅速,由全局簡(jiǎn)單回歸模型發(fā)展到顧及時(shí)空異質(zhì)性的高級(jí)統(tǒng)計(jì)模型、由線性模型發(fā)展到非線性模型,并引入了氣象條件、土地利用等諸多影響因素。目前,大氣PM2.5遙感反演技術(shù)日趨成熟,在大氣環(huán)境監(jiān)測(cè)應(yīng)用中發(fā)揮著重要的作用。
本文主要從大氣PM2.5遙感反演與驗(yàn)證、大氣PM2.5偏差校正與無(wú)縫制圖兩方面進(jìn)行綜述,并總結(jié)大氣PM2.5遙感制圖的前沿研究方向。
基于衛(wèi)星遙感的大氣PM2.5反演研究通常采用衛(wèi)星氣溶膠光學(xué)厚度(aerosol optical depth,AOD)產(chǎn)品,其方法主要可歸為以下4類(圖1)。①模式比例因子法[7-10]。利用大氣化學(xué)傳輸模型模擬AOD與大氣PM2.5的比例因子,從而由遙感AOD數(shù)據(jù)估算地面大氣PM2.5濃度。其優(yōu)勢(shì)在于不依賴地面站點(diǎn)大氣PM2.5數(shù)據(jù),直接由衛(wèi)星觀測(cè)值反演大氣PM2.5濃度,然而,其模型結(jié)構(gòu)與模擬過程十分復(fù)雜,并且污染物排放清單常常存在較大的不確定性,這往往導(dǎo)致大氣PM2.5反演精度有限。②基于物理機(jī)理的半經(jīng)驗(yàn)法[11-13]?;谖锢頇C(jī)理,建立衛(wèi)星AOD與地面大氣PM2.5的物理關(guān)系方程,其優(yōu)勢(shì)在于具備嚴(yán)密的理論推導(dǎo),然而參數(shù)的求解一般需要通過經(jīng)驗(yàn)統(tǒng)計(jì)關(guān)系擬合。③統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)方法[14-19]。構(gòu)建衛(wèi)星AOD與站點(diǎn)大氣PM2.5之間的定量關(guān)系,并將此關(guān)系擴(kuò)展至面域大氣PM2.5反演。該類方法易于實(shí)現(xiàn),并且精度較高,是目前大氣PM2.5遙感反演最為流行的手段。④混合模型。將上述方法混合使用,較為流行的方式是首先通過大氣模式模擬[20-22]或其與遙感AOD結(jié)合[23](即第1類方法)得到初始大氣PM2.5數(shù)據(jù),其次將該初始大氣PM2.5數(shù)據(jù)作為統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)的建模輸入變量。
圖1 大氣PM2.5遙感反演方法示意Fig.1 Schematic of atmospheric PM2.5 remote sensing retrieval methods
在上述4類方法中,基于統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)的方法已經(jīng)成為大氣PM2.5遙感反演最為重要的技術(shù)途徑,以下進(jìn)行詳細(xì)闡述:
(1) 簡(jiǎn)單回歸模型。2003年,文獻(xiàn)[19]首次定量探討了衛(wèi)星觀測(cè)AOD與地面站點(diǎn)大氣PM2.5的相關(guān)性,論證了衛(wèi)星AOD用于地面大氣PM2.5反演的可行性。在此基礎(chǔ)上,AOD-PM2.5關(guān)系容易受到氣象因子、地形條件等諸多因素影響,多元線性回歸模型由此引入到大氣PM2.5遙感反演中[18]。值得注意的是,利用多元線性回歸構(gòu)建站點(diǎn)觀測(cè)大氣PM2.5及周邊地理要素變量間的關(guān)系,即為土地利用回歸建模[24]。其次,通過分析大氣PM2.5與影響變量之間的數(shù)值分布規(guī)律,引入數(shù)值先驗(yàn)(如指數(shù)函數(shù)關(guān)系),文獻(xiàn)[25]發(fā)展了半經(jīng)驗(yàn)統(tǒng)計(jì)模型,其一般轉(zhuǎn)換為多元線性回歸模型進(jìn)行求解。此3類簡(jiǎn)單回歸模型的結(jié)構(gòu)分別如式(1)—(3)所示
PM2.5=β0+βAOD·AOD
(1)
PM2.5=β0+βAOD·AOD+βX·X
(2)
PM2.5=eβ0·AODβAOD·eβX·X
(3)
式中,X指代其他輔助輸入變量;β0、βAOD與βX為模型回歸系數(shù)。
(2) 廣義可加模型。廣義可加模型(generalized additive model,GAM)是簡(jiǎn)單線性模型的擴(kuò)展,表現(xiàn)在引入了非線性函數(shù)[26],從而能夠描述AOD-PM2.5關(guān)系的非線性特征。模型結(jié)構(gòu)如式(4)所示
PM2.5=βo+SAOD(AOD)+SX(X)
(4)
式中,SAOD()與SX()表示AOD及其他輔助變量的非線性函數(shù)。
例如,文獻(xiàn)[27]利用GAM模型,結(jié)合衛(wèi)星AOD、氣象、土地利用等輔助數(shù)據(jù),對(duì)地面大氣PM2.5濃度估算進(jìn)行建模。該方法對(duì)預(yù)測(cè)變量間的交互作用顧及不足,僅能通過手動(dòng)添加交互項(xiàng)進(jìn)行彌補(bǔ)。
(3) 線性混合效應(yīng)模型。上述回歸模型一般建立大氣PM2.5濃度與影響因素間的全局關(guān)系,并沒有考慮AOD-PM2.5關(guān)系的時(shí)空異質(zhì)性。線性混合效應(yīng)(linear mixed effects,LME)模型[16,28-30]通常在時(shí)間維度上添加隨機(jī)效應(yīng),用以考慮AOD-PM2.5關(guān)系的時(shí)間異質(zhì)性,如式(5)所示
PM2.5=(β0+β0,t)+(βAOD+βAOD,t)·AOD+
βX·X
(5)
式中,β0與βAOD為不隨時(shí)間而變的模型固定效應(yīng)系數(shù),而β0,t與βAOD,t則為模型隨機(jī)效應(yīng)系數(shù),隨時(shí)間而改變,反映AOD-PM2.5關(guān)系的時(shí)間變異性。
需要注意的是,LME模型在時(shí)間維度上能夠反映AOD-PM2.5關(guān)系的變異性,而在空間維度上是全局的,即:沒有考慮空間異質(zhì)性。有學(xué)者嘗試在LME建模時(shí)添加空間隨機(jī)效應(yīng),但在空間制圖過程中,對(duì)空間隨機(jī)效應(yīng)進(jìn)行了舍棄處理[31]。該模型基于線性假設(shè),無(wú)法反映AOD與大氣PM2.5間的非線性關(guān)系。
(4) (時(shí)空)地理加權(quán)回歸。考慮到AOD-PM2.5關(guān)系的時(shí)空異質(zhì)性,單時(shí)間(如天、小時(shí))地理加權(quán)回歸模型(geographically weighted regression,GWR)[32-34]利用局部回歸技術(shù),構(gòu)建基于衛(wèi)星觀測(cè)AOD的大氣PM2.5局部估算模型,其結(jié)構(gòu)為公式(6),該模型建立的AOD-PM2.5關(guān)系是空間位置的函數(shù)。
PM2.5,s=β0(μs,vs)+βAOD(μs,vs)·AODs+
βX(μs,vs)·Xs
(6)
式中,(μs,vs)表示空間位置s處的坐標(biāo),即:模型系數(shù)隨空間位置而改變。
然而,此模型僅利用單個(gè)時(shí)間數(shù)據(jù)進(jìn)行建模,沒有考慮時(shí)間上的依賴性,難以處理單個(gè)時(shí)間AOD-PM2.5匹配樣本較少的情況。此外,進(jìn)一步引入時(shí)間依賴性,時(shí)空地理加權(quán)回歸模型(geographically and temporally weighted regression,GTWR)[35-36]能夠更為有效地應(yīng)對(duì)大氣PM2.5衛(wèi)星反演問題。其建模思路與GWR模型類似,主要改進(jìn)在于引入時(shí)間依賴性,即在式(6)的求解過程中加入時(shí)間維度信息,進(jìn)一步提高模型的穩(wěn)定性。盡管此類模型考慮了時(shí)空異質(zhì)性,但其是基于線性假設(shè)的,對(duì)AOD-PM2.5關(guān)系非線性特征的刻畫仍然存在局限。
(5) 機(jī)器學(xué)習(xí)模型。鑒于衛(wèi)星AOD與站點(diǎn)大氣PM2.5間具有很強(qiáng)的非線性關(guān)系,AOD-PM2.5關(guān)系的機(jī)器學(xué)習(xí)建模是近年來的研究熱點(diǎn)。不同于傳統(tǒng)統(tǒng)計(jì)模型,機(jī)器學(xué)習(xí)是數(shù)據(jù)驅(qū)動(dòng)的,其優(yōu)勢(shì)在于強(qiáng)大的非線性刻畫能力。其中,神經(jīng)網(wǎng)絡(luò)被率先應(yīng)用于大氣PM2.5遙感反演[17,37],其模型性能相比傳統(tǒng)統(tǒng)計(jì)模型取得了較大的提高。此外,隨機(jī)森林[38-39]、支持向量機(jī)[40]、梯度提升學(xué)習(xí)[41]、深度學(xué)習(xí)[42-44]等模型也逐漸得到了學(xué)者們的青睞,如文獻(xiàn)[44]利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)估算美國(guó)區(qū)域的大氣PM2.5濃度,模型結(jié)構(gòu)如圖2所示。同時(shí),多種機(jī)器學(xué)習(xí)模型集成(ensemble learning)方法[45-47]在大氣PM2.5衛(wèi)星估算研究中也得到了較為深入的應(yīng)用。然而,基于機(jī)器學(xué)習(xí)的大氣PM2.5遙感反演方法仍然存在以下局限:①機(jī)器學(xué)習(xí)模型一般僅僅擬合大氣PM2.5與影響因素之間的數(shù)值對(duì)應(yīng)關(guān)系,對(duì)大氣PM2.5本身的地理和物理特征考慮不足;②機(jī)器學(xué)習(xí)模型的可解釋性不強(qiáng),無(wú)法理清大氣PM2.5反演的內(nèi)在機(jī)制;③機(jī)器學(xué)習(xí)模型的訓(xùn)練需要大量樣本,在地面觀測(cè)樣本不足情況下的建模能力有待提升。針對(duì)第一點(diǎn),文獻(xiàn)[43]在深度置信網(wǎng)絡(luò)(deep belief network,DBN)中引入了大氣PM2.5的時(shí)空自相關(guān)性,從而發(fā)展了地理智能深度學(xué)習(xí)方法(Geoi-DBN),模型結(jié)構(gòu)如圖3所示;同時(shí),顧及PM2.5與影響因子間關(guān)系的時(shí)空異質(zhì)性,文獻(xiàn)[48]發(fā)展了地理加權(quán)extreme learning machine(ELM)模型,有效提升模型的整體穩(wěn)健性。
圖2 基于CNN模型估算大氣PM2.5濃度示意[44]Fig.2 Structure of CNN model for the estimation of atmospheric PM2.5[44]
圖3 Geoi-DBN模型結(jié)構(gòu)[43]Fig.3 Structure of Geoi-DBN model[43]
模型優(yōu)勢(shì)缺陷簡(jiǎn)單回歸模型結(jié)構(gòu)簡(jiǎn)單過于簡(jiǎn)單,無(wú)法刻畫復(fù)雜關(guān)系廣義可加模型線性模型的非線性擴(kuò)展對(duì)預(yù)測(cè)變量間的交互作用顧及不足線性混合效益模型可反映AOD-PM2.5關(guān)系時(shí)間異質(zhì)性基于線性假設(shè),無(wú)法描述AOD-PM2.5關(guān)系的非線性特征(時(shí)空)地理加權(quán)回歸考慮了AOD-PM2.5關(guān)系的時(shí)空異質(zhì)性基于線性假設(shè),無(wú)法描述AOD-PM2.5關(guān)系的非線性特征機(jī)器學(xué)習(xí)模型具備強(qiáng)大的非線性刻畫能力對(duì)物理、地理特性顧及不足
總結(jié)上述模型,其優(yōu)勢(shì)與缺陷歸納如表1所示??偠灾?,早期簡(jiǎn)單回歸模型由于結(jié)構(gòu)過于簡(jiǎn)單,目前應(yīng)用較少。較為流行的是GWR/GTWR、LME和機(jī)器學(xué)習(xí)模型,尤其是機(jī)器學(xué)習(xí)模型,近年來取得了快速的發(fā)展。其中,對(duì)于GWR和GTWR模型,在不考慮計(jì)算量和調(diào)參難度的情況下,應(yīng)優(yōu)先選擇GTWR模型。同時(shí),與LME模型相比,GTWR模型進(jìn)一步考慮了空間異質(zhì)性,往往能夠取得更好的反演效果[36,49];當(dāng)研究區(qū)域較小時(shí)(空間異質(zhì)性不強(qiáng)),LME模型或許能夠表現(xiàn)出一定優(yōu)勢(shì),并且其計(jì)算效率比GTWR高。其次,機(jī)器學(xué)習(xí)模型具備強(qiáng)大的非線性擬合能力,但對(duì)地理相關(guān)性與時(shí)空異質(zhì)性的考慮尚顯不足,能夠兩者兼顧的機(jī)器學(xué)習(xí)模型[43,48]是新的發(fā)展趨勢(shì)。
此外,目前大氣PM2.5遙感反演方法通常都采用AOD產(chǎn)品,而AOD產(chǎn)品一般是利用大氣輻射傳輸模型由衛(wèi)星反射率反演得到的[50-51]。那么,能否直接由衛(wèi)星反射率反演地面大氣PM2.5濃度是一個(gè)非常值得探討的問題。文獻(xiàn)[52]基于深度置信網(wǎng)絡(luò)模型,利用MODIS紅、藍(lán)、2.1 μm通道表觀反射率與觀測(cè)角度反演地面大氣PM2.5濃度;同樣地,文獻(xiàn)[53]基于隨機(jī)森林模型,利用AHI傳感器紅、藍(lán)、2.3 μm通道表觀反射率及相應(yīng)觀測(cè)角度進(jìn)行大氣PM2.5估算建模。此類研究利用機(jī)器學(xué)習(xí)模型挖掘衛(wèi)星反射率與大氣PM2.5之間蘊(yùn)含的潛在關(guān)系,避免了AOD反演過程,為大氣PM2.5遙感制圖提供了新的視角。
基于站點(diǎn)觀測(cè)對(duì)遙感估算結(jié)果進(jìn)行精度驗(yàn)證是通用的方法,因此,交叉驗(yàn)證[54]常被用于基于統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)的大氣PM2.5遙感反演模型的精度驗(yàn)證。當(dāng)前最為流行的兩種方式是留一交叉驗(yàn)證和十折交叉驗(yàn)證,前者將樣本(站點(diǎn)、區(qū)域或時(shí)間)逐一用于模型驗(yàn)證,而后者將樣本(站點(diǎn)、區(qū)域或時(shí)間)隨機(jī)平均分成十份,其中一份用于模型驗(yàn)證,重復(fù)以上過程,直至所有樣本(站點(diǎn)、區(qū)域或時(shí)間)都已用于驗(yàn)證。大氣PM2.5遙感反演的驗(yàn)證方法主要可歸為5類,其方法特點(diǎn)、適用條件和局限性見表2。
表2 大氣PM2.5遙感反演驗(yàn)證方法匯總
總的說來,基于樣本驗(yàn)證方法適用于反映模型的整體預(yù)測(cè)能力,基于站點(diǎn)驗(yàn)證和基于區(qū)域驗(yàn)證方法適用于空間預(yù)測(cè)能力的評(píng)估,基于時(shí)間驗(yàn)證和歷史驗(yàn)證方法則適用于評(píng)價(jià)模型的時(shí)間預(yù)測(cè)能力。對(duì)于大氣PM2.5遙感制圖而言,最適合的為基于站點(diǎn)的驗(yàn)證方法,因?yàn)槠渑c遙感估算的空間擴(kuò)展目的契合得較好。
以全國(guó)為研究案例,選擇常用的大氣PM2.5遙感反演方法并重點(diǎn)關(guān)注其空間預(yù)測(cè)能力,驗(yàn)證結(jié)果見表3(表中評(píng)價(jià)指標(biāo)R2為決定系數(shù),無(wú)單位;RMSE是均方根誤差,單位為μg/m3)。對(duì)于反距離插值、LME和GWR模型而言,基于樣本驗(yàn)證的結(jié)果與基于站點(diǎn)驗(yàn)證結(jié)果相差不大,表明這些模型的總體預(yù)測(cè)能力與空間預(yù)測(cè)能力相似。而對(duì)于GTWR和Geoi-DBN模型來說,基于站點(diǎn)驗(yàn)證的性能比基于樣本驗(yàn)證的性能有較大下降,原因是這兩個(gè)模型均利用了站點(diǎn)歷史數(shù)據(jù)進(jìn)行建模。值得注意的是,對(duì)于基于樣本、基于站點(diǎn)的驗(yàn)證,反距離空間插值比LME、GWR、GTWR等常用的遙感反演方法取得了更好的結(jié)果。究其原因,地面監(jiān)測(cè)站點(diǎn)的空間分布常常是不均勻的,一般集中在城市中心區(qū)域,導(dǎo)致站點(diǎn)之間的距離非常近;在驗(yàn)證過程中,驗(yàn)證站點(diǎn)離建模站點(diǎn)很近。此外,相比于基于樣本、基于站點(diǎn)的驗(yàn)證結(jié)果,各模型基于區(qū)域(省份)驗(yàn)證的結(jié)果均有顯著的下降,一定程度上表明,由于站點(diǎn)分布不均勻,基于樣本驗(yàn)證、基于站點(diǎn)驗(yàn)證方法容易高估大氣PM2.5遙感估算的精度。因此,如何在大氣PM2.5遙感反演模型驗(yàn)證過程中考慮站點(diǎn)的不均勻分布,仍需進(jìn)一步深入研究。
表3 基于不同驗(yàn)證方法的常用反演模型性能對(duì)比
衛(wèi)星反演大氣PM2.5數(shù)據(jù)的時(shí)相合成(如月均、季均或年均)對(duì)污染宏觀監(jiān)控具有重要意義,然而,由于衛(wèi)星數(shù)據(jù)的缺失,時(shí)相合成一般僅利用能夠獲取的數(shù)據(jù)進(jìn)行平均,這給PM2.5合成數(shù)據(jù)產(chǎn)品帶來了系統(tǒng)偏差,其校正方法主要包括以下兩種:
(1) 比例因子校正法[49,60]。以站點(diǎn)觀測(cè)大氣PM2.5均值為真值(無(wú)采樣偏差),計(jì)算其與用于建模的站點(diǎn)大氣PM2.5觀測(cè)均值(與衛(wèi)星觀測(cè)對(duì)應(yīng),含有采樣偏差)之間的比例因子,并進(jìn)行空間插值,從而對(duì)衛(wèi)星反演大氣PM2.5合成產(chǎn)品偏差進(jìn)行校正,可表示為
(7)
式中,AvgGPM2.5,all為站點(diǎn)觀測(cè)大氣PM2.5均值;AvgGPM2.5,model為用于建模的站點(diǎn)大氣PM2.5均值;AvgSPM2.5,model表示衛(wèi)星反演大氣PM2.5均值;CSPM2.5表示校正后的衛(wèi)星反演大氣PM2.5均值。此方法應(yīng)用較為廣泛,但其局限性在于空間插值的不確定性較大。借鑒比例因子校正法的思想,有學(xué)者利用大氣模型模擬PM2.5對(duì)衛(wèi)星反演大氣PM2.5合成產(chǎn)品偏差進(jìn)行校正。文獻(xiàn)[10]計(jì)算時(shí)間連續(xù)大氣PM2.5模型模擬均值與衛(wèi)星有效觀測(cè)時(shí)間的大氣PM2.5模型模擬均值之間的比例關(guān)系,并對(duì)相對(duì)誤差進(jìn)行分析,表明中國(guó)北方易出現(xiàn)低估現(xiàn)象而南方相反。
(2) 時(shí)空信息融合方法[37]。將站點(diǎn)觀測(cè)進(jìn)行空間插值,得到大氣PM2.5時(shí)空無(wú)縫濃度初始場(chǎng);假設(shè)不同時(shí)相間站點(diǎn)插值結(jié)果的差異與衛(wèi)星反演大氣PM2.5結(jié)果的差異相等,從而對(duì)缺失信息進(jìn)行預(yù)測(cè)。模型可表示為
Li,p-Li,m=Fi,p-Fi,m+εi,m,p
(8)
式中,Li,p表示時(shí)間p空間位置i的站點(diǎn)插值,而Fi,p表示時(shí)間p空間位置i的衛(wèi)星反演值,εi,m,p為隨機(jī)誤差。該方法的優(yōu)勢(shì)在于能夠有效利用時(shí)空互補(bǔ)信息,其缺陷為地面站點(diǎn)插值的精度有限。圖4所示為衛(wèi)星反演年均大氣PM2.5數(shù)據(jù)示例圖,由于數(shù)據(jù)的缺失,衛(wèi)星反演大氣PM2.5直接合成結(jié)果與站點(diǎn)插值數(shù)據(jù)的空間分布趨勢(shì)存在較大差異,最明顯的表現(xiàn)為華南區(qū)域濃度值偏高(與文獻(xiàn)[10]結(jié)論相符)。經(jīng)過時(shí)空信息融合方法校正后,與站點(diǎn)插值結(jié)果在空間分布上基本保持一致。
然而,已有研究多針對(duì)星-地聯(lián)合建模時(shí)段內(nèi)的大氣PM2.5制圖,基于衛(wèi)星遙感的大氣PM2.5歷史預(yù)測(cè)結(jié)果合成產(chǎn)品的偏差校正仍然是一個(gè)挑戰(zhàn)。分析上述兩種方法,前者可利用建模時(shí)段內(nèi)計(jì)算得到的校正因子,擴(kuò)展至歷史預(yù)測(cè)數(shù)據(jù)的校正,其基本假設(shè)為各站點(diǎn)偏差校正因子隨時(shí)間變化不大,這個(gè)假設(shè)本身具有較大的不確定性;而后者無(wú)法應(yīng)用于歷史數(shù)據(jù)的偏差校正。綜上,對(duì)于大氣PM2.5歷史預(yù)測(cè)結(jié)果的偏差校正亟待突破,其可能的解決思路是聯(lián)合多源衛(wèi)星觀測(cè)AOD或大氣模型模擬AOD,盡量減少AOD數(shù)據(jù)的缺失,從而減少或消除歷史預(yù)測(cè)結(jié)果合成產(chǎn)品的偏差。
圖4 2014年年均大氣PM2.5濃度示意[37]Fig.4 Distribution of annual mean atmospheric PM2.5 concentration in 2014[37]
受云覆蓋、高亮地表等因素的影響,衛(wèi)星AOD數(shù)據(jù)往往存在空間縫隙,從而導(dǎo)致基于AOD反演的大氣PM2.5空間信息缺失問題。因此,對(duì)于衛(wèi)星反演大氣PM2.5缺失信息重建的研究主要可歸納為兩個(gè)方面:一是AOD缺失信息重建,從而減少或消除大氣PM2.5數(shù)據(jù)的空間縫隙(圖5紅色線);二是直接對(duì)衛(wèi)星反演大氣PM2.5進(jìn)行無(wú)縫重建(圖5綠色線)。
圖5 衛(wèi)星反演大氣PM2.5重建示意Fig.5 Schematic of satellite retrieved atmospheric PM2.5 reconstruction
(1) 衛(wèi)星AOD數(shù)據(jù)重建。對(duì)大氣PM2.5遙感反演文獻(xiàn)中AOD重建方法進(jìn)行歸納,主要包括空間插值、多源AOD數(shù)據(jù)融合、大氣PM2.5站點(diǎn)輔助建模、統(tǒng)計(jì)回歸與機(jī)器學(xué)習(xí)方法等。其中空間插值方法[34]較早地應(yīng)用于AOD數(shù)據(jù)的重建,適用于缺失區(qū)域較小的情況??紤]到多源數(shù)據(jù)的互補(bǔ)性,文獻(xiàn)[10]融合多傳感器AOD數(shù)據(jù),文獻(xiàn)[36]對(duì)相同傳感器的不同算法AOD數(shù)據(jù)進(jìn)行融合。對(duì)于大氣PM2.5站點(diǎn)輔助建模法,文獻(xiàn)[61]首先基于線性假設(shè)求解大氣PM2.5站點(diǎn)處的AOD值,其次利用空間插值對(duì)AOD進(jìn)行缺失信息重建。統(tǒng)計(jì)回歸與機(jī)器學(xué)習(xí)方法近年來逐漸流行,通過構(gòu)建AOD與其他輔助變量的映射關(guān)系,對(duì)缺失區(qū)域進(jìn)行預(yù)測(cè)。文獻(xiàn)[55]利用多重填補(bǔ)法,建立AOD與模型模擬AOD、氣象參量等的關(guān)系,實(shí)現(xiàn)AOD數(shù)據(jù)空間全覆蓋;文獻(xiàn)[62]構(gòu)建AOD與云雪信息、氣象參量等的隨機(jī)森林模型,對(duì)AOD缺失區(qū)域進(jìn)行重建。
(2) 衛(wèi)星反演大氣PM2.5數(shù)據(jù)重建。主要包括兩類方法,即:空間平滑方法、星-地時(shí)空信息融合方法。其中,空間平滑方法構(gòu)建衛(wèi)星有效反演值與區(qū)域(或緩沖區(qū))均值、空間位置的半?yún)?shù)回歸方程,隨后對(duì)缺失信息進(jìn)行預(yù)測(cè)。該方法由KLOOG團(tuán)隊(duì)[63-66]提出,然而并未得到廣泛應(yīng)用,其缺陷在于僅僅利用了空間信息,適用于小面積缺失區(qū)域重建。對(duì)于星-地時(shí)空信息融合方法[67],以衛(wèi)星反演結(jié)果為高分辨率數(shù)據(jù),以站點(diǎn)插值結(jié)果為低分辨率數(shù)據(jù),借鑒時(shí)空信息融合模型[68-70],對(duì)缺失信息進(jìn)行重建。該類方法引入了其他時(shí)相的輔助數(shù)據(jù),對(duì)大面積缺失區(qū)域的重建理論上更具優(yōu)勢(shì)。如圖6所示,星-地時(shí)空信息融合模型能夠?qū)Υ髿釶M2.5缺失區(qū)域進(jìn)行重建,生成小時(shí)級(jí)無(wú)縫大氣PM2.5數(shù)據(jù),對(duì)提升大氣PM2.5衛(wèi)星監(jiān)測(cè)能力具有重要意義。
圖6 2016年2月28日小時(shí)級(jí)大氣PM2.5無(wú)縫重建示例,左邊為反演數(shù)據(jù),右邊為重建數(shù)據(jù)[67]Fig.6 Example of hourly and gapless atmospheric PM2.5 concentration on Feb. 28, 2016. Left: satellite retrieved PM2.5; right: gapless PM2.5 data[67]
大氣PM2.5遙感制圖經(jīng)過近十幾年的蓬勃發(fā)展,取得了可喜的成績(jī),已經(jīng)得到了較為廣泛、深入的應(yīng)用。本文主要從大氣PM2.5遙感反演與驗(yàn)證、大氣PM2.5無(wú)縫制圖兩方面進(jìn)行了綜述,需要說明的是,影響大氣PM2.5遙感制圖精度的因素很多,如衛(wèi)星數(shù)據(jù)的時(shí)空分辨率、AOD產(chǎn)品自身的質(zhì)量、輸入變量的篩選等[71],然而,本文旨在梳理大氣PM2.5遙感反演與制圖的模型與方法,上述影響因素并非是本文的重點(diǎn),有待于將來進(jìn)一步梳理與總結(jié)。當(dāng)前,大氣PM2.5遙感制圖仍是國(guó)內(nèi)外的研究熱點(diǎn),其前沿方向主要包括:
(1) 時(shí)空大數(shù)據(jù)支持的大氣PM2.5遙感制圖。大氣PM2.5的時(shí)空分布受到氣象、地形、土地利用、人為活動(dòng)等諸多因素的影響,這給大氣PM2.5精確制圖帶來了挑戰(zhàn)。時(shí)空大數(shù)據(jù)技術(shù)的發(fā)展為大氣PM2.5遙感制圖帶來了新的機(jī)遇,基于時(shí)空大數(shù)據(jù)篩選對(duì)大氣PM2.5精確制圖具有重要貢獻(xiàn)的變量,構(gòu)成能夠深入解釋與表征大氣PM2.5時(shí)空變化的樣本集;引入深度學(xué)習(xí)技術(shù),自動(dòng)學(xué)習(xí)與大氣PM2.5相關(guān)的本因特征,深度挖掘時(shí)空大數(shù)據(jù)中蘊(yùn)含的復(fù)雜關(guān)系,提高大氣PM2.5遙感制圖的精度。
(2) 物理/地理約束的機(jī)器學(xué)習(xí)反演模型?;跈C(jī)器學(xué)習(xí)的大氣PM2.5遙感反演是近些年來國(guó)內(nèi)外的研究熱點(diǎn),已經(jīng)取得了長(zhǎng)足的進(jìn)展,然而,對(duì)大氣PM2.5自身物理、地理特性的考慮尚顯不足。當(dāng)前機(jī)器學(xué)習(xí)模型在模擬大氣PM2.5反演物理模型方面有少許嘗試,但如何構(gòu)建物理關(guān)系的正則化約束準(zhǔn)則需要進(jìn)一步研究。與此同時(shí),地理相關(guān)性、時(shí)空異質(zhì)性與機(jī)器學(xué)習(xí)結(jié)合的框架取得了一定的突破,然而,在時(shí)空自適應(yīng)參數(shù)選擇、優(yōu)化求解等方面仍有待提升。
(3) 新型衛(wèi)星與低成本地面監(jiān)測(cè)網(wǎng)的融合。大氣PM2.5遙感制圖已取得了快速的發(fā)展,但在區(qū)域尺度精細(xì)監(jiān)測(cè)應(yīng)用中仍存在諸多限制。隨著衛(wèi)星遙感技術(shù)的發(fā)展,新型衛(wèi)星(如中國(guó)的風(fēng)云四號(hào)、高分五號(hào),日本的Himawari-8/-9等)傳感器設(shè)計(jì)更為先進(jìn),能夠提供更高時(shí)間、空間、光譜分辨率的觀測(cè)數(shù)據(jù),對(duì)大氣PM2.5高時(shí)空分辨率動(dòng)態(tài)制圖具有天然的優(yōu)勢(shì)。此外,地面低成本小傳感器監(jiān)測(cè)已成為大氣PM2.5制圖的研究熱點(diǎn)之一[72-74],為精細(xì)尺度的星-地聯(lián)合建模提供了加密觀測(cè)數(shù)據(jù)。新型衛(wèi)星、低成本小傳感器監(jiān)測(cè)網(wǎng)的引入,以及兩者的融合,將是重要的發(fā)展趨勢(shì)。
(4) 多傳感器大氣PM2.5三維立體監(jiān)測(cè)。光學(xué)衛(wèi)星一般僅能提供二維觀測(cè)數(shù)據(jù),無(wú)法在垂直方向上對(duì)大氣PM2.5進(jìn)行立體監(jiān)測(cè),從而限制了大氣PM2.5三維分布與傳輸特性的研究。隨著大氣探測(cè)技術(shù)的發(fā)展,星載、機(jī)載、地基激光雷達(dá)能夠獲取垂直廓線信息,無(wú)人機(jī)搭載顆粒物傳感器可實(shí)現(xiàn)垂直方向的監(jiān)測(cè)[75-76],并與區(qū)域大氣質(zhì)量模型等手段相結(jié)合,探索點(diǎn)-線-面觀測(cè)數(shù)據(jù)的跨尺度融合方法,從而構(gòu)建大氣PM2.5濃度三維時(shí)空連續(xù)場(chǎng),是一個(gè)十分重要的新挑戰(zhàn)。
(5) 多源數(shù)據(jù)融合的大氣PM2.5組分制圖。大氣PM2.5組分信息對(duì)污染成因解析、人體健康分析等至關(guān)重要,其時(shí)空動(dòng)態(tài)制圖是一個(gè)重要的發(fā)展方向?;瘜W(xué)傳輸模型可以模擬大氣PM2.5組分信息,融合衛(wèi)星觀測(cè)、地理要素、模型模擬大氣PM2.5組分信息、地面觀測(cè)等多源數(shù)據(jù),是當(dāng)前大氣PM2.5組分時(shí)空分布制圖的常用方法[22,77],然而,地面成分觀測(cè)網(wǎng)的建設(shè)仍不完善,如何克服對(duì)地面觀測(cè)的依賴,實(shí)現(xiàn)大氣PM2.5組分高精度制圖亟待進(jìn)一步的研究。