詹淇雯, 胡為安, 劉傳立
(1.江西理工大學 土木與測繪工程學院, 江西 贛州 341000; 2.廣東工貿(mào)職業(yè)技術(shù)學院, 廣州 510510)
夜間燈光數(shù)據(jù)作為一種新型數(shù)據(jù)源, 用于記錄全球范圍內(nèi)的夜間燈光亮度, 在估算社會經(jīng)濟參量指標方面表現(xiàn)出巨大的潛力和應用前景[1-2]。20世紀70年代, 美國軍事氣象衛(wèi)星(defense meteorological satellite program, DMSP)搭載的線性掃描系統(tǒng)(operational linescan system, OLS)設計初衷是為了探測月光照射下的云層分布信息, 而專家學者意外發(fā)現(xiàn)DMSP-OLS可記錄夜間無云條件下來自地表城鎮(zhèn)等發(fā)射的可見光輻射, 從此拉開了夜間燈光遙感研究的序幕。夜間燈光影像數(shù)據(jù)不僅記錄了來自城鎮(zhèn)的穩(wěn)定光源, 同時可以捕獲森林火災、 火山噴發(fā)和油氣燃燒導致的短暫性發(fā)光, 因其作為一種長時間序列的數(shù)據(jù)類型, 具有數(shù)據(jù)量小、 數(shù)據(jù)存檔豐富和易獲取等優(yōu)點, 被廣泛應用于社會經(jīng)濟參量指標估算[3-6]、 城市化[7-9]和城市空間結(jié)構(gòu)演變分析[10-12]、 生態(tài)環(huán)境和健康效應[13-14]、 重大事件評估[15-17]和漁業(yè)[18]等研究領域。隨著美國新一代國家極軌衛(wèi)星(suomi national polar-orbiting partnership, SNPP)搭載的可見光近紅外成像輻射(visible infrared imaging radiometer suite, VIIRS)傳感器獲取的夜間燈光數(shù)據(jù)存檔量不斷豐富, 影像數(shù)據(jù)分辨率更高, 解決了DMSP-OLS數(shù)據(jù)中發(fā)展較快城市中心像元“飽和效應”問題, 長時間序列數(shù)據(jù)之間可比性和連續(xù)性更好, 可為更精細化的社會經(jīng)濟指標預測提供有利的新型數(shù)據(jù)源。
將夜間燈光影像數(shù)據(jù)用于GDP的研究較早。Elvidge等[19]基于DMSP-OLS影像數(shù)據(jù)對美洲數(shù)十個國家的GDP與燈光面積進行回歸分析, 擬合優(yōu)度R2達到0.97, 證明可以利用夜間燈光數(shù)據(jù)估算GDP等社會經(jīng)濟指標。隨后, Ebener等[20]利用DMSP-OLS夜間燈光數(shù)據(jù)對GDP進行估算, 并取得較好的效果; Ghosh等[21]通過夜間燈光數(shù)據(jù)與美國校正后的經(jīng)濟數(shù)據(jù)建立回歸模型, 成功預測出各州的實際經(jīng)濟狀況, 發(fā)現(xiàn)該方法可用于核實官方發(fā)布的經(jīng)濟數(shù)據(jù); 顏定勇[22]利用Copula函數(shù)和條件分布函數(shù)構(gòu)建EEMD-SVR-Copula模型用于GDP預測, 預測精度較高; 范強等[23]同樣基于DMSP-OLS數(shù)據(jù)與GDP之間建立多項式預測模型, 證明了該方法可以準確反映研究區(qū)的GDP實際增長情況。而目前基于SNPP-VIIRS數(shù)據(jù)對GDP進行預測的研究較少, 且預測模型僅限單一的函數(shù), 缺乏對比和可行性驗證。
鑒于此, 本文利用2012—2019年SNPP-VIIRS月度復合數(shù)據(jù), 經(jīng)過消除負值和不穩(wěn)定光源等校正處理, 運用線性函數(shù)等6種預測模型對江西省GDP進行預測, 以擬合優(yōu)度和相對誤差等指標對各模型預測效果進行對比。為校正SNPP-VIIRS影像數(shù)據(jù)提供了新思路, 彌補了傳統(tǒng)調(diào)查方法的缺陷, 同時為相關研究提供學術(shù)參考。
江西省位于我國長江中下游南部, 界于113°34′36″E—118°28′58″E、 24°29′14″N—30°04′41″N(圖1), 東接福建、 廣東, 西鄰湖北, 南望廣東, 北枕湖北、 安徽, 同時被譽為新中國紅色搖籃。北面為鄱陽湖, 其他三面環(huán)山, 地形以丘陵和山地為主, 平原為輔, 常年溫和多雨, 四季分明。轄11個地級市, 27個市轄區(qū), 12個縣級市, 61個縣, 共100個縣級行政區(qū)劃。截至2019年, 地區(qū)生產(chǎn)總值GDP為24 757.54億元, 年末常住人口4 666.10萬。優(yōu)越的地理位置、 豐富的雨水資源和礦物資源、 醇厚的優(yōu)秀紅色文化為江西的快速發(fā)展奠定了良好的基礎。 GDP是評估地區(qū)發(fā)展狀況的重要經(jīng)濟指標, 利用夜間燈光遙感數(shù)據(jù)預測江西省的GDP, 對比不同預測模型的預測效果顯得極具研究意義。
圖1 江西省地理位置
(1)江西省和各市行政區(qū)劃矢量數(shù)據(jù)。行政區(qū)劃數(shù)據(jù)來源于國家基礎地理信息中心1∶ 400萬數(shù)據(jù)庫。
(2)GDP經(jīng)濟指標數(shù)據(jù)。該數(shù)據(jù)來源于中國國家統(tǒng)計局(http://www.stats.gov.cn/)和江西省統(tǒng)計局(http://tjj.jiangxi.gov.cn/), 其中省級數(shù)據(jù)包括江西省8年的GDP統(tǒng)計數(shù)據(jù), 市級數(shù)據(jù)包含江西省11個地級市8年的GDP統(tǒng)計數(shù)據(jù)。
(3)SNPP-VIIRS夜光影像數(shù)據(jù)。SNPP-VIIRS影像數(shù)據(jù)來源于美國科羅拉多礦業(yè)大學, 可通過網(wǎng)址https://eogdata.mines.edu/download_dnb_composites.html進行獲取。與前一代DMSP-OLS數(shù)據(jù)相比, SNPP-VIIRS在空間分辨率、 時間分辨率和光譜分辨率方面均有較大提升, 各衛(wèi)星間進行星上定標操作, 且具有更廣的輻射范圍, 解決了在城市中心存在像元“飽和效應”問題。用于探測夜間燈光輻射的DNB(day night band)波段, 光譜分辨率14 bit, 波長范圍0.5~0.9 μm, 所能檢測到的燈光輻射亮度下限由5×10-10W/(sr·cm2)提升至2×10-11W/(sr·cm2), 這就意味著在影像數(shù)據(jù)中可記錄夜晚更微弱的燈光信息, 可為研究精細化的人類社會活動提供可靠的新數(shù)據(jù)源。該數(shù)據(jù)分為年度復合和月度復合數(shù)據(jù), 年度數(shù)據(jù)存檔較少, 用于時間序列的年際變化研究略顯不足, 而月度數(shù)據(jù)較為豐富, 共發(fā)布95期。由于夏季影像易受植被影響, 冬季影像受冰雪影響, 因此本文選擇2012—2019年10月份復合數(shù)據(jù)進行研究, “*.vcm”格式的影像數(shù)據(jù)與“*.vcmsl”相比, 完全排除雜散光的影響, 數(shù)據(jù)質(zhì)量更佳。
SNPP-VIIRS不但繼承了OLS傳感器的微光探測能力, 增強了探測敏感度, 提高了時空分辨率和光譜分辨率, 而且不存在像元DN值“飽和”問題, 影像數(shù)據(jù)在時間尺度可對比性和連續(xù)性更強, 在監(jiān)測人類社會活動和自然現(xiàn)象等方面更具應用潛力, 但也正因為VIIRS傳感器對輻射光源的高度靈敏性, 導致數(shù)據(jù)中也存在背景噪聲等問題, 需進行校正處理。以江西省為研究區(qū), SNPP-VIIRS月度復合影像為研究數(shù)據(jù), 利用2012—2018年的GDP統(tǒng)計數(shù)據(jù)與燈光強度數(shù)據(jù), 基于線性函數(shù)等常用的預測模型外, 引入Gaussian函數(shù)預測2019年江西省的GDP值。具體思路為: ① 數(shù)據(jù)預處理: 首先將我國區(qū)域的SNPP-VIIRS夜間燈光影像數(shù)據(jù)投影至符合我國地形的Albers投影坐標系, 設置其參數(shù)Central_Meridian為105°, Standard_Parallel_1為25°, Standard_Parallel_2為47°, 采用最鄰近法將影像柵格大小調(diào)整為500 m×500 m, 同時利用研究區(qū)域的行政邊界數(shù)據(jù)對影像數(shù)據(jù)進行掩膜裁剪, 得到各年份研究區(qū)域的NPP-VIIRS夜間燈光影像; ② 影像校正: 針對月度復合影像數(shù)據(jù)中存在負值和背景噪聲等問題, 利用標準年度數(shù)據(jù)對其進行校正操作; ③ 數(shù)據(jù)質(zhì)量驗證: 選取南昌市為樣本區(qū)域, 以GDP和年末常住人口為經(jīng)濟指標, 擬合優(yōu)度R2和顯著性P值作為評價標準, 驗證數(shù)據(jù)質(zhì)量; ④ GDP預測: 利用多種函數(shù)預測模型對2019年江西省GDP進行預測, 對比擬合優(yōu)度和相對誤差等指標分析各模型的預測效果。
通過對像元DN值進行提取, 發(fā)現(xiàn)影像數(shù)據(jù)中存在負值現(xiàn)象, 該現(xiàn)象主要發(fā)生在夏季高緯度地區(qū)以及西南地區(qū), 負值數(shù)值較小, 但數(shù)量較多, 該問題的存在必定會影響數(shù)據(jù)質(zhì)量和研究結(jié)果的準確性, 因此需要對負值進行消除。目前, 解決負值問題的常用方法有兩種: 一是利用DMSP-OLS夜間燈光數(shù)據(jù)中不存在負值問題的特性消除負值, 該方法科學有效, 但因兩種影像數(shù)據(jù)分辨率不同, 導致校正過程復雜, 且不適合長時間序列的數(shù)據(jù)校正; 二是將負值像元賦予0值, 該方法簡單易操作, 針對時間序列數(shù)據(jù)校正效果好。鑒于此, 本文采用第二種方法消除負值:
(1)
其中,DNx表示校正前的像元DN值;DNy表示校正后的像元DN值。
VIIRS傳感器接收到的能量信息中不僅包含穩(wěn)定的城鎮(zhèn)夜間燈光, 同時也將探測到地表發(fā)射的月光、 閃電和諸多噪聲因子(高能粒子與大氣層碰撞火光)等短暫性光源。數(shù)據(jù)說明文件顯示, 月度復合數(shù)據(jù)未進行去光處理, 短暫光源與背景噪聲仍被保留, 因此需要對影像進一步校正。科羅拉多礦業(yè)大學發(fā)布了2015—2016年已經(jīng)去除短暫光源和背景噪聲的兩期年度標準數(shù)據(jù), 考慮到兩期數(shù)據(jù)年份相近, 僅選擇2015年的標準年度數(shù)據(jù)校正2015年月度復合數(shù)據(jù)。將標準年度數(shù)據(jù)按照DN≤0賦值為0、DN>0賦值為1(表示穩(wěn)定光源區(qū)域), 生成掩膜數(shù)據(jù); 將2015年月度數(shù)據(jù)乘以掩膜數(shù)據(jù)去除短暫性光源和背景值, 獲得2015年校正的月度數(shù)據(jù)。
由于短暫光源存在時間較短, 不可能同時存在于相鄰年份數(shù)據(jù)的同一地理位置, 可認為在上一年(下一年)的燈光未在下一年(上一年)數(shù)據(jù)中出現(xiàn), 即為短暫性光源。相鄰年份的穩(wěn)定光源及像元DN值應變化不大, 因此, 以經(jīng)過校正的2015年月度數(shù)據(jù)中穩(wěn)定區(qū)域為基準, 對其他年份數(shù)據(jù)進行校正。分別提取其他各年影像的掩膜數(shù)據(jù), 2012—2014年影像按照式(2)提取穩(wěn)定燈光區(qū)域, 2016—2019年按照式(3)提取穩(wěn)定燈光區(qū)域, 最后將穩(wěn)定燈光區(qū)域與對應年份的數(shù)據(jù)相乘, 得到去除短暫光源與背景噪聲的校正影像。
(2)
(3)
式中:DNx表示校正年份的DN值;DNx+1表示校正年份下一年的DN值;DNx-1表示校正年份上一年的DN值;DNy表示校正年份的穩(wěn)定光源DN值。
由于地表河流湖泊等高反射表面和大功率漁船照明等因素的影響, 極易對局部影像數(shù)據(jù)造成局部擾動, 表現(xiàn)為像元DN值異常, 數(shù)值較大, 遠遠超出實際情況, 需要對影像進一步校正處理。針對異常極高值問題, 本文參考胡為安等[24]提出的解決方法, 首先基于ArcGIS平臺分別對各年影像數(shù)據(jù)像元DN進行提取, 按照順序或逆序進行排列, 基于統(tǒng)計學原理獲得2012—2019年江西省最大燈光亮度值分別為61.41、 72.65、 83.86、 93.96、 104.39、 118.47、 135.86和151.34。若像元DN值大于該年最大燈光亮度值, 即可認為其為極高值, 利用最大燈光亮度值將異常極高值像元進行替換, 消除極高值對數(shù)據(jù)質(zhì)量的影響。
我國作為世界上最大的發(fā)展中國家, 2012—2019年間的城市化進程和經(jīng)濟狀況等均處于快速發(fā)展階段, 未出現(xiàn)衰退現(xiàn)象。因此, 下一年的燈光亮度值不低于上一年同一地理位置的燈光亮度值, 依據(jù)此理論, 以2012年影像數(shù)據(jù)為基準, 2013—2019年數(shù)據(jù)按照式(4)依次進行校正, 增強時間序列數(shù)據(jù)的可比性與連續(xù)性。
(4)
研究表明, 單個像元覆蓋地表大約2.5×105m2區(qū)域, 其燈光輻射亮度值易受周圍環(huán)境的影響, 無法利用其與GDP構(gòu)建預測模型, 而區(qū)域燈光總強度與人類社會活動指標間存在高度相關性早已被證實, 因此, 構(gòu)建區(qū)域燈光總強度指標(total night light index, TNLI)計算式進行GDP預測:
(5)
式中:DNm表示第m級的亮度值;nm表示像元數(shù)量。
鑒于之前相關研究多采用線性函數(shù)等單一的函數(shù)模型進行GDP預測, 僅以相關性擬合優(yōu)度作為評價標準, 未對校正數(shù)據(jù)進行質(zhì)量驗證, 缺乏從多視角、 多維度研究GDP預測問題。因此, 如表1所示, 本文選取常用的5種函數(shù)預測模型外, 引入Gaussian函數(shù), 從多方面比較各函數(shù)預測效果。
表1 6種函數(shù)預測模型
目前基于夜間燈光影像數(shù)據(jù)進行社會經(jīng)濟參量指標預測的研究, 對精度評價的方法主要有兩種:
一是通過相對誤差的方式檢驗預測值與統(tǒng)計值間的接近程度
(6)
另一種則是利用預測值與統(tǒng)計值進行回歸分析, 利用擬合優(yōu)度等指標對預測精度進行評定, 該方法適用于預測數(shù)據(jù)與統(tǒng)計數(shù)據(jù)間存在明顯的線性關系。為對比各函數(shù)模型的預測效果, 本文同時采用上述兩種方法對預測GDP精度進行驗證。
為驗證影像數(shù)據(jù)校正方法的合理性和科學性, 分別進行定性和定量分析對比。定性采用目視解譯法, 從直觀的視覺角度分析影像校正前后的變化。校正前的影像中存在負值現(xiàn)象, 幾乎所有區(qū)域均被大量的背景噪聲覆蓋, 時間序列的影像數(shù)據(jù)缺乏可比性和連續(xù)性(圖2); 校正后的影像, 去除了負值像元、 背景噪聲和短暫光源, 最小DN值為0, 最大DN值逐年遞增, 城市空間結(jié)構(gòu)清晰可見, 城市化擴張得到有利凸顯, 符合實際情況(圖3)。
圖2 2012、2015和2019年DN值校正前影像
圖3 2012、2015和2019年DN值校正后影像
定量分析則選取省會南昌作為樣本區(qū), 提取校正前后影像中的TNLI與社會經(jīng)濟參量指標進行擬合能力對比。校正前TNLI與GDP、 年末常住人口的擬合優(yōu)度R2分別為0.720 5、 0.652 9, 經(jīng)過校正后的擬合優(yōu)度R2分別提升至0.961 8和0.960 2(圖4、 圖5)。為了檢驗擬合方程的可信度, 采用皮爾遜相關性來檢驗線性關系與擬合方程系數(shù)是否具有統(tǒng)計學意義。結(jié)果表明, TNLI與GDP、 年末常住人口的皮爾遜相關性為0.98和0.97, 且通過了0.01級別(雙尾)顯著性檢驗, 進一步說明校正方法的可靠性和科學性, 校正后的數(shù)據(jù)可用于年際變化的GDP預測研究。
圖4 校正前后TNLI與社會經(jīng)濟指標擬合效果對比
圖5 校正前后TNLI與人口指標擬合效果對比
基于ArcGIS平臺對2012—2018年江西省TNLI進行提取, 采用線性函數(shù)等6種模型分別對TNLI與統(tǒng)計局整理的GDP數(shù)據(jù)進行回歸分析, 回歸結(jié)果如圖6所示。各函數(shù)模型的擬合優(yōu)R2均在0.9以上, 且通過了0.01級別(雙尾)顯著性檢驗, 說明文中所選指標與GDP間存在極高的相關性, 而且利用該指標可以對GDP進行預測分析。其中, 二項式函數(shù)的回歸效果最佳, 擬合優(yōu)度R2達0.967 0。
圖6 6類預測模型與TNLI的回歸結(jié)果
按照圖4、 5中的回歸預測模型方程, 將所提取的江西省2019年TNLI代入各函數(shù)模型方程, 預測結(jié)果如表2所示。6種函數(shù)預測模型相對誤差絕對值均小于10%, 小于2%的有3種, 分別是二項式函數(shù)、 指數(shù)函數(shù)和Gaussian函數(shù); 其中新引入的Gaussian函數(shù)模型預測效果最佳, 絕對誤差為-285.29億元, 相對誤差僅為-1.15%, 對數(shù)函數(shù)模型預測結(jié)果誤差較大, 相對誤差為8.65%。
表2 各模型預測值與誤差
在上述省級尺度下, 利用2012—2018年已有統(tǒng)計GDP數(shù)據(jù)結(jié)合TNLI預測2019年的省級GDP總值。為在更精細尺度上研究各函數(shù)模型的預測效果, 有必要在市級尺度上分析各模型的預測效果, 將2012—2018年江西省11個地級市的GDP統(tǒng)計數(shù)據(jù)與TNLI進行回歸分析, 求解預測模型方程, 并將2019年各年TNLI代入模型求解各城市的GDP預測值, 預測結(jié)果見表3。在市級尺度下, Gaussian函數(shù)預測模型由于函數(shù)特性限制, 導致無法對九江和鷹潭兩個城市進行預測外, 其他函數(shù)預測相對誤差絕對值均小于10%, 對數(shù)函數(shù)模型預測結(jié)果相對誤差較大, 二項式函數(shù)預測效果最佳, 相對誤差僅為-0.68%。
表3 2019年江西省地級市GDP預測結(jié)果
通過將各模型預測值與統(tǒng)計值進行回歸分析, 基于相關性擬合優(yōu)度R2和均方根誤差RMSE進行預測效果評定, 通過了0.01級別顯著性檢驗, 分析結(jié)果如圖7所示。各函數(shù)模型均表現(xiàn)出較好的預測效果, 擬合優(yōu)度均大于0.95, 其中二次函數(shù)預測模型預測效果最佳, 擬合優(yōu)度為0.985 8,RMSE為182.4, 均優(yōu)于其他函數(shù)模型。
圖7 2019年城市GDP預測值與統(tǒng)計值回歸結(jié)果
GDP數(shù)據(jù)對于科學研究和國家決策具有重要的參考價值, 鑒于獲取該數(shù)據(jù)多采用抽樣調(diào)查統(tǒng)計等傳統(tǒng)方式, 在此過程中需要消耗大量的財力、 物力和人力資源, 同時存在人為因素的干擾、 缺乏地理空間信息以及數(shù)據(jù)更新存在滯后性等缺點。夜間燈光影像數(shù)據(jù)與人類活動密切相關, 具有獨立客觀、 空間信息和時空連續(xù)等特性, 因此夜間燈光數(shù)據(jù)可用于社會經(jīng)濟參量估算研究。
由于目前研究多采用DMSP-OLS數(shù)據(jù)進行GDP預測, 且多采用單一的函數(shù)模型, 缺乏對比和可行性驗證。隨著第二代夜間燈光數(shù)據(jù)SNPP-VIIRS的陸續(xù)發(fā)布, 數(shù)據(jù)存檔量逐漸豐富, 使長時間序列的年際變化研究成為可能。 研究證明, 與DMSP-OLS數(shù)據(jù)相比, SNPP-VIIRS數(shù)據(jù)更具發(fā)展?jié)摿?。因? 本文選取10月份的SNPP-VIIRS月度復合數(shù)據(jù), 經(jīng)過消除負值和穩(wěn)定光源等校正操作, 對比了線性函數(shù)等6種函數(shù)模型的預測效果, 發(fā)現(xiàn)在省級尺度下, 二項式函數(shù)擬合優(yōu)度最高, Gaussian函數(shù)預測效果最好; 市級尺度下, 二項式函數(shù)均優(yōu)于其他函數(shù)模型。本文研究結(jié)果為SNPP-VIIRS校正提供了新思路, 也為相關科學研究和政府決策提供了學術(shù)參考。