楊俊芳, 萬劍華, 馬 毅, 姜宗辰, 胡亞斌
高光譜特征波段在海洋典型溢油油種識別中的精度評估
楊俊芳1, 萬劍華1, 馬 毅2, 3, 姜宗辰2, 4, 胡亞斌2
(1. 中國石油大學(華東), 山東 青島 266580; 2. 自然資源部第一海洋研究所, 山東 青島 266061; 3. 自然資源部海洋遙測技術(shù)創(chuàng)新中心, 山東 青島 266061; 4. 山東科技大學, 山東 青島 266590)
溢油種類精準識別對快速有效地治理污染具有重要的意義, 高光譜遙感在海面溢油油種識別中至關(guān)重要。為探討海洋典型溢油油種識別的高光譜特征波段范圍, 通過設(shè)計室外模擬溢油實驗, 在獲取原油、燃料油、柴油、汽油和棕櫚油等5種油種的實測高光譜數(shù)據(jù)基礎(chǔ)上, 運用因子分析和光譜標準偏差分析法遴選溢油油種的光譜特征波段, 并利用支持向量機模型開展基于光譜特征波段的油種識別精度評價。結(jié)果表明, 基于光譜標準偏差分析和因子分析獲得的特征波段的油種識別精度分別是83.33%和90.74%, 與基于全波段的識別精度相比, 整體精度分別提高了3.7%和11.11%。選取的特征波段(360~540 nm, 560~600 nm, 610~630 nm, 640~660 nm)可作為5種油種相互區(qū)分的最佳高光譜波段。
高光譜數(shù)據(jù); 光譜分析; 最佳波段; 油種識別; 精度評價
近年來, 海上溢油事件頻發(fā), 石油及其制品進入海洋, 對世界海洋環(huán)境、人類健康和經(jīng)濟發(fā)展造成嚴重危害[1-4]。海面溢油類型涉及溯源處罰和清理方案的制定, 溢油種類精準識別對快速有效地治理污染有重要的意義。油膜的光譜特性與它們的化學成分、基本分子振動及其組合有關(guān), 不同種類油品的光譜吸收特征是區(qū)分油品種類的重要依據(jù)[5],確定油種的特征波段對油種識別具有重要指導(dǎo)意義。近年來, 光譜分析技術(shù)成為溢油油種識別的新興手段。
高光譜數(shù)據(jù)光譜分辨率高, 細節(jié)信息突出, 可有效區(qū)分油膜和海水背景[6-9], 還能根據(jù)油膜的光譜特征差異來識別油品的種類[10-11]。然而, 波段數(shù)眾多使相鄰波段間存在較強的相關(guān)性, 產(chǎn)生信息冗余, 若將全部波段用于地物分類過程, 計算量大且耗時, 且易造成“Hughes”效應(yīng)。已有研究表明, 相對于寬波段, 位于光譜特定位置的窄帶可以顯著提高地物的分辨能力和分類精度[12]。Thenkabail等[13]、Hu等[14]分別基于實測的多種地物類型光譜數(shù)據(jù), 采用幾種光譜分析方法獲取了地物類型的高光譜特征波段, 有效提高了分類精度。Lu等[15]設(shè)計了實驗室實驗, 測量不同濃度的油包水和水包油乳化物的光譜特性, 發(fā)現(xiàn)表征二者的最佳波長, 建立了油乳化物類型分類的光學模型。趙冬至等[16]、劉丙新等[17]分別測量了不同油品的光譜反射率數(shù)據(jù), 并基于其光譜特性開展油種鑒別研究, 但均未給出有利于油種識別的特征波段范圍。利用高光譜手段開展海面溢油監(jiān)測是近年來的研究熱點, 但海面典型溢油油種高光譜識別方面的研究工作較少, 尤其是在溢油油種高光譜特征波段選擇的基礎(chǔ)研究方面。
本文設(shè)計了室外模擬溢油實驗, 使用ASD (analytical spectral devices)地物光譜儀采集了5種典型油品在350~2 500 nm范圍內(nèi)的反射率光譜數(shù)據(jù), 分別運用因子分析和光譜標準偏差分析方法對數(shù)百個光譜波段進行綜合評估, 以選擇提供有效信息的特征波段。在此基礎(chǔ)上, 利用支持向量機模型開展基于光譜特征波段的油種識別精度評價, 確定海面典型溢油油種相互區(qū)分的最佳高光譜波段。
根據(jù)海面溢油來源及以往發(fā)生的溢油事件, 選取了5種典型海面溢油油品(圖1)開展實驗, 油品的性質(zhì)及描述如表1所示。
圖1 實驗油品
選擇天氣晴朗、風力小于4級(風速為6~8 m/s)的環(huán)境條件下, 在聚氯乙烯水池(圖2a)中擺放亞克力管, 注入青島近岸海水。將預(yù)先盛于5個燒杯中的等體積原油、燃料油、柴油、汽油和棕櫚油, 緩緩傾倒于已編號的直徑為15 cm的亞克力管中(圖2c), 使其鋪滿水面。應(yīng)用ASD FieldSpec4地物光譜儀(圖2b)依次測量朗伯體標準板、5種油品、海水和天空光(圖2d)的光譜輻亮度, 每隔0.5或1 h測量一組光譜。測量期間應(yīng)盡量保證光線照射穩(wěn)定, 無陰影和強反射體的影響, 并利用水溫計測量海水溫度, 利用風速儀測量風速, 做好記錄。
對采集到的光譜開展質(zhì)量控制, 剔除無效和異常光譜, 并根據(jù)公式1—4將測量的各油種的輻亮度轉(zhuǎn)化為遙感反射率。在忽略太陽耀斑和白帽等外界影響情況下, 光譜儀測量的海面輻亮度Surface可以表示為:
表1 油品的性質(zhì)及描述
圖2 外場光譜測量過程
Surface=Water+·Sky. (1)
由此可得離水輻亮度為:
Water=Surface–·Sky, (2)
式中,表示氣-油界面反射率, 宜采用1.0%[1]。Sky表示天空光輻亮度。
遙感反射率可用離水輻亮度Water和海面入射輻照度()的比值表示, 即
其中,()可由測量標準板得出:
式中,表示波長,()表示標準板的反射率, 要求在10%~35%,()表示測得的標準板輻亮度。
在這種情況下, 就可以認為兩種油品與油品在波長處具有可分性, 波長就是能區(qū)分這兩種油品的高光譜特征波段。
因子分析方法是在挖掘原始光譜特征基礎(chǔ)上的排序方法, 根據(jù)優(yōu)先準則量化每個波段的重要性, 并在排序序列中選擇排名靠前的波段。本文采用的因子分析方法核心思想為: 首先根據(jù)累積方差貢獻率(大于95%)確定參與特征波段選擇的因子數(shù)量。通常第1個因子包含的樣本信息量最多, 第2個因子包含的信息量次之, 但每個因子間彼此獨立。由因子載荷矩陣可知, 不同光譜波長對每個因子的相關(guān)性是不一樣的, 根據(jù)因子載荷來判斷這些波長的重要性, 光譜波長的因子載荷越大, 說明該光譜波長與該因子的相關(guān)性也越大, 即可認為是該因子的光譜波長。通過構(gòu)建一定的規(guī)則, 可獲取因子的光譜波長集合={1,2,…,B}。其中,1={1,2,…,x},2={2,3,…,x}是第一個因子和第二個因子的光譜波長集合。由于光譜波長是唯一的({1,2,…,x,…,x,…,x};,∈), 即1和2中的光譜波長2是同一光譜波長。因此統(tǒng)計光譜波長集合中各光譜波長出現(xiàn)的頻次, 再根據(jù)篩選準則(公式6)即可獲取最終的特征波長范圍。
其中,為實驗數(shù)據(jù)集類別,f為第個數(shù)據(jù)集對應(yīng)的頻次比集合{},為選取的波譜范圍對應(yīng)的頻次集合{},M為第個實驗數(shù)據(jù)集獲取的波譜范圍最大頻次,集合f元素滿足公式(6)時,該元素對應(yīng)的波譜范圍即為特征波長范圍。
本文開展油種識別采用的算法是支持向量機中的C-SVC模型[19], 其思想是建立一個分類超平面作為決策曲面, 使得正例和反例之間的隔離邊緣最大化。核函數(shù)選擇的是RBF(radial basis function), 故決策函數(shù)為
實驗采集了標準板、原油、燃料油、柴油、棕櫚油、汽油、海水和天空光等的反射率光譜, 共18組, 獲得5種典型油品和海水的均值遙感反射率(圖3a)。此外, 考慮到光譜儀感知光譜的末端存在系統(tǒng)的測量誤差, 本文剔除了受大氣吸收嚴重影響的波段(1 341~ 1 459 nm和1 801~1 979 nm)和水氣強吸收影響的波段(1.4 μm, 1.9 μm)區(qū)間, 保留360~1 340 nm、1 460~ 1 800 nm和1 980~2 400 nm的光譜范圍(圖3b)來研究海面典型溢油油種相互區(qū)分的最佳高光譜波段。
如圖3b所示, 柴油、汽油和棕櫚油等輕質(zhì)油的反射率光譜曲線與海水大體一致, 而原油和燃料油等重質(zhì)油的反射率光譜曲線與海水存在明顯差異, 表現(xiàn)為在390~730 nm的可見光范圍內(nèi), 低于海水反射率; 在730~2 500 nm的近紅外和短波紅外范圍內(nèi), 高于海水反射率。在光譜的近紅外和短波紅外范圍, 5種油品的反射率均高于海水反射率, 其中原油的反射率明顯高于其他油種的反射率, 這是因為純凈的自然水體在近紅外波段近似于一個黑體, 幾乎吸收了全部的能量; 原油的近紅外和短波紅外波段吸收大量太陽輻射能量, 并以熱能的形式向外輻射。因此在780~2 500 nm范圍內(nèi), 較純凈的自然水體的反射率很低, 趨近于0, 而原油的反射率卻很高。
圖3 典型油品和海水的均值光譜反射率
由圖4a可知, 3種輕質(zhì)油的反射率光譜曲線極其相似, 僅在可見光藍光波段480 nm處的反射峰和550~620 nm的綠光波段存在微小的差異, 因此, 開展輕質(zhì)油間的可分性分析是非常必要的; 而對于圖4b所示的包絡(luò)線去除處理后的輕質(zhì)油光譜, 可以發(fā)現(xiàn)在紫光波段、綠光波段和紅光波段出現(xiàn)了明顯的光譜區(qū)別, 且在同一光譜波段處最大值和最小值之間的差異超過了原始數(shù)據(jù)。分析圖4c—h, 柴油、汽油和棕櫚油的原始反射率光譜兩兩可分性波段較窄, 而經(jīng)過包絡(luò)線去除變換后, 可分性波段均被擴大。
表2給出了包絡(luò)線去除變換前后3種輕質(zhì)油類型兩兩區(qū)分特征光譜的查找表。表中未加粗的右上部分是3種輕質(zhì)油類型原始光譜曲線中的兩兩可分波段(380~490 nm), 加粗的左下部分是包絡(luò)線去除變換后光譜曲線中兩兩可分波段(375~455 nm, 485~630 nm)。
圖4 輕質(zhì)油種間兩兩相互區(qū)分的特征波段區(qū)間
注: 灰色區(qū)域為可分性波段
表2 典型輕質(zhì)油種兩兩區(qū)分光譜范圍/nm
注: 字體未加粗為基于原始光譜結(jié)果, 加粗為經(jīng)過包絡(luò)線去除變換后結(jié)果
在實驗過程中將9組數(shù)據(jù)(54個樣本)用于SVM模型訓(xùn)練, 另外的9組數(shù)據(jù)(54個樣本)用于驗證模型的油種識別結(jié)果, 圖5中的藍色圓圈代表實際測試集分類, 紅色米字代表預(yù)測測試集分類, 當紅色米字落入藍色圓圈中, 表明預(yù)測測試集分類與實際測試集分類一致, 識別精度優(yōu); 反之, 表明預(yù)測測試集分類與實際測試集分類不符, 如圖5a柴油中存在一個空的藍色圓圈, 其對應(yīng)的紅色米字落在表示海水的一行中, 表明該柴油樣本被錯誤識別為海水。由圖5a可知, 基于全波段的總體油種識別精度為43/54=79.63%。原油、燃料油等重質(zhì)油的識別精度較好, 達到8/9=88.89%, 輕質(zhì)油種中的汽油和棕櫚油識別精度一般, 僅有55.56%和66.67%?;诠庾V標準差特征分析方法獲得的輕質(zhì)油原始光譜可分特征波段(380~490 nm), 得到總體的油種識別精度為42/54=77.78%。雖然總體的油種識別精度并未提高, 但燃料油和水的識別率得到提高。基于包絡(luò)線去除后的輕質(zhì)油可分特征波段范圍(375~455 nm, 485~ 630 nm)的總體油種識別精度為45/54=83.33%(圖5b), 與基于全波段的識別精度相比, 精度整體提高了3.7%, 其中, 除柴油和汽油外, 其他油種識別率均有顯著提高。
圖5 SVM油種識別結(jié)果圖
由表3可知, 5種油品和海水的前4個因子就能概括97%以上的變量特征, 故選擇前4個因子參與特征波段選擇。針對每種類型的每一因子, 選擇具有最高因子載荷的前200個波長, 例如, 柴油的因子1具有最高因子載荷的前200個波長范圍是910~920 nm、930~950 nm、1 100~1 170 nm和1 240~ 1 340 nm。分別針對全油種和海水(6種類型)、輕質(zhì)油種和海水(4種類型)及輕質(zhì)油種(3種類型)3組數(shù)據(jù)集統(tǒng)計4個因子特征變量集合中各波長出現(xiàn)的頻次, 詳見表3。
特征波長出現(xiàn)的頻次決定符合限定條件的特征波長的數(shù)量, 與油種識別精度密切相關(guān), 基于某一特定頻次的特征波長集合可以獲取最大的油種識別精度。在頻次一覽表(表3)的基礎(chǔ)上, 根據(jù)構(gòu)建的篩選準則(公式6)進行3組數(shù)據(jù)集特征波長篩選。全油種和海水實驗數(shù)據(jù)集中波長最大出現(xiàn)頻次是11次, 滿足公式6條件的頻次是8次(對應(yīng)特征波長范圍為360~520 nm, 560~580 nm), 同理可知, 輕質(zhì)油種和海水實驗數(shù)據(jù)組與輕質(zhì)油種實驗數(shù)據(jù)組中選取的頻次分別為5次和4次(對應(yīng)特征波長范圍為360~540 nm, 560~600 nm, 610~630 nm, 640~ 660 nm)。
在全油種和海水(6種類型)、輕質(zhì)油種和海水(4種類型)和輕質(zhì)油種(3種類型)等3組數(shù)據(jù)集中, 分別選擇頻次大于等于數(shù)據(jù)集中類型數(shù)量的特征變量開展油種識別。由表4可知, 基于滿足公式6特征波段的油種識別精度在各自數(shù)據(jù)集中的識別精度均是最高的, 分別是85.18%, 90.74%和90.74%(圖5c), 與基于全波段的識別效果相比, 精度整體提高了5.55%, 11.11%和11.11%。同時, 可以發(fā)現(xiàn)油種識別精度為90.74%的兩組特征波段是相同的, 故可認為360~ 540 nm, 560~600 nm, 610~630 nm和640~660 nm是識別5種海洋典型溢油油種的最佳特征波段。
表3 油品和海水具有最高因子載荷的前200波長的出現(xiàn)頻次一覽表
表4 基于因子分析方法的特征波段油種識別精度
不同的海面溢油來源可能導(dǎo)致海面溢油類型的不同。本文通過設(shè)計的室外模擬溢油實驗, 獲取原油、燃料油、柴油、汽油和棕櫚油等5 種油種的實測光譜數(shù)據(jù), 分別運用光譜標準偏差分析和因子分析方法對特征波段進行選擇, 并基于特征波段利用支持向量機模型開展油種識別實驗。結(jié)果表明, 基于光譜標準偏差分析和因子分析的油種識別精度分別是83.33%和90.74%, 與基于全波段的識別精度相比,整體精度分別提高了3.7%和11.11%。除汽油外, 其它油種和海水的識別精度均得到提高, 這是由于汽油極易揮發(fā), 與海水存在誤分的情況。同時可以發(fā)現(xiàn),獲得的特征波段集中在紫外波段和藍綠光波段, 這與藍綠光對水體的透射率高和紫外對薄油膜敏感有關(guān)?;谝蜃臃治霁@取的特征波段(360~540 nm, 560~ 600 nm, 610~630 nm, 640~660 nm)可作為5種油種相互區(qū)分的最佳高光譜波段。
海洋溢油發(fā)生后往往不會被立即發(fā)現(xiàn)并清除,在風化的過程中, 油品會經(jīng)歷漂移、擴散、溶解、乳化和生物降解等物理和化學的變化, 導(dǎo)致油品的光譜響應(yīng)發(fā)生變化, 對乳化后油品的油種識別還有待進一步的研究。衛(wèi)星影像數(shù)據(jù)在軌處理是未來發(fā)展的必然趨勢, 特征波段的有效選擇, 極大的減少處理的數(shù)據(jù)量, 對實現(xiàn)溢油影像數(shù)據(jù)在軌快速處理有較好的借鑒意義, 進而可在溢油場景發(fā)生時推廣應(yīng)用。
[1] YANG J F, WAN J H, MA Y, et al. Characterization analysis and identification of common marine oil spill types using hyperspectral remote sensing[J]. Internatio-nal Journal of Remote Sensing, 2020, 41(18): 7163- 7185.
[2] LEIFER I, LEHR W J, SIMECEK-BEATTY D, et al. State of the art satellite and airborne marine oil spill remote sensing: Application to the BP Deepwater Horizon oil spill[J]. Remote Sensing of Environment, 2012, 124(9): 185-209.
[3] YANG J F, WAN J H, MA Y, et al. Research on Objec-ted-oriented Decision Fusion for Oil Spill Detection on Sea Surface[C]//IEEE Geoscience & Remote Sensing Symposium. Piscataway, NJ, USA: IEEE, 2019, 9772-9775.
[4] CALLY C. Unique oil spill in East China Sea frustrates scientists[J]. Nature, 2018, 554(7690): 17-18.
[5] KOKALY R F, COUVILLION B R, HOLLOWAY J A M, et al. Spectroscopic remote sensing of the distribution and persistence of oil from the Deepwater Horizon spill in Barataria Bay marshes[J]. Remote Sensing of Environment, 2013, 129(2): 210-230.
[6] LU Y C, LI X, TIAN Q J, et al. Progress in marine oil spill optical remote sensing: detected targets, spectral response characteristics, and theories[J]. Marine Geodesy, 2013, 36 (1): 334-346.
[7] FINGAS M, BROWN C. Review of oil spill remote sensing[J]. Marine Pollution Bulletin, 2014, 83(1): 9-23.
[8] HU C, FENG L, HOLMES J, et al. Remote sensing estima-tion of surface oil volume during the 2010 Deepwater Horizon oil blowout in the Gulf of Mexico: scaling up AVIRIS observations with MODIS measurements[J]. Journal of Applied Remote Sensing, 2018, 12 (2), 026008.
[9] LU Y C, TIAN Q J, WANG X Y, et al. Determining oil slick thickness using hyperspectral remote sensing in the Bohai Sea of China[J]. International Journal of Digital Earth, 2013, 6(1): 76-93.
[10] 李穎, 劉丙新, 陳澎. 高光譜遙感技術(shù)在水上溢油監(jiān)測中的研究進展[J]. 海洋環(huán)境科學, 2012, 31(3): 158-162. LI Ying, LIU Bingxin, CHEN Peng. Research progress of hyperspectral remote sensing technology in oil spill monitoring[J]. Marine Environmental Science, 2012, 31(3): 158-162.
[11] WETTLE M, DANIEL P J, LOGAN G A, et al. Assessing the effect of hydrocarbon oil type and thickness on a remote sensing signal: A sensitivity study based on the optical properties of two different oil types and the HYMAP and Quickbird sensors[J]. Remote Sensing of Environment, 2009, 113(9): 2000-2010.
[12] THENKABAIL P S. Biophysical and yield information for precision farming from near-real-time and historical Landsat TM images[J]. International Journal of Remote Sensing, 2003, 24(14): 839-877.
[13] THENKABAIL P S, ENCLONA E A, ASHTON M S, et al. Accuracy assessments of hyperspectral waveband per-formance for vegetation analysis applications[J]. Remote Sensing of Environment, 2004, 91(3/4): 354-376.
[14] HU Y B, ZHANG J, MA Y, et al. Hyperspectral coastal wetland classification based on a multi-object convolutional neural network model and decision fusion[J]. IEEE Geoscience and Remote Sensing Letters, 2019, 16(7): 1110-1114.
[15] LU Y C, SHI J, WEN Y S, et al. Optical interpretation of oil emulsions in the ocean-Part I: Laboratory measurements and proof-of-concept with AVIRIS observations[J]. Remote Sensing of Environment, 2019, 230(5): 2000-2010.
[16] 趙冬至, 叢丕福. 海面溢油的可見光波段地物光譜特征研究[J]. 遙感技術(shù)與應(yīng)用, 2000, 3(15): 160-164. ZHAO Dongzhi, CONG Pifu. Research on spectral characteristics of oil spill in visible light band[J]. Remote Sensing Technology and Application, 2000, 3(15): 160-164.
[17] 劉丙新, 李穎, 韓亮. 基于光譜反射率數(shù)據(jù)的水面油種鑒別研究[J]. 光譜學與光譜分析, 2016, 36(4): 1100-1103.LIU Bingxin, LI Ying, HAN Liang. Identification of oil type using spectral reflectance characteristics[J]. Spectroscopy and Spectral Analysis, 2016, 36(4): 1100-1103.
[18] 鄧書斌. ENVI遙感圖像處理方法[M]. 北京: 高等教育出版社, 2014. DENG Shubin. ENVI Remote Sensing Image Processing Method[M]. Beijing: Higher Education Press, 2014.
[19] CHANG C C, LIN C J. LIBSVM: A library for support vector machines[J]. ACM Transactions on Intelligent Systems & Technology, 2011, 2(3): 1-39.
Accuracy assessments of hyperspectral characteristic waveband- for common marine oil spill types identification
YANG Jun-fang1, WAN Jian-hua1, MA Yi2,3, JIANG Zong-chen2,4, HU Ya-bin2
(1. China University of Petroleum, Qingdao 266580, China; 2. First Institute of Oceanography, Ministry of Natural Resources, Qingdao 266061, China; 3. Technology Innovation Center for Ocean Telemetry, Ministry of Natural Resources, Qingdao 266061, China; 4. Shandong University of Science and Technology, Qingdao 266590, China)
Accurate identification of the oil spill type is of great significance for rapid and effective treatment. Hyperspectral remote sensing plays an important role in oil spill identification. In order to explore the hyperspectral characteristic wavebands of marine oil spill types identification, we designed an outdoor oil spill experiment. The spectral characteristic wavebands were selected by factor analysis and spectral standard deviation analysis methods based on the measured spectral reflectance data of crude oil, fuel oil, diesel oil, gasoline and palm oil. Oil type identification accuracy evaluation were performed using the Support Vector Machine (SVM) model. The results show that oil type identification accuracy using characteristic wavebands obtained by spectral standard deviation analysis and factor analysis are 83.33% and 90.74%, respectively, and the overall accuracy is improved by 3.7% and 11.11% respectively compared with that using the full spectrum. The selected characteristic wavebands (360~540 nm, 560~600 nm, 610~630 nm, 640~660 nm) can be regarded as the best hyperspectral wavebands to distinguish the five common oil types, which has a good reference significance for the realization of on orbit rapid processing of oil spill image.
hyperspectral data; spectral analysis; optimal waveband; oil type identification; accuracy assessment
Jul. 20, 2020
P76
A
1000-3096(2021)04-0097-09
10.11759/hykx20200720003
2020-07-20;
2020-10-09
國家重點研發(fā)計劃項目(2017YFC1405600); 國家自然科學基金重大項目課題(61890964); 山東省聯(lián)合基金項目(U1906217); 國家自然科學基金青年項目(41706208); 國家自然科學基金面上項目(42076182)
[National Key Research and Development Project, No. 2017YFC1405600; National Natural Science Foundation of China Major Project, No. 61890964; National Natural Science Foundation of China Joint Fund, No. U1906217; National Natural Science Foundation, No. 41706208, No. 42076182]
楊俊芳(1991—), 女, 山東煙臺人, 博士研究生, 主要從事海洋溢油遙感監(jiān)測研究, E-mail: yangjunfang113@163.com; 馬毅(1973—),通信作者, 男, 研究員, 主要從事海島海岸帶遙感與應(yīng)用研究, E-mail: mayimail@fio.org.cn
(本文編輯: 叢培秀)