蔣萬里, 石俊生*, 季明江
1. 云南師范大學物理與電子信息學院, 云南 昆明 650504
2. 云南省光電信息技術重點實驗室, 云南 昆明 650504
光譜反射率是物體表面的固有屬性, 不僅全面地記錄了物體的顏色信息, 而且是物體表面材質(zhì)的表示方式; 可見與近紅外波段在物體反射光譜重建、 多光譜成像和遙感目標地物分類識別等領域有廣泛的應用。 不同波段有不同的應用, 人眼感知的可見波段主要與顏色應用相關, 決定著自然和人造物體在不同光源下的顏色, 除了人們?nèi)粘I钪薪ㄖ?環(huán)境、 照明、 服飾、 媒體等方面, 而且涉及光源設計、 各種顯示設備同色異譜, 以及顏色恒常等科學技術領域; 相關場景中物體的光譜反射率是必須獲得的信息[1]。 近紅外波段超出了人眼感知的范圍, 但其利用越來越受到關注。
隨著科技的發(fā)展, 包含可見和近紅外的多光譜得到廣泛應用。 在遙感應用中, 由于各波段所提供的信息不同, 光譜波段被選擇性地利用。 如區(qū)分不同植被種類, 探測植物葉綠素濃度植物活力, 監(jiān)測作植物健康狀況及農(nóng)作物長勢等。 在環(huán)境保護領域中, 通過獲取植物的高光譜影像來調(diào)查植物光譜反射率, 可以測量水域生物量, 可以對地下天然氣的泄露進行檢測[2]。 在顏色圖像領域, 可以用于近紅外波段圖像增強可見光圖像[3]、 去霧[3-4]和真彩色復原[5]等一系列應用。
建立可見與近紅外光譜反射率數(shù)據(jù)庫對科學研究和技術應用都非常重要。 在遙感應用領域, 美國在20世紀60年代末到70年代初建立了包含植物、 土壤、 巖石礦物和水體等4大類地物的電磁波波譜特性的數(shù)據(jù)庫—地球資源信息光譜數(shù)據(jù)庫。 美國地質(zhì)調(diào)查局(USGS)對各種巖石類型和部分植被類型進行了較系統(tǒng)的光譜測量, 建立了USGS光譜數(shù)據(jù)庫[6]。 包含人造材料、 涂料、 液體、 礦物質(zhì)、 有機化合物、 土壤、 混合物和植被共計2 467條光譜。 約翰霍普金斯大學(JHU)建立了包含巖石、 礦物、 地球土壤、 月球土壤、 人工材料、 隕石、 植被、 水體、 雪和冰、 以及人工目標的光譜數(shù)據(jù)庫。 美國噴氣推進實驗室(JPL)建立了160種礦物巖石在125~500, 45~152 μm和<45 μm三種波段ASTER光譜庫。 該光譜庫在2009年加入了來自JHU、 USGS等數(shù)據(jù)庫的光譜, 共計2300多條[6]。 我國數(shù)據(jù)庫的建立與研究起步較晚, 直到20世紀90年代初, 我國才建立了第一個綜合性“地物波譜特性數(shù)據(jù)庫”。 1998年, 國土資源部航遙中心建立了主要針對巖石礦物的地物光譜數(shù)據(jù)庫(GOSDBS)[7]。 2003年—2004年期間建立了中國巖礦標準波譜庫[6]。 2006年, 彭妮娜等通過測量植被、 土壤、 巖石、 水體、 人工目標和大氣信息6類物體的波譜特性, 建立了大氣及典型地物光學特性數(shù)據(jù)庫[7]。 2013年—2014年期間通過測量建立了太湖、 巢湖、 滇池等中國典型內(nèi)陸水體不同季節(jié)的光學量數(shù)據(jù)庫[6]。
在顏色應用領域, 2006年Kohonen等人從光譜顏色科學的角度簡要介紹了一些應用于顏色分析和表示的多種光譜數(shù)據(jù)庫[8], 如: 由1 600條以1 nm為間隔、 380~780 nm波段的Munsell色卡光譜反射率數(shù)據(jù)庫; 1 750條以10 nm為間隔, 400~700 nm波段的瑞典自然色系統(tǒng)(natural color system, NCS)數(shù)據(jù)庫; 由花、 葉和各種彩色植物共計218條以5 nm為間隔、 400~700 nm波段的光譜反射率組成的自然色卡數(shù)據(jù)庫等。
主成分分析(PCA)在光譜領域有廣泛的應用, 如數(shù)據(jù)降維、 光譜特征提取及光譜重建等。 在顏色領域應用方面, 2014年Chen等提出了在PCA的基礎上使用深度學習對高光譜圖像進行分類[9]。 2016年Xiao等利用相機對人類皮膚進行光譜反射率重建[10]。 2017年Hajipour和Shams-Nateri把Munsell 色卡作為訓練樣本[1], Macbeth色卡作為測試樣本, 使用競爭神經(jīng)網(wǎng)絡先進行分類, 再用PCA進行光譜反射率重建。 同年, Liu等以LOPEX93和ANGERS數(shù)據(jù)庫為基礎[11], 利用PCA重建植物葉片的光譜反射率并且檢索葉片的生化成分。 2018年Otsu等基于聚類算法和PCA利用給定的光譜三刺激值進行光譜反射率重建[12]。 2019年Dadon等提出了一種新穎的基于PCA的分類方法[13], 對隨機選擇植物樣本進行分類。 同年, Lewis D Griffin對基于PCA重建的光譜和其顏色真實性進行了評估。
近年來, 低照度彩色成像受到關注。 物體的光譜反射率是彩色成像的基礎。 如果知道圖像中物體的光譜反射率, 就可以計算圖像在任意光源下的顏色。 為此針對每一類物體都需要一個數(shù)據(jù)庫用以光譜重建。 如何將光譜反射率應用到解決低照度條件下真彩色復原一直都是國內(nèi)外研究的熱點。 單純利用可見光獲取低照度條件下的圖像會發(fā)現(xiàn)因為光譜相對功率分布過低而無法分辨顏色, 加上近紅外獲取的圖片雖然細節(jié)會提高很多, 但是圖像整體會偏粉。 因此建議使用包含近紅外的可見光對物體進行識別, 然后利用可見光對物體進行真彩色重建。 國內(nèi)外研究光譜反射率重建大多基于色卡而非實際物體, 例如Hajipour等的實驗[1]。 而Chen等的實驗都是基于高光譜圖像而非光譜反射率[9, 13], 在低照度條件下所獲取的植被在可見光范圍內(nèi)的圖像很難分辨出顏色。 但是如果能知道植被的光譜反射率, 就能重建任意光源條件下的真彩色圖像。
各種應用研究需要不同物體的光譜反射率, 國內(nèi)外已經(jīng)建立了各式各樣的數(shù)據(jù)庫, 但目前存在的問題是: (1)在遙感領域, 數(shù)據(jù)不完整或沒有公開; (2)在顏色領域, 僅僅存在標準色卡數(shù)據(jù), 沒有公開自然物體數(shù)據(jù), 而且光譜范圍在可見波段, 不包含近紅外波段。 這些不足限制了數(shù)據(jù)庫不同領域的研究與應用。
我們在研究低照度條件下利用近紅外獲得真彩色圖像中, 萌生了建立自然物體光譜反射率數(shù)據(jù)庫的愿望。 因而測量并建立了紅邊龍血樹、 藍花楹、 云南山楂等48種植物葉片從可見光到近紅外波段光譜反射率數(shù)據(jù)庫, 波長范圍380~1 068 nm、 間隔4 nm。 分別對可見與可見到近紅外兩種波段范圍進行了PCA, 為遙感和顏色領域應用提供數(shù)據(jù)和分析參考。
(1)實驗室標準燈箱。 采用便攜式地物光譜儀在戶外采集自然物體時發(fā)現(xiàn), 光譜反射率在近紅外波段會出現(xiàn)很強的噪聲影響測量。 為了測量更準確, 采用采集植物葉片后迅速帶回實驗室在標準燈箱下測量的實驗方法, 如圖1(a)。
圖1 測量器材與測量條件
(2)照明光源選擇A光源。 由于物體光譜反射率不隨照明光源變化, 可以選擇標準燈箱中D65, A, UV和CWF四種照明光源中的任何一種測量, 實驗發(fā)現(xiàn), 四種光源在可見光范圍內(nèi)的測量精度和重復率有較好的一致性。 但在近紅外波段, A光源的測量精度和重復率效果較好。 原因是A光源的光譜功率在近紅外波段呈上升趨勢, 如圖1(b), 而其他光源光譜功率分布在近紅外波段非常小, 導致測量結果跳躍、 不穩(wěn)定, 重復率差, 精度不高, 甚至是錯誤。
(3)測量儀器使用Photo Research公司PR-715光譜輻射亮度計, 可以測量波長范圍380~1 068 nm, 4 nm為間隔的光譜反射率。
(4)測量在暗室環(huán)境中0°/45°測量條件。 光源垂直于物體, 而PR-715呈45°角, 如圖1(c)。 在每種情況下, 都試圖對物體進行定向, 以減少物體被測部分的鏡面反射[8]。 在測量每個樣品之前, 將校準的標準漫反射板放置在物體位置測量其光譜功率分布。 選擇葉片中顏色均勻的部分多次測量, 當一片葉子上存在多種顏色時, 就會測量多個部位, 加上葉片的顏色多樣, 因此48種植物測量了150條光譜反射率。
對于公開數(shù)據(jù)庫, 國際上有專門網(wǎng)站可以下載使用, 也有以文件的形式提供下載使用。 我們數(shù)據(jù)庫數(shù)據(jù)是采用文件“xlsx”, 同時附上植物圖像和測量葉片及光譜反射系數(shù)曲線, 如圖2。 保存和顯示測量的光譜反射系數(shù)是沒有處理的原始數(shù)據(jù), 保留4位小數(shù)點。 對于同一植物不同葉片或同葉片顏色差距較為明顯的不同部位, 分別測量其光譜反射系數(shù)。 如圖2(a)是在同一季節(jié)采集的紅花檵木10種不同顏色葉片的10條光譜反射系數(shù)。 因此, 48種植物得到了150條光譜反射率(數(shù)據(jù)庫數(shù)據(jù)將公開提供使用)。
采集數(shù)據(jù)的葉片都來自云南省昆明市呈貢區(qū)云南師范大學和盤龍區(qū)昆明植物園。 采集時間從2020年10月30號開始到2021年6月9號截止包含春、 秋、 冬三個季節(jié)。 圖3是測量的48種植物圖像, 每個圖像右下角是被測葉片。 從左向右, 第1行: 刺柏、 藍花楹、 竹葉、 桃花、 荷花玉蘭、 云南山楂; 第2行: 玉蘭、 銀杏、 龍柏、 決明、 紫絨鼠尾草、 木犀; 第3行: 木茼蒿、 櫸樹、 女貞、 春羽、 高山榕、 石楠; 第4行: 常春藤、 云南黃素磬、 黃楊、 火炬樹、 燈籠花、 八角金盤; 第5行: 紅花檵木、 四季海棠、 金邊黃楊、 紅邊龍血樹、 火棘、 胡頹子; 第6行: 高盆櫻桃、 柳樹、 炮仗花、 樟、 碧桃、 蔓長春藤; 第7行: 楓香樹、 油菜、 天門冬、 薰衣草、 一串紅、 河津櫻; 第8行: 蒲葦、 金邊吊蘭、 尖尾芋、 幸福樹、 棕桐、 槭樹。
圖3 48種植物和測量葉片圖像
圖4是48種植物葉片圖像測得的光譜反射率, 共有150條譜線。 鑒于在波長兩端380 和1 068 nm附近測量噪音較大, 取值400~1 000 nm波長范圍。 從圖4可以看出, 48種植物葉在400~680 nm波段, 光譜反射率存在一個位置和大小各不相同的反射峰, 這是因為植物體內(nèi)葉綠素、 葉黃素、 葉紅素和花青苷含量的不同而導致的。 在680~750 nm波段, 植物葉片的光譜反射率急劇增大, 出現(xiàn)一個“陡坡”, 形成植物的獨有特征, 并且不同植物的光譜位置和反射率斜率基本一致。 在750~950 nm波段, 有著較高的反射率, 而且趨于平穩(wěn), 這是因為葉面反射光譜特征主要受葉內(nèi)細胞結構和葉冠結構控制, 由于光在葉內(nèi)散射, 光譜反射率非常高, 出現(xiàn)“紅外高臺階”。 在975 nm附近存在一個吸收峰, 這是由于植被體內(nèi)水的吸收和冠層結構所導致。 正是因為葉片的光譜反射率呈現(xiàn)這樣一種分布, 因此在晚上拍攝植物葉片時圖像會偏暗, 但是加上近紅外鏡頭之后圖像會偏亮。
圖4 48種植物葉片在400~1 000 nm范圍內(nèi)的光譜反射率
如圖5所示, 我們將不同植物顏色相近的葉片的光譜反射率放在一起, 可以發(fā)現(xiàn)不同植物, 顏色相近葉片的光譜反射率曲線形狀基本相似。 圖6是多種顏色紅花檵木葉片的光譜反射率圖像, 從中可以發(fā)現(xiàn)同一種植物不同顏色葉片的光譜反射率形狀有較大的差異。
圖5 不同植物相近顏色葉片的光譜反射率
圖6 多種顏色紅花檵木葉片
對光譜反射率數(shù)據(jù)庫進行PCA分析, 通過一組本征矢來近似表示大量植物葉片的光譜反射率, 可以實現(xiàn)光譜數(shù)據(jù)的低重構誤差。 為了能使重建的光譜反射率更好的體現(xiàn)出植物的生化特性, 需要在重建時加上光譜反射率的平均值。 分別對150個光譜樣本在400~700和400~1 000 nm波段進行PCA分析。 表1和表2分別給出了可見波段和從可見到近紅外波段150個光譜反射率的平均值和前六個主成分數(shù)據(jù)。
平均值和前三個主成分如圖7所示。
表3給出前六個主成分對應貢獻率及累積貢獻率。 對于400~1000 nm波段, 它的第一個主成分的貢獻率為71.46%, 前三個主成分的累積貢獻率為94.97%, 前六個主成分的累積貢獻率達到了99.42%。 而對于400~700 nm波段, 它的第一個主成分的貢獻率為87.74%, 前三個主成分的累積貢獻率達到了98.62%, 前六個主成分的累積貢獻率達到了99.84%。 也就是說在通常情況下, 使用前三個主成分就可以描述葉片絕對大多數(shù)的特征了。 從圖中也可以看出在400~700 nm波段兩者的前三個主成分曲線形狀有著很大的差異。
表1 150個光譜樣本在可見波段400~700 nm平均值和前六個主成分數(shù)據(jù)
表2 150個光譜樣本在可見到近紅外波段400~1 000 nm平均值和前六個主成分數(shù)據(jù)
圖7 光譜平均值和PCA前三個主成分
表3 前六個主成分對應貢獻率及累積貢獻率
測量并建立了紅邊龍血樹、 藍花楹、 云南山楂等48種植物150條葉片從可見光到近紅外波段光譜的反射率數(shù)據(jù)庫, 波長范圍400~1 000 nm、 間隔4 nm。 分別對可見與可見到近紅外兩種波段范圍進行了PCA研究。 結果表明: 不同植被葉片在相同色相內(nèi)的光譜反射率曲線基本上有相同的波形。 即使是同一種植物, 因為體內(nèi)葉綠素、 葉黃素、 葉紅素和花青苷含量的不同, 波形可以出現(xiàn)很大的差異。 通過分析葉片光譜反射率的一階導數(shù)和紅邊特征參數(shù)可以為植被的識別與分類提供基礎。 PCA結果表明: 可見和可見與近紅外兩種波段前三個主成分的累積貢獻率分別為98.62%和94.97%。 因此通過前三個主成分就能很好的重建植物葉片的光譜反射率, 并且通過色相進行分類可以有效地提高主成分的貢獻率。 我們通過建立數(shù)據(jù)庫并計算出植物葉片的本征矢可能對遙感領域植物的識別與分類以及顏色科學領域在不同照明條件下實現(xiàn)顏色再現(xiàn)等提供幫助。
從光譜反射率和PCA的角度分析了數(shù)據(jù)庫, 通過對數(shù)據(jù)庫進行不同的處理和分析, 可以應用于不同的領域。 本工作只采集了48種植物, 對于建立數(shù)據(jù)庫來說還需要更多的數(shù)據(jù), 因此后續(xù)將繼續(xù)擴大數(shù)據(jù)庫的內(nèi)容。