李雪鵬,許 增,楊 昱,鄧紅霞,李海芳
(1. 太原理工大學(xué)信息與計(jì)算機(jī)學(xué)院,山西 太原 030600)
植被生長(zhǎng)態(tài)勢(shì)的監(jiān)測(cè)是城市綠化持續(xù)健康發(fā)展的基礎(chǔ)[1]。過去相關(guān)研究[2-11]盡管能夠映射出植被葉片含水量和高光譜波段之間的聯(lián)系,但由于高光譜相機(jī)的價(jià)格十分高昂,對(duì)于大范圍監(jiān)測(cè)城市植被的生長(zhǎng)態(tài)勢(shì)可行性很小。隨著無人機(jī)技術(shù)的普及[12],大范圍監(jiān)測(cè)成為可能?;诖耍脽o人機(jī)在4個(gè)月時(shí)間內(nèi)對(duì)6種植被進(jìn)行葉片含水量監(jiān)測(cè),并嘗試在植被的多維光譜信息和含水量之間利用回歸方程建立映射關(guān)系,分析不同回歸方程對(duì)植被含水量的相關(guān)性,并對(duì)模型精度進(jìn)行測(cè)評(píng)。
本文的數(shù)據(jù)來源于山西省晉中市榆次區(qū),使用深圳市大疆創(chuàng)新科技有限公司生產(chǎn)的Mavic Air2型多旋翼無人機(jī),搭載一顆全新的1/2英寸CMOS傳感器,支持拍攝4 800萬像素的照片(角度84°,等效角度24 mm,光圈f/2.8)。在2020-04~2020-08共5個(gè)月時(shí)間內(nèi),選取了草地、白蠟、冬青、美人榆、白楊、棗樹6種植被。根據(jù)不同的植被種植面積采用不同的飛行高度,經(jīng)多次試飛后選定為4~30 m,拍攝角度為50~84°,拍攝時(shí)間選為上午9:00、10:00、11:00和下午14:00、15:00,拍攝場(chǎng)景選取風(fēng)力柔和的晴天,每次拍攝前先操控?zé)o人機(jī)飛至植被區(qū)域上空5~10 s待機(jī)身穩(wěn)定后進(jìn)行拍攝,保證獲取圖像的質(zhì)量。圖1為拍攝的6種植被的可見光圖像。
圖1 航拍植被的可見光圖像
為了建立植被冠層含水量和可見光圖像之間的映射關(guān)系,還需要采集實(shí)驗(yàn)地面植被的冠層水分信息。對(duì)于每一種植被,隨機(jī)挑選10~20處長(zhǎng)勢(shì)正常的分枝,用電子天平(單位:g,精度0.01:g)測(cè)量出這些分枝的重量,即植被的鮮重FW(fresh weight,單位:g);接下來將這些分枝置于70℃的恒溫烘干箱中烘烤12 h,直至其質(zhì)量不再發(fā)生變化,得到植被的干重DW(單位:g),通過式(1)計(jì)算可得植被冠層的相對(duì)含水量[13]:
在1.1 中航拍到的圖像中,盡管有所需要的植被部分,但是同時(shí)也存在大量的非植被區(qū)域。由于非植被部分的存在,會(huì)對(duì)接下來的提取造成多余的信息干擾,因此要預(yù)處理去除圖像中的非植被部分,只保留植被部分的信息。
本文采用過綠植被指數(shù)NExG[14]和歸一化處理來提取圖像中的植被部分:
式中,R、G、B分別代表像素點(diǎn)的紅、綠、藍(lán)亮度值。
利用直方圖閾值法確定NExG的閾值大小,然后根據(jù)閾值點(diǎn)對(duì)對(duì)原圖像進(jìn)行Mask 掩膜處理,結(jié)果如圖2所示。
圖2 圖像預(yù)處理前后對(duì)比
本文使用的技術(shù)路線如圖3 所示,按照一部分中的方法采集足量的數(shù)據(jù)集,其中每張圖像與其拍攝時(shí)的冠層含水量之間做記錄并一一對(duì)應(yīng)。將采集到的圖像做預(yù)處理后,利用HSCNN 將普通可見光RGB 圖像重構(gòu)為400~700 nm 的多光譜圖像,然后利用PCA 從多維光譜信息中提取出主成分,最終從這些主成分和冠層含水量之間建立一個(gè)映射關(guān)系,達(dá)到反演目的。
圖3 技術(shù)路線
HSCNN是Xiong[12]等在2017年ICCV上提出的統(tǒng)一的深度學(xué)習(xí)框架。具體流程是首先通過簡(jiǎn)單插值在光譜維度上對(duì)RGB圖像進(jìn)行升采樣,然后所提出的方法從大量的升采樣/地面高光譜圖像對(duì)中學(xué)習(xí)端到端映射。映射表示為深度卷積神經(jīng)網(wǎng)絡(luò),以頻譜上采樣的圖像為輸入,并預(yù)測(cè)丟失的圖像細(xì)節(jié),從中恢復(fù)最終的高光譜圖像。
HSCNN網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示,網(wǎng)絡(luò)共有d層,第一層負(fù)責(zé)從輸入圖像中提取補(bǔ)丁。由于高光譜圖像是三維圖像,因此第一層具有64 個(gè)大小為3×3×Ω(Ω為索引光譜坐標(biāo))的過濾器,并在Ω?jìng)€(gè)光譜帶的3×3空間區(qū)域上運(yùn)行,產(chǎn)生了64個(gè)特征映射。除第一個(gè)和最后一個(gè)圖層外的其他圖層均為64 個(gè)大小為3×3×64的過濾器。最后一層由大小為3×3×64 的Ω?jìng)€(gè)過濾器組成,可從64 個(gè)特征映射中重建具有Ω?jìng)€(gè)光譜帶的高光譜圖像。
圖4 HSCNN網(wǎng)絡(luò)框架
可見光圖像(w×h×3,w和d為圖片寬度和高度,3 代表三維顏色通道RGB)經(jīng)過HSCNN 重構(gòu)為w×h×31的圖像矩陣,由三維通道擴(kuò)充到了31維,可見光光譜波長(zhǎng)范圍為400~700 nm,波長(zhǎng)間隔為10 nm。
圖像的顏色矩,即一階矩(均值)、二階矩(方差)和三階矩(斜度)被證明可以很有效地表示圖像中的顏色分布[15],3個(gè)顏色矩的數(shù)學(xué)定義如式(3):
式中,ρi,j為圖像第i個(gè)顏色通道分量中灰度為j的像素出現(xiàn)的概率;N為圖像中的像素個(gè)數(shù)。
圖像的31維通道組成的直方圖向量,即圖像的特征向量表示如式(4):在可見光波長(zhǎng)范圍內(nèi),每一種植被都有其各自的光譜反射特性,因此要建立植被冠層含水量和可見光圖像之間的映射關(guān)系,就是建立從植被圖像中提取的多維光譜特征信息和該植被實(shí)際冠層含水量間的聯(lián)系[16]。
多元回歸分析方法是處理多變量間相依關(guān)系的統(tǒng)計(jì)方法[17]。但在實(shí)際的應(yīng)用中,有的多元自變量與因變量相關(guān)性不大,有的自變量之間還可能存在近似線性關(guān)系則會(huì)引起回歸方程的不穩(wěn)定,由于2.3 中圖像的特征向量維數(shù)較多,需要用較少的幾個(gè)綜合變量來代替原來較多的變量,使得這幾個(gè)綜合變量彼此之間互不相關(guān),盡可能反映原變量的信息。表1 顯示出當(dāng)相關(guān)性大于99.9%時(shí)所需要的主成分?jǐn)?shù)。
表1 光譜波段主成分分析表
實(shí)驗(yàn)得出的6 種植被的光譜波段的主成分在4~6之間,要建立這些主成分與其對(duì)應(yīng)的相對(duì)含水量之間的聯(lián)系,可采用最小二乘法擬合多元變量來建立回歸模型[18]??紤]到模型中使用的樣本數(shù)量較少,可能出現(xiàn)過擬合的現(xiàn)象,為了避免這種情況,可以通過在最小二乘法回歸方程后加上正則化參數(shù)來調(diào)節(jié)。在這里選擇添加L1正則和L2正則2個(gè)參數(shù),即使用ElasticNet,既能減少模型的方差,又能使得回歸系數(shù)盡可能取較小的值,防止出現(xiàn)過擬合。ElasticNet公式如下所示(5):
以04-01~08-01 采集數(shù)據(jù)中的4/5 樣本進(jìn)行回歸建模,1/5 樣本用來驗(yàn)證模型的精度,其中6種植被的無人機(jī)航拍圖像和對(duì)應(yīng)的植被冠層相對(duì)含水量數(shù)據(jù)均為160個(gè)樣本建模,40個(gè)樣本驗(yàn)證,驗(yàn)證方法采用五折交叉驗(yàn)證,6 種植被的冠層相對(duì)含水量統(tǒng)計(jì)特征如表2所示。
表2 植被冠層相對(duì)含水量統(tǒng)計(jì)特征
采用模型決定系數(shù)(R2)和均方根誤差(RMSE),2 種驗(yàn)證方式[19]和五折交叉驗(yàn)證對(duì)回歸模型進(jìn)行驗(yàn)證。驗(yàn)證結(jié)果見表3。
根據(jù)表3 對(duì)2 種模型下植被冠層相對(duì)含水量的預(yù)測(cè)值與實(shí)測(cè)值比較,2 種回歸模型方法均有較好的預(yù)測(cè)性。其中最小二乘法的預(yù)測(cè)誤差率普遍要略大于ElasticNet。白蠟在2種模型的決定系數(shù)R2均表現(xiàn)出偏低(0.322 和0.371),而其他5 種植被均表現(xiàn)正常,2 種回歸模型均可作為反演植被含水量的模型。同時(shí)也發(fā)現(xiàn),接觸地面的草地植被(草) 和灌木植被(白楊、棗樹)的誤差率相比較林地植被(白蠟、冬青、美人榆)的更高,因此可以推測(cè)這2 種模型對(duì)林地植被的反演精度更高。對(duì)比文獻(xiàn)[11]中基于無人機(jī)可見光波段反演冬小麥植株含水量,其光譜反射率模型的相對(duì)誤差率為10%,光譜植被指數(shù)模型的相對(duì)誤差率為13%,兩者結(jié)合下的優(yōu)選模型相對(duì)誤差率約為7%,而本文提出基于HSCNN可見光植被含水量反演模型平均相對(duì)誤差率為4%左右,相較于其模型準(zhǔn)確率提高了3%~9%。
表3 不同模型下植被冠層相對(duì)含水量的預(yù)測(cè)值與實(shí)測(cè)值比較
本研究從無人機(jī)拍攝的可見光圖像著手,采集了草地、白蠟、冬青、美人榆、白楊、棗樹6 種植被各200組數(shù)據(jù)和與圖像一一對(duì)應(yīng)的植被冠層相對(duì)含水量數(shù)據(jù)。首先對(duì)采集到的圖像進(jìn)行預(yù)處理,通過Mask掩膜覆蓋圖像的非植被部分,然后通過HSCNN 映射并恢復(fù)出航拍圖像可見光400~700 nm范圍內(nèi)的多光譜數(shù)據(jù);利用PCA 主成分提取法對(duì)多維光譜波段提取主成分,然后通過最小二乘法和ElasticNet 2 種回歸模型對(duì)通過PCA 提取出來的主成分和植被冠層相對(duì)含水量數(shù)據(jù)之間建立映射關(guān)系。
實(shí)驗(yàn)結(jié)果表明,植被的可見光多維光譜信息和植被冠層相對(duì)含水量之間存在較好的相關(guān)性,其預(yù)測(cè)結(jié)果和實(shí)際測(cè)量結(jié)果的誤差率在2%~5%左右,對(duì)可見光反演植被冠層含水量提供了一定理論支持。同時(shí),通過2 種回歸模型對(duì)6 種植被的冠層含水量反演的結(jié)果分析,其對(duì)冬青的反演結(jié)果最好(模型決定系數(shù)在0.7以上,誤差率在2.5%左右)。因此可以認(rèn)為通過普通的RGB可見光圖像能夠?qū)χ脖还趯雍窟M(jìn)行預(yù)測(cè)和反演,為大面積監(jiān)測(cè)城市植被的生長(zhǎng)態(tài)勢(shì)提供了理論依據(jù)。盡管在可見光植被圖像和植被冠層含水量之間建立了映射關(guān)系,但模型有以下兩點(diǎn)限制:①由于不同植被之間的外觀、顏色、長(zhǎng)勢(shì)、含水量之間的差異性,每種映射關(guān)系的建立是在同一種植被上,因此如果想要建立除本研究中外6 種植被的反演模型,需要建立新的映射關(guān)系;②本研究中所實(shí)驗(yàn)的植被均為綠色植被,因此非綠色植被能否應(yīng)用本文的方法仍需進(jìn)一步研究。