王浩云 曹雪蓮 孫云曉 閆明壯 王江波 徐煥良
(1.南京農(nóng)業(yè)大學(xué)人工智能學(xué)院,南京 210095; 2.中國電子科技集團國睿科技股份有限公司,南京 210023;3.塔里木大學(xué)植物科學(xué)學(xué)院,阿拉爾 843300;4.塔里木大學(xué)南疆特色果樹高效優(yōu)質(zhì)栽培與深加工技術(shù)國家地方聯(lián)合工程實驗室,阿拉爾 843300)
綠蘿是優(yōu)良的室內(nèi)觀賞植物,除觀賞價值外,對凈化室內(nèi)環(huán)境也有重要作用[1]。葉綠素含量是影響植物光合作用的重要因素,也是評價綠色植物生長狀況的關(guān)鍵指標[2-3]。快速檢測綠蘿葉綠素含量對于掌握綠蘿健康狀況具有重要意義。葉綠素含量檢測方法可分為有損的化學(xué)檢測和無損檢測兩類。傳統(tǒng)的化學(xué)檢測手段存在耗時、費力、時效性差、適用性差、破壞植物體結(jié)構(gòu)等缺陷[4]。無損檢測方法主要依靠葉綠素測量儀和高光譜成像技術(shù),葉綠素測量儀操作便捷,但因只能對局部點光譜進行分析,無法完整獲取葉片或冠層整體的葉綠素信息[5],在實際應(yīng)用中仍存在較大的局限性。
基于光譜分析技術(shù)結(jié)合光譜和圖像信息可以實現(xiàn)葉綠素含量的快速、非破壞性檢測[3]。其中,光譜儀因其便攜、快速、無損的優(yōu)勢而被廣泛應(yīng)用,但便攜式光譜儀采用點光源測量方式,從樣本中獲取的光譜信息有限。而由高光譜相機拍攝的高光譜圖像同時包含大量圖像信息和光譜信息,彌補了傳統(tǒng)光譜儀和數(shù)字攝像頭在獲取圖像信息上的不足[6],在農(nóng)業(yè)工程領(lǐng)域已得到廣泛的應(yīng)用。
目前,采用高光譜檢測葉綠素含量的方法大多通過構(gòu)建簡單模型將光譜圖像與葉綠素含量直接關(guān)聯(lián)[7-10],忽略了植物組織內(nèi)部對光的吸收和散射[11-12],故無法表達整個植物組織內(nèi)部葉綠素含量的完整信息。因此,在使用光譜技術(shù)進行分析時有必要研究光在植物組織中的傳輸機理[13],將光譜信息和光學(xué)特性參數(shù)結(jié)合可以彌補單一光譜信息的不足。陳榮等[14]采用遺傳退火算法重構(gòu)光學(xué)特性參數(shù),得到μa和μs的反演誤差分別為8%和0.1%。劉奇[15]利用BP神經(jīng)網(wǎng)絡(luò)反演多層模型的光學(xué)特性參數(shù),雙層平板模型的誤差為1.84%,三層平板模型的誤差為1.73%,獲得比線性擬合和微擾蒙特卡洛方法更高的預(yù)測精度。深度學(xué)習(xí)方法在光學(xué)特性參數(shù)反演中表現(xiàn)突出,但該方法依賴大量樣本進行模型訓(xùn)練,需要投入較多的人力、物力,以獲取數(shù)據(jù)。林相澤等[16]、鄭一力等[17]和龍滿生等[18]將遷移學(xué)習(xí)應(yīng)用到圖像識別領(lǐng)域,獲得比直接訓(xùn)練更好的效果。許景輝等[19]采用不同訓(xùn)練方式將VGG-16模型遷移到玉米病害圖像識別中。徐煥良等[20]基于模型遷移方法,在雙層平板模型上得到光學(xué)參數(shù)反演結(jié)果。鄭宗生等[21]將源域與目標域分布差異添加到損失函數(shù)中,使遷移模型收斂更快、準確率更高。
目前,在葉綠素高光譜檢測研究中,尚未見結(jié)合光學(xué)特性參數(shù)進行分析的相關(guān)研究。本文以綠蘿為研究對象,提出結(jié)合仿真光譜數(shù)據(jù)和域自適應(yīng)遷移學(xué)習(xí)方法進行光學(xué)特性參數(shù)反演,并將神經(jīng)網(wǎng)絡(luò)輸出的深度特征用于葉綠素含量預(yù)測模型。
1.1.1實驗樣本
實驗對象為長藤綠蘿,選取20盆長勢相當?shù)木G蘿為樣本,分別從每盆綠蘿植株四周均勻采集葉片10片,總計200片綠蘿葉片。為避免時間過長導(dǎo)致葉片水分流失或葉綠素高溫見光分解,葉片采摘后立即進行實驗數(shù)據(jù)采集。
1.1.2綠蘿葉片高光譜數(shù)據(jù)采集
采用HSI-VNIR-0001型高光譜成像系統(tǒng)獲取綠蘿葉片高光譜圖像,成像系統(tǒng)結(jié)構(gòu)如圖1所示,該成像系統(tǒng)主要包含CCD相機、光譜儀、光源、移動載物臺、計算機及配套的光譜成像和分析軟件,光譜采集波長為375.54~1 033.87 nm。消除前后噪聲波段后,高光譜有效波長范圍設(shè)置為400~900 nm,共468個波段。
1.1.3綠蘿葉片積分球數(shù)據(jù)采集
采用上海五鈴光電科技有限公司的雙積分球系統(tǒng)采集綠蘿葉片的反射率與透射率,主要由透射球、反射球、光纖、光源、光譜儀、計算機和相應(yīng)配套軟件組成。由雙積分球系統(tǒng)獲得葉片的反射率和透射率后,利用IAD算法通過迭代計算來確定綠蘿葉片的光學(xué)特性參數(shù),最終得到綠蘿葉片的吸收系數(shù)μa(0.01~6 mm-1)和散射系數(shù)μs(0.9~150 mm-1)。
1.1.4綠蘿葉片葉綠素含量采集
采用便攜式SPAD-502型葉綠素儀采集綠蘿葉片的葉綠素含量信息。為避免儀器本身存在測量誤差,在每次測量前對設(shè)備進行校準。設(shè)備校準后,選取生長發(fā)育正常的綠蘿葉片,對 2像素×2像素的矩形區(qū)域進行測量,在同一區(qū)域測量3次取平均值作為該區(qū)域的葉綠素含量,如圖2所示。
蒙特卡洛方法是一種模擬抽樣或統(tǒng)計試驗方法,其基本思想是首先通過一系列隨機數(shù)來模擬與實際情況類似的隨機過程或者概率模型,再進行抽樣實驗計算相關(guān)參數(shù),最后得到近似解。研究表明,蒙特卡洛方法能夠有效地描述光子在組織中的傳輸過程,與實際測量的參數(shù)基本一致,因此該方法已經(jīng)成為光在生物組織中傳輸?shù)囊环N非實驗標準。
利用蒙特卡洛方法模擬光子傳輸?shù)倪^程中[15],光束可以被看成一個一個的光子,當發(fā)射一個光子時,該光子會隨機移動一個步長,接著與組織中的微小顆粒發(fā)生吸收和散射作用。散射會改變光子的運動方向,吸收會使光子權(quán)重減小,然后光子繼續(xù)移動并發(fā)生吸收散射作用。當光子從組織表面逸出時,從上表面逸出的光子形成漫反射光,從下表面逸出的光子形成透射光,當光子的權(quán)重足夠小時,就會被組織吸收。最后重復(fù)這條光束中的所有光子,從而完成整個光束的蒙特卡洛模擬。
徐煥良等[20]構(gòu)造點光源下的蘋果雙層平板模型,簡化了復(fù)雜模型計算量[22]。但點光源應(yīng)用存在較大局限性,本文采用面光源構(gòu)造蒙特卡洛平板模型模擬最真實的平行光光源下的光子傳輸過程。因葉片結(jié)構(gòu)與單層平板結(jié)構(gòu)極為接近,最終采用基于面光源的單層平板結(jié)構(gòu)構(gòu)建綠蘿葉片的光子傳輸模型。根據(jù)積分球?qū)嶒灉y得的光學(xué)特性參數(shù)設(shè)置仿真實驗參數(shù),將葉片厚度d設(shè)置為涵蓋實測樣本全部厚度的25個值,μa和μs分別取實測吸收系數(shù)和散射系數(shù)中均勻分布的7個和8個值,本文使用1×106個光子模擬整個過程,得到光子在葉片組織表面的統(tǒng)計分布如圖3所示。從圖3中可以看出,與點光源圖像相比,面光源光子分布圖更亮且光子覆蓋面更廣,一定程度上說明了使用面光源數(shù)據(jù)可以獲取更多圖像和光譜信息。
本文提出基于遷移學(xué)習(xí)的綠蘿葉片光學(xué)特性參數(shù)反演方法,并根據(jù)光學(xué)特性參數(shù)反演結(jié)果構(gòu)建綠蘿葉片葉綠素含量預(yù)測模型。首先,根據(jù)實測綠蘿葉片數(shù)據(jù)構(gòu)建面光源下的蒙特卡洛單層平板模型,模擬光子在葉片中的運動軌跡以獲得大量無噪聲的理想光譜數(shù)據(jù),再利用卷積神經(jīng)網(wǎng)絡(luò)對模擬光譜數(shù)據(jù)進行訓(xùn)練,得到預(yù)訓(xùn)練模型?;谟?xùn)練好的模型,在神經(jīng)網(wǎng)絡(luò)的損失函數(shù)中加入仿真數(shù)據(jù)與實測數(shù)據(jù)的最大均值差異,用實測數(shù)據(jù)對網(wǎng)絡(luò)進行微調(diào),獲得比直接訓(xùn)練神經(jīng)網(wǎng)絡(luò)和模型遷移都更高的反演精度。最后,利用高光譜和遷移后的模型反演光學(xué)特性參數(shù),建立綠蘿葉綠素含量預(yù)測模型,并與光學(xué)參數(shù)、高光譜數(shù)據(jù)建立的模型進行對比,驗證了光學(xué)特性參數(shù)反演的必要性。
卷積神經(jīng)網(wǎng)絡(luò)因其多層卷積、權(quán)值共享、旋轉(zhuǎn)不變性等特點[23],擁有比傳統(tǒng)方法更強的特征提取和表達能力,在圖像識別分類任務(wù)中表現(xiàn)突出,一般由輸入層、卷積層、池化層、全連接層和輸出層構(gòu)成。卷積神經(jīng)網(wǎng)絡(luò)可以將原始圖像直接輸入網(wǎng)絡(luò)進行特征提取,卷積層和池化層是提取圖像特征的重要環(huán)節(jié),輸出層將多維向量組合成一維向量輸出,實現(xiàn)圖像分類識別。
本文選擇卷積神經(jīng)網(wǎng)絡(luò)進行預(yù)訓(xùn)練,網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。網(wǎng)絡(luò)模型包含3個卷積層、1個池化層和1個全連接層,網(wǎng)絡(luò)輸入是30像素×30像素的仿真綠蘿葉片光亮度分布圖像,第1層為卷積層,卷積核尺寸為2×2,通道數(shù)為10,步長為1,第2層為池化層,池化窗口尺寸2×2,步長為1,第3層為卷積層,卷積核尺寸為3×3,通道數(shù)為20,步長為1,第4層為卷積層,卷積核尺寸為2×2,通道數(shù)為20,步長為1,全連接層FC1將第4層網(wǎng)絡(luò)的輸出降維到1×50,最后通過Softmax層實現(xiàn)光學(xué)參數(shù)分類。
遷移學(xué)習(xí)是指利用數(shù)據(jù)、任務(wù)或模型之間的相似性,將在源領(lǐng)域?qū)W習(xí)到的模型應(yīng)用于目標領(lǐng)域的一種學(xué)習(xí)過程。預(yù)訓(xùn)練模型中的卷積層已經(jīng)可以對源域樣本進行特征提取[24],再添加全連接層就能實現(xiàn)較好的分類效果。一般的模型遷移方法只需要基于預(yù)訓(xùn)練模型,改變最后的全連接層應(yīng)用到目標數(shù)據(jù)集上,對網(wǎng)絡(luò)進行微調(diào)就可以實現(xiàn)遷移學(xué)習(xí)。但該方法要求源域與目標域圖像具有相同分布,忽略了兩種數(shù)據(jù)的差異性,如果將二者分布差異加入模型訓(xùn)練中,可以提高網(wǎng)絡(luò)的遷移能力。
最大均值差異(Maximum mean discrepancy,MMD)[21]是遷移學(xué)習(xí)中使用頻率最高的度量方法,度量在再生希爾伯特空間(RKHS)中兩個分布的距離,是一種核學(xué)習(xí)方法,兩個隨機變量的MMD平方距離為
(1)
式中Lmmd——最大均值差異平方距離
Fs、Ft——源域和目標域提取的特征
M、N——源域和目標域樣本數(shù)量
φ——將原始數(shù)據(jù)映射到再生希爾伯特空間的核函數(shù)
本文基于預(yù)訓(xùn)練模型引入最大均值差異的分布匹配方法,在網(wǎng)絡(luò)的全連接層之后增加分布匹配度量,減小實測綠蘿葉片光譜圖像和模擬光亮度圖特征分布的差異,提高網(wǎng)絡(luò)的遷移能力。網(wǎng)絡(luò)的交叉熵損失函數(shù)Lc為
Lc=λ1L1+λ2L2
(2)
其中
(3)
式中L1、L2——μa、μs交叉熵損失
λ1、λ2——μa、μs權(quán)重
m——樣本總數(shù)量
n——任務(wù)分類類別數(shù)量
xi——學(xué)習(xí)到的特征向量
wj、bj——第j個類別全連接層輸出的權(quán)重向量和偏置項
wyi、byi——第yi個樣本的權(quán)重向量和偏置項
綜合上述交叉熵損失和分布匹配度量損失,本文基于MMD的域適應(yīng)方法的損失函數(shù)為
(4)
式中Ltotal——總損失函數(shù)
Xt、Yt——實測樣本特征
偏最小二乘回歸(Partial least squares regression,PLSR)是基于成分提取思想,可解決變量之間多重相關(guān)的問題。在本文提出的基于遷移學(xué)習(xí)的光學(xué)特性參數(shù)反演方法基礎(chǔ)上,使用光學(xué)參數(shù)深度特征構(gòu)建偏最小二乘預(yù)測模型,得到葉綠素含量回歸結(jié)果,并與常規(guī)的高光譜分析方法進行對比。采用實測值與預(yù)測值之間的決定系數(shù)R2和均方根誤差(Root mean square error,RMSE)評估預(yù)測模型的性能。決定系數(shù)越接近1,則模型的預(yù)測能力越好;RMSE越小,說明模型預(yù)測能力越好。
實驗在Python 3.7.4、Tensorflow-GPU 1.13.1軟件環(huán)境下完成。CPU采用AMD Ryzen 5 1600 Six-core Processor,主頻3.2 GHz;GPU采用NVIDIA GeForce RTX 2080 Ti顯卡。
通過蒙特卡洛仿真模型得到12 000幅模擬葉片光亮度分布圖,對樣本數(shù)據(jù)進行簡單劃分,其中訓(xùn)練集10 000幅、測試集2 000幅。通過對測試結(jié)果的分析評估對模型參數(shù)進行調(diào)整,設(shè)置批次為100,學(xué)習(xí)率為0.000 1,訓(xùn)練2 000次得到預(yù)訓(xùn)練模型。將實驗采集到的3 000幅高光譜圖像以4∶1的比例劃分為訓(xùn)練集和測試集,基于預(yù)訓(xùn)練網(wǎng)絡(luò),引入最大均值差異度量方法進行遷移學(xué)習(xí),生成新的光學(xué)參數(shù)反演模型。在預(yù)測葉綠素含量階段,將實測樣本的光譜數(shù)據(jù)輸入到訓(xùn)練好的模型中,得到全連接層的輸出結(jié)果作為偏最小二乘的輸入,得到葉綠素含量回歸結(jié)果。同時為了驗證本文方法的有效性,將基于光學(xué)參數(shù)和高光譜的葉綠素含量模型與本文方法進行對比。
3.3.1基于仿真數(shù)據(jù)的光學(xué)特性參數(shù)反演
蒙特卡洛方法模擬得到的仿真圖像尺寸均為100像素×100像素,其中中心點位置為(50像素,50像素),為了在減小計算量提高效率的同時不影響訓(xùn)練效果,分別取像素區(qū)間(21∶80,21∶80)、(21∶50,51∶80)、(21∶50,21∶50)、(51∶80,51∶80)、(51∶80,21∶50)的仿真圖像作為網(wǎng)絡(luò)輸入,反演結(jié)果如表1所示。
從表1中可以看出,(21∶80,21∶80)和(51∶80,51∶80)獲得了更好的反演結(jié)果,二者的反演效果差距不大,但更大的圖像選取范圍會導(dǎo)致模型參數(shù)以及訓(xùn)練和測試成本的成倍增加,考慮到模型的實用性,最終選取(51∶80,51∶80)區(qū)域圖像對模型進行訓(xùn)練。
表1 不同選取范圍的反演結(jié)果對比Tab.1 Inversion results comparison of different selected ranges
在訓(xùn)練網(wǎng)絡(luò)模型之前,對數(shù)據(jù)進行歸一化處理,有利于卷積神經(jīng)網(wǎng)絡(luò)進行特征提取。使用線性方法進行數(shù)據(jù)歸一化,選取像素區(qū)間為(51∶80,51∶80)的仿真圖像進行模型訓(xùn)練,分別采用點除10、100、1 000、10 000的線性歸一化方式,仿真數(shù)據(jù)的光學(xué)參數(shù)反演結(jié)果如表2所示,可以看出,點除10 000的歸一化效果最好。
表2 歸一化對預(yù)訓(xùn)練網(wǎng)絡(luò)分類結(jié)果的影響Tab.2 Effect of normalization method on classification results of pre-training network
因此,本文采用點除10 000的方式進行數(shù)據(jù)歸一化,歸一化結(jié)果作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,得到預(yù)訓(xùn)練模型,訓(xùn)練損失曲線如圖5所示,可以看出模型在迭代1 100次以后逐漸趨于平穩(wěn)。由于仿真數(shù)據(jù)是理想條件下生成的模擬數(shù)據(jù),數(shù)值分布較為一致,訓(xùn)練時模型收斂快,隨著迭代次數(shù)增加,損失值沒有較大波動。最終仿真數(shù)據(jù)光學(xué)參數(shù)反演結(jié)果中,吸收系數(shù)和散射系數(shù)的反演準確率均達到87%以上。
3.3.2基于實測數(shù)據(jù)的光學(xué)特性參數(shù)反演
遷移學(xué)習(xí)使模型具有更好的泛化能力,且可以有效解決過擬合問題,模型遷移是最常用的遷移方法之一。分別進行非遷移學(xué)習(xí)和模型遷移,并采用不同的參數(shù)學(xué)習(xí)方式進行訓(xùn)練,結(jié)果如表3所示。
表3 不同訓(xùn)練方式的光學(xué)參數(shù)反演測試集準確率Tab.3 Optical parameter classification accuracy of different training methods %
從表3可以看出,模型遷移只訓(xùn)練全連接層的測試準確率最低,原因是雖然預(yù)訓(xùn)練網(wǎng)絡(luò)的卷積層已經(jīng)具備提取圖像特征能力,但是模擬數(shù)據(jù)和實測數(shù)據(jù)分布不完全相同,僅訓(xùn)練改變?nèi)B接層無法達到理想效果,訓(xùn)練改變?nèi)繀?shù)則可以提升模型性能。因此,最終采用訓(xùn)練全部層的方式進行光學(xué)參數(shù)反演。
在模型遷移方法的基礎(chǔ)上引入MMD度量方法,基于MMD遷移方法的反演結(jié)果為:吸收系數(shù)μa測試集準確率為87.55%,散射系數(shù)μs測試集準確率為86.67%。與非遷移學(xué)習(xí)和簡單模型遷移相比,測試準確率有明顯提升。
由上述結(jié)果可知,非遷移學(xué)習(xí)方法測試準確率最低,這是由于實測訓(xùn)練數(shù)據(jù)較少,隨著訓(xùn)練次數(shù)增加損失值出現(xiàn)波動,導(dǎo)致最終的訓(xùn)練結(jié)果不理想。兩種遷移學(xué)習(xí)與非遷移學(xué)習(xí)相比均有更高的準確率,且大大縮短了模型收斂時間。因模擬數(shù)據(jù)與實測光譜數(shù)據(jù)仍存在一定差異,僅通過模型遷移不能達到理想效果,而基于MMD的遷移方法可以明顯提高測試準確率。
3.3.3葉綠素含量估測
根據(jù)文獻[25]的結(jié)果,卷積平滑S-G預(yù)處理對波段400~900 nm范圍的綠蘿葉片高光譜數(shù)據(jù)處理效果最好,可以有效消除原始高光譜圖像中的噪聲信息,因此采用S-G平滑方法對高光譜數(shù)據(jù)進行預(yù)處理。圖6a為400~900 nm范圍內(nèi)的高光譜原始圖像,數(shù)據(jù)噪聲較大;圖6b為經(jīng)過卷積平滑預(yù)處理后的高光譜圖像,可以看出,該方法有效去除了數(shù)據(jù)噪聲,并保證了數(shù)據(jù)的完整性,為特征波段的提取提供了良好的基礎(chǔ)。之后使用連續(xù)投影算法(SPA)對特征波段進行選擇,最終通過連續(xù)投影算法篩選的特征波長分別為59、77、97、128、167、305、348、420 nm。
為了驗證光學(xué)參數(shù)反演方法的必要性,利用光學(xué)參數(shù)、SPA篩選的高光譜數(shù)據(jù)以及遷移得到的深度特征分別構(gòu)建葉綠素含量預(yù)測模型,結(jié)果如圖7所示。使用光學(xué)參數(shù)對葉綠素含量進行回歸的結(jié)果為:回歸決定系數(shù)R2為0.884 2,均方根誤差為1.768 6;使用高光譜圖像對葉綠素含量進行回歸的結(jié)果為:回歸決定系數(shù)R2為0.869 0,均方根誤差為1.154 9。而利用本文提出的遷移方法得到的深度光學(xué)特性參數(shù)特征對葉綠素含量建模的結(jié)果為:R2為0.931 0,均方根誤差為0.837 4??梢钥闯?,結(jié)合了光譜信息和光學(xué)特性參數(shù)信息的深度特征預(yù)測效果最好。因此,由高光譜反演光學(xué)參數(shù)可以為綠蘿葉片的葉綠素含量檢測提供更好的方法。
(1)與采用實測數(shù)據(jù)直接訓(xùn)練相比,遷移學(xué)習(xí)方法縮短了模型的收斂時間,解決了因?qū)崪y數(shù)據(jù)不足而導(dǎo)致網(wǎng)絡(luò)模型預(yù)測效果不佳的問題,提升了網(wǎng)絡(luò)識別的準確率。與普通模型遷移方法相比,基于MMD遷移的綠蘿葉片光學(xué)參數(shù)反演方法具有更好的性能。
(2)基于面光源的蒙特卡洛模擬方法使實際所需樣本數(shù)量減少,降低了因獲取大量實測樣本而造成的人力物力成本消耗,面光源與點光源相比,能夠獲得更多圖像和光譜信息,進一步提升了模型的魯棒性。
(3)利用遷移學(xué)習(xí)方法得到的基于深度光學(xué)參數(shù)特征建立的綠蘿葉綠素含量回歸模型,其估測結(jié)果優(yōu)于基于高光譜圖像和光學(xué)參數(shù)構(gòu)建的回歸模型,證明了光學(xué)參數(shù)反演方法的有效性。