劉輝軍, 魏超宇, 韓 文, 姚 燕
中國計(jì)量學(xué)院計(jì)量測(cè)試工程學(xué)院, 浙江 杭州 310018
果實(shí)采收期的成熟度決定了水果最終食用品質(zhì)和商業(yè)價(jià)值, 選擇果實(shí)最佳的采收時(shí)間, 是降低水果損失率和提高水果品質(zhì)的關(guān)鍵。 近紅外光譜技術(shù)在水果品質(zhì)檢測(cè)領(lǐng)域已有大量成功應(yīng)用, 其快速、 無損的特點(diǎn), 非常適合用于水果生長狀態(tài)、 成熟度和采收期等方面的持續(xù)性檢測(cè), 盡管一直受到學(xué)者、 行業(yè)的重視, 但相關(guān)研究、 應(yīng)用進(jìn)展緩慢。
Sharpe等較早發(fā)現(xiàn)不同成熟度的梨、 西紅柿等漫反射光譜均呈現(xiàn)較大差異, 提出該技術(shù)可進(jìn)行水果成熟度檢測(cè)[1]。 Peris等通過商業(yè)采收前的天數(shù)確定蘋果的成熟度, 建立了蘋果采收期的光譜預(yù)測(cè)模型[2], 并且發(fā)現(xiàn)當(dāng)不同年份果實(shí)品質(zhì)的變異系數(shù)較小時(shí), 模型精度較高[3]。 Zude等利用NIRS技術(shù)對(duì)3個(gè)不同采收期的蘋果正確識(shí)別率為66%[4]。 Liew等經(jīng)催熟得到6個(gè)不同成熟度的香蕉并建立了其可溶性固形物含量(SSC)和硬度的近紅外光譜檢測(cè)模型, 結(jié)果表明單一成熟度模型精度較高, 多成熟度模型預(yù)測(cè)誤差增大[5]。 趙娟等利用多個(gè)品質(zhì)指標(biāo)提取蘋果成熟度SIQI指數(shù), 建立了蘋果成熟光譜檢測(cè)模型, 表明支持向量回歸(SVR)分類模型優(yōu)于極限學(xué)習(xí)機(jī)(ELM)[6]。 McCormick等開發(fā)了可用于田間的蘋果采收期檢測(cè)儀, 指出需結(jié)合大數(shù)據(jù)技術(shù), 氣候、 果樹負(fù)載和果徑等信息以提高檢測(cè)精度[7]。
受光照強(qiáng)度、 光質(zhì)等影響, 水果品質(zhì)個(gè)體差異大, 常用的化學(xué)計(jì)量學(xué)方法需進(jìn)行復(fù)雜的光譜預(yù)處理, 所建模型難以滿足不同季節(jié)、 果園等需求, 是影響近紅外光譜技術(shù)在水果采收期檢測(cè)領(lǐng)域應(yīng)用的主要原因。 卷積神經(jīng)網(wǎng)絡(luò)模擬人腦機(jī)制獲取信息, 可通過自學(xué)習(xí)逐級(jí)進(jìn)行特征提取, 在目標(biāo)檢測(cè)、 圖像分類和自然語言處理等領(lǐng)域取得了令人矚目的成績。 近年來, 利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行近紅外光譜處理也倍受關(guān)注。 有研究通過PCA方法構(gòu)建了樣本的協(xié)方差二維光譜矩陣, 利用CNNs方法進(jìn)行了近紅外光譜土壤含水率預(yù)測(cè), 結(jié)果表明不同訓(xùn)練樣本模型結(jié)果趨于一致。 Malek等將CNNs方法用于測(cè)量橙汁蔗糖含量、 葡萄酒中酒精含量和肉類脂肪含量的光譜檢測(cè), 實(shí)驗(yàn)表明當(dāng)訓(xùn)練樣本量較少時(shí), 粒子群優(yōu)化算法(PSO)優(yōu)于隨機(jī)梯度下降法[8]。 Bjerrum等用貝葉斯優(yōu)化算法調(diào)整網(wǎng)絡(luò)的超參數(shù), 利用CNN-GP結(jié)合樣本光譜擴(kuò)增建立了藥片中麻醉劑含量回歸模型, 模型表現(xiàn)了出較好的傳遞性能[9]。 魯夢(mèng)瑤等采用改進(jìn)的LeNet-5網(wǎng)絡(luò), 利用近紅外光譜進(jìn)行了煙葉產(chǎn)地的分類[10]。 Acquarelli等統(tǒng)計(jì)每次迭代后CNNs網(wǎng)絡(luò)最后一層神經(jīng)元的正系數(shù)頻次, 得到其特征分?jǐn)?shù), 表明對(duì)特征光譜區(qū)域的選擇有較好的解釋性[11]。 Cui等通過隨機(jī)抽取部分樣品光譜與CNNs輸出分類結(jié)果的相關(guān)系數(shù)得到模型的回歸系數(shù), 結(jié)果表明CNNs模型與PLS模型相比有更好的精度和更低的噪聲[12]。
本研究提出了利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行基于近紅外光譜的水果采收期檢測(cè)方法, 研究了黃花梨采收期的端對(duì)端檢測(cè), 采用了不同年份測(cè)試的樣品集, 分析了CNNs模型的解釋性和泛化能力, 并與偏最小二乘判別(PLSDA)方法結(jié)果進(jìn)行了比較。
樣品采自杭州市東部的商業(yè)果園, 實(shí)驗(yàn)前標(biāo)記了15棵樹形、 樹齡相近的果樹, 每次在果樹的東、 西、 南、 北和中方位隨機(jī)采集樣本。 最佳采收期根據(jù)果園當(dāng)年的商業(yè)采收期確定, 在商業(yè)采收期及前后間隔10 d左右進(jìn)行3次采樣, 分別定義成熟度為1, 2和3。 第一批樣品(2016年)每次收集130個(gè)樣本, 隨機(jī)選擇其中100個(gè)樣品歸入訓(xùn)練集, 其余30個(gè)歸入測(cè)試集, 共300個(gè)樣品組成訓(xùn)練集, 90個(gè)樣品組成測(cè)試集1。 第二批(2017年)樣品每次收集20個(gè)樣品, 共60個(gè)樣品組成測(cè)試集2。
實(shí)驗(yàn)采用MCS600(Zeiss, Germany)陣列式光纖光譜儀, 光源為CHL600(10 W), 結(jié)合自制積分球漫反射附件, 波長范圍為500~1 700 nm, 所用軟件為Aspect Plus。 沿果實(shí)赤道測(cè)量對(duì)其向光面、 背光面和任一側(cè)面的漫反射光譜, 取三個(gè)區(qū)域測(cè)量的平均光譜為樣品光譜。
1.3.1 一維卷積神經(jīng)網(wǎng)絡(luò)模型
光譜數(shù)據(jù)是一維信號(hào), 相鄰波長有強(qiáng)的相關(guān)性, 樣本量少的問題, 采用了包含5層的一維淺層卷積神經(jīng)網(wǎng)絡(luò), 包括1個(gè)輸入層、 2個(gè)卷積層、 1個(gè)池化層、 1個(gè)全連接層和1個(gè)softmax輸出層(見圖1), 采用誤差反向傳播算法結(jié)合隨機(jī)梯度下降法進(jìn)行層與層之間的連接權(quán)重調(diào)節(jié)。 在卷積層中利用多個(gè)卷積核提取不同屬性的光譜特征, 采用非飽和線性修正單元(rectified linearunits, ReLU)為激活函數(shù), 池化層采用Max-pooling方法進(jìn)行下采樣, 其有利于減少因樣本光譜平移、 旋轉(zhuǎn)產(chǎn)生的干擾, 保留主要特征并增大輸出特征的感受野。 為進(jìn)行不同光譜特征的融合, 使用卷積層代替LeNet等網(wǎng)絡(luò)中輸出層前普遍采用的全連接層, 實(shí)現(xiàn)了全卷積, 盡管在一維網(wǎng)絡(luò)中兩者具有相同的參數(shù)數(shù)量, 前者有更明確的物理意義。 輸出層使用了Softmax分類器, 將預(yù)測(cè)結(jié)果轉(zhuǎn)換為非負(fù)值, 輸出類別的歸一化概率, 得到黃花梨的采收期類別。
(1)
式(1)中,x為輸入向量,wi為第i個(gè)神經(jīng)元對(duì)應(yīng)的權(quán)重系數(shù),k為類別數(shù), 取3個(gè)類別。
Softmax分類器常采用交叉熵為損失函數(shù), 與傳統(tǒng)多層感知器相比, CNN網(wǎng)絡(luò)的參數(shù)少, 結(jié)合所用的網(wǎng)絡(luò)中神經(jīng)元數(shù)目也較少, 未采用隨機(jī)失活(dropout), 在損失(Loss)函數(shù)中加入了L2正則項(xiàng), 將網(wǎng)絡(luò)權(quán)重控制在較低的水平, 可降低模型的過度擬合并提高模型泛化能力。
(2)
CNNs網(wǎng)絡(luò)的權(quán)重采用隨機(jī)初始化, 利用第一批390個(gè)樣品以內(nèi)部交叉驗(yàn)證法進(jìn)行網(wǎng)絡(luò)參數(shù)的選擇。
圖1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
1.3.2 PLSDA
偏最小二乘判別方法(PLSDA)建立在PLS算法基礎(chǔ)上, 以二進(jìn)制類別變量取代目標(biāo)變量值, PLSDA計(jì)算光譜向量與類別向量的相關(guān)關(guān)系, 常用“1”和“0”來表示屬于或不屬于某一類, 一般取臨界值0.5來判定樣品的類歸屬。
相關(guān)系數(shù)法是近紅外光譜模型特征變量波長選擇方法, 常用于模型的解析, 通過計(jì)算光譜變量與被測(cè)量間的相關(guān)系數(shù), 系數(shù)越大表示對(duì)應(yīng)的波長所含信息量越大, 但其不適用于非線性模型。
互信息是機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的特征選擇中常用方法, 可衡量變量間的非線性關(guān)系, 互信息值越大表示兩個(gè)隨機(jī)變量相關(guān)程度越高, 可用于特征波長的篩選。
(3)
式(3)中,X為樣品任一波長的光譜反射率,Y為樣本類別,p(x,y)為兩個(gè)隨機(jī)變量X和Y的聯(lián)合概率分布函數(shù),p(x)和p(y)分別是X和Y的邊緣概率分布函數(shù), 利用校正集樣本波長變量與成熟度類別的平均互信息MI(X∶Y)計(jì)算CNNs模型中光譜變量與樣本類別的相關(guān)程度, 以減少互信息MI(x∶y)的隨機(jī)性。
采用訓(xùn)練集和測(cè)試集的判別正確率作為模型評(píng)價(jià)指標(biāo)。
CNNs模型基于Tensorflow平臺(tái)構(gòu)建, 利用Python完成編程。 PLSDA模型利用了PLS_toolbox_70工具箱。
PLSDA和CNNs方法模型采用了相同的訓(xùn)練集和測(cè)試集。 PLSDA模型中使用了Savitzky-Golay(SG)二階導(dǎo)數(shù)進(jìn)行光譜預(yù)處理, 選用的隱含變量個(gè)數(shù)為5。 當(dāng)訓(xùn)練次數(shù)為1 200時(shí), 模型達(dá)到穩(wěn)定。 表1為兩類模型對(duì)黃花梨采收期判別的結(jié)果, 訓(xùn)練集和測(cè)試集1正確識(shí)別率均為100%。 PLSDA模型對(duì)測(cè)試集2的采收期正確識(shí)別率降為41.67%, 最佳采收期的正確識(shí)別率僅為40%。 可見, 盡管PLSDA方法常被用于水果成熟度的檢測(cè), 但多未采用不同年份樣品對(duì)模型進(jìn)行測(cè)試。 采收期前后果實(shí)內(nèi)部品質(zhì)變化復(fù)雜, 不同年份果實(shí)品質(zhì)差異大, 同時(shí), 水果類物質(zhì)含水率高, 近紅外光譜譜峰重疊嚴(yán)重, PLSDA方法通過選擇隱含變量個(gè)數(shù)不能有效克服光譜數(shù)據(jù)的非線性影響, 難以提取樣本穩(wěn)健的光譜特征, 在同一年份測(cè)試集中往往有較好的效果, 但不適用于其他年份測(cè)試集[13], 模型不能用于不同年份黃花梨的采收期判別。 CNNs模型對(duì)測(cè)試集2的采收期正確識(shí)別率降為88.33%, 最佳采收期的正確識(shí)別率為85%, 錯(cuò)誤識(shí)別主要表現(xiàn)為相鄰采收期間的誤判, 對(duì)不同年份的黃花梨采收期判別有較好的精度。
表1 黃花梨采收期檢測(cè)結(jié)果
由于水果類樣品在可見-近紅外區(qū)域的光譜峰較寬, 為有利于提取譜峰信息, 第1個(gè)卷積層中使用的卷積核個(gè)數(shù)、 長度和步長分別為1~10, 3~50和1~15。 增加卷積核數(shù)量, 可以提取更多不同的光譜特征, 但當(dāng)樣品數(shù)量較少時(shí), 會(huì)降低網(wǎng)絡(luò)的泛化能力, 考慮所建的CNNs網(wǎng)絡(luò)規(guī)模以及訓(xùn)練樣品數(shù)量, 當(dāng)卷積核數(shù)為6、 長度為25、 步長為10時(shí), 模型達(dá)到最優(yōu)。 圖2為模型訓(xùn)練生成的6個(gè)卷積核, 分別如圖2(a)—(f)所示。
圖2 CNN模型中第1個(gè)卷積層的卷積核
由于激活函數(shù)、 池化等增加了卷積神經(jīng)網(wǎng)絡(luò)的非線性, 如何提高CNN模型可解釋性是深度學(xué)習(xí)領(lǐng)域的研究熱點(diǎn), 目前針對(duì)光譜處理中CNNs模型解釋性的研究較少。 Bjerrum[10]和Cui[12]和等指出, 適當(dāng)?shù)墓庾V預(yù)處理, 可減少CNNs模型的訓(xùn)練時(shí)間, 且對(duì)模型精度的影響較小, 本研究所建CNNs模型中未進(jìn)行光譜預(yù)處理。 由圖2(a,b,c)分別可以看出, 卷積核的作用類似于不同偏斜、 縮放的一階SG或分?jǐn)?shù)階微分, 且均含有大量的非零元素, 表現(xiàn)出較好的平滑性。 其中, 卷積核2和5的變化趨勢(shì)表明分別進(jìn)行前向和后向微分, 卷積后結(jié)果經(jīng)ReLU后輸出; 當(dāng)反射率增大時(shí), 卷積核3輸出的非零值減??; 當(dāng)反射率降低時(shí), 卷積核5輸出的非零值增大, 有利于在全波段中提取穩(wěn)定的光譜特征。 在模型訓(xùn)練中, 卷積核參數(shù)被不斷優(yōu)化, 較傳統(tǒng)方法選擇光譜預(yù)處理節(jié)省了的大量人力, 其可解釋性尚待進(jìn)一步研究, 后者則有較明確的物理意義。
兩類模型訓(xùn)練集樣本波長變量與輸出采收期類別間的回歸系數(shù)如圖3, 其中, (a)為黃花梨的平均光譜。 PLSDA和CNNs模型的回歸系數(shù)曲線均含有一定噪聲, 可能由果形變化等因素引起, 但兩者呈現(xiàn)較大差異[如圖3(b)和(c)所示]。 在PLSDA模型中, 與黃花梨成熟度相關(guān)性大的波長主要集中在可見光波段, 800~1 700 nm范圍內(nèi)相關(guān)系數(shù)接近零, 主要反映了果實(shí)成熟期葉綠素、 花青素等含量的變化。 在CNNs模型中, 互信息在0.31~0.42呈較均勻分布, 除可見光波段, 在1 430 nm附近互信息也較強(qiáng), 對(duì)應(yīng)水分的一階倍頻吸收區(qū)域, 主要反映水果的干物質(zhì)(DM)含量, DM是進(jìn)行水果成熟度檢測(cè)中常用指標(biāo), 800~1 200 nm區(qū)域多用于可溶性固形物含量(SSC)相關(guān)的檢測(cè), SSC易受冠層條件、 氣候等影響, 其較少用做成熟度單一評(píng)價(jià)指標(biāo)。 980 nm附近對(duì)應(yīng)水分的二階倍頻吸收, 互信息較低。
PLSDA模型中所用相關(guān)波長變量較少, 不能充分反映果實(shí)采收期品質(zhì)變化, 模型易出現(xiàn)過擬合, CNNs模型則較好地利用了樣品的全波段信息, 有效避免了模型的過擬合, 且波長變量與黃花梨采收期主要品質(zhì)變化有較好的相關(guān)性及可解釋性。
圖3 PLSDA, CNNs模型的回歸系數(shù)
提出一種基于全卷積神經(jīng)網(wǎng)絡(luò)的黃花梨采收期近紅外光譜檢測(cè)方法。 設(shè)計(jì)了一種5層的一維卷積神經(jīng)網(wǎng)絡(luò), 采用交叉熵結(jié)合L2正則項(xiàng)為損失函數(shù), 無光譜預(yù)處理, 實(shí)現(xiàn)了黃花梨采收期的端到端檢測(cè), 有利于實(shí)現(xiàn)水果分期分批的精細(xì)化采收。
(1)利用卷積神經(jīng)網(wǎng)絡(luò)良好的自學(xué)習(xí)功能可有效地提取光譜特征, 避免了復(fù)雜的光譜預(yù)處理。 通過對(duì)PLSDA和CNNs模型的相關(guān)系數(shù)、 互信息的分析, CNNs模型結(jié)合與樣品波長變量有較好的相關(guān)度, 能較好地反映黃花梨采收期主要品質(zhì)變化, 且有較好的可解釋性。
(2)結(jié)果表明與PLSDA方法相比, CNNs模型有較強(qiáng)的泛化能力, 對(duì)不同年份樣品采收期正確識(shí)別率達(dá)到88.33%, 有效克服了不同年份樣品品質(zhì)變化對(duì)模型的影響。
(3)進(jìn)一步結(jié)合果園管理、 物候等先驗(yàn)信息, 將有利于加快近紅外光譜技術(shù)在水果采收期、 成熟度檢測(cè)方面的實(shí)際應(yīng)用。