劉燕德, 廖 軍, 李 斌, 姜小剛, 朱明旺, 姚金良, 王 秋
華東交通大學(xué)機(jī)電與車(chē)輛工程學(xué)院, 智能機(jī)電裝備創(chuàng)新研究院, 江西 南昌 330013
貢梨是一種受人喜愛(ài)的水果, 以皮薄多汁、 味濃甘甜而聞名。 貢梨中的可溶性固形物含量是影響貢梨品質(zhì)的重要內(nèi)部屬性之一, 也是決定水果成熟度和收獲時(shí)間的關(guān)鍵參數(shù)之一。 因此, 開(kāi)發(fā)無(wú)損、 快速的貢梨可溶性固形物含量的檢測(cè)方法來(lái)滿足消費(fèi)者對(duì)穩(wěn)定、 優(yōu)質(zhì)水果日益增長(zhǎng)的需求具有重要的價(jià)值。 近紅外光譜技術(shù)能夠?qū)崿F(xiàn)食品的無(wú)損檢測(cè)分析, 而且?guī)缀醪恍枰獙?duì)樣品進(jìn)行處理即可進(jìn)行檢測(cè), 不會(huì)產(chǎn)生廢物, 并允許同時(shí)評(píng)估幾種成分[1]。 近紅外在線檢測(cè)已被應(yīng)用于測(cè)定梨[2]、 橙子[3]、 橄欖[4]、 蘋(píng)果[5]等水果的SSC。
水果的物理性質(zhì)如顏色[6]、 溫度[7]、 靜止位置[8]、 移動(dòng)速度[9]等在檢測(cè)過(guò)程中可能會(huì)對(duì)光譜信息采集有很大影響, 除這些物理性質(zhì)以外, 測(cè)量方向也是影響光譜信息采集的重要因素之一。 Yu等[10]研究了基于近紅外光譜的紅富士蘋(píng)果果實(shí)方位變化對(duì)可溶性固形物在線預(yù)測(cè)的影響; 韓東海等[11]比較了3種果實(shí)方向即莖-花萼軸水平、 莖-花萼軸垂直、 莖向上和莖向下在線檢測(cè)蘋(píng)果中的SSC, 基于莖-花萼軸垂直、 莖向上的方向得到了較好的結(jié)果; 在透射模式下, 基于莖萼軸水平方向檢測(cè)梨褐心得到了較好的結(jié)果[12], 莖萼軸垂直取向也獲得了測(cè)量蘋(píng)果的SSC和硬度的良好結(jié)果。 如今近紅外在線檢測(cè)水果內(nèi)部品質(zhì)的設(shè)備多采用局部模型對(duì)水果進(jìn)行預(yù)測(cè), 由于局部模型是利用單個(gè)局部方向獲得的光譜數(shù)據(jù)單獨(dú)開(kāi)發(fā)的, 在預(yù)測(cè)其他水果方向上的SSC時(shí), 其精度會(huì)大打折扣。 目前解決該問(wèn)題主要依靠人工擺正果位或增加擺正機(jī)構(gòu), 費(fèi)錢(qián)費(fèi)力。 建立一個(gè)基于全方向的全局模型也許能夠解決上面的問(wèn)題, 也還沒(méi)有人將全局模型應(yīng)用于近紅外在線漫透射檢測(cè)裝備來(lái)預(yù)測(cè)不同方向運(yùn)送下的貢梨SSC。
本研究利用課題組自主研發(fā)的在線漫透射檢測(cè)裝備采集六個(gè)不同檢測(cè)方向下的貢梨光譜, 使用Savitzky-Golay卷積平滑、 多元散射校正MSC、 高斯濾波平滑GFS對(duì)平均后的150貢梨光譜進(jìn)行預(yù)處理, 對(duì)光譜進(jìn)行修正和優(yōu)化, 最后通過(guò)偏最小二乘回歸PLSR建立了六個(gè)局部模型和一個(gè)全局模型。 六個(gè)方向的預(yù)測(cè)集分別對(duì)七個(gè)模型進(jìn)行預(yù)測(cè), 對(duì)預(yù)測(cè)結(jié)果進(jìn)行比較并評(píng)判各局部模型與全局模型的魯棒性。 為全局模型是否能夠應(yīng)用于近紅外在線漫透射檢測(cè)裝備提供參考。
于2021年四月下旬在中國(guó)南昌某水果超市購(gòu)買(mǎi)150個(gè)貢梨, 150個(gè)貢梨均沒(méi)有表面缺陷或污染物。 貢梨的赤道直徑范圍為85~95 mm, 所有樣品都單獨(dú)清洗并編號(hào); 實(shí)驗(yàn)前把樣品放在實(shí)驗(yàn)室儲(chǔ)存24 h, 使貢梨溫度與實(shí)驗(yàn)室溫度一致, 以減少溫度對(duì)預(yù)測(cè)精度的影響。
將150個(gè)樣本隨機(jī)分配到校準(zhǔn)集和預(yù)測(cè)集。 選擇115個(gè)樣本作為用于開(kāi)發(fā)校準(zhǔn)模型的校準(zhǔn)集, 其余35個(gè)樣本用作預(yù)測(cè)集來(lái)驗(yàn)證校準(zhǔn)模型的預(yù)測(cè)性能。
樣品的漫透射光譜由本課題組自主研發(fā)的水果內(nèi)部品質(zhì)近紅外漫透射光譜在線檢測(cè)裝備(圖1)測(cè)得[13]。
使用反射率超過(guò)95%的聚四氟乙烯制成的直徑φ=90 mm的白色球體測(cè)量參考光譜。 參考測(cè)量三次, 計(jì)算平均光譜作為最終的Rwhite。 當(dāng)所有的燈都關(guān)了, 燈的入口打開(kāi)時(shí), 收集暗光譜Rdark。
圖1 水果內(nèi)部品質(zhì)近紅外漫透射光譜在線檢測(cè)裝備示意圖
如圖2所示[14], 莖-花萼軸垂直, 莖向上(A1)和莖向下(A5), 莖-花萼軸和水平之間45°, 莖向上傾斜(A2)和莖向下傾斜(A4), 莖-花萼軸水平, 莖朝向右側(cè)光(A3), 莖花萼軸水平, 莖朝向帶移動(dòng)方向(A6)。 實(shí)驗(yàn)前隨機(jī)選取了60個(gè)貢梨, 讓它們從上一傳送通道上隨機(jī)傳過(guò)來(lái), 貢梨在果杯上的位置都在這六個(gè)方向附近, 這可能是因?yàn)樨暲姹旧淼慕Y(jié)構(gòu)造成的。 且兩排光源以果杯為基準(zhǔn)為對(duì)稱(chēng)光源, 這六個(gè)方向相當(dāng)于一個(gè)大區(qū)間, 從上一傳送通道上傳過(guò)來(lái)的貢梨在果杯上的位置都在這一區(qū)間內(nèi)。
圖2 漫透射檢測(cè)機(jī)構(gòu)(a)及貢梨擺放位置(b)
分別在六個(gè)方向測(cè)量光譜數(shù)據(jù), 光譜數(shù)據(jù)按A1, A2, A3, A4, A5和A6的順序采集。 用手將每個(gè)樣品穩(wěn)定地放在水果盤(pán)上。 本課題組自主研發(fā)的水果內(nèi)部品質(zhì)近紅外漫透射光譜在線檢測(cè)裝備(圖1)能夠保證運(yùn)行平穩(wěn), 果杯上的貢梨震感極弱, 在傳送貢梨的過(guò)程中可以保證貢梨的平穩(wěn)傳送。 僅保留346~1 125 nm的光譜數(shù)據(jù), 由1 044個(gè)數(shù)據(jù)點(diǎn)即光譜變量組成, 用于進(jìn)一步分析。 然后, 原始光譜Rraw根據(jù)式(1)轉(zhuǎn)換為校準(zhǔn)光譜R:
(1)
考慮到貢梨形狀的不規(guī)則性, 為了減少操作人員和儀器引入的誤差, 提高信噪比, 在每個(gè)水果方位采集三個(gè)光譜, 樣品繞莖萼軸旋轉(zhuǎn)0°, 120°和240°, 對(duì)三個(gè)光譜進(jìn)行平均得到平均光譜。 樣品以30 cm·s-1的速度由傳送帶傳送, 同時(shí)所有光譜數(shù)據(jù)存儲(chǔ)在工業(yè)計(jì)算機(jī)中。
在光譜采集之后, 立即通過(guò)傳統(tǒng)的破壞性試驗(yàn)確定SSC值。 手動(dòng)擠壓每個(gè)完整樣品的汁液, 并將其滴到日本東京ATAGO有限公司生產(chǎn)的數(shù)字折光儀PAL-1上(測(cè)量精度為Brix±0.2%, 且具有溫度補(bǔ)償功能, 適用溫度范圍10~40 ℃), 以測(cè)量SSC值, 繞莖萼軸旋轉(zhuǎn)0°, 120°和240°, 為每個(gè)樣品收集三個(gè)SSC值, 并根據(jù)這三個(gè)值來(lái)獲取平均值。
由于采集的光譜可能包含無(wú)用的背景信息或噪聲, 而光譜預(yù)處理往往可以提高模型的性能。 采用不同的預(yù)處理方法對(duì)原始光譜數(shù)據(jù)進(jìn)行預(yù)處理, 包括Savitzky-Golay卷積平滑SGS、 多元散射校正MSC和高斯濾波平滑GFS等來(lái)優(yōu)化原始光譜數(shù)據(jù)。 SGS可以有效減少光譜的噪聲并提高信噪比, 多元散射校正MSC可以消除水果內(nèi)部不均導(dǎo)致的散射效應(yīng); 高斯濾波GFS可以消除光譜中的隨機(jī)噪聲。
偏最小二乘回歸PLSR是一種無(wú)監(jiān)督的多變量統(tǒng)計(jì)分析方法[15], 被廣泛應(yīng)用于NIRS分析研究, 具有較強(qiáng)的抗干擾性。 PLSR的目的是通過(guò)將光譜矩陣與濃度向量投影到新的潛在空間, 使其中的潛在變量之間的協(xié)方差最大化, 并最終執(zhí)行潛變量線性回歸模型。
為了全面檢驗(yàn)測(cè)量方向?qū)ω暲鍿SC光譜分析的影響, 使用PLSR分別為每個(gè)方向和所有方向數(shù)據(jù)集建立SSC模型, 即局部模型與全局模型。 每個(gè)局部模型都是由該方向上的115個(gè)校正集光譜數(shù)據(jù)建立的。 因此, 分別建立了六個(gè)局部模型, 如圖3, 校正集用長(zhǎng)方形表示, 預(yù)測(cè)集用圓形表示; 在局部模型中, 實(shí)線所指為本方向的預(yù)測(cè)集對(duì)該模型進(jìn)行驗(yàn)證; 虛線為其他方向的預(yù)測(cè)集對(duì)該模型進(jìn)行驗(yàn)證, 這是為了評(píng)估局部模型的魯棒性。 一些物理性質(zhì)的全局模型已經(jīng)成功地用于減少色差[8]、 溫度波動(dòng)[9]和生物可變性對(duì)近紅外模型性能的影響。 在本研究中, 全局模型中的校正集由六個(gè)方向的校正集數(shù)據(jù)組成, 總共包括690個(gè)光譜。 為了驗(yàn)證全局模型的預(yù)測(cè)能力, 分別用六個(gè)預(yù)測(cè)集對(duì)全局模型進(jìn)行驗(yàn)證。 比較七個(gè)模型的性能, 選擇出魯棒性最好的模型。
圖3 局部模型、 全局模型的建立以及實(shí)驗(yàn)驗(yàn)證方案
根據(jù)校準(zhǔn)和預(yù)測(cè)的相關(guān)系數(shù)、 校準(zhǔn)的均方根誤差RMSEC、 預(yù)測(cè)的均方根誤差RMSEP來(lái)評(píng)估校準(zhǔn)模型的性能。Rc,Rp, RMSEC和RMSEP的計(jì)算定義如式(2)—式(5)
(2)
(3)
(4)
(5)
其中,ypi為第i個(gè)水果的SSC的預(yù)測(cè)值,ymi為第i個(gè)貢梨SSC的實(shí)測(cè)值,ymeanc和ymeanp分別為校準(zhǔn)集和預(yù)測(cè)集中SSC的平均值,nc和np分別為校準(zhǔn)集和預(yù)測(cè)集中水果個(gè)數(shù)。 一般來(lái)說(shuō), 選擇一個(gè)好的模型, 不僅要根據(jù)較高的Rc和Rp, 較低的RMSEC和RMSEP, 還要根據(jù)RMSEC和RMSEP之間的微小差異來(lái)選擇。
在150個(gè)貢梨中隨機(jī)選取第11號(hào)果, 如圖4所示為11號(hào)果在A1—A6六個(gè)方向上獲得的346~1 125 nm的漫透射平均原始光譜。 由圖4可知, A1方向的漫透射光譜的能量明顯強(qiáng)于其他方向, 處于其他方向的漫透射光譜上方; 其他方向的漫透射光譜的能量由強(qiáng)到弱依次是A5, A6, A2, A3和A4, 其中A6, A2, A3和A4的漫透射光譜的能量相差不大; 各方向的漫透射光譜的能量不同可能與貢梨所受的有效光源照射面積有關(guān), 其中A1與A5所受的有效光源照射面積最大。 從六個(gè)方向所采集的光譜的吸收峰和波谷所處的波段大致相同, 只是光強(qiáng)大小不同。 其中波谷在750 nm附近, 在710與800 nm附近各有一個(gè)波峰。 750 nm附近的波谷可能由O—H三倍頻伸縮振動(dòng)導(dǎo)致。
圖4 11號(hào)果六個(gè)方向的平均光譜圖
表1為六個(gè)方向的校正集和預(yù)測(cè)集可溶性固形物的范圍, 標(biāo)準(zhǔn)偏差和平均值。 從表1可看出含115個(gè)樣本的校正集的可溶性固形物含量的范圍大于含35個(gè)樣本的預(yù)測(cè)集的可溶性固形物含量的范圍。
表1 校正集和預(yù)測(cè)集中可溶性固形物SSC含量的范圍、 標(biāo)準(zhǔn)偏差和平均值
以A1方向?yàn)槔?用在A1方向采集的115個(gè)校正集光譜數(shù)據(jù)建立模型, 再用另外35個(gè)預(yù)測(cè)集數(shù)據(jù)對(duì)其進(jìn)行局部驗(yàn)證。 其他五個(gè)方向同理建立模型并進(jìn)行驗(yàn)證。 每種預(yù)處理方法側(cè)重的方面都有所不同, 因此對(duì)原始光譜用不同的預(yù)處理方法會(huì)有不同的效果, 為了有效減少光譜的噪聲并提高信噪比, 使用SGS對(duì)六個(gè)局部模型進(jìn)行預(yù)處理; 考慮到水果內(nèi)部不均易導(dǎo)致散射效應(yīng), 采用MSC對(duì)六個(gè)局部模型進(jìn)行預(yù)處理; 由于光譜中的隨機(jī)噪聲, 選用GFS對(duì)六個(gè)局部模型進(jìn)行預(yù)處理。 表2記錄了使用SGS, MSC和GFS預(yù)處理后結(jié)合PLSR建立的模型以及預(yù)測(cè)結(jié)果。 可以發(fā)現(xiàn), 六個(gè)方向的原始數(shù)據(jù)使用SGS和MSC預(yù)處理后建立的PLSR模型, 它們的Rc和Rp都會(huì)有所減小, 校正集和預(yù)測(cè)集的RMSE大多都會(huì)變大; 當(dāng)使用GFS分別對(duì)六個(gè)方向原始數(shù)據(jù)預(yù)處理后, A1, A2, A4, A5和A6的Rc會(huì)變小,Rp會(huì)變大, 這就使得校正集和預(yù)測(cè)集的相關(guān)系數(shù)更接近, 擬合性更好。 因此, 結(jié)果表明通過(guò)GFS預(yù)處理后建立的六個(gè)局部模型比用其他兩種預(yù)處理后建立的結(jié)果更好。
表2 六個(gè)方向的局部模型與局部預(yù)測(cè)效果
將經(jīng)過(guò)GFS預(yù)處理后的光譜建立的六個(gè)局部模型及驗(yàn)證結(jié)果進(jìn)行比較, 可以發(fā)現(xiàn)在A3方向的預(yù)測(cè)效果最好, 它的Rc和Rp分別是0.913和0.872, RMSEC和RMSEP分別為0.397和0.342。 A6方向的局部模型的局部預(yù)測(cè)效果最差, 它的Rc和Rp分別是0.831和0.794, RMSEC和RMSEP分別為0.534和0.508。 結(jié)果表明, 貢梨SSC局部模型在相同方向上的預(yù)測(cè)效果非常好。 但是在線檢測(cè)時(shí), 如果沒(méi)有機(jī)構(gòu)或人工擺正水果的位置, 水果在經(jīng)過(guò)檢測(cè)裝置時(shí)不可能只是單一方向的。 因此, 要想證明局部模型該情況下的效果, 還需要看其他五個(gè)方向的預(yù)測(cè)集對(duì)其進(jìn)行驗(yàn)證的效果。
使用A1—A6六個(gè)方向上的690個(gè)校正集數(shù)據(jù)建立全局模型, 各方向的預(yù)測(cè)集分別對(duì)全局模型進(jìn)行驗(yàn)證。 然而從表3和表4中可以看到, 經(jīng)過(guò)GFS預(yù)處理后建立的PLSR模型, 校正集與各個(gè)方向的預(yù)測(cè)集的擬合性變好; 校正集的Rc為0.828, A1, A2, A3, A4, A5和A6的Rp分別為0.818, 0.765, 0.799, 0.821, 0.794和0.824, 校正集的RMSEC為0.424, RMSEP分別為0.446, 0.525, 0.478, 0.538, 0.486和0.619, 可以看出全局模型對(duì)各個(gè)方向都有較好的預(yù)測(cè)效果。
表3 全局模型以及A1, A2和A3方向預(yù)測(cè)效果
為了進(jìn)一步評(píng)估全局模型對(duì)全方向模型的預(yù)測(cè)效果, 把六個(gè)方向的預(yù)測(cè)集合成一個(gè)預(yù)測(cè)集, 再對(duì)全集模型進(jìn)行驗(yàn)證, 該預(yù)測(cè)集的Rp和RMSEP分別為0.748和0.548, 結(jié)果表明依舊有較好的預(yù)測(cè)效果。 圖3為貢梨SSC測(cè)量真值與預(yù)測(cè)值的散點(diǎn)圖。
表4 全局模型以及A4, A5和A6方向預(yù)測(cè)效果
圖5 全方向驗(yàn)證散點(diǎn)圖
用六個(gè)方向的預(yù)測(cè)集數(shù)據(jù)分別對(duì)A1, A2, A3, A4, A5和A6的局部模型和全局模型進(jìn)行驗(yàn)證。 如表5和表6, 局部模型雖然對(duì)本方向的預(yù)測(cè)效果很好, 但是對(duì)于其他方向的預(yù)測(cè)效果卻很差, 例如局部模型A1預(yù)測(cè)A2, A3, A4和A5的RMSEP分別為1.431, 0.816, 0.767和1.015; 局部模型A2預(yù)測(cè)A1, A4, A5和A6的Rp均在0.1以下, 不可信賴(lài); 其他局部模型均有類(lèi)似情況。 在線檢測(cè)時(shí)如果沒(méi)有人工對(duì)水果進(jìn)行方向調(diào)整或者沒(méi)有設(shè)計(jì)制造調(diào)整方向的擺正機(jī)構(gòu), 那么局部模型是不具備在線檢測(cè)能力的, 局部模型在驗(yàn)證其他方向時(shí)所表現(xiàn)出來(lái)的魯棒性太差。 六個(gè)方向的預(yù)測(cè)集對(duì)全局模型進(jìn)行驗(yàn)證的效果雖不如局部模型預(yù)測(cè)本方向時(shí)的驗(yàn)證效果, 但是效果都還不錯(cuò), 全局模型的校正集Rc為0.828, RMSEC為0.424; A1, A2, A3, A4, A5和A6方向的預(yù)測(cè)集分別為0.818, 0.765, 0.799, 0.821, 0.794和0.824, RMSEP分別為0.446, 0.525, 0.478, 0.538, 0.486和0.619; 結(jié)果表明六個(gè)方向的Rp與Rc均比較接近且均在0.800左右, RMSEC與RMSEP均在0.500左右, 因此全局模型在驗(yàn)證六個(gè)方向時(shí)是魯棒的。 但是總體來(lái)看R都只有0.8左右, 這可能是因?yàn)樨暲媪鶄€(gè)方向上的SSC含量分布不均勻, 而本實(shí)驗(yàn)所測(cè)得的SSC含量真值為貢梨整果的平均SSC含量真值。
表5 局部模型和全局模型對(duì)A1, A2, A3方向預(yù)測(cè)集的預(yù)測(cè)效果
表6 局部模型和全局模型對(duì)A4, A5和A6預(yù)測(cè)集的預(yù)測(cè)效果
采用本課題組自主研發(fā)的水果內(nèi)部品質(zhì)近紅外漫透射光譜在線檢測(cè)裝備采集150個(gè)貢梨六個(gè)方向的光譜, 研究了光譜測(cè)量方向的變化對(duì)貢梨SSC在線測(cè)定的影響。 使用GFS預(yù)處理后通過(guò)PLSR建立的模型效果都比較好, 局部模型能夠很好的預(yù)測(cè)本方向的貢梨SSC, 全局模型可以較好的預(yù)測(cè)全方向的貢梨SSC。 通過(guò)建立局部模型和全局模型并分別用六個(gè)方向的預(yù)測(cè)集對(duì)它們進(jìn)行驗(yàn)證, 結(jié)果表明樣品的檢測(cè)方向極大地影響了貢梨SSC的預(yù)測(cè)精度, 局部模型的魯棒性差; 全局模型與局部模型相比, 基于所有方向的全局模型獲得了更準(zhǔn)確的預(yù)測(cè)結(jié)果, 六個(gè)方向的Rp與Rc均比較接近且均在0.800左右, RMSEC與RMSEP均在0.500左右, 魯棒性更好。 因此, 全局模型將有助于消除光譜測(cè)量中測(cè)量方向的影響, 實(shí)現(xiàn)貢梨SSC的整體方向在線檢測(cè), 這對(duì)近紅外在線檢測(cè)工業(yè)化有實(shí)際意義。