楊曉玉YANG Xiao-yu 丁佳興 - 房盟盟 - 何建國 n-
(寧夏大學農(nóng)學院,寧夏 銀川 750021)
雞蛋新鮮度與蛋品品質密切相關,是加工企業(yè)和消費者最為關注的蛋品指標[1-2]。
近年來,國內(nèi)外不少學者在無損檢測雞蛋新鮮度方面做了大量研究和探索。目前實現(xiàn)對雞蛋新鮮度無損檢測的有機器視覺[3-4]、近紅外光譜[5-7]、電子鼻[8]和高光譜檢測法[9-11]等。其中機器視覺法只采集雞蛋圖像,根據(jù)雞蛋形狀特性和顏色特征參數(shù)對雞蛋新鮮度進行檢測;近紅外光譜技術光譜變量多,數(shù)據(jù)量大,并且檢測部位較為局限,且選擇點的位置和數(shù)量較為隨機和片面[12];電子鼻檢測相對光學法耗時較長,適用于抽樣檢測。高光譜成像技術是集圖像和光譜于一體的多信息融合技術。高光譜圖像采集后,選取整個雞蛋表面作為感興趣區(qū)域,用平均光譜反映樣本,代表性強,相關性好,滿足快速、無損、準確檢測雞蛋新鮮度的要求。
本研究以雞蛋為研究對象,選用哈夫單位作為雞蛋新鮮度標準,利用可見/近紅外高光譜成像技術采集樣品400~1 000 nm 的光譜數(shù)據(jù)。首先利用蒙特卡洛法剔除異常樣本,再使用卷積平滑(Savitzky-Golay Smoothing, SGS)、標準正態(tài)變量變換(Standardized Normal Variate,SNV)、基線校準(Baseline)和去趨勢(Detrend) 法對原始光譜進行預處理,根據(jù)建立的PLSR模型效果優(yōu)選預處理方法。然后應用CARS、 GAPLS 和 IRF提取特征波長,分別建立基于全光譜和特征波長的PLSR 和 LS-SVM 的雞蛋新鮮度預測模型;分析比較不同特征波長選取和建模方法對雞蛋新鮮度的預測效果,選出最優(yōu)模型,為高光譜成像技術對雞蛋新鮮度檢測提供參考和技術支持。
雞蛋:為同批海蘭褐雞所產(chǎn)新鮮蛋,購于寧夏某雞場,樣本共150個,常溫儲藏;
高光譜成像儀:V10E-QE型,芬蘭Specim公司;
CCD相機:C8484-05G型,日本Hamamatsu公司;
光纖鹵素燈:DCRⅢ型,150 W,美國Schott公司;
電控位移平臺:SC300-1A型,北京卓立漢光儀器有限公司;
可見-近紅外高光譜成像系統(tǒng):400~1000 nm,光譜分辨率2.5 nm,125個波段。該系統(tǒng)由高光譜成像儀、CCD相機、光纖鹵素燈、電控位移平臺組成,見圖1。
1.2.1 高光譜圖像采集 選取大小均勻,表面無雜物的雞蛋作為最終試驗樣本,共選出126個。每天隨機取出10個雞蛋,編號,掃描其高光譜圖像。為保證圖像清晰,需試驗確定高光譜參數(shù),最終確定參數(shù):相機曝光時間設為10 ms,物鏡高度為385 mm,電控位移平臺速度為15 mm/s。由于暗電流和噪聲的影響,需要對采集的高光譜圖像進行黑白校正[13],首先采集聚四氟乙烯板的全反射圖像Rw,然后蓋上鏡蓋,采集全黑圖像Rd。黑白校正公式為:
(1)
式中:
I——校正后的高光譜反射圖像,%;
R——樣本原始的高光譜反射圖像;
Rd——全黑圖像;
Rw——白板的高光譜反射圖像。
獲得樣本高光譜圖像后,利用ENVI 4.8軟件選取雞蛋橢圓表面作為感興趣區(qū)域(Region of Interest,ROI),計算出每張ROI的平均反射光譜作為樣本的反射光譜。
1.2.2 雞蛋新鮮度測定 光譜采集后的雞蛋,按編號逐個放入精度為0.001 g的電子天平稱重,然后破殼,用0.02 mm的游標卡尺測量距離蛋黃1 cm處蛋白高度3次,測定時要選準位置,取平均值為最終蛋白高度,代入哈夫值(Ha)公式計算新鮮度[14-15]:
Ha=100×lg(h-1.7w0.37+7.57),
(2)
式中:
Ha——哈夫值;
h——平均蛋白高度,mm;
w——雞蛋重量,g。
1.2.3 樣本劃分方法 采用Galvao等[16]提出的SPXY(Sample Set Partitioning Based on Joint X-Y distance)法。該方法的優(yōu)點是將變量X和Y均考慮在內(nèi),能夠有效地覆蓋多維向量空間, 從而改善所建模型的預測能力。
1.2.4 異常樣本剔除 由于高光譜成像儀的精度限制和噪聲等因素的影響,獲得的高光譜圖像不可避免地存在一小部分異常樣本。異常樣本的存在影響了模型穩(wěn)定性和預測能力,所以剔除異常樣本對提高模型效果非常重要。本試驗采用蒙特卡洛采樣法[17-18]對全部樣本進行異常樣本檢測。
1.2.5 光譜數(shù)據(jù)處理方法 雞蛋新鮮度快速無損檢測的實現(xiàn)需要一個穩(wěn)定性高、預測能力強的模型,本試驗選用PLSR和LS-SVM 2種建模方法對雞蛋新鮮度進行預測。
由于在不同波長下光源的強度不均勻、儀器噪音等因素的影響,需要對原始光譜數(shù)據(jù)進行預處理。本試驗選取SGS、SNV、Baseline和Detrend預處理方法對光譜進行處理。
由于高光譜采集過程受到多種外界因素干擾,獲得的光譜信息中會存在一些像基線漂移、噪聲等無用信息,并且全光譜共125個波長,信息量大,處理速度慢,選用適當?shù)姆椒ㄌ蕹幌嚓P或者非線性變量,實現(xiàn)用少數(shù)關鍵變量代替全光譜,達到降低模型運算量和復雜度、提高模型穩(wěn)定性和預測準確性的目的。本試驗選用CARS、GAPLS和IRF法提取特征波長。其中光譜預處理和建立PLSR模型在The Unscrambler X 10.4軟件上實現(xiàn),其余算法在Matlab R2014a軟件上完成。
采用蒙特卡洛方法檢測異常樣本,運行之前首先建立基于全部126個樣本的PLSR模型,確定RMSECV最小時對應的主成分數(shù)最優(yōu)為11,預處理方法設置為Mean center;抽樣次數(shù)設置為2 500次,蒙特卡洛抽樣所得校正集與測試集比例為3∶1,預測誤差均值和標準差閾值分別取各自平均值的2.5 倍。雞蛋哈夫值蒙特卡洛異常樣本檢測結果見圖2。
由圖2可知,10號、22號、31號、79號和123號的預測誤差均值均大于總體樣本預測誤差均值閾值,判定上述樣本為異常樣本,剔除這些樣本后,建立PLSR模型,所得模型的交互驗證系數(shù)Rcv為0.827大于原始樣本模型(0.793);交互驗證均方根誤差RMSECV為2.642小于原始樣本模型(2.927)。71號樣本在閾值線上,假定它為異常樣本,剔除71號樣本建立PLSR模型發(fā)現(xiàn)模型交互驗證系數(shù)Rcv為0.833,交互驗證均方根誤差RMSECV為2.589。因此,10號、22號、31號、71號、79號和123號均為異常樣本,剔除后剩余120個作為后續(xù)處理樣本。
利用SPXY法將樣本按3∶1劃分校正集和預測集,校正樣本90個,預測樣本30個,雞蛋樣本哈夫值及重量統(tǒng)計見表1。由表1可知,校正集樣本中哈夫值最大值大于預測集,最小值小于預測集,即校正集哈夫值范圍較大,說明劃分合理。
基于4種預處理方法的雞蛋哈夫值的PLSR模型結果統(tǒng)計見表2。由表2可知,所有預處理后的光譜的PLSR模型的Rc均小于原始光譜的PLSR模型,經(jīng)SNV預處理的PLSR模型的RMSECV最低,且最優(yōu)主成分數(shù)為7低于其他模型,說明經(jīng)SNV預處理的PLSR模型較為穩(wěn)定,確定SNV為最優(yōu)預處理方法。圖3為經(jīng)SNV預處理后的反射光譜。
2.4.1 利用CARS提取特征波長 運行CARS之前,首先確定PLSR模型中最優(yōu)主成分數(shù)為7。設定CARS參數(shù):蒙特卡洛采樣次數(shù)為200,交叉驗證組數(shù)為5。對樣本光譜進行篩選,過程見圖4。由圖4(a)可知,隨著變量篩選過程的進行,挑選的波長數(shù)逐漸下降,速度由快變慢,說明波長變量篩選先粗選、后精選。圖4(b)為變量篩選過程中交互驗證均方根誤差的變化趨勢,可知交互驗證均方根誤差先降低后增加,MC 采樣次數(shù)為131時,交互驗證均方根誤差達到最小值2.459,MC采樣次數(shù)繼續(xù)增加后,交互驗證均方誤差逐漸增大,再結合篩選過程中波長變量回歸系數(shù)變化趨勢[見圖4(c),圖中“*”是建模過程中最小RMSECV值對應的采樣次數(shù)]。最終,在MC采樣為131次時,挑選出8個特征波長,分別為:415.7,449.4,459.0,487.8,588.6,771.1,814.3,996.7 nm。
表2基于不同預處理方法的雞蛋哈夫值PLSR模型
Table 2 PLSR model of Haugh value of eggs based on different pretreatment methods
2.4.2 利用GAPLS提取特征波長 設置GAPLS參數(shù):種群數(shù)為30,交叉概率為50%,變異概率為1%,最大遺傳因子為30,迭代次數(shù)100次。雞蛋光譜通過GAPLS篩選的有效信息見圖5。運行GAPLS時,同時計算不同波長下的RMSECV值見圖6。最后結合RMSECV值和波長頻次數(shù)選出最佳波長變量。
由圖6可知,當選出35個波長變量時,RMSECV最低;結合圖5中每個波長篩選頻數(shù),選出的35個波長的篩選頻數(shù)≥7。說明選出的35個波長與雞蛋哈夫值相關性強,最終確定這35個波長為特征波長。主要分布在435.0~497.4,545.4~593.4,665.4~876.7 nm。
Figure 4 Process of competitive adaptive reweighed sampl-ing Characteristic wavelength selection for identification of Haugh value of eggs
橫坐標為125個波點;縱坐標為篩選的頻次,頻次越高表示適應性越強,與哈夫值相關性越高
圖5 雞蛋光譜的GA篩選圖
Figure 5 GA screening of spectrum of egg
2.4.3 利用IRF提取特征波長 設置IRF參數(shù):迭代次數(shù)N為1 000,間隔寬度W為10,子間隔初始值Q為50,最大主成分數(shù)為15。運行IRF,得到116個間隔中排名前10的間隔見表3;同時計算每個間隔的RMSECV,見圖7。
Figure 7 The Root mean square error of cross validation of the union of the top ranked intervals from 1st to the last
由表3可知,前10名區(qū)間選出的波點是從22號到49號,但圖7顯示,當選擇前21個間隔時,RMSECV最低,所以選擇排名前21個間隔的波長作為特征波長,這些波長是17~50號、77~93號、96~107號、113~123號,具體是478.2~636.6,766.3~843.1,857.5~910.3,939.1~987.1 nm,共74個波長。
原始光譜經(jīng)SNV預處理后,分別建立基于全波段光譜(Full Spectrum,F(xiàn)S)和特征波長的PLSR和LS-SVM的雞蛋新鮮度預測模型,結果見表4。
建立PLSR模型時,首先根據(jù)RMSECV最低確定最優(yōu)主成分數(shù),確定PLSR建模結果。由表4可知,全波段和利用CARS、GAPLS、UVE法提取的特征波長建立的預測模型的最佳主成分數(shù)分別是7,6,6,7。在PLSR預測模型中,CARS-PLSR和IRF-PLSR模型的Rc均小于FS-PLSR模型的,說明此2種模型不穩(wěn)定;GAPLS-PLSR與FS-PLSR模型的Rc均為0.890,前者最優(yōu)主成分數(shù)為6低于后者的的,但前者的RMSEC大于后者的,Rp為0.800小于后者的,說明GAPLS-PLSR與FS-PLSR校正性能一樣,但預測能力弱于后者,說明GAPLS-PLSR較FS-PLSR模型不穩(wěn)定。故認定FS-PLSR模型是所建立的PLSR模型中的最優(yōu)模型。
由表4可知,IRF-LS-SVM具有最大的Rc,但有最低的Rp,說明該模型的校正性能最優(yōu),預測能力最差;CARS-LS-SVM和GAPLS-LS-SVM的Rp均為0.832且最大,但前者的Rc明顯低于后者以及FS-LS-SVM模型的,說明CARS-LS-SVM模型預測能力較強,但校正性能較差;GAPLS-LS-SVM的Rc為0.899略低于FS-LS-SVM模型的,前者的RMSEC略大于后者的,但GAPLS-LS-SVM模型預測集的Rp明顯大于FS-LS-SVM模型的,且RMSEP最低,說明該模型校正性能較好,預測能力最強,模型穩(wěn)定。最后確定GAPLS-LS-SVM為LS-SVM中的最優(yōu)模型。
對比特征波長方法,CARS法提取波長數(shù)最少,降維能力最強,GAPLS法次之,IRF法最差,但基于CARS特征波長建立的PLSR和LS-SVM模型效果均較差,GAPLS-LS-SVM模型效果較優(yōu)。對比PLSR和LS-SVM 2種模型中的最優(yōu)模型,GAPLS-LS-SVM的Rc和Rp均大于FS-PLSR模型的;且前者的RMSEC和RMSEP均小于后者的,故GAPLS-LS-SVM模型效果優(yōu)于FS-PLSR。本研究最終確定GAPLS-LS-SVM為最優(yōu)模型,且GAPLS提取的光譜能代替全光譜建模,模型效果見圖8。
采集后的原始雞蛋光譜經(jīng)4種預處理方法,對比其PLSR模型效果,確定SNV法為最優(yōu)預處理方法;對SNV預處理后的光譜經(jīng)CARS、GAPLS和IRF法提取特征波長,分別獲得8,35,74個特征波長,CARS法降維效果最佳,GAPLS法次之,IRF法最差;分別建立基于特征波長和全光譜的PLSR、LS-SVM模型,結果表明,在PLSR模型中,F(xiàn)S-PLSR模型較好,GAPLS-LS-SVM模型效果最優(yōu);在LS-SVM模型中,GAPLS-LS-SVM效果最優(yōu),利用GAPLS法提取的特征波長代替全波段建立LS-SVM模型是可行的。對比2種建模方法,確定GAPLS-LS-SVM雞蛋新鮮度預測模型最優(yōu),其Rc為0.899,RMSEC為2.092;Rp為0.832,RMSEP為2.423。
[1] 畢夏坤, 趙杰文, 林顥, 等. 便攜式近紅外光譜儀判別雞蛋的貯藏時間[J]. 食品科學, 2013(22): 281-285.
[2] 朱云鵬, 崔春利, 王蘭嬌, 等. 哈爾濱市售雞蛋品質及營養(yǎng)成分分析[J]. 食品工業(yè), 2017(5): 289-292.
[3] 王巧華, 任奕林, 文友先. 基于BP神經(jīng)網(wǎng)絡的雞蛋新鮮度無損檢測方法[J]. 農(nóng)業(yè)機械學報, 2006(1): 104-106.
[4] 邢志中, 張海東, 王孟, 等. 基于計算機視覺和神經(jīng)網(wǎng)絡的雞蛋新鮮度檢測[J]. 江蘇農(nóng)業(yè)科學, 2017(11): 160-163.
[5] 趙杰文, 畢夏坤, 林顥, 等. 雞蛋新鮮度的可見-近紅外透射光譜快速識別[J]. 激光與光電子學進展, 2013(5): 213-220.
[6] LIN Hao, ZHAO Jie-wen, SUN Li, et al. Freshness measurement of eggs using near infrared (NIR) spectroscopy and multivariate data analysis[J]. Innovative Food Science & Emerging Technologies, 2011, 12(2): 182-186.
[7] GIUNCHI A L, BERARDINELLI A N, RAGNI L, et al. Non-destructive freshness assessment of shell eggs using FT-NIR spectroscopy[J]. Journal of Food Engineering, 2008, 89(2): 142-148.
[8] 李佳婷, 王俊, 李園, 等. 基于電子鼻的雞蛋新鮮度檢測[J]. 現(xiàn)代食品科技, 2017(4): 300-305, 188.
[9] SMITH D P, LAWRENCE K C, HEITSCHMIDT G W. Fertility and embryo development of broiler hatching eggs evaluated with a hyperspectral imaging and predictive modeling system[J]. International Journal of Poultry Science, 2008, 7(10): 1 001-1 004.
[10] 王巧華, 周凱, 吳蘭蘭, 等. 基于高光譜的雞蛋新鮮度檢測[J]. 光譜學與光譜分析, 2016(8): 2 596-2 600.
[11] JOHNSON Ⅲ Owen N, SLIDELL Mark, KREISHMAN Peter, et al. Hyperspectral imaging: an emerging technology as a potential novel adjunct in assessing peripheral perfusion deficits and success oflower extremity revascularizations[J]. Journal of the American College of Surgeons, 2008, 207(3): S114.
[12] 吳龍國, 何建國, 賀曉光, 等. 高光譜圖像技術在水果無損檢測中的研究進展[J]. 激光與紅外, 2013, 43(9): 990-996.
[13] ELMASRY G, WANG Ning, ELSAYED A. Hyperspectral imaging for nondestructive determination of some quality attributes for strawberry[J]. Journal of Food Engineering, 2007, 81: 98-107.
[14] 杜丹萌, 王風諾, 王世平. 雞蛋新鮮度隨儲藏條件變化規(guī)律的研究[J]. 食品科技, 2014, 39(5): 26-29, 33.
[15] 王巧華, 李小明, 段宇飛. 基于CUVE-PLS-DA的雞蛋新鮮度在線檢測分級[J]. 食品科學, 2016(22): 187-191.
[17] 張明錦, 杜一平. 蒙特卡洛-偏最小二乘回歸系數(shù)法用于近紅外光譜變量篩選[J]. 分析試驗室, 2013(2): 12-16.
[18] 劉善梅. 基于高光譜成像技術的冷鮮豬肉品質無損檢測方法研究[D]. 武漢: 華中農(nóng)業(yè)大學, 2015: 26-41.