付丹丹,王巧華,2,*
(1.華中農(nóng)業(yè)大學(xué)工學(xué)院,湖北 武漢 430070;2.國家蛋品加工技術(shù)研發(fā)分中心,湖北 武漢 430070)
雞蛋新鮮度、pH值及黏度的高光譜檢測模型
付丹丹1,王巧華1,2,*
(1.華中農(nóng)業(yè)大學(xué)工學(xué)院,湖北 武漢 430070;2.國家蛋品加工技術(shù)研發(fā)分中心,湖北 武漢 430070)
利用高光譜成像儀采集雞蛋的高光譜透射圖像,并利用游標卡尺、pH計、黏度計測定雞蛋的新鮮度、酸堿度與黏度,用競爭性自適應(yīng)重加權(quán)(competitive adaptive reweighed sampling,CARS)算法與連續(xù)投影算法(successive projections algorithm,SPA)選取特征波長分別建立雞蛋品質(zhì)與其高光譜特征的簡單多元線性回歸(multiple linear regression,MLR)模型,并在CARS提取的特征波長基礎(chǔ)上用SPA進行了二次波段提取,建立相應(yīng)的MLR模型,對比一次波長提取與二次波長提取選擇的特征波長建立的模型性能。結(jié)果表明,CARS與SPA建立的MLR模型的驗證集相關(guān)系數(shù)均在0.9以上。二次特征波段建立MLR模型的驗證集相關(guān)系數(shù)比一次特征波段提取建立的MLR相關(guān)系數(shù)高,且均方根誤差(root mean square error,RMSE)均有所減小,選取的特征波段比單獨使用CARS或SPA選取的波段要少。建立的雞蛋新鮮度、酸堿度(pH值)、黏度MLR模型的相關(guān)系數(shù)R分別為0.94、0.95、0.95,RMSE分別為6.36、0.17、149。即CARS、SPA提取特征波長可以優(yōu)化模型,二次特征波段提取能更進一步的優(yōu)化模型,提高了模型的穩(wěn)定性,該模型能完好無損預(yù)測雞蛋品質(zhì)。
雞蛋;新鮮度;酸堿度;黏度;高光譜;連續(xù)投影算法
有關(guān)貯藏期間雞蛋品質(zhì)的評價與預(yù)測及其與貯藏時間和條件的關(guān)系一直是食品加工和保鮮領(lǐng)域的研究熱點問題之一。而對于雞蛋品質(zhì)的評價有多個指標,例如雞蛋哈夫單位(Haugh unit,HU)值、揮發(fā)性鹽基氮值、酸堿度、黏度等,這些指標在雞蛋貯藏期間都會有較顯著的變化。目前這些指標的檢測方法主要還是以生化方法為主,但是生化方法是破壞性的檢測,且存在檢測周期長、程序復(fù)雜等弊端,因此,要滿足快速、無損的現(xiàn)代檢測要求,就必須運用現(xiàn)代無損檢測技術(shù)實現(xiàn)雞蛋內(nèi)部品質(zhì)指標的無損檢測。常見的雞蛋內(nèi)部品質(zhì)無損檢測的方法有機器視覺法[1-2]、近紅外檢測法[3-5]、高光譜檢測法[6-7]等。
目前已有利用高光譜技術(shù)檢測普通雞蛋的新鮮度、種蛋、血斑等[8-11]的報道,均為常規(guī)指標檢測,沒有深入綜合地對雞蛋內(nèi)部多個品質(zhì)指標進行研究。有研究[12-16]已經(jīng)發(fā)現(xiàn)雞蛋的可見-近紅外光譜與雞蛋HU值、蛋白含量、pH值、貯藏時間有很好的相關(guān)性。對于高光譜聯(lián)合檢測雞蛋內(nèi)部理化指標如酸堿度、黏度等鮮見報道。雞蛋在貯藏期間有多個品質(zhì)變化,各品質(zhì)指標之間存在一定的相關(guān)性,本實驗利用高光譜結(jié)合雞蛋新鮮度對雞蛋內(nèi)部的pH值與黏度進行研究,找出能夠表征雞蛋品質(zhì)的最優(yōu)波長組合,建立雞蛋內(nèi)部多個理化品質(zhì)指標與高光譜的關(guān)系模型。
1.1 材料
1 日齡的褐殼雞蛋200 枚 湖北武漢九峰養(yǎng)雞場。將所有雞蛋放置于(22±1)℃、相對濕度65%恒溫培養(yǎng)箱中貯藏。
1.2 儀器與設(shè)備
SF2000電子數(shù)顯卡尺 桂林廣陸數(shù)字測控股份有限公司;JA2002電子天平 上海浦春計量儀器有限公司;MP511 pH計 上海三信儀表廠;NDJ-5S數(shù)顯黏度計上海衡平儀器儀表廠;Zolix HyperSIS-VNIR-CL高光譜成像系統(tǒng) 美國海洋光學(xué)公司。
1.3 方法
1.3.1 高光譜相機校正
高光譜成像系統(tǒng)主要是由高光譜成像儀、計算機、透射光源箱、高光譜采集軟件(SpectraSENS)等組成,其中高光譜成像儀是由光源、開關(guān)、CCD相機和絲桿式移動平臺等部分組成。設(shè)置光譜波長范圍為300~1 100 nm,相機曝光時間為0.15 s,絲桿移動平臺的速率為1.7 mm/s,移動距離為80 mm。
CCD相機在拍攝雞蛋的透射圖像時,各波段光源的強度形成了不均勻的分布,獲取的圖像存在一定的噪聲,故必須對高譜圖像進行黑白校正[10]。在采集雞蛋的透射圖像之前,在光源正上方放置標準的白色校正板,得到全白標定圖像W,然后蓋住鏡頭,得到全黑標定圖像D,掃描雞蛋采集的原始高光譜透射圖像I,按公式(1)計算校正后的圖像R:
1.3.2 雞蛋新鮮度、pH值及黏度的測定
實驗步驟:1)貯藏第0、10、20、30、40天時,隨機挑選出40 枚雞蛋,分別進行測定。2)將每次隨機挑選出來的雞蛋大頭朝上,依次豎直放立在自制的高光譜儀中的透射光源箱的孔口,在保證透射光源箱無漏光條件下將絲桿移動平臺移動到合適的位置,通過相機及圖像采集系統(tǒng)采集每一枚雞蛋的高光譜透射圖像。3)將采集完高光譜數(shù)據(jù)的雞蛋打破,利用常規(guī)方法,用電子天平測雞蛋質(zhì)量,用數(shù)顯游標卡尺測雞蛋蛋白高度。4)利用分蛋器將蛋清分離,校準pH計,測定每個雞蛋蛋清的pH值,每個雞蛋測3 次。5)將每枚雞蛋蛋清分別倒入50 mL離心管中,測量的實際黏度占當前轉(zhuǎn)子和轉(zhuǎn)速條件下測量黏度最大值的百分比在20%~90%之間時測定的黏度為有效數(shù)值,根據(jù)這一原則,從1、2、3、4號轉(zhuǎn)子與6、12、30、60 r/min轉(zhuǎn)速中選定合適的轉(zhuǎn)子與轉(zhuǎn)速測定待測蛋清的黏度,在室溫條件下,待黏度計測定15 min后,記錄10 組數(shù)據(jù)。6)記錄所有數(shù)據(jù),根據(jù)雞蛋質(zhì)量與蛋白高度計算雞蛋的HU值,用其來表示雞蛋的新鮮度,用測定的pH值、黏度的平均值作為雞蛋最終的酸堿度值與黏度。
1.3.3 光譜預(yù)處理
本實驗選用微分處理和平滑處理2 種方法。光譜微分是通過對透射光譜進行數(shù)學(xué)模擬,計算不同階數(shù)的微分值,提取不同的光譜參數(shù)。
一階微分處理公式為:
二階微分處理公式為:
式中:λi為波長/nm;ρ’(λi)為λi處的一階微分光譜;ρ(λi+1)為λi+1波長處的光譜;ρ(λi-1)為λi-1波長處的光譜;ρ”(λi)為λi處的二階微分光譜;Δλ為相鄰兩波段間的波長間隔/nm。
平滑處理是為了消除外界干擾產(chǎn)生的噪聲,常用的平滑處理方法包括移動平均法、Savitzky-Golay法等。本實驗選用Savitzky-Golay(S-G)平滑法進行預(yù)處理,其可以有效地消除基線漂移、傾斜等噪聲。SG平滑法中的平滑點數(shù)的選擇尤為重要,平滑點數(shù)過少,容易產(chǎn)生新的計算誤差,導(dǎo)致模型精度下降;平滑點數(shù)過多,包
含樣品信息的光譜數(shù)據(jù)被磨光丟失,同樣也會導(dǎo)致模型精度下降,因此,必須選擇合適的平滑點數(shù),保證模型精度[17]。
1.3.4 特征波段提取
在對全波段進行特征波段提取時,主要用到2 種方法。第1種是競爭性自適應(yīng)重加權(quán)(competitive adaptive reweighed sampling,CARS)算法。CARS變量選取法遵循的是“適者生存”的原則,也就是將輸入的每一個變量都看成是一個獨立的個體,通過自適應(yīng)加權(quán)采樣技術(shù)篩選出模型中回歸系數(shù)絕對值較大的波長,去掉權(quán)重較小的波長并且通過交互驗證優(yōu)選出模型交互驗證均方根誤差(root mean square error of cross validation,RMSECV)最小時所對應(yīng)的波長組合[18-20]。因此,對于高光譜高維數(shù)據(jù)來說,用這種變量選擇方法可以較好的簡化模型。第2種是連續(xù)投影算法(successive projections algorithm,SPA)。SPA是一種前向循環(huán)的選擇方法,從一個波長開始,每一次迭代時加入新的波長,直到達到指定的波長數(shù)N。每次循環(huán),計算它在未選入波長的投影,投影向量Pxj按公式(4)計算:
式中:xj為光譜矩陣中任一列向量;xk(n-1)表示第n步(n=1,2,3…N)迭代時得到的波長k(n-1)中的列向量。
將投影向量最大的波長引入波長組合,直到循環(huán)N次,每一個新選入的波長,都與前一個線性關(guān)系最小[21-24]。
1.3.5 多元線性回歸(multiple linear regression,MLR)模型
當因變量同時受多個重要的因素影響時,且自變量與因變量之間呈現(xiàn)密切的線性關(guān)系,此時進行的回歸分析即為MLR分析,設(shè)Y為因變量,X1、X2…Xi為自變量,則其MLR模型為:
式中:b0為常數(shù)項;b1、b2…bi為回歸系數(shù)。
2.1 雞蛋HU值、pH值及黏度的相關(guān)性分析
依次將雞蛋的HU值、pH值、黏度作為控制變量輸入對剩下的2 個指標進行偏相關(guān)性分析可以發(fā)現(xiàn),當HU值作為控制變量時,雞蛋pH值與黏度之間的偏相關(guān)系數(shù)為-0.428,當pH值作為控制變量時,雞蛋HU值與黏度之間的偏相關(guān)系數(shù)為0.486,當黏度作為控制變量時,雞蛋的HU值與pH值之間的偏相關(guān)系數(shù)為-0.484。相關(guān)系數(shù)的絕對值均下降,但仍然均高于0.3,呈一定的弱相關(guān)。
表1 雞蛋HU值、pH值、黏度的Pearson的相關(guān)性檢驗Table1 Pearson’s correlation test of HU, pH, and viscosity of eggs
雞蛋的新鮮度、酸堿度與黏度隨著貯藏時間的延長都有較為顯著的變化,利用SPSS 13.0對雞蛋的這3 個指標進行Pearson相關(guān)性分析,由表1可知,雞蛋HU值與pH值的Pearson相關(guān)系數(shù)為-0.875,雞蛋黏度與pH值的Pearson相關(guān)系數(shù)為-0.867,雞蛋HU值與黏度的Pearson相關(guān)系數(shù)為0.876,相關(guān)系數(shù)的絕對值均大于0.8,表明雞蛋HU值、pH值、黏度任意兩者之間均呈強相關(guān)。顯著性(雙側(cè))均為0,表示其均具有統(tǒng)計學(xué)差異。綜合Pearson相關(guān)分析及偏相關(guān)分析結(jié)果可得,雞蛋的HU值、pH值、黏度這三者之間均存在強相關(guān)性,且雞蛋貯藏期間的品質(zhì)變化都是相互影響的。
2.2 光譜數(shù)據(jù)預(yù)處理
在利用高光譜成像儀獲取雞蛋的透射圖像的基礎(chǔ)上,選擇像素值為20 000的整蛋為感興趣區(qū)域,提取感興趣區(qū)域的平均光譜作為原始光譜。由于原始的光譜信息在兩端存在較大的噪聲信號,這些噪聲在后續(xù)的光譜特征參數(shù)提取與建模時會造成較大的干擾,必須去除,因此本實驗選取500~950 nm的波段進行研究。
在貯藏的50 d中,隨著貯藏時間的延長,雞蛋質(zhì)量逐漸減少,且濃厚蛋白逐漸稀化,HU值逐漸減小,且隨著濃蛋白逐漸轉(zhuǎn)化為稀蛋白,蛋清的黏度減小明顯,且蛋清酸堿度逐漸上升,雞蛋的透射率逐漸降低,如圖1所示。
圖1 不同貯藏時期的高光譜500~950 nm波段原始曲線Fig.1 Original hyper-spectral curves in the range of 500-950 nm for eggs during different storage periods
由于光譜在500~950 nm波段區(qū)間仍然存在較為明顯的噪聲信號,為了減小甚至消除其對后續(xù)研究及模型預(yù)測準確性的影響,提取特征參數(shù)建模之前需要對原始的光譜數(shù)據(jù)進行預(yù)處理。本研究中的光譜數(shù)據(jù)預(yù)處理均在MATLAB 2012(a)中完成,預(yù)處理方法主要包括樣本集的劃分、微分校正、平滑處理等。
2.2.1 訓(xùn)練集與預(yù)測集的分選
利用Kennard-Stone(KS)法對建模樣本進行挑選。KS法是將光譜差異較大的樣品選入訓(xùn)練集,而其余相近的樣品選入預(yù)測集[23]。如表2所示,通過KS法選擇總體樣本約1/3用來預(yù)測,剩下的樣本用來建模。由于對比的理化指標實驗歷時長,本實驗采集數(shù)據(jù)的時間間隔為10 d,且pH值的變化范圍很?。火ざ扔嫓y定的是蛋清攪拌均勻前的黏度,因此其測定的黏度變化范圍很大,這主要是因為貯藏期間蛋清濃厚蛋白逐漸稀化,實驗第1天,蛋清中絕大部分是濃蛋白,而在實驗第40天,蛋清中幾乎只剩稀蛋白。
表2 利用KS算法劃分出的樣品集的劃分統(tǒng)計Table2 Division and statistics of sample sets by KS algorithm
2.2.2 微分處理
微分處理不僅可以提供比原光譜更清晰的光譜輪廓變換,而且可以消除光譜基線漂移或者平滑背景干擾的影響。本研究對原始光譜分別進行了一階微分與二階微分處理,從數(shù)學(xué)意義上講,一階微分可以反映光譜的變化率,二階微分可以突出光譜的彎曲點。對原始光譜及不同微分處理后高光譜數(shù)據(jù)分別建立雞蛋HU值、pH值、黏度MLR分析模型,如表3所示。經(jīng)二階微分預(yù)處理后的全波段MLR模型的驗證集相關(guān)系數(shù)高于原始全波段光譜MLR模型驗證集的相關(guān)系數(shù)。
表3 采用不同預(yù)處理方法的全波段MLR模型驗證集的相關(guān)系數(shù)Table3 The correlation coefficients with different pre-treatment methods of full band by MLR
如表3所示,綜合考慮這3 個指標模型的相關(guān)系數(shù)可以看出,在一階微分的基礎(chǔ)上進行S-G平滑處理,能夠同時較好的提高雞蛋HU值、pH值、黏度的模型的相關(guān)系數(shù),說明這種組合預(yù)處理的效果最好,因此本研究后續(xù)的數(shù)據(jù)處理是基于高光譜一階光滑處后的數(shù)據(jù)上進行的。
盡管不同預(yù)處理的全波段MLR模型的相關(guān)系數(shù)均不高,但是用偏最小二乘(partial least squares,PLS)模型分別建立各指標的全波段模型,驗證集的相關(guān)系數(shù)均在0.7左右,表明雞蛋HU值、pH值、黏度與高光譜的光譜信息之間存在較好的相關(guān)性?;谔卣鞑ㄩL建立的雞蛋HU值、pH值、黏度PLS模型的相關(guān)數(shù)均沒有MLR模型的相關(guān)系數(shù)高,因此最終統(tǒng)一選用全波段的MLR模型與特征波段的MLR模型進行對比研究。表3表明,在建立全波段的MLR模型時,無信息波長干擾較強,故必須通過特征波長的提取,剔除無信息的干擾波長,選出信息量大的最優(yōu)波長組合,提高模型預(yù)測的準確性。
2.2.3 平滑處理
平滑處理可以有效濾去雜波,使光譜曲線更平滑。其濾波效果與窗口寬度及光譜分辨率相關(guān),經(jīng)過反復(fù)嘗試,確定采用窗口寬度為8的S-G法分別對一階微分及二階微分光譜進行平滑。將500~950 nm波段范圍內(nèi)的波長從0~450 nm依次進行編號,由圖2可知,平滑處理有效的消除了雜波的干擾,光譜曲線較處理前更平滑。
圖2 平滑處理前后的高光譜一階曲線Fig.2 Smoothed and unsmoothed first derivative hyper-spectral curves
2.3 CARS變量選取法提取特征波長
對訓(xùn)練集的高光譜數(shù)據(jù)進行預(yù)處理后,采用CARS變量選取分別對雞蛋的HU值、pH值、黏度的波長進行篩選,以HU的特征波長選取過程為例說明CARS的特征波長集的選取過程,如圖3所示。由圖3A可知,選取變量的變化趨勢,變量數(shù)與運行次數(shù)之間呈指數(shù)關(guān)系遞減[17]。由圖3B可知,RMSECV的變化趨勢,RMSECV值隨著取樣運行次數(shù)先減小后增大,RMSECV值逐漸減小,表明光譜數(shù)據(jù)中部分無用信息被剔除,RMSECV值逐漸增大,表明光譜數(shù)據(jù)中有一些重要信息被剔除。由圖3C可知,對應(yīng)的RMSECV為最小值時,各變量的回歸系數(shù)隨著運行次數(shù)增加的變化趨勢,如圖3C中豎直線位置所示,當RMSECV達到最小值時,共取樣運行17 次。
圖3 雞蛋pH值高光譜特征波長選取圖Fig.3 Hyper-spectral characteristic wavelength selected for detection of egg pH
經(jīng)過反復(fù)的參數(shù)嘗試,在RMSECV均為最小值時,最終選取的雞蛋HU值、pH值、黏度具體的波段如表4所示。基于CARS變量選取法選擇的HU值預(yù)測的最優(yōu)波長組合中有48 個波長,pH值預(yù)測的最優(yōu)波長組合中有15 個波長,黏度預(yù)測的最優(yōu)波長組合中有6 個波長。
表4 基于CARS變量選取法選擇的最優(yōu)波長組合Table4 Optimal wavelength combinations based on CARS method
2.4 SPA提取特征波長
將KS法挑選出來的70 個高光譜數(shù)據(jù)樣本個體作為測試集輸入,用于檢驗?zāi)P偷念A(yù)測性能,將其余的130 個數(shù)據(jù)樣本作為訓(xùn)練集輸入,用于選擇最優(yōu)特征波長和建模。本實驗對SPA優(yōu)選出的波長序列分別與雞蛋的HU值、pH值、黏度建立一個MLR模型。
圖4 SPA提取特征波長Fig.4 SPA extraction of characteristic wavelengths
如圖4所示,以雞蛋pH值為例簡要說明SPA的選取過程。根據(jù)SPA的原理,利用均方根誤差(root mean square error,RMSE)來決定所建模型的優(yōu)劣,選出RMSE減小過程中由快變慢的過渡值[25]。在過渡值前,由于冗余波長的不斷剔除,RMSE值隨著變量的增加下降較快,在過渡值后,由于冗余的波長已經(jīng)基本剔除,因此RMSE隨著變量的增加變化穩(wěn)定。選取RMSE過渡值對應(yīng)的變量數(shù)作為最優(yōu)的波長組合。由表5可知,基于SPA變量選取法選擇的HU值預(yù)測的最優(yōu)波長組合中有19 個波長,pH值預(yù)測的最優(yōu)波長組合中有20 個波長,黏度預(yù)測的最優(yōu)波長組合中有20 個波長。
表5 基于SPA變量選取法選取的最優(yōu)波長組合Table5 Optimal wavelength combinations based on SPA
2.5 二次特征波長選取
用CARS與SPA選取的特征波長組合,盡管能夠有效地削減光譜波數(shù),但是選取的波長數(shù)仍然相對較多,因此本研究繼續(xù)在CARS提取的最優(yōu)波長組合的基礎(chǔ)上,
利用SPA進行二次波長選取,最終選取的特征波長。由表6可知,基于CARS選取的特征波長組合的SPA二次特征波長選取法選擇的HU值預(yù)測的最優(yōu)波長組合中有13 個波長,pH值預(yù)測的最優(yōu)波長組合中有10 個波長,黏度預(yù)測的最優(yōu)波長組合中有6 個波長。對比可見,二次特征波長提取可以在原先最優(yōu)波長組合上更進一步的削減光譜波數(shù),使最終建立的模型結(jié)構(gòu)得到進一步的簡化與優(yōu)化。
表6 基于CARS選取的特征波長組合的SPA二次特征波長選取組合Table6 Optimal wavelength combinations based on CARS methods and SPA
2.6 雞蛋HU值、pH值、黏度預(yù)測模型
表7 基于不同特征波長提取方法建立的MLR模型效果Table7 Comparison of MLR models based on different characteristic wavelength extraction methods
如表7所示,對CARS、SPA及CARS-SPA選取的最優(yōu)波段組合分別建立MLR模型,基于CARS建立的雞蛋HU值、pH值、黏度MLR模型預(yù)測值與真實值的相關(guān)系數(shù)均大于0.9,此結(jié)論與Wang Qiaohua等[8]對雞蛋新鮮度的研究結(jié)論相同,且基于SPA建立的雞蛋HU值、pH值、黏度MLR模型預(yù)測值與真實值的相關(guān)系數(shù)也均大于0.9,此預(yù)測效果較Zhang Wei等[6]對雞蛋新鮮度的預(yù)測效果好。由此可以看出,特征波段的提取能夠有效消除冗余的波段,模型的復(fù)雜度大大降低,且大大提高模型穩(wěn)定性與準確性。
基于CARS-SPA的二次波段提取建立的雞蛋HU值、pH值、黏度MLR模型預(yù)測值與真實值的相關(guān)系數(shù)均在0.95左右,均高于一次波段提取的模型相關(guān)系數(shù),其相關(guān)系數(shù)高于Wang Qiaohua[8]、Zhang Wei[6]等建立的模型的相關(guān)系數(shù)。且RMSE值均較CARS-MLR、SPA-MLR有所降低,由此可見二次波段提取比一次波段提取效果好,其能夠更進一步的有效降低模型的復(fù)雜度,提高模型的穩(wěn)定性與準確性,優(yōu)化模型。
本研究以比白殼雞蛋更難以透光的褐殼雞蛋為研究對象,研究基于高光譜技術(shù)與雞蛋新鮮度有關(guān)的內(nèi)部理化指標的無損檢測方法,建立雞蛋HU值、pH值、黏度的MLR模型。用KS法挑選出70 個樣本作為模型的預(yù)測集,其余的130 個樣本作為模型的訓(xùn)練集。對不同的預(yù)處理方法分別建立模型預(yù)測,發(fā)現(xiàn)高光譜一階微分平滑數(shù)據(jù)的預(yù)測效果較好。雞蛋的新鮮度、酸堿度、黏度之間存在較強的相關(guān)性,且彼此之間互相影響。基于高光譜一階微分的全波段MLR模型驗證集的雞蛋HU值、pH值、黏度的相關(guān)系數(shù)分別為0.39、0.63、0.69,基于CARS特征參數(shù)提取的MLR模型驗證集的相關(guān)系數(shù)分別為0.91、0.94、0.95,基于SPA特征參數(shù)提取的MLR模型驗證集的相關(guān)系數(shù)分別為0.92、0.92、0.96。因此,特征參數(shù)提取可以有效的降低模型復(fù)雜度,提高模型準確性?;贑ARS提取的雞蛋HU值、pH值、黏度的最佳波段組合數(shù)分別為48、15、6 個,基于SPA提取的雞蛋HU值、pH值、黏度的最佳波段組合數(shù)分別為19、20、20 個,基于CARS-SPA二次波段提取的最佳波段組合數(shù)分別為13、10、6 個。二次波段提取可以進一步削減貢獻較小的波長,進一步簡化模型結(jié)構(gòu)。與全波段建模相比,有效的特征參數(shù)提取均可以較好的提高預(yù)測模型的準確性。不論是用CARS算法,還是用SPA提取特征波長,都可以大大的提高預(yù)測模型的準確性。通過特征波長的提取,能夠剔除冗雜的無或少信息量的波段,選出具有較高信息量的波長來表征雞蛋的HU值、pH值及黏度,簡化模型。在CARS提取的特征波長組合的基礎(chǔ)上采用SPA再次進行特征波長提取,并建立MLR模型,建立的雞蛋HU值、pH值、黏度MLR模型驗證集的相關(guān)系數(shù)分別為0.94、0.95、0.95。且二次特征波段提取可以進一步削減貢獻較小的波長,選出有用的光譜表征信息,去除更多的無關(guān)信息,繼而優(yōu)化模型。
[1] 王巧華, 文友先, 林雪冬, 等. 雞蛋透射光圖像形態(tài)特征與其新鮮度的相關(guān)關(guān)系[J]. 農(nóng)業(yè)工程學(xué)報, 2008, 24(3): 179-184. DOI:10.3321/ j.issn:1002-6819.2008.03.036.
[2] 王栓巧, 郁志宏, 韓寶, 等. 基于機器視覺雞蛋品質(zhì)檢測機構(gòu)的研究[J]. 機械設(shè)計與制造, 2009(12): 84-86. DOI:10.3969/ j.issn.1001-3997.2009.12.033.
[3] 劉燕德, 彭彥穎, 孫旭東. 雞蛋蛋白pH可見/近紅外光譜在線檢測信息變量提取研究[J]. 江西農(nóng)業(yè)大學(xué)學(xué)報, 2010, 32(5): 1075-1080. DOI:10.3969/j.issn.1000-2286.2010.05.031.
[4] 劉燕德, 周延睿, 彭彥穎. 基于近紅外漫反射光譜檢測雞蛋品質(zhì)[J]. 光學(xué)精密工程, 2013, 21(1): 40-46. DOI:10.3788/ OPE.20132101.0040.
[5] 候卓成, 楊寧, 李俊英, 等. 傅里葉變換近紅外反射用于雞蛋品質(zhì)的研究[J]. 光譜學(xué)與光譜分析, 2009, 29(8): 2063-2067. DOI:10.3964/j. issn.1000-0593(2009)08-2063-04.
[6] ZHANG Wei, PAN Leiqing, TU Sicong, et al. Non-destructive internal quality assessment of eggs using a synthesis of hyperspectral imaging and multivariate analysis[J]. Journal of Food Engineering, 2015, 157: 41-48. DOI:10.1016/j.jfoodeng.2015.02.013.
[7] 張偉, 潘磊慶, 林紅英. 基于高光譜圖像檢測禽蛋新鮮度的研究[J]. 南京曉莊學(xué)院學(xué)報, 2015, 11(6): 46-51. DOI:10.3969/ j.issn.1009-7902.2015.06.011.
[8] WANG Qiaohua, ZHOU Kai, WANG Caiyun, et al. Egg freshness detection based on hyperspectral image technology[J]. Advance Journal of Food Science and Technology, 2015, 7(8): 652-657.
[9] 潘磊慶, 張偉, 于敏莉, 等. 基于高光譜圖像的雞種蛋孵化早期胚胎性別鑒別[J]. 農(nóng)業(yè)工程學(xué)報, 2016, 32(1): 181-187. DOI:10.11975/ j.issn.1002-6819.2016.01.025.
[10] 祝志慧, 劉婷, 馬美湖. 基于高光譜信息融合和相關(guān)向量機的種蛋無損檢測[J]. 農(nóng)業(yè)工程學(xué)報, 2015, 31(15): 285-292. DOI:10.11975/ j.issn.1002-6819.2015.15.039.
[11] 張偉, 潘磊慶, 屠康. 利用高光譜透射圖像檢測雞種蛋早期孵化[J]. 農(nóng)業(yè)工程學(xué)報, 2012, 28(21): 149-155. DOI:10.3969/ j.issn.1002-6819.2012.21.021.
[12] NICOLAS A N, MICHAEL N, SHIV P, et al. Prediction of egg freshness and albumen quality using visible/near infrared spectroscopy[J]. Food Bioprocess Technologies, 2011, 4: 731-736. DOI:10.1007/s11947-009-0265-0.
[13] LIN H, ZHAO J W, SUN L, et al. Freshness measurement of eggs using near infrared (NIR) spectroscopy and multivariate data analysis[J]. Innovative Food Science and Emerging Technologies, 2011, 12: 182-186. DOI:10.1016/j.ifset.2011.01.008.
[14] KAROUI R, KEMPS B, BAMELIS F, et al. Methods to evaluate egg freshness in research and industry: a review[J]. European Food Research and Technology, 2006, 222: 727-732. DOI:10.1007/s00217-005-0145-4.
[15] KEMPS B J, de KETELAERE B, BAMELIS F R, et al. Albumen freshness assessment by combining visible near-infrared transmission and low-resolution proton nuclear magnetic resonance spectroscopy[J]. Poultry Science, 2007, 86(4): 757-759. DOI:10.1093/ps/86.4.752.
[16] IQBAL A, SUN D W, ALLEN P. Prediction of moisture, color and pH in cooked, preslic-ed turkey hams by NIR hyperspectral imaging system[J]. Journal of Food Engineering, 2013, 117: 42-51. DOI:10.1007/s11947-014-1327-5.
[17] 陳華舟, 潘濤, 陳潔梅, 等. 多元散射校正與Savitaky-Golay平滑模式的組合優(yōu)選應(yīng)用于土壤有機質(zhì)的近紅外光譜分析[J]. 計算機與應(yīng)用化學(xué), 2011, 28(5): 518-522. DOI:10.3969/j.issn.1001-4160.2011.05.002.
[18] 李洪波, 郭志明, 黃文倩, 等. 應(yīng)用CARS和SPA算法對草莓SSC含量NIR光譜預(yù)測模型中變量及樣本篩選[J]. 光譜學(xué)與光譜分析, 2015, 35(2): 372-378. DOI:10.3964/j.issn.1000-0593(2015)02-0372-07.
[19] 劉燕德, 施宇, 蔡麗君, 等. 基于CARS算法的臍橙可溶性固形物近紅外在線檢測[J]. 農(nóng)業(yè)機械學(xué)報, 2013, 44(9): 138-145. DOI:10.6041/j.issn.1000-1298.2013.09.025.
[20] 吳靜姝, 徐云. 基于CARS-PLS的食用油脂肪酸近紅外定量分析模型優(yōu)化[J]. 農(nóng)業(yè)機械學(xué)報, 2011, 42(11): 162-167. DOI:10.3969/ j.issn.1000-1298.2011.10.032.
[21] 高洪智, 盧啟鵬, 丁海泉, 等. 基于連續(xù)投影算法的土壤總氮近紅外特征波長的選取[J]. 光譜學(xué)與光譜分析, 2009, 29(11): 2951-2954. DOI:10.3964/j.issn.1000-0593(2009)11-2951-04.
[22] 洪涯, 洪添勝, 代芬, 等. 連續(xù)投影算法在砂糖橘總酸無損檢測中的應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報, 2010, 26(增刊2): 380-383. DOI:10.3969/ j.issn.1002-6819.2010.z2.072.
[23] 吳迪, 金春華, 何勇. 基于連續(xù)投影算法的光譜主成分組合優(yōu)化方法研究[J]. 光譜學(xué)與光譜分析, 2009, 29(10): 2734-2737. DOI:10.3964/j.issn.1000-0593(2009)10-2734-04.
[24] 吳迪, 寧紀鋒, 劉旭, 等. 基于高光譜成像技術(shù)和連續(xù)投影算法檢測葡萄果皮花色苷含量[J]. 食品科學(xué), 2014, 35(8): 57-62. DOI:10.7506/spkx1002-6630-201408010.
[25] 廖宜濤, 樊玉霞, 成芳, 等. 連續(xù)投影算法在豬肉pH值無損檢測中的應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報, 2010, 26(1): 379-383. DOI:10.3969/ j.issn.1002-6819.2010.z1.067.
Predictive Models for the Detection of Egg Freshness, Acidity and Viscosity Using Hyper-Spectral Imaging
FU Dandan1, WANG Qiaohua1,2,*
(1. College of Engineering, Huazhong Agricultural University, Wuhan 430070, China; 2. National Research and Development Center for Egg Processing, Wuhan 430070, China)
In this study, hyper-spectral data of eggs were collected using a hyper-spectral imager, and their freshness, pH and viscosity were also measured with a vernier caliper, a pH meter and a viscometer, respectively. Characteristic wavelengths were selected using competitive adaptive reweighed sampling (CARS) and successive projections algorithm (SPA), respectively, for constructing a simple multiple linear regression model (MLR) between egg quality and hyper-spectral features. Moreover, another MLR model was also established based on secondary SPA extraction of the characteristic wavelengths selected by CARS. The performances of the three models developed were compared. The results showed that the validation set correlation coefficients of both the CARS model and SPA model were above 0.9, which were lower than that of the CARS-SPA model with a lower root mean square error (RMSE) and fewer characteristic wavelength bands. The correlation coefficients of the MLR model for egg freshness, pH and viscosity were 0.94, 0.95, and 0.95 respectively, and the RMSE were 6.36, 0.17, and 149, respectively. This study indicates that optimized MLP model could be obtained using CARS or SPA to extract characteristic wavelengths and be further optimized by their combined use for non-destructive prediction of egg quality with improved stability.
eggs; freshness; acidity; viscosity; hyper-spectral imaging; successive projection algorithm
10.7506/spkx1002-6630-201622026
S24
A
1002-6630(2016)22-0173-07
付丹丹, 王巧華. 雞蛋新鮮度、pH值及黏度的高光譜檢測模型[J]. 食品科學(xué), 2016, 37(22): 173-179. DOI:10.7506/ spkx1002-6630-201622026. http://www.spkx.net.cn
FU Dandan, WANG Qiaohua. Predictive models for the detection of egg freshness, acidity and viscosity using hyperspectral imaging[J]. Food Science, 2016, 37(22): 173-179. (in Chinese with English abstract) DOI:10.7506/spkx1002-6630-201622026. http://www.spkx.net.cn
2016-04-11
國家自然科學(xué)基金面上項目(31371771);“十二五”國家科技支撐計劃項目(2015BAD19B05);
湖北省科技支撐計劃項目(2015BBA172);公益性行業(yè)(農(nóng)業(yè))科研專項(201303084)
付丹丹(1991—),女,碩士研究生,研究方向為智能化檢測與控制。E-mail:fudandan@webmail.hzau.edu.cn
*通信作者:王巧華(1970—),女,教授,博士,研究方向為機電一體化、智能化檢測與控制、機器視覺。
E-mail:wqh@mail.hzau.edu.cn