宋 凱,汪明輝
(沈陽理工大學 信息科學與工程學院,沈陽 110159)
牛肉品質高光譜檢測技術研究
宋 凱,汪明輝
(沈陽理工大學 信息科學與工程學院,沈陽 110159)
為及時了解肉品品質,需要一種快速準確檢測肉品品質的方法。針對此問題,提出利用高光譜檢測技術檢測肉品品質的方法。高光譜檢測技術,需對光譜進行預處理。主要分析在400~1100nm波長內獲取牛肉表面的高光譜圖像,經過多種預處理方法進行預處理后,再通過連續(xù)投影算法進行特征波長優(yōu)選后,分別利用多元線性回歸對新鮮度和水分含量進行校正集和預測集建模,通過模型評價指標來判斷各預處理方法的優(yōu)劣性。實驗結果表明,2階9點S.Golay卷積平滑對牛肉新鮮度指標和水分含量的預測均是最佳預處理方法。
牛肉新鮮度;水分含量;高光譜圖像;預處理;多元線性回歸;連續(xù)投影算法;校正集;預測集
隨著目前我國人民的生活水平的逐漸提高,人們的飲食結構也慢慢朝著優(yōu)質而合理的方向發(fā)展,牛肉是中國需求量排行第二的肉食品類,僅僅低于豬肉。牛肉的脂肪含量很低,但是卻有著豐富的蛋白質,所以牛肉擁有嬌嫩的口感和鮮美的味道,人們愛吃牛肉,所以牛肉享有“肉中驕子”的美名。因此,人們對牛肉的需求越來越大,同樣,也對牛肉的肉品品質提出了更高、更嚴苛的要求。傳統的較為常見的檢測肉品品質的方法主要為以下幾種:感官評價、微生物菌落檢測以及理化指標檢測等等[1]。但是這些傳統的檢測方法都存在著或多或少的弊端,無法達到真正的使用目的。因此,世界各國亟需一種方便、快捷且準確性高的肉品品質檢測手段,因此光譜分析技術應運而生。
光譜的范圍在400~1100nm之間的光譜稱為可見-近紅外光譜,可見-近紅外光譜技術是一種相對來說非常成熟的光譜檢測技術。通過被測樣品自身所攜帶的各種各樣的信息從而得到樣品全波長范圍內的原始光譜數據,再結合樣品的多種組成成分,找出樣品全波長范圍內的原始光譜數據與各種理化指標的實際測量值之間的關聯,并通過分析來得出被測樣品所包含的主要的成分信息。通過可見-近紅外光譜來獲得的待測樣品的反射光譜信息,原始光譜中不僅含有物質本身的化學成分信息,也極其容易被諸如外界因素、背景信息以及電噪聲等多種干擾所影響[2],導致光譜數據中不僅包含著研究所需信息,但同時存在著不相關的無用信息,使得光譜數據出現基線漂移或者光譜不重疊等后果[3],使得待測樣本的光譜數據中存在一定量的誤差,從而影響預測模型精度。所以,在對數據進行研究之前需要對原始的光譜數據進行預處理,光譜預處理的主要作用是可以在一定的程度上消弭部分噪聲或者減少噪聲對有用光譜信息的影響,使得原本所隱藏的信號差別得以放大,提高待測光譜的分辨率[4],使得所得有效信息具有高信噪比、低干擾性的特點,最后建立的預測模型具有較高的預測精度。
本文主要針對不同預處理算法對后續(xù)建模結果的影響進行分析,介紹了多種不同的預處理算法以及比較經過預處理之后所建模型的差異性,用實驗數據闡明了預處理在預測建模中的差異性以及重要性。
為了區(qū)別多種預處理方法效果之間的差異,本文主要分析針對103個牛肉樣本(含67個校正集和36個預測集)建立牛肉新鮮度指標和水分含量的預測模型,分析原始光譜數據經過不同種的預處理方法預處理之后,所建預測模型之間的差異性,選擇最優(yōu)的預處理方法。
本實驗采用Matlab R2010a對數據進行預處理。首先對所有數據用mapminmax函數進行處理,對結果分別采用均值中心化、標準化、歸一化、標準正態(tài)變量變換、多元散射校正、3點平滑、5點平滑、7點平滑、3階5點、1階7點、2階7點、1階9點和2階9點S.Golay平滑等方法對103個牛肉樣本(含67個校正集和36個預測集)的光譜數據進行多種方式預處理。對于處理后的數據用連續(xù)投影算法進行特征波長優(yōu)選,在對其進行多元線性回歸建模,比較所建模型的優(yōu)劣性,從而選擇最佳預處理算法。圖1為原始光譜。
圖1 原始光譜
1.1 均值中心化
均值中心化變換是通過用原始光譜減掉校正集的平均光譜[5]。在建模時,均值中心化是將光譜的變動與待測部分的構成或性質的變動關聯在一起,而非將光譜的絕對量與待測部分的構成或性質相關聯。因此,建立光譜定性模型或者定量模型之前,往往需要通過采用均值中心化來凸顯各個樣品光譜之間的差異,從而使得預測模型有著穩(wěn)定、預測準確性高的特點。
在使用這種預處理方法對原始光譜數據進行處理的時候,往往也需要對待測部分的構成或性質進行預處理[6]。
1.2 標準化
標準化又稱作均值方差化,光譜標準化變換的原理是將均值中心化處理后得到的光譜數據再除以校正集光譜陣所得的標準偏差光譜。
1.3 歸一化
歸一化的方法相對而言較多,包括最大歸一化法、面積歸一化法以及平均歸一化法等。在光譜分析當中,使用最多的方法是矢量歸一化。矢量歸一化通常是被用來校正因為微小的光程差異所引起的光譜變化帶來的問題。
1.4 標準正態(tài)變量變換SNV
標準正態(tài)變量變換的目的主要是為了消除固體顆粒的大小、樣本的表面散射和光程變化對NIR漫反射光譜產生的影響。SNV的主要原理是通過改變光譜信號的尺度范圍和強度大小的方法來消除樣本背景噪聲。
1.5 多元散射校正MSC
多元散射校正和標準正態(tài)變量變化都是將吸收信息與散射光信號相分離。在一般的情況下,散射所導致的光譜的變化一般要比樣品成分所導致的光譜變化要大一些,MSC的主要目的是校正每一條光譜的散射,獲得其中與成分有關的相對來說理想的信息。MSC的處理結果類似于SNV方法的結果。
1.6 平滑去噪算法
通過光譜儀獲得的光譜信號中既有有用信息,也有隨機誤差,即噪聲。信號平滑是最為常見的消弭噪聲的一種方式,它的原理是假設光譜所包含的噪聲為零的隨機白噪聲,若多次測定求均值,能達到降低噪聲和提高信噪比的效果。使用較多的一些信號平滑的方式有移動平均平滑法和Savitzky-Golay卷積平滑法[7]。
移動平均平滑算法是通過一個特定窗口寬度的平滑窗口(2ω+1),單個窗口內的波長點都為奇數個,用窗口中的中心波長點k以及前后ω點處的測量值的平均值來代替波長點的測量值,自左至右移動k,使得所有的點都得到平滑。
采取該預處理方法的時候,窗口寬度的大小非常的重要,若寬度過小,將不能充分去噪;若寬度過大,用簡單的求均值運算,不僅會平滑處理掉所不需要的噪聲,也會過濾掉所需的有用信息,使得光譜信號失真。
實驗中采用3點平滑、5點平滑和7點平滑對原始光譜數據進行預處理,判斷各自優(yōu)劣性。
1.7 Savitzky-Golay卷積平滑
Savitzky-Golay卷積平滑的基本思想與移動平均平滑大致相似。只是通過多項式的方式來對移動窗口中的數據進行最小二乘擬合,而并非是用簡單的平均方法,它的本質是一種加權平均算法,它突出了中心點的作用。S.Golay卷積平滑法是目前使用較多、較為普及的一種去噪的方式,因為相對于移動平均平滑來說,移動窗口的寬度對最終結果的影響要小得多。
同時S.Golay卷積平滑也能用來求導數光譜,可以通過最小二乘法求得導數系數。目的是能夠有效消除基線漂移和背景噪聲對光譜的干擾,同時能夠精確分辨出重疊峰,在提高靈敏度的同時也增強分辨率。但同時也會引入噪聲,降低信噪比。在進行光譜處理的時候,導數點數是較為重要的參數,假如過小,就會導致噪聲較大,影響所建模型的預測能力;反之假如過大,會導致處理過度,使得光譜失去所需的細節(jié)。
經驗證,本實驗采取一階差分寬度時效果最佳,分別采用3階5點、1階7點、2階7點、1階9點和2階9點S.Golay平滑來對原始光譜數據進行預處理,判斷各自優(yōu)劣性。
2.1 連續(xù)投影算法
連續(xù)投影算法屬于前向循環(huán)的選擇方法,它的原理是從一個波長開始,每次循環(huán)都是在計算它在未選入波長上的投影,將投影向量最大的波長引入到波長組合。每一個新選入的波長,都有與前一個線性關系最小的特點[8]。
2.2 多元線性回歸
線性回歸總共有兩大類,分別是一元線性回歸和多元線性回歸[9]。在實際使用中,很多情況下需要用到多元線性回歸來更好地描述不同的變量與變量之間的關系。從而導致多元線性回歸的計算量往往要比一元線性回歸大許多,一般用計算機處理。
設因變量Y與自變量X1,X2,…,Xm之間有關系式:Y=b0+b1X1+…+bmXm+ε對于n組量測數據:
(Y1;X11,X12,…,X1m)
(Y2;X21,X22,…,X2m)
?
(Yn;Xn1,Xn2,…,Xnm)
Xij是自變量Xj的第i個值,Yi是因變量Y的第i個值,m為自變量的個數。模型的數據結構式為
Y1=b0+b1X11+b2X12+…+bmX1m+ε1
Y2=b0+b1X21+b2X22+…+bmX2m+ε2
? ? ?
Yn=b0+b1Xn1+b2Xn2+…+bmXnm+εn
多元線性回歸常用于評價多組樣品的光譜預測結果與參考方法測定結果之間的相關性。
2.3 模型評價指標
(1)校正標準偏差(RMSEC)
(2)預測標準偏差(RMSEP)
(3)相關系數(R)
對于光譜數據來說,無論是校正集還是預測集所建的預測模型,相關系數R越接近于1,預測結果越好;RMSEC和RMSEP越小,表明所建的預測模型具有更強的預測能力。
本實驗利用103個牛肉樣本(含67個校正集和36個預測集)的實驗理化值及全光譜數據分別建立牛肉新鮮度指標和水分含量的MLR多元線性回歸模型。結果顯示,不同種預處理算法對原始光譜的處理得到的結果存在著差異,如圖2~圖14所示。
(1) 均值中心化
圖2為均值中心化處理后的光譜。
圖2 均值中心化處理后的光譜
(2) 標準化
圖3為標準化處理后的光譜。
圖3 標準化處理后的光譜
(3) 歸一化
圖4為歸一化處理后的光譜。
圖4 歸一化處理后的光譜
(4) SNV
圖5為SNV處理后的光譜。
圖5 SNV處理后的光譜
(5) MSC
圖6為MSC處理后的光譜。
圖6 MSC處理后的光譜
(6)3點平滑
圖7為3點移動平均平滑法處理后的光譜。
圖7 3點移動平均平滑法處理后的光譜
(7)5點平滑
圖8為5點移動平均平滑法處理后的光譜。
圖8 5點移動平均平滑法處理后的光譜
(8)7點平滑
圖9為7點移動平均平滑法處理后的光譜。
圖9 7點移動平均平滑法處理后的光譜
(9)3階5點S.Golay平滑
圖10為3階5點S.Golay平滑處理后的光譜。
圖10 3階5點S.Golay平滑處理后的光譜
(10)1階7點S.Golay平滑
圖11為1階7點S.Golay平滑處理后的光譜。
圖11 1階7點S.Golay平滑處理后的光譜
(11)2階7點S.Golay平滑
圖12為2階7點S.Golay平滑處理后的光譜。
圖12 2階7點S.Golay平滑處理后的光譜
(12)1階9點S.Golay平滑
圖13為1階9點S.Golay平滑處理后的光譜。
圖13 1階9點S.Golay平滑處理后的光譜
(13)2階9點S.Golay平滑
圖14為2階9點S.Golay平滑處理后的光譜。
圖14 2階9點S.Golay平滑處理后的光譜
同時,釆用不同種類的光譜預處理方法對牛肉的新鮮度指標和水分含量建立預測模型的模型參數有所不同,具體如表1、表2所示。
綜上所述,2階9點S.Golay卷積平滑后對牛肉的新鮮度和水分含量進行建模,無論是校正集建模還是預測集建模,其建模效果都要好于其他預處理算法。在對牛肉新鮮度指標的校正集預測中,測得R為0.9737,RMSEC為0.1686;在對預測集的預測中,測得R為0.9689,RMSEP為0.1364;在對水分含量的校正集預測中,測得R為0.9685,RMSEC為0.1784;在對預測集的預測中,測得R為0.9560,RMSEP為0.1682。
表1 不同預處理方法建立牛肉新鮮度指標的預測模型
表2 不同預處理方法建立牛肉水分含量的預測模型
探討了利用高光譜檢測技術對牛肉的新鮮度和水分含量進行檢測,通過對原始光譜進行預處理,波長優(yōu)選后進行MLR建模。通過對預處理的結果分析以及對所得模型評價指標的比較,可知2階9點S.Golay卷積平滑對牛肉新鮮度指標和水分含量的預測均是最佳的預處理方法。
[1]劉娟.肉品新鮮度檢測方法研究進展[J].農家科技(下旬刊),2012 (5):134-135.
[2]許倩,朱秋勁,葉春,等.近紅外光譜分析技術快速檢測冰溫貯藏牛肉品質[J].肉類研究,2015 (3):23-26.
[3]程長闊,楊鵬程,李燕,等.光譜預處理方法對硝酸鹽測量模型影響實驗研究及軟件設計[J].海洋技術學報,2015 (2):69-73.
[4]金靈.基于高光譜技術的寧夏灘羊肉內部品質檢測方法研究[D].寧夏:寧夏大學 2014:42-44.
[5]馬世榜,湯修映,徐楊,等.可見/近紅外光譜結合遺傳算法無損檢測牛肉pH 值[J].農業(yè)工程學報, 2012,28(18):263-268.
[6]張洋.吸附材料的改性及其在微量成分近紅外光譜分析中的應用研究[D].天津:南開大學,2013:23-24.
[7]王璇.基于多元線性回歸的昆蟲圖像分割技術研究[D].南昌:江西理工大學,2014:34-35.
[8]王欣.近紅外分析中光譜預處理方法的研究與應用進展[J].科技資訊,2013 (15):23-24.
[9]劉善梅.基于高光譜成像技術的冷鮮豬肉品質無損檢測方法研究[D].武漢:華中農業(yè)大學,2015:45-47.
(責任編輯:馬金發(fā))
Hyperspectral Detection Technology of Beef Quality
SONG Kai,WANG Minghui
(Shenyang Ligong University,Shenyang 110159,China)
In order to understand the quality of meat,we need a rapid and accurate method for the detection of meat quality.To solve this problem,the method of meat quality detection is preposed using hyperspectral detection technology.For hyperspectral detection technology,pretreatment on the spectrum is needed.The main analysis of this paper is to obtain high spectral image at 400~1100nm wavelength in the surface of the beef,after pretreated by many methods and selected feature wavelength for spectral data by successive projection algorithm,by using multiple regression model respectively for freshness and moisture content of the calibration and prediction modeling,through the model evaluation index to judge the pros and cons of each pretreatment method.Experimental results show that the 2 order 9 point S.Golay convolution smoothing method is the best pretreatment method for the prediction of the fresh degree and the moisture content of beef.
freshness of beef;moisture content;high spectral image;pretreatment;multiple linear regression;continuous projection algorithm;calibration set;prediction set
2016-10-08
遼寧省教育廳科學研究項目資助(LG201610)
宋凱(1964—),男,教授/博導,博士,研究方向:計算機視覺、智能檢測與控制等。
1003-1251(2017)02-0005-07
O657.33
A