章海亮,葉 青,羅 微,劉雪梅
(華東交通大學(xué)電氣與自動化工程學(xué)院,江西 南昌 330013)
基于LS-SVM高光譜成像魚新鮮度鑒別
章海亮,葉 青,羅 微,劉雪梅
(華東交通大學(xué)電氣與自動化工程學(xué)院,江西 南昌 330013)
基于高光譜成像光譜信息的魚新鮮度(魚不同冷凍時間以及凍融次數(shù))鑒別。首先,提取魚樣本感興趣區(qū)域(region of interest,ROI)光譜,分別采用蒙特卡羅無信息變量消除(Monte Carlo free information variable elimination,MCVE),連續(xù)投影算法(successive projections algorithm,SPA)和隨機青蛙算法(random frog,RF)提取特征波長,三種算法分別得到90,31和49個特征變量,采用最小二乘支持向量機作為分類模型,將90,31和49個特征變量作為LS-SVM模型的輸入變量建立分類模型,基于SPA-LS-SVM和MCVE-LS-SVM模型預(yù)測集識別率都達到了98%,而采用RF-LS-SVM建立的模型取得了較差的預(yù)測結(jié)果,模型預(yù)測集識別率都只是達到了88%。結(jié)果表明,SPA-LS-SVM作為分類模型優(yōu)于其他模型,SPA選擇的特征波長,不但可以簡化模型,還可以提高模型的預(yù)測精度,基于高光譜成像技術(shù)可以用于魚新鮮度(魚不同冷凍時間以及凍融次數(shù))鑒別。
蒙特卡羅無信息變量消除;連續(xù)投影;隨機青蛙;LS-SVM
隨著人們消費水平的提高,多寶魚由于其豐富的營養(yǎng)價值如低脂肪,高蛋白,富含多種維生素和礦物質(zhì),日益受到人們的青睞。但是由于魚類產(chǎn)品普遍具有水分含量高和易腐敗特點,蛋白質(zhì)在酶和微生物的綜合作用下,容易變質(zhì),致使魚類產(chǎn)品品質(zhì)下降,因此,魚類產(chǎn)品的新鮮度的預(yù)測和判別就很重要[1-6]。目前,一般采用微生物方法判別多寶魚肉的新鮮度和剩余存儲時間,這種方法盡管結(jié)果穩(wěn)定可靠,但是這是一種破壞性試驗,操作人員需要經(jīng)過專業(yè)訓(xùn)練,由于操作過程中要用到化學(xué)試劑,造成環(huán)境破壞,魚肉也不能繼續(xù)食用,較長的檢測時間也不能保證實時性[7]。
近年來,采用高光譜成像技術(shù)對魚類產(chǎn)品的實時和無損檢測進行的大量研究,相比較于物理化學(xué)法,高光譜成像技術(shù)具有快速、無損、成本低和預(yù)測準(zhǔn)確特點,在很多領(lǐng)域得到廣泛應(yīng)用[8-11]。采用高光譜成像技術(shù)獲得的數(shù)據(jù),圖像上的每一個像素點包含全波長范圍的光譜信息,可以具體到單個像素級別的分析,大大提高了分析精細(xì)度,可以根據(jù)需要,在整個對象的面上尋找提取感興趣區(qū)域,獲得對象的光譜數(shù)據(jù),而采用近紅外光譜分析技術(shù)嚴(yán)格意義上說,只能提取對象單個小區(qū)域的平均光譜數(shù)據(jù),不能同時提取對象整個面上區(qū)域的光譜數(shù)據(jù),高光譜成像技術(shù)具有圖像分析技術(shù)和光譜分析技術(shù)的雙重優(yōu)點,在魚類產(chǎn)品新鮮度分析領(lǐng)域具有非常大的潛力,其數(shù)據(jù)矩陣結(jié)構(gòu)原理如圖1所示。從圖1可知,高光譜數(shù)據(jù)塊是一種三維數(shù)據(jù),在每個波長上都有一幅灰度圖像與之對應(yīng),在圖像上每個像素點都包括全譜波長信息。
本文采用高光譜成像技術(shù)鑒別多寶魚的新鮮度,具體研究目的如以下4點:① 探尋高光譜成像數(shù)據(jù)的光譜信息和多寶魚新鮮度之間的定性關(guān)系;②分別采用CARS,SPA和GA挑選多寶魚的新鮮度特征波長;③ 比較不同的鑒別多寶魚新鮮度的模型性能;④ 確定最優(yōu)模型用于鑒別多寶魚的新鮮度。鑒別過程思路如下,首先獲取5個類別共160個樣本高光譜成像數(shù)據(jù),波長范圍381~1 023 nm,對原始高光譜成像數(shù)據(jù)進行黑白板校正;提取樣本感興趣區(qū)域光譜,作為樣本的光譜數(shù)據(jù);根據(jù)2∶1的比例建立樣本建模集和預(yù)測集;基于全譜和特征光譜分別建立鑒別模型;基于分類準(zhǔn)確率(correct classification rate,CCR)確定最優(yōu)鑒別模型。
圖1 高光譜成像數(shù)據(jù)矩陣Fig.1 Hyperspectral imaging data matrix
1.1 樣本來源及光譜的獲取
試驗用多寶魚購于杭州農(nóng)副產(chǎn)品水產(chǎn)交易中心,樣本重量規(guī)格在400~600 g之間。在水產(chǎn)交易中心現(xiàn)場進行樣本前處理,具體過程如下:每次在養(yǎng)殖水池?fù)瞥鲆粭l鮮活多寶魚,魚冰水休克,棒擊頭部致死,去除魚內(nèi)臟和頭尾,在冰水中洗干凈。每條多寶魚均勻切割成4份,作為4個樣本。采用塑料袋放置每個樣本,將塑料袋放置在盛滿新鮮碎冰的干凈白色泡沫保溫箱中,保溫箱底部開有滴水孔,運輸過程中部分碎冰化成水從滴水孔中流走,運輸專車在0.5~1 h內(nèi)將樣本快速運送至實驗室。160樣本分5類,分別用1~5表示5個類別,詳見表1所示。
表1 建模集和預(yù)測集統(tǒng)計信息Tab.1 Statistical information of calibration and prediction sets
1.2 數(shù)據(jù)采集系統(tǒng)
本試驗的魚樣本數(shù)據(jù)采集系統(tǒng)包括高光譜攝像機(N10E,Specim,F(xiàn)inland),150 W鹵素?zé)艟€光源2個(Oriel Instruments,Irvine,Cal.),鐵皮暗箱隔絕室內(nèi)燈光影響,步進導(dǎo)軌平臺由步進電機(IRCP0076,IsuzuOptics Corp,Taiwan,China)驅(qū)動,近紅外光譜儀,可接收的光譜波長范圍為381~1 023 nm,CCD成像相機,控制裝置和計算機。
1.3 高光譜數(shù)據(jù)采集
為了獲取到魚樣本不變形、不失真和清晰的高光譜成像數(shù)據(jù),需要調(diào)節(jié)CCD相機的曝光時間和步進導(dǎo)軌平臺移動速度,本研究中的步進導(dǎo)軌平臺移動速度為3.2 mm/s,曝光時間設(shè)置為0.08 s,近紅外光譜儀至樣本間距離為45 cm。采集數(shù)據(jù)時用紙巾吸去魚樣本表面的多余水分,將樣本置于步進導(dǎo)軌平臺上面,垂直于近紅外光譜儀移動,獲取三維魚樣本高光譜成像數(shù)據(jù)塊。分析軟件為Matlab 2010,Unscrambler 10.1及Origin8.5軟件平臺。為了減少CCD相機暗電流及各波長下光源強度分布不均勻的影響,對原始數(shù)據(jù)分析前需要對原始高光譜成像數(shù)據(jù)(Ⅰ)進行反射率校正。
1.4 特征波長選擇算法
為了簡化模型,提高模型運行效率和精度,本研究分別采用MCVE、SPA和RF算法選擇特征波長,關(guān)于MCVE[12-14]、SPA[15-16]和RF[17-20]原理詳見文獻。
2.1 魚樣本的光譜
通過魚樣本高光譜圖像上感興趣區(qū)域提取光譜,感興趣區(qū)域大小選擇在80×80左右的矩形區(qū)域內(nèi),得到的光譜波長范圍為381~1 023 nm,共計512個波長,由于在429 nm波長之前的光譜,存在部分噪聲且有用信息較少,本研究取429~1 023 nm波長范圍作為原始波長范圍,圖3中每一條光譜為樣本感興趣區(qū)平均光譜,從光譜曲線可知,在整個波長范圍內(nèi),最大反射率不高于0.25,從光譜曲線還可以看出,近紅外區(qū)域的反射率要高于可見光區(qū)域的反射率,在960 nm附近,近紅外光譜存在較大的吸收度,這是由于魚樣本的C-H功能鍵在此區(qū)域存在吸收峰。
2.2 Random frog算法選取特征波長
隨機青蛙算法(random frog,RF)是一種非常有用的特征波長提取算法,在每次建模運算時,該算法會評價參與建模變量的被選頻率值,被選頻率高的變量組合,用于替代原始光譜用于進一步的建模分析。本文隨機青蛙返回結(jié)果如圖3所示,圖3中橫虛線分別表示取被選頻率大于橫線對應(yīng)頻率的特征波長用于建模,或者說取某條橫線之上的變量用于建模,本研究采用隨機青蛙算法獲取到的變量數(shù)量為49個。表2是采用隨機青蛙選擇的變量具體波長點。
圖2 160個魚樣本光譜Fig.2 Spectra of 160 fish samples
圖3 Random frog變量被選頻率Fig.3 Frequency of variable selections by RF
表2 Random frog選擇特征波長Tab.2 Effective wavelengths selected by RF
2.3 MCUVE關(guān)鍵變量提取
圖4表示基于MCUVE算法挑選特征波長結(jié)果圖。圖4表示RMSEC和RMSEP隨建模因子數(shù)量變化趨勢,RMSEC值隨建模變量數(shù)量變化趨勢和每個變量穩(wěn)定性分布。從圖4(a)可以看出,采用8個建模因子數(shù)量時,得到的RMSEC和RMSEP值最小,后面隨著建模因子數(shù)量的增加,模型復(fù)雜度也隨之增加,降低了模型精度;圖4(b)中RMSECV值起初呈急劇減小趨勢,表明采樣過程中,無信息變量被不斷消除,然后RMSECV值變化不明顯,表明變量數(shù)量變化不明顯,最后RMSECV值逐漸增大,表明一些關(guān)鍵變量被消除;圖4(c)中,兩天虛線之間的波長是要被剔除的,不能參與建模分析,閾值1.57的確定是結(jié)合圖4(b)和圖4(c)決定,由圖4(b)可知,保留變量數(shù)量為90個,在由圖4(c)可知,閾值在1.57處,虛線之外的波長變量數(shù)量正好為90個。在MCVE算法中,一些無用變量被消除,一些關(guān)鍵變量被保留,本研究中,90個關(guān)鍵變量被提取出來用于替代原始光譜進行進一步的分析建模。
圖4 MCVE關(guān)鍵變量提取結(jié)果圖Fig.4 Key variables selection results by MCVE
2.4 連續(xù)投影算法選取特征波長
原始波長數(shù)由470個經(jīng)過遺傳算法選擇后變?yōu)?1個波長,采用連續(xù)投影算法后,建模變量大大減少,極大的簡化了模型。說明一點,圖5是SPA算法得到的特征波長在全譜波長上的具體位置信息,SPA算法選擇的特征波長詳見表3。圖6表示模型的RMSEC值變化趨勢,隨著SPA算法選擇的特征變量數(shù)量的增加,RMSEC的值起初急劇變小,說明選擇的31個特征波長為最優(yōu)特征波長,而第31個波長點以后的波長對模型的RMSEC值影響不大。
表3 SPA選擇特征波長Tab.3 Effective wavelengths selected by SPA
2.5 基于光譜建立LS-SVM類別預(yù)測模型
基于LS-SVM的高光譜成像魚不同冷凍時間以及冷凍解凍次數(shù)類別的鑒別模型。LS-SVM模型在很多領(lǐng)域都得到了廣泛應(yīng)用,可以處理線性和非線性的問題,參數(shù)gam用于減小模型訓(xùn)練錯誤率和簡化模型,參數(shù)sig2用于定義非線性轉(zhuǎn)換,從一個向量空間向高維空間轉(zhuǎn)換[21-22]。本研究采用的LS-SVM分類模型基于LS-SVM工具箱。
選取429~1 023 nm的波段作為樣本光譜信息分析基礎(chǔ),把選取的470個波段輸入建立LS-SVM類別預(yù)測模型,模型的預(yù)測集識別率為96%,為了進一步降低模型的復(fù)雜度,對原始光譜采用MCVE算法,連續(xù)投影算法和RF算法分別得到90,31和49個波段變量,且把這90,31和49個波段變量分別作為LS-SVM模型的輸入,如表4所示。
圖5 連續(xù)投影算法選擇特征波長Fig.5 SPA selected variables
圖6 連續(xù)投影算法選擇特征波長RMSEP變化趨勢Fig.6 Trend of RMSEP based on characteristic wavelengths selected by SPA
表4 基于不同的波長建立鑒別模型的分類準(zhǔn)確率Tab.4 Correct classification rate of different models based on different wavelengths selection methods
從表3中可以看到,基于全譜的LS-SVM模型在預(yù)測時,基于光譜模型識別率分別為96%,當(dāng)把MCVE提取的90個參數(shù)變量作為LS-SVM模型輸入時準(zhǔn)確率為98%,把SPA選擇的特征變量作為LS-SVM模型的輸入,識別率分別達到98%,當(dāng)把RF選擇的光譜變量作為LS-SVM模型的輸入時,模型精度為88%,不難看出,為了簡化模型和選擇精度最高模型,本文把SPA選擇的31光譜變量作為最優(yōu)特征變量,把LSSVM分類模型作為最優(yōu)建模模型。
本文基于高光譜成像技術(shù)對魚不同冷凍時間以及冷凍解凍次數(shù)類別樣本共5個類別進行分類識別。首先,獲取魚樣本ROI光譜曲線,分別采用MCVE,SPA和RF算法提取特征波長,將3種算法分別得到90,31和49個特征變量作為模型LS-SVM模型的輸入建立分類模型,基于SPA-LS-SVM和MCVE-LS-SVM模型預(yù)測集識別率都達到了98%,而采用RF-LS-SVM模型預(yù)測集識別率都只是達到了88%。結(jié)果表明,SPALS-SVM和MCVE-LS-SVM作為分類模型優(yōu)于RF-LS-SVM模型,SPA和CARS選擇的特征波長,不但可以簡化模型,還可以提高模型的預(yù)測精度,基于高光譜成像技術(shù)可以用于魚新鮮度(魚不同冷凍時間以及凍融次數(shù))鑒別。
[1]劉曉華,馬儷珍,郭耀華,等.不同保鮮劑對4℃冷藏鯰魚魚糜保鮮效果的影響[J].食品科學(xué),2014(24):316-320.
[2]RZEPKA M,OZOGUL F,SUROWKA K,et al.Freshness and quality attributes of cold stored Atlantic bonitogravad[J].International Journal of Food Science and Technology,2013,48(6):1318-1326.
[3]KIMIYA T,SIVERTSEN A H,HEIA K.VIS/NIR spectroscopy for non-destructive freshness assessment of Atlantic salmon fillets[J].Journal of Food Engneering,2013,116(3):758-764.
[4]LIU D,ZENG X A,SUN D W.NIR spectroscopy and imaging techniques for evaluation of fish quality-A review[J].Applied Spectroscopy Reviews,2013,48(8):609-628.
[5]CHENG J,SUN D.Rapid Quantification analysis and visualization of escherichia coli loads in grass carp fish flesh by hyperspectral imaging method[J].Food and Bioprocess Technology,2015,8(5):951-959.
[6]CHENG J,SUN D,PU H.Combining the genetic algorithm and successive projection algorithm for the selection of feature wavelengths to evaluate exudative characteristics in frozen–thawed fish muscle[J].Food Chemistry,2016,197:855-863.
[7]章海亮,朱逢樂,劉雪梅,等.基于圖像光譜信息融合的魚不同凍藏時間及凍融次數(shù)鑒別[J].農(nóng)業(yè)工程學(xué)報,2014(6):272-278.
[8]HE H,SUN D.Hyperspectral imaging technology for rapid detection of various microbial contaminants in agricultural and food products[J].Trends in Food Science&Technology,2015,46(1):99-109.
[9]CHENG J,SUN D.Hyperspectral imaging as an effective tool for quality analysis and control of fish and other seafoods:Current research and potential applications[J].Trends in Food Science&Technology,2014,37(2):78-91.
[10]KHOJASTEHNAZHAND M,KHOSHTAGHAZA M H,MOJARADI B,et al.Comparison of visible-near infrared and short wave infrared hyperspectral imaging for the evaluation of rainbow trout freshness[J].Food Research International,2014,56:25-34.
[11]ZHU F,ZHANG D,HE Y,et al.Application of visible and near infrared hyperspectral imaging to differentiate between fresh and frozen-thawed fish fillets[J].Food and Bioprocess Technology,2013,6(10):2931-2937.
[12]ANTANASIJEVI D,POCAJT V,PERI-GRUJI A,et al.Modelling of dissolved oxygen in the Danube River using artificial neural networks and Monte Carlo Simulation uncertainty analysis[J].Journal of Hydrology,2014,519:1895-1907.
[13]HUANG Z,SHA S,RONG Z,et al.Feasibility study of near infrared spectroscopy with variable selection for non-destructive determination of quality parameters in shell-intact cottonseed[J].Industrial Crops and Products,2013,43:654-660.
[14]HAN Q,WU H,CAI C,et al.An ensemble of Monte Carlo uninformative variable elimination for wavelength selection[J].Analytica Chimica Acta,2008,612(2):121-125.
[15]LIU K,CHEN X,LI L,et al.A consensus successive projections algorithm-multiple linear regression method for analyzing near infrared spectra[J].Analytica Chimica Acta,2015,858:16-23.
[16]GUAN X C,CHEN X J,JIANG J.Integration of modified uninformative variable elimination and successive projections algorithm for determination harvest time of laver by using visible and near infrared spectra[J].African Journal of Agricultural Research,2011,6(27):5987-5991.
[17]LI X,SUN C,LUO L,et al.Determination of tea polyphenols content by infrared spectroscopy coupled with iPLS and random frog techniques[J].Computers and Electronics in Agriculture,2015,112:28-35.
[18]HU M,DONG Q,LIU B,et al.Estimating blueberry mechanical properties based on random frog selected hyperspectral data[J]. Postharvest Biology and Technology,2015,106:1-10.
[19]YUN Y,LI H,E WOOD L R,et al.An efficient method of wavelength interval selection based on random frog for multivariate spectral calibration[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2013,111:31-36.
[20]LI H,XU Q,LIANG Y.Random frog:An efficient reversible jump Markov Chain Monte Carlo-link approach for variable selection with applications to gene selection and disease classification[J].Analytica Chimica Acta,2012,740:20-26.
[21]LIU X,LIU J.Measurement of soil properties using visible and short wave-near infrared spectroscopy and multivariate calibration[J].Measurement,2013,46(10):3808-3814.
[22]SHAO Y N,ZHAO C J,BAO Y D,et al.Quantification of nitrogen status in rice by least squares support vector machines and reflectance spectroscopy[J].Food and Bioprocess Technology,2012,5(1):100-107.
Classification of Fish Freshness Based on LS-SVM and Hyperspectra Imaging Technology
Zhang Hailiang,Ye Qing,Luo Wei,Liu Xuemei
(School of Electrical and Automation Engineering,East China Jiaotong University,Nanchang 330013,China)
This study investigated the feasibility of using near infrared hyperspectral imaging system (NIR-HIS) technique for non-destructive identification of fresh and frozen-thawed fish fillets.Hyperspectral images of freshness,storage time,and frozen-thawed times of fillets for turbot flesh were obtained in the spectral region of 381~1 023 nm.Reflectance values were extracted from each region of interest(ROI)of each sample.Monte Carlo free information variable elimination (MCVE)algorithm,successive projections algorithm (SPA)and random frog(RF)were carried out to identify the most significant wavelengths.Based on the ninety,thirty-one and fortynine wavelengths suggested by MCVE,SPA and RF,respectively,two classified models (least squares-support vector machine,LS-SVM and SIMCA)were established.Among the established models,SPA-LS-SVM model performed well with the highest classification rate(100%)in calibration and 98%in prediction sets.SPA-LSSVM and MCVE-LS-SVM models obtained better results 98%of classification rate in prediction set with thirtyone and ninety effective wavelengths respectively.The RF-LS-SVM model obtained poor results with 88%of classification rate in prediction set.The results showed that NIR-HIS technique can be used to identify the varieties of fresh and frozen-thawed fish fillets rapidly and non-destructively,and SPA was effective wavelengths selection method.
monte carlo free information variable elimination(MCVE);successive projections algorithm(SPA);random frog(RF);least squares-support vector machine(LS-SVM)
O433
A
1005-0523(2017)02-0105-07
(責(zé)任編輯 姜紅貴)
2016-10-01
國家自然科學(xué)基金項目(61565005);江西省科技支撐項目(20142BDH80021)
章海亮(1977—),男,副教授,博士,主要研究方向為高光譜成像技術(shù)及其應(yīng)用。
劉雪梅(1978—),女,副教授,博士,主要研究方向為高光譜成像技術(shù)及其應(yīng)用。