王松磊,吳龍國 ,馬天蘭,陳亞斌,何建國, *,賀曉光,康寧波
1.寧夏大學(xué)土木與水利工程學(xué)院,寧夏 銀川 750021 2.寧夏大學(xué)農(nóng)學(xué)院,寧夏 銀川 750021
高光譜技術(shù)的羊肉品種多波段識別研究
王松磊1,2,吳龍國1,馬天蘭2,陳亞斌2,何建國1, 2*,賀曉光2,康寧波1
1.寧夏大學(xué)土木與水利工程學(xué)院,寧夏 銀川 750021 2.寧夏大學(xué)農(nóng)學(xué)院,寧夏 銀川 750021
利用可見/近紅外(400~1 000 nm)及近紅外(900~1 700 nm)高光譜成像技術(shù)對寧夏地區(qū)灘寒雜交、鹽池灘羊、小尾寒羊三個品種羊肉進行識別研究。針對不同波段光譜特點,分別優(yōu)選出Baseline及SG卷積平滑光譜預(yù)處理方法,并運用連續(xù)投影算法(SPA)提取特征波長,結(jié)合線性判別分析(LDA)及徑向基核函數(shù)支持向量機(RBFSVM)模型進行全波段及特征波長識別分析。結(jié)果表明不同波段高光譜對羊肉品種識別均獲得較好效果,其中400~1 000 nm波段采用Baseline-Fullwave-RBFSVM及12個特征波長下準(zhǔn)確率為100%與98.75%,900~1 700 nm波段采用Baseline-Fullwave-RBFSVM及7個特征波長下準(zhǔn)確率為96.25%與87.80%;RBFSVM非線性分類準(zhǔn)確率高于LDA線性判別結(jié)果,400~1 000 nm波段識別準(zhǔn)確率優(yōu)于900~1 700 nm波段,說明三種羊肉在色澤紋理上差異比成分含量顯著,利用高光譜成像技術(shù)結(jié)合RBFSVM方法能夠獲得較優(yōu)的羊肉品種識別效果。
高光譜成像技術(shù);羊肉品種;多波段識別;特征波長;支持向量機
寧夏鹽池灘羊是我國特有的綿羊品種,主要分布于賀蘭山東麓平坦的山前荒原及河?xùn)|丘陵,特定的自然生態(tài)環(huán)境賦予了灘羊肉鮮香細(xì)嫩,低脂無膻,低膽固醇,脂肪分布均勻,肌肉紋理清晰,口感醇正的優(yōu)良品質(zhì),產(chǎn)品價格比同地區(qū)其他羊肉價格每公斤高10元以上[1]。近年來市場上利用其他品種羊肉假冒灘羊肉謀取高利事件時有發(fā)生,因此對羊肉品質(zhì)進行快速識別及品種定性分析成為當(dāng)前灘羊產(chǎn)業(yè)發(fā)展亟需解決的問題。高光譜成像技術(shù)將二維成像技術(shù)和光譜技術(shù)有機地結(jié)合在一起,具有連續(xù)多波段、光譜分辨率高和圖像光譜合一等特點[2],在肉品品質(zhì)檢測上具有顯著優(yōu)勢。Qiao等[3-4]在400~1 000 nm波段掃描檢測豬肉大理石花紋,利用PCA提取出的主成分結(jié)合人工神經(jīng)網(wǎng)絡(luò)算法進行分級,準(zhǔn)確率達(dá)到85%;最近又結(jié)合高光譜技術(shù)針對pH值、色澤、系水力3個指標(biāo)各優(yōu)選出6個特征波長,并結(jié)合ANN算法建立預(yù)測模型,預(yù)測相關(guān)系數(shù)為0.77,0.55和0.86;Barbin等[5-6]應(yīng)用近紅外區(qū)域的高光譜獲取豬肉表面的光譜信息,結(jié)合導(dǎo)數(shù)法、標(biāo)準(zhǔn)化歸一及多元散射校正預(yù)處理,利用偏最小二乘回歸(PLS)建立表面色澤、滴水損失、pH值預(yù)測模型,相關(guān)系數(shù)分別為0.93,0.87和0.83;彭彥昆等[7-10]利用可見VIS/NIR高光譜對豬肉新鮮度及嫩度、牛肉品質(zhì)及細(xì)菌總數(shù)等進行檢測分析,建立了多元線性回歸等多種預(yù)測模型;Sun[11-15]利用NIR高光譜在900-1700nm波段對羊肉水分、脂肪、蛋白含量采用PLSR建立預(yù)測模型,決定系數(shù)最高為0.88,并在該波段對羊肉顏色、滴水損失建立PLSR預(yù)測模型,決定系數(shù)最高達(dá)0.93;王家云等[1]利用NIR高光譜成像技術(shù)對灘羊肉蛋白質(zhì)和脂肪含量、pH 值進行無損檢測研究,采加權(quán)β系數(shù)法提取特征波長建立PLSR 模型;鄒小波等[16-17]在NIR波段范圍分別采用PLS,iPLS,biPLS,siPLS和MSC-SG-SVM等算法建立TVB-N含量的預(yù)測模型,其中預(yù)測肴肉新鮮度等級準(zhǔn)確率為87.5%;上述研究可以看出利用高光譜技術(shù)在VIS/NIR及NIS不同波段均可獲得較好的識別效果,在400~1 000 nm波段主要為分子基團的三倍頻及可見光吸收,倍頻吸收信號相對較弱,主要特征與其外部色澤紋理相關(guān);在900~1 700 nm則主要為分子基團二倍頻吸收,光譜吸收信號相對較強,主要與物質(zhì)化學(xué)成分及含量有關(guān);本工作利用高光譜技術(shù)對寧夏地區(qū)灘羊及與灘羊品質(zhì)相近的灘寒雜交羊、小尾寒羊三種羊肉進行分類識別研究,并對400~1 000及900~1 700 nm波段定性分析識別特點進行比較分析。
1.1 材料
選用寧夏鹽池灘羊及與灘羊品質(zhì)相近本地飼養(yǎng)的灘寒雜交、小尾寒羊三個品種羊肉為研究對象,實驗樣本來源于寧夏吳忠市澇河橋清真肉食品有限公司及寧夏鹽池鑫海清真食品有限公司,樣本均來自10月齡不同品種羯羊,經(jīng)屠宰后放置在0 ℃下冷藏24 h完成排酸處理后,取樣部位為羊背外脊肌肉,取出羊肉樣品進行分割,剔除背部油層和筋膜后,羊肉樣品用真空包裝后放入保溫箱運送至實驗室,放置于4 ℃冷柜備用,光譜掃描前修整切成長×寬×高分別為4 cm×2 cm×1 cm的長方塊,室溫放置30 min后用濾紙吸干羊肉樣品表面的水分,用兩臺不同波段光譜儀同步掃描。
1.2 儀器
試驗分別采用Vis/NIR型高光譜及NIR高光譜兩套檢測系統(tǒng),波段范圍分別為400~1 000及900~1 700 nm,如圖1所示。Vis/NIR高光譜系統(tǒng)采用美國Headwall公司生產(chǎn)的HyperSpec VNIR N型設(shè)備,光譜分辨率2.8 nm,狹縫寬度25 μm,相機像素尺寸8.0 μm,配備Imspector N型成像光譜儀和G4-232增強型EMCCD相機、VT-80自動電控位移平臺及2個鹵素?zé)艟€光源;NIR高光譜系統(tǒng)采用芬蘭Specimen公司生產(chǎn)的HyperSIS-NIR型近紅外光譜成像儀,光譜分辨率5 nm,狹縫寬度30 μm,系統(tǒng)包括Imspector N17E光譜成像光譜儀,Models XC-130型CCD相機,PSA200-11-X型自動電控位移平臺及4個35 W鹵素?zé)?,?shù)據(jù)采集軟件采用北京卓立漢光公司開發(fā)的Spectra SENS軟件。
圖1 400~1 000和900~1 700 nm波段高光譜成像系統(tǒng)
由于各個波段光源強度分布不均勻以及儀器中暗電流的存在,導(dǎo)致光源強度分布較弱波段的圖像有非常大的噪音,會掩蓋該波段的樣品信息,同時由于羊肉樣本形狀、表面紋理、色澤及反光度各異,因此,利用高光譜采集樣本前需進行黑白校正及掃描參數(shù)設(shè)置,VIS/NIR高光譜系統(tǒng)經(jīng)過反復(fù)實驗,確定羊肉樣本的最佳采集參數(shù)為:曝光時間15 ms,物距380 mm,輸送速度160 μm·s-1,圖像分辨率1 004×501 pix,掃描距離80 mm;近紅外高光譜成像系統(tǒng)最佳采集參數(shù)為:曝光時間20 ms,物距380 mm,輸送速度15 mm·s-1,圖像分辨率320×300,掃描線長度200 mm。
1.3 數(shù)據(jù)處理方法
樣本光譜掃描后,先采用ENVI 4.6軟件提取感興趣區(qū)域高光譜圖像并進行預(yù)處理,實驗嘗試用預(yù)處理方法有:卷積平滑(SG)、標(biāo)準(zhǔn)正態(tài)變量變換(SNV)、多元散射校正(MSC)、正交信號校正(OSC)、區(qū)域歸一化(Area normalize)、最大歸一化(Max normalize)、卷積平滑導(dǎo)數(shù)(SG derivative)、一階導(dǎo)數(shù)(FD)、基線校正(Baseline)和Deresolve等。
三個品種羊肉光譜信息混雜,數(shù)據(jù)維度高及冗余度高,可運用連續(xù)投影算法(SPA)進行降維,提取出聚類效果較好的特征波長進行后續(xù)建模處理。SPA方法能有效消除波長之間的多重共線性問題,得到光譜信息中最低限度冗余信息的變量數(shù),提高信噪比和模型穩(wěn)健性。波長提取過程中首先得到光譜波長為j列的矩陣X,規(guī)定Xk(0)為初始迭代向量,N為需要提取變量個數(shù),選光譜矩陣中任1列Xj,基于Xj構(gòu)造正交投影算子,分別計算Xj對剩余矩陣的最大投影向量k(i+1)=arg(max(‖x(i+1)j‖)),并進行多元線性回歸分析,得到驗證集的均方根誤差,采用留一交叉驗證法確定最小RMSE所對應(yīng)的特征波長和變量數(shù)N。特征波長提取及預(yù)測模型建立主要應(yīng)用Matlab R2011a(The Mathworks Inc.,Natick,MA)及Unscrambler X 10.2(CAMO Software AS,OSLO,Norway)軟件。
建模方法選用線性判別分析(LDA)及支持向量機(support vector machine,SVM)。LDA依據(jù)同類方差和與類間均方差比最大原則,它的分類依據(jù)為線性判別函數(shù),在d維空間中的某一樣品x,線性判別函數(shù)為
g(x)=wTx+w0
其中,x={x1,x2, …,xd}是d維特征向量;w={w1,w2, …,wd},稱為權(quán)向量;w0稱為閾值權(quán)[18]。
SVM是基于統(tǒng)計學(xué)習(xí)理論的最優(yōu)分類面判別方法,能有效改善基于傳統(tǒng)學(xué)習(xí)理論的神經(jīng)網(wǎng)絡(luò)收斂速度慢、穩(wěn)定性及泛化能力差等問題,在非線性、小樣本數(shù)量、高維空間的模式識別方面具有較強的優(yōu)勢和潛力。對于非線性可分問題,SVM經(jīng)常選用多項式核函數(shù)、徑向基核函數(shù)、S型核函數(shù)將數(shù)據(jù)映射到高維空間來處理,但如何選擇核函數(shù),尚未有明確的指導(dǎo)原則,要經(jīng)過多次實驗確定[19]。經(jīng)尋優(yōu)對比本實驗選擇徑向基核函數(shù)支持向量機(RBF-SVM)。
2.1 樣本選擇
利用Unscrambler X10.2軟件以固定間隔方式對三個品種樣本進行取樣,選擇2/3樣本作為校正集,1/3作為驗證集。結(jié)果如表1所示。400~1 000 nm波段范圍有效樣本總數(shù)為263個,其中校正集樣本175個,驗證集樣本88個;900~1 700 nm波段范圍有效樣本總數(shù)為283個,其中校正集樣本187個,驗證集樣本96個;選擇整塊羊肉作為感興趣區(qū)域,利用Envi 4.6軟件提取感興趣區(qū)域平均值作光譜曲線如圖2所示。
2.2 原始光譜及預(yù)處理光譜的LDA模型
原始光譜曲線中既含有羊肉樣品本身的化學(xué)信息,還有許多無關(guān)的信息,如樣品的形狀、背景噪音、雜散光、儀器暗流等,黑白校正只能消除光照強度的不均勻和儀器暗電流的影響,不能徹底消除全部無關(guān)信息對實驗結(jié)果所帶來的誤差。實驗中由于羊肉樣品表面分布差異性大,光照不均勻,導(dǎo)致同一羊肉樣品不同采集區(qū)域的光譜差異較大,為了提高化學(xué)計量學(xué)所建模型的準(zhǔn)確性和可靠性,對原始光譜信息進行光譜預(yù)處理是非常必要的。表2是不同預(yù)處理方法光譜LDA分類模型比較結(jié)果。
表1 不同品種羊肉樣本選擇
圖2 原始光譜曲線
表2 不同預(yù)處理方法光譜LDA線性分類結(jié)果
對三種羊肉原始光譜預(yù)處理后進行全波段線性判別分析(LDA)評價。在400~1 000 nm波段樣本總數(shù)為263個;900~1 700 nm波段樣本數(shù)為283個。從表2可以看出在400~1 000 nm波段范圍內(nèi)原始光譜與預(yù)處理光譜的線性判別結(jié)果有明顯差異,線性判別結(jié)果最好的是基線校正預(yù)處理,校正集高達(dá)99.44%,并且對模型的驗證也很好,達(dá)到96.67%,模型穩(wěn)健性較高;線性判別結(jié)果相對較差的是正交信號校正(OSC)預(yù)處理,校正集為86.67%,并且對模型的驗證結(jié)果也較低,同樣達(dá)到86.67%,該預(yù)處理方法提高光譜與羊肉特征之間的線性關(guān)系,同時刪除部分有效信息出現(xiàn)過擬合現(xiàn)象;SNV可較好消除肉厚度及表面不平整引起的光譜差異;一階導(dǎo)數(shù)和卷積求導(dǎo)預(yù)處理光譜校正集結(jié)果都非常高,高達(dá)100%,但對模型的驗證結(jié)果卻非常低,僅為48.33%,求導(dǎo)的過程中可能對部分噪音進行放大,掩蓋了有效信息。在900~1 700 nm波段范圍內(nèi)原始光譜與預(yù)處理后光譜的線性判別準(zhǔn)確率均在90%以上;準(zhǔn)確率最高的是卷積平滑(SG)預(yù)處理,校正集達(dá)到98.89%,模型驗證為100%,具有較高的穩(wěn)健性,正交信號校正預(yù)處理將光譜數(shù)據(jù)矩陣與羊肉成分含量數(shù)據(jù)矩陣正交,在剔除無關(guān)信息同時可能導(dǎo)致部分有效信息被消除,模型校正集與驗證集準(zhǔn)確率分別為93.89%和95%;導(dǎo)數(shù)法預(yù)處理光譜校正集結(jié)果都非常高,高達(dá)98.33%和95%,但模型驗證準(zhǔn)確率僅為36.67%和28.33%,不能對羊肉品種進行準(zhǔn)確分類識別。
圖3為400~1 000 nm波段及900~1 700 nm波段下三種羊肉樣本Baseline、SG卷積平滑預(yù)處理后的光譜曲線。對比原始光譜曲線與預(yù)處理曲線,可以看出原始光譜曲線中存在的噪聲、基線漂移、多重共線性等現(xiàn)象被消除。
2.3 不同波段光譜吸收特征分析
在400~1 000 nm波段及900~1 700 nm波段范圍對三種不同品種羊肉光譜取平均值如圖4所示。
由上述光譜反射曲線得出,在610~780 nm波段可見光波段肉品在橙紅色區(qū)域反射率較強,在400~570 nm波段光譜反射值較低,新鮮羊肉在可見光區(qū)域由于肌紅蛋白與血紅蛋白的共同作用下呈現(xiàn)紅色,而與之呈互補色的青綠色區(qū)域光譜吸收率較高;在近紅外區(qū)域,光譜吸收取決于物質(zhì)分子基團光子能量吸收與能級躍遷,不同物質(zhì)具有特定的波長吸收組合[9],羊肉脂肪、蛋白及水分含量約占質(zhì)量的99%,因此光譜吸收主要與其所含的—OH,—CH和—NH2等基團緊密相關(guān):940~960 nm區(qū)域可分析為水分中—OH的三倍頻特征吸收帶,1 020~1 050 nm則為—NH的三倍頻特征吸收帶;1 190~1 220 nm為—CH基團三倍頻吸收帶;1 400~1 600 nm出峰值幅頻較寬應(yīng)為H2O的吸收帶,1 670 nm應(yīng)為—CH基團二倍頻吸收帶;不同品種之間羊肉光譜反射值差不同應(yīng)歸結(jié)為成分含量、組成結(jié)構(gòu)及品質(zhì)之間的差異,為光譜特征波長選擇及不同品種羊肉識別提供理論分析依據(jù)。
圖3 (a) 400~1 000 nm羊肉樣本Baseline預(yù)處理光譜曲線;(b) 900~1 700 nm三種羊肉樣本SG卷積平滑預(yù)處理光譜曲線
圖4 不同品種羊肉在400~1 000 nm波段及900~1 700 nm波段平均光譜曲線
2.4 特征波長提取
SPA方法依據(jù)正交投影信息來選擇相關(guān)性最小的特征波長,達(dá)到消除光譜信息冗余及簡化模型結(jié)構(gòu)目的。首先波長數(shù)m的選擇依據(jù)均方根誤差RMSE得到,特征波長所含羊肉品種差異有效信息與真實值之間具有較小的偏差,由圖5(a)可知,當(dāng)特征波長數(shù)為12之前,RMSE處于顯著下降階段,之后RMSE隨著波長數(shù)m的增加處于較平穩(wěn)的變化階段,m=12時,RMSE=0.1529,特征波長所含羊肉品種差異信息與真實值之間具有較高的一致性。圖5(b)為選擇的特征波長,橫軸為400~1 000 nm范圍中125個波段數(shù),所選擇特征波長為401,406,410,430,445,468,502,559,631,891,977和991 nm;主要集中在羊肉光譜吸收較強、反射率較低的在400~570 nm波段。
在900~1 700 nm范圍共采集256個波段,由圖6(a)可得,當(dāng)特征波長數(shù)m為7之前,RMSE處于顯著下降階段,之后RMSE隨著波長數(shù)m的增加逐漸趨于平穩(wěn),m=7時,RMSE=0.224 1,特征波長所含信息與真實值之間偏差較小,達(dá)到了模型構(gòu)建要求。圖6(b)為選擇的特征波長,橫軸為900~1 700 nm范圍中256個波段數(shù),所選擇特征波長為984,1 121,1 234,1 312,1 466,1 645和1 678 nm,對照光譜吸收曲線,提取特征波長均在波峰或者波谷區(qū)域,波峰或波谷為多種分子基團共同作用效果,出現(xiàn)區(qū)域為某一主要分子基團吸收波長帶產(chǎn)生一定偏移。
2.5 全波段及特征波長下羊肉品種LDA識別模型
實驗分別選用LDA線性判別模型及SVM非線性識別模型對不同波段下羊肉品種識別進行比較研究,并對全部波段及SPA提取特征波長建立分類模型進行對比分析。圖7(a)和(b)為400~1 000 nm經(jīng)Baseline預(yù)處理全波段及特征波長下LDA線性判別方法對三種羊肉識別結(jié)果,圖7(c)和(d)為900~1 700 nm經(jīng)SG卷積平滑處理后全波段及特征波長下LDA線性判別方法對三種羊肉識別結(jié)果。
在400~1 000 nm波段有效樣本263個,固定間隔選擇校正集樣本175個,驗證集88個,建立全波段LDA線性判別模型對驗證集的識別結(jié)果為:10個灘寒雜交羊肉樣本被識別為鹽池灘羊,8個鹽池灘羊肉樣本被識別灘寒雜交,小尾寒羊肉樣本識別全部正確,總體識別準(zhǔn)確率為79.54%;對SPA提取12個特征波長建立LDA判別模型進行分析,7個灘寒雜交羊肉樣本被識別為鹽池灘羊,7個鹽池灘羊肉樣本被識別為灘寒雜交,3個鹽池灘羊肉樣本被識別為小尾寒羊,小尾寒羊肉樣本識別全部正確,總體識別準(zhǔn)確率為80.68%。從識別結(jié)果得出:在400~1 000 nm可見/近紅外波段高光譜獲取主要以羊肉表面色澤紋理特征為主,LDA線性判別方法對羊肉品種上述特征進行分類準(zhǔn)確率約為80%,說明三種不同品種羊肉之間存在一定的品質(zhì)特征差異,但差異特征線性區(qū)分關(guān)系相對較弱;灘寒雜交羊肉與鹽池灘羊肉雙方誤判率較高,小尾寒羊與灘寒雜交、鹽池灘羊肉樣本之間的誤判率較低,說明灘寒雜交羊肉與鹽池灘羊肉色澤紋理等品質(zhì)相對較近,與小尾寒羊之間的差異相對較明顯;全波段(Baseline-Fullwave-LDA)與特征波長下(Baseline-SPA-LDA)識別準(zhǔn)確率無明顯差異,體現(xiàn)出特征波長提取的有效性及LDA判別模型的穩(wěn)健性。
圖5 400~1 000 nm波段范圍利用SPA方法提取特征波長
圖6 900~1 700 nm波段范圍利用SPA方法提取特征波長
在900~1 700 nm波段獲取有效樣本283個,以固定間隔選擇校正集175個,驗證集96個,建立全波段LDA線性判別模型對驗證集的識別結(jié)果為:4個灘寒雜交羊本被識別成鹽池灘羊,4個鹽池灘羊肉樣本被識別為小尾寒羊,2個小尾寒羊樣本被識別為鹽池灘羊,總體識別準(zhǔn)確率為89.58%;對SPA提取7個征波長下建立LDA判別模型進行分析,2個灘寒雜交羊肉樣本被識別成鹽池灘羊,2個灘寒雜交羊本被識別成小尾寒羊,3個鹽池灘羊肉樣本被識別為小尾寒羊,7個小尾寒羊樣本被識別成鹽池灘羊,總體識別準(zhǔn)確率為85.41%。利用900~1 700 nm近紅外波段高光譜主要獲取羊肉脂肪、蛋白、含水量等化學(xué)成分及內(nèi)部空間結(jié)構(gòu)信息,并以此為特征對羊肉品種進行識別。利用近紅外高光譜技術(shù)對羊肉品種識別達(dá)到了相對較高的準(zhǔn)確度,驗證集全波段識別準(zhǔn)確率接近90%,特征波長下準(zhǔn)確率達(dá)85%以上,說明灘寒雜交羊肉、鹽池灘羊肉與小尾寒羊肉在成分含量上有明顯差異,可以作為品種識別方法,但三個品種樣本互有誤判,說明由于三種羊受到飼養(yǎng)條件、年齡、性別等因素影響,羊肉內(nèi)部品質(zhì)特征有一定的交叉性;特征波長下(Baseline-SPA-LDA)羊肉品種識別率較之全波段(Baseline-Fullwave-LDA)下降了4個百分點,說明在近紅外區(qū)域采用SPA方法提取特征波長使部分有效信息被剔除,但在可容忍的范圍之內(nèi),可以用上述7個特征波長替代全波段進行品種識別的LDA分析。
在900~1 700 nm全波段及特征波長下對三種羊肉進行線性判別分析識別準(zhǔn)確率均高于400~1 000 nm全波段及特征波長,說明以內(nèi)部品質(zhì)特征為依據(jù)的羊肉品種識別更適合于線性判別模型,但總體分類準(zhǔn)確率較低,應(yīng)加強對羊肉品種的非線性分類模型的探索研究。
圖7 400~1 000及900~1 700 nm波段全波長及特征波長下LDA方法對三種羊肉分類識別結(jié)果
2.6 全波段及特征波長下羊肉品種SVM識別模型
圖8(a)和(b)為400~1 000 nm經(jīng)Baseline預(yù)處理全波段及特征波長下RBF-SVM非線性判別方法對三種羊肉識別結(jié)果,圖8(c)和(d)為900~1 700 nm經(jīng)SG卷積平滑處理后全波段及特征波長下RBF-SVM非線性判別方法對三種羊肉識別結(jié)果(其中0為灘寒雜交羊肉樣本,1為鹽池灘羊肉樣本,2為小尾寒羊肉樣本)。
圖8 400~1 000及900~1 700 nm波段全波長及特征波長下SVM方法對三種羊肉分類識別結(jié)果
在400~1 000 nm全波段利用RBF-SVM模型對三個品種驗證集樣本識別準(zhǔn)確率為100%(校正集及驗證集的樣本選擇同上LDA模型分析),利用SPA方法提取出的12個特征波長進行RBF-SVM分析,驗證集中僅有1個鹽池灘羊肉樣本被識別為灘寒雜交,其他2種羊肉樣本全部識別正確,總體準(zhǔn)確率為98.75%;從識別結(jié)果得出:在可見/近紅外波段三種羊肉樣本特征映射到高維空間后,通過線性超平面得到了較好的識別,說明三種不同品種羊肉在色澤紋理等外部特征上存在顯著差異,在高維特征空間中建立線性學(xué)習(xí)機的RBF-SVM模型是進行羊肉品種識別的最優(yōu)方法。全波段(Baseline-Fullwave-RBFSVM)與特征波長下(Baseline-SPA-RBFSVM)模型識別準(zhǔn)確率無明顯差異,體現(xiàn)出在400~1 000 nm波段SPA方法提取出12個特征波長的有效性,可以用特征波長替代全波長進行三種羊肉的光譜識別。
在900~1 700 nm全波段利用RBF-SVM模型對三個品種羊肉樣本進行識別分析(校正集及驗證集的樣本選擇同上LDA模型分析),首先利用SG預(yù)處理后全波段光譜進行分析,有2個灘寒雜交羊肉樣本被識別為鹽池灘羊,1個鹽池灘羊被識別為灘寒雜交羊,小尾寒羊肉樣本全部識別正確,總體識別準(zhǔn)確率為96.25%;后利用SPA提取出的7個特征波長進行RBF-SVM模型分析,則有4個鹽池灘羊肉樣本被識別為灘寒雜交,6個小尾寒羊樣本被識別為鹽池灘羊,灘寒雜交羊肉樣本全部識別正確,準(zhǔn)確為87.80%。在900~1 700 nm波段對三種羊肉進行識別取得了較好的效果,利用近紅外高光譜技術(shù)可以對羊肉內(nèi)部品質(zhì)差異進行有效識別,但特征波長下(Baseline-SPA-RBFSVM)羊肉品種識別率與全波段(Baseline-Fullwave-RBFSVM)檢測準(zhǔn)確率相比下降了8.45個百分點,說明在近紅外區(qū)域采用SPA方法提取特征波長使部分有效信息被剔除,7個特征波長不能替代900~1 700 nm全波段對羊肉品種進行識別分析。
通過上述實驗分析可知,同一地區(qū)不同品種羊肉在色澤紋理及內(nèi)部脂肪、蛋白、含水量等內(nèi)外部品質(zhì)上有較大差異,這種差異通過高光譜檢測技術(shù)結(jié)合RBFSVM方法可以得到有效提取識別,且非線性的SVM分類顯著優(yōu)于線性的LDA判別方法;相對于900~1 700 nm波段中內(nèi)部品質(zhì)的檢測,三種羊肉在400~1 000 nm波段外部色澤紋理特征識別上有更顯著的效果。
(1)寧夏地區(qū)飼養(yǎng)的灘寒雜交、鹽池灘羊、小尾寒羊三個品種羊肉在色澤紋理及內(nèi)部脂肪、蛋白、含水量等內(nèi)外部品質(zhì)上有較大差異,這種差異特征可通過可見/近紅外及近紅外高光譜快速檢測技術(shù)進行有效提取識別。相對于900~1 700 nm波段中內(nèi)部品質(zhì)的檢測,三種羊肉在400~1 000 nm波段外部色澤紋理特征識別上有更顯著的效果,在400~1 000 nm波段采用Baseline-Fullwave-RBFSVM方法對三種羊肉識別準(zhǔn)確率高達(dá)100%。
(2)在400~1 000 nm波段Vis/NIR 高光譜Baseline方法為羊肉品種識別最佳預(yù)處理方法,結(jié)合SPA提取12個特征波長為401,406,410,430,445,468,502,559,631,891,977和991 nm;特征波長下結(jié)合LDA線性判別模型與RBFSVM非線性模型,88個驗證集預(yù)測模型準(zhǔn)確率分別為79.54%和98.75%,與全波段判別模型識別率一致,可以利用特征波長替代全波段進行羊肉樣本品種識別,且Baseline-SPA-RBFSVM非線性模型識別準(zhǔn)確率顯著高于Baseline-SPA-LDA模型,且大幅降低冗余數(shù)據(jù),為羊肉品種快速識別的最優(yōu)方法。
(3)在900~1 700 nm波段NIR高光譜SG方法為羊肉品種識別最佳預(yù)處理方法,結(jié)合SPA提取7個特征波長為984,1 121,1 234,1 312,1 466,1 645和1 678 nm,特征波長下結(jié)合LDA線性判別模型與RBFSVM非線性模型,96個驗證集預(yù)測模型準(zhǔn)確率分別為85.41%和87.80%,雖然達(dá)到了較好的檢測準(zhǔn)確率,與全波段Baseline-Fullwave-LDA及Baseline-Fullwave-RBFSVM識別準(zhǔn)確率89.58%及96.25%相比差異較大,說明SPA方法提取7個特征波長部分有效信息被剔除,不能替代全波段進行羊肉品種快速識別,需進一步優(yōu)化。
[1] WANG Jia-yun, WANG Song-lei, HE Jian-guo(王家云, 王松磊, 何建國).Modern Food Science and Technology(現(xiàn)代食品科技),2014, 30(6): 257.
[2] ZHU Feng-le, HE Yong, SHAO Yong-ni(朱逢樂, 何 勇, 邵永妮).Spectrosopy and Spectral Analysis(光譜學(xué)與光譜分析),2015, 35(1):113.
[3] Qiao J, Ngadi M O, Wang N, et al.Journal of Food Engineering, 2007, 83(1): 10.
[4] Qiao J, Wang N, Ngadi M O, et al.Meat Science, 2007, 76( 1): 1.
[5] Barbin D, Elmasry G, Sun D W, et al.Analytica Chimica Acta, 2012, 719: 30.
[6] Barbin D, Elmasry G, Sun D W, et al.Meat Science, 2012, 90(1): 259.
[7] Wu Jianhu, Peng Yankun, Li Yongyu.Journal of Food Engineering, 2012,109: 267.
[8] ZHANG Lei-lei, PENG Yan-kun, TAO Fei-fei(張雷蕾, 彭彥昆, 陶斐斐).Journal of Food Safety and Quality(食品安全質(zhì)量檢測學(xué)報), 2012, 3(6): 545.
[9] Wu Jianhu, Peng Yankun, Li Yongyu.Journal of Food Engineering, 2012,109: 267.
[10] Tao Feifei, Peng Yankun, Li Yongyu, et al.Meat Science, 2012,90: 851.
[11] Mohammed K, Gamal E, Sun Dawen.Innovative Food Science and Emerging Technologies, 2012, 7: 3.
[12] Douglas F B, Gamal E, Sun Dawen.Analytica Chimica Acta, 2012,719: 30.
[13] Mohammed K, Gamal E, Sun Dawen.Analytica Chimica Acta, 2012,714: 57.
[14] Mohammed K, Gamal E, Sun Dawen.Journal of Food Engineering, 2011,(104):332.
[15] Mohammed K, Douglas B, Gamal E, et al.Innovative Food Science and Emerging Technologies, 2012, 8: 28.
[16] ZOU Xiao-bo, LI Zhi-hua, SHI Ji-yong(鄒小波, 李志華, 石吉勇).Food Science(食品科學(xué)), 2014, 35(8): 89.
[17] MA Shi-bang, XU Yang, PENG Yan-kun(馬世榜, 徐 楊, 彭彥昆).Journal of Food Safety and Quality(食品安全質(zhì)量檢測學(xué)報), 2012, 3(6): 603.
[18] WEN Zhen-cai, SUN Tong, LIU Mu-hua(溫珍才, 孫 通, 劉木華).Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2013,33(9): 2354.
[19] DU Min, GONG Ying, HUA Guo-dong(杜 敏, 鞏 穎, 華國棟).Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2013,33(5): 1211.
(Received Sep.29, 2015; accepted Dec.21, 2015)
*Corresponding author
Study on Multi-Bands Recognition for Varieties of Mutton by Using Hyperspectral Technologies
WANG Song-lei1,2, WU Long-guo1, MA Tian-lan2, CHEN Ya-bin2, HE Jian-guo1,2*, HE Xiao-guang2,KANG Ning-bo1
1.School of Construction and Hydraulic Engineering, Ningxia University, Yinchuan 750021, China 2.School of Agriculture, Ningxia University, Yinchuan 750021, China
This paper focused on the research on identifying and classifying for mutton varieties of Tan-han hybrid sheep,Yanchi Tan-sheep and small-tailed sheep in Ningxia by using visible/ near-infrared (400~1 000 nm).Near infrared (900~1 700 nm) hyperspectral technologies, baseline and SG convolution smoothing spectra pretreatment methods were applied respectively according to the characteristics of different spectrum bands; the characteristic wavelengths were extracted by using successive projection algorithm (SPA);then combined with linear discriminant analysis (LDA) and radial basis kernel function of support vector machine (RBFSVM) model were applied to identify the different mutton varieties under characteristic wavelengths and full-wave bands.Results showed that there were good effects for mutton varieties identification in different hyperspectral bands, among which Baseline-Fullwave-RBFSVM and the same models under 12 characteristic wavelengths obtained accuracy of 100% and 98.75% in 400~1 000 nm respectively, and Baseline-Fullwave-RBFSVM and the same models under 7 characteristic wavelengths obtained accuracy of 96.25% and 87.80% in 900~1 700 nm respectively.The identification accuracy of RBFSVM nonlinear classification was higher than the LDA linear discriminant result, meanwhile the identification accuracy in 400~1 000 nm bands was better than in 1 000~1 700 nm bands, which explained that the differences of color and texture were more significant than the component contents among the 3 varieties mutton.Combined hyperspectral technologies with RBFSVM models can obtain a better recognition effect of mutton varieties.
Hyperspectral imaging technology;Varieties of mutton;Multichannel recognition;Characteristic wavelengths;SVM(support vector machine)
2015-09-29,
2015-12-21
國家自然科學(xué)基金青年項目(31101306)資助
王松磊,1982年生,寧夏大學(xué)土木與水利工程學(xué)院講師 e-mail:wangsonglei163@126.com *通訊聯(lián)系人 e-mail:hejg@nxu.edu.cn
O657.3
A
10.3964/j.issn.1000-0593(2016)09-2937-09