王彩霞,王松磊,賀曉光,董 歡
(寧夏大學(xué)農(nóng)學(xué)院,寧夏銀川 750021)
牛肉味道鮮美,營養(yǎng)豐富,深受國內(nèi)外市場的青睞。近年來,隨著人們生活水平的不斷提高以及膳食結(jié)構(gòu)的日益科學(xué)化,消費(fèi)者對(duì)牛肉品質(zhì)和營養(yǎng)的要求越來越高。高品質(zhì)牛肉鮮香細(xì)嫩,色澤紅潤,肌肉紋理清晰,蛋白質(zhì)含量高,售價(jià)相對(duì)較高[1]。目前仍有不法商販將低質(zhì)量的牛肉假冒為高品質(zhì)牛肉,以次充好,損害消費(fèi)者利益。因此對(duì)不同品質(zhì)的牛肉進(jìn)行定性鑒別成為當(dāng)前牛肉產(chǎn)業(yè)發(fā)展亟需解決的問題。不同品種的牛肉在品質(zhì)和口感上存在很大的差異,但肉品性狀和顏色極為相似,肉眼難以區(qū)分。傳統(tǒng)的肉類鑒別方法有酶聯(lián)免疫吸附[2]、蛋白質(zhì)譜技術(shù)[3-5]、PCR[6]等,鑒別成本較高,操作繁瑣,耗時(shí)耗力。因此,需研發(fā)一種高效快速、無損環(huán)保、操作簡單的檢測方法對(duì)牛肉的種類和品質(zhì)進(jìn)行鑒別。
高光譜成像技術(shù)作為一種新型無損檢測技術(shù),具有超多波段、高光譜分辨率和譜圖合一等優(yōu)勢[7],在肉品分析領(lǐng)域得到了廣泛的應(yīng)用。Jiang等[8]利用Vis/NIR高光譜對(duì)雞胸肉的嫩度進(jìn)行分類研究,結(jié)果表明基于全光譜波段所建的偏最小二乘判別模型(Partial least squares discrimination analysis,PLS-DA)模型的校正集與預(yù)測集準(zhǔn)確率分別為0.92、0.94;Xiong等[9]利用可見近紅外高光譜對(duì)散養(yǎng)雞和普通飼養(yǎng)方式下的及進(jìn)行識(shí)別分析,并結(jié)合多元散射校正(Multiplicative scatter correction,MSC)進(jìn)行預(yù)處理,建立基于連續(xù)投影算法(Successive projections algorithm,SPA)和徑向基函數(shù)-支持向量機(jī)(RBF-SVM)的雞肉判別模型,模型準(zhǔn)確率高達(dá)93.33%;王昱陸[10]利用特征光譜建立的線性模型對(duì)牛肉、羊肉、豬肉進(jìn)行品種識(shí)別,識(shí)別準(zhǔn)確率分別為100%、94.1%、95.5%;王松磊等[11]使用高光譜成像技術(shù)對(duì)寧夏地區(qū)灘寒雜交、鹽池灘羊、小尾寒羊三個(gè)品種羊肉進(jìn)行識(shí)別,結(jié)果表明,不同波段高光譜對(duì)羊肉品種識(shí)別均有較好效果;王靖等[12]使用900~1700 nm高光譜成像系統(tǒng)對(duì)寧夏不同產(chǎn)地的羊肉進(jìn)行品種識(shí)別,結(jié)果表明CARS-PLS-DA為最優(yōu)模型,校正集正確率90.48%,預(yù)測集正確率84.21%。綜上可知,已有學(xué)者利用高光譜成像技術(shù)對(duì)雞肉、豬肉、羊肉以及摻假肉等進(jìn)行鑒別分析,但對(duì)不同品種牛肉的鑒別鮮有報(bào)道。
本研究利用可見/近紅外高光譜成像技術(shù)對(duì)不同品種的牛肉進(jìn)行鑒別分析,并比較不同特征波長提取方法及建模方法對(duì)牛肉品種鑒別效果的影響,進(jìn)而為牛肉品種的快速無損鑒別提供技術(shù)參考。
3~5頭5歲左右產(chǎn)奶率低的荷斯坦奶牛(母牛) 采自寧夏吳忠市澇河橋分割肉加工有限公司;3~5頭3歲左右的秦川牛、西門塔爾牛(公母均有) 采自寧夏固原市寧夏尚農(nóng)生物科技發(fā)展產(chǎn)業(yè)有限公司。
Hyper Spec-VNIR高光譜成像系統(tǒng)(包括Imspector N型成像光譜儀、G4-232增強(qiáng)型EMCCD相機(jī)、VT-80自動(dòng)電控位移平臺(tái)及2個(gè)鹵素?zé)艄庠?。其?光譜分辨率2.8 nm,狹縫寬度25 μm,相機(jī)像素尺寸8.0 μm) 美國Headwall公司
1.2.1 牛肉樣本采集 各品種牛經(jīng)屠宰后在0 ℃下冷藏,排酸48 h。取出牛肉樣品進(jìn)行分割,每個(gè)品種的牛分別取4個(gè)部位肉(肩頸肉、眼肉、瓜條肉、里脊肉),剔除多余的油脂和筋膜后,放入保溫箱運(yùn)至實(shí)驗(yàn)室,貯藏在4 ℃冷柜備用。其中,奶牛肉108個(gè)(脖肉、眼肉、瓜條肉、里脊肉各15、17、39、37個(gè))、秦川牛肉117個(gè)(脖肉、眼肉、瓜條肉、里脊肉各16、16、40、45個(gè))、西門塔爾牛肉樣品各113個(gè)(脖肉、眼肉、瓜條肉、里脊肉各10、17、43、43個(gè))個(gè)。光譜掃描前將肉樣整形切塊(大小約為40 mm×30 mm×10 mm),室溫下放置2 h,待肉樣中心溫度達(dá)到室溫水平后,用濾紙吸干樣品表面的水分,進(jìn)行光譜掃描。
1.2.2 高光譜圖像采集 由于肉樣本紋理形狀、色澤等會(huì)造成光源漫反射,影響光譜信息采集效果。因此,圖像采集時(shí)需設(shè)置合理的曝光時(shí)間和位移平臺(tái)移動(dòng)速度。經(jīng)預(yù)試驗(yàn)最終確定牛肉樣品的采集參數(shù)為:相機(jī)曝光時(shí)間:15 ms,物距:380 mm,電控位移平臺(tái)移動(dòng)速度:15 mms。
同時(shí),由于光源強(qiáng)度分布不均及相機(jī)中暗電流的存在,使采集到的信息中含有大量噪聲。因此在采集高光譜圖像之前需進(jìn)行黑白校正。具體方法為:開啟高光譜系統(tǒng),調(diào)整焦距和曝光時(shí)間,獲取標(biāo)準(zhǔn)全反射白板的白圖像Rw,然后蓋住鏡頭,獲取全黑圖像Rd。根據(jù)式(1)計(jì)算出樣本的校正圖像I:
式(1)
其中:I為校正后的漫反射光譜圖像;R為樣本原始的漫反射光譜圖像;Rd為全黑圖像;RW為白板的漫反射圖像。
圖像采集前,需打開高光譜儀器預(yù)熱30 min。試驗(yàn)過程中,每組取5塊肉樣依次置于電控位移平臺(tái)上,進(jìn)行光譜掃描。圖像數(shù)據(jù)處理之前,利用ENVI 4.8軟件選取整塊肉表面作為感興趣區(qū)域(Range of interest,ROI),計(jì)算ROI內(nèi)的平均反射光譜,作為樣本的反射光譜。
1.2.3 光譜數(shù)據(jù)預(yù)處理 在光譜采集過程中,由于試驗(yàn)樣本、測定環(huán)境及儀器噪音等因素的影響,所采集的光譜數(shù)據(jù)中會(huì)夾雜一些無用信息,從而影響建模性能。因此,需要對(duì)原始光譜數(shù)據(jù)進(jìn)行預(yù)處理。本試驗(yàn)通過卷積平滑(Savitzky-golay smoothing,SG)、區(qū)域歸一化(Area normalize)、一階導(dǎo)數(shù)(First derivative,FD)、基線校準(zhǔn)(Baseline)、標(biāo)準(zhǔn)正態(tài)變量變換(Standard normal variate,SNV)、MSC方法[13]對(duì)原始光譜進(jìn)行預(yù)處理。
1.2.4 樣本劃分 不同的樣本劃分方法對(duì)所建模型具有不同的預(yù)測性能。本試驗(yàn)嘗試的樣本劃分方法有:隨機(jī)法(Random select,RS)、選樣本(Kennard-stone,KS)、光譜-理化值共生距離法(Sample set partitioning based on joint X-Y distances,SPXY)[14]及順序劃分法。
1.2.5 特征波長提取 由于牛肉樣本的全波段光譜數(shù)據(jù)量大、信息混雜,且大量的光譜數(shù)據(jù)會(huì)造成模型復(fù)雜、計(jì)算量大等問題。因此,選用適當(dāng)?shù)奶卣鞑ㄩL提取方法可有效降低光譜數(shù)據(jù)的維度,減少運(yùn)算量,提高模型穩(wěn)健性和預(yù)測準(zhǔn)確性[15]。本文選用應(yīng)用競爭性自適應(yīng)重加權(quán)算法(CARS)、連續(xù)投影算法(SPA)和無信息變量消除算法(UVE)CARS、SPA、UVE法提取特征波長[16-19]。
1.2.6 模型建立 本試驗(yàn)采用PLS-DA、KNN及RBF-SVM法建立牛肉品種鑒別模型。PLS-DA算法是在PLS回歸算法基礎(chǔ)上建立樣本分類變量與光譜特征間的回歸模型的分類方法。KNN算法是將一個(gè)樣本在特征空間中的K個(gè)最相似或者最鄰近的樣本進(jìn)行比較,樣本中的大多數(shù)屬于某一類則將該樣本則歸結(jié)為此類[20]。RBF-SVM法是基于統(tǒng)計(jì)學(xué)習(xí)理論提出的一種機(jī)器學(xué)習(xí)識(shí)別方法,對(duì)非線性及高維信息識(shí)別具有較好的處理能力。該算法的原理將向量映射到高維空間,構(gòu)建一個(gè)超平面,進(jìn)而建立合適的分隔超平面,使兩個(gè)與之平行的超平面距離達(dá)到最大,從而解決復(fù)雜數(shù)據(jù)的分類及回歸問題[21]。
光譜數(shù)據(jù)預(yù)處理在The Unscrambler X 10.4中進(jìn)行,其余算法在Matlab R2016a中實(shí)現(xiàn)。
3種牛肉的高光譜原始圖像如圖1所示。對(duì)3種牛肉樣品的光譜數(shù)據(jù)取平均,得到的平均光譜曲線如圖2所示??梢钥闯?不同品種牛肉的光譜曲線走勢相似。在400~590 nm波段范圍內(nèi),反射率較低。而在650~780 nm波段,光譜反射值較高。在可見光區(qū)域,牛肉中的肌紅蛋白與血紅蛋白相互作用,使其肉色呈現(xiàn)紅色;在近紅外區(qū)域,光譜吸收取決于物質(zhì)分子基團(tuán)中光子能量吸收與能級(jí)躍遷,不同物質(zhì)具有特定的波長吸收組合,牛肉脂肪、蛋白及水分含量約占牛肉總質(zhì)量的99%,因此光譜吸收主要與其本身所含的-OH,-CH和-NH2等基團(tuán)密切相關(guān)。由圖2可知,荷斯坦奶牛肉的反射率值明顯低于秦川牛肉與西門塔爾牛肉,這可能是由于荷斯坦奶牛肉中三大營養(yǎng)物質(zhì)的含量較其他兩種牛肉較少,所含關(guān)鍵集團(tuán)的數(shù)量也較少,因此反射率較低。秦川牛肉與西門塔爾牛肉在各個(gè)波段的反射率值接近,說明兩種牛肉中所含關(guān)鍵官能團(tuán)的數(shù)量相似。在部分波段范圍內(nèi)存在光譜交叉及重疊現(xiàn)象,但是在690~930 nm范圍內(nèi),各波段反射率差異比較明顯,這為牛肉品種的快速鑒別提供了大量信息。不同牛肉品種的光譜反射值差不同應(yīng)歸結(jié)為成分含量、組成結(jié)構(gòu)及品質(zhì)之間的差異,為光譜特征波長選擇及不同品種牛肉識(shí)別提供理論分析依據(jù)。
圖1 三種牛肉樣品的高光譜掃描圖像Fig.1 Hyperspectral scan image of 3 kinds beef samples
圖2 牛肉樣品平均光譜圖Fig.2 Original average spectra of beef simples
經(jīng)不同預(yù)處理方法后建立PLS-DA模型,結(jié)果如表1所示。
表1 不同預(yù)處理方法后的PLS-DA模型結(jié)果Table 1 Results of PLS-DA models by different pretreatment methods
由表1可知,經(jīng)過FD法預(yù)處理后所建模型的交互驗(yàn)證中最小錯(cuò)誤率小于原始光譜及其他預(yù)處理方法,其模型的準(zhǔn)確率達(dá)到0.9882。且經(jīng)過FD法預(yù)處理后所建的PLS-DA模型最優(yōu)主成分?jǐn)?shù)為6,低于原始光譜11,表明采用一階導(dǎo)數(shù)預(yù)處理所建模型的準(zhǔn)確性最好。故選擇FD方法對(duì)原始光譜進(jìn)行預(yù)處理。原始光譜圖像及經(jīng)FD法預(yù)處理后的如圖3所示。由圖可知,經(jīng)FD法預(yù)處理后的光譜有效減了原始光譜的背景噪音和重疊現(xiàn)象。
圖3 牛肉樣本光譜曲線Fig.3 Spectrum curves of beef samples注:(a)為原始光譜圖;(b)為FD法預(yù)處理后的光譜圖。
樣本集的劃分方法在一定程度上決定了所建模型的優(yōu)略性,本研究對(duì)四種常見的方法進(jìn)行對(duì)比分析,進(jìn)而優(yōu)選出最佳樣本劃分方法。對(duì)牛肉樣品進(jìn)行取樣時(shí)選擇3/4樣本作為校正集,剩余1/4作為預(yù)測集。其中,順序法劃分取每種樣品的前3/4為校正集,后1/4為預(yù)測集。不同樣本劃分方法的預(yù)測準(zhǔn)確率見表2。
表2 不同樣本劃分方法的PLS-DA模型結(jié)果Table 2 Results of PLS-DA model by different sample partitioning methods
從表3可以看出,使用SPXY法進(jìn)行樣本劃分,所建的模型的校正集與預(yù)測集的準(zhǔn)確率均高于其他樣本劃分方法。因此,選用SPXY法進(jìn)行樣本劃分,劃分結(jié)果如表3所示。
表3 利用SPXY法劃分樣本結(jié)果Table 3 Results of sample partitioning by SPXY
2.4.1 應(yīng)用CARS提取特征波長 CARS算法的原理是從偏最小二乘(Partial least squares,PLS)模型中優(yōu)選出回歸系數(shù)權(quán)重大的波長點(diǎn),并利用十折交叉驗(yàn)證選出校正集中交互驗(yàn)證均方根誤差(Root mean square error of cross validation,RMSECV)最小的子集,將其作為最優(yōu)組合。由于每次運(yùn)行CARS的結(jié)果具有隨機(jī)性,所以試驗(yàn)過程中在每個(gè)設(shè)定的蒙特卡洛采樣次數(shù)下運(yùn)行20次,取所建立的PLS-DA模型中最小的RMSECV值,即為最優(yōu)變量。經(jīng)過試驗(yàn),最終設(shè)定CARS參數(shù)為:蒙特卡洛采樣次數(shù)50,主成分?jǐn)?shù)20,交叉驗(yàn)證組數(shù)10。牛肉品種鑒別篩選過程如圖4所示。
圖4 CARS方法特征波長篩選過程Fig.4 Process of CARS characteristic wavelength selection
由圖4a可知,變量數(shù)與運(yùn)行次數(shù)之間呈指數(shù)關(guān)系遞減,表示波長變量選擇分為“粗選”與“精選”兩個(gè)過程[22]。圖4b表示篩選過程中均方根誤差的變化,由圖可知,當(dāng)采樣次數(shù)為11時(shí),交互驗(yàn)證均方根誤差達(dá)到最小值0.2679。圖4c是各變量在采樣過程中回歸系數(shù)的變化路徑,“*”所對(duì)應(yīng)的位置為第11次采樣保留下來的變量,此時(shí)交互驗(yàn)證誤差達(dá)到最小。分析可知,CARS法挑選出的關(guān)鍵變量共24個(gè),分別為:410.9、415.7、444.6、449.4、487.8、497.4、516.6、531.0、550.2、598.3、603.0、612.6、622.0、627.0、684.6、799.9、804.7、910.3、939.1、958.3、963.1、982.3、987.1、991.9 nm。利用CARS優(yōu)選出的特征波長占全部波長的19.2%。
2.4.2 應(yīng)用SPA提取特征波長 由圖5可知,特征波長數(shù)在17之前時(shí),RMSECV處于明顯下降狀態(tài),之后隨著波長數(shù)的增加,RMSEC處于較平穩(wěn)的變化狀態(tài)。當(dāng)波長數(shù)為17時(shí),RMSECV=0.3312。表明特征波長所含牛肉品種差異信息與真實(shí)值之間具有較高的一致性。利用SPA法所選的特征波長為439.8、444.6、454.2、459.0、463.8、468.6、497.4、502.2、511.8、516.6、521.4、526.2、535.8、540.6、545.4、550.2、564.6 nm。利用SPA法優(yōu)選出的特征波長占全部波長的13.6%。
圖5 SPA方法提取特征波長Fig.5 Extracting the characteristic wavelengths using SPA
2.4.3 應(yīng)用UVE提取特征波長 應(yīng)用UVE提取特征波長時(shí),先根據(jù)RMSECV最小確定PLS的最佳主成分?jǐn)?shù)。本研究中當(dāng)主成分?jǐn)?shù)為19時(shí),所對(duì)應(yīng)的RMSECV值最小為0.1732,因此,確定最佳主成分?jǐn)?shù)為19。運(yùn)行UVE計(jì)算125個(gè)輸入變量和隨機(jī)變量的穩(wěn)定性結(jié)果如圖6所示。
圖6 UVE方法篩選變量Fig.6 Extracting the characteristic wavelengths using UVE
圖6中豎線左側(cè)為全光譜(Full spectra,FS)條件下的125個(gè)波長變量,右側(cè)為125個(gè)隨機(jī)變量。兩條水平虛線之外的變量所對(duì)應(yīng)的波長為有效波長,虛線之內(nèi)的變量為無用變量。UVE法共選取的19個(gè)特征波長,分別為:415.7、425.4、454.2、463.8、473.4、487.8、492.6、497.4、531.0、564.6、574.2、622.2、641.4、718.2、751.9、863.2、939.1、958.3、982.3 nm。利用UVE提取出的特征波長占總波長的15.2%。
2.4.4 不同方法提取特征波長的結(jié)果比較 對(duì)不同方法提取的特征波長進(jìn)行比較,結(jié)果如下表4所示。
表4 3種特征波長提取方法結(jié)果比較Table 4 Comparison of extracting the characteristic wavelengths by three methods
由表4可知,SPA法提取出的特征波長數(shù)目最少,只占全波段的13.6%,CARS法提取的波長數(shù)目最多為24個(gè),但也只占到全波段的19.2%。
對(duì)三種不同方法提取的特征波長進(jìn)行分析對(duì)比,結(jié)果發(fā)現(xiàn),優(yōu)選出的特征波長主要集中在光譜吸收較強(qiáng)且反射率較低的410~550 nm波段。
2.5.1 建模參數(shù)的設(shè)定 KNN算法中K值的確定十分關(guān)鍵。K值的大小不僅會(huì)影響模型的穩(wěn)定性,同時(shí)對(duì)模型的預(yù)測效果也有很大的干擾[23]。試驗(yàn)中將最大主成分?jǐn)?shù)設(shè)定為10,利用馬氏距離算法[24]并進(jìn)行數(shù)據(jù)歸一化處理,采用百葉窗交互驗(yàn)證[25],設(shè)置交互驗(yàn)證組數(shù)為10,原始光譜的交互驗(yàn)證錯(cuò)誤率隨主成分?jǐn)?shù)的變化如圖7所示。
圖7 KNN算法中K值選擇Fig.7 K values selection for KNN algorithm
圖7為全光譜交互驗(yàn)證的錯(cuò)誤率與K值大小的分布圖,根據(jù)交互驗(yàn)證錯(cuò)誤率最低確定K值,由圖7可知,當(dāng)K=6時(shí),交互驗(yàn)證錯(cuò)誤率達(dá)到最低值,所以選擇K=6時(shí)建立KNN模型。同理可得,CARS、SPA、UVE的K值,結(jié)果如表5所示。
表5 KNN和PLS-DA建模參數(shù)的設(shè)定Table 5 Modeling parameters of KNN and PLS-DA
在建立PLS-DA模型時(shí),需確定模型的最佳主成分?jǐn)?shù)。試驗(yàn)中將最大主成分?jǐn)?shù)設(shè)定為20,進(jìn)行數(shù)據(jù)歸一化處理,并采用百葉窗交互驗(yàn)證,設(shè)置交互驗(yàn)證組數(shù)為10,原始光譜的交互驗(yàn)證誤判率隨主成分?jǐn)?shù)的變化如圖8所示。從圖8中可以看出,在主成分?jǐn)?shù)為6時(shí)誤判率為0.015,之后隨主成分?jǐn)?shù)的上升誤判率緩慢增大,當(dāng)主成分?jǐn)?shù)達(dá)到19時(shí),錯(cuò)誤率達(dá)到最低為0.011,但仍將6確定為最優(yōu)主成分?jǐn)?shù)。以此類推,可確定CARS、SPA、UVE特征波長的最佳主成分?jǐn)?shù),分別建立對(duì)應(yīng)的PLS-DA模型,結(jié)果如表5所示。
圖8 交互驗(yàn)證中不同主成分下的錯(cuò)誤率Fig.8 Error rate of different principal components in cross validation
建立SVM模型時(shí)首先需要確定核函數(shù)類型、懲罰因子c和核參數(shù)g,本研究選用徑向基函數(shù)支持向量機(jī)(RBF-SVM)[26]。RBF-SVM模型的性能由參數(shù)c和g共同決定。經(jīng)尋優(yōu)對(duì)比,采用5折交叉驗(yàn)證方法確定c和g。先粗略設(shè)置參數(shù)c和g,接著利用網(wǎng)格搜索法進(jìn)一步確定取值范圍,然后計(jì)算RMSECV,根據(jù)最小RMSECV確定最優(yōu)的c、g值。不同變量篩選下的最優(yōu)c和g值如表6所示。
表6 不同變量選擇方法下SVM模型參數(shù)Table 6 Parameters of SVM with different variable selection methods
2.5.2 建模結(jié)果 經(jīng)FD法預(yù)處理后的光譜數(shù)據(jù),分別建立基于全部波段及3種特征波長提取波段下的KNN、PLS-DA及RBF-SVM牛肉品種鑒別模型,并對(duì)模型效果進(jìn)行比較分析。所建模型結(jié)果如表7所示。
表7 3個(gè)品種牛肉的鑒別準(zhǔn)確率Table 7 Identification accuracy of three beef breeds
由表7可知,基于3種特征波長提取方法建立的KNN、PLS-DA及RBF-SVM模型中校正集與預(yù)測集的正確率均大于90%,說明3種特征波長提取方法所建模型穩(wěn)定性和預(yù)測能力較好。對(duì)比三種模型發(fā)現(xiàn),RBF-SVM建模效果優(yōu)于KNN及PLS-DA。在KNN模型中,FS-KNN校正集模型有63個(gè)樣本被誤判,鑒別正確率最低。SPA-KNN模型的校正集與預(yù)測集的鑒別準(zhǔn)確率分別為95.65%、94.12%,分別有11、5個(gè)樣本被誤判,表明SPA-KNN模型效果較好。在PLS-DA判別模型中,FS-PLS-DA模型對(duì)校正集與預(yù)測集的準(zhǔn)確率分別為98.81%和98.82%,分別有3、1個(gè)樣品發(fā)生誤判;基于CARS與SPA所建PLS-DA模型對(duì)校正集的鑒別準(zhǔn)確率分別為97.63%、97.23%,各有6、7個(gè)樣品被誤判,預(yù)測集準(zhǔn)確率CARS高于SPA。CARS-PLS-DA模型的校正集與預(yù)測集準(zhǔn)確率分別為97.63%、95.29%,略低于基于全波段所建的模型,校正集與預(yù)測集中分別有6、4個(gè)秦川樣本被誤判。在RBF-SVM建模結(jié)果中,除SPA法外,其他3種方法所建模型的校正集準(zhǔn)確率均為100%。
綜上可知,在特征變量選擇方法中,CARS法優(yōu)于SPA和UVE法,得到的14個(gè)特征波長包含了大量的有用信息,可以代替全光譜建模。RBF-SVM法所建模型效果明顯優(yōu)于PLS-DA及KNN算法,CARS-RBF-SVM模型結(jié)果最佳,鑒別結(jié)果圖如圖9所示。
圖9 CARS-RBF-SVM法對(duì)三種牛肉分類鑒別結(jié)果Fig.9 Discrimination results for 3 kinds of beef sample under CARS-RBF-SVM
由圖9可知,CARS-RBF-SVM法對(duì)三種牛肉分類鑒別中,校正集準(zhǔn)確率為100%,預(yù)測集準(zhǔn)確率為98.82%,其中有一個(gè)秦川牛肉被誤判為西門塔爾牛肉。此結(jié)果與表7中的結(jié)果一致。
本文利用近紅外高光譜技術(shù)對(duì)不同牛肉品種進(jìn)行鑒別研究。利用400~1000 nm高光譜系統(tǒng)采集3種牛肉樣本的高光譜圖像,分別提取其光譜信息,對(duì)比分析不同的光譜預(yù)處理方法,優(yōu)選出FD預(yù)處理方法;并采用4種樣本分類方法對(duì)數(shù)據(jù)進(jìn)行分類,優(yōu)選出SPXY法劃分樣品;然后對(duì)光譜數(shù)據(jù)進(jìn)行特征變量選擇,應(yīng)用CARS、SPA、UVE算法提取的特征波長分別為14、17、19個(gè);分別建立基于全波段和特征波長下的PLS-DA、KNN和RBF-SVM牛肉鑒別模型,優(yōu)選CARS法提取的14個(gè)特征波長特征變量選擇效果最好,提高了模型的穩(wěn)定性和準(zhǔn)確性,CARS-RBF-SVM模型的校正集與預(yù)測集準(zhǔn)確率分別為100%、98.82%,具有較好的鑒別效果,且能大幅降低冗余信息,為牛肉品種快速無損鑒別提供理論依據(jù)。