向靈孜, 郭培源
(北京工商大學(xué)計算機(jī)與信息工程學(xué)院,北京 100048)
近年來,隨著人們飲食消費(fèi)的多元化和肯德基、麥當(dāng)勞等快餐在中國市場的強(qiáng)勢擴(kuò)張,雞肉消費(fèi)正在慢慢超過豬肉成為國人第一大肉類消費(fèi)[1].同時,由于人民生活品質(zhì)的不斷提高,健康意識逐步增強(qiáng),大眾膳食的肉類消費(fèi)結(jié)構(gòu)也由豬肉、羊肉等紅肉逐漸轉(zhuǎn)變?yōu)橐噪u肉為代表的白肉[2].中國是世界雞肉生產(chǎn)、消費(fèi)和貿(mào)易的大國,根據(jù)FAO(聯(lián)合國糧食及農(nóng)業(yè)組織)統(tǒng)計,2013年生產(chǎn)雞肉10 640萬t,占世界雞肉產(chǎn)量的88%,是世界第二大雞肉生產(chǎn)國[3].
然而,近年來市場上不同品種不同級別的雞肉混雜,且由于土雞價格的持續(xù)走高,以次充好的現(xiàn)象時有發(fā)生[4].目前,在雞肉檢測方面,傳統(tǒng)的化學(xué)分析方法較為常用.然而,化學(xué)分析方法通常需要取樣化驗(yàn),過程中涉及較多的專業(yè)化學(xué)設(shè)備和化學(xué)試劑,且過程復(fù)雜、檢測時間長、成本高,種種因素導(dǎo)致測試效率極低.而近紅外(near infrared,NIR)光譜特性穩(wěn)定,含有豐富的信息,能夠反映樣品的綜合信息,是一種高效、綠色的分析測試技術(shù)[5].紅外光譜分析方法與化學(xué)分析方法相比,檢測速度快,可在短時間內(nèi)實(shí)現(xiàn)大量樣品的快速測定;同時,由于該方法不需要化學(xué)試劑,對樣品或者環(huán)境不會造成污染,屬于綠色環(huán)保型.
劉煒等[4]應(yīng)用近紅外光譜對148個鮮雞肉樣本掃描,建立了脂肪、蛋白質(zhì)和水分的定量分析模型,其模型的平均內(nèi)部交叉驗(yàn)證均方差(RMSECV)為0.111,0.149,0.177 9等,說明利用近紅外光譜法能夠同時對鮮雞肉中的脂肪、蛋白質(zhì)和水分含量進(jìn)行檢測.沈杰[5]采集了禽肉的近紅外圖像信息,對雞肉中的脂肪含量和系水力指標(biāo)建模分析,其相關(guān)系數(shù)分別是0.818 1,0.873 3,相關(guān)系數(shù)均達(dá)到了0.8以上.燕昌江等[6]對200份高脂系肉種雞樣本進(jìn)行實(shí)驗(yàn),研究雞肉胸肌肉質(zhì)指標(biāo),利用偏最小二乘法(PLS)對樣本的光譜數(shù)據(jù)進(jìn)行分析建模.結(jié)果表明,近紅外光譜技術(shù)對于雞肉胸肌肉質(zhì)中水分、蛋白、脂肪等指標(biāo)有較高的預(yù)測能力.
本文運(yùn)用近紅外光譜技術(shù)對雞肉分類進(jìn)行研究,限于測量環(huán)境和實(shí)驗(yàn)條件,在通用檢測標(biāo)準(zhǔn)允許的范圍內(nèi),實(shí)驗(yàn)樣品采用在市場中購買的新鮮雞肉,對其進(jìn)行光譜掃描,采集不同種類的雞肉樣品光譜圖,并對其進(jìn)行了聚類分析和建模研究,研究了聚類分析技術(shù)應(yīng)用于檢測雞肉分類的可行性[7-14].
采樣肉雞品種為白羽肉雞,土雞品種為北京本地散養(yǎng)柴雞.樣品取自新鮮胴體的一側(cè)胸肉,剔除可見脂肪和結(jié)締組織,新鮮雞肉樣品來自北京市農(nóng)貿(mào)市場和超市.本實(shí)驗(yàn)分別采集了20份新鮮肉雞雞胸樣品和20份新鮮土雞雞胸樣品,其中每15份樣品作為校正樣本集用來建立聚類模型,5份樣品作為驗(yàn)證樣本集用來檢測.
采用瑞士FoodScanFoss公司的FoodScan近紅外全光柵透射光譜分析儀;光譜范圍為850~1 050 nm,分辨率為2 cm-1,每個掃描采集數(shù)據(jù)點(diǎn)數(shù)為100,該儀器采用硅(Si)檢測器和固體測量容器,透反射測量有效光程為2 mm,采用光柵投射和相關(guān)固體測量柱形杯具,杯具直徑為6 cm.采用Win ISI軟件對光譜數(shù)據(jù)進(jìn)行預(yù)處理分析,使用MatLab 2012b工具對其進(jìn)行聚類分析.
1.3.1樣品制備
在掃描前,儀器需預(yù)熱0.5 h,樣品粉碎成肉糜狀.18℃恒溫箱保存,掃描過程中嚴(yán)格控制室內(nèi)濕度,保持環(huán)境的一致性.按標(biāo)號依次將樣品杯中的雞肉樣品倒入樣品盤,雞肉樣品均勻鋪滿整個樣品盤并保證厚度一致.每個樣品掃描3次,采樣間隔為2 nm,分辨率為5 nm,剔除異常樣本后,取平均值.采集到的光譜圖像如圖1和圖2.
1.3.2特征波段選取
本實(shí)驗(yàn)分別在無預(yù)處理和采用不同預(yù)處理方法的情況下對肉雞和土雞的光譜圖使用標(biāo)準(zhǔn)方法進(jìn)行聚類分析.在聚類過程中,首先導(dǎo)入校正集肉雞雞胸光譜1~15和土雞雞胸光譜1~15.通過交互式選擇光譜的頻率范圍,如圖3.由圖3看出,在900~1 022 nm光譜內(nèi)存在較明顯的吸收峰,而其余光譜范圍內(nèi)幾乎沒有吸收信號.因此本實(shí)驗(yàn)選擇900~1 022 nm為光譜分析區(qū)間.在比較不同預(yù)處理方法產(chǎn)生的聚類結(jié)果后,選擇合適的預(yù)處理方法建立聚類預(yù)測模型,從而準(zhǔn)確鑒別驗(yàn)證集肉雞光譜16~20樣品和土雞光譜16~20樣品.本實(shí)驗(yàn)采用較為直觀的樹形圖來呈現(xiàn)所得聚類結(jié)果.
圖1 土雞樣品近紅外光譜圖Fig.1 Near infrared spectra of domestic chickens samples
圖2 肉雞樣品近紅外光譜圖Fig.2 Near infrared spectra of broiler chicken samples
圖3 交互式頻率范圍選擇Fig.3 Range selection of interactive frequency
1.3.3光譜預(yù)處理
因?yàn)槿怆u肉與土雞肉的物質(zhì)組成和化學(xué)結(jié)構(gòu)幾乎相同,且其內(nèi)部的化學(xué)基團(tuán)在近紅外中的吸光度相近,在同一譜圖上譜相似,吸收峰值一致.因此,直接通過譜圖很難區(qū)分肉雞肉和土雞肉[15].因此,為了保證校正模型的穩(wěn)定性和可靠性,需要對原始光譜進(jìn)行合理的預(yù)處理后再進(jìn)行聚類分析,以便降噪、減少各種外界干擾的影響并消除光譜中包含的無用信息,提高分析準(zhǔn)確度.本研究主要采用的光譜預(yù)處理方法包括矢量歸一化、一階導(dǎo)數(shù)處理、二階導(dǎo)數(shù)處理和歸一化與求導(dǎo)相結(jié)合.
矢量歸一化,是計算的平均吸光度值能夠消除光程或樣品稀釋等變化對光譜造成的影響[11].其具體計算步驟:1)對一條原始光譜,計算其平均吸光度值;2)用原始光譜值減去平均吸光度值,得到處理后的光譜值;3)計算處理后的光譜值的平方和,再開平方根,設(shè)這個值為m;4)將處理后的光譜值除以m,此時光譜的矢量歸一化是1,一條光譜的矢量歸一化完成[16].
一階導(dǎo)數(shù)可用于消除光譜中基線的漂移,并使較小的特征吸收峰變得明顯,二階導(dǎo)數(shù)可消除光譜的散射現(xiàn)象.在有效消除其他背景干擾的同時,分辨重疊峰,提高分辨率和靈敏度.
一階微分:
式(1)和式(2)中,k為光譜間隔,大小可視具體情況設(shè)定,x為吸光度.采用矢量歸一化方法預(yù)處理后的雞肉樣品光譜曲線如圖4,一階導(dǎo)數(shù)預(yù)處理后的雞肉樣品光譜曲線如圖5,二階導(dǎo)數(shù)預(yù)處理后的雞肉樣品光譜曲線如圖6.
圖4 雞肉樣品矢量歸一化近紅外光譜圖Fig.4 Near infrared spectra of chicken samples after vector normalization
1.3.4聚類分析方法
聚類分析過程包括兩種距離的計算,一種是光譜圖與光譜圖之間距離的計算,另一種是新創(chuàng)建類與其他譜圖或類之間距離的計算[17-18].本研究中,光譜距離采用標(biāo)準(zhǔn)法計算,即用歐式距離表示光譜距離.歐氏距離的計算如式(3):
圖5 雞肉樣品一階導(dǎo)數(shù)近紅外光譜圖Fig.5 Near infrared spectra of chicken samples after first derivative
圖6 雞肉樣品二階導(dǎo)數(shù)近紅外光譜圖Fig.6 Near infrared spectra of chicken samples after second derivative
式(3)中,D表示光譜和光譜之間的距離;a(k)和b(k)是光譜圖a和b的縱坐標(biāo)的值,即光譜a和光譜b在k波長點(diǎn)處的吸光度值.歐式距離的主要優(yōu)點(diǎn)是當(dāng)坐標(biāo)軸進(jìn)行正交旋轉(zhuǎn)時,歐式距離保持不變.因此,如果對原坐標(biāo)系進(jìn)行平移和旋轉(zhuǎn)變換,則變換后樣本點(diǎn)之間的距離和變換前完全相同.
本研究采用較為常用的平均距離法:
式(4)中,目標(biāo)p和q聚為一個新目標(biāo)r.D(p,i)是目標(biāo)p和目標(biāo)i的光譜距離,D(q,i)是目標(biāo)q和目標(biāo)i的光譜距離.新目標(biāo)r和目標(biāo)i的距離D(r,i)小于兩個原來距離值.聚類分析分類預(yù)測模型構(gòu)建流程如圖7.
由掃描所得肉雞和土雞雞胸樣品的近紅外光譜圖(如圖5和圖6)可見,盡管肉雞和土雞屬于2個不同的雞肉品種,且產(chǎn)地不同,但是所有樣品的光譜趨勢及吸收峰的位置均大體一致.然后選取肉雞和土雞的16~20樣品光譜作為實(shí)驗(yàn)的驗(yàn)證集,余下的30個樣品作為校正集.
無任何預(yù)處理900~1 022 nm原始譜圖的聚類分析樹形圖見圖8.由圖8可以看出,對未經(jīng)優(yōu)化的光譜數(shù)據(jù)進(jìn)行聚類分析時,肉雞和土雞的分類較混亂,幾乎找不到顯著的區(qū)分和規(guī)律.
圖7 聚類分析分類預(yù)測模型構(gòu)建Fig.7 Structure of clustering analysis prediction model
圖8 無預(yù)處理聚類分析結(jié)果樹形圖Fig.8 Result tree diagram of clustering analysis without pretreatment
經(jīng)過一階導(dǎo)數(shù)后,譜圖在900~1 022 nm范圍的聚類分析樹形圖如圖9.由圖9可以看出,單純對原始光譜進(jìn)行一階求導(dǎo),產(chǎn)生的聚類分析結(jié)果也不能將肉雞和土雞準(zhǔn)確分類.
經(jīng)過二階導(dǎo)數(shù)后,譜圖范圍在900~1 022 nm的聚類分析樹形圖如圖10.由圖10可以看出,單純對原始光譜進(jìn)行二階求導(dǎo),產(chǎn)生的聚類分析結(jié)果依舊不能將肉雞和土雞準(zhǔn)確分類.
將近紅外原始光譜圖經(jīng)過一階求導(dǎo)+矢量歸一化、二階求導(dǎo)+矢量歸一化分別預(yù)處理后,所得譜圖在900~1 022 nm,聚類分析樹形圖如圖11、圖12.
由圖8~圖12可以得出聚類結(jié)果如表1.
唐詩的模糊美初探 ……………………………………………………………… 王華琴,張青華,張 紅(5.76)
由表1可以看出,校正集近紅外光譜在分別采用矢量歸一化、一階導(dǎo)數(shù)+矢量歸一化、二階導(dǎo)數(shù)+矢量歸一化方法預(yù)處理后,通過聚類分析都可以將肉雞和土雞準(zhǔn)確的區(qū)分,且各自歸為一類,準(zhǔn)確率為100%.
以上實(shí)驗(yàn)結(jié)果說明譜圖的預(yù)處理對于計量學(xué)分析結(jié)果的好壞會起到十分重要的作用,同時也說明不同種類的雞肉可以通過近紅外光譜技術(shù)很好分類.
圖9 一階導(dǎo)數(shù)后聚類分析結(jié)果樹形圖Fig.9 Result tree diagram of clustering analysis with first derivative
圖10 二階導(dǎo)數(shù)后聚類分析結(jié)果樹形圖Fig.10 Result tree diagram of clustering analysis with second derivative
圖11 一階求導(dǎo)+矢量歸一化后聚類分析結(jié)果樹形圖Fig.11 Result tree diagram of clustering analysis with first derivative and vector normalization
圖12 二階求導(dǎo)+矢量歸一化后聚類分析結(jié)果樹形圖Fig.12 Result tree diagram of clustering analysis with second derivative and vector normalization
表1 肉雞和土雞樣品聚類分析結(jié)果Tab.1 Cluster analysis results of broiler chicken and native chicken samples
在得到準(zhǔn)確的聚類分析結(jié)果之后,實(shí)驗(yàn)選取聚類效果較好的二階導(dǎo)數(shù)加矢量歸一方法對光譜進(jìn)行預(yù)處理并建立聚類模型,以便驗(yàn)證集肉雞和土雞能準(zhǔn)確地歸類.
驗(yàn)證集肉雞和土雞樣品采用已建立好的聚類模型進(jìn)行聚類測試的結(jié)果如圖13、圖14.
圖13 驗(yàn)證集肉雞的聚類結(jié)果樹形圖Fig.13 Verification result tree diagram of clustering analysis of broiler chicken
肉雞和土雞在未經(jīng)宰殺前可以通過其外部特征利用感官分析法來區(qū)分.然而,由于肉雞和土雞同屬雞肉品種,肉品性狀和色澤較為相似.因此,一旦經(jīng)過宰殺并將其肉分類售賣,很難通過感官來準(zhǔn)確區(qū)分肉雞肉和土雞肉.本實(shí)驗(yàn)研究了近紅外光譜分析技術(shù)用于雞肉分類檢測的可行性.為了提高分類模型預(yù)測的準(zhǔn)確度,選用不同的預(yù)處理算法.通過聚類分析建立了雞肉分類的預(yù)測模型.實(shí)驗(yàn)證明,近紅外技術(shù)用于判定雞肉分類采用的聚類分析方案是有效的.研究表明,當(dāng)預(yù)處理方法為一階導(dǎo)數(shù)+矢量歸一化、二階導(dǎo)數(shù)+矢量歸一化均能使模型的預(yù)測準(zhǔn)確率達(dá)到100%,經(jīng)過預(yù)處理的聚類分析方法能夠很好地提高模型的預(yù)測能力.這為近紅外技術(shù)在農(nóng)業(yè)、工業(yè)生產(chǎn)中用于分析檢測雞肉類別的可行性及其預(yù)測能力的提高與改進(jìn)提供了一種有效的方法和思路.
圖14 驗(yàn)證集土雞的聚類結(jié)果樹形圖Fig.14 Verification result tree diagram of clustering analysis of native chicken