趙靜遠 張俊芹 孫 梅 陳興海, 劉業(yè)林,
肉類主要包括畜禽類和水產品類,人體所需的蛋白質、脂肪酸、微量元素等重要能量物質都來源于肉類[1]。隨著生活水平不斷提高,人們在飲食方面更加注重食品的品質和營養(yǎng)均衡搭配,但一些不法商家將一些低品質的肉類混入高品質肉類中,以次充好,特別是2013年歐洲的“馬肉風波”,引發(fā)了人們對肉類摻假問題的極度關注[2-3]。肉類摻假檢測方法包括感官評測、熒光PCR檢測技術、電泳分析法和酶聯(lián)免疫分析技術等,但大多需要樣品前處理,試驗操作較為繁瑣且費時費力,很難實現(xiàn)較大樣品量的現(xiàn)場快速實時檢測[2-4]。
高光譜成像技術作為一種能同時表征一維光譜信息和二維空間性信息的綜合無損檢測技術,已被廣泛應用于醫(yī)藥[5]、農業(yè)[6]、生態(tài)保護[7]等行業(yè)。在肉類摻假檢測方面,朱亞東等[8]利用近紅外高光譜成像技術結合線性回歸算法(MLR)建立了牛肉中摻假雞肉的定量檢測模型;劉友華等[9]對羊肉中摻假豬肉在390~1 040 nm波段范圍內進行了高光譜圖像的采集,最終利用競爭性自適應重加權算法(CARS)挑選出42個波長建立了羊肉摻假定量模型;Zhao等[10]基于可見—近紅外高光譜對新鮮牛肉中摻假變質牛肉進行識別,最終利用入侵雜草優(yōu)化算法(IWO)結合最小二乘支持向量機算法(LS-SVM)建立的模型效果最優(yōu);進一步證明了高光譜無損檢測技術在肉類品質檢測中的可行性。
現(xiàn)有文獻研究報道大都采用單一波段的高光譜成像技術對肉類摻假進行判別,但少有同時采用兩個波段進行對比分析。試驗擬選取高品質解凍狀態(tài)下的羊肉為摻假對象,以價格相對較低的鴨肉進行摻雜,采集樣品在可見—近紅外(400~1 000 nm)和短波近紅外(900~1 700 nm)兩個波段范圍內的高光譜信息,通過選取合適的預處理方法建立定量模型,并選取最優(yōu)的模型進行圖像反演,提出一種快速檢測羊肉摻假鴨肉的快速定量檢測可視化方法,以期為羊肉摻假的定量檢測提供數(shù)據和技術支撐。
新鮮羊肉、鴨肉:京東7fresh生鮮超市,在1 h內全程低溫貯藏運回實驗室。
高光譜設備:GaiaSoter-Dual型,GaiaField-Pro-V10E型,GaiaField-Pro-N17E型,江蘇雙利合譜科技有限公司;
電子秤:CN-LQ-C-6002型,昆山優(yōu)科維特電子科技有限公司;
多功能切碎機:HCP-A9型,中山市小馬熊電器有限公司。
1.3.1 樣品的制備 從羊肉和鴨肉中去除可見脂肪,以減少對試驗結果的干擾。將羊肉和鴨肉切塊后,按照一定的摻假比例(10%~90%,摻假間隔為10%,每份樣品總量為50 g),稱取相對應的羊肉和鴨肉至攪拌機中攪拌4 min,使樣品充分混合后放入培養(yǎng)皿中鋪平。每個摻假樣品制備5個平行樣,并同時制備5個純羊肉樣品和5個純鴨肉樣品, 共計55個。
1.3.2 高光譜圖像的采集與校正 在進行高光譜圖像采集之前,應保證光源的穩(wěn)定性,消除光譜儀自身的影響,因此試驗前先將高光譜儀器開機預熱30 min后,再進行圖像的采集。首先確定高光譜鏡頭與拍攝樣品之間的最佳物距,隨后調整高光譜采集數(shù)據的各項參數(shù),具體參數(shù):GaiaField-Pro-V10E型(400~1 000 nm)高光譜儀與樣品的物距為300 mm,曝光時間為2.4 ms,掃描速度為0.140 6 cm/s,圖像像素為800×769;GaiaField-Pro-N17E型(1 000~1 700 nm)高光譜儀與樣品的物距為510 mm,曝光時間為1.2 ms,掃描速度為0.093 2 cm/s,圖像像素為640×666。高光譜采集系統(tǒng)示意圖如圖1所示。
圖1 高光譜系統(tǒng)結構示意圖Figure 1 Schematic diagram of hyperspectral system structure
對55個樣品進行光譜信息采集后,在相同的采集條件下,掃描聚四氟乙烯白板(反射率為99.99%)得到全白的校準板圖像,蓋上相機鏡頭蓋獲取全黑的背景圖像,利用黑白校正的方法以減少儀器本身的暗電流和樣品本身對光源反射的影響。其中,黑白校正公式為:
(1)
式中:
R——校正后的信號強度;
R0——原始信號強度;
B——全黑的標定信號強度;
W——全白的標定信號強度。
1.3.3 感興趣區(qū)域提取 對55組樣品的高光譜數(shù)據進行黑白校正后,對感興趣區(qū)域進行提取,具體步驟如圖2所示,并對提取的感興趣區(qū)域內每個像素點的光譜反射率值進行平均處理作為樣品最終的光譜數(shù)據,共獲取得到55組光譜數(shù)據。數(shù)據處理采用Specview軟件、ENVI5.3軟件和Matlab2020b軟件。
1.3.4 樣品集劃分 在采集樣品的過程中,難免會產生異常樣品,其在一定程度上影響校正模型的預測能力,因此在建模前須將異常樣品從樣品集中剔除。試驗采用主成分分析(PCA),利用提取的光譜主成分得分向量來代替光譜向量計算樣本間的馬氏距離,將超出設定的馬氏距離閾值的異常樣本進行剔除[11]。剔除馬氏距離大于3f/n(f為PCA選取前6個主成分數(shù);n為樣品數(shù))的校正樣品[12],通過3f/n計算得到的馬氏距離閾值為0.327 3,最終從55個樣本中剔除1個超過閾值的異常樣品。然后采用光譜—理化值共生距離算法(SPXY)[13]將剩余的54個樣品以3∶2的比例劃分成32個校正集和22個預測集。
圖2 感興趣區(qū)域提取步驟Figure 2 Extraction steps for regions of interest
1.3.5 變量篩選方法
(1) 連續(xù)投影算法(SPA):從選定一個波長開始,每次循環(huán)都計算其在未入選波長上的投影,將投影向量最大的波長引入到波長組合。每一個新入選的波長,都與前一個線性關系最小。算法對每次選擇的結果進行MLR建模預測分析,以最小均方根誤差(RMSE)來判斷所建模型的優(yōu)劣。試驗中選擇的最佳變量數(shù)范圍為5~50,從400~1 000 nm光譜集合選擇出14個特征波長,從900~1 700 nm光譜集合選擇出13個特征波長。
(2) 競爭性自適應重加權算法(CARS):每次通過指數(shù)衰減函數(shù)(EDF)和自適應重加權采樣(ARS)選取PLS模型中回歸系數(shù)絕對值大的波長點,在交叉驗證過程中選取PLS模型中交叉驗證均方根誤差(RMSECV)最小子集定義為最優(yōu)變量子集[14]。試驗中將蒙特卡洛采樣次數(shù)設置為1 000次,交叉驗證組數(shù)為5,從400~1 000 nm光譜集合選擇出10個特征波長,從900~1 700 nm光譜集合選擇出14個特征波長。
(3) 區(qū)間隨機蛙跳(iRF)算法:它是一種可逆的跳躍馬爾可夫鏈蒙特卡羅式算法,通過計算每個區(qū)間光譜點的絕對回歸系數(shù)總和來評估區(qū)間,選擇誤差最小的區(qū)間組合[15]。參數(shù)設置:移動窗口大小w設置4,子間隔初始值Q為5,最大主成分數(shù)為10,迭代次數(shù)N設置為500。從400~1 000 nm光譜集合選擇出排名前10的波長間隔共29個特征波長,從900~1 700 nm光譜集合選擇出排名前19的波長間隔共70個特征波長。
(4) 組合區(qū)間偏最小二乘法(SiPLS):在區(qū)間偏最小二乘法(iPLS)的基礎上[16],將全光譜波段分成的若干個子區(qū)間中精度較高的幾個子區(qū)間聯(lián)合起來,以RMSECV值為衡量指標并在此基礎上建立PLS模型[17]。SiPLS的子區(qū)間數(shù)均設為10,從400~1 000 nm光譜集合選擇的最佳聯(lián)合子區(qū)間(包括2、5、6和7)共47個特征波長。從900~1 700 nm光譜集合選擇的最佳聯(lián)合子區(qū)間(包括2、3、4和10)共205個特征波長。
利用偏最小二乘法回歸(PLS)算法構建樣品中羊肉摻假鴨肉的全波段定量分析模型和特征波段定量分析模型。PLS是光譜分析中應用最廣泛的化學計量方法,該方法同時可將光譜陣X和濃度陣Y同時進行分解,并將濃度陣Y主成分信息與引入到光譜陣X的分解過程中,增強了兩者的對應計算關系[18][19]59-61。
(2)
(3)
(4)
式中:
R2——決定系數(shù);
RMSE——均方根誤差;
RPD——相對分析誤差;
n——校正集或驗證集的樣本個數(shù);
yi——第i個樣品測量值;
1.2 納入與排除標準 納入標準:①患者均符合股骨頸骨折的診斷標準;②患者均進行手術治療且無手術禁忌證;③患者均配合本項研究。排除標準:①患者合并嚴重器官功能障礙、免疫系統(tǒng)及傳染性疾??;②患者術后有認知障礙;③患有精神疾病的患者。
圖3為所有樣品在400~1 000 nm的原始光譜圖像,圖4為所有樣品在900~1 700 nm的原始光譜圖像。通過圖3(a)和圖4(a)可以看出,未摻假樣品和摻假樣品的光譜曲線趨勢大致相似,但從圖3(b)和圖4(b)中的10條不同摻假比例(0%~100%)的光譜曲線中可以看出,在500~800 nm波段,1 000~1 400 nm波段,摻假樣品相對于未摻假樣品的變化趨勢和變化幅度均有較為明顯的差異,并且在整個光譜范圍(400~1 000 nm和900~1 700 nm)內并不存在隨著羊肉摻假比例的升高,光譜的反射率曲線明顯呈升高或下降的規(guī)律,因此需要通過化學計量學方法提取光譜中的有效信息,剔除無用的干擾信息后建立模型[21]。
圖3 樣品在400~1 000 nm的原始光譜Figure 3 Original spectra of samples (400~1 000 nm)
圖4 樣品在900~1 700 nm的原始光譜Figure 4 Original spectra of samples (900~1 700 nm)
制備的肉類摻假樣品的光譜中除了包含自身豐富的化學物質信息外,還含有與樣品組分無關的信息和噪聲,如溫度、光的散射、儀器響應以及樣品自身混合不均勻等因素。采用小波變換(WT)、多元散射校正(MSC)、標準正態(tài)變量變換(SNV)、歸一化和Savitzky-Golay卷積平滑法(SG) 5種光譜預處理方法對原始光譜進行預處理,并建立羊肉摻假鴨肉的全波段PLS定量預測模型,建模結果如表1、表2所示。通過比較分析,篩選出適合于400~1 000 nm和900~1 700 nm兩個譜段范圍的光譜預處理方法。
表1 400~1 000 nm下采用不同預處理方法的全波段PLS模型性能Table 1 Performance of full-band PLS models with different pretreatment methods for 400~1 000 nm
在2.2的基礎上,對400~1 000 nm波段的光譜數(shù)據進行歸一化預處理,對900~1 700 nm波段的光譜數(shù)據進行SNV預處理后,采用4種變量篩選方法(SPA、CARS、iRF和SiPLS)對模型進行進一步優(yōu)化。
通過表3對比可以看出,雖然SPA方法和iRF方法的校正集建模效果相當,但SPA方法的預測集建模效果要優(yōu)于iRF方法。分析其原因并通過圖5可以看出,SPA方法選擇的波長在整個區(qū)間范圍內都有分布,但iRF方法選擇的波長較為集中且連續(xù),可能包含了一定的無用信息。且在可見光波段范圍內的515~700 nm波段附近存在肌紅蛋白、氧肌紅蛋白和脫氧肌紅蛋白等與肉類中色素形成相關的基團吸收[22],SPA方法選擇到的特征波長在此區(qū)間內均有分布。
表3 400~1 000 nm下采用歸一化后的PLSR建模效果Table 3 Effects of PLSR modeling after using normalization for 400~1 000 nm
圖5 400~1 000 nm波段歸一化預處理后挑選特征波長Figure 5 Selection of characteristic wavelengths after normalized pre-processing in the 400~1 000 nm band
圖6 400~1 000 nm波段歸一化結合SPA建模效果Figure 6 400~1 000 nm band normalized combined with SPA modeling effect
通過表4對比可以看出,SPA方法和CARS方法選擇的特征波長數(shù)相似,SPA方法挑選了14個波長,CARS方法挑選了13個波長,但SPA的建??傮w效果要優(yōu)于CARS。結合圖7可以看出,在980,1 200 nm附近存在O—H鍵的一級倍頻和二級倍頻的吸收;在1 235,1 540 nm 附近存在蛋白質中C—H鍵的三級倍頻和N—H鍵的二級倍頻吸收;在990~1 200,1 690~1 700 nm 附近存在于肉類中脂質形成相關的C—H鍵的二級倍頻和合頻的吸收[22-23]。SPA方法相較于CARS方法在1 600~1 700 nm波段選擇到了更多與肉類脂質形成相關的特征波長,因此其建模效果更優(yōu)。
表4 900~1 700 nm下采用SNV預處理方法后的PLSR建模效果Table 4 Effects of PLSR modeling with SNV pretreatment method for 900~1 700 nm
綜上所述,對照SPA方法在400~1 000 nm波段選擇得到的14個波長點和在900~1 700 nm波段選擇得到的13個波長點,它們大都落在與肉類相關的吸收譜帶區(qū)域內或附近,表明挑選出的各峰位較好地反映了兩種不同肉類的吸收特征;從另一個側面也說明SPA方法挑選出的波長更具有代表性,進一步提升了建模的效果。
圖7 900~1 700 nm 波段SNV預處理后挑選波長Figure 7 Selection of wavelengths after SNV pretreatment in the 900~1 700 nm band
通過2.3節(jié)可知,最佳的PLS定量模型是在900~1 700 nm 波段范圍內,首先對光譜進行SNV預處理后,再利用SPA方法挑選波長后得到。利用該模型建立羊肉摻假鴨肉含量的預測表達式:
y=0.436 4λ899.83 nm+0.186 4λ926.51 nm+0.528 3λ942.2 nm+4.141 1λ965.74 nm-5.771 0λ1 003.4 nm+1.732 7λ1 111.68 nm+2.931 3λ1 136.79 nm-0.961 4λ1 207.41 nm-0.618 9λ1 372.18 nm-3.074 4λ1 574.62 nm-0.796 7λ1 623.27 nm-3.043 6λ1 640.53 nm-1.412 7λ1 690.75 nm-13.727 8,
(5)
式中:
y——預測的摻假率值;
λ——特征波長對應的反射率值。
通過式(5)計算羊肉摻假鴨肉的高光譜圖像中每個像素點的摻假率,再使用偽彩色圖像處理方法生成摻假率的可視化圖像,如圖9所示。從圖9可以看出,隨著摻假比例的增加,顏色由深色變成淺色。高光譜成像技術提供了一種切實可靠的方法來可視化摻假樣品的分布,這是其他方法無法實現(xiàn)的。然而,對于每個單獨制備的摻假樣品,盡管在前期樣本制備的過程中已經盡可能地讓樣品混合均勻,但通過圖9仍發(fā)現(xiàn)摻假樣品的分布還是存在不均勻性。
圖8 900~1 700 nm波段 SNV結合SPA建模效果Figure 8 900~1 700 nm band SNV combined with SPA modeling effect
圖9 羊肉摻假鴨肉摻假可視化圖像Figure 9 Visualization images of lamb adulteration and duck adulteration
(1) 對于400~1 000 nm波段來說,采用歸一化預處理后建立的全波段PLS模型精度最高;對于900~1700 nm 波段來說,采用SNV預處理后建立的全波段PLS模型精度最高。對最佳預處理方法下的兩個光譜波段進行波長選擇,發(fā)現(xiàn)SPA方法在消除多重共線性的基礎上,挑選出的波長之間的共線性最小且具有代表性,能進一步提升模型的精度和簡潔度。
(2) 在900~1 700 nm波段范圍內含有的與肉類組成相關的基團信息更多,更能反映肉類的特征信息,可能更適合于進行肉類摻假的識別。為擴大模型的全面性和適用性,試驗還需延伸至長波近紅外譜段(1 700~2 500 nm);同時,試驗中選取高品質的羊肉和鴨肉均為當?shù)爻械某善钒b,后續(xù)模型能否適用于不同環(huán)境(溫度、濕度、形態(tài)等)、不同品種、不同品質、不同喂養(yǎng)方式和不同新鮮度下的羊肉摻假研究,需進一步地驗證探討。