吳 威, 祖廣鵬, 陳桂云, 徐劍宏, 陳坤杰*
1. 南京農(nóng)業(yè)大學(xué)工學(xué)院,江蘇 南京 210031 2. 江蘇省農(nóng)業(yè)科學(xué)院食品質(zhì)量安全與檢測研究所,江蘇 南京 210014
脫氧雪腐鐮刀菌烯醇(DON),屬單端孢霉烯族化合物,通常存在于感染了赤霉病的谷物中。DON含量超標(biāo)的食物具有致癌、致畸、致突變的作用,危害人類和家畜的生命健康[1-2]。我國在《食品中真菌毒素限量》(GB2761—2011)標(biāo)準(zhǔn)中規(guī)定了小麥等制品 DON 的限量指標(biāo)為1 000 μg·kg-1 [3]。
實驗共采集了102個具有不同DON濃度的小麥樣品,品種為鎮(zhèn)麥168。這些小麥樣本在揚(yáng)花期接種了赤霉菌毒素。樣本經(jīng)過去皮、磨粉、過篩,其粗細(xì)程度滿足我國標(biāo)準(zhǔn)粉規(guī)格。使用近紅外光譜儀InfraXact(Foss,USA)收集樣品光譜。光譜儀配備硅探測器(570~1 100 nm), 銦鎵砷探測器(1 100~1 850 nm)。樣品以2 nm間隔在570~1 848 nm范圍內(nèi)掃描,數(shù)據(jù)采集的頻率為每次掃描3 s。每個樣品掃描兩次,取其平均值。通過ISIscan(Infrasoft International,Port Matilda,PA,USA)收集光譜數(shù)據(jù)。
DON含量參考值按照《GB 5009.111—2016 食品安全國家標(biāo)準(zhǔn)食品中脫氧雪腐鐮刀菌烯醇及其乙?;苌锏臏y定》[15](第二法免疫親和層析凈化高效液相色譜法HPLC),使用HPLC系統(tǒng)(SHIMADZU,SPD-10A,UV-VIS DETECTOR ; LC-10AT VP)進(jìn)行定量測定。
利用Unscrambler?X,v10.1(CAMO Software AS,Oslo,Norway,2011)軟件進(jìn)行數(shù)據(jù)預(yù)處理。所有樣本的光譜首先通過15點(diǎn)Savitzky-Golay函數(shù)平滑,然后通過去趨勢處理,最后進(jìn)行乘法散射校正(MSC)。
在光譜矩陣中,每一行對應(yīng)一個樣本的光譜,并把樣本按DON濃度從低到高進(jìn)行排列。第一列為樣本的DON濃度,其后的640列為570~1 848 nm波段下的光譜值(吸光度)。選取其中所有的奇數(shù)行作為校正集光譜,所有偶數(shù)行數(shù)據(jù)作為驗證集光譜,校正集和驗證集均有51個樣本。在這樣的光譜矩陣中,單波段下所有樣本的吸光度從上到下的遞增趨勢越強(qiáng),則說明該波段下的吸光度與DON濃度的變化趨勢越是一致,則該波段可以作為評估DON濃度的特征波段。據(jù)此,可以為每一個波段定義一個判斷遞增趨勢的趨勢參數(shù),以期找到遞增趨勢最強(qiáng)的特征波段,具體做法如下:
利用Unscrambler?X,v10.1軟件中的二次判別分析QDA模塊進(jìn)行分析建模。提取校正集中特征波段下的光譜,采用兩個閾值1 000和2 000 μg·kg-1,將校正集數(shù)據(jù)分成低、中、高程度三類污染水平,因此QDA建模的類別數(shù)為3。假設(shè)所有變量的先驗概率均相等,權(quán)重均為1.00。所構(gòu)建的模型在驗證集特征波段的光譜下進(jìn)行模型檢驗。DON的分類準(zhǔn)確性通過計算被正確分類的樣本數(shù)占樣本總數(shù)的百分比來評估。
在102個小麥樣品中,DON水平為319~31 437 μg·kg-1不等,通過可見光-近紅外光譜法分析小麥樣品,并且以570~1 848 nm之間的吸光度記錄光譜。圖1顯示了6種不同DON濃度小麥樣品的Vis-NIR原始光譜,其范圍在319~5 895 μg·kg-1DON范圍內(nèi)。從這些譜圖的比較來看,低DON水平的小麥樣品與含有高DON水平的小麥樣品具有相同的Vis-NIR譜帶,因此表明兩種樣品中的主要官能團(tuán)和化學(xué)成分是共存的。
圖1 六種不同DON濃度(用高效液相色譜法測量)小麥樣品的Vis-NIR光譜
Fig.1 Vis-NIR spectra of wheat samples with six different DON concentrations (measured by high performance liquid chromatography)
按照1.4節(jié)的特征波長選取方法,計算各個波段對應(yīng)的趨勢參數(shù),結(jié)果如圖2所示,可見在666,1 238和1 660 nm波段處出現(xiàn)三個局部最大值,將其提取作為評估DON濃度的特征波段。
圖2 各個波段下趨勢參數(shù)分布圖Fig.2 Distribution of trend parameter of each band
只提取校正集樣本的三個特征波段(666,1 238和1 660 nm)下的光譜。采用兩個閾值1 000和2 000 μg·kg-1,事先將校正集數(shù)據(jù)分成低、中、高程度污染。利用QDA將校正集樣本分成三類,結(jié)果的混淆矩陣如表1(左側(cè))所示,校正過程中整體分類正確率為88.24%。低和中度污染水平樣本都100%被正確分類; 重度污染的31個樣本中只有6個樣本被誤判為中度污染,剩余的25個(80.64%)的重度污染樣本被正確分類。利用校正集構(gòu)建的TP-QDA模型去判定驗證集合中的樣本,驗證集也只選取三個特征波段的光譜,驗證結(jié)果如表1(右側(cè))所示。驗證集總體判斷正確率為86.27%。
表1 趨勢參數(shù)(TP)-二次判別分析(QDA)模型的校正及驗證結(jié)果
Table 1 The calibration and validation results of Trend Parameter(TP)-Quadratic Discriminant Analysis (QDA) model
參考類別(HPLC測量結(jié)果)校正分類結(jié)果驗證分類結(jié)果輕度中度重度輕度中度重度輕度400200中度01661144重度00250228
主成分分析PCA是選取特征波段最有效的方法之一,谷物中DON含量檢測的文章中很多都采用了主成分分析[11-15],從而對數(shù)據(jù)進(jìn)行降維。以下將對相同的校正集樣本,采用PCA選取特征波段,建模方式仍為QDA分析,PCA-QDA模型檢測的準(zhǔn)確率仍在原來的驗證集樣本中測試,從而對趨勢參數(shù)法和主成分分析法選取特征波段的有效性做一一對比。
對校正集全光譜數(shù)據(jù)進(jìn)行主成分分析,選取前2個主成分,解釋了91%的變量。QDA分析時采用PCA的選取的兩個主成分,PCA-QDA模型的校正和驗證集分類結(jié)果,以及其與TP-QDA模型檢測結(jié)果的對比如表2所示??梢姡蓑炞C集中的輕度污染樣本,TP-QDA模型在各個分類中的分類正確率以及整體分類正確率都高于PCA-QDA模型,因此,趨勢參數(shù)法選擇的特征波段能獲得更高的識別率。
表2 TP-QDA和PCA-QDA模型校正和驗證識別準(zhǔn)確率對比結(jié)果
Table 2 The classification accuracy comparison of TP-QDA and PCA-QDA model in calibration and verification sets
準(zhǔn)確率TP-QDAPCA-QDA校正驗證校正驗證輕度分類準(zhǔn)確率/%10066.6750100中度分類準(zhǔn)確率/%10087.5062.5081.25重度分類準(zhǔn)確率/%80.6481.8174.1965.62整體分類準(zhǔn)確率/%88.2486.2768.6272.55
通過定義各個波段下光譜的趨勢參數(shù),可以得到與小麥粉中DON濃度最相關(guān)的特征波段,選出的特征波段有助于快速準(zhǔn)確地判定小麥粉中DON含量的等級。分類模型表現(xiàn)出良好的預(yù)測性能,總體分類率高,小分類錯誤率低,模型簡單,無需昂貴耗材,能快速分析大量的樣品,所提出的分類模型在篩選小麥樣品的脫氧雪腐鐮刀菌烯醇含量方面具有實際應(yīng)用價值,使得NIR光譜學(xué)成為監(jiān)測安全程序的強(qiáng)有力的工具。但是該方法還需要在更多品種小麥樣本中進(jìn)行普適性驗證。