王 冬, 潘立剛, 劉龍海, 江元卿, 李 安, 靳欣欣, 馬智宏, 王紀(jì)華*
1. 北京農(nóng)業(yè)質(zhì)量標(biāo)準(zhǔn)與檢測技術(shù)研究中心,北京 100097
2. 農(nóng)業(yè)部農(nóng)產(chǎn)品質(zhì)量安全風(fēng)險評估實驗室(北京),北京 100097
3. 愛德萬測試(中國)管理有限公司,上海 201203
ATR-THz波譜結(jié)合PLS-DA對陳化小麥快速無損鑒別研究
王 冬1, 2, 潘立剛1, 2, 劉龍海3, 江元卿3, 李 安1, 2, 靳欣欣1, 2, 馬智宏1, 2, 王紀(jì)華1, 2*
1. 北京農(nóng)業(yè)質(zhì)量標(biāo)準(zhǔn)與檢測技術(shù)研究中心,北京 100097
2. 農(nóng)業(yè)部農(nóng)產(chǎn)品質(zhì)量安全風(fēng)險評估實驗室(北京),北京 100097
3. 愛德萬測試(中國)管理有限公司,上海 201203
采用ATR附件采集了人工控制條件老化小麥樣品的太赫茲波譜數(shù)據(jù),并在PCA綜合得分基礎(chǔ)上對數(shù)據(jù)進行分集,建立陳化小麥的快速無損鑒別PLS-DA模型,并對其進行外部驗證。結(jié)果顯示,針對吸收系數(shù)譜,所建模型的校正集實驗組、對照組以及交互驗證實驗組、對照組正確率分別為84.2%,94.7%,84.2%和81.6%,外部驗證集實驗組、對照組正確率分別為73.7%和100.0%; 針對折射率譜,所建模型的校正集實驗組、對照組以及交互驗證實驗組、對照組正確率分別為84.2%,92%,76.3%和76.3%,外部驗證集實驗組、對照組正確率分別為84.2%和89.5%。研究表明,ATR-THz技術(shù)在陳化小麥無損鑒別方面具有一定的應(yīng)用潛力。
太赫茲波譜; 衰減全反射; 小麥; 綜合得分; 判別分析
近年來,食品安全事件頻繁發(fā)生,糧食安全是關(guān)系到國計民生的大事。糧食經(jīng)過一段時間儲藏,特別是炎熱的夏季,由于溫度和濕度等條件控制不到位,均極有可能成為陳化糧。
小麥?zhǔn)俏覈饕Z食作物之一。小麥質(zhì)量安全影響著廣大消費者的飲食健康。陳化小麥不僅營養(yǎng)、品質(zhì)有所下降,而且容易滋生有害物質(zhì),食用后對人體健康非常不利。然而,陳化小麥經(jīng)過研磨過篩等加工后,從外觀上難以辨認(rèn)?,F(xiàn)有的陳化小麥(粉)的鑒別方法多以感官法為主,存在很大的主觀因素。
小麥在陳化過程中,脂肪酸、碳水化合物、蛋白質(zhì)、酶等多項指標(biāo)皆會發(fā)生不同程度的變化,有的表現(xiàn)為量的改變,有的表現(xiàn)為質(zhì)的轉(zhuǎn)化,并且各品質(zhì)之間的變化既相互關(guān)聯(lián),又相互影響。由此可見,僅從單一指標(biāo)衡量小麥陳化程度是難以實現(xiàn)準(zhǔn)確判斷的。只有全面考慮內(nèi)外因子的變化,才能對小麥的新陳作出較準(zhǔn)確的判斷。
太赫茲波譜[1-2]介于紅外和微波之間,是迄今為止人類尚未完全開發(fā)的電磁波譜區(qū)。近年來,太赫茲波譜技術(shù)成為新的研究熱點[3-4],很多學(xué)者圍繞太赫茲波譜應(yīng)用技術(shù)展開了有意義的研究工作。在食品安全方面,張寶月[5]等采用太赫茲波譜針對小麥粉中摻入滑石粉進行檢測初步研究; 付秀華[6]等將太赫茲波譜數(shù)據(jù)結(jié)合偏最小二乘算法針對小麥粉中摻入的滑石粉建立定量分析模型,其相關(guān)系數(shù)達到0.993 9,均方根誤差為1.48%,檢出限優(yōu)于2.0%; 秦建平[7]等對面粉和面粉增白劑的太赫茲波譜特征進行了初步研究; Gyeongsik Ok[8]等采用太赫茲波譜成像技術(shù)對食物中的異物進行成像研究; 廉飛宇[9]等對反復(fù)高溫加熱前后的食用油采集太赫茲波譜,在分析波譜特征的基礎(chǔ)上指出,太赫茲波譜可實現(xiàn)對上述食用油的鑒別; 梁川[10]等采用太赫茲波譜技術(shù)對高油玉米中的油分進行了初步研究,結(jié)果表明,不同品種玉米的胚乳在太赫茲波譜區(qū)內(nèi)存在差異。
針對陳化小麥鑒別難題,采用太赫茲波譜技術(shù),針對人工控制條件的不同老化程度小麥樣品采集衰減全反射-太赫茲(attenuated total reflection-Terahertz, ATR-THz)波譜數(shù)據(jù),建立陳化小麥快速無損鑒別模型,并對模型進行外部驗證評價。為陳化小麥的快速無損鑒別提供新的方法,并且對劣變農(nóng)產(chǎn)品的快速無損鑒別以及太赫茲波譜在農(nóng)產(chǎn)品質(zhì)量安全方面的應(yīng)用提供一定的參考。
1.1 材料
在小麥主產(chǎn)區(qū)進行代表性樣品收集,先后收集小麥樣品共計57份,品種涵蓋冬小麥(47份)、春小麥(10份); 產(chǎn)地覆蓋北京(34份)、河南(7份)、江蘇(6份)、內(nèi)蒙古(10份)地區(qū)。所收集樣品皆分為對照組和實驗組。采用人工加速陳化方法,在人工控制溫濕度條件下分別將對照組、實驗組小麥進行處理,共得到小麥樣品114個; 經(jīng)過篩除雜質(zhì)、研磨過篩,制備全麥粉。
化學(xué)指標(biāo)的測試: 小麥在陳化過程中,脂肪酸、碳水化合物、蛋白質(zhì)、酶等多項指標(biāo)皆會發(fā)生不同程度的變化,各品質(zhì)之間的變化既相互關(guān)聯(lián)、又相互影響。選擇了小麥中含量、變化皆較大的成分—蛋白質(zhì)—進行了化學(xué)指標(biāo)測定,即測定各樣品的濕面筋、干面筋含量,用以對小麥陳化做出描述。
1.2 儀器
采用太赫茲波譜儀(儀器型號: TAS7500SP,日本AdvanTest公司)結(jié)合ATR附件對各小麥粉樣品采集太赫茲波譜數(shù)據(jù)。儀器光路示意圖如圖1所示。由發(fā)射器發(fā)射的太赫茲波譜經(jīng)過光路反射后,照射在樣品表面,與樣品相互作用后,反射的太赫茲波譜經(jīng)由光路反射,被檢測器接收。太赫茲波段: 0~2 THz,頻率分辨率: 0.007 6 THz,累加次數(shù): 2 048次。
圖1 太赫茲光路示意圖
1.3 數(shù)據(jù)處理
針對太赫茲波譜數(shù)據(jù)的兩種表現(xiàn)形式——吸收系數(shù)譜、折射率譜,采用偏最小二乘-判別分析(partial least square-discriminant analysis, PLS-DA)算法結(jié)合全交互驗證算法(full cross validation)建立陳化小麥快速無損鑒別模型,采用外部驗證樣品對模型性能做進一步驗證; 分別針對訓(xùn)練樣品和外部驗證樣品,通過模型測定系數(shù)(determination coefficient,R2)、校正集均方根誤差(root mean square error of calibration, RMSEC)、交互驗證均方根誤差(root mean square error of cross validation, RMSECV)以及模型的預(yù)測正確率分別對模型自身及其預(yù)測性能進行評價。
2.1 參考值
對各小麥樣品的面筋含量進行測試,測試按照“GB/T 5506.2—2008”執(zhí)行。將小麥的面筋測試結(jié)果進行統(tǒng)計,如表1所示。
表1 小麥面筋測試統(tǒng)計結(jié)果
面筋測試結(jié)果顯示,河南、北京冬小麥陳化組較對照組干、濕面筋含量皆由不同程度的下降; 江蘇冬小麥的濕面筋含量有所上升,干面筋含量有所下降; 內(nèi)蒙春小麥的干、濕面筋含量皆有小幅下降。測試結(jié)果表明,陳化過程對小麥品質(zhì)具有相當(dāng)程度的影響,但影響程度有所不同,僅用面筋變化則難以描述,需要結(jié)合波譜數(shù)據(jù)進一步建立鑒別模型。
2.2 吸收系數(shù)譜數(shù)據(jù)
針對太赫茲吸收系數(shù)譜數(shù)據(jù)進行分析,建立陳化小麥ATR-THz吸收系數(shù)譜鑒別模型。
(1)吸收系數(shù)譜主成分分析與數(shù)據(jù)分集
采用主成分分析(principal component analysis, PCA)對小麥ATR-THz吸收系數(shù)譜數(shù)據(jù)進行分解,第1—8主成分貢獻率分別為50%,10%,6%,4%,4%,3%,2%,2%,即前8個主成分累計貢獻率達到81%。主成分分析PC1和PC2得分散點圖如圖2所示。從圖2可見,難以獲得陳化、非陳化小麥的清晰劃分界限。
為對所建模型進行有效驗證,將上述小麥的ATR-THz吸收系數(shù)譜數(shù)據(jù)分為訓(xùn)練集和外部驗證集。訓(xùn)練集、外部驗證集皆包含實驗組和對照組小麥樣品,數(shù)據(jù)分集依據(jù)如下: 分別根據(jù)實驗組(A)、對照組(B)小麥樣品的吸收系數(shù)譜數(shù)據(jù)在第1~8主成分上的得分值以及對應(yīng)的主成分貢獻率,計算吸收系數(shù)譜數(shù)據(jù)PCA綜合得分,按照綜合得分升序排列,按照訓(xùn)練集∶外部驗證集=2∶1的比例挑選外部驗證集和訓(xùn)練集。吸收系數(shù)譜數(shù)據(jù)PCA前8個主成分的綜合得分計算公式如下
其中,TA為系數(shù)譜數(shù)據(jù)PCA綜合得分,ti為第i主成分得分,λi為第i主成分貢獻率。
根據(jù)吸收系數(shù)譜數(shù)據(jù)PCA綜合得分選取的訓(xùn)練集、外部驗證集樣品,繪制綜合得分-樣品號散點圖,如圖3所示。由圖3可見,根據(jù)上述綜合得分所選的實驗組、對照組的外部驗證集和訓(xùn)練集具有一致的分布趨勢,因此可以避免模型驗證出現(xiàn)嚴(yán)重偏差的錯誤。
圖2 小麥ATR-THz吸收系數(shù)譜PCA分解第1和第2主成分得分散點圖
Fig.2 The scatter plot of PC1 and PC2 scores of ATR-THz absorption coefficient spectra of wheat by PCA
圖3 實驗組(a)和對照組(b)吸收系數(shù)譜綜合得分散點圖
Fig.3 The scatter plots of synthesis scores of absorption coefficient spectra for experiment group (a) and control group (b)
圖4 陳化小麥ATR-THz吸收系數(shù)譜數(shù)據(jù)PLS模型
(a): Scatter plot of PC1-PC2 scores; (b): Decreasing plot of RMSEC and RMSECV versus factor number; (c): Correlation of the predicted and specified values of the calibration set; (d): Correlation of the predicted and specified values of the cross validation set
(2)判別模型的建立與預(yù)測
針對小麥ATR-THz吸收系數(shù)譜數(shù)據(jù),結(jié)合全交互驗證算法,建立PLS-DA模型,結(jié)果如圖4所示。
圖4(a)是第1、2主成分得分散點分布圖,其中,實線區(qū)域表示對照組樣品得分分布,虛線區(qū)域表示實驗組得分分布??梢?,小麥ATR-THz吸收系數(shù)譜數(shù)據(jù)PLS-DA模型的前2個主成分可以將實驗組、對照組樣品區(qū)分開。圖4(b)是模型的RMSEC, RMSECV隨模型維數(shù)下降曲線圖,圖4(b)表明,2維是該模型的最佳主成分?jǐn)?shù)。圖4(c)、圖4(d)分別是訓(xùn)練集以及交互驗證的預(yù)測值-化學(xué)值相關(guān)關(guān)系圖,從中可見,以“0”為分界,可以將大多數(shù)樣品正確分開。
模型結(jié)果的數(shù)據(jù)如表2所示。通過表2數(shù)據(jù)可見,針對訓(xùn)練集小麥樣品的ATR-THz吸收系數(shù)譜數(shù)據(jù),訓(xùn)練集以及交互驗證的實驗組、對照組的正確識別率皆在81%以上。
表2 陳化小麥吸收系數(shù)譜PLS模型結(jié)果
對外部驗證集的預(yù)測結(jié)果如表3所示。通過表3數(shù)據(jù)可見,針對外部驗證集小麥樣品的ATR-THz吸收系數(shù)譜數(shù)據(jù),實驗組、對照組的正確識別率皆在73%以上。
表3 吸收系數(shù)譜外部驗證集預(yù)測結(jié)果
Table 3 Prediction result of absorption coefficient spectra for the external validation set
實驗組正確個數(shù)實驗組誤判個數(shù)實驗組正確率/%對照組正確個數(shù)對照組誤判個數(shù)對照組正確率/%15473 7190100 0
2.3 折射率譜數(shù)據(jù)分析
折射率譜是太赫茲波譜數(shù)據(jù)的另一種重要表現(xiàn)形式,其譜線是以頻率為橫坐標(biāo),以物質(zhì)在對應(yīng)頻率下對太赫茲波的折射率為縱坐標(biāo)而繪制的。針對折射率譜數(shù)據(jù)進行分析,建立陳化小麥ATR-THz折射率譜鑒別模型。
(1)主成分分析與數(shù)據(jù)分集
采用PCA對小麥ATR-THz折射率譜數(shù)據(jù)進行分解,第1~16主成分貢獻率分別為18%,13%,9%,7%,5%,5%,4%,3%,3%,3%,2%,2%,2%,2%,1%和1%,即前16個主成分累計貢獻率達到80%。主成分分析PC1和PC2得分散點圖如圖5所示。從圖5可見,難以獲得陳化、
圖5 小麥ATR-THz折射率譜PCA分解第1,第2主成分得分散點圖
Fig.5 The scatter plot of PC1 and PC2 scores of ATR-THz refractive index spectra data of wheat by PCA
非陳化小麥的清晰劃分界限。
為對所建模型進行有效驗證,將上述小麥的ATR-THz折射率譜數(shù)據(jù)分為訓(xùn)練集和外部驗證集。訓(xùn)練集、外部驗證集皆包含實驗組和對照組小麥樣品,數(shù)據(jù)分集依據(jù)如下: 分別根據(jù)實驗組(A)、對照組(B組)小麥樣品在第1~16主成分上的得分值以及對應(yīng)的主成分貢獻率,計算綜合得分,按照綜合得分升序排列,按照訓(xùn)練集∶外部驗證集=2∶1的比例挑選外部驗證集和訓(xùn)練集。前16個主成分的綜合得分計算公式如下
其中,T為綜合得分;ti為第i主成分得分;λi為第i主成分貢獻率。
根據(jù)綜合得分選取的訓(xùn)練集、外部驗證集樣品,繪制綜合得分-樣品號散點圖,如圖6所示。由圖6可見,根據(jù)綜合得分所選的實驗組、對照組的外部驗證集和訓(xùn)練集具有一致的分布趨勢,因此可以保證對模型的有效驗證,而不至發(fā)生模型驗證出現(xiàn)嚴(yán)重偏差。
圖6 陳化組(a)和非陳化組(b)折射率譜綜合得分散點圖
Fig.6 The scatter plots of synthesis scores of refractive index spectra for the experimental group (a) and control group (b)
(2)判別模型的建立與預(yù)測
針對小麥ATR-THz折射率譜數(shù)據(jù),針對訓(xùn)練集樣品采用全交互驗證算法,建立PLS-DA模型,建模結(jié)果如圖7所示。
圖7(a)是第1和2主成分得分三點分布圖,其中,實線區(qū)域表示對照組樣品得分分布,虛線區(qū)域表示實驗組得分分布。可以看到,小麥ATR-THz折射率譜數(shù)據(jù)的PLS-DA模型的前2個主成分可以將實驗組、對照組樣品區(qū)分開。圖7(b)是模型的RMSEC和RMSECV隨模型維數(shù)下降曲線圖,圖7(b)表明,2維是該模型的最佳主成分?jǐn)?shù)。圖7(c), 圖7(d)分別是訓(xùn)練集以及交互驗證的預(yù)測值-化學(xué)值相關(guān)關(guān)系圖,從中可見,以“0”為分界,可以將大多數(shù)樣品正確分開。
模型結(jié)果的數(shù)據(jù)如表4所示。通過表4數(shù)據(jù)可見,針對訓(xùn)練集小麥樣品的ATR-THz折射率譜數(shù)據(jù),訓(xùn)練集以及交互驗證的實驗組、對照組的正確識別率皆在76%以上。
圖7 陳化小麥ATR-THz折射率譜數(shù)據(jù)PLS模型
(a): Scatter plot of PC1-PC2 scores; (b): Decreasing plot of RMSEC and RMSECV versus factor number; (c): Correlation of the predicted and specified values of the calibration set; (d): Correlation of the predicted and specified values of the cross validation set
表4 陳化小麥折射率譜PLS模型結(jié)果
表5 折射率譜外部驗證集預(yù)測結(jié)果
對外部驗證集的預(yù)測結(jié)果如表5所示。通過表5數(shù)據(jù)可見,針對外部驗證集小麥樣品的ATR-THz折射率譜數(shù)據(jù),實驗組、對照組的正確識別率皆在84%以上。
采用太赫茲波譜技術(shù)結(jié)合ATR附件采集了人工控制條件老化小麥樣品的太赫茲波譜數(shù)據(jù),并對陳化小麥的快速無損鑒別進行了探索研究。結(jié)果表明,針對吸收系數(shù)譜,所建立的PLS-DA模型的正確率皆在81%以上,外部驗證樣品的正確識別率在73%以上; 針對折射率譜,所建立的PLS-DA模型的正確率皆在76%以上,外部驗證樣品的正確識別率在84%以上。上述結(jié)果表明,ATR-THz技術(shù)在陳化小麥無損鑒別方面具有一定的應(yīng)用潛力。然而,進一步提高太赫茲波譜技術(shù)在陳化糧食快速無損鑒別方面的正確率,以及進一步擴展太赫茲波譜在農(nóng)產(chǎn)品質(zhì)量安全方面的應(yīng)用,還需要進一步深入探索。
[1] Mantsch H H, Naumann D. Journal of Molecular Structure, 2010, 964(1-3): 1.
[2] ZHU Shou-ming, TIAN Lu, ZHAO Kun, et al(朱守明, 田 璐, 趙 昆, 等). Acta Photonica Sinica(光子學(xué)報), 2010, 39(Sup. 1): 9.
[3] Ho L, Müller R, Gordon K C, et al. European Journal of Pharmaceutics and Biopharmaceutics, 2009, 71(1): 117.
[4] Qin J, Xie L, Ying Y. Food Chemistry, 2015, 170: 415.
[5] ZHANG Bao-yue, LI Jiu-sheng(張寶月, 李九生). Journal of the Chinese Cereals and Oils Association(中國糧油學(xué)報), 2010, 25(7): 113.
[6] FU Xiu-hua, LI Wen-da, XIA Yi, et al(付秀華, 李聞達, 夏 燚, 等). Journal of the Chinese Cereals and Oils Association(中國糧油學(xué)報), 2013, 28(3): 110.
[7] QIN Jian-ping, NIU Bo, ZHANG Yuan, et al(秦建平, 牛 波, 張 元, 等). Science and Technology of Cereals, Oils and Foods(糧油食品科技), 2013, 21(2): 39.
[8] Ok G, Kim H J, Chun H S, et al. Food Control, 2014, 42: 284.
[9] LIAN Fei-yu, QIN Jian-ping, NIU Bo, et al(廉飛宇, 秦建平, 牛 波, 等). Agricultural Engineering(農(nóng)業(yè)工程), 2012, 2(6): 37.
[10] LIANG Chuan, QI Shu-ye, LI Xi-ran, et al(梁 川, 戚淑葉, 李曦染, 等). Journal of Food Safety and Quality(食品安全質(zhì)量檢測學(xué)報), 2014, 5(3): 730.
(Received Mar. 11, 2015; accepted Jun. 27, 2015)
*Corresponding author
Research on Rapid and Non-Destructive Identification of Aging Wheat Based on ATR-Terahertz Spectroscopy Combined with PLS-DA
WANG Dong1, 2, PAN Li-gang1, 2, LIU Long-hai3, JIANG Justin3, LI An1, 2, JIN Xin-xin1, 2, MA Zhi-hong1, 2,WANG Ji-hua1, 2*
1. Beijing Research Center for Agricultural Standards and Testing, Beijing 100097, China
2. Risk Assessment Lab for Agro-products (Beijing), Ministry of Agriculture, Beijing 100097, China
3. Advantest (China) Co. Ltd., Shanghai 201203, China
In this research, the terahertz spectra data of the aging wheat processed under manual control environment by ATR accessory were collected. After the data diversity based on the composite score by PCA, the non-destructive identification models of aging wheat were developed by PLS-DA algorithm. The results showed that for the absorption coefficient spectrum, the accuracy of the experimental group, control group of the calibration set and cross validation set were 84.2%, 94.7%, 84.2% and 81.6% respectively, while the accuracy of the experimental group and control group of the external validation set were 73.7% and 100.0% respectively; for the refractive index spectrum, the accuracy of the experimental group, control group of the calibration set and cross validation set were 84.2%, 92.0%, 76.3% and 76.3% respectively, while the accuracy of the experimental group and control group of the external validation set were 84.2% and 89.5% respectively. The research indicates that ATR-THz technology should be of great potentials in the application in the non-destructive identification of aging wheat.
Terahertz spectroscopy; Attenuated total reflection; Wheat; Composite score; Discriminant analysis
2015-03-11,
2015-06-27
國家重大科學(xué)儀器設(shè)備開發(fā)專項(2012YQ14000507),北京市農(nóng)林科學(xué)院青年基金項目(QNJJ201431)資助
王 冬,1982年生,北京農(nóng)業(yè)質(zhì)量標(biāo)準(zhǔn)與檢測技術(shù)研究中心副研究員 e-mail: wangd@nercita.org.cn *通訊聯(lián)系人 e-mail: wangjh@nercita.org.cn
O657.33
A
10.3964/j.issn.1000-0593(2016)07-2036-06