宗 婧,黃志軒,陳曉宇,陳 達
(1.天津大學(xué)精密儀器與光電子工程學(xué)院,天津 300072;2.中國民航大學(xué)飛機防火及應(yīng)急研究所,天津 300300)
近年來,隨著乳品消費量的大幅增加,乳品安全已經(jīng)引起全社會的高度關(guān)注。其中,乳粉作為大眾食品原料,在全球經(jīng)濟貿(mào)易中占有重要地位。受經(jīng)濟利益驅(qū)使的乳粉摻假行為具有一定的普遍性,嚴重地損害了人民的利益,甚至危及嬰幼兒的生命健康[1-3]。我國目前的食品安全檢測標(biāo)準(zhǔn)方法僅僅針對已知危害物質(zhì)制定其限量標(biāo)準(zhǔn)。然而,由于新型化學(xué)性有害物質(zhì)層出不窮,不法商販為逃避監(jiān)管,有可能使用其他可替代化學(xué)品,不可能逐一建立檢測標(biāo)準(zhǔn)。因此,針對可能存在未知摻雜物的乳粉,發(fā)展新型、高效的非定向篩查技術(shù),成為食品安全領(lǐng)域的一大緊迫需求。
目前常用的乳粉檢測手段主要基于色譜、質(zhì)譜技術(shù),如高效液相色譜法、氣相色譜-質(zhì)譜聯(lián)用法等[4-7],通常是通過盡可能多的搜集化學(xué)品的信息,構(gòu)建大數(shù)據(jù)庫,以覆蓋乳粉中未知化合物的檢測。基于色譜和質(zhì)譜的分析方法,雖然靈敏度高,但其需要繁瑣的前處理工序,對檢測人員要求高,對儀器成本要求高,不適宜用作大規(guī)模的快速篩查[8-10],而更適合作為篩查后的確證方法使用。
在各類檢測技術(shù)中,基于光譜的檢測技術(shù),具有檢測速度快、無損、操作簡單、高通量等優(yōu)點[3,11-13]。其中,拉曼光譜譜峰指紋特異性好,富含豐富的光譜信息,為后續(xù)化學(xué)計量學(xué)分析奠定了良好的基礎(chǔ),十分適用于乳粉的非定向篩查。然而,乳粉摻雜行為大部分是通過添加含氮化合物提升其表觀蛋白質(zhì)含量[13-14],通常摻雜濃度很低,且因不需要特殊設(shè)備和培訓(xùn),其混合方式通常是干法混合[15],因此存在混合不均勻的現(xiàn)象。傳統(tǒng)的拉曼光譜技術(shù),僅采集樣品單點數(shù)據(jù)或多點數(shù)據(jù)取平均值,而忽略了乳粉樣本的非均勻異質(zhì)性[16],因此極易錯過低濃度摻雜物質(zhì),從而降低其檢測靈敏度。
針對摻雜乳粉上述特點,引入拉曼高光譜成像技術(shù)用于乳粉安全性的檢測,該技術(shù)有效結(jié)合微區(qū)分析和大面積掃描的特性,可同時獲取包括位置信息和光譜信息的三維數(shù)據(jù)立方體[17]。目前,一些文獻報道了拉曼近紅外光譜成像技術(shù)在藥品和食品的摻假診斷中的應(yīng)用,然而這些方法往往只能實現(xiàn)特定摻雜物的定向篩查,即針對某種已知摻雜物建立其定性、定量的化學(xué)計量學(xué)方法,而并未將這些光譜成像技術(shù)應(yīng)用于非定向篩查領(lǐng)域,因此難以全面覆蓋食品中的未知摻雜物。如Chao Kuanglin等[18]使用摻雜物標(biāo)準(zhǔn)譜出峰位置的強度值結(jié)合最優(yōu)閾值畫出二值成像圖。Fu Xiaping等[19]通過光譜角測量(spectral angle mapping,SAM)、光譜相關(guān)性度測量和歐式距離測量等光譜相似性分析方法,比較被測物的每個像素點的光譜與純摻雜物光譜的相似度,從而證明高光譜技術(shù)結(jié)合光譜相似性分析可以有效地檢測食品中的摻雜物。Lohumi等[20]使用單變量、多變量和光譜角制圖等方法,針對摻雜物作出成像圖,并根據(jù)摻雜像素點的數(shù)量進行辣椒粉的定量分析。Qin Jianwei等[10,21-22]在拉曼成像技術(shù)領(lǐng)域發(fā)表了很多的工作成果,其中,常使用被測物特征單波長信息畫出拉曼強度圖,并結(jié)合強度閾值法畫出被測摻雜物的二值圖,再通過摻雜像素點的個數(shù)定量分析摻雜質(zhì)量。然而,在真實的乳粉摻雜鑒別應(yīng)用中,各類摻雜物質(zhì)種類繁多,定向篩查方法難以通過窮舉法實現(xiàn)全面檢查。因此,急需發(fā)展一種通用的非定向篩查方法,用于彌補傳統(tǒng)拉曼高光譜成像技術(shù)在乳粉質(zhì)量安全檢測中的不足。
本研究發(fā)展了一種基于移動窗口光譜角制圖的拉曼高光譜成像方法(moving spectral angle mapping Raman hyperspectral imaging method,MWSAM-RHIM),以實現(xiàn)乳粉安全的非定向篩查。在MWSAM-RHIM中,利用改進的移動窗口光譜角制圖算法,借助高光譜位置信息與光譜信息合一的特性,將乳粉中未知摻雜物的識別問題轉(zhuǎn)化為奇異像素點的識別問題,設(shè)置合理閾值,構(gòu)建二值圖像,進而可視化、非定向的識別摻雜乳粉。實驗中,首先采集正常乳粉高光譜數(shù)據(jù),確定了MWSAMRHIM中正常乳粉判定閾值,并進一步使用驗證樣本驗證此方法的準(zhǔn)確性和有效性。
脫脂乳粉(25 種) 雀巢(中國)研發(fā)公司;尿素(99%,生物技術(shù)級)、三聚氰酸(98%)、硫脲(分析純,99%) 上海麥克林生化科技有限公司;滑石粉 商丘市亮峰衛(wèi)生用品有限公司;小麥粉(特級,金 龍魚) 益海嘉里食品營銷有限公司。
本實驗使用實驗室自行搭建的拉曼高光譜成像裝置,并為此裝置開發(fā)了操作軟件,將BIOS-105T-304GS型(日本Sigma Koki公司)二維位移平臺控制器與便攜式拉曼光譜儀一同控制,實現(xiàn)了拉曼光譜儀與位移平臺的聯(lián)用。此裝置所用便攜式拉曼光譜儀的激光器功率為100 mW,波長785 nm,CCD波數(shù)范圍為200~2 200 cm-1, 采集的每條拉曼光譜數(shù)據(jù)為1h 1 024波長點陣列。在實驗中,設(shè)置單點采集積分時間為600 ms,激光功率為100 mW,將高光譜采集區(qū)域設(shè)置為30 mmh 30 mm,將二維位移平臺步長設(shè)置為0.3 mm,則可以采集100h 100共10 000 個像素點的拉曼光譜數(shù)據(jù),其空間分辨率為0.3 mm(30 mm范圍內(nèi)100 個像素點)。最終可以得到每個乳粉樣品的100h 100h 1 024的拉曼高光譜三維數(shù)據(jù)立方體,其中100h 100表示在采集平面X-Y軸方向的采樣點數(shù),而1 024是每個像素點的拉曼光譜數(shù)據(jù)點數(shù)(Z軸)。
在光譜數(shù)據(jù)處理中,使用Matlab R2016a軟件進行計算。移動窗口光譜角制圖算法,根據(jù)算法原理自行編寫。
1.3.1 樣品分組
實驗設(shè)置6 組驗證樣品,用來驗證MWSAM-RH的有效性。其中,第1組為陰性樣本,第2~6組為人為配制的摻雜陽性樣本。具體分別為:第1組為雀巢中國研發(fā)公司提供的15 個按照國標(biāo)生產(chǎn)的脫脂乳粉;第2~4組分別采用尿素、三聚氰酸、硫脲摻雜樣品15 個,按照質(zhì)量分數(shù)梯度0.1%~5%混合入脫脂乳粉中;第5~6組分別采用滑石粉、小麥粉摻雜樣品15 個,按照質(zhì)量分數(shù)梯度0.1%~15%混合入脫脂乳粉中。具體摻雜樣品摻雜濃度見表1。
1.3.2 摻雜樣品制備
按照表1配制驗證樣品中的5 組陽性摻雜樣品,每個樣品20 g。具體制樣步驟:1)將摻雜化學(xué)品采用研缽進行研磨;2)研磨后過200 目的篩子,使其2 種混合體系的顆粒度盡可能一致;3)將摻雜物質(zhì)倒入乳粉中,用玻璃棒攪拌至肉眼觀察已均勻后,使用XW-80A渦流混合儀混合5 min,之后再用玻璃棒輔助移入樣品杯,以確保奶粉中摻假顆粒的均勻性。
表 1 摻雜樣品的配制Table 1 Preparation of adulterated samples at different concentrations
1.3.3 MWSAM-RHIM原理
乳粉是復(fù)雜的有機物體系,其拉曼光譜具有強烈的熒光背景[24]。摻雜的乳粉,其摻雜物位點的拉曼光譜會含有摻雜物的光譜信息,因此,摻雜乳粉的拉曼光譜相較于純?nèi)榉酃庾V存在畸變。本研究基于此現(xiàn)象,將被測物質(zhì)光譜與純脫脂乳粉光譜進行對比,計算其相似度,通過設(shè)置合理閾值,達到非定向篩查的目的。
光譜角制圖算法,最早由Kruse等[25]在1993年提出,是一種常用的計算光譜相似性的方法,在高光譜和成像領(lǐng)域應(yīng)用廣泛[26-31]。通過計算參考光譜與分析光譜的矢量夾角大小度量光譜間的相似性,夾角越小,兩光譜越相似[25]。之前常被用于定向篩查方法,通過計算被測物質(zhì)與已知某摻雜物的純物質(zhì)光譜的光譜相似性,檢測是否含有此種摻雜物[19]。而本實驗用其作為非定向篩查的手段,將被測物光譜與純?nèi)榉酃庾V進行比較。傳統(tǒng)的光譜角制圖算法如式(1)所示[28]:
式中:xr為參考光譜;X為分析光譜;DSAM(X)為求得的夾角。其值越小,代表與參考光譜的匹配越緊密,相似性越高。
傳統(tǒng)的SAM,使用整條光譜進行對比,而通常乳粉摻雜物的含量偏低,且拉曼光譜指紋特異性較好,摻雜物可能僅在幾個波數(shù)范圍內(nèi)出現(xiàn)很小的尖峰,因此用單條光譜比對,容易出現(xiàn)摻雜物信息淹沒在大部分相似的脫脂乳粉信息中的情況,從而產(chǎn)生假陽性的問題。針對此問題,本研究提出了移動窗口光譜角制圖方法,通過添加移動窗口,將整條光譜切分為很多段進行對比,從而可以提取更多細節(jié)光譜信息,提升其檢測靈敏度。
利用計算光譜相似性原理進行檢測,其閾值設(shè)置的合理性尤為重要。如果設(shè)置過于嚴格的閾值,則可能出現(xiàn)假陽性的誤判,而設(shè)置過于寬松的閾值,則會出現(xiàn)假陰性的誤判。在本方法中,利用正常奶粉數(shù)據(jù)自行比對計算,得到乳粉的光譜相似性信息。將正常乳粉比對后矢量角最大,即最不相似的值設(shè)置為閾值,大于此閾值則認作異常光譜。
將上述算法與拉曼高光譜相結(jié)合,建立MWSAMRHIM,可以利用高光譜特性,大面積獲取乳粉信息的同時,獲取到微區(qū)的精細信息,再通過移動窗口光譜角制圖算法,計算每個像素點與正常奶粉光譜的相似性,從而判斷該像素點是否摻雜,最終得知此樣品是否為摻雜樣品。MWSAM-RHIM計算了兩個向量間的余弦角[28],使用角度表示兩個向量在方向上的差異,這一特點十分適用于分析乳粉這一含有強烈熒光背景的物質(zhì)的拉曼光譜,此方法省略了有機物拉曼光譜常規(guī)的去除熒光背景的預(yù)處理步驟,大大提升了計算速度。
1.3.4 MWSAM-RHIM參數(shù)設(shè)置
在實踐中,MWSAM-RHIM首先需要設(shè)置窗口。由于本研究使用的便攜式拉曼光譜儀提供200~2 200 cm-1共1 024 個變量。使用半窗寬為100,步長為50的移動窗口,可以得到17 個窗口。其次,需要為每個窗口設(shè)置判定閾值。由于不同批次、不同品牌的脫脂乳粉具有不同的基質(zhì)特性,為保證此方法可以覆蓋絕大多數(shù)脫脂乳粉,選用10 種正常乳粉計算閾值。具體為,使用MWSAM-RHIM計算10 種正常乳粉同一窗口光譜兩兩之間的相似度。每個樣品因為含有10 000 個像素點的光譜數(shù)據(jù),所以最終得到10 000h 10 000的相似度數(shù)據(jù)。為避免個別奇異點對閾值的影響,將全部數(shù)據(jù)排序,找到前10 個最大值取平均,作為此兩種奶粉光譜的最大夾角,即最不相似值。用此方法對全部10 種乳粉進行計算,可以得到共計55 組相似度數(shù)據(jù),再選擇此55 組中的前10 個最大值的平均值,即為正常乳粉間差異的最大范圍,將此范圍作為正常脫脂乳粉的判定閾值。17 個窗口全部使用上述方法計算,最終產(chǎn)生17 個判定閾值。
1.3.5 MWSAM-RHIM檢測未知樣品
采集未知待測樣品的高光譜數(shù)據(jù),計算每個像素點的每個窗口待測樣品與正常奶粉的光譜角大小,并與先前建立的判定閾值作對比。如果有任一窗口的光譜角超出閾值,則判定該像素點為摻雜像素,標(biāo)記為1;如果在閾值范圍內(nèi),則判定該像素點為正常像素,標(biāo)記為0。待測樣品只要存在摻雜的像素點,則認為其為摻雜樣品。在此基礎(chǔ)上,結(jié)合像素點的位置和標(biāo)記,畫出包含定位信息的二值圖,得到待測樣品的摻雜二值圖像。MWSAM-RHIM的具體流程如圖1所示。
圖 1 基于移動窗口光譜角制圖的拉曼高光譜成像方法流程圖Fig. 1 Flowchart of MWSAM-RHIM
1.3.6 方法評價指標(biāo)
作為一種定性方法,采用識別率作為此方法的評價指標(biāo)[3,32]。計算公式為:
式中:TP為陽性樣本被正確識別為陽性的數(shù)量;TN為陰性樣本被正確識別為陰性的數(shù)量;FN為陽性樣本被錯誤識別為陰性樣本的數(shù)量;FP為陰性樣本被錯誤識別為陽性樣本的數(shù)量。TP+FN即為全部陽性樣本的數(shù)量,而TN+FP為全部陰性樣品的數(shù)量。
使用1.3.2節(jié)方法計算得到的17 個窗口的閾值分別為:0.192、0.152、0.112、0.127、0.164、0.187、0.183、0.130、0.158、0.181、0.190、0.195、0.155、0.137、0.135、0.158、0.172。
圖 2 MWSAM-RHIM的摻雜脫脂乳粉二值成像圖Fig. 2 MWSAM-RHIM binary images of adulterated skim milk samples
在計算出閾值之后,將未知樣品與正常乳粉進行對比,將超出閾值的像素點設(shè)置為1,沒有超出的設(shè)置為0。在一共17 個窗口中,只要有其中某一窗口有超出閾值的像素點,則認為此為摻雜像素點。使用此方法畫出可視化的摻雜二值成像圖(空間分辨率0.3 mm),如圖2和圖3所示。圖2表示了此方法可以在0.1%摻雜的條件下,檢測出尿素、三聚氰酸、硫脲和滑石粉的摻雜情況,并可視化的標(biāo)注出摻雜像素點的位置。圖3則以滑石粉為例,顯示了隨著摻雜質(zhì)量分數(shù)的升高,摻雜像素點數(shù)量也同時升高,在摻雜15%時,所有像素點都含有摻雜物質(zhì)信號。
圖 3 摻雜不同質(zhì)量分數(shù)滑石粉的脫脂乳粉MWSAM-RHIM二值成像圖Fig. 3 MWSAM-RHIM binary images of talcum powder adulterated skim milk powders
表 2 基于MWSAM-RHIM非定向篩查模型識別率預(yù)測結(jié)果評價Table 2 Classification rates of MWSAM-RHIM predicted results
本實驗使用含有15 個正常脫脂乳粉(陰性樣本)和含有共計75 個摻雜樣品(陽性樣本)計算此方法的識別率,從而驗證此方法的有效性,并將結(jié)果見表2。結(jié)果表明,MWSAM-RHIM其陰性和陽性樣本識別率(特異性)均達到了93.3%,證明其非定向篩查的準(zhǔn)確識別率可滿足實際乳粉工業(yè)檢測需求。另外,5 組摻雜不同質(zhì)量分數(shù)梯度的摻雜物的樣品被用來驗證此方法的最低可檢出質(zhì)量分數(shù),結(jié)果如表3所示。結(jié)果證明,其針對尿素、三聚氰酸、硫脲和滑石粉的最低可檢出質(zhì)量分數(shù)為0.1%,完全可以滿足乳粉質(zhì)量安全真實性鑒別的需求;但其對小麥粉的最低可檢出質(zhì)量分數(shù)僅達到3%,其原因是純小麥粉的拉曼光譜,其熒光信號很強,且不具有特征峰。證明此方法對某些不具備特征峰的摻雜物,在其低質(zhì)量分數(shù)下,存在靈敏度不足的問題,應(yīng)在以后針對此問題繼續(xù)發(fā)展新型的非定向篩查方法。
表 3 基于MWSAM-RHIM非定向篩查最低可檢出 質(zhì)量分數(shù)模型預(yù)測結(jié)果評價Table 3 MWSAM-RHIM predicted results of lowest detectable concentrations
本研究提出了一種基于移動窗口光譜角制圖的拉曼高光譜成像方法,該方法借助拉曼高光譜成像技術(shù),將乳粉中未知摻雜物的識別問題轉(zhuǎn)化為拉曼高光譜奇異像素點的識別問題;借助移動窗口光譜角制圖算法,找出與正常脫脂乳粉相似度差距大于閾值的像素點,有效的彌補了傳統(tǒng)的定向篩查方法中無法遍歷所有摻雜物的問題。實驗結(jié)果表明,MWSAM-RHIM能較準(zhǔn)確地識別乳粉的陰性樣品和陽性樣本,以可視化的方式實現(xiàn)乳粉真?zhèn)蔚姆嵌ㄏ蚝Y查,并為其他食品體系的非定向篩查提供了一種新思路。