卜文華,孫學(xué)景
(山東省東營市墾利區(qū)市場監(jiān)督管理局,山東 東營 257500)
食品鑒別和檢測是確保食品安全的重要環(huán)節(jié),也是促進(jìn)食品行業(yè)發(fā)展的重要途徑。近年來,隨著人們對食品安全的重視,快速準(zhǔn)確的食品鑒別和檢測技術(shù)越發(fā)受歡迎,也取得了突破性的進(jìn)展。在食品真實(shí)性鑒別方面,王冰峰等[1]基于液相色譜串聯(lián)高分辨質(zhì)譜的組學(xué)分析技術(shù),針對冒充、稀釋、非法添加和非標(biāo)注成分這4類摻假行為進(jìn)行了研究,實(shí)現(xiàn)了隱蔽摻假食品的真?zhèn)舞b別。陳愛亮[2]基于物種特異性單一脫氧核糖核酸(DNA)標(biāo)記擴(kuò)增檢測的食品真實(shí)性定性鑒別技術(shù),對食品真實(shí)性進(jìn)行了鑒別,為食品真實(shí)性定性鑒別提供了一種新思路。在食品成分鑒別方面,張媛媛等[3]通過對豬、牛、羊、雞、鴨對5種動物的總DNA模板進(jìn)行PCR擴(kuò)增,對食品成分進(jìn)行了鑒別。結(jié)果表明,該方法具有操作簡單、成本低且準(zhǔn)確率高的特點(diǎn),可用于肉類罐頭食品和長時間高溫加工食品中動物源成分的鑒別。在食品添加劑方面,吳婉琴等[4]建立了高效液相色譜-四極桿-飛行時間質(zhì)譜快速篩查鑒別食品中非法添加的62種中藥材的方法,實(shí)現(xiàn)無標(biāo)準(zhǔn)品情況下中藥材的定性篩查,解決了食品中非法添加中藥材難以識別和確證的難題。通過上述研究可以發(fā)現(xiàn),食品的鑒別與檢測在技術(shù)上取得了突破性進(jìn)展,但綜合分析以上研究成果來看,目前的研究對同品種不同種類食品的鑒別和檢測相對較少。因此,為實(shí)現(xiàn)對同品種不同種類食品的鑒別和檢測,本研究以不同種類的大米為研究對象,提出一種基于圖譜特征和多元分析方法的食品鑒別與檢測方法。
PCANet模型是一種結(jié)構(gòu)簡單的輕量型深度學(xué)習(xí)網(wǎng)絡(luò)模型,常用于不同場景下的小體積數(shù)據(jù)分類預(yù)測。其基本結(jié)構(gòu)如圖1所示,主要包括三層結(jié)構(gòu)。其中,第一層結(jié)構(gòu)和第二層結(jié)構(gòu)相似,負(fù)責(zé)去平均并通過PCA提取主成分進(jìn)行卷積;第三層結(jié)構(gòu)是輸出層,負(fù)責(zé)非線性輸出和直方圖量化[5]。
圖1 PCANet模型結(jié)構(gòu)
(1)
最后將輸出的特征向量通過分類器即可實(shí)現(xiàn)分類。本研究選用支持向量機(jī)作為最終分類器,用于食品種類鑒別。
PLSR模型是一種集多元線性回歸、主成分分析和相關(guān)分析為一體的多元數(shù)據(jù)分析方法,可有效解決自變量因子間的多重共線性影響問題[7]。
由于食品水分含量對食品種類鑒別具有一定的重要意義,因此為探究食品中的水分,研究采用PLSR模型進(jìn)行檢測。
2.1.1圖像特征提取
根據(jù)大米的特點(diǎn),研究選用其形態(tài)和紋理作為圖像特征來進(jìn)行提取。針對大米的形態(tài)特征提取,首先進(jìn)行閾值化處理以獲取二值圖像,然后截取大米的矩陣區(qū)域,得到僅含大米的二值圖像,最后根據(jù)二值圖像中大米的輪廓跟蹤其外邊界后,再來進(jìn)行8聯(lián)通處理與標(biāo)注。如此,即可獲取大米的形態(tài)特征。
針對大米的紋理特征提取,研究首先選用灰度梯度共生矩陣(GLGCM)算法提取其灰度熵和梯度熵,如式(2)和(3)[8],然后通過離散小波變換(DWT)算法提取其熵和能量,如式(4)和(5)[9],最后采用五階高斯馬爾科夫隨機(jī)場模型法(GMRF)提取其12維特征向量進(jìn)行實(shí)現(xiàn),如式(6)[10]。
(2)
(3)
(4)
(5)
θ=(θ1,θ2,…,θ12)T
(6)
2.1.2光譜特征提取
針對大米光譜特征提取時基于圖像分割的感興趣區(qū)域提取。首先,將采集的高光譜圖像進(jìn)行閾值化處理獲取二值圖像,然后截取大米矩陣區(qū)域提取其感興趣區(qū)域,并將二值圖像與高光譜圖像進(jìn)行“與”操作,最后對感興趣區(qū)域的像素光譜進(jìn)行平均計(jì)算,獲取的平均光譜即為提取的光譜特征[10]。
形態(tài)和紋理圖像特征和光譜特征提取的流程可概括為圖2。
圖2 圖譜特征提取流程
基于上述提取的圖像特征和光譜特征,采用PCANet模型對大米種類進(jìn)行分類,采用PLSR模型對大米水分含量進(jìn)行檢測,即可實(shí)現(xiàn)大米種類的鑒別與水分含量檢測,具體操作流程如下:
(1)高光譜圖像和反射光譜采集與預(yù)處理。利用高光譜成像儀采集大米高光譜圖像,利用PSR-3500便攜式地物光譜儀采集大米反射光譜。考慮到光譜中含有一定噪聲,需要對其進(jìn)行去噪預(yù)處理;
(2)圖譜特征提取。根據(jù)上述圖像和光譜特征提取方法對大米的形態(tài)和紋理圖像特征進(jìn)行提取,以及光譜特征進(jìn)行提取;
(3)特征降維。由于提取的圖譜特征維度較高,增加了大米種類鑒別與水分含量檢測的復(fù)雜度,因此采用主成分分析法(PCA)對提取的特征進(jìn)行降維。PCA降維的處理方法如式(7)[11]:
(7)
(4)大米種類鑒別與水分含量檢測。采用PCA-Net模型對大米種類進(jìn)行分類,采用PLSR模型對大米水分含量進(jìn)行檢測。
本次實(shí)驗(yàn)在Windows10操作系統(tǒng)上進(jìn)行,通過scikit-learn框架和Python語言實(shí)現(xiàn)PCA與分類模型的構(gòu)建,采用MATLAB R2018b實(shí)現(xiàn)回歸模型和數(shù)據(jù)分析及光譜處理。系統(tǒng)配置Intel(R)Xeon(R)Gold6152 CPU,NVIDIA Tesla P40顯卡,24 GB顯存,256 GB內(nèi)存。
本次實(shí)驗(yàn)選用我國的4種優(yōu)質(zhì)大米作為所提食品鑒別和檢測方法的研究對象,具體包括哈爾濱五常大米、伊犁大米、寧夏珍珠米、增城絲苗米。
為避免隨機(jī)誤差對結(jié)果的影響,實(shí)驗(yàn)購買了每種大米3種不同批次,并隨機(jī)從每個批次中選取150粒大米,即每種大米共450個樣本。最終,實(shí)驗(yàn)共獲取1 800個大米樣本。
考慮到原始樣本的光譜特征數(shù)據(jù)中含有一定噪聲,會對最終結(jié)果造成影響。因此,在實(shí)驗(yàn)前,研究對原始樣本光譜特征數(shù)據(jù)進(jìn)行去噪處理。首先,采用MSC算法計(jì)算所有光譜特征的平均光譜,并采用平均光譜作為最優(yōu)光譜,以減少散射噪聲對有效光譜信息的干擾。然后采用S-G smoothing算法增加光譜的平滑性,減少噪聲干擾[12-13]。
圖3為大米原始光譜通過MSC算法和S-G smoothing算法進(jìn)行預(yù)處理后的光譜對比。圖3中,(a)圖為原始光譜,(b)圖為通過S-G smoothing算法處理后的光譜。
圖3 大米光譜預(yù)處理前后對比
由圖3可知,通過MSC算法和S-G smoothing算法進(jìn)行預(yù)處理后的大米光譜更加平滑,噪聲更少。由此說明,所采用的噪聲預(yù)處理方法有效。
此外,考慮到不同數(shù)據(jù)量綱不同,研究采用min-max歸一化方法對數(shù)據(jù)進(jìn)行了處理,具體操作如下[14]:
(8)
式中,x為光譜特征值,xmin和xmax為樣本光譜特征的最小值和最大值。
最后,將預(yù)處理后的數(shù)據(jù)按4∶1比例劃分為訓(xùn)練集和測試集,用于分類模型的訓(xùn)練和測試。其中,訓(xùn)練集共1 440個樣本,測試集共360個樣本。
本次實(shí)驗(yàn)選用正確分類率(CCR)、決定系數(shù)(R2)、均方根誤差(RMSE)評估所提分類模型的性能。其計(jì)算方法如下[15]:
(9)
(10)
(11)
3.4.1光譜反射率分析
4種大米測試樣本的反射率光譜曲線見圖4。
圖4 不同種類大米的反射率光譜
由圖4可知,不同種類的大米光譜大體趨勢相同,但光譜反射率存在明顯差異。在0~683 nm范圍內(nèi),所有種類的大米光譜反射率較低,且基本保持平穩(wěn);在683~782 nm范圍內(nèi),所有種類的大米光譜反射率快速上升;在782~960 nm范圍內(nèi),所有種類的大米光譜反射率出現(xiàn)波動。其中,寧夏珍珠米和伊犁大米的光譜反射率主要在400~720 nm范圍內(nèi)較高,其原因是該兩種大米相較于其他種類大米,米粒的透明度更高;五常大米、伊犁大米和增城絲苗米在720~960 nm范圍內(nèi)的反射率較低,分析其原因是,相較于其他種類大米,其含水量較少。
3.4.2光譜特征鑒別大米種類
為探究光譜特征對大米種類的鑒別結(jié)果影響,實(shí)驗(yàn)采用PCANet模型對預(yù)處理后的光譜進(jìn)行鑒別,得到結(jié)果如圖5所示。
圖5 光譜特征鑒別大米種類的正確分類率
由圖5可知,利用光譜特征鑒別測試集中大米種類的正確分類率達(dá)到97%以上,說明光譜特征對大米種類鑒別具有一定的有效性。
3.4.3大米形態(tài)和紋理圖像特征的分析
為探究大米形態(tài)和紋理特征對大米種類鑒別的影響,實(shí)驗(yàn)結(jié)合大米的形態(tài)以及大米的紋理特征和反射光譜圖進(jìn)行分析。其中,大米的形態(tài)選用外觀、面積、長軸比、離心率和周長5個參數(shù)進(jìn)行分析。這5個參數(shù)的均值和標(biāo)準(zhǔn)差見表1。
表1 不同大米種類形態(tài)參數(shù)的平均值和標(biāo)準(zhǔn)差(像素)
由表1可知,不同種類的大米形態(tài)參數(shù)均值和標(biāo)準(zhǔn)差不同,但存在某些大米種類的參數(shù)均值相近,可能對大米種類鑒別造成一定影響,導(dǎo)致大米種類鑒別結(jié)果存在一定誤差。
大米的紋理特征是基于446.94 nm波長的單色圖進(jìn)行提取,首先通過GLGCM算法提取其灰度熵和梯度熵,然后通過DWT算法提取其熵和能量,通過GMRF提取其θ2、θ3,最后計(jì)算這些紋理特征的標(biāo)準(zhǔn)差和均值,結(jié)果見圖6。由圖6可知,不同大米的紋理特征標(biāo)準(zhǔn)差和均值不同,但部分大米種類的紋理特征均值差異較小,會對大米最終鑒別結(jié)果造成一定影響。
圖6 不同大米種類紋理特征參數(shù)的標(biāo)準(zhǔn)差和均值
綜合上述結(jié)果可知,不同種類的大米形態(tài)和紋理特征參數(shù)差異較小,若僅采用其中一種方法鑒別大米種類難以實(shí)現(xiàn)精確的大米種類鑒別,但以其作為輔助信息,可在一定程度上提高大米種類鑒別的精度。
3.4.4多特征融合鑒別大米種類
為探究大米光譜+形態(tài)+紋理多特征融合對大米種類鑒別的性能,研究采用PCANet分類模型分別對多特征融合的大米種類以及基于形態(tài)、紋理單特征和基于光譜+形態(tài)、光譜+紋理、紋理+形態(tài)雙特征的大米種類進(jìn)行鑒別,結(jié)果見表2。
表2 不同特征的鑒別結(jié)果對比
由表2可知,相較于基于形態(tài)和紋理單特征和基于光譜+形態(tài)、光譜+紋理、紋理+形態(tài)雙特征的正確分類率,基于光譜+形態(tài)+紋理多特征融合的正確分類率最高,訓(xùn)練集正確分類率CCRP和測試集正確分類率CCRT分別達(dá)到98.88%和98.69%,具有明顯的優(yōu)勢。由此說明,基于光譜+形態(tài)+紋理多特征融合的鑒別方法更能有效準(zhǔn)確地鑒別大米種類。
3.4.5高光譜成像對大米水分的鑒定
為探究高光譜成像對大米水分鑒定的影響,研究采用PLSR模型結(jié)合高光譜成像鑒定大米水分,結(jié)果見圖7。
圖7 大米水分鑒定結(jié)果
由圖7可知,利用PLSR模型對大米高光譜成像進(jìn)行水分鑒定可取得良好的結(jié)果,校正集和預(yù)測集上的決定系數(shù)分別為0.75和0.74,校正集和預(yù)測集上的均方根誤差分別為0.54和0.60。
為展現(xiàn)大米水分含量,研究利用可視化技術(shù)對上述鑒定結(jié)果進(jìn)行了可視化。圖8為其中20粒大米的水分含量情況示例。圖中顏色越紅表示水分含量越高,越紫表示水分含量越低。由圖8可知,不同種類的大米水分含量不同,利用可視化技術(shù)展現(xiàn)PLSR模型結(jié)合高光譜成像,可直觀地看出不同種類大米的水分分布情況。
圖8 大米水分含量可視化結(jié)果示例
綜上所述,所提的基于圖譜特征和多元分析方法的食品鑒別和檢測方法,通過融合大米光譜特征和形態(tài)與紋理圖像特征,并利用PCANet模型進(jìn)行分類預(yù)測,實(shí)現(xiàn)了對不同種類大米的鑒別,且具有較高的正確分類率,在訓(xùn)練集和測試集上的正確分類率分別達(dá)到98.88%和98.69%;通過利用PLSR模型對大米高光譜成像進(jìn)行水分含量檢測,可較為準(zhǔn)確地測定大米中的水分,校正集和預(yù)測集上的決定系數(shù)分別為0.75和0.74,均方根誤差分別為0.54和0.60,可用于其他食品的鑒別與檢測。但由于條件限制,本研究仍存在一些不足有待改進(jìn)。在大米水分含量檢測中,由于實(shí)驗(yàn)選用的是市場上購買的大米,可能存在放置時間長,導(dǎo)致水分含量低的問題,可能影響水分含量的測定。因此,為避免該因素對結(jié)果的影響,后續(xù)研究將通過人為方式設(shè)置不同水分含量樣本。