殷 勇 戴松松 于慧春
(河南科技大學(xué)食品與生物工程學(xué)院,河南 洛陽(yáng) 471023)
玉米(Zea mays Linn.)是我國(guó)重要的農(nóng)作物之一,其營(yíng)養(yǎng)價(jià)值豐富,可作為主食、飼料、工業(yè)加工重要原料,是養(yǎng)殖業(yè)的重要能量來(lái)源,但玉米在運(yùn)輸和貯藏過(guò)程中極易發(fā)生霉變,霉變后會(huì)產(chǎn)生分布廣泛、致癌力較強(qiáng)的黃曲霉毒素B1,如果對(duì)黃曲霉毒素B1處理不當(dāng),則極易引起人、畜、禽中毒。 因此,及時(shí)檢出霉變玉米及霉變等級(jí)尤為重要[1]。
黃曲霉毒素B1的檢測(cè)方法主要包括感官評(píng)定[2]、高效液相色譜法(high performance liquid chromatography, HPLC)[3]、 聚 合 酶 鏈 式 反 應(yīng)(polymerase chain reaction,PCR)[4]、氣質(zhì)聯(lián)用法(gas chromatography mass spectrometer,GC-MS)[5]及DNA 探針?lè)╗6]、酶聯(lián)免疫(enzyme-linked immuno sorbent assay,ELISA)法[7-8]等,但上述方法存在主觀性強(qiáng)、結(jié)果可靠性差,或破壞物料、操作復(fù)雜等缺點(diǎn)。 而高光譜技術(shù)具有高效、無(wú)損、低成本和可重復(fù)等優(yōu)勢(shì)[9],已被廣泛應(yīng)用于肉類[10-12]、杏仁[13]、水果[14-18]、雞蛋[19]、茶葉[20]、谷類[21]和油料作物[22-23]等農(nóng)副產(chǎn)品檢測(cè),并取得了較好的分析結(jié)果。 近年來(lái),高光譜技術(shù)在玉米霉變檢測(cè)中也有報(bào)道,褚璇等[24]對(duì)獲取400 ~1 000 nm 波段范圍內(nèi)的霉變玉米高光譜圖像,引入基于Fisher 判別最小誤判率的方法選擇最優(yōu)波長(zhǎng),并以所選最優(yōu)波長(zhǎng)作為判別模型的輸入,其驗(yàn)證集的判別正確率為80. 9%。 袁瑩等[25]利用高光譜技術(shù)對(duì)霉變玉米進(jìn)行上述檢測(cè),采用支持向量機(jī)分類模型得出的訓(xùn)練集和預(yù)測(cè)集的預(yù)測(cè)準(zhǔn)確率分別為93. 3% 和91. 7%。 研究表明,高光譜有能力對(duì)霉變玉米進(jìn)行鑒別,但對(duì)霉變玉米的檢測(cè)正確率不高,且多是定性鑒別,缺乏定量分析。 因此,本研究擬利用高光譜技術(shù)對(duì)霉變玉米中黃曲霉毒素B1進(jìn)行定量預(yù)測(cè)分析,以期為霉變玉米中黃曲霉毒素B1定量檢測(cè)提供一種新手段,為實(shí)現(xiàn)霉變玉米中黃曲霉毒素B1的高光譜無(wú)損檢測(cè)奠定基礎(chǔ)。
玉米品種為中單909,購(gòu)自洛陽(yáng)市中原農(nóng)貿(mào)城。將新鮮玉米放入相對(duì)濕度為90%、溫度為30℃的LHS-HC-100 恒溫恒濕培養(yǎng)箱(上海資一儀器設(shè)備有限公司)中培育。 采用不同培育天數(shù)的玉米來(lái)表征不同的霉變程度。 試驗(yàn)選用培育第0、第2、第4、第6、第8 天來(lái)標(biāo)記5 個(gè)等級(jí)的霉變玉米。 每個(gè)等級(jí)的樣品各取50 個(gè)樣本(35 個(gè)訓(xùn)練集,15 個(gè)測(cè)試集),每個(gè)樣本量為60±0.5 g。
高光譜圖像采集系統(tǒng)由IST50—3810 成像光譜儀(德 國(guó)Inno-spec 公 司)、 計(jì) 算 機(jī)、4 個(gè)500 W 的RK90000420108 光纖鹵素?zé)?德國(guó)ESYLUX 公司)和傳送裝置等組成。 可采集到的反射光譜范圍為371.05~1 023.82 nm,光譜分辨率為2.8 nm,共得到1 288 個(gè)不同的波段。 高光譜掃描設(shè)定范圍為Width 760、Heigh 550,得到的高光譜圖像分辨率為760×550。因此,最終得到的每個(gè)樣本大小為760×550×1 288 的高光譜圖像。
采集樣本高光譜數(shù)據(jù)時(shí),將樣本均勻地平鋪在規(guī)格為8 cm×8 cm 的正方體盒子中,然后將盛有樣品的盒子放在搭建的傳送帶上,由SICap-STVR V1.0.x 軟件平臺(tái)驅(qū)動(dòng)控制成像儀,并記錄和存儲(chǔ)高光譜數(shù)據(jù)。采集樣本在371.05~1 023.82 nm 的反射光譜,然后對(duì)采集的高光譜圖像信息進(jìn)行黑白校正,校正方法詳見文獻(xiàn)[26]。 針對(duì)所采集的高光譜圖像,用ENVI 4.8提取每個(gè)樣本的所有像素點(diǎn)在各波長(zhǎng)下的平均反射值,以此得到250 個(gè)樣本的平均反射光譜數(shù)據(jù),最后通過(guò)Matlab 2014a 軟件對(duì)光譜數(shù)據(jù)進(jìn)行處理。
為降低儀器噪音和暗電流等的干擾,本試驗(yàn)采用多元散射校正法(multiplicative scatter correction,MSC)對(duì)黑白校正后的高光譜數(shù)據(jù)進(jìn)行預(yù)處理。 MSC 可以增強(qiáng)與成分含量相關(guān)的光譜吸收信息,消除光譜數(shù)據(jù)中散射帶來(lái)的影響。 但采用該方法的前提是要先建立一個(gè)樣品的“理想光譜”,即樣品中待測(cè)成分的含量與光譜變化滿足直接線性關(guān)系,以該光譜為標(biāo)準(zhǔn)對(duì)其他樣品光譜通過(guò)基線平移和偏移校正進(jìn)行修正。 首先計(jì)算樣品高光譜的平均值,然后以平均值作為標(biāo)準(zhǔn)光譜,將樣品光譜于標(biāo)準(zhǔn)光譜進(jìn)行一元線性回歸運(yùn)算,最后進(jìn)行多元散射校正[27],相關(guān)計(jì)算公式如下:
平均光譜:
一元線性回歸:
多元散射校正:
式中,A 表示光譜數(shù)據(jù)矩陣;n 為樣品數(shù);A-表示所有樣品的原始高光譜在各個(gè)波長(zhǎng)點(diǎn)處求平均值所得到的平均光譜矢量;mi和bi分別表示各樣品高光譜Ai與平均光譜A-進(jìn)行一元線性回歸后得到的相對(duì)偏移系數(shù)和平移量。
參照GB 5009.22-2016[28]的測(cè)定方法對(duì)不同霉變等級(jí)玉米中的黃曲霉毒素B1進(jìn)行測(cè)定。
采集到的高光譜信息是高達(dá)1 288 個(gè)波段的數(shù)據(jù),加上光譜數(shù)據(jù)中相鄰光譜值存在極高的相關(guān)性,故含有大量的冗余信息,使得特征吸收峰不明顯,因此,特征波長(zhǎng)的提取對(duì)減少計(jì)算量、提高檢測(cè)精度至關(guān)重要。 本試驗(yàn)擬通過(guò)偏最小二乘回歸(partial least squares regression,PLSR)法對(duì)1 288 個(gè)波段上樣本的平均光譜反射值進(jìn)行回歸分析,借助于回歸系數(shù)的大小來(lái)提取特征波長(zhǎng)。
基于偏最小二乘回歸系數(shù)來(lái)選擇特征波長(zhǎng)的基本方法:通過(guò)PLSR 系數(shù)構(gòu)建黃曲霉毒素B1對(duì)各波長(zhǎng)光譜反射值的回歸模型,回歸表達(dá)式中每個(gè)波段的回歸系數(shù)表征了各波段的貢獻(xiàn)比重,系數(shù)絕對(duì)值越大,對(duì)回歸模型的影響越大。 因此,通過(guò)比較回歸系數(shù)可選出光譜的特征波長(zhǎng)。
霉變等級(jí)判別分析是不同霉變等級(jí)黃曲霉毒素B1定量檢測(cè)的前提。 首先采用Fisher 判別分析(fisher discriminant analysis,FDA)全波長(zhǎng)和特征波長(zhǎng)下不同等級(jí)霉變玉米的有效性,然后采用農(nóng)產(chǎn)品食品智能無(wú)損檢測(cè)實(shí)驗(yàn)室自行編寫的FDA 分析程序,以全波長(zhǎng)和特征波長(zhǎng)為變量進(jìn)行5 組訓(xùn)練集及其對(duì)應(yīng)的測(cè)試集的FDA 分析,比較全波長(zhǎng)和特征波長(zhǎng)下的FDA判別結(jié)果。
本研究以偏最小二乘回歸和BP 神經(jīng)網(wǎng)絡(luò)來(lái)建立全波長(zhǎng)和特征波長(zhǎng)下的預(yù)測(cè)模型,并比較模型的預(yù)測(cè)精度。
1.8.1 偏最小二乘回歸 PLSR 分析在建模過(guò)程中集中了主成分分析、典型相關(guān)分析和線性回歸分析的特點(diǎn),預(yù)測(cè)能力強(qiáng)且模型簡(jiǎn)單[29]。 PLSR 模型性能評(píng)價(jià)指標(biāo)采用訓(xùn)練集相關(guān)系數(shù)(Rc)、測(cè)試集相關(guān)系數(shù)(Rp)、訓(xùn)練集均方根誤差(RMSEC)、測(cè)試集均方根誤差(RMSEP) 來(lái)綜合評(píng)定。 Rc、Rp 越高,RMSEC、RMSEP 越小,則模型預(yù)測(cè)性能越好。
1.8.2 BP 神經(jīng)網(wǎng)絡(luò) 在BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的構(gòu)造中,采用輸入層、中間層(隱層)和輸出層3 層網(wǎng)絡(luò)結(jié)構(gòu),全波長(zhǎng)下輸入層神經(jīng)元個(gè)數(shù)為1 288 個(gè)(代表1 288 個(gè)波長(zhǎng)下的光譜值),特征波長(zhǎng)下輸入層神經(jīng)元個(gè)數(shù)為7 個(gè)(代表7 個(gè)波長(zhǎng)下的光譜值),輸出層神經(jīng)元個(gè)數(shù)都為1(代表黃曲霉毒素B1)。 tansig 函數(shù)為隱層神經(jīng)元傳遞函數(shù)、traincgf 函數(shù)為訓(xùn)練函數(shù)、logsig 函數(shù)為輸出層神經(jīng)元傳遞函數(shù)時(shí),用訓(xùn)練集數(shù)據(jù)來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò),并用試湊法來(lái)確定隱層神經(jīng)元個(gè)數(shù)(6)。 此時(shí)的網(wǎng)絡(luò)訓(xùn)練誤差為0.000 47,訓(xùn)練步數(shù)為100,學(xué)習(xí)速率為0.1。 BP 神經(jīng)網(wǎng)絡(luò)的具體用法參見文獻(xiàn)[30]。
以隨機(jī)抽取每個(gè)等級(jí)中的5 個(gè)平行樣本的平均值作為該等級(jí)的測(cè)試結(jié)果(表1)。 本結(jié)果由河南省商丘市質(zhì)量技術(shù)監(jiān)督檢驗(yàn)測(cè)試中心測(cè)試并提供。
表1 霉變玉米中黃曲霉毒素B1 含量Table 1 The test results of aflatoxin B1 corresponding to different moldy grades of maize
由圖1 可知,原始光譜曲線存在較為嚴(yán)重的基線漂移現(xiàn)象,經(jīng)MSC 預(yù)處理后的光譜曲線(圖2)的基線漂移現(xiàn)象被消除了。 由獲取的光譜曲線可知,不同等級(jí)霉變玉米的光譜曲線總體變化規(guī)律具有相似性:在410 ~490 nm 波段,平均光譜反射值逐漸降低;不同霉變等級(jí)的玉米光譜反射值在490 nm附近出現(xiàn)吸收波谷,這是由玉米中黃曲霉毒素B1的吸收作用引起的;在490 ~800 nm 波段平均光譜值逐漸增加,在820 nm 附近出現(xiàn)了最大的光譜反射值,之后逐漸平穩(wěn)。
由圖3 可知,經(jīng)PLSR 分析選出了7 個(gè)特征波長(zhǎng),這些特征波長(zhǎng)較好地體現(xiàn)了原光譜中大部分黃曲霉毒素B1信息。 其中,544.6、623.5、757.1、921.6 nm 4 個(gè)特征波長(zhǎng)的平均光譜反射值與霉變玉米中黃曲霉毒素B1含量呈正相關(guān);584.1、697.1、841.7 nm 處的光譜反射值與霉變玉米中黃曲霉毒素B1的含量呈負(fù)相關(guān)。
圖1 原始光譜曲線Fig.1 The original spectrum curve
由圖4 可知,全波長(zhǎng)下的不同程度霉變玉米大部分能夠區(qū)分開來(lái),但第2、第4 天和第6、第8 天仍有小部分重疊,FDA 測(cè)試結(jié)果比較分散。 特征波長(zhǎng)下的不同程度霉變玉米基本上能夠較好的區(qū)分開來(lái),且分布較聚集(圖5)。 由表2 可知,全波長(zhǎng)下的FDA 鑒別正確率在85%~88%之間,特征波長(zhǎng)下的FDA 鑒別正確率均在98%以上。 因此,在鑒別分析中運(yùn)用特征波長(zhǎng)能較好地判別不同霉變等級(jí)的玉米樣本。
圖2 經(jīng)MSC 預(yù)處理后的光譜曲線Fig.2 The spectrum curves after MSC pretreatment
圖3 黃曲霉毒素B1 模型權(quán)重系數(shù)圖Fig.3 The weight coefficient curves of aflatoxin B1 PLSR model
圖4 基于全波長(zhǎng)下的FDA 結(jié)果Fig.4 FDA results based on the full wavelengths
圖5 基于特征波長(zhǎng)下的FDA 結(jié)果Fig.5 FDA results based on the characteristic wavelengths
表2 全波長(zhǎng)和特征波長(zhǎng)下對(duì)應(yīng)測(cè)試集的FDA 鑒別正確率Table 2 FDA accuracy of test set based on the full wavelength and the Characteristic wavelength /%
圖6 全波長(zhǎng)和特征波長(zhǎng)下對(duì)應(yīng)測(cè)試集的PLSR 預(yù)測(cè)結(jié)果Fig.6 PLSR prediction results of test set based on the full wavelength and characteristic wavelengths
2.5.1 偏最小二乘回歸模型的分析 不同霉變等級(jí)玉米能得到有效鑒別是構(gòu)建黃曲霉毒素B1定量預(yù)測(cè)模型的基礎(chǔ)。 由圖6 可知,基于特征波長(zhǎng)下預(yù)測(cè)模型的Rp(0.9570)略低于全波長(zhǎng)下的Rp(0.991 1),但RMSEP ( 2.779 2) 略高于全波長(zhǎng)的 RMSEP(1.261 2)。特征波長(zhǎng)下的預(yù)測(cè)模型性能參數(shù)劣于全波長(zhǎng)的預(yù)測(cè)模型,但兩者精度相差不大,且特征波長(zhǎng)預(yù)測(cè)模型的變量降到7 個(gè),遠(yuǎn)低于全波長(zhǎng)的1 288 個(gè)變量,說(shuō)明特征波長(zhǎng)的提取及所構(gòu)建的預(yù)測(cè)模型是有效的。
2.5.2 BP 神經(jīng)網(wǎng)絡(luò)模型的分析 由表3 可知,在75個(gè)測(cè)試集中,全波長(zhǎng)下預(yù)測(cè)相關(guān)系數(shù)Rp=0.994 4,RMSEP=0.339 1;特征波長(zhǎng)下預(yù)測(cè)模型的相關(guān)系數(shù)Rp=0.999 9,RMSEP=0.180 9,說(shuō)明特征波長(zhǎng)下的預(yù)測(cè)效果優(yōu)于全波長(zhǎng),特征波長(zhǎng)光譜信息能代表全波長(zhǎng)信息。
2.5.3 PLSR 與BP 神經(jīng)網(wǎng)絡(luò)模型的比較分析 由表4 可知,在2 種預(yù)測(cè)模型中,預(yù)測(cè)準(zhǔn)確度均在95%以上。 在全波長(zhǎng)下,BP 神經(jīng)網(wǎng)絡(luò)模型和PLSR 模型的預(yù)測(cè)相關(guān)系數(shù)相近,均在99%以上,但BP 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)集的均方根誤差RMSEP=0.339 1,小于PLSR 模型預(yù)測(cè)集的均方根誤差RMSEP=1.261 2,其預(yù)測(cè)精度高于PLSR 模型。 在特征波長(zhǎng)下,BP 神經(jīng)網(wǎng)絡(luò)模型的Rp=0.999 9,高于PLSR 模型的Rp=0.957 0,且其均方根誤差RMSEP = 0.180 9 遠(yuǎn)低于PLSR 模型的RMSEP=2.779 2,說(shuō)明BP 神經(jīng)網(wǎng)絡(luò)模型在特征波長(zhǎng)下的預(yù)測(cè)效果優(yōu)于PLSR 模型。 而全波長(zhǎng)下,BP 神經(jīng)網(wǎng)絡(luò)模型中的模型預(yù)測(cè)相關(guān)系數(shù)Rp=0.994 4,略低于特征波長(zhǎng)下的Rp = 0.999 9, 預(yù)測(cè)精度RMSEP(0.339 1)高于特征波長(zhǎng)下的RMSEP(0.180 9),這與玉米霉變等級(jí)鑒別分析中,特征波長(zhǎng)下的FDA 鑒別正確率在98%以上相吻合。 綜上,特征波長(zhǎng)下的BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型具有較高的穩(wěn)定性與可靠性。
玉米中毒素的產(chǎn)生主要是由于其自身帶有孢子和芽孢,芽孢是細(xì)菌的休眠體,孢子由霉菌產(chǎn)生,它們?cè)谶m宜的生長(zhǎng)環(huán)境下可使玉米產(chǎn)生霉變[2],而有關(guān)玉米霉變的分析,前人主要是通過(guò)理化試驗(yàn)對(duì)其進(jìn)行鑒定。本研究對(duì)霉變玉米進(jìn)行了黃曲霉毒素B1含量的高光譜預(yù)測(cè),達(dá)到了無(wú)損快速檢測(cè)霉變玉米中黃曲霉毒素B1的目的,為實(shí)現(xiàn)玉米霉變的在線、快速、精確檢測(cè)提供了借鑒。
表3 測(cè)試集中黃曲霉毒素B1 期望值與BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值Table 3 Prediction vales of aflatoxin B1 based on BP neural network and their desired values for test set /(μg·kg-1)
表4 2 種預(yù)測(cè)模型中測(cè)試集對(duì)比評(píng)價(jià)指標(biāo)Table 4 Comparison of two test models in the test set evaluation index
本試驗(yàn)中,影響高光譜預(yù)測(cè)霉變玉米中黃曲霉毒素B1結(jié)果的因素主要包括特征波長(zhǎng)的選取和模型的構(gòu)建。 本試驗(yàn)結(jié)果表明,特征波長(zhǎng)的FDA 鑒別正確率高于全波長(zhǎng),說(shuō)明特征波長(zhǎng)的提取是有效的,將特征波長(zhǎng)作為不同霉變等級(jí)黃曲霉毒素B1定量檢測(cè)的模型輸入時(shí),發(fā)現(xiàn)預(yù)測(cè)精度明顯提高,這與孫靜濤等[31]采用高光譜技術(shù)并結(jié)合特征波長(zhǎng)的提取預(yù)測(cè)哈密瓜可溶性固形物和硬度的結(jié)論一致。 本研究中,特征波長(zhǎng)下的PLSR 預(yù)測(cè)模型精度略低于全波長(zhǎng),而BP 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型中,特征波長(zhǎng)下的預(yù)測(cè)精度又明顯比全波長(zhǎng)高,說(shuō)明構(gòu)建的模型不同,其特征波長(zhǎng)下的預(yù)測(cè)精度并不是都比全波長(zhǎng)下的高,這可能與本研究只用了偏最小二乘權(quán)重回歸系數(shù)這一種方法提取特征波長(zhǎng)有關(guān),因?yàn)樘崛〉倪@7 個(gè)特征波長(zhǎng)雖然去除了冗余信息,提高了模型精度,但是特征波長(zhǎng)的選擇方法可能并不是最佳的,所以針對(duì)高光譜特征波長(zhǎng)的選擇仍需進(jìn)一步研究。
高光譜成像技術(shù)在霉變玉米無(wú)損檢測(cè)中仍然存在一定的局限性,還需要進(jìn)一步完善,同時(shí)本研究的樣本的數(shù)量及種類可能還不夠多,地域、品種覆蓋范圍還不夠廣,霉變天數(shù)的選擇也可能不是預(yù)測(cè)霉變玉米中黃曲霉毒素B1的最佳等級(jí),以及霉變玉米的鑒別方法比較單一,構(gòu)建的預(yù)測(cè)模型泛化能力有待進(jìn)一步提高,因此,后續(xù)工作仍有待深入研究。
針對(duì)霉變玉米中黃曲霉毒素B1的高光譜檢測(cè)方法,在提取霉變玉米高光譜特征波長(zhǎng)的基礎(chǔ)上,分別研究了全波長(zhǎng)和特征波長(zhǎng)下的FDA 判別效果。 結(jié)果表明,特征波長(zhǎng)能較好地判別不同等級(jí)的霉變玉米;特征波長(zhǎng)下的BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,具有較高的穩(wěn)定性與可靠性。 因此,特征波長(zhǎng)光譜信息能代表全波長(zhǎng)信息,而且進(jìn)行特征波長(zhǎng)的提取也是必要的,可減少計(jì)算量、提高檢測(cè)精度及減少信息的冗余現(xiàn)象。