郝 婕,董福佳,王松磊,李亞蕾,崔佳銳,劉思佳,呂 鈺
寧夏大學(xué)食品與葡萄酒學(xué)院,寧夏 銀川 750021
我國是世界第一柑橘生產(chǎn)國與消費國,產(chǎn)量和種植面積均居世界首位。臍橙因其果肉多味甜和高營養(yǎng)價值備受消費者喜愛[1]。農(nóng)藥在臍橙的生長過程中起到病蟲草害的防治作用,但殘留在臍橙表面的農(nóng)藥通過果皮滲透進(jìn)果肉中,可被人體吸收,危害人體健康。不同的農(nóng)藥成分以及不同的劑量會導(dǎo)致不同的中毒癥狀,輕至皮膚,重達(dá)血液甚至致命[2]。
傳統(tǒng)的檢測方法包括高效液相色譜法、酶聯(lián)免疫吸附試驗法、氣質(zhì)聯(lián)用法等。這些方法靈敏度高,但只能用于抽樣檢驗,前處理繁瑣和費時,且實驗具有破壞性,僅能用于實驗室農(nóng)藥殘留的精確分析和法定檢測[3]。因此,需要一種快速、無損、高效的方法檢測臍橙表面的農(nóng)藥殘留。
有些研究也使用了高光譜技術(shù),如可見光/近紅外高光譜、近紅外高光譜以及熒光高光譜成像技術(shù)等,用于確定水果和蔬菜的農(nóng)藥殘留[4-6]。熒光高光譜成像(HSI)是一種將光譜學(xué)和計算機視覺相結(jié)合的技術(shù),已成為檢測食品和農(nóng)產(chǎn)品的有力工具[7-10]。熒光高光譜可對熒光發(fā)射光譜進(jìn)行波段解離,有效去除非熒光背景物質(zhì)及自發(fā)熒光干擾,其靈敏度比分光光度法和比色法高2~3個數(shù)量級,對熒光物質(zhì)檢測優(yōu)勢顯著[11-13]。薛龍[2]等基于激光誘導(dǎo)熒光高光譜技術(shù)建立了臍橙表面敵敵畏殘留的預(yù)測模型,其預(yù)測集的相關(guān)系數(shù)達(dá)到0.810 1;Sun[14]等采用了高光譜結(jié)合葉綠素?zé)晒夤庾V的方法建立了萵苣葉中農(nóng)藥殘留的預(yù)測模型,其預(yù)測集決定系數(shù)為0.987。目前傳感器技術(shù)的進(jìn)步提高了熒光高光譜的空間和光譜的分辨率,使采集的光譜圖像尺寸變大,數(shù)據(jù)冗余,因此需要篩選特征波段,提高數(shù)據(jù)處理效率。本研究采用氙燈光源激發(fā)的熒光高光譜成像系統(tǒng)采集熒光光譜信息,結(jié)合二維相關(guān)光譜(2D-COS)算法對熒光光譜二次提取特征波長,在較少的特征波長表征光譜信息的基礎(chǔ)上,通過主成分分析與線性判別分析相結(jié)合算法(PCA-LDA)和偏最小二乘算法(PLS-DA)建立了臍橙表面不同濃度毒死蜱和多菌靈殘留的的判別模型,提高了不同濃度農(nóng)藥殘留的識別率,圖1為數(shù)據(jù)分析和模型建立的主要步驟流程圖。
圖1 數(shù)據(jù)分析和模型建立的主要步驟流程圖
毒死蜱標(biāo)準(zhǔn)溶液購自上海阿拉丁生化科技股份有限公司,多菌靈標(biāo)準(zhǔn)溶液購自羅恩試劑。根據(jù)GB 2763—2021《食品安全國家標(biāo)準(zhǔn)食品中農(nóng)藥殘留最大殘留限量》臍橙表面毒死蜱和多菌靈國標(biāo)限量分別為3和5 mg·kg-1,分別用甲醇溶液稀釋毒死蜱和多菌靈標(biāo)準(zhǔn)溶液,配置濃度梯度為0,0.5,1,2 mg·kg-1的毒死蜱溶液和0,1,3,5 mg·kg-1的多菌靈溶液,置于具塞錐形瓶中備用。實驗所用的臍橙均購自超市,挑選表面沒有缺陷和損傷的臍橙,將其表皮洗凈,靜置晾干。將配置好的溶液模擬農(nóng)藥噴灑至臍橙表面。
采用熒光高光譜儀(北京卓立漢光儀器有限公司)采集臍橙的熒光高光譜圖像。熒光高光譜系統(tǒng)主要由CCD相機、氙燈光源、二向分色鏡、電控位移平臺、發(fā)射光濾光片、暗箱和控制計算機組成。該系統(tǒng)覆蓋了392~998.2 nm波段范圍內(nèi)的176個波長,光譜分辨率為3.5 nm,相機的分辨率為960像素×1 101像素,像素數(shù)(空間維×光譜維)為960×176。圖2為熒光高光譜系統(tǒng)光學(xué)原理結(jié)構(gòu)圖。
圖2 熒光高光譜系統(tǒng)光學(xué)原理結(jié)構(gòu)圖
第一次采集時保留自動曝光、自動調(diào)焦、自動速度匹配,點擊采集可自動完成數(shù)據(jù)采集。之后打開自動拍攝的圖像查看是否過曝,如果結(jié)果不理想則需要手動調(diào)整參數(shù)。經(jīng)過預(yù)實驗,最終確定采集熒光高光譜圖像的參數(shù)為:起點位置0.65 cm,掃描距離1.0 cm,掃描前進(jìn)速度0.07 cm·s-1,回退速度0.20 cm·s-1,CCD相機對樣品的曝光時間設(shè)置為40 s, 增益為5。激發(fā)光濾光片濾光為357 nm,帶寬為45 nm(激發(fā)光波長334.5~379.5 nm)。
熒光高光譜可以通過改變激發(fā)和發(fā)射波長來檢測多種熒光基團的存在。熒光光譜是基于不同基團有機分子的相互作用、反應(yīng)、吸收和輻射而形成,每個組分的熒光光譜之間存在相互影響,因此認(rèn)為光譜的變化與毒死蜱和多菌靈的濃度變化有關(guān)。分子受熒光激發(fā)后發(fā)生激發(fā)態(tài)分子內(nèi)質(zhì)子轉(zhuǎn)移(ESIPT),分子構(gòu)型發(fā)生四級循環(huán)變化,即N(基態(tài))→N*(激發(fā)態(tài))→T*(激發(fā)態(tài))→T(基態(tài))→N(基態(tài))變化,如圖3所示。當(dāng)樣品受到氙燈光源的激發(fā)后,電子會從基態(tài)(N)的最低振動能級躍遷至激發(fā)態(tài)(N*)或者更高能量的激發(fā)態(tài)(T*)。激發(fā)態(tài)分子不穩(wěn)定,部分分子以非輻射躍遷形式釋放能量,部分分子以輻射躍遷形式回到基態(tài)(N),這個過程為熒光發(fā)射[15]。產(chǎn)生熒光的首要條件是該物質(zhì)的分子必須具有能吸收激發(fā)光的結(jié)構(gòu),通常含苯環(huán)結(jié)構(gòu)和共軛大π鍵。本研究中的毒死蜱和多菌靈的分子結(jié)構(gòu)如圖4所示,均具有苯環(huán)和大π鍵,理論上具有較高的熒光效率。此外,有機物分子溶于甲醇溶劑中將在甲醇-水二元混合溶劑中形成復(fù)雜的氫鍵混合物,從而增加分子的平面性,熒光增強。本研究將毒死蜱和多菌靈溶液溶解于甲醇溶液,以增強其熒光性。
圖3 激發(fā)態(tài)質(zhì)子轉(zhuǎn)移的能級模型
圖4 毒死蜱和多菌靈的分子結(jié)構(gòu)
1.4.1 光譜數(shù)據(jù)預(yù)處理
消除實驗過程中相機暗電流、光散射、儀器的基線漂移和噪聲等無關(guān)信息的影響,提高后續(xù)模型的性能,需要對光譜數(shù)據(jù)進(jìn)行預(yù)處理。采用的預(yù)處理方法包括卷積平滑(savitzky-golay smoothing,SG)、標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate,SNV)和一階導(dǎo)(first derivative,F(xiàn)D)。
高光譜數(shù)據(jù)的高維性和相鄰變量之間的強相關(guān)性導(dǎo)致了模型訓(xùn)練的復(fù)雜性和高時間消耗。特征波長變量的選擇是光譜數(shù)據(jù)分析和簡化模型的關(guān)鍵步驟,主要集中在從大量光譜中識別和提取特征變量。本研究采用區(qū)間變量迭代空間收縮法(iVISSA)、無信息變量消除算法(UVE)、競爭性自適應(yīng)加權(quán)算法(CARS)[16]和二維相關(guān)光譜(2D-COS)[17]方法對特征波長進(jìn)行了選擇。
采用主成分分析與線性判別分析相結(jié)合算法(PCA-LDA)和偏最小二乘算法(PLS-DA)建立臍橙表面不同濃度毒死蜱和多菌靈殘留及光譜變量的判別模型。模型性能通過精確度評價,精確度越高,表示模型性能越好。
使用ENVI 4.8選取臍橙樣本的整個區(qū)域作為感興趣區(qū)域,將感興趣區(qū)域內(nèi)所有像素的平均熒光光譜作為臍橙光譜數(shù)據(jù)進(jìn)行進(jìn)一步分析。圖5為采集的臍橙熒光高光譜圖像。通過對采集的熒光高光譜圖像進(jìn)行分析,發(fā)現(xiàn)700.2~998.2 nm沒有熒光成像。因此有效發(fā)射波段為392~700.2 nm,共94個波段。后續(xù)數(shù)據(jù)分析及建模均基于有效波段。
圖5 臍橙熒光高光譜圖像
圖6為臍橙表面不同濃度毒死蜱和多菌靈的平均光譜曲線。圖6(a)為毒死蜱的平均光譜曲線,不同濃度樣品的光譜曲線走勢相似。噴灑毒死蜱的臍橙熒光強度高于未噴毒死蜱的原始臍橙樣本,且隨著濃度增加,熒光強度逐步升高。在530 nm附近出現(xiàn)一個微弱的譜峰,為橙子表面橙皮素的熒光發(fā)射波長。
圖6 臍橙表面不同濃度毒死蜱(a)和多菌靈(b)的平均光譜曲線
圖6(b)為多菌靈的平均光譜曲線,表面附著多菌靈的臍橙樣本的熒光強度明顯高于沒有多菌靈附著的臍橙表面。其中3 mg·kg-1濃度的多菌靈平均光譜最強,其次是1 mg·kg-1, 5 mg·kg-1最弱。分析認(rèn)為大部分熒光物質(zhì)存在一種聚集引發(fā)猝滅的現(xiàn)象。在濃度比較高的情況下激發(fā)能量會以分子間作用力形成超分子結(jié)構(gòu)的形式耗散,熒光成分可能會抑制低量子產(chǎn)率成分的發(fā)射[9],因此在較低濃度下測得的熒光量子效率反而更高。0 mg·kg-1的多菌靈臍橙表面由于橙皮素在530 nm附近有熒光發(fā)射峰,表面附著多菌靈的橙皮表面在550 nm附近出現(xiàn)熒光發(fā)射峰,5 mg·kg-1濃度的發(fā)射峰尤為明顯,由此可推測550 nm處的熒光發(fā)射峰為多菌靈的發(fā)射峰。
采用3種預(yù)處理算法(SG,SNV和FD)對光譜數(shù)據(jù)進(jìn)行處理。不同預(yù)處理后的熒光光譜有一定的差異。SG算法可以消除噪聲使光譜曲線變平滑,SNV算法可以實現(xiàn)光譜曲線的歸一化,而導(dǎo)數(shù)法可以解決光譜曲線的重疊峰,增強光譜之間的差異。圖7為毒死蜱和多菌靈預(yù)處理前后的熒光光譜曲線。
圖7 預(yù)處理前后的毒死蜱和多菌靈熒光高光譜曲線
(a): Chlorpyrifos original flourescence spectral curve;(b): Chlorpyrif spectral curve by SG pretreatment;(c): Chlorpyrifos spectral curve by SNV pretreatment;(d): Chlorpyrifos spectral curve by FD pretreatment;(e): Carbendazim original fluorescence spectral curve;(f): Carbendazim spectral curve by SG pretreatment;(g): Spectral curve by SNV pretreatment;(h): Spectral curve by FD pretreatment
圖7(a)為毒死蜱原始熒光光譜曲線,光譜曲線受噪聲影響出現(xiàn)若干小的尖峰,通過SG算法預(yù)處理后得到圖7(b),有效減少了原始光譜數(shù)據(jù)背景噪聲和重疊現(xiàn)象。圖7(c)為經(jīng)過SNV算法處理得到的光譜曲線,光譜曲線得以歸一化,但是依然存在若干小的尖峰。圖7(d)為經(jīng)過FD算法處理得到的光譜曲線,在420~430 nm處出現(xiàn)了兩個相反的大的尖峰,曲線缺乏規(guī)律性。圖7(e)—(h)為多菌靈原始光譜曲線和經(jīng)SG,SNV,F(xiàn)D預(yù)處理后的熒光光譜曲線,與毒死蜱熒光光譜數(shù)據(jù)預(yù)處理后的光譜曲線呈現(xiàn)相似趨勢。
對原始熒光光譜數(shù)據(jù)和預(yù)處理后的熒光光譜數(shù)據(jù)建立PLS-DA和PCA-LDA模型,結(jié)果如表1所示。由表1可知,毒死蜱和多菌靈熒光光譜數(shù)據(jù)經(jīng)過SG預(yù)處理后建模效果均為最優(yōu),分析認(rèn)為SG預(yù)處理有效減少了噪聲對數(shù)據(jù)的影響,提高了數(shù)據(jù)的規(guī)律性。其中,毒死蜱熒光光譜數(shù)據(jù)經(jīng)過SG處理后建立的PCA-LDA模型,預(yù)測集正確率達(dá)到95.83%,比原始數(shù)據(jù)建立的PCA-LDA模型高出4.16%,建立的PLS-DA模型,預(yù)測集正確率達(dá)到87.5%,高于原始數(shù)據(jù)和其他預(yù)處理后所建模型效果。多菌靈熒光光譜數(shù)據(jù)經(jīng)過SG處理后建立的PLS-DA和PCA-LDA,正確率均達(dá)到91.67%,為最優(yōu)數(shù)據(jù)集。結(jié)合光譜曲線和建模效果,選擇SG方法對毒死蜱和多菌靈熒光光譜數(shù)據(jù)進(jìn)行預(yù)處理。
表1 不同預(yù)處理方法的模型結(jié)果
2.3.1 特征波長一次提取與建模
使用iVISSA,CARS和UVE算法提取特征波長。iVISSA法提取特征波長具體參數(shù)設(shè)置為:最大主成分?jǐn)?shù)為15,交叉驗證次數(shù)為15次,選擇中心化數(shù)據(jù)處理模式,二進(jìn)制矩陣的采樣次數(shù)為500次。CARS法提取特征波長具體參數(shù)設(shè)置為:最大主成分?jǐn)?shù)為15,交叉驗證次數(shù)為15次,數(shù)據(jù)處理采用中心化數(shù)據(jù)處理模式,蒙特卡羅采樣次數(shù)為500次。UVE法提取特征波長具體參數(shù)設(shè)置為:最大主成分?jǐn)?shù)為30,交叉驗證次數(shù)為5次,選擇中心化數(shù)據(jù)處理模式,二進(jìn)制矩陣的采樣次數(shù)500次。特征波長提取如圖8所示。圖8(a)為毒死蜱熒光光譜數(shù)據(jù)的特征波長提取結(jié)果,iVISSA,CARS和UVE提取的特征波長數(shù)量分別為:26,10和12。圖8(b)為多菌靈熒光光譜數(shù)據(jù)的特征波長提取結(jié)果,iVISSA,CARS和UVE提取的特征波長數(shù)量分別為:20,30和13。
圖8 特征波長提取結(jié)果
對三種方法提取的特征波長建立模型,模型結(jié)果如表2所示。對于不同濃度的毒死蜱熒光光譜數(shù)據(jù),iVISSA法提取的特征波長建立的的模型效果最優(yōu),PLS-DA模型的校正集和預(yù)測集正確率分別為88.89%和87.50%。PCA-LDA模型的校正集和預(yù)測集的正確率分別為97.22%和91.67%,均優(yōu)于其他特征波長模型。對于不同濃度的多菌靈熒光光譜數(shù)據(jù),CARS法提取的特征波長建立的模型效果最好,PLS-DA和PCA-LDA模型預(yù)測集的正確率分別為91.67%和95.83%,優(yōu)于全波段和其他特征波長模型。分析認(rèn)為,相較于其他方法,CARS法提取的波長多分布在500~600 nm波段范圍,對應(yīng)于橙子表面的橙皮素和可能為多菌靈的發(fā)射峰出現(xiàn)的位置。但是由表2可知,毒死蜱和多菌靈的最優(yōu)特征波長的波長數(shù)分別為26和30,波長數(shù)較多,且毒死蜱最優(yōu)特征波長建立的PCA-LDA的預(yù)測集正確率略低于基于全波段建模的預(yù)測集正確率,故采用組合算法提取特征波長,以提取最優(yōu)特征波長,減少特征波長數(shù)量和數(shù)據(jù)冗余,同時提高模型性能。
表2 不同特征波長的模型結(jié)果
2.3.2 基于組合算法的特征波長提取與建模
毒死蜱和多菌靈具有成分復(fù)雜,含量高的特點,特征峰存在嚴(yán)重重疊。通過2.3.1得到毒死蜱和多菌靈熒光光譜數(shù)據(jù)的最優(yōu)特征波長,分別為iVISSA和CARS法。經(jīng)過二維熒光相關(guān)光譜技術(shù)進(jìn)行二次提取,可以提高光譜的分辨率和解釋能力,同時區(qū)分特征光譜中的覆蓋峰、弱峰和遷移峰。通過表征每個特征變量在模型中的作用,進(jìn)而用于特征峰提取,達(dá)到數(shù)據(jù)降維的目的。
如圖9(a—d)分別為毒死蜱和多菌靈的同步二維熒光相關(guān)譜和三維立體圖。根據(jù)Noda的二維光譜理論,同步二維熒光相關(guān)光譜呈對角線對稱,存在兩種相關(guān)峰。位于對角線上的峰為自峰,呈現(xiàn)正值,由動態(tài)信號自身相關(guān)得到,其強度代表了體系對外擾的敏感程度。圖9(a)和(b)分別為毒死蜱同步二維熒光相關(guān)譜和三維立體圖,在對角線位置主要出現(xiàn)3個自相關(guān)峰,分別位于458.8,494.5和580.5 nm,表明該變量處光譜信號對外擾較敏感。位于對角線外的峰為交叉峰,有正負(fù)之分,表示相應(yīng)吸收峰之間的相關(guān)程度。在(458.8,494.5),(494.5,580.5)和(458.8,580.5)nm處有明顯的正交叉峰,說明458.8,494.5和580.5 nm處的吸收峰強度在同時同向變化。圖9(c)和(d)分別為多菌靈同步二維熒光相關(guān)譜和三維立體圖,在對角線位置主要出現(xiàn)3個自相關(guān)峰,分別位于442.8,468.5和570.5 nm。在(442.8,468.5),(468.5,570.5)和(442.8,570.5)nm處有明顯的正交叉峰。因此選擇在交叉峰和自相關(guān)峰附近的波段為特征波段,在此基礎(chǔ)上選擇了毒死蜱iVISSA-2D-COS的10個特征變量,多菌靈CARS-2D-COS的12個變量,作為組合算法的特征變量。圖10為經(jīng)2D-COS二次提取特征波長的結(jié)果。
圖9 毒死蜱(a, b)和多菌靈(c, d)的同步二維熒光相關(guān)譜和三維立體圖
圖10 特征波長二次提取結(jié)果
表3為經(jīng)過2D-COS二次提取特征波長建模結(jié)果。對于毒死蜱的熒光光譜數(shù)據(jù),基于iVISSA-2D-COS與基于iVISSA建立的PLS-DA模型的預(yù)測集正確率一樣,均為87.50%,但是二次提取后特征波長的數(shù)量減少為一次提取的50%,減少了數(shù)據(jù)處理量,提高了模型處理的效率;建立的PCA-LDA模型的預(yù)測集正確率比一次提取建立的模型提高了4.16%。對于多菌靈的熒光光譜數(shù)據(jù),經(jīng)過2D-COS二次提取特征波長建立的PLS-DA模型和PCA-LDA模型的預(yù)測集正確率與基于一次提取特征波長所建立的模型相等,但是特征波長數(shù)量為CARS法提取的43%。綜上所述,對于不同濃度毒死蜱,iVISSA-2D-COS-PCA-LDA模型效果最優(yōu);對于不同濃度多菌靈,CARS-2D-COS-PCA-LDA模型效果最優(yōu)。
表3 二次提取特征波長建模結(jié)果
采用熒光高光譜成像技術(shù)對臍橙表面不同濃度毒死蜱和多菌靈進(jìn)行判別研究,采用SG法對熒光高光譜數(shù)據(jù)進(jìn)行預(yù)處理,有效減少了背景噪聲和重疊現(xiàn)象對原始光譜數(shù)據(jù)的影響。采用iVISSA法對經(jīng)過SG處理后的毒死蜱光譜數(shù)據(jù)進(jìn)行特征波長提取,用CARS法對經(jīng)過SG處理后的多菌靈光譜數(shù)據(jù)進(jìn)行特征波長提取,分別提取出26個和30個特征波長;然后采用2D-COS算法對提取出的特征波長進(jìn)行二次提取,分別得到10個和12個特征波長,降低了光譜數(shù)據(jù)冗余;最后,采用一次提取特征波長、二次提取特征波長建立不同濃度毒死蜱和多菌靈的判別模型。主要結(jié)論:
(1)對于臍橙表面不同濃度的毒死蜱,基于iVISSA-2D-COS法提取的特征波長建立的PCA-LDA模型效果最佳,校正集和預(yù)測集判別正確率分別為98.61%和95.83%。
(2)對于臍橙表面不同濃度的多菌靈,基于CARS-2D-COS法提取的特征波長建立的PCA-LDA模型效果最優(yōu),校正集和預(yù)測集判別正確率分別為97.22%和95.83%。
(3)iVISSA-2D-COS-PCA-LDA毒死蜱濃度模型判別和CARS-2D-COS-PCA-LDA多菌靈濃度模型判別準(zhǔn)確率均高于全波段熒光光譜數(shù)據(jù)和其他特征波長光譜數(shù)據(jù)模型判別正確率,說明2D-COS法提取特征波長,在減少波長數(shù)量的同時,可以保留重要的熒光光譜分類信息。