亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        超高效液相色譜-四極桿/飛行時間質(zhì)譜鑒別紅葡萄酒的品種和產(chǎn)地

        2022-10-17 04:56:32韓靜雯李國輝鐘其頂王道兵樊雙喜劉洋
        食品與發(fā)酵工業(yè) 2022年19期
        關(guān)鍵詞:分類模型

        韓靜雯,李國輝,鐘其頂,王道兵,樊雙喜,劉洋

        (中國食品發(fā)酵工業(yè)研究院有限公司,北京,100015)

        葡萄酒是由水、糖、有機酸、酚類和揮發(fā)性化合物組成的復(fù)雜混合物,GB/T 15037—2006《葡萄酒》中定義葡萄酒為以鮮葡萄或葡萄汁為原料,經(jīng)全部或部分發(fā)酵釀制而成的,含有一定酒精度的發(fā)酵酒。自2003年以來,葡萄酒的質(zhì)量評價以及品種、產(chǎn)地真實性的研究也逐步深入。由于我國對于葡萄酒品種鑒別和原產(chǎn)地認(rèn)證手段都還不夠成熟,缺乏相應(yīng)的檢測方法予以支撐。以次充好虛報品種和產(chǎn)地的葡萄酒產(chǎn)品極大地?fù)p害了消費者以及葡萄酒行業(yè)的經(jīng)濟利益,因此急需建立我國葡萄酒真實性鑒別的有效手段。

        目前用于葡萄酒品種、產(chǎn)地鑒別的主要有穩(wěn)定同位素技術(shù)[1-3]、氣相色譜質(zhì)譜聯(lián)用技術(shù)[4-6],高效液相色譜技術(shù)[7]和紅外光譜技術(shù)[8]等。葡萄酒中物質(zhì)的組成和數(shù)量與氣候條件、土壤、葡萄品種等因素息息相關(guān),可利用揮發(fā)性成分和元素信息等非靶向或靶向代謝指紋圖譜分析判別葡萄酒差異相關(guān)的特征性化合物,從而進行不同品種和產(chǎn)地等信息的區(qū)分[9-10]?;瘜W(xué)計量學(xué)的逐步發(fā)展使得主成分分析(principal component analysis, PCA)、偏最小二乘判別分析(partial least square-discriminant analysis, PLS-DA)、支持向量機(support ector machine, SM)和隨機森林(random forest, RF)等被廣泛應(yīng)用于食品領(lǐng)域進行品種鑒別和產(chǎn)地溯源[11-14]。此外,非目標(biāo)篩查與多元統(tǒng)計分析相結(jié)合可大幅提升對不同地理環(huán)境的葡萄酒鑒別的準(zhǔn)確率[7]。超高效液相色譜-四極桿飛行時間質(zhì)譜(ultra-performance liquid chromatography-quadrupole-time-of-flight-mass spectrometry,UPLC-QTOF-MS)技術(shù)具有良好的分離能力、分辨率高、檢測限低并且能夠測定樣品成分和物質(zhì)結(jié)構(gòu)的特性,在葡萄酒的質(zhì)量和真實性方面有很好的應(yīng)用前景[11]。本研究以不同品種和產(chǎn)地的國產(chǎn)紅葡萄酒為對象,基于UPLC-QTOF-MS進行葡萄酒代謝組學(xué)分析,結(jié)合化學(xué)計量學(xué)手段,通過不同預(yù)測模型逐步對國產(chǎn)紅葡萄酒的品種和產(chǎn)地進行鑒定,通過綜合考慮不同模型之間正確率的對比以及各個模型對于異常點的容忍度和過擬合的可能性,選擇最優(yōu)預(yù)測模型,為葡萄酒真實性鑒別提供方法支撐。

        1 材料與方法

        1.1 實驗儀器

        Agilent 1290-6546超高效液相色譜-四極桿飛行時間質(zhì)譜儀(配備Dual AJS ESI源),美國Agilent公司。

        1.2 實驗試劑和樣品

        甲酸(質(zhì)譜純,≥99%),上海麥克林生化科技有限公司;甲醇(質(zhì)譜純,99.9%),賽默飛世爾科技有限公司;超純水,美國Millipore公司。

        所選樣品均為單一葡萄品種釀造,同時包含不同的品種、產(chǎn)地和年份信息,樣品年份范圍為2015年—2019年,主要集中在2017年和2018年。樣品品種和產(chǎn)地信息如表1、表2所示。

        1.3 實驗方法

        1.3.1 樣品的制備

        準(zhǔn)確量取1 mL紅葡萄酒樣品與2 mL甲醇置于玻璃管中,渦旋混勻后取2 mL經(jīng)0.22 μm有機濾膜過濾后置于進樣瓶中,以供UPLC-QTOF-MS檢測。

        質(zhì)量控制(quality control, QC)樣品制備:所有待測樣品每個取0.5 mL置于三角瓶中,混合均勻,取混勻后的液體1 mL與2 mL甲醇置于玻璃管中,渦旋混勻后取2 mL經(jīng)0.22 μm濾膜過濾后置于進樣瓶中,以供UPLC-QTOF-MS檢測。

        1.3.2 試劑配制

        流動相A:0.1%(質(zhì)量分?jǐn)?shù),下同)甲酸水溶液;流動相B:100%甲醇。

        1.3.3 色譜條件

        色譜柱:ZORBAX Eclipse Pluse C18(2.1 mm×100 mm,1.8 μm);柱溫40 ℃;進樣量2 μL;流速0.3 mL/min;梯度洗脫程序見表3。

        表3 正模式梯度洗脫程序Table 3 Gradient elution procedure in positie mode

        1.3.4 質(zhì)譜條件

        在正模式下進行全掃描檢測。

        參數(shù)設(shè)置:毛細(xì)管電壓3 500 ;干燥氣溫度300 ℃;干燥氣流速6 L/min;霧化氣壓力241.3 kPa;鞘氣溫度350 ℃;鞘氣流速11 L/min;碎裂電壓120 ;質(zhì)量掃描范圍m/z50~1 700;采集速率2 spectra/s;參比離子m/z121.050 873和m/z922.009 798。

        1.4 數(shù)據(jù)處理與統(tǒng)計分析

        將在MassHunter Workstation(美國Agilent公司)采集的譜圖數(shù)據(jù)使用Profinder 10.0和Mass Profiler Professional(MPP)進行統(tǒng)計學(xué)分析并建立預(yù)測模型。

        2 結(jié)果與分析

        2.1 UPLC-QTOF-MS方法

        UPLC-QTOF-MS不需要復(fù)雜的前處理過程,具有液相色譜中良好的分離機制,被視為代謝指紋圖譜分析的有效工具[15],其能夠在不需要標(biāo)準(zhǔn)物質(zhì)的情況下對復(fù)雜樣品中的化合物成分進行鑒定和分析,具有高分辨率、高靈敏度、高選擇性和高精度的優(yōu)點,能夠提供更加精確的相對分子質(zhì)量和結(jié)構(gòu)信息[16]。本研究對紅葡萄酒進行非靶向指紋圖譜分析,在沒有具體的目標(biāo)物質(zhì)的情況下,對液相色譜分離和質(zhì)譜檢測在通用的方法參數(shù)基礎(chǔ)上加以優(yōu)化,以獲得包含盡可能多的化合物信息的樣品數(shù)據(jù)。方法采用反相高壓色譜柱和梯度洗脫使得紅葡萄酒樣品中不同極性的化合物能夠在高水相向高有機相轉(zhuǎn)變過程中有效分離,在流動相水相中添加0.1%的甲酸能夠一定程度上幫助物質(zhì)電離[14],所有的化合物可在16 min內(nèi)被洗脫,m/z的范圍選擇50~1 700,儀器在掃描過程中會自動對參比離子進行檢測,以此來對樣品中檢測到的物質(zhì)進行質(zhì)量校準(zhǔn)。

        2.2 提取穩(wěn)定化合物

        圖1所示為以正模式掃描的QC樣品總離子流色譜圖。將獲得的QC數(shù)據(jù)導(dǎo)入Profinder中進行遞歸特征提取,通過峰高、保留時間和質(zhì)量進行篩選,共篩選出1 470個特征化合物,在此基礎(chǔ)上在MPP中過濾掉變異系數(shù)(coefficient of ariation,C)≥20%的不穩(wěn)定化合物,獲得970個C<20%的穩(wěn)定化合物。樣品數(shù)據(jù)分組導(dǎo)入Profinder并依據(jù)獲得的穩(wěn)定化合物進行目標(biāo)特征提取,獲得樣品數(shù)據(jù)的PFA文件。在MPP中將所有數(shù)據(jù)用中位數(shù)對齊,建立預(yù)測模型。

        圖1 質(zhì)控樣品總離子流色譜圖Fig.1 Total ion chromatograms of QC samples

        2.3 建立預(yù)測模型

        2.3.1 PCA

        PCA技術(shù)能夠提取分析原始數(shù)據(jù)中有效的化學(xué)信息作為新的主成分變量,有效地降低數(shù)據(jù)維度,選取方差最大的幾個主成分,通過對比不同組別樣本間的差異性建立分組模型[17-18]。將經(jīng)QC數(shù)據(jù)篩選后的樣品數(shù)據(jù)導(dǎo)入MPP進行PCA,紅葡萄酒品種和產(chǎn)地的PCA結(jié)果見圖2。無論品種還是產(chǎn)地的樣本數(shù)據(jù)都相互交疊、重合程度極大。品種鑒別中3個主成分變量貢獻率分別為15.61%、9.81%和8.09%,產(chǎn)地鑒別中3個主成分變量貢獻率分別為15.33%、9.45%和7.91%,累計貢獻率為32.69%,小于35%,貢獻率低。提取的有效數(shù)據(jù)信息不充分,因此,PCA模型均無法成功區(qū)分葡萄酒品種和產(chǎn)地。

        a-品種;b-產(chǎn)地圖2 品種和產(chǎn)地的PCA圖Fig.2 PCA of ariety and origin

        2.3.2 PLS-DA

        為了解決PCA模型主成分貢獻率低,無法對樣品的品種和產(chǎn)地進行區(qū)分的問題,進一步使用PLS-DA對樣品數(shù)據(jù)進行分析。PLS-DA可以同時實現(xiàn)多元線性回歸和主成分分析[10,19],相較于PCA模型,PLS-DA模型除了對數(shù)據(jù)進行降維處理,還能實現(xiàn)預(yù)測模型的構(gòu)建,通過有監(jiān)督的模式更好地明確樣本組間關(guān)系。PLS-DA模型對紅葡萄酒樣品品種和產(chǎn)地的分類可視3D模型見圖3。圖3-a中可看出3個品種數(shù)據(jù)點各自形成清晰可見的聚集分布,分類效果較好,圖3-b中4個產(chǎn)地分組間仍有較大部分的重疊。從正確率來看,模型對于樣品的品種和產(chǎn)地的識別能力均為100%,但對于品種鑒別的預(yù)測能力為83.81%,對于產(chǎn)地溯源的預(yù)測能力為71.43%。

        a-品種;b-產(chǎn)地圖3 品種和產(chǎn)地的PLS-DA圖Fig.3 PLS-DA of ariety and origin

        在品種鑒別的交叉驗證中赤霞珠、梅鹿輒和西拉的分類正確率分別為81.12%、80.95%和100.00%(表4);在產(chǎn)地溯源的交叉驗證中河北、寧夏、山東和新疆的分類正確率分別為71.97%、78.57%、50.00%和80.00%(表5)。根據(jù)這種有監(jiān)督的分析,可以注意到西拉與其他2個品種差異較大,品種預(yù)測中赤霞珠和梅鹿輒正確率相對較低,但仍明顯呈現(xiàn)出聚類分布的趨勢,表明3個品種釀酒葡萄所生產(chǎn)的葡萄酒中的化合物組成存在一定程度的差異。產(chǎn)地預(yù)測中正確率低于80%,模型預(yù)測結(jié)果中,各個樣本組中被錯誤分類的樣品散落在其他幾個樣本組之間,沒有統(tǒng)一性,其葡萄酒數(shù)據(jù)間存在異常點,需要采用更為穩(wěn)定與對異常點容忍度更大的模型進一步分析。

        表4 PLS-DA模型的品種分類結(jié)果Table 4 The oeriew of ariety classification results obtained by PLS-DA model

        表5 PLS-DA模型的產(chǎn)地分類結(jié)果Table 5 The oeriew of origin classification results obtained by PLS-DA model

        2.3.3 SM

        SM模型作為一種常見的廣義線性分類器,一般用于分類與回歸問題的研究,對數(shù)據(jù)異常點的容忍度優(yōu)于PLS-DA,適用于較小的數(shù)據(jù)集,不容易造成過擬合現(xiàn)象[13,20]。本次構(gòu)建的SM模型采用線性核函數(shù)和留一法交叉驗證,對于樣品的品種和產(chǎn)地和識別能力均為100%,對于品種鑒別的預(yù)測能力為97.48%,對于產(chǎn)地溯源的預(yù)測能力為85.07%(表6、表7)。訓(xùn)練集和測試集的整體正確率較高,各個組別自身正確率除山東產(chǎn)地外均在80%以上,山東產(chǎn)地僅為64.00%(表7)。品種模型的訓(xùn)練和預(yù)測正確率十分優(yōu)異,3種釀酒葡萄所釀造的葡萄酒之間的差異明顯。但有13個山東產(chǎn)地的紅葡萄酒樣品被識別為了河北產(chǎn)地樣品,導(dǎo)致產(chǎn)地預(yù)測正確率出現(xiàn)了較大的偏差,這可能是由于山東省與河北省葡萄的主要種植地均在沿海地區(qū),其地理環(huán)境、土壤條件以及種植方式均有相似之處,使得2個產(chǎn)地葡萄酒在一定程度上具有相同的化合物信息,導(dǎo)致無法正確分類。盡管SM對于數(shù)據(jù)異常點的處理較為優(yōu)異,但仍然會受到相似性較大的數(shù)據(jù)點的影響,且組間樣本量差異較大,對模型分類預(yù)測結(jié)果造成影響。

        表6 SM模型的品種分類結(jié)果Table 6 The oeriew of ariety classification results obtained by SM model

        表7 SM模型的產(chǎn)地分類結(jié)果Table 5 The oeriew of origin classification results obtained by SM model

        2.3.4 RF

        為了進一步避免數(shù)據(jù)異常點對于模型的影響,使用對于異常點不敏感的RF,其作為一種非線性分類與回歸方法[21],區(qū)別于SM需要對多項參數(shù)進行調(diào)整優(yōu)化,更為簡單直接,從原始樣本中抽取多個樣本單獨進行決策樹建模,通過對大量決策樹的預(yù)測匯總,投票得出最終預(yù)測結(jié)果,提高了模型的預(yù)測精度,一定程度上避免了過擬合等問題的出現(xiàn)[22-23]。圖4給出了決策樹≤500時紅葡萄酒樣品品種和產(chǎn)地分類的袋外誤差結(jié)果,在保證模型有效的基礎(chǔ)上設(shè)置盡可能少的決策樹個數(shù)以節(jié)省建模所需時間。品種鑒別中誤差最低點為0.003 597 122,對應(yīng)的最小決策樹個數(shù)為257,產(chǎn)地溯源中誤差最低點為0.012 987 013,對應(yīng)的最小決策樹個數(shù)為259。

        a-品種;b-產(chǎn)地圖4 品種及產(chǎn)地溯源袋外誤差Fig.4 Out-of-bag error of ariety identification and origin traceability

        根據(jù)篩選出的最小決策樹個數(shù)分別建立預(yù)測模型(見表8和表9)。2個模型在訓(xùn)練過程中沒有出現(xiàn)錯誤分類,即識別能力均為100.00%,表明RF模型能夠分別對紅葡萄酒的品種和產(chǎn)地進行有效區(qū)分。整體品種分類的預(yù)測正確率為99.64%,赤霞珠、梅鹿輒和西拉的分類正確率分別為100.00%、97.62%和100.00%;整體產(chǎn)地分類的預(yù)測正確率為98.70%,河北、寧夏、山東和新疆的分類正確率分別為100.00%、98.21%、96.00%和98.57%。在針對2個模型的驗證中,所有組別的正確率均高于96.00%,驗證了RF模型的有效性。

        表8 RF模型的品種分類結(jié)果Table 8 The oeriew of ariety classification results obtained by RF model

        表9 RF模型的產(chǎn)地分類結(jié)果Table 9 The oeriew of origin classification results obtained by RF model

        本實驗選取的3個葡萄品種赤霞珠、梅鹿輒和西拉在色素、花青素和一些酚類物質(zhì)的種類和含量存在顯著差異[24],使得建立模型的干擾較少,較易得到準(zhǔn)確率優(yōu)異的品種預(yù)測模型。產(chǎn)地模型中克服了河北與山東產(chǎn)地樣品數(shù)據(jù)間的相似性,僅有2個山東產(chǎn)地樣品被識別為河北產(chǎn)地,有效避免了過擬合問題。同時,本研究在前期對數(shù)據(jù)進行了過濾以及特征化合物提取,篩選出的特征化合物在建立預(yù)測模型時更具有優(yōu)勢,相較于同類研究僅使用部分目標(biāo)酚類化合物及部分代謝物建立的RF預(yù)測模型(正確率91.75%)[25],預(yù)測正確率更高,性能更好。

        3 結(jié)果與討論

        使用UPLC-QTOF-MS在全掃描模式下對紅葡萄酒進行了代謝指紋圖譜分析,在獲得豐富信息數(shù)據(jù)的基礎(chǔ)上對紅葡萄酒進行品種鑒別和產(chǎn)地溯源具備可行性。不同葡萄品種(赤霞珠、梅鹿輒和西拉)釀制的紅葡萄酒除在PCA模型中無法實現(xiàn)聚類之外,在其他3種模型中均呈現(xiàn)出了較好的分類正確率,盡管各品種中包含了來自全國各地不同產(chǎn)地的信息,但其自身的差異性較小,識別率較高。而來自不同產(chǎn)地(河北、寧夏、山東和新疆)的紅葡萄酒受到產(chǎn)地間相似地理環(huán)境、土壤條件和種植方式等因素的影響,存在較多異常點信息,PCA和PLS-DA模型均無法實現(xiàn)準(zhǔn)確分類,而對于異常點容忍度優(yōu)異,過擬合現(xiàn)象發(fā)生概率較小的SM和RF模型,成功實現(xiàn)了對于不同產(chǎn)地的準(zhǔn)確分類。本研究通過多元化、多維度的非靶向數(shù)據(jù)源構(gòu)建了系統(tǒng)的預(yù)測模型,鑒別不同品種和產(chǎn)地的葡萄酒,從而建立了我國葡萄酒真實性鑒別的有效方法。

        但同時,本實驗在樣品設(shè)置上存在一些不足,由于中國釀酒葡萄的主要種植品種為赤霞珠,因此無論是品種樣品設(shè)置還是產(chǎn)地樣品設(shè)置中赤霞珠都占據(jù)了大多數(shù)。各個產(chǎn)地的主要釀酒葡萄種植品種存在差異,使得產(chǎn)地模型的建立存在較大的干擾。另外,由于時間對葡萄酒的影響較大,盡管本次樣品中涵蓋了不同的時間信息,但差距較小,在未來的研究中,可以對葡萄酒中組分隨著時間產(chǎn)生的變化進行探究,進一步分析本研究中的2個模型是否具有長期的適用性,以及如何進行適度的更新調(diào)整,從而建立更加完善可靠的葡萄酒分析預(yù)測模型。

        猜你喜歡
        分類模型
        一半模型
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        激情伊人五月天久久综合| 亚洲综合偷拍一区二区| 久久久国产精品黄毛片| 日本一区二区三区视频免费在线| 中文字幕亚洲综合久久菠萝蜜| 蜜桃无码一区二区三区| 真正免费一级毛片在线播放| 色婷婷激情在线一区二区三区| 操国产丝袜露脸在线播放| 国产自拍在线视频91| 麻豆精品国产精华液好用吗| 亚洲成色www久久网站夜月| 精品五月天| 在线无码免费看黄网站| 久久精品熟女亚洲av香蕉| 免费视频成人片在线观看 | 国产亚洲一区二区三区| 亚洲av无码久久精品蜜桃| 欧洲-级毛片内射| 国产欧美另类精品久久久| 中文字幕人妻少妇久久| 国产精品黑丝美腿美臀| 亚洲av日韩av天堂久久| 亚洲Va欧美va国产综合| 人妻少妇人人丰满视频网站| 好看的国内自拍三级网站| 国产一区亚洲二区三区极品| 艳妇臀荡乳欲伦69调教视频| 青青久在线视频免费观看| 含羞草亚洲AV无码久久精品| 蜜桃av噜噜一区二区三区香| 黄片视频大全在线免费播放| 天堂а在线中文在线新版| 韩国19禁无遮挡啪啪无码网站| 夜夜爽无码一区二区三区| 91精品人妻一区二区三区蜜臀| 日韩精品一区二区亚洲观看av| 欧美丰满熟妇xxxx性ppx人交| 永久免费的av在线电影网无码| 亚洲精品6久久久久中文字幕| 中文字幕有码久久高清|