亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高EGCG含量茶樹品種光譜識別模型構(gòu)建*

        2021-07-15 01:42:58翁海勇許金釵陶鑄劉江洪鄭金貴葉大鵬
        關(guān)鍵詞:反射率波段茶樹

        翁海勇,許金釵,陶鑄,劉江洪,鄭金貴,葉大鵬

        (1. 福建農(nóng)林大學(xué)機(jī)電工程學(xué)院,福州市,350002; 2. 現(xiàn)代農(nóng)業(yè)裝備福建省高校工程研究中心,福州市,350002; 3. 海峽兩岸科技產(chǎn)業(yè)合作基地(成員單位),福州市,350002)

        0 引言

        表沒食子兒茶素沒食子酸酯(Epigallocatechin gallate,EGCG)是茶多酚里面一種重要單體,具有較強(qiáng)的抗氧化活性,能提高免疫力,抑制癌細(xì)胞的產(chǎn)生,已在流行病學(xué)、細(xì)胞培養(yǎng)、動物研究和臨床試驗中得到證實[1-2]。高EGCG茶在市場上倍受青睞,EGCG的含量已成為衡量茶葉價格的重要因素。然而,茶葉是EGCG唯一的來源,EGCG無法通過人工合成[3]。因此,篩選出高EGCG含量的茶樹品種具有重要意義。

        目前,茶葉中的EGCG含量檢測主要采用高效液相色譜法(High Performance Liquid Chromatography, HPLC)[4-5]。雖然檢測精度高但存在操作過程繁瑣、檢測周期長、破壞性和成本較高等問題,無法滿足高EGCG茶樹育種過程中大規(guī)模測量。近年來,光譜檢測技術(shù)因具有快速、無損的優(yōu)點在農(nóng)產(chǎn)品品質(zhì)高通量檢測中表現(xiàn)出巨大的應(yīng)用前景。Lee等[6]利用近紅外光譜技術(shù)對綠茶鮮葉中的咖啡因、ECG和EGCG等9種品質(zhì)指標(biāo)進(jìn)行檢測,預(yù)測模型精度大于0.9。Huang等[7]利用可見—近紅外光譜技術(shù)研究了新鮮綠茶中的兒茶素和咖啡因,建立的多元線性回歸定量模型得到相關(guān)系數(shù)均大于0.893。董春旺等[8]通過近紅外光譜對紅茶發(fā)酵過程中品質(zhì)指標(biāo)進(jìn)行檢測,建立了支持向量機(jī)(SVR)模型,能夠較好地反演出紅茶中茶紅素、茶褐素、兒茶素和酚氨比的含量。趙杰文等[9]應(yīng)用傅里葉近紅外漫反射光譜檢測茶葉中兒茶素含量,建立了偏最小二乘法的定量分析模型,相關(guān)系數(shù)大于0.97。Luypaert等[10]利用近紅外光譜技術(shù)對綠茶中EGCG和EC兩種單體的含量進(jìn)行定量分析,模型對EGCG和EC的相關(guān)系數(shù)分別可達(dá)0.83和0.44。Li等[11]提取了茶葉的可見近紅外光譜反射率,結(jié)合區(qū)間偏最小二乘法建立了茶多酚預(yù)測模型,相關(guān)系數(shù)為0.916 3。上述對茶多酚或兒茶素單體的研究雖然取得較好的效果,但所選用的樣本所含的茶多酚或兒茶素單體濃度較低,模型無法適用于高EGCG茶樹品種的篩選。

        鑒于上述研究,有必要研究基于光譜技術(shù)的高EGCG茶樹品種識別模型。因此,本文以高/低EGCG茶樹品種的葉片為研究對象,利用近紅外高光譜技術(shù)探究高/低EGCG含量茶樹品種葉片的光譜特性,結(jié)合化學(xué)計量法建立高EGCG含量茶樹葉片的識別模型,研究結(jié)果可為高EGCG茶樹高通量育種提供技術(shù)支持。

        1 材料與方法

        1.1 試驗樣本

        供本次研究的2個茶樹品種分別為高EGCG含量的W1茶樹和低EGCG含量的Huangdan,其中W1和Huangdan茶樹均由福建農(nóng)林大學(xué)農(nóng)產(chǎn)品品質(zhì)研究所培育。茶樹種植于福建農(nóng)林大學(xué)農(nóng)產(chǎn)品品質(zhì)研究所試驗茶園內(nèi)。茶葉采摘于2020年9月14日。采摘時,摘取嫩梢上一芽四葉,W1和Huangdan的葉片各396片。本次試驗共得到792片作為研究對象。如圖1所示,高(W1)和低(Huangdan)EGCG含量茶樹品種的葉片無法通過肉眼進(jìn)行有效地區(qū)分。

        圖1 代表性高EGCG茶樹品種(W1)和低EGCG茶樹品種(Huangdan)葉片

        1.2 茶葉近紅外光譜反射率采集

        本次試驗采用NIRez-G1近紅外光譜儀獲取W1號和Huangdan茶樹葉片的近紅外光譜反射率。儀器的光譜波長范圍為950~1 650 nm,光譜分辨率為10 nm。在茶葉的近紅外光譜反射率采集前,先獲取暗電流和參考板的光譜數(shù)據(jù),用于數(shù)據(jù)處理前對茶葉原始光譜的校正。首先,采用近紅外光譜儀采集標(biāo)準(zhǔn)白板(HIS—CT—250×280)上3個不同位置光譜,求平均值,記為W。隨后用黑色不透光的塑料圓盤遮住采樣口,采集3次光譜,求平均值,記為B。為了盡可能地獲取更多茶葉表面的光譜信息,在試驗過程中采集葉片上3個不同的位置,求平均值作為該樣本的原始光譜數(shù)據(jù)。隨后采用式(1)對茶葉的光譜進(jìn)行校正,求得反射率。

        Rc=(Dc-B)/(W-B)

        (1)

        式中:Rc——茶葉的光譜反射率;

        Dc——茶葉的原始光譜;

        W——標(biāo)準(zhǔn)白板的原始光譜;

        B——暗電流的原始光譜。

        1.3 茶葉EGCG含量測定

        光譜數(shù)據(jù)采集完后,分別選取W1和Huangdan葉片各45片用于EGCG含量測定。每3片當(dāng)成1個樣本,每個品種分別取15個,共30個。樣品前處理過程如下:將茶鮮葉放置于120 ℃烘箱中殺青6 min,隨后在90 ℃條件下烘干至恒重。具體方法參考GB/T 8313—2018進(jìn)行測量。

        1.4 識別模型構(gòu)建

        1.4.1 主成分分析

        主成分分析(Principal Component Analysis,PCA)是通過正交變換將一組可能存在相關(guān)的變量轉(zhuǎn)化為一組線性不相關(guān)的變量[12-13]。PCA通過將原始數(shù)據(jù)降維,消除眾多信息共存中相互重疊的信息部分,使得數(shù)目較少的新變量成為原變量的線性組合且能最大限度的表征原變量的數(shù)據(jù)結(jié)構(gòu)特征。將分析主成分得分向量繪制成二維或三維散點圖可實現(xiàn)不同類別樣本聚類趨勢的定性分析。

        1.4.2 敏感波段的選擇

        高光譜的數(shù)據(jù)維度高,易出現(xiàn)冗余和共線性等問題。為了簡化模型以及提高模型運(yùn)算效率,需要從全波長中篩選出對EGCG敏感的波段。本研究選用RF(Random Frog)算法對EGCG敏感波段進(jìn)行提取。RF算法通過少數(shù)變量進(jìn)行建模,從而輸出每個變量被選取的概率。首先,初始化包含Q個變量的子集V0。其次,計算出包含Q*個變量的候選變量子集V*,然后選擇V*作為V1來代替原始變量的子集V0,接著迭代N次直到終止。最后,輸出每個變量被選取的概率[14]。變量被選取的概率越大說明其對EGCG越敏感。

        1.4.3 識別模型

        識別模型的性能直接影響著高EGCG含量茶樹葉片的識別效果。本文分別對比線性判別分析(Linear Discriminant Analysis,LDA)和最小二乘支持向量機(jī)(Least Support Vector Machine,LS-SVM)兩種機(jī)器學(xué)習(xí)方法對高EGCG含量茶樹葉片的識別效果。

        LDA是將高維空間的樣本映射到低維空間,以期實現(xiàn)提取有效的分類信息并對數(shù)據(jù)降維,以此同時確保映射到低維空間的樣本具有最小的類內(nèi)距離以及最大的類間距離,具備最優(yōu)的可分離性[15]。LS-SVM是在傳統(tǒng)SVM的基礎(chǔ)上,采取最小二乘線性系統(tǒng)作為損失函數(shù),通過求解線性方程式來取代標(biāo)準(zhǔn)SVM的凸二次規(guī)劃求解,從而加快模型運(yùn)算效率[16]。本文選取徑向基(Radial Basis Function,RBF)作為LS-SVM的核函數(shù)。采用網(wǎng)格搜索算法和交叉驗證(Cross Validation,CV)相結(jié)合實現(xiàn)模型的兩個主要參數(shù)γ和sig2(σ2)的尋優(yōu)。在分類過程中,把W1茶樹葉片和Huangdan茶樹葉片的標(biāo)簽分別賦值為“1”和“2”。采用KS(Kennard-Stone)算法將茶葉樣品按照2∶1的比例分成建模集和預(yù)測集[17]。

        1.4.4 模型篩選效果的評估指標(biāo)

        識別模型的性能利用識別正確率Accuracy、漏判率、誤判率和Kappa系數(shù)4個參數(shù)進(jìn)行評估[18]。模型將高EGCG茶樹品種(W1)判別成低EGCG茶樹品種(Huangdan)稱為漏判率,反之則稱為誤判。Accuracy的計算公式為

        Accuracy=(n1/n2)×100%

        (2)

        式中:n1——預(yù)測正確的預(yù)測集樣本數(shù);

        n2——預(yù)測集樣本總數(shù)。

        在混淆矩陣的基礎(chǔ)上計算Kappa系數(shù),如式(3)所示。

        Kappa=(po-pe)/(1-pe)

        (3)

        式中:po——每類被正確分類樣本數(shù)量之和與該樣本總數(shù)量的比值。

        每一類的真實樣本個數(shù)分別為a1,a2,…,ac,而預(yù)測結(jié)果中的每一類的樣本個數(shù)分別為b1,b2,…,bc,總樣本個數(shù)為n,則pe為

        pe=(a1×b1+a2×b2+…+ac×bc)/(n×n)

        (4)

        當(dāng)Kappa=0.0~0.2,表示預(yù)測與真實的一致性極低;當(dāng)Kappa=0.21~0.40,表示預(yù)測與真實的一致性一般;當(dāng)Kappa=0.41~0.60,表示預(yù)測與真實的一致性中等;當(dāng)Kappa=0.61~0.80表示預(yù)測與真實的一致性較好;當(dāng)Kappa=0.81~1.0,表示預(yù)測與真實的一致性幾乎一致[19]。

        本文涉及到的光譜數(shù)據(jù)處理在MATLAB R2014a、Unscrambler10.1和EXCEL2010中完成。

        2 結(jié)果與分析

        2.1 茶葉EGCG濃度統(tǒng)計分析

        W1和Huangdan葉片中的EGCG含量如圖2所示。W1茶樹葉片中的EGCG含量(13.68±1.99)%明顯高于Huangdan(4.86±1.17)%,相差2.81倍。單因素方差分析結(jié)果表明兩者達(dá)到顯著性差異(P=2.75×10-6<0.05)。將EGCG含量大于10%的茶樹品種稱為高EGCG含量茶樹品種[20]。因此,本研究選用的茶樹W1和Huangdan可分別視為高/低EGCG含量茶樹品種,這為下文建立高EGCG含量茶葉品種識別模型提供參考。

        圖2 W1茶樹和Huangdan葉片中的EGCG含量

        2.2 平均光譜曲線

        高EGCG含量茶樹(W1)和低EGCG含量茶樹(Huangdan)葉片的平均光譜反射率如圖3所示。

        圖3 高EGCG含量茶樹(W1)和低EGCG含量的茶樹(Huangdan)葉片的平均光譜曲線

        由圖3可知,兩種茶樹葉片的光譜曲線趨勢大致相似,具有相似的吸收峰,說明其所含的主要成分相似。進(jìn)一步分析可知,W1葉片的近紅外光譜反射率低于Huangdan葉片,這可能與W1和Huangdan葉片中某些成分的含量存在差異有關(guān)。1 100~1 650 nm的反射率反映了樣品中有機(jī)物含氫基團(tuán)(C—H、O—H、N—H)的彎曲振動或倍頻伸縮振動信息。在1 100~1 420 nm 范圍內(nèi)光譜反射率與CH3或CH2的C—H鍵伸縮振動的一級倍頻及組合頻有關(guān),在1 400~1 550 nm 的吸收峰主要由O—H鍵、C—H鍵以及N—H鍵伸縮或彎曲振動引起;在1 600~1 650 nm范圍內(nèi)的光譜反射率發(fā)生變化主要是與C—H鍵的一級倍頻振動伸縮振動有關(guān)[21]。兒茶素單體的分子結(jié)構(gòu)中含有許多碳?xì)浠鶊F(tuán),因此,在1 100~1 650 nm范圍內(nèi)可能含有與兒茶素單體相關(guān)的化學(xué)信息[22]。W1茶樹和Huangdan葉片的光譜反射率在這些光譜范圍內(nèi)存在差異。因此,有望依據(jù)光譜特性建立高EGCG含量茶樹品種識別模型。

        2.3 主成分分析

        圖4(a)顯示了前7個主成分對原始變量的解釋程度。前四個主成分累計貢獻(xiàn)率達(dá)99.92%,能夠解釋原始數(shù)據(jù)絕大部分信息。其中,PC1、PC2、PC3和PC4的貢獻(xiàn)率分別為95.4%、4.2%、0.19%和0.057%。由于PC1和PC2的貢獻(xiàn)率已經(jīng)大于99%,因此將有必要進(jìn)一步分析PC1和PC2的得分。

        (a) 前7個主成分累積方程貢獻(xiàn)率

        由圖4(b)可知,高EGCG茶樹葉片和低EGCG茶樹葉片在PC1和PC2得分分布圖上具有聚成兩類的趨勢,但是仍然也存在重疊的地方。因此,需要對光譜數(shù)據(jù)進(jìn)行進(jìn)一步分析和處理以期獲得更好的區(qū)分結(jié)果。

        2.4 敏感波段的篩選

        簡化數(shù)據(jù)維度,提高模型運(yùn)算速度,優(yōu)化篩選模型有助于在茶樹育種過程中更加有效地篩選出高EGCG含量茶樹品種。因此,有必要從原始的228個變量中提取出EGCG含量敏感波段?;赗F算法求解出的各個波段對EGCG的敏感性如圖5(a)所示。由圖5(a)可知,對EGCG敏感性較高的波段主要集中在1 100~1 650 nm范圍內(nèi),這與圖3分析的結(jié)論相一致。合理的敏感波段數(shù)量有利于減少數(shù)據(jù)維度以及簡化篩選模型,因此有必要按照最終識別模型的識別效果來設(shè)置最優(yōu)的選取概率的閾值,從而獲取相應(yīng)的敏感波段作為識別模型的輸入變量。

        (a) 不同波段的選擇概率

        本文采用閾值為25%,取前35個概率較大的敏感波段進(jìn)行分析,分別為(1 610,1 650,1 341,1 647,1 615,1 380,1 582,1 607,1 618,1 377,1 403,1 612,1 374,1 331,1 645,1 465,1 325,1 078,1 383,1 577,1 282,1 604,1 328,1 344,1 124,1 401,1 398,1 134,1 334,1 273,1 602,1 634,1 627,1 585和1 368 nm),分布情況如圖5(b)所示。

        2.5 高EGCG含量茶樹品種模型的識別效果分析

        不同輸入變量下LS-SVM和LDA模型對高/低EGCG茶樹品種的識別效果如圖6所示。從圖6可以看出,當(dāng)輸入變量的數(shù)量小于等于3時,LS-SVM和LDA的識別效果均不理想。隨著輸入變量的數(shù)量增多,兩個模型的識別準(zhǔn)確率逐步上升,這說明增加敏感波段的數(shù)量有助于提升高EGCG茶樹品種的識別效果??傮w來看,LS-SVM模型的識別準(zhǔn)確率均優(yōu)于LDA模型。當(dāng)敏感波段數(shù)量為20個時,LS-SVM模型的總體準(zhǔn)確率為93.94%大于LDA模型(90.90%)。但是當(dāng)敏感波段數(shù)量大于20個時,隨著輸入變量的逐漸增多,LS-SVM 和LDA模型的總體識別準(zhǔn)確率保持相對平穩(wěn),說明增加的敏感波段并沒有顯著增加對樣本的描述性信息。綜上所述,在相同的輸入變量,LS-SVM算法更適合用來構(gòu)建高EGCG茶樹品種的識別模型。

        圖6 不同數(shù)量的敏感波段對LS-SVM和LDA模型識別效果影響

        僅根據(jù)總體準(zhǔn)確率來評估LS-SVM和LDA模型的識別性能還不夠,需要進(jìn)一步分析兩個模型的混淆矩陣及Kappa系數(shù)。當(dāng)敏感波段為20個時,LS-SVM和LDA對高/低EGCG茶樹品種的識別結(jié)果如表1所示。從表1可以看出,LS-SVM篩選模型建模集和預(yù)測集的總體準(zhǔn)確率分別為94.32%和93.94%。其預(yù)測集的漏判率、誤判率、Kappa系數(shù)分別為8.63%、3.20%和0.89。其中,12個高EGCG茶樹品種的葉片被漏判成低EGCG茶樹葉片。LS-SVM模型的Kappa系數(shù)均大于0.81表明利用機(jī)器學(xué)習(xí)方法識別出高EGCG茶樹品種與實際高EGCG茶樹品種幾乎完全一致。相比之下,LDA識別模型建模集和預(yù)測集總體準(zhǔn)確率分別為86.17%和90.90%,出現(xiàn)了過擬合的現(xiàn)象。LDA模型預(yù)測集的漏判率為7.26%,誤判率為10.71%,Kappa系數(shù)為0.83。9個高EGCG茶樹品種的葉片被漏判成低EGCG茶樹品種葉片。上述結(jié)果表明,在茶樹育種過程中,RF算法結(jié)合 LS-SVM 構(gòu)建的模型具有快速實現(xiàn)高EGCG茶樹品種初篩的能力。

        表1 LS-SVM和LDA模型對高/低EGCG茶樹葉片的識別結(jié)果Tab. 1 Discriminant results of high/low EGCG tea varieties with LS-SVM and LDA models

        3 結(jié)論

        1) 本文采用高效液相色譜法(HPLC)測定W1和Huangdan葉片中的EGCG含量,得出W1茶樹葉片中的EGCG含量(13.68±1.99)%明顯高于Huangdan(4.86±1.17)%,相差2.81倍。單因素方差分析結(jié)果表明兩者達(dá)到顯著性差異,這為建立高EGCG含量茶葉品種識別模型提供參考。

        2) 對比分析了高/低EGCG茶樹葉片的光譜反射率,主成分分析后樣本的第一主成分(PC1)和第二主成分(PC2)的累計方差貢獻(xiàn)率為99.6%,對應(yīng)的得分對高/低EGCG含量茶樹葉片具有較好的聚類作用,但是仍然也存在重疊的地方。

        3) 利用Random Frog算法選取的前20個敏感波段結(jié)合LS-SVM建立的識別模型能夠有效實現(xiàn)高EGCG含量茶樹葉片的識別,LS-SVM模型的建模集總體準(zhǔn)確率為94.32%,Kappa系數(shù)為0.89,預(yù)測集總體準(zhǔn)確率為93.94%,Kappa系數(shù)為0.89。表明利用機(jī)器學(xué)習(xí)方法識別出高EGCG茶樹品種與實際高EGCG茶樹品種幾乎完全一致。

        4) 采用近紅外高光譜技術(shù)結(jié)合化學(xué)計量學(xué)分析方法具有快速識別高EGCG茶樹品種能力,研究結(jié)果為篩選出高EGCG含量茶樹品種提供新方法和技術(shù)指導(dǎo)。

        猜你喜歡
        反射率波段茶樹
        春日暖陽
        影響Mini LED板油墨層反射率的因素
        近岸水體異源遙感反射率產(chǎn)品的融合方法研究
        海洋通報(2022年4期)2022-10-10 07:40:26
        具有顏色恒常性的光譜反射率重建
        山茶樹變身搖錢樹
        化學(xué)腐蝕硅表面結(jié)構(gòu)反射率影響因素的研究*
        電子器件(2017年2期)2017-04-25 08:58:37
        M87的多波段輻射過程及其能譜擬合
        兩個推薦茶樹品種
        茶樹灣
        日常維護(hù)對L 波段雷達(dá)的重要性
        西藏科技(2015年4期)2015-09-26 12:12:58
        99re免费在线视频| 国产精品久久久久久福利| 精品国产一区二区三区av片| 爽妇网国产精品| 亚洲av国产大片在线观看| 在线精品国产亚洲av麻豆| 欧美人妻aⅴ中文字幕| 欧美日韩中文国产一区| 黄 色 成 年 人 网 站免费| 国产精品美女主播一区二区| 天天做天天爱夜夜爽| 亚洲av无码精品色午夜蛋壳| 白白色发布在线播放国产| 丝袜美腿一区在线观看| 精品福利一区二区三区免费视频| 人妻 日韩精品 中文字幕| 国产午夜激无码AV毛片不卡| 日本国产一区二区在线| 日韩日韩日韩日韩日韩| 国内揄拍国内精品少妇国语| 国产午夜av一区二区三区| 国产三级精品三级男人的天堂| 精品国产性色无码av网站| 亚洲av无码成人精品区天堂 | 久久久精品人妻一区二区三区蜜桃| av无码精品一区二区乱子| 日韩精品人妻一区二区三区蜜桃臀| 精品精品国产高清a毛片| 国产老熟女狂叫对白| 久久aⅴ无码av高潮AV喷| 少妇高潮精品在线观看| 免费a级毛片无码av| 四虎精品影视| 一区二区三区黄色一级片| 天天躁夜夜躁狠狠是什么心态| 亚洲∧v久久久无码精品| 国产综合精品久久久久成人| 在线观看国产视频午夜| 亚洲精品美女久久久久久久| 色www亚洲| 男女互舔动态视频在线观看|