亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于高光譜成像技術(shù)的白茶儲(chǔ)藏年份判別

        2021-09-29 14:17:02陳書媛張友超蔡梅生張青碧何普明屠幼英
        食品工業(yè)科技 2021年18期
        關(guān)鍵詞:白茶儲(chǔ)藏年份

        陳書媛,張友超,楊 杰,蔡梅生,張青碧,何普明, ,屠幼英

        (1.浙江大學(xué)茶學(xué)系,浙江杭州 310058;2.浙江大學(xué)農(nóng)業(yè)工程系,浙江杭州 310058;3.福鼎市茶業(yè)發(fā)展領(lǐng)導(dǎo)小組,福建福鼎 355200;4.福鼎市茶業(yè)管理局,福建福鼎 355200)

        白茶是我國六大茶類之一,主要產(chǎn)區(qū)在福建福鼎、政和、松溪、建陽、云南景谷等地。根據(jù)原料的嫩度不同,白茶可分為白毫銀針、白牡丹、壽眉和貢眉。萎凋和干燥這兩道工序形成了白茶獨(dú)特的品質(zhì)特征和生物活性。研究表明,白茶具有許多強(qiáng)大的生物活性,包括抗氧化、抗炎、抗癌、抗菌和神經(jīng)保護(hù)活性[1?5]。而在茶葉銷售市場(chǎng)中,長期儲(chǔ)存的白茶更受到廣大消費(fèi)者的喜愛和追捧,有著“一年茶,三年藥,七年寶”的說法。有研究表明[6],白茶在儲(chǔ)藏過程中,其化學(xué)品質(zhì)成分會(huì)發(fā)生改變,與新白茶相比,儲(chǔ)藏白茶的醇含量更低,碳?xì)浠衔锖扛?。Ning等[7]發(fā)現(xiàn)兒茶素和氨基酸的含量隨著儲(chǔ)藏年份的延長呈相似的下降趨勢(shì),而沒食子酸的含量則增加。相比之下,由茶氨酸和兒茶素在儲(chǔ)藏過程中形成的7種新化合物8-C-N-乙基-2-吡咯烷酮(8-C N-ethyl-2-pyrrolidi-none-substituted flavan-3-ols,EPSFs)取代黃烷-3-醇顯著增加,其含量與儲(chǔ)藏年份呈正相關(guān)[8]。隨著消費(fèi)者對(duì)儲(chǔ)藏白茶的喜愛的增加,市面上也出現(xiàn)了儲(chǔ)藏年份造假的現(xiàn)象,但當(dāng)下關(guān)于白茶儲(chǔ)藏年份預(yù)測(cè)的研究報(bào)道極少。Dongchao Xie等[9]對(duì)白茶中24種儲(chǔ)藏相關(guān)化合物進(jìn)行了絕對(duì)定量分析和線性回歸,分析表明基于EPSFs的5個(gè)指標(biāo)組合對(duì)白茶儲(chǔ)藏年份具有較好的判別能力,其中模型和測(cè)試集的相關(guān)系數(shù)分別為0.9294和0.8812。該模型對(duì)于儲(chǔ)藏年份小于10年的白茶,預(yù)測(cè)和實(shí)際儲(chǔ)藏年份之間的誤差在?1.75~1.84年之間,尚不能滿足快速精確判別白茶年份的需求。

        光譜技術(shù)的發(fā)展為快速、準(zhǔn)確地進(jìn)行茶葉品控檢測(cè)提供了基礎(chǔ),近年來較多研究集中在近紅外光譜技術(shù)在茶葉領(lǐng)域中的應(yīng)用。劉鵬[10]提出采用局部線性嵌入法和拉普拉斯特征映射法對(duì)近紅外光譜數(shù)據(jù)進(jìn)行非線形流形降維處理,從而提高不同海拔茶葉品質(zhì)的鑒別精度。Wang等[11]利用微型近紅外光譜儀預(yù)測(cè)了紅綠茶的判別模型,基于標(biāo)準(zhǔn)正態(tài)變量的支持向量機(jī)模型對(duì)兩類茶葉中的兒茶素和咖啡因都有較高的判別能力。劉洪林等[12]對(duì)利用近紅外光譜技術(shù)結(jié)合感官審評(píng)結(jié)果建立多個(gè)預(yù)測(cè)模型,其預(yù)測(cè)性能優(yōu),為客觀評(píng)價(jià)功夫紅品質(zhì)提出新方法。李春霖[13]采用化學(xué)計(jì)量方法和近紅外光譜技術(shù)對(duì)龍井茶的感官和化學(xué)品質(zhì)評(píng)價(jià)進(jìn)行了系統(tǒng)性研究,建立龍井茶鮮味和澀味的定性預(yù)測(cè)模型,預(yù)測(cè)準(zhǔn)確率達(dá)75.18%。

        相較于近紅外光譜技術(shù),高光譜成像技術(shù)是一種更高效、無損的檢測(cè)技術(shù)。近紅外光譜技術(shù)對(duì)待檢測(cè)的樣本有一定的要求,例如磨碎過篩,而高光譜成像技術(shù)則不需要。并且高光譜成像技術(shù)是成像技術(shù)和光譜技術(shù)的結(jié)合體,故可以同時(shí)獲得待測(cè)樣品的光譜信息和空間信息,以此檢測(cè)樣品的內(nèi)外品質(zhì)。目前高光譜成像技術(shù)在茶葉領(lǐng)域的研究主要集中在茶葉等級(jí)判別和茶類判別。于英杰等[14]利用高光譜技術(shù)對(duì)不同等級(jí)的鐵觀音進(jìn)行判別,結(jié)合支持向量機(jī)的模型對(duì)未知的鐵觀音茶樣正確判別率可達(dá)92.86%。李曉麗等[15]結(jié)合高光譜成像儀和高效液相色譜法,建立光譜與表沒食子兒茶素沒食子酸酯(epigallocatechin gallate,EGCG)濃度之間的回歸模型,其最優(yōu)回歸模型的決定系數(shù)達(dá)到0.905。李瑤等[16]以蒙頂黃芽、竹葉青、甘露茶葉為實(shí)驗(yàn)對(duì)象,利用高光譜成像技術(shù)結(jié)合支持向量機(jī)建立茶葉品種判別模型和茶葉等級(jí)判別模型,其精確率分別達(dá)到了100%和96.67%。Guangxin Ren等[17]利用近紅外高光譜成像結(jié)合多決策樹的方法,對(duì)祁門工夫紅茶進(jìn)行了品質(zhì)和等級(jí)判別,比較了三種不同類型的監(jiān)督?jīng)Q策樹算法,其中基于數(shù)據(jù)融合的細(xì)樹(fine tree, FT)模型預(yù)測(cè)效果最好,紅茶品質(zhì)的評(píng)價(jià)正確率達(dá)到93.13%。Zhiqi Hong等[18]采用380~1030和874~1734 nm兩個(gè)光譜范圍的高光譜成像系統(tǒng)對(duì)6個(gè)產(chǎn)地的龍井茶單葉進(jìn)行了產(chǎn)地判別,建立了支持向量機(jī)和偏最小二乘判別分析模型,在兩個(gè)光譜范圍內(nèi)均獲得了良好的分類性能,校正集和預(yù)測(cè)集的總體分類精確率均在84%以上。

        鑒于白茶儲(chǔ)藏年份判別的研究報(bào)道較少以及高光譜成像技術(shù)的優(yōu)點(diǎn),本文探討高光譜成像技術(shù)在白茶儲(chǔ)藏年份判別中的應(yīng)用,在450~998 nm光譜范圍采集白茶的高光譜圖像并建模分析,嘗試為白茶儲(chǔ)藏年份快速檢測(cè)提供理論基礎(chǔ)。

        1 材料與方法

        1.1 材料與儀器

        實(shí)驗(yàn)樣本 均來自福建省福鼎市(北緯26°52′~27°26′,東經(jīng)119°55′~120°43′)12家茶葉企業(yè)。選取的白茶樣本等級(jí)均為壽眉,原料品種均為福鼎大毫。實(shí)驗(yàn)樣本的儲(chǔ)藏條件與白茶的一般儲(chǔ)藏條件基本一致,實(shí)驗(yàn)前樣本均儲(chǔ)藏在室溫25 ℃,通風(fēng)干燥的茶葉儲(chǔ)藏室中。在實(shí)驗(yàn)當(dāng)月2020年8月,將生產(chǎn)日期在2017年5月~10月、2014年5月~10月、2010年5月~10月的樣本儲(chǔ)藏時(shí)間分別歸為3、6、10年,樣本數(shù)量分別為160、156、148,每份樣本約為15 g。

        Q285成像光譜儀 來自德國品牌Cubert;AZD100鹵素?zé)?來自德國品牌Osram。為避免圖像采集時(shí)環(huán)境光的干擾:4個(gè)75 W鹵素?zé)魧?duì)稱安裝在暗箱側(cè)部,保證整個(gè)視場(chǎng)光照均勻,電控升降臺(tái)安裝在暗箱底部。成像光譜儀通過網(wǎng)線與計(jì)算機(jī)相連,以控制數(shù)據(jù)的采集和傳輸[19?20]。Q285采用能在千分之一秒內(nèi)獲得樣本高光譜圖像立方體數(shù)據(jù)的畫幅式成像技術(shù),相比于傳統(tǒng)的推掃式成像技術(shù),不需要配備電動(dòng)位移平臺(tái),其數(shù)據(jù)采集過程更加快速、穩(wěn)定。Q285的主要技術(shù)參數(shù)如下:光譜范圍為450~998 nm,采樣間隔4 nm,通道125,鏡頭焦距23 nm,像素分辨率1000×1000,數(shù)字分辨率14 bit。

        1.2 光譜采集

        采集高光譜圖像前的準(zhǔn)備工作:實(shí)驗(yàn)前30 min打開光源進(jìn)行預(yù)熱,將壽眉樣本均勻平鋪在直徑150 mm、高度20 mm的培養(yǎng)皿中,培養(yǎng)皿預(yù)先內(nèi)置反射率近似為零的黑色橡膠,以免影響實(shí)驗(yàn)數(shù)據(jù)。

        打開高光譜圖像采集軟件的操作界面,采集壽眉樣本的高光譜圖像。使用HSI Analyzer(ISUZU optics,中國臺(tái)灣)軟件對(duì)高光譜圖像進(jìn)行白板與暗電流校正。然后,利用ENVI 5.1(Exelis VIS,美國)軟件分析壽眉的光譜特征,確定分割閾值,將背景置0,并使用Spectral Python 0.21,scikit-learn 0.23.1,numpy 1.18.1,pandas 1.0.3做后續(xù)光譜數(shù)據(jù)分析。

        1.3 數(shù)據(jù)處理

        1.3.1 光譜提取和樣本劃分 由于壽眉樣本等級(jí)基本一致,且葉梗芽隨機(jī)分布,顏色花雜,故高光譜采集到的圖像數(shù)據(jù)對(duì)壽眉分類并無實(shí)際意義,本文只分析光譜數(shù)據(jù)。高光譜圖像在采集過程中會(huì)受到多種因素的干擾,因此高光譜圖像的去噪尤為重要[21]。為了盡可能保留光譜的主要特征,同時(shí)又能去除光譜中的噪音,本文采用數(shù)學(xué)形態(tài)學(xué)中的二值形態(tài)學(xué)對(duì)采集到的壽眉樣本圖像進(jìn)行降噪處理,利用開運(yùn)算和閉運(yùn)算將圖像上孤立的小點(diǎn)和毛刺去掉,填平小孔,并保持總體的位置和形狀不變。

        因?yàn)閴勖紭颖镜牟煌课?,如梗、葉、芽所含的內(nèi)含物質(zhì)成分差異明顯,故每個(gè)像素點(diǎn)之間的光譜數(shù)據(jù)差異較大。為解決這一問題,如圖1所示,本文采用的方法是在樣本區(qū)域內(nèi)隨機(jī)選取100個(gè)20×20像素的感興趣區(qū)域(Region of Interest, ROI),其中一個(gè)像素點(diǎn)包含一條光譜信息,再計(jì)算ROI內(nèi)所有像素點(diǎn)的平均光譜作為建立模型的光譜數(shù)據(jù)進(jìn)行下一步分析。

        圖 1 壽眉樣本高光譜圖像數(shù)據(jù)采集示意圖Fig.1 Sketch of data acquisition

        為了防止同一個(gè)樣本的方塊數(shù)據(jù)點(diǎn)同時(shí)出現(xiàn)在訓(xùn)練集和測(cè)試集,本實(shí)驗(yàn)以每個(gè)壽眉樣本的100個(gè)ROI作為一個(gè)單位進(jìn)行判別分析。本次實(shí)驗(yàn)一共464個(gè)壽眉樣本,共采集到46400個(gè)ROI,464個(gè)數(shù)據(jù)組。為了防止訓(xùn)練集過擬合,同時(shí)防止因?yàn)橛?xùn)練集測(cè)試集劃分引起的精確率的誤差,本文采用5折交叉驗(yàn)證法以增強(qiáng)模型的泛化能力,即進(jìn)行5次隨機(jī)劃分,最后取各次結(jié)果平均值來評(píng)估模型效果。每一次都采用隨機(jī)挑選法選取371個(gè)數(shù)據(jù)組作為訓(xùn)練集,剩余93個(gè)數(shù)據(jù)組作為測(cè)試集。

        1.3.2 四種預(yù)處理方法 因?yàn)殡娫胍?、光散射、基線漂移、光程變化等因素的干擾強(qiáng)度較大,還需要對(duì)光譜數(shù)據(jù)做必要的預(yù)處理。本文采用4種光譜預(yù)處理算法:最小二乘平滑濾波(Savitzky-Golay Filter,SGF)、歸一化(MinmaxScaler,Minmax)、多元散射校正(Multiplicative Scatter Correction,MSC)、標(biāo)準(zhǔn)正態(tài)變換(Standard Normal Variate,SNV)。后續(xù)實(shí)驗(yàn)分別建立不同預(yù)處理后的光譜與儲(chǔ)藏時(shí)間的不同判別模型,通過對(duì)比不同預(yù)處理后的建模結(jié)果,確定最佳處理組合。

        1.3.2.1 最小二乘平滑濾波(SGF) Savitzky-Golay濾波器廣泛地運(yùn)用于數(shù)據(jù)平滑去噪,是一種基于局域多項(xiàng)式最小二乘法擬合的濾波方法,其最大特點(diǎn)在于去除噪聲的同時(shí)可以保留信號(hào)的形狀、寬度不變[22]。該方法應(yīng)用于光譜數(shù)據(jù)的主要作用是消除隨機(jī)噪聲,提高信噪比。

        1.3.2.2 標(biāo)準(zhǔn)正態(tài)變換(SNV) 粒子大小、散射和多重共線性是漫反射光譜分析中長期存在的問題。這些效應(yīng)的乘性組合是阻礙解釋漫反射光譜的主要因素。樣品粒子大小是影響方差的主要因素,而由化學(xué)成分引起的方差很小。SNV可有效地消除散射、粒徑的乘性干擾和多重共線性[23]。該算法處理光譜數(shù)據(jù)的基本思想是:假設(shè)每一條光譜中各波長點(diǎn)的反射強(qiáng)度應(yīng)符合正態(tài)分布,再對(duì)每一條原始光譜數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)正態(tài)化處理使得校正后的光譜數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為1。具體如以下公式:

        式中:x是原始光譜數(shù)據(jù);x′是經(jīng)過標(biāo)準(zhǔn)正態(tài)變換后的光譜數(shù)據(jù);μ為平均值;σ為原始光譜數(shù)據(jù)的標(biāo)準(zhǔn)偏差。

        1.3.2.3 歸一化(Minmax) Minmax的原理與SNV相似,目的都是為了方便處理數(shù)據(jù),使得整個(gè)數(shù)據(jù)分布更加均勻,且兩者都能使模型運(yùn)行時(shí)的收斂速度加快[24]。Minmax與SNV的區(qū)別在于,Minmax是將訓(xùn)練集中某一列數(shù)值特征(假設(shè)是第i列)的值縮放到0到1之間或者?1到1,從而降低特異樣本數(shù)據(jù)導(dǎo)致的不良影響。計(jì)算公式如下:

        式中:x′′是經(jīng)過Minmax變換后的光譜數(shù)據(jù);xi是 第i列的任一原始光譜數(shù)據(jù);m ax(xi)是該列中最大值;m in(xi)是最小值。

        1.3.2.4 多元散射校正(MSC) MSC主要用來消除固體顆粒大小、表面散射對(duì)漫反射的影響。多元散射校正通過校正每個(gè)光譜的散射來消除顆粒分布不均勻及顆粒大小產(chǎn)生的影響,增強(qiáng)了與成分含量相關(guān)的光譜吸收信息[25]。廣泛應(yīng)用于固體漫反射光譜。使用該方法的前提是建立一個(gè)待測(cè)樣品的“理想光譜”,而實(shí)際上并不存在“理想光譜”。該光譜的特點(diǎn)是樣品中的成分含量與其滿足線性關(guān)系,然后將該光譜作為標(biāo)準(zhǔn)對(duì)其他樣品的光譜進(jìn)行修正,其中包括基線平移和偏移校正。在實(shí)際應(yīng)用中,經(jīng)常將所有光譜的平均光譜視為一個(gè)理想的標(biāo)準(zhǔn)光譜。

        1.3.3 三種判別模型 本文通過混淆矩陣、精確率、召回率對(duì)建立的模型進(jìn)行評(píng)估。以最簡(jiǎn)單的二分類問題為例,預(yù)測(cè)結(jié)果可分為四類,分別是:原本為正例的樣本被預(yù)測(cè)為正類(True Positive, TP)或負(fù)類(False Negative, FN),原本為負(fù)例樣本被預(yù)測(cè)為負(fù)類(True Negative, TN)或正類(False Positive, FP)。精確率是針對(duì)總體預(yù)測(cè)結(jié)果而言的,它表示的是所有預(yù)測(cè)正確的樣本占總觀測(cè)值的比重,若用P表示精確率(Precision),則:

        而召回率是針對(duì)原來的樣本而言的,它表示的是樣本中的正例被預(yù)測(cè)正確的比例,若用R表示召回率(Recall),則:

        1.3.3.1 支持向量機(jī) 支持向量機(jī)(Support vector machine,SVM)是將低維空間線性不可分的數(shù)據(jù)映射到高維,利用支持向量用來尋找一個(gè)最優(yōu)分類超平面,使得不同類別的邊緣數(shù)據(jù)點(diǎn)之間的距離最大化,使得分類器的泛化能力最強(qiáng),從而實(shí)現(xiàn)最優(yōu)的二分類或多分類。SVM的核心是將高維特征空間中的內(nèi)積運(yùn)算轉(zhuǎn)化為低維空間中的內(nèi)積核函數(shù),以實(shí)現(xiàn)數(shù)據(jù)在經(jīng)歷非線性轉(zhuǎn)化后的線性劃分[26]。核函數(shù)是支持向量機(jī)映射數(shù)據(jù)的重要手段[27]。在光譜數(shù)據(jù)分析中,徑向基函數(shù)(RBF)因其較強(qiáng)的非線性問題處理能力而成為應(yīng)用最廣泛的核函數(shù)。本文以徑向基函數(shù)作為核函數(shù),采用網(wǎng)格搜索法確定支持向量機(jī)的超參數(shù)(懲罰系數(shù)c和核寬度g)。

        1.3.3.2 偏最小二乘法聯(lián)合線性判別 偏最小二乘法(Partial Least-square Method,PLS)是一種基于特征變量的回歸方法,其實(shí)質(zhì)是按照協(xié)方差極大化準(zhǔn)則,在分解自變量變量數(shù)據(jù)矩陣X的同時(shí),也在分解因變量數(shù)據(jù)矩陣Y,并且建立相互對(duì)應(yīng)的解釋隱變量與反應(yīng)隱變量之間的回歸關(guān)系方程[28]。偏最小二乘回歸的成分之間是相互正交的,這在一定程度上消除了多重線性相關(guān)性。線性判別(Linear discriminant analysis,LDA)分類器是一種監(jiān)督學(xué)習(xí)的數(shù)據(jù)降維方法,該方法的核心是將輸入變量空間投影到最佳鑒別矢量空間,達(dá)到樣本在投影后的矢量空間中“類內(nèi)方差最小,類間方差最大”的目的,即投影后每一種類別數(shù)據(jù)的投影點(diǎn)盡可能的接近,而不同類別的數(shù)據(jù)的類別中心之間的距離盡可能的大。之后通過計(jì)算待測(cè)樣本與各中心的距離,待測(cè)樣本的類別即為距離最短的[29]。

        1.3.3.3 邏輯回歸 邏輯回歸(Logistic Regression,LR)是在線性回歸的基礎(chǔ)上構(gòu)建一種分類模型,是對(duì)于特征的線性組合來擬合真實(shí)標(biāo)記為正例的概率的對(duì)數(shù)幾率,其公式可表示為:

        式中:w,b均為參數(shù)。

        LR多應(yīng)用于二分類問題,一個(gè)事件發(fā)生的機(jī)率定義為事件發(fā)生的概率與不發(fā)生的概率的比值,設(shè)p=P(y=1|x,w),那么事件的幾率是p/1?p,其對(duì)數(shù)幾率是:

        可以看出,輸出類別1的對(duì)數(shù)幾率函數(shù)是輸入x的線性函數(shù),對(duì)數(shù)幾率函數(shù)是Sigmoid函數(shù)的重要代表[30]。對(duì)于多分類問題,LR的方法是將多分類轉(zhuǎn)化為所有的多個(gè)二分類問題,然后對(duì)樣本,再依次進(jìn)行二分類[31]。

        2 結(jié)果與分析

        2.1 光譜分析

        由于三個(gè)儲(chǔ)藏年份的壽眉樣本的光譜曲線在頭尾處存在較大的隨機(jī)誤差,首先除去全波段中450~461 和963~998 nm的首尾噪聲,以獲得波段范圍為462~962 nm內(nèi)的126個(gè)波段的光譜數(shù)據(jù)進(jìn)行后續(xù)分析。統(tǒng)計(jì)每個(gè)樣本的光譜數(shù)據(jù)并作圖,結(jié)果如圖2所示。根據(jù)圖2可知,650~700 nm處存在一個(gè)波谷,可能是因?yàn)槿~綠素在663 nm處有較大的吸光系數(shù),李曉麗等[15]利用高光譜成像實(shí)現(xiàn)茶葉中EGCG可視化研究中也有類似研究現(xiàn)象。700~900 nm處壽眉樣本對(duì)光譜的反射急劇上升,是因?yàn)閴勖紝?duì)近紅外波段吸收較少。每條光譜曲線的形狀類似,說明壽眉樣本內(nèi)部的內(nèi)含成分大致相同。隨著儲(chǔ)藏時(shí)間的變化,壽眉的內(nèi)含成分的含量發(fā)生變化,導(dǎo)致在相同的波段有不同的反射率,這也為壽眉儲(chǔ)年份測(cè)定奠定了客觀基礎(chǔ)。

        圖 2 各儲(chǔ)藏年份壽眉樣本原始光譜數(shù)據(jù)圖Fig.2 Diagram of raw spectra of different Shoumei samples

        圖 3 預(yù)處理效果圖Fig.3 Spectra of all samples after being preprocessed

        2.2 預(yù)處理效果

        由圖3可知,在同一坐標(biāo)系下,除了SNV預(yù)處理后的光譜,其余光譜的相對(duì)反射率均在0以上。由1.3.2.3中的公式可知,SNV預(yù)處理后的相對(duì)反射率值為原始反射率減去該波段所有反射率的平均值再除以原始光譜的標(biāo)準(zhǔn)偏差后得到,所以相對(duì)反射率會(huì)出現(xiàn)負(fù)值。從光譜變化情況可知,相比于其余預(yù)處理,SNV預(yù)處理后的光譜在不同波段的相對(duì)反射率變化較大。從光譜分布情況可知,MinMax預(yù)處理后的光譜分布相比于原始光譜更為離散;MSC預(yù)處理后光譜分布相比于原始光譜更為集中,而SGF預(yù)處理前后差異不明顯。光譜預(yù)處理后的具體建模效果還需結(jié)合建模結(jié)果進(jìn)一步分析。

        2.3 建模結(jié)果分析

        2.3.1 SVM建模結(jié)果 表1是SVM建模分析結(jié)果,表2是該模型下的最優(yōu)處理即SNV-SVM處理后得到的混淆矩陣。從表1可以看出,經(jīng)過SNV預(yù)處理后的建模結(jié)果最優(yōu),訓(xùn)練集和測(cè)試集的精確率明顯高于其他預(yù)處理,分別為90.83%和86.02%。其中沒有經(jīng)過預(yù)處理的建模效果在兩個(gè)數(shù)據(jù)集上的表現(xiàn)與經(jīng)過Minmax預(yù)處理后的差異較小,說明原始光譜分布較為均勻,導(dǎo)致該預(yù)處理在SVM模型中效果一般。從表2混淆矩陣中可以看出,SNV-SVM處理組合對(duì)于訓(xùn)練集不同年份壽眉樣本的預(yù)測(cè)效果差異不大,但對(duì)于測(cè)試集中的預(yù)測(cè)效果差異明顯,其中3、10年壽眉的召回率接近,分別為90.32%、89.29%,而6年壽眉的召回率只有79.41%。

        表 1 SVM建模分析結(jié)果Table 1 Results of SVM modeling analysis

        2.3.2 PLS-LDA建模結(jié)果 表3是PLS-LDA建模分析結(jié)果,表4是該模型下的最優(yōu)處理即SNV-PLSLDA處理后得到的混淆矩陣。由表3可見,經(jīng)過SNV預(yù)處理之后的建模結(jié)果最佳,訓(xùn)練集和測(cè)試集中的精確率分別為80.05%和74.19%;而經(jīng)過部分預(yù)處理后的建模結(jié)果相較于無預(yù)處理并沒有明顯的提高。在PLS-LDA模型中,與SVM建模結(jié)果類似,不經(jīng)過預(yù)處理與經(jīng)過Minmax預(yù)處理后的建模結(jié)果幾乎一致;不經(jīng)過預(yù)處理的建模結(jié)果比經(jīng)過SGF和MSC預(yù)處理的建模結(jié)果更好,可見原始光譜的噪聲較小、基線漂移不明顯,預(yù)處理可能會(huì)造成有效信息的損失。從表4混淆矩陣中可見,經(jīng)過SNV預(yù)處理后,10年的壽眉樣本的精確率最高,但召回率最低,在測(cè)試集中分別為86.67%、66.67%;3年的壽眉樣本情況則相反,在測(cè)試集中的精確率和召回率分別為62.50%、80.00%。

        2.3.3 LR建模結(jié)果 表5是LR建模分析結(jié)果,表6是該模型下的最優(yōu)處理即Minmax-LR處理后得到的混淆矩陣。從表5可知,與PLS-LDA建模結(jié)果類似,不經(jīng)過預(yù)處理的建模結(jié)果和SGF、MSC預(yù)處理后的建模結(jié)果差異較小。但與其他兩種模型不同的是Minmax相比于其他預(yù)處理在LR模型中的表現(xiàn)最佳,訓(xùn)練集和測(cè)試集的精確率分別為84.64%和78.50%,這與LR模型本身對(duì)樣本分布的均勻度更為敏感有關(guān)。從表6混淆矩陣中可以看出,Minmax模型對(duì)三個(gè)儲(chǔ)藏年份的壽眉樣本判別存在差異,且在兩個(gè)數(shù)據(jù)集中都對(duì)3年壽眉樣本的判別最佳,6年其次,10年最差。

        表 2 SNV-SVM處理的混淆矩陣Table 2 The confusion matrix in SNV-SVM model

        表 3 PLS-LDA建模分析結(jié)果Table 3 Results of PLS-LDA modeling analysis

        表 4 SNV-PLS-LDA處理的混淆矩陣Table 4 The confusion matrix in SNV-PLS-LDA model

        表 5 LR建模分析結(jié)果Table 5 Results of LR modeling analysis

        表 6 Minmax-LR處理的混淆矩陣Table 6 The confusion matrix in Minmax-LR model

        表 7 三種判別模型的最優(yōu)處理匯總Table 7 Results of three discriminant models with their best preprocessing algorithm

        2.3.4 建模結(jié)果小結(jié) 從表7可以得出,SVM模型對(duì)于壽眉樣本的判別效果要明顯優(yōu)于PLS-LDA、LR模型,其中最佳處理組合SNV-SVM在訓(xùn)練集和測(cè)試集的精確率分別為90.83%、86.02%。四種預(yù)處理方法中,SNV在三種判別模型中的表現(xiàn)較好,Minmax其次,SGF和MSC表現(xiàn)一般。該結(jié)果與原始光譜數(shù)據(jù)特點(diǎn)相關(guān),原始光譜數(shù)據(jù)所受到隨機(jī)噪聲和基線漂移的影響都較小,SGF和MSC預(yù)處理后可能降低原始光譜中的有效信息,導(dǎo)致后續(xù)的建模效果相較于無預(yù)處理并不明顯,在PLS-LDA模型中甚至更差。

        3 結(jié)論

        本文通過高光譜成像技術(shù)獲得450~998 nm波段范圍內(nèi)的高光譜數(shù)據(jù)對(duì)儲(chǔ)藏年份為3、6、10年的壽眉樣本進(jìn)行無損檢測(cè)研究。采用Minmax、SGF、SNV、MSC 4種算法來對(duì)壽眉原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,并分別建立SVM、PLS-LDA、LR判別模型。建模結(jié)果表明,相較于線性模型PLS-LDA、LR,非線性模型SVM對(duì)于壽眉樣本的高光譜數(shù)據(jù)有更好的判別效果,說明光譜數(shù)據(jù)和白茶儲(chǔ)藏年份之間的關(guān)系更可能是一個(gè)非線性關(guān)系,這與白茶中多種內(nèi)含成分在儲(chǔ)藏過程中不斷發(fā)生復(fù)雜的化學(xué)變化有關(guān)。本文所建立的SNV-SVM處理組合針對(duì)3、6、10年這三個(gè)年份的壽眉有較高的判別精確率以及較強(qiáng)的泛化能力,而對(duì)于判別其他品類和其他年份的白茶還需后續(xù)進(jìn)一步研究。

        猜你喜歡
        白茶儲(chǔ)藏年份
        特殊的一年
        繪本
        這只貓說得好有道理
        意林(2019年10期)2019-06-03 16:37:12
        西藥藥品的儲(chǔ)藏探討
        ANIMATING ‘IP’
        ANIMATING ‘IP’COMICS AND EMOJIS BECOME ENTERTAINMENT BRANDS
        漢語世界(2017年4期)2017-03-07 06:21:20
        便于儲(chǔ)藏的美味
        什么是閏年?
        一樣的年份
        “蘊(yùn)藏”和“儲(chǔ)藏”
        亚洲色大成网站www在线观看| 国产精品国产三级国产av18| 久久久99精品成人片| 国产精品无码素人福利不卡| 国产成人精品一区二区不卡| 亚洲色大成网站www在线观看| 国产精品人成在线765| 亚洲三级视频一区二区三区| 久久99精品久久久久久9蜜桃| 国产av精国产传媒| 国产亚洲sss在线观看| 亚洲女同人妻在线播放| 免费a级毛片18禁网站| 人人狠狠综合久久亚洲| 久久中文字幕亚洲精品最新 | 另类专区欧美在线亚洲免费| 丰满少妇人妻无码超清| 亚洲日本中文字幕乱码在线 | 亚洲精品黑牛一区二区三区| 午夜影视啪啪免费体验区入口| 国产av麻豆精品第一页| 国产精品久久精品第一页| 欧美日韩精品一区二区在线观看| 色yeye在线观看| 综合亚洲二区三区四区在线| 日韩女同视频在线网站| 欧美一区二区三区红桃小说| 久久福利青草精品资源| 亚洲av色香蕉一区二区三区av| 精品国产天堂综合一区在线| 亚洲综合国产一区二区三区| 久久精品一区二区免费播放| 真实国产网爆门事件在线观看| 久久久精品国产三级精品| 成年站免费网站看v片在线| 国产思思99re99在线观看| 98精品国产高清在线xxxx| 国产的自拍av免费的在线观看| 精品国产免费一区二区三区香蕉| 日本黄页网站免费观看| 99热国产在线|