亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于煙葉化學(xué)成分烤煙香型分類模型的建立

        2015-04-29 00:00:00申欽鵬張霞張濤等
        湖北農(nóng)業(yè)科學(xué) 2015年5期

        摘要:基于煙葉化學(xué)數(shù)據(jù)建立烤煙香型分類模型,然后對(duì)各模型進(jìn)行篩選比較選出最優(yōu)模型。首先對(duì)142個(gè)烤煙煙葉樣品中的9類成分的63個(gè)指標(biāo)采用行業(yè)標(biāo)準(zhǔn)進(jìn)行檢測(cè),然后采用逐步回歸法篩選出19個(gè)煙葉化學(xué)成分,依據(jù)這19個(gè)指標(biāo)采用線性判別分析法、Logistic回歸、高斯混合模型、分類樹(shù)、K最鄰近法、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)七種方法進(jìn)行建模。通過(guò)對(duì)不同方法建立的模型采用100次隨機(jī)抽取訓(xùn)練集樣本和測(cè)試樣本計(jì)算錯(cuò)誤分類率,選擇錯(cuò)誤分類率較低的模型作為優(yōu)選模型。經(jīng)比較發(fā)現(xiàn),線性判別法和高斯混合模型建立的兩種香型函數(shù)能較好地對(duì)未知樣品的香型進(jìn)行正確分類,且效果較好。篩選出的兩種優(yōu)選模型對(duì)于烤煙香型分類研究具有一定的應(yīng)用價(jià)值。

        關(guān)鍵詞:煙葉化學(xué)成分;烤煙香型;模型分類法

        中圖分類號(hào):TS44+1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2015)05-1220-07

        DOI:10.14088/j.cnki.issn0439-8114.2015.05.049

        Abstract: Based on the chemical components of tobacco leaves, the classification models of tobacco flavor were established. All models were compared to select the optimal model. 63 components of 9 kinds of 142 tobacco leaves were detected by tobacco industry standards. 19 chemical components were selected by stepwise regression method. Seven methods including discriminate analysis, Logistic regression, Gauss mixture model, classification tree, K nearest neighbor method, artificial neural network and support vector machine were used to establish the models based on the 19 index. 100 randomly selected samples were used as the training sets and test samples to calculate the error classification rate through the establishment of the different methods of models. The model was the preferred model with classification error rate lower than others. By comparision, two kinds of flavor function model (linear discriminate method and Gauss mixed) were better to unknown sample types. Two kinds of optimization models had a certain application value for classifying tobacco flavor.

        Key words: chemical components of tobacco leaves; tobacco flavor; model classification methods

        目前利用烤煙中化學(xué)成分、致香成分對(duì)三種烤煙香型進(jìn)行模式識(shí)別已有相關(guān)文獻(xiàn)報(bào)道[1-4]。在國(guó)內(nèi)的研究中,朱立軍等[2]對(duì)112份市售卷煙樣品中20種化學(xué)成分采用逐步判別方法進(jìn)行判別分析取得了較好的分類結(jié)果,Zhan等[4]以63個(gè)中部和65個(gè)上部煙葉為材料,基于其中的67種致香物質(zhì)對(duì)三種香型進(jìn)行逐步判別分析也取得較好的分類結(jié)果并得到很好的應(yīng)用。目前在利用化學(xué)計(jì)量學(xué)進(jìn)行模式識(shí)別的過(guò)程中,已發(fā)展出了各種各樣的方法[5],采用其他類型的方法是否與經(jīng)典的判別分析方法具有同樣的效果,或是效果要好于經(jīng)典方法,此方面的研究還未見(jiàn)相關(guān)的報(bào)道。為此,采用目前較為成熟的經(jīng)典判別分析方法(LDA)、Logistic回歸(LR)、高斯混合模型(Mix)、分類樹(shù)(Tree)、K最鄰近法(KNN)、人工神經(jīng)網(wǎng)絡(luò)(CANN)和支持向量機(jī)(SVM)七種化學(xué)計(jì)量學(xué)方法,隨機(jī)抽取不同的訓(xùn)練集和測(cè)試集進(jìn)行分析,擬篩選出分類效果較優(yōu)且精度較為穩(wěn)健的模型,以期為烤煙香型分類優(yōu)化模型的選擇提供理論依據(jù)。

        1 材料與方法

        1.1 材料

        2011年收集142份烤煙樣品,分別來(lái)自中國(guó)14個(gè)省份,16個(gè)品種。其中清香型(簡(jiǎn)稱“清”)50個(gè),中間香型簡(jiǎn)稱“中”40個(gè),濃香型(簡(jiǎn)稱“濃”)52個(gè)。本次收集的樣品均由全國(guó)評(píng)煙委員會(huì)委員組成的評(píng)吸專家組對(duì)烤煙香型(清香型、濃香型和中間香型)進(jìn)行鑒定。

        1.2 方法

        1.2.1 分析檢測(cè) 在煙葉化學(xué)成分中主要對(duì)9類成分中的63個(gè)指標(biāo)采用行業(yè)標(biāo)準(zhǔn)進(jìn)行檢測(cè)。63個(gè)指標(biāo)具體是總糖、還原糖、氯、鉀、氮、總植物堿、石油醚提取物、粗纖維素、揮發(fā)酸、揮發(fā)堿、葡萄糖、果糖、蔗糖、綠原酸、莨菪亭、蕓香苷、鐵、錳、銅、鋅、鈉、硼、鈣、鎂、硝酸根、硫酸根、磷酸根、草酸、丙二酸、蘋果酸、棕櫚酸、硬脂酸、檸檬酸、亞油酸、亞麻酸、煙堿、降煙堿、麥斯明、假木賊堿、新煙草堿、2,3-聯(lián)吡啶、葉黃素、胡蘿卜素、天冬酰胺酸、組氨酸、絲氨酸、谷氨酰胺酸、精氨酸、甘氨酸、高絲氨酸、天冬氨酸、谷氨酸、蘇氨酸、丙氨酸、γ-氨基丁酸、脯氨酸、賴氨酸、酪氨酸、纈氨酸、異亮氨酸、亮氨酸、苯丙氨酸、色氨酸。

        1.2.2 統(tǒng)計(jì)分析方法 主要的統(tǒng)計(jì)分析程序采用R-2.15.3進(jìn)行。

        1)自變量篩選方法。變量篩選方法采用逐步方法,該方法與逐步回歸方法較為一致[6,7]。主要通過(guò)計(jì)算每一逐步過(guò)程中所得的F值與指定值進(jìn)行判斷變量移除或進(jìn)入,并獲得每個(gè)變量的Wilks’lambda統(tǒng)計(jì)量。

        2)建模及評(píng)估方法。主要采用了判別分析法[8,9]、Logistic回歸[10]、高斯混合模型[11]、分類樹(shù)[12]、K最鄰近法[13-15]、人工神經(jīng)網(wǎng)絡(luò)[16]和支持向量機(jī)[17,18]七種方法進(jìn)行建模。通過(guò)對(duì)不同方法建立的模型采用100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本計(jì)算錯(cuò)誤分類率[19],選擇錯(cuò)誤分類率較低的方法所建模型作為優(yōu)選模型。

        3)隱含層計(jì)算。在采用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行建模的過(guò)程中,涉及到兩個(gè)參數(shù)的優(yōu)化,一個(gè)是隱含層單元數(shù)的確定,另一個(gè)是權(quán)衰減系數(shù)的確定。對(duì)于權(quán)衰減系數(shù)的確定主要參看下面“參數(shù)優(yōu)化選擇”中的內(nèi)容進(jìn)行優(yōu)化選擇,而隱含層單元數(shù)的確定主要采用以下公式進(jìn)行計(jì)算:

        其中,s為隱含層節(jié)點(diǎn)數(shù),m為輸入層節(jié)點(diǎn)數(shù),n為輸出層節(jié)點(diǎn)數(shù)。通過(guò)式(1)可對(duì)各化學(xué)成分、致香成分和近紅外光譜信息的隱含層數(shù)進(jìn)行選擇。

        4)參數(shù)優(yōu)化選擇。在分類樹(shù)、K最鄰近法、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)這四種方法進(jìn)行建模的過(guò)程需要對(duì)分類樹(shù)中樹(shù)的復(fù)雜度、K最鄰近法中最鄰近點(diǎn)、人工神經(jīng)網(wǎng)絡(luò)權(quán)衰減系數(shù)及支持向量機(jī)中的懲罰因子進(jìn)行優(yōu)化選擇[19]。一般情況下,優(yōu)化參數(shù)的選擇估計(jì)主要通過(guò)CV(交叉驗(yàn)證)方法進(jìn)行[20],本研究主要采用十折交叉驗(yàn)證方法(10-fold CV)結(jié)合“單個(gè)標(biāo)準(zhǔn)誤”準(zhǔn)則對(duì)模型參數(shù)進(jìn)行優(yōu)化選擇。

        2 結(jié)果與分析

        分別采用逐步回歸法篩選后的各化學(xué)成分對(duì)三種烤煙香型進(jìn)行建模,各模型建立后分別采用100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本計(jì)算錯(cuò)誤分類率,選擇錯(cuò)誤分類率較低、分類準(zhǔn)確率高的方法所建模型作為優(yōu)選模型。

        2.1 基于各化學(xué)成分對(duì)三種烤煙香型定性建模比較擇優(yōu)

        對(duì)逐步回歸篩選出的還原糖、鉀、氮、石油醚提取物、揮發(fā)酸、葡萄糖、果糖、蔗糖、蕓香苷、鐵、錳、銅、檸檬酸、煙堿、假木賊堿、2,3-聯(lián)吡啶、胡蘿卜素、天冬酰胺、甘氨酸這19個(gè)指標(biāo)與三種香型采用不同的方法進(jìn)行定性建模,其結(jié)果如下。

        從圖1可知,采用線性判別分析法對(duì)三種烤煙香型數(shù)據(jù)進(jìn)行定性建模,其中100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本計(jì)算的三種香型的錯(cuò)誤分類率水平較為一致,基本保持在10%以下,中間香型的錯(cuò)誤分類率分布范圍較濃香型、清香型廣,三種香型綜合起來(lái)的錯(cuò)誤分類率分布范圍較小。

        從圖2可知,采用Logistic回歸法對(duì)三種烤煙香型數(shù)據(jù)進(jìn)行定性建模,其中100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本計(jì)算的三種香型與合計(jì)的錯(cuò)誤分類率水平濃香型、清香型較為一致,基本保持在10%左右,中間香型錯(cuò)誤分類率水平較高,為15%~20%,中間香型的錯(cuò)誤分類率分布范圍較濃香型、清香型和總計(jì)廣,總計(jì)的錯(cuò)誤分類率分布范圍較小。

        從圖3可知,采用高斯混合模型對(duì)三種烤煙香型數(shù)據(jù)進(jìn)行定性建模,其中100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本計(jì)算的三種香型的錯(cuò)誤分類率水平較為一致,基本保持在10%左右,三種香型綜合起來(lái)的錯(cuò)誤分類率分布范圍較小。

        從圖4、圖5和圖6可知,采用K最鄰近法(KNN法)對(duì)三種烤煙香型數(shù)據(jù)進(jìn)行定性建模,在最鄰近點(diǎn)數(shù)目?jī)?yōu)化選擇中采用隨機(jī)抽樣的測(cè)試誤差與CV誤差法篩選的K值為1;采用100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本對(duì)不同最鄰近點(diǎn)數(shù)目構(gòu)建的模型計(jì)算總體錯(cuò)誤分類率進(jìn)行優(yōu)選后的K值可為1、3、4、5、6、7、8和9之間的數(shù)值,最終指定優(yōu)化K值為1。最終利用優(yōu)化參數(shù)所建模型經(jīng)過(guò)100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本計(jì)算的三種香型與合計(jì)的錯(cuò)誤分類率水平和清香型較為一致,基本保持在20%左右,中間香型錯(cuò)誤分類率水平較高,為25%~30%,濃香型錯(cuò)誤分類率水平較低,在15%左右,中間香型、清香型的錯(cuò)誤分類率分布范圍較廣,三種香型綜合起來(lái)的錯(cuò)誤分類率分布范圍較小。

        從圖7、圖8和圖9可知,采用分類樹(shù)法對(duì)三種烤煙香型數(shù)據(jù)進(jìn)行定性建模,在樹(shù)復(fù)雜度優(yōu)化選擇中采用隨機(jī)抽樣的測(cè)試誤差與CV誤差法篩選的樹(shù)復(fù)雜度為0.01;采用100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本對(duì)不同樹(shù)復(fù)雜度構(gòu)建的模型計(jì)算總體錯(cuò)誤分類率篩選的樹(shù)復(fù)雜度沒(méi)有找到明顯較低趨勢(shì)的值,最終指定優(yōu)化樹(shù)復(fù)雜度為0.01。最終利用優(yōu)化參數(shù)所建模型經(jīng)過(guò)100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本計(jì)算的三種香型與合計(jì)的錯(cuò)誤分類率水平在濃香型、清香型上較為一致,保持在60%~70%,中間香型錯(cuò)誤分類率水平較高,在80%左右,三種香型綜合起來(lái)的錯(cuò)誤分類率分布范圍較小。

        從圖10、圖11和圖12可知,采用神經(jīng)網(wǎng)絡(luò)法對(duì)三種烤煙香型數(shù)據(jù)進(jìn)行定性建模,主要采用三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),在隱含層節(jié)點(diǎn)數(shù)選擇中采用公式進(jìn)行計(jì)算為9,在權(quán)衰減系數(shù)優(yōu)化選擇中隨機(jī)抽樣的測(cè)試誤差與CV誤差法篩選的權(quán)衰減系數(shù)為0.15;采用100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本對(duì)不同權(quán)衰減系數(shù)構(gòu)建的模型計(jì)算總體錯(cuò)誤分類率,篩選的權(quán)衰減系數(shù)沒(méi)有找到明顯較低趨勢(shì)的值,最終指定優(yōu)化權(quán)衰減系數(shù)為0.15。最終利用優(yōu)化參數(shù)所建模型經(jīng)過(guò)100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本計(jì)算的三種香型的錯(cuò)誤分類率水平在濃香型、清香型上較為一致,保持在60%左右,中間香型錯(cuò)誤分類率水平較高,為70%~80%,中間香型的錯(cuò)誤分類率分布范圍較廣,三種香型綜合起來(lái)的錯(cuò)誤分類率分布范圍較小。

        從圖13、圖14和圖15可知,采用支持向量法對(duì)三種烤煙香型數(shù)據(jù)進(jìn)行定性建模,核函數(shù)采用徑向基函數(shù),在懲罰因子優(yōu)化選擇中采用隨機(jī)抽樣的測(cè)試誤差與CV誤差法篩選的懲罰因子為0.05;采用100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本對(duì)不同懲罰因子構(gòu)建的模型計(jì)算總體錯(cuò)誤分類率,篩選的懲罰因子為0.05,最終指定優(yōu)化懲罰因子為0.05。最終利用優(yōu)化參數(shù)所建模型經(jīng)過(guò)100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本計(jì)算的三種香型的錯(cuò)誤分類率水平在濃香型和總計(jì)上較為一致,保持在15%~20%,中間香型錯(cuò)誤分類率水平較高,為25%~30%,清香型錯(cuò)誤分類率水平較低,在10%左右,三種香型綜合起來(lái)的錯(cuò)誤分類率分布范圍較小。

        對(duì)以上幾種模型100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本的總體錯(cuò)誤分類率進(jìn)行比較(圖16),發(fā)現(xiàn)線性判別法和高斯混合模型具有較低的錯(cuò)誤分類率,可作為19種化學(xué)成分對(duì)三種烤煙香型分類的最優(yōu)模型。

        2.2 基于19個(gè)化學(xué)成分對(duì)三種烤煙香型的分類模型信息匯總

        基于煙葉中19個(gè)化學(xué)成分采用了線性判別分析法、Logistic回歸、高斯混合模型、分類樹(shù)、K最鄰近法、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)七種方法建立了烤煙香型分類模型,然后對(duì)所建模型的分類效果進(jìn)行了比較,選擇分類效果最佳的模型為優(yōu)選模型,主要是依據(jù)100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本集的錯(cuò)誤分類率,錯(cuò)誤分類率最低、分類效果最好的模型為優(yōu)選模型。具體結(jié)果見(jiàn)表1,從表1中可以看出,線性判別分析法和高斯混合模型對(duì)烤煙香型判斷準(zhǔn)確率均達(dá)到90%及以上,因此確定這兩種模型可作為優(yōu)選模型。

        3 小結(jié)

        基于煙葉中19個(gè)化學(xué)成分分別采用線性判別分析法、Logistic回歸、高斯混合模型、分類樹(shù)、K最鄰近法、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)七種方法建立了烤煙香型的分類模型,并分別比較了七種模型對(duì)100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本的錯(cuò)誤分類率,最終選擇錯(cuò)誤分類率較低、分類效果較好的模型作為優(yōu)選模型。通過(guò)比較對(duì)烤煙香型分類的結(jié)果,發(fā)現(xiàn)采用線性判別分析法和高斯混合模型建立的兩種香型函數(shù)能較好地對(duì)未知樣品的香型進(jìn)行正確分類,且效果較好(各項(xiàng)正確率均達(dá)到90%及以上),因此可將這兩種模型確定為烤煙香型分類的優(yōu)選模型。通過(guò)本研究確定的兩種優(yōu)選分類模型對(duì)于烤煙香型分類研究具有一定的應(yīng)用價(jià)值。

        參考文獻(xiàn):

        [1] 畢淑峰, 朱顯靈, 馬成澤. 逐步判別分析在中國(guó)烤煙香型鑒定中的應(yīng)用[J]. 熱帶作物學(xué)報(bào),2006,27(4):104-107.

        [2] 朱立軍,王 鵬,施豐成,等. 基于化學(xué)成分的卷煙類型逐步判別分析[J]. 西南大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,34(3):9-13.

        [3] GAO Q, YU L, CHEN L, LIU B Z, et al. Data discriminant analysis of aroma characteristics of tobacco based on DHS-GC/MS volatile data[J]. Computers and Applied Chemistry, 2012, 29(3):309-312.

        [4] ZHAN J, ZHOU F F, BAO C Y, et al. Judgment of aroma types of the up-middle flue-cured tobacco leaves based on proportions of aroma components[J]. Agricultural Science Technology,2013,14(4):612-619.

        [5] 褚小立. 化學(xué)計(jì)量學(xué)方法與分子光譜分析技術(shù)[M]. 北京: 化學(xué)工業(yè)出版社, 2011.

        [6] HABBEMA J D F, HERMANS J. Selection of variables in discriminant analysis by F-statistic and error rate[J]. Technometrics,1977,19(4):487-493.

        [7] MCKAY R J, CAMPBELL N A. Variable selection techniques in discriminant analysis: Ⅱ. Allocation[J]. British Journal of Mathematical and Statistical Psychology, 1982, 35(1): 30-41.

        [8] HUBERTY C J. Applied Discriminant Analysis[M]. New York: Wiley,1994.

        [9] JOHNSON R A, WICHERN D W. Applied Multivariate Statistical Analysis[M]. New Jersey:Prentice Hall, 2002.

        [10] KLEINBAUM D G, KLEIN M. Logistic Regression[M]. New York: Springer, 2002.

        [11] HASTIE T, TIBSHIRANI R. Discriminant analysis by gaussian mixtures[J]. JRSS-B, 1996, 58(1):155-176.

        [12] BREIMAN L, FRIEDMAN J H, OLSHEN R H, et al. Classification and regression trees[M]. California:Wadsworth Belmont,1984.

        [13] DAVIES A N. Mass spectrometry[A]. GAUGLITZ G,VO-DINH T. Handbook of Spectroscopy Vol.2[C]. Weinheim: Wiley-VCH,2003.488-504.

        [14] ROBIEN W. Nuclear magnetic resonance spectroscopy[A]. Gauglitz G,Vo-Dinh T. Handbook of Spectroscopy Vol.2 [C]. Weinheim:Wiley-VCH,2003,469-487.

        [15] THIELE S, SALZER R. Optical spetcroscopy[A]. Gauglitz G, Vo-Dinh T.Handbook of Spectroscopy Vol.2[C]. Weinheim:Wiley-VCH, 2003.441-468.

        [16] RIPLEY B D. Pattern Recognition and Neural Networks[M]. London:Cambridge University Press,1996.

        [17] CHRISTIANINI N, SHAWE-TAYLOR J. An Introduction to Support Vector Nachines and Other Kernel-based Learning Methods[M]. London:Cambridge University Press,2000.

        [18] VAPNIK V. The Nature of Statistical Learning Theory[M]. New York: Springer,1995.

        [19] VARMUZA K, FILZMOSER P. Introduction to Multivariate Statistical Analysis in Chemometrics[M].Boca Raton: CRC Press, 2009.

        [20] ANTHONY M, HOLDEN S B. Cross-validation for binary classification by real-valued functions:theoretical analysis[A]. Bartlett P, MANSOUR Y. COLT'98 Proceedings of the eleventh annual conference on computational learning theory[C]. New York:ACM,1998.218-229.

        国产一区二区在线免费视频观看| 欧美日韩精品乱国产| 国产精品亚洲综合色区韩国| 全免费a级毛片免费看视频| 92精品国产自产在线观看48页| 少妇特殊按摩高潮对白| 免费观看国产短视频的方法| 久久久久亚洲av片无码v| 亚洲av无码片在线播放| 精品国产车一区二区三区| 国产亚洲av另类一区二区三区| 40岁大乳的熟妇在线观看| 特级黄色毛片视频| 日本免费一区精品推荐| 日本中文字幕婷婷在线| 国产好大好硬好爽免费不卡| 激情婷婷六月| 久久免费精品视频老逼| 国产av综合网站不卡| 欧美寡妇xxxx黑人猛交| 无遮挡网站| 人妻少妇激情久久综合| 日韩av无码中文字幕| 丰满的少妇xxxxx青青青| 国产在视频线精品视频二代| 免费看av网站在线亚洲| av中文字幕潮喷人妻系列| 亚洲精品成人网久久久久久| 亚洲av有码精品天堂| 日韩一区在线精品视频| 国产精品v欧美精品v日韩精品| 国产精品亚洲片夜色在线| 久久精品伊人久久精品伊人| 一本久久综合亚洲鲁鲁五月天| 免费又黄又爽又猛的毛片| 大白屁股流白浆一区二区三区| 扒开美女内裤舔出白水| 久久国产精品精品国产色婷婷| 亚洲AV无码久久精品国产老人| 色婷婷av一区二区三区丝袜美腿 | 美女窝人体色www网站|