亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于近紅外光譜技術結合隨機森林的煙葉成熟度快速判別

        2017-10-23 02:53:17王承偉譚觀萍周冀衡
        西南農業(yè)學報 2017年4期
        關鍵詞:成熟度正確率煙葉

        王承偉,賓 俊,范 偉,譚觀萍,周冀衡*

        (1.湖南農業(yè)大學生物科學技術學院,湖南 長沙 410128; 2.湖南農業(yè)大學煙草研究院,湖南 長沙 410128)

        基于近紅外光譜技術結合隨機森林的煙葉成熟度快速判別

        王承偉1,2,賓 俊1,2,范 偉1,2,譚觀萍1,2,周冀衡1,2*

        (1.湖南農業(yè)大學生物科學技術學院,湖南 長沙 410128; 2.湖南農業(yè)大學煙草研究院,湖南 長沙 410128)

        【目的】成熟度是煙葉品質的中心因素,田間成熟是獲得優(yōu)質煙葉的前提和基礎,如何準確判斷煙葉成熟程度是一個難題?!痉椒ā勘疚睦媒t外光譜技術結合化學計量學方法對不同成熟度的新鮮煙葉進行了探討。【結果】隨機森林(RF)分類模型參數(shù)優(yōu)化簡單、泛化能力強、預測結果較好,能有效識別不同成熟程度的煙葉樣本,實現(xiàn)煙葉成熟度的快速判別,上、中和下部煙葉不同成熟度模型預測集的分類正確率分別為0.9231、0.90和0.9091,預測正確率優(yōu)于主成分分析(PCA)、K最近鄰(KNN)和支撐向量機(SVM)等方法?!窘Y論】因此,近紅外光譜技術結合隨機森林方法簡單、快速、準確,可為客觀辨別煙葉成熟度的等級、優(yōu)劣等問題提供了一種新的、便捷的輔助手段。

        成熟度;近紅外光譜技術;隨機森林;判別模型

        【研究意義】煙葉成熟度影響著煙葉質量,是煙葉質量評價的一個重要品質指標,并列為分級的首要品質因素?!厩叭搜芯窟M展】煙草種植業(yè)較為發(fā)達的國家,曾對煙葉的采收成熟度進行過系統(tǒng)研究,提出了諸如:采烤前一周采樣化驗煙葉各項生理指標確定成熟度的方法、制作比色卡在田間比色從而確定煙葉成熟度的方法、通過烤房試驗或抽屜試驗確定煙葉成熟度的方法等[1-4]。然而對于依據(jù)現(xiàn)有的煙葉外觀判定標準,運用傳統(tǒng)的目測方法過于籠統(tǒng)和抽象,在應用時存在外觀描述的含糊性、經(jīng)驗性及主觀性問題,在實際操作中也很難掌握。對于化學分析及色差計等方法,檢測時會對煙葉造成一定的損傷,且操作復雜、成本高又缺乏實時性。我國也有學者提出通過數(shù)字圖像處理技術、顏色分析、葉片紋理分析的方法、通過便攜式生物學測量儀器(葉綠素儀)測量的方法判定煙葉成熟度[5-7]。但上述的定量化方法有些雖然準確但實施不便,有些實施方便但準確率欠佳。基于目前國內外對于煙葉成熟度檢測技術尚無一種田間快速、直觀、操作性強的技術方法的研究現(xiàn)狀?!颈狙芯壳腥朦c】本文提出了一種基于近紅外光譜技術結合隨機森林(RF)建立成熟度判別模型對鮮煙葉進行成熟度判別的方法,且與主成分分析(PCA)、K最鄰近算法(KNN)、支撐向量機(SVM)等方法進行了對比分析,并驗證了其具有較高的預測性能?!緮M解決的關鍵問題】旨在更好地將光譜分析技術應用于指導煙葉采收時的質量控制,同時可為開發(fā)基于光譜分析的煙葉成熟度檢測儀器提供數(shù)據(jù)和技術支持。

        1 材料與方法

        1.1 試驗與材料

        試驗于 2015 年進行,地點設在云南省騰沖縣界頭鎮(zhèn),以烤煙品種K326為試驗品種。鮮煙葉成熟度評判標準由煙葉成熟度評判專家結合生產經(jīng)驗與文獻給出如表1所示。

        1.2 光譜采集

        按批次在試驗地中挑選煙葉,按照上述成熟度特征,在各部位葉片成熟度為欠熟、適熟、過熟時分別采收12~15片,每片煙葉為1個樣本。采下后,為保證測定結果精確可靠,迅速裝入塑封袋,在室內密閉環(huán)境下的測量[8]。采用B&WTEK i-Spec近紅外光譜儀采集樣本光譜,儀器配有標準探頭和漫反射白板。掃描次數(shù)為32次,分辨率為3.5 cm-1,積分時間為400 us,光譜采集范圍為11000~5800 cm-1(900~1700 nm),優(yōu)化光譜儀掃描條件后,立即進行近紅外光譜掃描,其中掃描時,每個樣本在視線范圍內避開主脈在左右兩側各取6個點,每個點測量3次取平均值,所有點的平均值作為該煙葉的代表光譜。

        1.3 分類建模方法

        1.3.1 主成分分析(PCA) 主成分分析法(Principal Component Analysis,PCA)是以一種最優(yōu)化方法去濃縮和綜合原始數(shù)據(jù)信息、研究如何將多指標問題轉化為較少的綜合指標的統(tǒng)計方法,采用舍棄部分線性變換信息,對高維變量空間進行降維處理,達到以少數(shù)的綜合變量代替原有的多維變量的目的[9]。PCA對樣本分類主要是通過投影判別法,先直接對樣本測量數(shù)據(jù)矩陣進行分解,只取其中的主成分來投影,然后進行判別分析。PCA所得的主成分軸是該數(shù)據(jù)矩陣的最大方差方向,且這些主成分軸相互正交,這樣就可保證從高維向低維空間投影時盡量多地保留有效信息。

        1.3.2K最鄰近算法(KNN)K最近鄰算法(K-Nearest Neighbors Algorithm,KNN)是一種簡單的機器學習算法,由 Cover 和 Hart 于1968年提出[10],理論比較成熟。該方法的思路是:若一個樣本在特征空間中的K個最相似(特征空間中最鄰近)的樣本中的大多數(shù)屬于某一類別,則該樣本也屬于此類別。KNN算法中,基于給定的鄰居度量方式以及結合經(jīng)驗選取合適的K值,所選擇的鄰居都是已經(jīng)正確分類的對象。該方法在分類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。

        1.3.3 支持向量機(SVM) 支持向量機(Support Vector Machine,SVM)由 Vapinik等人[11-12]在20世紀90年代提出。SVM能夠結合統(tǒng)計學習優(yōu)化方法和核函數(shù)方法,考慮訓練誤差(經(jīng)驗風險)和測試錯誤(期望風險)最小化,在模型的復雜性與學習能力中,根據(jù)有限樣本信息找到最優(yōu)的解決辦法,并擁有準確的預測和避免過擬合問題等優(yōu)點。SVM的核函數(shù)有線性核函數(shù)、多項式核函數(shù)、sigmoid 核函數(shù)和徑向基核函數(shù)(RBF核函數(shù))。如何選擇出應用SVM的核函數(shù)及懲罰參數(shù)C和核參數(shù)g是關鍵,不同的參數(shù)對SVM的機器學習性能影響較大。

        1.3.4 隨機森林(RF) 隨機森林(Random Forest,RF)是 Leo Breiman(2001)提出的一種根據(jù)分類回歸樹模型的集成學習算法[13],它是采取Bootstrap重復抽取樣本的方法,從原始的訓練樣本集N中有放回地重復隨機抽取樣本生成k個新的訓練集;同時從初始訓練樣本集中未能抽取出來的樣本組成的集合,稱為袋外數(shù)據(jù)集(out of bag,OOB),再構建多個決策樹模型,通過對決策樹模型進行投票,得票愈多的決策樹模型分類性能愈高[14]。

        表1 不同處理鮮煙葉的采收成熟度Table 1 Maturity of fresh tobacco leaves treated with different treatments

        表2 樣本劃分統(tǒng)計Table 2 Sample partition statistics

        2 結果與分析

        2.1 光譜預處理及樣本劃分

        預處理有助于有用信息的提取和分析,不同的預處理方法達到的效果不同,常見的預處理方法包括平滑、多元散射校正(MSC)、微分、標準正交變換(SNV)和小波變換(WT)等[15-16],經(jīng)過對比分析,本文選擇如下的方法對上、中、下3個部位煙葉的標準光譜進行預處理。

        采用Savitzky-Golay平滑法對光譜進行平滑處理,平滑窗口為13;應用多元散射校正(MSC)算法消除由于煙葉樣品顆粒分布不均勻的影響。預處理前后光譜見圖1。

        預處理后的光譜數(shù)據(jù)通過Kennard-Stone樣本劃分方法[17]劃分為訓練集和預測及,具體的樣本劃分數(shù)據(jù)見表2。

        2.2 不同分類模型比較

        2.2.1 PCA方法 用主成分分析法對各個部位煙葉的數(shù)據(jù)進行分類處理,得到圖2。上、中、下部煙葉的未熟、成熟和過熟煙葉光譜都不能完全分開,上部葉的成熟煙葉和過熟煙葉混合在一起與未熟煙葉分的比較開,而中下部煙葉的3種不同成熟度都不能分開,導致這種結果的原因可能是:PCA將所有的樣本作為一個整體對待,去尋找一個均方誤差最小意義下的最優(yōu)線性映射投影,而忽略了類別屬性,而它所忽略的投影方向有可能剛好包含了重要的可分性信息,所以導致PCA對煙葉成熟度的聚類分析不準確,需要借助更加復雜的學習算法來解決此問題。

        2.2.2 KNN方法 用鄰近算法(KNN)對數(shù)據(jù)進行運算處理,得到圖3和表2。

        從表3可以看出,訓練集的上部葉的分類正確率為78 %,高于中部葉和下部葉的69 %。預測集的分類正確率也是一樣的趨勢,但下部葉的要低于訓練集的正確率。KNN是一種經(jīng)典的懶惰分類算法,與常規(guī)的分類算法先通過訓練建立模型不同,其采用邊測試邊訓練的被動方式建立分類模型,但對測試樣本分類時的計算量大,可解釋性較差,無法給出決策樹那樣的規(guī)則,可以看出煙葉成熟度分類效果也不佳。

        A為上部葉原始譜圖,B為上部葉預處理后譜圖,C為中部葉原始譜圖,D為中部葉預處理后譜圖,E為下部葉原始譜圖,F(xiàn)為下部葉預處理后譜圖圖1 近紅外光譜圖Fig.1 Near-infrared spectroscopy

        A表示上部葉,B表示中部葉,C表示下部葉圖2 光譜PCA得分Fig.2 Spectral PCA score

        圖3 KNN分類方法K值的選擇Fig.3 Selection of K value of KNN classification method

        2.2.3 SVM方法 從表4~5可知,訓練集的預測正確率中,上部葉最低,但是在預測集的分類正確率中,上部葉反而最高92.3 %,中部葉最低40 %,下部葉73 %,相對穩(wěn)定。但是SVM存在不足,它依賴經(jīng)驗選擇參數(shù),同時,如果參數(shù)選擇不準確,很容易導致過擬合的出現(xiàn),文中的中部葉和下部葉分類模型就有可能是過擬合,訓練集分類準確率非常高,接近100 %,但是預測集的分類正確率較低,這也說明SVM不適合煙葉成熟度分類的研究。

        表3 KNN預測結果Table 3 KNN prediction results (%)

        注:(25/32)表示“正確樣本數(shù)/總樣本數(shù)”。
        Note:(25/32)means ‘correct sample number / total sample number’.

        表4 SVM預測結果Table 4 SVM prediction results (%)

        表5 SVM最佳參數(shù)(RBF核)Table 5 SVM optimal parameters (RBF kernel)

        A表示上部葉(200),B表示中部葉(100),C表示下部葉(60)圖4 RF樹數(shù)目的選擇Fig.4 RF tree number selection

        A表示上部葉,B表示中部葉,C表示下部葉(圖中灰色表示訓練樣本,黑色表示預測樣本)圖5 RF分類效果圖Fig.5 RF classification effect chart

        表6 RF預測結果Table 6 RF prediction results

        2.2.4 RF方法 從圖4可知,當各部位煙葉隨機森林選擇樹數(shù)目,上部葉200、中部葉100和下部葉60時,線條趨于平穩(wěn);由圖5可看出,各成熟度的預測集和訓練集的分布;而由表6可知,上、中和下部葉的預測正確率較高,皆達90 %以上。

        通過上述分析可知,近紅外光譜技術結合RF方法模型穩(wěn)健,分類效果較好。該方法不僅確定構建隨機森林樹數(shù)目簡單,而且通過子模型循環(huán)500次得到穩(wěn)定的變量重要度,相對于其他方法更加穩(wěn)定;RF能夠很好的解決煙草成熟度近紅外光譜分類中算法參照經(jīng)驗值和分類模型過擬合問題,具有推廣使用價值。

        3 結 論

        綜上結果表明,RF方法能較有效的有利于地分類近紅外光譜信息,預測準確率優(yōu)于其他方法,實現(xiàn)了上部葉和下部葉較高的預測準確率,訓練集預測正確率達87.5 %以上,預測集正確率達90 %以上,且較其他方法相對穩(wěn)定。此法簡單、快速、準確,為煙農客觀辨別煙葉成熟度的等級、優(yōu)劣等問題提供了一種新的、便捷的輔助手段。

        選擇近紅外光譜結合化學計量學算法進行成熟度識別有助于適時采收,提高初烤煙葉的烘烤起點,提高煙葉品質?;诮t外光譜技術的煙葉成熟度判別模型具有較好的穩(wěn)健性,近紅外光譜用于煙葉精細分類是可行的。同時需要結合煙葉的工業(yè)可用性提高分類標準的合理性、可靠性,進一步的研究工作將結合實際生產諸如部位、烘后煙葉成熟度、養(yǎng)分、水分、品種、農藝管理、生態(tài)條件等要素進行。通過建立成熟度等級賦值和量化體系、成熟度量化模型,并進而與光譜技術耦合建立煙葉的綜合評價質量技術體系,可實現(xiàn)煙葉成熟采收的現(xiàn)代化、科學化。

        [1]高漢杰,陳漢新,彭世陽,等.煙葉成熟度鑒別方法與實用五段式烘烤新工藝應用研究的回顧[J].中國煙草科學,2002(4):39-41.

        [2]Peedin G F.Effects of nitrogen rate and ripeness at harvest on some agronomic and chemical characteristics of flue-cured tobacco[C].Coresta Congress,Agro-Photo Groups,1995.

        [3]Hwang K J,Kim C W,Kim C H.Studies on the change of chemical components of flue-cured tobacco with maturity[C].Coresta Congress,Agro-Photo Groups,1981.

        [4]Walker E K.Some chemical characteristics of the cured leaves of flue-cured tobacco relative to time of harvest,stalk position and chlorophyll content of the green leaves[J].Tob Sci,1968(12): 58-65.

        [5]汪 強,席 磊,任艷娜.基于計算機視覺技術的煙葉成熟度判定方法[J].農業(yè)工程學報,2012(4): 175-179.

        [6]聶榮邦,李海峰,胡子述.烤煙不同成熟度鮮煙葉組織結構的研究[J].煙草科技,1991(3):37-39.

        [7]李佛琳,趙春江,劉良云,等.烤煙鮮煙葉成熟度的量化[J].中國煙草科技,2007(1):54-58.

        [8]LI-COR LI-1800-12 Integrating sphere instruction manual[Z].1983.Pub.No.8305-0034.LI-COR,Inc.,Lincoln,NE.

        [9]王一丁,趙銘欽,付 博,等.利用可見-近紅外光譜鑒定不同香型風格烤煙的方法[J].中國煙草科學,2015,36(6):88-93.

        [10]Wu Xindong,Kumar V,Quinlan J R,et al.Top 10 algorithms in data mining[J].Knowl Inf Syst,2008(14): 1-17.

        [11]Cortes C,Vapnik V.Support vector networks[J].Mach Learn,1995,20(1): 273-297.

        [12]Li Hongdong,Liang Yizeng,Xu Qingsong,et al.Support vector machines and its applications in chemistry[J].Chemometr Intell Lab,2009(95): 188-198.

        [13]Breiman L.Random forests[J].Mach Learn,2001,45(1): 5-32.

        [14]Liaw A,Wiener M.Classification and regression by random forest[J].R News,2002(2/3): 18-22.

        [15]褚小立,袁洪福,陸婉珍.近紅外分析中光譜預處理及波長選擇方法進展與應用[J].化學進展,2004,16(4):528-542.

        [16]尼 珍,胡昌勤,馮 芳.近紅外光譜分析中光譜預處理方法的作用及其發(fā)展[J].藥物分析雜志,2008(5):824-829.

        [17]Kennard R W,Stone L A.Computer aided design of experiments [J].Technometrics,1969,11(1): 137-148.

        RapidDiscriminationofMaturityofTobaccoLeafBasedonNear-infraredSpectroscopyandRandomForest

        WANG Cheng-wei1,2,BIN Jun1,2,FAN Wei1,2,TAN Guan-ping1,2,ZHOU Ji-heng1,2*

        (1.College of Bioscience and Biotechnology,Hunan Agricultural University,Hunan Changsha 410128,China; 2.Institude of Tobacco,Hunan Agricultural University,Hunan Changsha 410128,China)

        【Objective】Maturity is the center of the tobacco leaf quality factors,and the maturity in field is the premise and foundation to obtain high quality tobacco leaf,but how to accurately determine tobacco maturity is a difficult problem.【Method】A new method by using near infrared spectroscopy combined with chemometrics for classifying different maturity of fresh tobacco leaves was proposed in this paper.【Result】Compared with principal component analysis(PCA),K nearest neighbor (KNN) and support vector machine (SVM) qualitative models,the random forest models for maturity had the advantages of automatic parameter optimization,better performance,stronger generalization ability and better accurate prediction results,by which the maturity classification of upper,middle and low leaves achieved the accuracy of 0.9231,0.90 and 0.9091,respectively.【Conclusion】Near infrared technology in combination with random forests could thus accurately identify tobacco maturity level,which would provide the new and convenient means of auxiliary.

        Maturity; Tobacco leaf; Near-infrared spectroscopy; Discriminative model

        1001-4829(2017)4-0931-06

        10.16213/j.cnki.scjas.2017.4.035

        2016-09-10

        湖南省研究生科研創(chuàng)新項目“煙草烘烤過程近紅外光譜在線無損監(jiān)測及變化規(guī)律的研究”(CX2015B237)

        王承偉(1991-),男,湖南永州人,碩士在讀,煙草化學分析,E-mail:435253080@qq.com,Tel:15387495313;*為通訊作者,E-mail:jhzhou2005@163.com。

        S572

        A

        (責任編輯 陳 虹)

        猜你喜歡
        成熟度正確率煙葉
        產品制造成熟度在型號批生產風險管理中的應用
        門診分診服務態(tài)度與正確率對護患關系的影響
        整機產品成熟度模型研究與建立
        關于新形勢下煙葉生產可持續(xù)發(fā)展的思考
        活力(2019年15期)2019-09-25 07:21:56
        不同成熟度野生水茄果實的種子萌發(fā)差異研究
        種子(2018年9期)2018-10-15 03:14:04
        剛好夠吃6天的香蕉
        煙葉主要真菌病害的發(fā)生與防治
        生意
        品管圈活動在提高介入手術安全核查正確率中的應用
        天津護理(2016年3期)2016-12-01 05:40:01
        生意
        故事會(2016年15期)2016-08-23 13:48:41
        欧美日本国产va高清cabal| 亚洲香蕉av一区二区三区| 国产亚洲综合一区二区三区| 久久不见久久见免费影院www| 久久精品国产亚洲AV高清特级 | 久久蜜桃一区二区三区| 国产青青草在线观看视频| 国产精品 人妻互换| 手机在线精品视频| 国产一级一厂片内射视频播放| 国产一级一级内射视频| 天美传媒一区二区| 亚洲VA不卡一区| 国产一区二区三区探花| 国产精品久久久久久人妻无| 成人一区二区免费视频| 精品无码成人片一区二区| 日韩中文字幕熟女人妻| 粗大的内捧猛烈进出小视频 | 免费高清av一区二区三区| 丰满少妇人妻无码专区| 蜜桃视频中文字幕一区二区三区 | 亚洲线精品一区二区三区八戒| 日本熟妇裸体视频在线| 夜夜夜夜曰天天天天拍国产| 国产自偷亚洲精品页65页| 亚欧同人精品天堂| 亚洲国产精品区在线观看| 丰满少妇三级全黄| 中文字幕无码人妻丝袜| 国产精品黄色在线观看| 久久久久人妻一区二区三区| 曰本女人与公拘交酡免费视频| 久久国产亚洲中文字幕| 一本之道久久一区二区三区| 成人综合婷婷国产精品久久蜜臀| 2021国产精品一区二区在线| 青青草在线免费观看视频| 成午夜精品一区二区三区| 国产精品自在线免费| 国产成人av一区二区三|