亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于變量組合集群分析法的小麥蛋白質近紅外光譜變量選擇方法研究

        2016-11-30 06:23:33趙環(huán)宦克為鄭峰石曉光
        關鍵詞:方法模型

        趙環(huán),宦克為,鄭峰,石曉光

        (長春理工大學 理學院,長春 130022)

        基于變量組合集群分析法的小麥蛋白質近紅外光譜變量選擇方法研究

        趙環(huán),宦克為,鄭峰,石曉光

        (長春理工大學 理學院,長春 130022)

        為了解決小麥蛋白質的近紅外光譜信息復雜、共線性嚴重及全光譜建模的預測能力不足等問題,采用一種新的變量選擇方法——變量組合集群分析法(VCPA)對小麥蛋白質的近紅外光譜進行特征波長選取。首先利用二進制矩陣采樣策略(BMS)和指數(shù)衰減函數(shù)(EDF)刪除無信息變量,優(yōu)選小麥中蛋白質近紅外特征波長,然后結合偏最小二乘法(PLS)建立預測模型。與其他變量選擇方法相比,VCPA所選用的波長點最少,模型的預測能力最強,VCPA算法所采用的BMS變量采樣策略彌補了蒙特卡洛采樣方法的不足。研究結果表明,VCPA算法可以有效選擇小麥蛋白質近紅外光譜特征波長,提高預測模型的可靠性和適用性。

        小麥;近紅外光譜;變量組合集群分析法;特征波長;二進制矩陣采樣;指數(shù)遞減函數(shù)

        隨著現(xiàn)代化學分析儀器的發(fā)展,應用近紅外光譜分析從復雜的分析系統(tǒng)生成的高維度化學和生物學數(shù)據時變量選擇方法是一個重要的環(huán)節(jié)。變量選擇的目標和意義被總結為三個層面:(1)提高模型的預測精準性;(2)通過減少維度災難進而更快的進行模型計算;(3)提供一個更容易理解的潛在變量數(shù)據的生成過程。然而,在面對變量多樣本少的情況時,在眾多變量中找到一組滿足上述三個方面的最佳變量組合是較難的。隨著化學計量學的發(fā)展,國內外提出了大量的變量選擇方法,并以不同的方式處理上述三個問題。如粒子群算法[1](PSO)、遺傳學算法[2-4](GA)、無信息變量消除法(UVE)、蒙特卡洛無信息變量消除法[5](MC-UVE)和隨機蛙跳算法[6](RF)等。雖然國內外提出了大量的變量選擇方法,但是很少有算法考慮了變量組合因素的影響。本文首次運用了變量組合集群分析法[7](VCPA)對小麥蛋白質的近紅外光譜進行了特征變量選取,該方法考慮到了所有可能有相互影響的變量的自由組合,對比其他變量選擇方法的預測精準性,評價模型的預測性能,結果表明,VCPA算法是一種可行的變量選擇方法。

        1 實驗儀器及樣品采集

        1.1 實驗儀器

        本次實驗選用的光譜儀是德國卡爾蔡司的MCS611NIR光纖光譜儀,其光譜范圍為950~1690nm,自制光纖束,樣品皿,計算機,環(huán)帶光纖耦合漫透射反射接收器和光源為OSRAM64258,12V,20W鹵鎢燈。每個小麥樣品采集3條光譜,計算出每個樣品三條吸光度的平均值,建立小麥蛋白質預測模型。

        1.2 樣品采集

        本次實驗所使用的實驗數(shù)據來自國家糧食局北京東方孚德研究中心提供的93個小麥樣品和93個小麥蛋白質化學值數(shù)據,選用校正集和預測集的分類方法為Kennard-Stone(K-S)算法,運用K-S算法將北京東方孚德研究中心所提供的93個小麥樣品分為61個校正集和32個預測集。如表1所示:

        表1 小麥的蛋白質含量值統(tǒng)計表

        2 模型評價及光譜預處理

        模型評價參數(shù)的作用是檢驗通過校正集樣本建立的預測模型可靠性。在近紅外光譜多元校正建模過程中,經常采用的模型評價參數(shù)為預測殘差平方和(PRESS),交互檢驗均方根誤差(RMSECV),預測值與實際值之間的相關系數(shù)(R)等,本次實驗采用的模型評價參數(shù)分別是建模均方根誤(RMSEC)、校正集決定系數(shù)(RC2)和預測均方根誤差(RMSEP)。

        光譜數(shù)據采集時產生的高頻噪音和低頻噪音會影響近紅外光譜與小麥蛋白質含量之間的相關關系,進而影響預測模型的可靠性,為了避免這些高頻噪音和低頻噪音的影響,本文采用小波包(WTP)對光譜信號進行去噪處理,得到更加準確的小麥蛋白質近紅外光譜數(shù)據[8],如圖1所示。

        圖1 WTP降噪后小麥近紅外光譜圖

        3 VCPA特征變量選擇方法的研究

        3.1 VCPA算法原理

        VCPA是一種新的變量選擇算法,該算法首先運用二進制矩陣采樣法(BMS)從變量空間中采樣k組變量子集,其次運用偏最小二乘法(PLS)分別計算出這k組變量子集的RMSECV,保留RMSECV最小的σ×k組變量子集,統(tǒng)計這σ×k組變量子集中每個變量出現(xiàn)的頻率,通過指數(shù)衰減函數(shù)(EDF)去掉出現(xiàn)頻率較小的波長點,將所保留的變量重復BMS采樣和EDF消除,此過程重復N次,剩余了L個光譜變量,最后計算出這L個變量之間的所有變量組合的RMSECV,其RMSECV值最小的變量組合即為最終所選取的特征變量組合。

        3.2 基于VCPA的特征變量選擇

        VCPA算法是一種考慮了所有變量組合效應的新算法,首先應用主成分分析(PCA)得到校正集建模數(shù)據的最大主成分數(shù)為13,其次通過對其他控制參數(shù)的大量實驗測試,設定為:采樣次數(shù),k=1000;迭代次數(shù)N=50;k個變量子集中優(yōu)秀子集所占的比率σ=10%;二進制采樣矩陣M中每個變量被采樣的次數(shù)占總采樣次數(shù)的百分比α=0.5,剩余變量數(shù)目L=14。

        通過BMS對校正集變量進行1000次變量采樣,此過程不僅能得到1000組不同的變量組合,而且還能確保每個變量具有相同的被采樣概率,通過PLS分別計算出這1000組變量組合的RMSECV,得到1000個不同的RMSECV,最后選出RMSECV值最小的100組變量組合,所選的100組變量組合的RMSECV如圖2所示。

        圖2 二進制矩陣采樣法所采樣的1000個變量子集

        統(tǒng)計這100組變量組合中每個變量出現(xiàn)的頻率,并通過EDF刪除這100組變量組合中出現(xiàn)頻率較小的變量,得到一個新的校正集數(shù)據,之后對這個新的校正集數(shù)據繼續(xù)做1000次BMS采樣、RMSECV最小的100個變量組合篩選、統(tǒng)計每個變量出現(xiàn)頻率和EDF變量刪除。此過程循環(huán)50次之后只剩下了14個光譜變量,最后通過PLS計算出這14個光譜變量之間所有變量組合的RMSECV,其RMSECV值最小的變量組合為最終通過VCPA所選取的特征變量組合。其保留的特征光譜波長為969.5178nm,1002.711nm,1006.35nm,1115nm,1131.815nm,1138.49nm,1251.015nm,1254.12nm,1281.813nm,1561.12nm,1691.09nm。如圖3所示:

        圖3 平均光譜和VCPA保留的波長

        運用通過VCPA選取的特征變量結合PLS建模,所得模型的RMSEC為0.2779,RC2為0.9210,RMSEP為0.3530,預測集決定系數(shù)(RP2)為0.8932,所得模型校正集的實際值與預測值之間的散點圖和預測集的實際值與預測值之間的散點圖如圖4所示。

        圖4 基于WTP-VCPA-PLS的小麥蛋白質含量的預測值與真實值之間的散點圖分布

        4 結果分析

        運用VCPA結合PLS所建立的小麥蛋白質含量預測模型,其預測結果對比其他建模方法GA-PLS,RF-PLS,MC-UVE-PLS和全光譜建模,結果如表2所示,為了避免每種建模方法在運行過程中隨機性對變量選擇結果的影響,我們將每種變量選擇方法運行50次,取RMSEP最小的變量組合作為每種變量選擇方法的最終運行結果。

        表2 小麥蛋白質含量預測結果比較

        對比運用不同建模方法得到的小麥蛋白質含量的預測結果,從表2中可以看出基于每種變量選擇方法的PLS所得預測精準度都要強于基于全光譜的PLS建模,這表明在建立小麥蛋白質含量預測模型前執(zhí)行變量選擇是必要的,相比之下,通過WTP-VCPA-PLS建立的小麥蛋白質含量預測模型精準度最佳,對比WTP-PLS的預測結果,其RMSEP由0.4974下降到了0.3530,預測精準度提升了29%,此外,WTP-VCPA-PLS,WTP-GAPLS,WTP-RF-PLS和WTP-MC-UVE-PLS都采用了較少的變量進行建模,這一現(xiàn)象證明了,運用較少的變量建立小麥蛋白質含量預測模型可以實現(xiàn)更好的預測能力。對比WTP-VCPA-PLS與WTP-GA-PLS可以看出,其RMSEP由0.4143下降到了0.3530,這是因為VCPA所采用的EDF變量刪除策略每執(zhí)行一次,一些貢獻較小的變量就會被刪除,隨著EDF的執(zhí)行,變量空間會越來越小,進而在更小的變量空間確立最佳變量組合,提高了有用變量之間的組合概率,避免了無信息變量和干擾變量的影響。對比WTP-VCPA-PLS與WTP-RFPLS和WTP-MC-UVE-PLS可以看出其RMSEP分別由0.3881,0.3808下降到了0.3530,這是因為WTP-RF-PLS和WTP-MC-UVE-PLS采用的蒙特卡洛采樣策略不能保證每個變量具有相同的被采樣概率,而VCPA所采用的BMS采樣策略彌補了蒙特卡洛采樣的不足。

        5 結論

        利用VCPA算法選擇小麥蛋白質近紅外特征波長,建立PLS預測模型,與全光譜PLS建立的小麥蛋白質含量預測模型相比,其RMSEP由0.4974下降到了0.3530,預測精準度提升了29%,光譜變量由全光譜的256個下降到了11個,極大的減少了變量數(shù)目,簡化了模型,研究證明,VCPA算法可以有效選擇小麥蛋白質近紅外光譜的特征波長,簡化模型,提高計算效率,增強模型的可靠性。

        [1] 梁逸曾,徐青松.復雜體系儀器分析——白、灰、黑分析體系及其多變量解析方法[M].北京:化學工業(yè)出版社,2012:242-247.

        [2] Leardi R.Application of genetic algorithm–PLS for feature selection in spectral data sets[J].Chemometr,2008,14(5-6):643.

        [3] Leardi R,Genetic algorithms in chemometrics and chemistry a review[J].Chemometr,2001,15(7):559-569.

        [4] Yun Y H,Cao D S,Tan M L,et al.A simple idea on applying large regression coefficient to improve the genetic algorithm–PLS for variable selection in multivariate calibration[J].Chemometr.Intell. Lab.Syst,2014(130):76-83.

        [5] Yun Y H,Wang W T,Tan M L,et al.A strategy that iteratively retains informative variables for selecting optimal variable subset in multivariate calibration[J].Anal.Chim.Acta,2014(807):36-43.

        [6] 朱逢樂,何勇,邵詠妮.應用近紅外高光譜成像預測三文魚肉的水分含量[J].光譜學與光譜分析,2015(1): 113-117.

        [7] Yun Y H,Wang W T,Deng B C,et al.Using variable combination population analysis for variable selection in multivariable calibration[J].Anal.Chim. Acta,2015,862:14-23

        [8] 張賀龍,邸旭,石曉光,等.基于小麥近紅外漫反射光譜的小波閾值去噪方法研究[J].長春理工大學學報:自然科學版,2010,33(4):46-49.

        Research on Variable Selection of Protein in Wheat Near Infrared Spectroscopy Based on Latent Projective Graph

        ZHAO Huan,HUAN Kewei,ZHENG Feng,SHI Xiaoguang
        (School of Science,Changchun University of Science and Technology,Changchun 130022)

        In order to solve the near infrared spectra of wheat protein complex information,collinearity serious and full spectrum of modeling prediction ability is insufficient,a new method of variable selection is adopted what variable combination population analysis(VCPA) on the near infrared spectrum characteristics of wheat protein wavelength selection.Based on the features of the binary matrix sampling(BMS) and uninformative variable elimination strategy of index decreasing function(EDF),VCPA explored optimally the efficient wavelength from the NIR spectroscopy the wheat to develop models for prediction the protein of the wheat.The results showed that the performance of VCPA model was superior to the performances from others selection variables method with the least variable.Good prediction performance was obtained for protein of wheat.the BMS variable sampling strategy made up for the deficiency of the Monte Carlo sampling method.The study demonstrated that VCPA could effectively select the characteristic wavelengths of NIR spectral to improve the model robustness and applicability.

        Wheat;Near infrared spectroscopy;Variable combination population analysis;Characteristic wavelengths;Binary matrix sampling;index decreasing function

        O657.33

        A

        1672-9870(2016)05-0051-04

        2016-05-05

        2014年度國家公益性行業(yè)(氣象)科研專項課題(GYHY201406037);2011年高等學校博士學科點專項科研基金聯(lián)合資助項目(20112216110006)

        趙環(huán)(1990-),男,碩士研究生,E-mail:545149375@qq.com

        宦克為(1982-),男,博士,講師,E-mail:huankewei@126.com

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        學習方法
        可能是方法不對
        3D打印中的模型分割與打包
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        中文字幕无线码免费人妻| 色婷婷精品国产一区二区三区| 亚洲一区免费视频看看| 亚洲av无码专区国产乱码4se| 99久久婷婷国产综合精品电影| 猫咪www免费人成网最新网站| 国产精品无码久久AⅤ人妖| 日韩av在线不卡一区二区| 国产综合精品一区二区三区| 亚洲中文字幕无码专区| 777久久| 在线观看一区二区蜜桃| 婷婷丁香五月激情综合| 少妇人妻偷人精品一区二区| 国产成人精品人人做人人爽| 国产激情综合五月久久| 麻豆婷婷狠狠色18禁久久| 熟妇与小伙子matur老熟妇e| 亚洲色图在线视频免费观看| 国语对白在线观看免费| 自愉自愉产区二十四区| 国产精品三级在线观看| 国产亚洲精品高清视频| 99久久99久久精品国产片| 好大好深好猛好爽视频免费| 男人阁久久| 中文字幕亚洲一二三区| 国产精品久久国产精品99| 久久99热精品这里久久精品| 一区二区三区夜夜久久| 亚洲国产精品日本无码网站| 日韩乱码人妻无码中文字幕视频| 自慰高潮网站在线观看| 在线国人免费视频播放| 亚洲欧美日韩国产精品一区二区| 99ri国产在线观看| 久久精品国产亚洲av沈先生| 久爱www人成免费网站| 在线观看免费午夜大片| 亚洲伊人成综合网| 久久频精品99香蕉国产|