亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        小麥霉菌污染支持向量機判別模型的建立

        2021-10-13 11:17:34呂都唐健波趙緒婷劉永翔李俊陳中愛王梅馮亞超
        食品研究與開發(fā) 2021年18期
        關鍵詞:污染模型

        呂都,唐健波,趙緒婷,劉永翔,李俊,陳中愛,王梅,馮亞超

        (1.貴州省農(nóng)業(yè)科學院生物技術研究所,貴州 貴陽 550006;2.遵義師范學院生物與農(nóng)業(yè)科技學院,貴州 遵義 563006;3.葉縣食品檢驗檢測中心,河南 平頂山 467200)

        小麥(Triticum aestivum),為禾本科植物,是一種在世界各地廣泛種植的谷類作物,在我國北方地區(qū)種植面積大,是主要糧食作物之一,約占全國糧食消費總額的20%[1-2]。小麥營養(yǎng)豐富,易被霉菌污染[3],其富含淀粉、蛋白質、脂肪和礦物質是霉菌等微生物生長的良好培養(yǎng)基[4]。當小麥的儲藏條件適宜霉菌和其他微生物生長時,霉菌等微生物會快速繁殖消耗小麥的營養(yǎng)物質[5-6],并產(chǎn)生有毒有害的代謝毒素,造成小麥發(fā)霉變質使其商品性降低,甚至會對人畜產(chǎn)生毒害作用[7]。

        目前,常用的霉菌污染檢測方法主要有平板計數(shù)法[8]、酶聯(lián)免疫法[9]和熒光染色法[10]等,這些方法靈敏度和精準度較高,但是需要的試驗試劑多,試驗的操作過程比較繁瑣,試驗花費的時間較長,檢測的效率較低。近紅外光譜分析技術是由硬件、化學計量學軟件和模型三部分構成,傅里葉變換近紅外光譜儀用于采集樣品的近紅外光譜,化學計量學軟件用于建立預測模型,預測模型用于待測樣品的定量和定性預測分析[11-12]。

        常用化學計量學分類算法主要有偏最小二乘判別分析法(partial least squares-discriminant analysis,PLS-DA)和支持向量機分類法(support vector machine classification,SVM)。PLS-DA是一種有監(jiān)督模式的分析方法,根據(jù)已知樣品集的特征變量,選定適合的判別準則建立分析模型,將光譜數(shù)據(jù)與分類變量進行線性回歸,對未知樣品進行判別分析[13]。樣本數(shù)量越多、差異性越顯著,所建立的PLS-DA判別模型結果越準確[14]。SVM是一種研究小樣本統(tǒng)計學習規(guī)律理論,由Cortes和Vapnik,在1995年首次提出并闡述了其基本原理[15]。SVM采用結構風險最小化準則來控制學習機器的容量從而揭示了過度擬合與泛化能力之間的關系,在樣本量少的情況下,依然能夠很好地對樣本進行識別[16]。本研究以未污染霉菌的小麥和污染霉菌的小麥樣品為研究對象,運用近紅外光譜分析技術結合支持向量機分類方法,建立快速鑒別小麥霉菌污染的判別模型,旨在為小麥的儲藏安全提供快速檢測的技術手段。

        1 材料與方法

        1.1 材料與試劑

        小麥:河南省豫糧糧食集團有限公司;黑曲霉(ATCC 16404):中國工業(yè)微生物菌種保藏中心;馬鈴薯葡萄糖瓊脂培養(yǎng)基:上海博偉生物科技有限公司;75%乙醇(分析純):天津科密歐化學試劑有限公司。

        1.2 儀器與設備

        60Co輻照場:貴州金農(nóng)輻照科技有限責任公司;MPA型傅里葉變換近紅外光譜儀:德國Bruker公司;YXQ-LS-75SII型高壓滅菌鍋、SPX-150B-Z型生化培養(yǎng)箱:上海博迅實業(yè)有限公司醫(yī)療設備廠;SW-CJ-2D型超凈工作臺:蘇州凈化設備有限公司;AB104-N電子天平:上海第二天平儀器廠。

        1.3 方法

        1.3.1 樣品制備

        用自封袋將小麥樣品分裝成200g/份,共分裝63份。放置在60Co輻照場內(nèi)進行輻照處理,處理輻照劑量為15 kGy,確保小麥樣品中的霉菌和其他微生物都被殺滅。將輻照后的每份樣品分為兩份。一份不作任何處理,另一份進行模擬霉菌污染。將黑曲霉活化培養(yǎng),并制備濃度1×106CFU/mL的菌懸液。加入菌懸液模擬霉菌污染,放置在恒溫恒濕箱中培養(yǎng)備用,共計126份樣品。

        1.3.2 近紅外光譜的采集

        以鍍金的漫反射體作參比校正,工作期間,每隔0.5 h掃描一次背景光譜。使用OPUS 7.5軟件,調用積分球不旋轉程序,掃描光譜區(qū)域選用3 594.9 cm-1~12 790.3 cm-1,分辨率為 16 cm-1,掃描次數(shù)為 64 次,每個樣品掃描3次。每隔1 h,進行1次背景光譜采集。

        1.3.3 異常光譜的剔除與光譜數(shù)據(jù)降維

        由于樣品制備和人員操作等原因會獲得少量異常光譜,這可能會導致模型偏差[17-18]。本試驗采用基于馬氏距離的主成分分析來剔除異常光譜。近紅外光譜吸收譜帶重疊嚴重,因此,需要對其進行降維處理。將原始光譜數(shù)據(jù)進行“壓縮”,獲得的少量能代表樣本差異和原始數(shù)據(jù)的變量集合稱為主成分[19],并將獲得的主成分作為支持向量機的輸入變量。用獲得的主成分代替原始光譜數(shù)據(jù)計算馬氏距離,馬氏距離的閾值范圍由閾值權重系數(shù)決定,如果樣本的馬氏距離超過閾值范圍,則將該樣品定義為需要去除的異常樣品。

        1.3.4 樣品訓練集和驗證集的劃分

        在Matlab 2019b中使用基于聯(lián)合x-y距離的樣本集劃分法(sample set partitioning based on joint x-y distance,SPXY),將樣本按照訓練集和驗證集之比為3∶1進行劃分。

        1.3.5 光譜的預處理

        為了消除基線漂移、噪聲和散射效應對近紅外光譜圖的影響,本研究采用平滑(smoothing)、卷積平滑導數(shù)(savitzky golay derivative,SG derivative)、基線校正(baseline)、標準正態(tài)變換(standard normal variate,SNV)、多元散射校正(multiplicative scatter correction,MSC)、消除噪音(noise)、數(shù)據(jù)元素解析處理(deresolve)和歸一化處理(normalize)等預處理方法對輸入變量進行處理,以提高模型的穩(wěn)健性和準確性[20-21]。

        1.3.6 SVM判別模型的建立和優(yōu)化

        將主成分作為支持向量機分類判別模型的輸入變量,將無霉菌污染樣品定義為“1”類,霉菌污染樣品定義為“2”類,作為支持向量機分類判別模型的輸出變量,使用支持SVM方法建立判別模型。以訓練集準確度和內(nèi)部交叉驗證準確度為指標,探究線性核函數(shù)(linear)、多項式核函數(shù)(polynomial)、徑向基核函數(shù)(radial basis function,RBF)和 S型核函數(shù)(sigmoid)的建模效果,然后采用網(wǎng)格全局尋優(yōu)算法確定核函數(shù)參數(shù)C和g的最佳值。

        1.3.7 判別模型驗證

        將31份外部驗證集樣品(未參與判別模型建立的樣品)的近紅外光譜數(shù)據(jù),帶入建好的判別模型中進行驗算獲得判定結果,對判別模型進行外部驗證,根據(jù)判別準確度來評價判別模型的預測能力。

        1.4 數(shù)據(jù)處理

        本實驗數(shù)據(jù)采用 OPUS 7.5、Unscrambler 10.4、Matlab 2019b、和Origin 9.5.0處理分析和作圖。

        2 結果與分析

        2.1 小麥樣品的近紅外光譜圖

        小麥樣品的近紅外光譜圖見圖1。

        圖1 小麥樣品的近紅外光譜圖Fig.1 Near infrared spectra of wheat samples

        近紅外光譜圖主要反映的是有機物中含氫基團(包含C-H、O-H和N-H)振動吸收的情況。由圖1可知,未污染霉菌小麥樣品的近紅外光譜圖和污染霉菌小麥的近紅外光譜峰形相似,且吸收譜帶重疊嚴重,直接從近紅外光譜圖中獲取的信息較少,因此需要使用化學計量學知識和化學計量學數(shù)據(jù)軟件,對其進行更深的分析處理。

        2.2 異常光譜的剔除

        基于馬氏距離的主成分分析[22]剔除異常光譜圖,結果見圖2。

        圖2 基于馬氏距離的主成分分析剔除異常光譜Fig.2 Elimination of abnormal spectra by principal component analysis based on Mahalanobis distance

        由圖2可知,設置置信區(qū)間為95%時,有5個樣品被認定為異常樣品,將其從樣品中剔除掉,剩余有效樣品121份。

        小麥樣品的近紅外光譜圖含有的信息非常多,將剔除異常光譜樣品剩余的121個有效樣品,進行主成分分析提取到8個主成分能夠代表原始樣本的98.80%,主成分分析結果見表1。

        表1 樣品主成分分析結果Table 1 Results of principal component analysis of samples

        2.3 樣品訓練集和驗證集的劃分

        將121份有效樣品進行主成分分析獲得的主成分矩陣,按照訓練集與驗證集之比3∶1的比例,在Matlab 2019b軟件中使用SPXY樣本劃分方法,將樣本劃分為訓練集90份和驗證集31份。將訓練集90份樣品建立判別模型,驗證集31份樣品為外部驗證樣品,對判別模型進行檢驗。

        2.4 最佳預處理方式的選擇

        采用 smoothing、SG dericative、baseline、SNV、MSC、noise、deresolve和normalize等預處理方法對輸入變量進行處理,處理后的輸入變量,見圖3。

        圖3 不同預處理方式處理后的輸入變量譜圖Fig.3 Input variable spectra after different preprocessing methods

        選擇支持向量機分類模型核函數(shù)為RBF,核函數(shù)參數(shù)C取值1,參數(shù)g取值0.125。以訓練集準確度和內(nèi)部交叉驗證準確度為指標,將預處理后的輸入變量使用支持向量機分類方法建立判別模型,結果見表2。

        表2 不同預處理方式對判別模型的影響Table 2 The influence of different preprocessing methods on discriminant model

        表2結果表明,noise方法處理后,模型的訓練集準確度達到100%,但是內(nèi)部交叉驗證準確度只有52.22%,可能是此方法處理的輸入變量建立的判別模型出現(xiàn)了過擬合現(xiàn)象。綜合內(nèi)部訓練集準確度和內(nèi)部交叉驗證準確度,最終確定SNV為最佳預處理方式,與李軍濤[23]的研究結果一致,SNV預處理方式可以消除固體顆粒大小、表面散射以及光程變化對近紅外光譜的影響。SVM判別模型的內(nèi)部訓練集準確度為96.67%,內(nèi)部交叉驗證準確度為93.33%。

        2.5 SVM判別模型的建立與優(yōu)化

        用最佳預處理方式處理后的輸入變量,選擇線性核函數(shù)(linear)、多項式核函數(shù)(polynomial)、徑向基核函數(shù)(radial basis function,RBF) 和 S型核函數(shù)(sigmoid),核函數(shù)參數(shù)C取值1,參數(shù)g取值0.125,建立SVM判別模型,以訓練集準確度和內(nèi)部交叉驗證準確度為指標,結果見表3。

        表3 不同核函數(shù)對判別模型的影響Table 3 The influence of different kernel functions on discriminant model

        表3結果表明,選用的核函數(shù)為linear時,建立的判別模型,內(nèi)部訓練集準確度為98.89%,內(nèi)部交叉驗證準確度為97.78%。

        以linear為支持向量機分類模型核函數(shù),以訓練集準確度和內(nèi)部交叉驗證準確度為指標,由于核函數(shù)為linear,核函數(shù)參數(shù)g值為1,采用網(wǎng)格全局尋優(yōu)算法[24]確定參數(shù)C的最佳值。由于核函數(shù)參數(shù)C值取值范圍較廣,為了作圖方便,以lgC值為橫坐標,以判別模型的準確度為縱坐標,結果見圖4。

        圖4 不同核函數(shù)參數(shù)C值對判別模型的影響Fig.4 The influence of different kernel function parameter C value on discriminant model

        圖4結果表明,當核函數(shù)參數(shù)C值由0.01逐漸增大時,判別模型的訓練集準確度和內(nèi)部交叉驗證準確度也隨著增大。當核函數(shù)參數(shù)C值為10時,建立的SVM判別模型,其內(nèi)部訓練集準確度為100.00%,內(nèi)部交叉驗證準確度為98.89%。當核函數(shù)參數(shù)值C大于10時,內(nèi)部訓練集準確度為100.00%,但是內(nèi)部交叉驗證準確度呈現(xiàn)下降趨勢,準確度為96.67%,因此,確定判別模型核函數(shù)參數(shù)C的最佳取值為10。

        2.6 判別模型的驗證

        將31個外部驗證集樣品的主成分作為輸入變量,帶入建立并優(yōu)化好的SVM判別模型中,獲得樣品的判別結果,將判別結果與樣品的真實分類結果進行比較結果見表4。

        由表4可知,16個無霉菌污染樣品,即定義為“1”類的樣品,全部判定正確;15個霉菌污染樣品,即定義為“2”類的樣品,全部判定正確。因此,本研究所建立的SVM判別模型識別能力強,可以用于小麥中霉菌污染的快速檢測。

        表4 SVM判別模型對外部驗證集樣品的判別結果Table 4 Discriminant results of SVM discriminantmodel for samples of external verification set

        3 結論

        本研究采用近紅外光譜技術結合支持向量機分類法(SVM)建立快速鑒別小麥霉菌污染的判別模型,并對鑒別模型進行了優(yōu)化和驗證。將小麥樣品的原始光譜進行主成分分析提取了8個主成分,能夠代表98.80%的樣本信息,輸入變量的預處理方式為SNV時,SVM判別模型內(nèi)部訓練集準確度為96.67%,內(nèi)部交叉驗證準確度為93.33%。繼續(xù)優(yōu)化SVM判別模型的參數(shù),當判別模型的核函數(shù)為linear時,SVM判別模型,內(nèi)部訓練集準確度為98.89%,內(nèi)部交叉驗證準確度為97.78%。進一步采用網(wǎng)格全局尋優(yōu)算法優(yōu)化核函數(shù)linear參數(shù)C值,當時核函數(shù)linear參數(shù)C值為10時,SVM判別模型,其內(nèi)部訓練集準確度為100.00%,內(nèi)部交叉驗證準確度為98.89%。將未參與建立模型的外部驗證集31份樣品光譜,帶入鑒別模型進行判斷,模型判斷正確率為100%。本研究建立的模型準確可靠,與傳統(tǒng)的培養(yǎng)法和化學分析法相比具有檢測時間短、操作便捷、檢測效率高等優(yōu)點,可以為小麥的安全儲藏提供技術支持。

        猜你喜歡
        污染模型
        一半模型
        什么是污染?
        重要模型『一線三等角』
        什么是污染?
        重尾非線性自回歸模型自加權M-估計的漸近分布
        堅決打好污染防治攻堅戰(zhàn)
        當代陜西(2019年7期)2019-04-25 00:22:18
        堅決打好污染防治攻堅戰(zhàn)
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉換方法初步研究
        對抗塵污染,遠離“霾”伏
        都市麗人(2015年5期)2015-03-20 13:33:49
        免费看又色又爽又黄的国产软件| 久久这里只有精品黄色| 青青草视频视频在线观看| 欲香欲色天天天综合和网| 天美传媒一区二区| 在线人妻无码一区二区| 午夜男女视频一区二区三区| 在线视频色系中文字幕| 人妻少妇中文字幕乱码| 亚洲精品成人网久久久久久| 亚洲熟妇夜夜一区二区三区| 青青草激情视频在线播放| 在线精品无码字幕无码av| 精品少妇一区二区三区视频| 日本啪啪一区二区三区| 亚洲一区二区三区偷拍女| 少妇高潮一区二区三区99| 日韩中文字幕欧美亚洲第一区| 国产后入内射在线观看| 一区二区三区日韩亚洲中文视频| 粗大猛烈进出白浆视频| 日本成人久久| 国内精品国产三级国产avx| 水蜜桃在线观看一区二区| 性生交大全免费看| 国产视频网站一区二区三区| 伊人狼人大香线蕉手机视频| 国产成a人亚洲精品无码樱花| 欲妇荡岳丰满少妇岳| 国产av大片在线观看| 中文字幕在线看精品乱码| 亚洲精品美女久久久久久久| 久久av无码精品人妻糸列| 国产成人av一区二区三| 天天爽夜夜爽夜夜爽精品视频 | 国产一区二区三区在线观看完整版| 51国偷自产一区二区三区| 97SE亚洲国产综合自在线不卡| 亚洲精品一区二在线观看| 亚洲日韩中文字幕无码一区| 99国产精品99久久久久久|