亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        近紅外光譜結(jié)合變量優(yōu)選和GA-ELM模型的干制哈密大棗水分含量研究

        2020-02-25 08:06:16王文霞馬本學羅秀芝李小霞雷聲淵李玉潔孫靜濤
        光譜學與光譜分析 2020年2期
        關(guān)鍵詞:模型

        王文霞, 馬本學, 羅秀芝, 李小霞, 雷聲淵, 李玉潔, 孫靜濤

        1. 石河子大學機械電氣工程學院, 新疆 石河子 832003 2. 農(nóng)業(yè)農(nóng)村部西北農(nóng)業(yè)裝備重點實驗室, 新疆 石河子 832003 3. 石河子大學食品學院, 新疆 石河子 832003

        引 言

        哈密大棗是新疆特色優(yōu)勢果品, 個大肉厚, 外觀紫紅有光澤, 食之有藥香, 是上等的滋補食品和藥用食品[1]。 哈密大棗的鮮食期較短, 大量的鮮棗收獲后進行干制, 將鮮棗的水分含量從70%降低到25%左右, 使其可溶性固形物的濃度達到微生物難以生存和利用的程度[2], 以便貯藏和運輸。 水分含量(MC)作為干制哈密大棗重要品質(zhì)參數(shù)之一, 干制過程中若含水量過少, 會使硬度增加, 口感變差; 若水分含量過高, 會使細菌容易繁殖, 在貯藏和運輸過程中易腐爛變質(zhì)。 因此, 如何實現(xiàn)干制哈密大棗水分含量的快速、 無損檢測就顯得尤為重要。

        近紅外光譜在農(nóng)產(chǎn)品品質(zhì)定量分析領(lǐng)域中得到廣泛應(yīng)用[3-6]。 由于光譜變量中含有大量冗余信息, 從全波長中提取出對模型有效的特征波長變量, 可以進一步提高模型的穩(wěn)定性和準確性[7]。 彭云發(fā)等[8]利用近紅外光譜結(jié)合遺傳算法(genetic algorithm, GA), 對白熟期灰棗的總糖含量進行預測, 建立的偏最小二乘(partial least squares, PLS)預測模型Rp達到0.9583; 胡曉男等[9]使用近紅外光譜結(jié)合無信息變量消除法(uninformative variable elimination, UVE), 對晚熟期駿棗總酸進行預測, 建立的PLS模型Rp為0.8778; 彭海根等[10]利用近紅外光譜結(jié)合聯(lián)合區(qū)間偏最小二乘法(synergy interval partial leset squares, si-PLS), 對南疆灰棗進行糖度預測, 建立的PLS預測模型, 相關(guān)系數(shù)達到0.942; 以上研究主要以鮮棗為研究對象, 而對干制哈密大棗的研究卻鮮有報道。 另外, 有國內(nèi)外學者通過近紅外高光譜對農(nóng)產(chǎn)品水分含量進行研究。 Anisur Rahman等[11]使用高光譜成像對番茄水分含量進行預測, PLS模型相關(guān)系數(shù)為0.81; 楊傳得等[12]使用近紅外光譜技術(shù)對鮮食花生水分含量進行預測, PLS模型決定系數(shù)達到0.936 2。 他們的工作對干制哈密大棗水分檢測具有一定的啟示和借鑒作用。

        采用多種預處理方法結(jié)合變量篩選方法, 將篩選出的與水分含量相關(guān)性較高波長變量, 作為遺傳算法優(yōu)化極限學習機(GA-ELM)的輸入量, 建立干制哈密大棗水分含量的預測模型, 并評價相應(yīng)的模型預測效果, 以此驗證了GA-ELM模型應(yīng)用于干制哈密大棗水分含量預測的可行性, 實現(xiàn)快速、 科學和準確的干制哈密大棗水分含量檢測。

        1 實驗部分

        1.1 材料

        選取220個新疆哈密五堡鄉(xiāng)果園采摘的哈密大棗為研究樣本, 果實成熟后采用自然晾曬干, 顏色深紅, 果實飽滿有彈性, 大小均勻, 無損傷, 平均果重9 g左右。 將挑選好的干制哈密大棗表面擦拭干凈, 并進行編號, 在室溫條件下(28~31 ℃, 27~30% RH)放置48 h, 使樣本溫度和環(huán)境溫度達到一致。 在樣本赤道上選取3個點(間隔約120°)作為光譜采集點, 每個點采集1次, 對3條光譜取平均, 作為該樣本的代表光譜。 使用SPXY方法將220個干制哈密大棗樣本分為170個校正集和50個預測集樣本, 用于建模分析。

        1.2 儀器

        近紅外光譜系統(tǒng)主要由光譜儀(NIRQuest 256-2.5, Ocean Inc., USA), 光源(鹵鎢燈, 30 W, 12 V, QP400-1-VIS-NIR, VIVO, Ocean Optics Inc., USA), 漫反射光纖, 暗箱和計算機組成, 如圖1所示。 光譜范圍為869.19~2 501.14 nm, 共256個波長, 分辨率為9.5 nm。 設(shè)置積分時間為18 ms, 掃描次數(shù)和平滑度分別為32和3, 最后將樣本放置于VIVO光源載物臺上進行近紅外漫反射光譜采集。

        圖1 近紅外光譜采集系統(tǒng)的結(jié)構(gòu)示意圖

        1.3 干制哈密大棗水分含量的測量

        在近紅外光譜數(shù)據(jù)采集后將完整的干制哈密大棗使用電子秤(JY/YP30002, 上海樂平科學儀器有限公司, 精度為0.000 1 g)測量干制哈密大棗的濕重。 然后放入烘干箱(DHG-9070 A, 220 V, 50 Hz, 1 550 W, 溫控范圍: 10~250 ℃)進行脫水, 干燥溫度設(shè)定為105 ℃, 4 h后取出稱重, 然后繼續(xù)放入烘干箱干燥0.5 h, 重復操作直至前后兩次重量誤差不超過2 mg, 記錄此時重量作為樣本的干重值。 將濕重與干重的差值, 除以濕重, 計算出每個樣本的水分含量。 表1為測得220個干制哈密大棗樣本劃分為校正集和預測集的水分含量統(tǒng)計結(jié)果。

        水分含量

        1.4 數(shù)據(jù)處理方法

        1.4.1 預處理方法

        由于受到外部環(huán)境和儀器暗電流的影響, 在光譜數(shù)據(jù)采集過程中存在譜線重疊、 噪音信號和基線漂移等問題, 影響后續(xù)建模精度和穩(wěn)定性[13]。 通過分析, 在869.19~927.77 nm光譜范圍內(nèi)存在較大的噪音, 因此采用927.77~2 501.14 nm范圍內(nèi)的光譜(共247個波段)用于下一步的數(shù)據(jù)分析。 為進一步消除干擾因素影響, 應(yīng)用標準正態(tài)變換(standard normal variate, SNV)、 多元散射(multiplicative scatter correction, MSC)和矢量歸一化(normalization, Norm)等方法處理。

        1.4.2 變量優(yōu)選方法

        在建立預測模型時, 若模型中存在較多與干制哈密大棗水分含量無關(guān)的光譜信息, 會影響模型準確性和計算速度。 光譜特征波段的篩選對后續(xù)建模和預測效果具有較大影響。 因此, 采用聯(lián)合區(qū)間偏最小二乘法(si-PLS)、 遺傳算法(GA)、 連續(xù)投影算法(successive projections algorithm, SPA)及其算法組合等方法來提取特征波長以簡化模型。

        1.4.3 GA-ELM建模方法

        極限學習機(extreme learning machine, ELM)是一種求解單隱含層前饋型神經(jīng)網(wǎng)絡(luò)(SLFN)的學習算法, 其學習速度快, 泛化性能好, 具有高效處理非線性數(shù)據(jù)回歸擬合問題的能力[14]。 ELM與傳統(tǒng)的函數(shù)逼近理論不同, 其預測精度與隱含層節(jié)點的個數(shù)密切相關(guān)。 輸入層與隱含層間的連接權(quán)值wi和隱含層神經(jīng)元閾值bi是隨機生成的, 在給定參數(shù)時可能存在部分數(shù)值為0的情況, 導致隱含層輸出矩陣不滿秩, 使得部分隱含層節(jié)點失效, 進而降低模型的預測精度。 為增強ELM網(wǎng)絡(luò)穩(wěn)定性和預測精度, 用遺傳算法(GA)對ELM神經(jīng)網(wǎng)絡(luò)的wi和bi進行優(yōu)化選擇, 以確定最優(yōu)的ELM模型。

        訓練步驟如下:

        (1)根據(jù)ELM神經(jīng)網(wǎng)絡(luò)的基本拓撲結(jié)構(gòu), 將輸入權(quán)值和閾值級聯(lián)起來, 產(chǎn)生k個初始種群。

        (1)

        其中,Qλ為種群中的第λ(1≤λ≤k)個個體,wij為第i個神經(jīng)元與隱含層第j個神經(jīng)元的連接權(quán)值,bl為第l個隱含層節(jié)點的閾值, 且均為區(qū)間[-1, 1]中的隨機數(shù)。 適應(yīng)度函數(shù)用于評價種群優(yōu)劣程度, 將模型對驗證集的預測均方根誤差作為適應(yīng)度函數(shù), 適應(yīng)度函數(shù)越小, 則模型精度越高。

        (2)

        (2)利用ELM算法隱含層激活函數(shù)(“sig”函數(shù))計算出輸出權(quán)值矩陣。 將歸一化后的樣本數(shù)據(jù)代入模型, 逐個計算每個個體的適應(yīng)度(Fitness_best), 根據(jù)適應(yīng)度函數(shù)值來確定適應(yīng)度較優(yōu)的個體。

        (3)對適應(yīng)度較優(yōu)的個體利用交叉、 變異對種群進行進化, 得到新種群。 并檢查進化代數(shù)g值, 當g小于P時, 返回到第(2)步, 直至g等于P則結(jié)束運算, 選出最優(yōu)個體, 并將其拆分為初始權(quán)值和隱含層閾值, 即可確定最優(yōu)的ELM模型。

        1.5 模型評價

        模型校正和預測性能采用校正相關(guān)系數(shù)(Rc)、 預測相關(guān)系數(shù)(Rp)、 校正均方根誤差(RMSEC)、 預測均方根誤差(RMSEP)表示, 以及剩余預測偏差(RPD)作為評價模型預測能力的指標。 Nicolar[15]指出當RPD小于1.5時, 說明模型預測性能較差; 當RPD值在1.5~2之間說明模型對檢測指標有一定的預測能力; 當在2~2.5之間說明可以粗略對檢測指標進行定量分析; 當在2.5~3之間, 說明具有較好的預測精度。

        2 結(jié)果與討論

        2.1 GA-ELM預測模型參數(shù)優(yōu)化

        在GA-ELM算法中, 參數(shù)的設(shè)置直接影響算法的尋優(yōu)速度和質(zhì)量。 其中, 核函數(shù)的類別和隱含層神經(jīng)元個數(shù)對模型預測能力和穩(wěn)定性的影響最直接, 因此針對GA-ELM模型中核函數(shù)選擇和隱含層神經(jīng)元個數(shù)進行研究。

        (1)核函數(shù)對網(wǎng)絡(luò)的影響: 核函數(shù)的種類一般有“sig”, “sin”和“hardlim”等3種。 將220個干制哈密大棗樣本的原始光譜作為GA-ELM模型輸入量, 使用不同核函數(shù)建立的GA-ELM模型預測結(jié)果如表2所示。 從表中可以看出, 使用“sig”核函數(shù)建立的GA-ELM預測模型相關(guān)系數(shù)達到0.9以上, 具有較強的預測能力, 因此選擇“sig”作為最優(yōu)核函數(shù)。

        (2)隱含層神經(jīng)元個數(shù)對模型的影響: 隱含層神經(jīng)元數(shù)目太少會導致ELM網(wǎng)絡(luò)“欠擬合”, 而數(shù)目太多會導致ELM網(wǎng)絡(luò)“過擬合”。 分別選取10, 20, …, 120個隱含層節(jié)點, 得到12種不同情況下GA-ELM網(wǎng)絡(luò)的預測結(jié)果, 再次進行3次重復測試, 求平均值以比較其擬合情況, 結(jié)果如圖2所示。 當隱含層神經(jīng)元個數(shù)小于50時,Rp大于Rc, 模型存在過擬合現(xiàn)象; 當隱含層神經(jīng)元個數(shù)在50~100時,Rp和Rc呈平穩(wěn)上升趨勢, 且Rc上升趨勢較Rp要快, 模型穩(wěn)定性顯著提高; 當隱含層神經(jīng)元個數(shù)大于100時,Rp急劇下降, RMSEP急劇上升, 模型精度大幅度下降。 因此, 本文選擇隱含層神經(jīng)元個數(shù)為100時, 作為最優(yōu)隱含層神經(jīng)元個數(shù)。

        表2 不同核函數(shù)建立GA-ELM模型的預測結(jié)果

        圖2 隱含層神經(jīng)元個數(shù)對網(wǎng)絡(luò)的影響

        圖3 經(jīng)過SNV后得到的反射光譜

        2.2 光譜預處理

        干制哈密大棗樣本在光譜數(shù)據(jù)采集過程中易受到多種因素的干擾, 需要對其做必要的預處理[16]。 分別使用標準正態(tài)變換(SNV)、 多元散射(MSC)和矢量歸一化(Norm)等方法對原始光譜進行預處理來減弱或消除干擾因素, 主要處理結(jié)果如表3所示。

        表3 不同光譜預處理方法的SVM, ELM和GA-ELM水分含量預測結(jié)果

        通過不同預處理方法處理后建立的SVM, ELM和GA-ELM建模比較分析, 利用SNV處理后的GA-ELM建模效果最佳, 相關(guān)系數(shù)Rp和Rc分別達到0.980 8和0.962 7, RMSEC和RMSEP分別達到0.006 8和0.008 2, RPD達到3.697 2。 因此選SNV處理后的光譜進一步進行特征波長篩選。

        2.3 特征波長篩選

        2.3.1 聯(lián)合區(qū)間偏最小二乘法(si-PLS)

        使用si-PLS方法將光譜數(shù)據(jù)劃分為20個子區(qū)間, 嘗試聯(lián)合4個區(qū)間篩選干制哈密大棗水分含量的特征波長。 運行結(jié)果選擇的最優(yōu)子區(qū)間為[3 11 13 15], 交互驗證均方根誤差(RMSECV)為0.010 5, 同時該區(qū)間組合所對應(yīng)的特征波長范圍為1 096.99~1 175.04, 1 769.98~1 846.85, 1 936.23~2 012.57和2 101.29~2 177.00 nm共52個波長變量, 占全波段的21%, 如圖4所示。 將選出的特征波長作為輸入量, 建立GA-ELM預測模型, 結(jié)果如表4所示。

        圖4 si-PLS波長提取

        2.3.2 遺傳算法(GA)

        遺傳算法(genetic algorithm, GA)是一種通過模擬自然進化過程搜索最優(yōu)解的方法。 本研究中, 遺傳算法的參數(shù)設(shè)定為: 初始種群50, 變異概率0.005, 遺傳迭代次數(shù)為100和收斂率為0.5。 圖5為GA迭代所選光譜變量的頻率圖, 圖6表示被選波長變量數(shù)所對應(yīng)的RMSECV值的變化, 圖中綠色圓點表示當選取115個波長變量時, 其PLS模型的RMSECV最低(0.01), 所選取的波長變量占全波段的46.5%, 建立GA-ELM預測模型, 結(jié)果如表4所示。

        圖5 GA篩選波段的頻率分布

        圖6 GA波長提取

        2.3.3 連續(xù)投影算法(SPA)

        連續(xù)投影算法(successive projections algorithm, SPA)是一種新興的特征波長篩選方法, 能夠有效消除波長變量之間共線性的影響, 進而有效提取出特征波長變量[14]。 在干制哈密大棗水分含量特征波長篩選中, 指定波長數(shù)N范圍設(shè)定為1~50。 圖7為RMSECV值隨SPA選擇變量數(shù)增加變化圖, 當m_max=14時, RMSECV值最低, 模型擬合效果最佳, 篩選出14個特征波長(927.77, 966.83, 1 090.48, 1 129.51, 1 298.49, 1 467.04, 1 680.03, 1 789.22, 1 840.45, 1 917.11, 1 974.44, 2 227.3, 2 314.97和2 464.1 nm)占全波長的5.6%。 將篩選的特征波長作為輸入量建立GA-ELM預測模型,Rc和Rp分別達到0.984 2和0.967 5, RMSEC和RMSEP分別達到0.006 1和0.007 9, RPD為3.952 8。 其中Rp較全波長預測模型提高0.004 8, RMSEP降低0.000 3, RPD提高了0.255 6, 說明SPA能夠從全波長中刪除與水分含量不相關(guān)的光譜信息, 提取有效光譜信息, 提高模型預測精度。 圖8表示所篩選的干制哈密大棗水分含量特征波段在全波段中的分布狀況。

        圖7 RMSECV值隨SPA選擇變量數(shù)增加變化圖

        圖8 SPA選擇的14個特征波長分布圖

        2.4 建立干制哈密大棗水分含量預測模型

        為比較不同特征波長篩選方法對GA-ELM模型性能的影響, 對SNV處理后的全波段光譜、 GA、 si-PLS和SPA及組合算法提取的特征波長光譜數(shù)據(jù)分別建立對應(yīng)的預測模型, 結(jié)果如表4所示。

        表4 不同波長提取方法的水分含量GA-ELM建模結(jié)果

        結(jié)果顯示, 采用SPA和GA-SAP方法篩選出的14個和13個特征波長建立的GA-ELM模型均得到較高的預測結(jié)果, 且SPA+GA-ELM預測結(jié)果中Rc和Rp的0.984 2和0.967 5均高于全波長的0.980 8和0.962 7, 進一步提高了模型的精度和穩(wěn)定性, 圖9和圖10分別為GA優(yōu)化進化過程和ELM預測結(jié)果。

        圖9 進化過程

        圖10 校正集和預測集干制哈密大棗水分含量預測值與真實值的關(guān)系

        Fig.10 Correlation of predicted value and actual value of dried Hami big jujubes MC for calibration set and validation set

        3 結(jié) 論

        采用近紅外光譜結(jié)合GA-ELM神經(jīng)網(wǎng)絡(luò)建立干制哈密大棗水分含量預測模型, 通過多種預處理方法結(jié)合波段篩選方法, 能夠有效提高模型的預測精度, 實現(xiàn)干制哈密大棗水分含量的準確預測。 以220個干制哈密大棗樣本為研究對象, 按照170∶50劃分校正集和驗證集, 使用多種預處理方法結(jié)合特征波長篩選方法(si-PLS, GA, SPA及它們的組合), 分別建立SVM, ELM和GA-ELM定量預測模型。 采用SNV+SPA組合提取的14個特征波長建立的GA-ELM預測模型效果最佳,Rc和Rp分別為0.984 2和0.967 5, RMSEC和RMSEP分別為0.006 1和0.007 9, RPD為3.678 8, 得到了較為理想的預測結(jié)果。 結(jié)果表明: GA-ELM預測模型具有較好的魯棒性和泛化能力, 通過遺傳算法對網(wǎng)絡(luò)連接權(quán)值和閾值進行優(yōu)化, 改善了普通ELM連接權(quán)值和閾值的隨意性所帶來預測精度不穩(wěn)定性。 同時由于ELM神經(jīng)元個數(shù)的大幅度縮減, 使得網(wǎng)絡(luò)訓練時間大大縮短, 且預測精度的有效提高, 對解決近紅外光譜技術(shù)在農(nóng)產(chǎn)品無損檢測中數(shù)據(jù)量大、 數(shù)據(jù)波動大的問題具有重要的意義。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機模型
        提煉模型 突破難點
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        91九色国产老熟女视频| 成人a在线观看| 白丝美女被狂躁免费视频网站| 男女啦啦啦视频在线观看| 免费国产在线精品一区二区三区免| 潮喷大喷水系列无码久久精品| 狠狠躁夜夜躁人人爽天天不卡软件| 日本熟妇hd8ex视频| 日本一区人妻蜜桃臀中文字幕| 人妻少妇偷人精品久久性色av | 射进去av一区二区三区| 日本中文字幕一区二区有码在线| 中文字幕无码日韩专区免费| 久草午夜视频| 亚洲天堂av另类在线播放| 亚洲精选自偷拍一区二| av 日韩 人妻 黑人 综合 无码| 亚洲产国偷v产偷v自拍色戒| 夫妻一起自拍内射小视频| 亚洲精品一区二区高清| 日韩精品久久久久久久电影蜜臀| 亚洲 欧美 唯美 国产 伦 综合| 国产精品麻豆A在线播放| 国产三级精品三级在线专区2| 香蕉免费一区二区三区| 少妇极品熟妇人妻无码| 日本一区二区三区专区| 日韩一区二区av极品| 夜夜添夜夜添夜夜摸夜夜摸| 日韩一级特黄毛片在线看| 亚洲高清美女久久av| 国产一区二区视频在线免费观看| 国产如狼似虎富婆找强壮黑人| 中文字幕亚洲综合久久菠萝蜜| 五十路一区二区中文字幕| 五月天激情电影| 美女自卫慰黄网站| 午夜一区二区三区av| 国产白浆在线免费观看| 国产精品igao视频| 欧美手机在线视频|