亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于近紅外光譜及鄰域粗糙集算法的稻谷貯藏品質(zhì)無損鑒別

        2019-12-19 07:56:00苑江浩趙會(huì)義
        食品與機(jī)械 2019年11期
        關(guān)鍵詞:鄰域稻谷脂肪酸

        楊 東 常 青 苑江浩 - 曹 陽 趙會(huì)義 -

        (國家糧食和物資儲(chǔ)備局科學(xué)研究院,北京 100037)

        稻谷是中國三大儲(chǔ)備原糧之一,其貯藏品質(zhì)及食用品質(zhì)備受國民關(guān)注[1-2]。稻谷在貯藏過程中易受倉內(nèi)溫濕度失衡、糧蟲侵蝕、霉菌侵染等影響使其品質(zhì)發(fā)生劣變,導(dǎo)致儲(chǔ)存稻谷出庫時(shí)數(shù)量及質(zhì)量損失嚴(yán)重[3-4]。因此,了解稻谷在貯藏過程中的品質(zhì)變化趨勢(shì),明確稻谷在貯藏過程中的宜存狀況,建立適宜的檢測方法實(shí)現(xiàn)稻谷貯藏品質(zhì)的有效鑒別,是當(dāng)前糧食貯藏領(lǐng)域急需攻克的技術(shù)難題[5]。

        脂肪酸值是衡量稻谷貯藏品質(zhì)變化趨勢(shì)的重要指標(biāo)之一[6],又可通過其實(shí)測值區(qū)間范圍確定當(dāng)前稻谷樣品的宜存狀況。然而,稻谷中脂肪酸含量的常規(guī)檢測方法通常以理化試驗(yàn)為主,存在檢測周期長、儀器成本較高且損傷樣品等問題,不適合現(xiàn)場快速、無損、批量檢測的需求[7]。

        近紅外光譜技術(shù)因其快速、無損、操作簡單、樣品無需預(yù)處理等特性,已被廣泛應(yīng)用于水果、蔬菜、肉類等農(nóng)產(chǎn)品品質(zhì)檢測方面[8-9],也有其應(yīng)用于稻米品質(zhì)檢測的報(bào)道[10]。而且國家已出臺(tái)了有關(guān)稻谷水分、粗蛋白質(zhì)等指標(biāo)近紅外分析模型的建立標(biāo)準(zhǔn)[11]。蔣曉杰等[12-13]以主成分分析及偏最小二乘回歸為核心算法,開展了稻谷中脂肪酸值近紅外光譜建模研究工作,并取得一定成效。文韜等[14]研究了稻谷的霉變狀況與脂肪酸值的變化規(guī)律,建立了二者的關(guān)系模型。

        特征波段優(yōu)選是光譜分析建模的重要環(huán)節(jié)之一,采用適宜的算法優(yōu)選出能夠表征樣品本質(zhì)特性的波長變量,可以提升建模效率和預(yù)測精度。鄰域粗糙集(neighborhood rough set,NRS)是針對(duì)目標(biāo)不確定性進(jìn)行數(shù)據(jù)約減或分類的算法,已在光譜波段選擇中得到了應(yīng)用,Liu等[15]在基于高光譜技術(shù)檢測大豆品種研究中利用了粗糙集算法進(jìn)行波段選擇,從而實(shí)現(xiàn)大豆品種的有效分類;朱啟兵等[16]將鄰域粗糙集算法與高光譜散射圖像相結(jié)合,成功地應(yīng)用于蘋果粉質(zhì)化程度檢測。但多數(shù)研究所建模型的復(fù)雜度可進(jìn)一步簡化,準(zhǔn)確性與穩(wěn)定性還有待提升。此外,將稻谷的貯藏品質(zhì)作為分類標(biāo)準(zhǔn),建立近紅外光譜鑒別稻谷宜存狀態(tài)的定性分析模型的研究還未見報(bào)道。

        試驗(yàn)擬以貯藏稻谷為分析對(duì)象,以脂肪酸值為指標(biāo)將稻谷樣品存儲(chǔ)狀態(tài)劃分為三類,引入鄰域粗糙集算法進(jìn)行光譜特征優(yōu)選,與隨機(jī)森林算法結(jié)合建立稻谷宜存狀態(tài)的鑒別模型,并對(duì)模型進(jìn)行驗(yàn)證和比較,為稻谷品質(zhì)安全現(xiàn)場快檢技術(shù)發(fā)展提供方法借鑒。

        1 材料與方法

        1.1 樣本制備

        稻谷樣品主要來源于黑龍江、吉林、江蘇、安徽等中國主要粳稻主產(chǎn)區(qū)某些地方糧食儲(chǔ)備庫,選取當(dāng)?shù)鼐哂写硇?,種植品種較多的庫存稻谷樣品進(jìn)行扦樣,所有樣品入庫水分含量均在13.4%~14.3%,滿足國家收購標(biāo)準(zhǔn),300余份樣品收集后標(biāo)記密封保存,運(yùn)到實(shí)驗(yàn)室進(jìn)行后期參數(shù)測定。經(jīng)整理后有效樣品285份,首先進(jìn)行光譜數(shù)據(jù)采集,隨后利用GB/T 15684—2015《谷物碾磨制品 脂肪酸值的測定》方法測定出樣品中的脂肪酸值含量。隨機(jī)選擇190份樣品作為校正集用于模型的構(gòu)建,剩余樣品作為測試集用于模型的驗(yàn)證。

        1.2 儀器設(shè)備

        近紅外光譜分析儀:Sup NIR-3000型,聚光科技(杭州)有限公司;

        全溫振蕩器:HZQ-Q型,廣州永程科學(xué)設(shè)備有限公司;

        電子天平:ML 204型,梅特勒—托利多儀器有限公司;

        組織搗碎機(jī):8010 BU型,青島圣吉儀器系統(tǒng)有限公司;

        碾米機(jī):JNM-II型,吉林省鼎立機(jī)械設(shè)備有限公司;

        試驗(yàn)礱谷機(jī):THU35B型,北京東孚久恒儀器技術(shù)有限公司。

        1.3 近紅外光譜采集

        采集光譜范圍1 000~1 800 nm,波長準(zhǔn)確性±0.2 nm,波長重復(fù)性<0.05 nm,分辨率(10.9±0.3) nm,每間隔1 nm取一次光譜數(shù)據(jù),每個(gè)樣品重復(fù)3次裝樣,掃描32次取平均得到最終樣本光譜數(shù)據(jù)。

        1.4 脂肪酸值測定

        按GB/T 15684—2015《谷物碾磨制品 脂肪酸值的測定》執(zhí)行,每個(gè)樣本作3次平行試驗(yàn),取平均值作為最終結(jié)果。根據(jù)GB/T 20569—2006《稻谷儲(chǔ)存品質(zhì)判定規(guī)則》中相關(guān)規(guī)定,粳稻谷脂肪酸值(KOH/干基)可將稻谷宜存狀況劃分為宜存(≤ 25 mg/100 g)、輕度不宜存(≤ 35 mg/100 g)、重度不宜存(>35 mg/100 g)三類。試驗(yàn)將這三類狀態(tài)作為模型的輸出結(jié)果,開展稻谷貯藏品質(zhì)鑒定方法的研究。

        1.5 數(shù)據(jù)分析方法

        1.5.1 隨機(jī)森林 隨機(jī)森林(RF)是一種非參數(shù)、非線性的分類和回歸算法,利用其集成學(xué)習(xí)方法的優(yōu)勢(shì),可以快速處理高維數(shù)據(jù),能夠有效地防止過擬合現(xiàn)象[17-18]。試驗(yàn)中決策樹數(shù)量的范圍設(shè)置為1~1 000,決策樹具體數(shù)量與對(duì)應(yīng)分裂變量個(gè)數(shù)利用10折交互驗(yàn)證方法優(yōu)選。

        1.5.2 鄰域粗糙集概念 經(jīng)典粗糙集(Rough Set,RS)理論將知識(shí)理解為對(duì)數(shù)據(jù)的劃分,將分類理解為在特定空間上的等價(jià)關(guān)系,可對(duì)不確定或不精確的知識(shí)利用特征屬性進(jìn)行描述或約減[19]。但利用RS理論進(jìn)行連續(xù)數(shù)據(jù)處理時(shí)需首先對(duì)其進(jìn)行離散化,會(huì)導(dǎo)致原始數(shù)據(jù)特征屬性出現(xiàn)損失,因此引入鄰域的概念到RS理論中,形成鄰域粗糙集模型用于解決集合中數(shù)值型特征變量離散化的過程[16,20],具體描述如下:

        (1)

        (2)

        (3)

        (4)

        式中:

        Q——鄰域?qū)傩?,歸屬于整體鄰域系統(tǒng);

        D——整體鄰域系統(tǒng)的決策屬性;

        NQD——決策屬性D關(guān)于Q鄰域的下近似或上近似;

        Xi——等價(jià)類,集合U被決策屬性D劃分為N個(gè)等價(jià)類;

        xi——樣本集數(shù)據(jù);

        δQ(xi)——由屬性Q和度量Δ(xi)生成的鄰域信息粒子。

        可變精度(β)是鄰域粗糙集模型中重要參數(shù)之一,通常0.5<β≤1.0。β與鄰域范圍(δ)的參數(shù)設(shè)定直接影響到鄰域粗糙集模型的性能及對(duì)數(shù)據(jù)的分析結(jié)果,因此β與δ參數(shù)匹配與選擇是模型建立的重要環(huán)節(jié)[21]。

        1.6 模型評(píng)價(jià)

        模型的評(píng)價(jià)標(biāo)準(zhǔn)主要是通過正確判別率(correct classification rate,CCR)檢驗(yàn),即正確判別的樣本個(gè)數(shù)(Nc)占總樣本個(gè)數(shù)(Nt)的百分比。此外,敏感性和特異性也用于分類模型的評(píng)判[22],通常敏感性和特異性的值越接近于1表明模型的性能越好。公式為:

        (5)

        (6)

        式中:

        Se——敏感性值;

        Sp——特異性值;

        TP——真正類,即真樣本被判別為真樣本的數(shù)量;

        FN——假正類,即真樣本被判別為偽樣本的數(shù)量;

        TN——真負(fù)類,即偽樣本被判別為偽樣本的數(shù)量;

        FP——假負(fù)類,即偽樣本被判別為真樣本的數(shù)量;

        2 結(jié)果與討論

        2.1 脂肪酸值實(shí)測數(shù)據(jù)分析

        表1為稻谷樣本脂肪酸值實(shí)測數(shù)據(jù)基礎(chǔ)參數(shù)統(tǒng)計(jì)結(jié)果。其中校正集樣本(n=190)均值和方差分別為24.15,10.67 mg/100 g,測試集樣本(n=95)分別為22.47,9.27 mg/100 g,兩個(gè)數(shù)據(jù)集具有可比較的參數(shù)統(tǒng)計(jì)量,此外,測試集樣本脂肪酸含量數(shù)據(jù)范圍(12.98~60.21)恰好被校正集樣本數(shù)據(jù)范圍(12.11~67.90)所覆蓋,符合基本建模需求,進(jìn)一步表明樣本數(shù)據(jù)集的劃分具有一定的合理性。圖1為校正集樣本脂肪酸值實(shí)測數(shù)據(jù)散點(diǎn)圖。由圖1可知,稻谷樣本多處于宜存或輕度不宜存狀態(tài),只有少量樣本脂肪酸值>35 mg/100 g,處于重度不宜存狀態(tài)。三類狀態(tài)樣本點(diǎn)數(shù)據(jù)離散的分布在各自閾值區(qū)間內(nèi),可作為分類模型的參考依據(jù),但在閾值(25,35 mg/100 g)邊緣處存在易混狀態(tài)樣本,可能會(huì)影響模型的性能。

        2.2 光譜特性分析

        圖2為采集到稻谷樣品經(jīng)過平滑處理后的光譜數(shù)據(jù)分布圖。由圖2可知,在測試范圍內(nèi)(1 000~1 800 nm),所有稻谷樣品光譜曲線分布趨勢(shì)基本一致,不同脂肪酸含量樣本在吸光度方向上呈現(xiàn)梯度式變化趨勢(shì)。脂肪酸含量的變化致使其光譜吸收特性存在差異,可能與稻谷在貯藏過程品質(zhì)變化趨勢(shì)相關(guān)。測試范圍內(nèi)含有多個(gè)不同的吸收波段(1 116,1 204,1 450 nm),可能與稻谷樣品中包含OH、CH、NH等含氫基團(tuán)的內(nèi)部組分及其含量的不同相關(guān)[23]。這些特征差異可作為定性分析模型的建立基礎(chǔ)。

        表1 校正集與測試集稻谷樣品脂肪酸值統(tǒng)計(jì)結(jié)果

        圖1 校正集稻谷樣品脂肪酸含量散點(diǎn)分布圖

        Figure 1 Scatter distribution of fatty acid values of paddy samples in calibration set

        圖2 不同宜存狀態(tài)稻谷樣品的光譜趨勢(shì)圖

        2.3 特征波長優(yōu)選

        利用NRS算法約減光譜變量,參閱文獻(xiàn)[21]可知,通常鄰域尺寸取值以0.05為步長,范圍標(biāo)準(zhǔn)化到[0,1]區(qū)間,β取值以0.05為步長在[0.5,1]區(qū)間變化。結(jié)合文獻(xiàn)[16]的參數(shù)取值結(jié)果,試驗(yàn)中β設(shè)定為0.75和0.85,δ設(shè)定為0.05,0.10,0.15,0.20,β與δ分別進(jìn)行組合完成鄰域粗糙集優(yōu)選算法參數(shù)的設(shè)置(分別設(shè)定為組合1和組合2),經(jīng)過多次校正實(shí)現(xiàn)特征波長的優(yōu)選,結(jié)果如表2所示。

        組合1針對(duì)不同鄰域尺寸分別優(yōu)選出16,13,12,10個(gè)波長變量,分布狀況如圖3(a)所示,優(yōu)選出的特征波段基本都分布在主要吸收峰附近。進(jìn)一步分析可知,不同鄰域尺寸優(yōu)選出的特征波長存在一定的共性,圖3(a)中標(biāo)識(shí)出的波長變量均被共同優(yōu)選出,因此針對(duì)組合1的優(yōu)選結(jié)果進(jìn)一步凝練出10個(gè)具有共性的特征波長變量(1 057,1 116,1 204,1 282,1 298,1 354,1 450,1 592,1 651,1 762 nm)用于分類模型的建立。

        組合2針對(duì)不同鄰域尺寸分別優(yōu)選出12,10,8,6個(gè)波長變量,分布狀況如圖3(b)所示,組合2共同優(yōu)選出的特征波長數(shù)量減少,與組合1優(yōu)選結(jié)果的吸收波段位置存在差異,但同樣分布在主要吸收峰附件。針對(duì)組合2的優(yōu)選結(jié)果凝練出8個(gè)特征波長變量(1 086,1 148,1 234,1 276,1 400,1 576,1 682,1 754 nm)用于分類模型的建立。優(yōu)選出的特征波長變量能否表征稻谷的宜存狀態(tài)還需進(jìn)一步通過建立的分類模型來驗(yàn)證。

        2.4 分類模型建立

        基于NRS算法,利用組合1和組合2各自優(yōu)選出的特征波長變量與RF相結(jié)合,分別建立NRS-RF-1和NRS-RF-2分類模型用于稻谷貯藏品質(zhì)的鑒定,分類結(jié)果如表3所示。模型NRS-RF-1和NRS-RF-2在校正集的分類準(zhǔn)確率相互接近(CCR均>94%),均達(dá)到較理想分類結(jié)果,其中,對(duì)重度不宜存狀態(tài)的稻谷樣品的判別均只誤判了1個(gè)。進(jìn)一步分析可知,由于輕度不宜存屬于過度存儲(chǔ)狀態(tài),致使處在宜存和重度不宜存狀態(tài)的稻谷樣品易被誤分為該狀態(tài)(脂肪酸含量處于閾值邊緣的樣本)。針對(duì)測試集樣本,兩個(gè)模型的分類能力均呈現(xiàn)出下降趨勢(shì),NRS-RF-1的CCR為93.68%,錯(cuò)誤判別了6個(gè)樣本數(shù)據(jù),而NRS-RF-2模型的分類能力下降明顯,CCR為86.31%,13個(gè)樣本被錯(cuò)誤劃分為其他類。綜合考慮可知,NRS-RF-1模型的分類能力與穩(wěn)定性要優(yōu)于NRS-RF-2模型,組合1優(yōu)選出的10個(gè)特征波長變量更能表征稻谷貯藏品質(zhì)的本質(zhì)特性。

        表2 鄰域粗糙集算法優(yōu)選特征波長統(tǒng)計(jì)結(jié)果?

        ? 加粗?jǐn)?shù)據(jù)表示不同β和δ組合共同優(yōu)選出的特征波長。

        2.5 與其他模型比較分析

        為了驗(yàn)證NRS-RF-1模型的分類能力,進(jìn)一步采用常規(guī)的主成分分析(PCA)和連續(xù)投影算法(SPA)分別對(duì)原始光譜數(shù)據(jù)進(jìn)行降維處理,沿用RF算法分別建立PCA-RF和SPA-RF分類模型用于稻谷貯藏品質(zhì)的鑒別,結(jié)果如表4所示。PCA-RF模型校正集與測試集分類準(zhǔn)確率均<90%,分別為88.94%,86.31%,其中校正集與測試集分別有21,13個(gè)稻谷樣本的宜存狀態(tài)被誤判到其他類屬。模型分類能力明顯不及NRS-RF-1模型。SPA-RF模型的分類能力略優(yōu)于PCA-RF模型,校正集CCR達(dá)到94.73%,僅10個(gè)樣本狀態(tài)判別錯(cuò)誤,測試集CCR下降到89.47%,表明SPA-RF模型的分類穩(wěn)定性還需進(jìn)一步提升。

        選取NRS-RF-1和SPA-RF模型通過敏感性和特異性指標(biāo)的計(jì)算結(jié)果進(jìn)一步比較模型性能。由表5可知,NRS-RF-1和SPA-RF模型校正集敏感性和特異性指標(biāo)分布在0.96~0.99和0.92~0.99,沒有明顯差異,分類結(jié)果較為理想。測試集中,NRS-RF-1模型評(píng)價(jià)指標(biāo)分布在0.93~0.98,具有較理想的模型穩(wěn)定性,而SPA-RF模型的分類準(zhǔn)確性和穩(wěn)定性均出現(xiàn)下降趨勢(shì)(0.88~0.98)。由此可知,SPA-RF模型針對(duì)稻谷樣品貯藏品質(zhì)的整體分類性能同樣不及NRS-RF-1模型的鑒別結(jié)果,利用NRS算法優(yōu)選的10個(gè)光譜特征波長結(jié)合RF算法建立的NRS-RF-1模型用于稻谷樣本貯藏品質(zhì)的鑒定是可行的。

        表3 基于NRS-RF模型的稻谷宜存狀態(tài)分類結(jié)果?

        ? 加粗?jǐn)?shù)據(jù)表示分類正確的樣本數(shù)量及分類準(zhǔn)確率。

        表4 基于PCA-RF和SPA-RF模型的稻谷貯藏品質(zhì)分類結(jié)果?

        ? 加粗?jǐn)?shù)據(jù)表示分類正確的樣本數(shù)量及分類準(zhǔn)確率。

        表5基于NRS-RF-1和SPA-RF模型的敏感性和特異性指標(biāo)統(tǒng)計(jì)結(jié)果?

        Table 5 The results of sensitivity and specificity based on NRS-RF-1 and SPA-RF models

        模型類別校正集敏感性特異性測試集敏感性特異性NRS-RF-1宜存 0.960.980.930.97輕度不宜存0.960.960.930.93重度不宜存0.960.990.940.98SPA-RF宜存 0.950.990.890.95輕度不宜存0.940.940.890.89重度不宜存0.920.980.880.98

        ? 加粗?jǐn)?shù)據(jù)表示敏感性和特異性指標(biāo)的分布范圍。

        3 結(jié)論

        采集1 000~1 800 nm的稻谷樣品近紅外光譜數(shù)據(jù),利用參數(shù)調(diào)整后的鄰域粗糙集(NRS)算法優(yōu)選出10個(gè)能表征稻谷樣品脂肪酸值變化趨勢(shì)及其宜存狀態(tài)的特征波長變量,并結(jié)合隨機(jī)森林(RF)算法構(gòu)建了分類模型NRS-RF-1,用于稻谷貯藏品質(zhì)的鑒定。該模型校正集與測試集CCR均>93%,敏感性和特異性分布在0.93~0.99,具有可觀的分類準(zhǔn)確性與穩(wěn)定性。經(jīng)分析比較,NRS-RF-1模型性能同樣優(yōu)于試驗(yàn)中所建立的SPA-RF和PCA-RF兩類模型。結(jié)果表明,NRS算法優(yōu)選出的特征變量能夠代表稻谷樣品的本質(zhì)特性,構(gòu)建的NRS-RF-1模型用于稻谷貯藏品質(zhì)的鑒定是可行的,后期可進(jìn)一步融合色澤、品嘗評(píng)分值、水分等多貯藏品質(zhì)指標(biāo)細(xì)化稻谷宜存狀態(tài)等級(jí),改進(jìn)現(xiàn)有模型算法,建立更加適宜的分類模型,為儲(chǔ)糧品質(zhì)安全現(xiàn)場快檢設(shè)備研制及多光譜在線檢測系統(tǒng)研發(fā)提供技術(shù)支持。

        猜你喜歡
        鄰域稻谷脂肪酸
        謙卑的稻谷
        揭開反式脂肪酸的真面目
        玉米價(jià)瘋漲 稻谷也湊熱鬧
        稀疏圖平方圖的染色數(shù)上界
        揭開反式脂肪酸的真面目
        基于鄰域競賽的多目標(biāo)優(yōu)化算法
        田野稻谷香
        關(guān)于-型鄰域空間
        春節(jié)過后 稻谷行情穩(wěn)中趨弱
        鱷梨油脂肪酸組成分析
        亚洲女同系列在线观看| 亚洲产在线精品亚洲第一站一| 亚洲中字幕永久在线观看| 女同亚洲一区二区三区精品久久 | 日韩精品第一区二区三区| 免费a级毛片18以上观看精品| 欧美国产日产一区二区| av无码电影一区二区三区| 亚州无吗一区二区三区| 内射人妻少妇无码一本一道| 成在人线av无码免费| 久久久2019精品视频中文字幕| 好看的日韩精品视频在线| 国产成人a在线观看视频免费 | 亚洲欧洲日韩另类自拍| 成年人视频在线观看麻豆| 在线观看的网站| 99久久免费精品高清特色大片| 91久国产在线观看| 精品一区二区三区婷婷| 我把护士日出水了视频90分钟| 欧美一欧美一区二三区性| 蜜臀av一区二区三区精品| 亚洲av成人综合网成人| 亚洲一线二线三线写真| 久久久久国产亚洲AV麻豆 | 无码av一区在线观看| 中文字幕高清视频婷婷| 影音先锋色小姐| 国产精品毛片无遮挡高清| 国产精品国产三级国产专区51区 | 婷婷色国产精品视频一区 | 国产av无码专区亚洲av麻豆| 男女啪啪免费体验区| 久久精品中文字幕久久| 久久亚洲乱码中文字幕熟女| 亚洲国产天堂久久综合| 国产av成人精品播放| 少妇我被躁爽到高潮在线影片| 夜夜爽日日澡人人添| 亚洲国产AV无码男人的天堂|