倪 金,索麗敏,劉海龍
(黑龍江八一農(nóng)墾大學(xué) 信息與電氣工程學(xué)院,黑龍江大慶 163319)
大米是我國(guó)主要的糧食作物之一[1]。隨著社會(huì)經(jīng)濟(jì)的發(fā)展,大米的質(zhì)量問題逐漸引起了人們的關(guān)注。其中,大米的陳化和摻假是一個(gè)突出的問題。傳統(tǒng)的大米鑒別方法主要依賴于人工經(jīng)驗(yàn)和化學(xué)分析技術(shù),普遍存在分析周期長(zhǎng)、操作復(fù)雜、成本高等問題[2-3]。因此,需繼續(xù)探索更加準(zhǔn)確、快速、穩(wěn)定的大米鑒別方法[4]。
本文在基于近紅外光譜數(shù)據(jù)的基礎(chǔ)上采用北方蒼鷹優(yōu)化算法(Northern Goshawk Optimization,NGO)對(duì)核極限學(xué)習(xí)機(jī)(Kernel Extreme Learning Machine,KELM)的兩個(gè)重要參數(shù)進(jìn)行尋優(yōu)并建立模型[5-6]。提出一種新的大米定性鑒別和摻假定量分析方法。通過驗(yàn)證,該方法在陳化大米的鑒別和摻假定量分析中取得了很好的效果,對(duì)于解決陳化大米鑒別和摻假問題具有重要的實(shí)際意義。
實(shí)驗(yàn)樣品為2017年和2022年水稻成熟后,于黑龍江省建三江市七星農(nóng)場(chǎng)采用五點(diǎn)式隨機(jī)采樣法獲取的五優(yōu)稻4號(hào),將其脫粒碾磨至精白米后作為研究樣品。其中新大米樣品為2022年收獲大米,摻假大米樣品為將2017年收獲的大米按照不同比例(25%、50%、75%)摻入2022年收獲的大米中,陳化大米樣品為2017年收獲大米。采用高精度電子秤(武義銀利電子有限公司)取(5±0.02)g作為一份樣品,共計(jì)新大米30份樣品、摻假大米90份樣品、陳化大米30份樣品。
TANGO近紅外光譜儀,德國(guó)布魯克(北京)科技有限公司。
1.3.1 光譜預(yù)處理
對(duì)原始光譜數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)正態(tài)變量變換(Standard Normal Variate,SNV)預(yù)處理,用于消除顆粒不均等原因產(chǎn)生的噪聲信息,原理為樣品光譜數(shù)據(jù)各波數(shù)點(diǎn)的吸光度符合一定分布,計(jì)算時(shí)將每個(gè)樣品的原始光譜減去理想光譜,再除以標(biāo)準(zhǔn)差[7-8]。SNV公式為
1.3.2 模型的建立
極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)是提出的一種機(jī)器學(xué)習(xí)模型[9],由于其可以自動(dòng)生成輸入層和隱含層之間的權(quán)重和偏差值,省去了參數(shù)的設(shè)定和迭代試錯(cuò),具有操作簡(jiǎn)單、建模速度快等優(yōu)點(diǎn)。為進(jìn)一步提高ELM的性能,在其基礎(chǔ)上將核函數(shù)加入建模過程,構(gòu)成核極限學(xué)習(xí)機(jī)(KELM),其原理是利用核函數(shù)代替ELM中隱含層的特征映射,達(dá)到將數(shù)據(jù)升維的目的,大幅提高了模型的計(jì)算精度與泛化能力,并且該模型在面對(duì)分類任務(wù)和回歸任務(wù)時(shí)都能表現(xiàn)出較好的效果。但KELM對(duì)建模中的核函數(shù)γ與正則化參數(shù)C過分依賴,二者的取值對(duì)預(yù)測(cè)結(jié)果有決定性作用。目前γ與C值的設(shè)定多采用人工調(diào)參選取,嚴(yán)重降低了建模時(shí)的快速性和穩(wěn)定性。為解決這一問題,該文引入北方蒼鷹優(yōu)化算法(NGO)對(duì)以上兩個(gè)參數(shù)進(jìn)行尋優(yōu)。NGO是一種模擬的北方蒼鷹捕獵行為的群體智能優(yōu)化算法,其思想是在輸入模式與目標(biāo)模式之間顯式地建立一個(gè)映射關(guān)系,通過不斷迭代尋得最優(yōu)的建模參數(shù)。該算法在彌補(bǔ)了原有不足的同時(shí)也提高了預(yù)測(cè)準(zhǔn)確率和置信度。
1.3.3 基于NGO-KELM的陳化大米定性鑒別方法
分別建立KELM分類模型和NGO優(yōu)化后的KELM分類模型。將新鮮大米30份、摻假大米90份以及陳化大米30份共計(jì)150份樣本數(shù)據(jù)隨機(jī)按照7∶3的比例分為訓(xùn)練集(105份)和測(cè)試集(45份)。采用訓(xùn)練集和測(cè)試集的預(yù)測(cè)準(zhǔn)確度和F1值作為模型的性能評(píng)價(jià)指標(biāo),并繪制混淆矩陣。
1.3.4 基于NGO-KELM的陳化大米摻假定量分析方法
基于上文定性分析,分別建立KELM回歸模型與NGO優(yōu)化后的KELM回歸模型,對(duì)摻假樣品進(jìn)行摻假量的定性分析,探討KELM模型和NGOKELM模型對(duì)新鮮大米中摻雜陳化大米量的預(yù)測(cè)能力。將新鮮大米30份(摻假量0%)、摻假大米90份(摻假量25%、50%、75%)、陳化大米30份(摻假量100%)共計(jì)150份樣本按照7∶3的比例隨機(jī)分為訓(xùn)練集(105份)和測(cè)試集(45份)。對(duì)于定量預(yù)測(cè)模型采用決定系數(shù)R2和RMSE作為性能評(píng)價(jià)指標(biāo),并繪制柱狀圖來反映預(yù)測(cè)結(jié)果。
分別建立KELM模型和NGO-KELM模型,對(duì)比二者準(zhǔn)確度和F1值并繪制混淆矩陣從而確定模型的性能,實(shí)驗(yàn)結(jié)果見表1。NGO-KELM模型的訓(xùn)練集和測(cè)試集準(zhǔn)確度與F1值均高于未優(yōu)化的KELM模型(NGO-KELM測(cè)試集的混淆矩陣見圖1),其測(cè)試集準(zhǔn)確度提高約5%,說明NGO能有效提高KELM模型的分類準(zhǔn)確度。
圖1 NGO-KELM模型在測(cè)試集上的混淆矩陣
表1 各模型結(jié)果對(duì)比
分別建立KELM模型和NGO-KELM模型進(jìn)行實(shí)驗(yàn)發(fā)現(xiàn),利用NGO優(yōu)化的KELM模型的定量預(yù)測(cè)表現(xiàn)也有顯著的提升,結(jié)果見圖2。
圖2 各模型定量預(yù)測(cè)結(jié)果對(duì)比
NGO-KELM模型測(cè)試集決定系數(shù)R2和RMSE分別提升了0.054 1和0.023 3,得到了較理想的摻假率檢測(cè)精度,見表2,該方法顯著優(yōu)于傳統(tǒng)方法。
表2 各模型定量預(yù)測(cè)結(jié)果
基于NGO-KELM實(shí)現(xiàn)了陳化大米的定性鑒別和摻假定量分析。通過近紅外光譜設(shè)備采集標(biāo)準(zhǔn)樣品的信息,并采用NGO優(yōu)化算法對(duì)KELM模型進(jìn)行了優(yōu)化。建立的模型具有較高的準(zhǔn)確度和穩(wěn)定性,可以有效鑒別陳化大米,同時(shí)能對(duì)其摻假進(jìn)行定量分析,為陳化大米的定性鑒別和摻假定量分析提供了一種新的分析方法。