摘要 近紅外光譜分析技術(shù)已成為食品、農(nóng)業(yè)和醫(yī)藥等領(lǐng)域中質(zhì)量監(jiān)控的重要分析手段。本研究提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的近紅外光譜多組分定量分析模型(MulCoSpecNet),此模型由1 個(gè)編碼解碼模塊、1 個(gè)專家模塊、1 個(gè)門控模塊、1 個(gè)多組分定量預(yù)測(cè)模塊和1 個(gè)超參數(shù)優(yōu)化器組成。編碼解碼模塊通過上采樣和下采樣方式降低光譜噪聲以及隨機(jī)誤差,提高光譜信噪比;專家模塊和門控模塊利用不同權(quán)重構(gòu)建不同子光譜;多組分定量預(yù)測(cè)模塊采用卷積和池化等操作提高模型的預(yù)測(cè)精度和泛化能力;超參數(shù)優(yōu)化器在超參數(shù)空間中同步優(yōu)化超參數(shù)。本研究以公共的谷物和玉米近紅外光譜數(shù)據(jù)為例,將MulCoSpecNet 預(yù)測(cè)結(jié)果與偏最小二乘法(PLS)、極限學(xué)習(xí)機(jī)(ELM)、支持向量回歸法(SVM)和神經(jīng)網(wǎng)絡(luò)(BP)結(jié)果進(jìn)行比較。結(jié)果表明,與PLS 相比, MulCoSpecNet 在谷物和玉米數(shù)據(jù)集上預(yù)測(cè)精度分別提高了25.5%~45.2%和10.0%~35.7%;與ELM 相比, MulCoSpecNet 預(yù)測(cè)精度分別提高了17.8%~38.6%和18.2%~37.2%;與SVM相比, MulCoSpecNet 預(yù)測(cè)精度分別提高了33.6%~47.0%和31.3%~50.7%;與BP 相比, MulCoSpecNet 預(yù)測(cè)精度分別提高了2.0%~58.5%和29.6%~48.6%?;诰矸e神經(jīng)網(wǎng)絡(luò)的MulCoSpecNet 近紅外光譜多組分預(yù)測(cè)模型有效地解決了預(yù)測(cè)精度低以及泛化能力差等問題,為建立無損高精度的近紅外光譜多組分定量分析模型提供了理論基礎(chǔ)。
關(guān)鍵詞 近紅外光譜;深度學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò);多組分;定量分析
隨著化學(xué)計(jì)量學(xué)的不斷發(fā)展,近紅外光譜分析技術(shù)(Near infrared spectroscopy, NIRS)在農(nóng)業(yè)[1]、石化[2-3]、醫(yī)藥[4]、食品[5]和飼料[6]等領(lǐng)域得到了廣泛應(yīng)用。NIRS 作為一種過程分析技術(shù),具有快速、無損等特點(diǎn),被廣泛用于樣品的在線分析檢測(cè)[7]。建立具有預(yù)測(cè)精度高和泛化能力強(qiáng)的定量分析模型是近紅外光譜分析技術(shù)的關(guān)鍵。目前,常用的近紅外光譜建模方法有偏最小二乘法(Partial least squares,PLS)[8]、極限學(xué)習(xí)機(jī)(Extreme learning machine, ELM)[9]、支持向量回歸法(Support vector machine,SVM)[10]和BP 神經(jīng)網(wǎng)絡(luò)(Back propagation neural network, BP)[11]等。然而,隨著NIRS 的不斷發(fā)展,常用的近紅外光譜建模方法面臨預(yù)測(cè)精度低、非線性特征處理差以及過擬合風(fēng)險(xiǎn)高等難題,導(dǎo)致模型無法有效地表征近紅外光譜與物質(zhì)化學(xué)值之間的內(nèi)在關(guān)聯(lián)。深度學(xué)習(xí)能夠有效地處理近紅外光譜中的線性和非線性特征信息[12]。在各種深度學(xué)習(xí)模型中,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network, CNN)被廣泛用于近紅外光譜的定性和定量分析[13]。例如, Liu 等[14]利用一維CNN 對(duì)葵花籽霉變進(jìn)行了定性分析;Zhang 等[15]利用一維CNN 對(duì)玉米蛋白質(zhì)、小麥蛋白質(zhì)、土壤有機(jī)碳等進(jìn)行了近紅外光譜定量分析;王磊等[16]建立了一維CNN 模型,并對(duì)玉米油、柴油十六烷值、啤酒酵母等多種樣品化學(xué)值進(jìn)行了定量分析;Yu 等[17]將一維CNN 與多種預(yù)處理方法相結(jié)合對(duì)啤酒酵母、牛奶蛋白質(zhì)、谷物水分進(jìn)行了近紅外光譜定量分析;Ma 等[18]將時(shí)間頻率分析與一維CNN 相結(jié)合對(duì)煙草樣品中的總糖、還原糖和尼古丁等化學(xué)成分進(jìn)行了定量分析。然而,上述的一維CNN 近紅外光譜預(yù)測(cè)模型多針對(duì)某個(gè)樣本中單一組分進(jìn)行預(yù)測(cè),對(duì)多組分預(yù)測(cè)仍有較大局限性。因此,建立一種基于CNN 的近紅外光譜多組分定量分析模型尤為重要。
本研究提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的近紅外光譜多組分定量分析模型(Multicomponent spectral"network, MulCoSpecNet),引入了多任務(wù)多專家(Multi-gate mixture-of-experts, MMoE)[19]思想,實(shí)現(xiàn)了多門控與多專家相結(jié)合,提高了模型的預(yù)測(cè)性能。編碼解碼模塊通過上采樣和下采樣,能夠有效降低噪聲,提高光譜信噪比。門控模塊通過不同的門控網(wǎng)絡(luò)得到權(quán)重并融合專家模塊輸出的特征光譜,使模型能夠捕捉不同任務(wù)之間的差異性。多組分定量預(yù)測(cè)模塊通過提取多個(gè)卷積層、池化層和全連接層的線性和非線性特征,學(xué)習(xí)多維特征信息,避免模型過擬合,提高模型預(yù)測(cè)精度。在公共的谷物和玉米近紅外光譜數(shù)據(jù)集中,與PLS、ELM、SVM和BP神經(jīng)網(wǎng)絡(luò)模型相比, MulCoSpecNet模型具有更好的預(yù)測(cè)精度和泛化能力。