王 冬,吳靜珠,韓 平*,王 坤
1.北京農(nóng)業(yè)質(zhì)量標(biāo)準(zhǔn)與檢測(cè)技術(shù)研究中心,北京 100097 2.北京工商大學(xué)食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100048 3.農(nóng)業(yè)農(nóng)村部農(nóng)產(chǎn)品質(zhì)量安全風(fēng)險(xiǎn)評(píng)估實(shí)驗(yàn)室(北京),北京 100097
農(nóng)產(chǎn)品和食品的品質(zhì)優(yōu)劣一直是人們關(guān)注的熱點(diǎn)。農(nóng)產(chǎn)品及食品品質(zhì)與安全不僅關(guān)系著人們的身體健康,而且關(guān)系著社會(huì)穩(wěn)定甚至國(guó)家安全。近年來,由于農(nóng)產(chǎn)品及食品品質(zhì)不合格導(dǎo)致的安全事件依然多發(fā),造成了不良的社會(huì)影響。我國(guó)對(duì)農(nóng)產(chǎn)品及食品的消費(fèi)量非常大,對(duì)大量農(nóng)產(chǎn)品及食品品質(zhì)的無損快速檢測(cè)成為當(dāng)前亟待解決的問題。長(zhǎng)久以來,對(duì)農(nóng)產(chǎn)品和食品品質(zhì)的高通量無損快速檢測(cè)一直是分析檢測(cè)領(lǐng)域的重點(diǎn)和難點(diǎn)[1]。
光譜分析法,尤其近紅外光譜分析,以其無損、快速、高效、環(huán)境友好以及可實(shí)現(xiàn)在線及現(xiàn)場(chǎng)檢測(cè)等諸多特點(diǎn),為農(nóng)產(chǎn)品及食品品質(zhì)無損快速檢測(cè)提供了良好的解決方案。然而,傳統(tǒng)的光譜分析法在分析過程中所涉及的大量數(shù)據(jù)成為該方法應(yīng)用過程中的瓶頸,主要表現(xiàn)為3個(gè)方面:(1)龐大的數(shù)據(jù)量增加建模過程的計(jì)算成本;(2)龐大的數(shù)據(jù)量對(duì)儀器裝備的硬件提出了很高的要求,間接增加了技術(shù)應(yīng)用成本;(3)對(duì)樣品的預(yù)測(cè)仍采用全譜數(shù)據(jù)導(dǎo)致儀器工作效率降低,無法滿足農(nóng)產(chǎn)品及食品品質(zhì)高通量無損快速檢測(cè)的需求。
面對(duì)上述困難,近年來,尤其近十余年來,光譜變量篩選算法脫穎而出,并成為光譜分析的一個(gè)新熱點(diǎn)[2]。通過對(duì)光譜數(shù)據(jù)篩選關(guān)鍵變量,基于所選的少量關(guān)鍵變量數(shù)據(jù)即可建立準(zhǔn)確度較高的校正模型,有效提高了工作效率,并間接地降低光譜分析的應(yīng)用成本,進(jìn)而為農(nóng)產(chǎn)品及食品品質(zhì)的高通量檢測(cè)提供了可靠的技術(shù)支持。目前,常用的關(guān)鍵變量篩選算法主要有以下幾個(gè)類型:(1)根據(jù)偏最小二乘(partial least square,PLS)模型的一些參數(shù)進(jìn)行變量篩選[3-5],如無信息變量消除(uninformative variable elimination,UVE)、競(jìng)爭(zhēng)自適應(yīng)重加權(quán)采樣(competitive adaptive re-weighted sampling,CARS)等;(2)基于智能優(yōu)化算法進(jìn)行變量篩選[6],如遺傳算法(genetic algorithm,GA)、模擬退火算法(simulated annealing,SA)等;(3)連續(xù)投影算法(successive projection algorithm,SPA);(4)模型集群分析策略變量篩選算法[7-8],如變量組合集群分析(variable combination population analysis,VCPA)、自舉柔性收縮算法(bootstrapping soft shrinkage,BOSS)等;(5)變量區(qū)間選擇算法[9],如區(qū)間偏最小二乘(interval partial least square,iPLS)、移動(dòng)窗口偏最小二乘(moving window partial least square,MWPLS)。此外,為了提高變量篩選算法所選變量穩(wěn)定性,近年來,蒙特卡洛(Monte-Carlo,MC)方法[10-11]正越來越多地被運(yùn)用到關(guān)鍵變量篩選過程中,通過多次蒙特卡洛方法抽樣選擇關(guān)鍵變量,對(duì)所選變量進(jìn)行頻次統(tǒng)計(jì),以提高所選變量的穩(wěn)定性。
本文針對(duì)光譜關(guān)鍵變量篩選在農(nóng)產(chǎn)品及食品品質(zhì)無損快速檢測(cè)中的應(yīng)用,分別就糧食及糧食作物、蔬菜、水果、經(jīng)濟(jì)作物、肉類、食品品質(zhì)與安全等方向進(jìn)行綜述,對(duì)光譜關(guān)鍵變量篩選技術(shù)的應(yīng)用從篩選方法、應(yīng)用范圍、應(yīng)用效果等方面進(jìn)行了分類總結(jié)歸納,并就光譜關(guān)鍵變量篩選技術(shù)在農(nóng)產(chǎn)品及食品品質(zhì)無損檢測(cè)中的應(yīng)用從變量篩選方法特點(diǎn)及趨勢(shì)、所選變量的穩(wěn)定性和可靠性、所選變量的實(shí)際意義等方面進(jìn)行了展望。
糧食是指烹飪食品中各種植物種子的總稱,富含蛋白質(zhì)、維生素、膳食纖維、脂肪等營(yíng)養(yǎng)物質(zhì),是人們獲取能量的最主要來源,是國(guó)家之根本,其重要程度不言而喻。對(duì)糧食的品質(zhì)檢測(cè)關(guān)系到糧食儲(chǔ)備、流通、消費(fèi)等諸多環(huán)節(jié)。一些學(xué)者就糧食及糧食作物品質(zhì)的無損快速檢測(cè)過程中關(guān)鍵變量的篩選進(jìn)行了研究,并取得了一定的成果。
由此可見,關(guān)鍵變量篩選算法在糧食及糧食作物品質(zhì)無損快速檢測(cè)方面有一定的應(yīng)用效果,可為糧食及糧食作物品質(zhì)的高通量無損快速檢測(cè)提供技術(shù)支持。其中,恰當(dāng)?shù)剡x擇關(guān)鍵變量甚至可以建立準(zhǔn)確度更高的校正模型。
蔬菜是指可以做菜、烹飪成為食品的植物或菌類,是人們?nèi)粘o嬍持斜夭豢缮俚氖澄镏?。蔬菜可提供人體所必需的多種維生素和礦物質(zhì)等營(yíng)養(yǎng)物質(zhì),此外,蔬菜中還有多種多樣的植物化學(xué)物質(zhì),是人們公認(rèn)的對(duì)健康有效的成分,對(duì)慢性疾病、退行性疾病有很好的預(yù)防作用。目前,近紅外技術(shù)已在蔬菜品質(zhì)無損檢測(cè)中得以應(yīng)用[19],其中不乏一些學(xué)者就蔬菜品質(zhì)無損快速檢測(cè)過程中關(guān)鍵變量的篩選進(jìn)行了研究,并取得了一定的成果。
從以上內(nèi)容可見,變量篩選算法在蔬菜品質(zhì)無損快速檢測(cè)中具有較好的應(yīng)用效果,可為大量蔬菜的品質(zhì)無損快速檢測(cè)提供技術(shù)支持。其中不乏將多種變量篩選算法相結(jié)合的報(bào)道,例如將UVE與SPA相結(jié)合,在消除無信息變量的基礎(chǔ)上進(jìn)一步去掉變量間的共線性,其對(duì)關(guān)鍵變量的篩選結(jié)果優(yōu)于單一變量篩選算法。
水果是指多汁且主要味覺為甜味和酸味、可食用的植物果實(shí)。水果不但含有豐富的營(yíng)養(yǎng)物質(zhì),而且具有促進(jìn)消化等保健作用。水果品質(zhì)無損快速分級(jí)正成為主流趨勢(shì),而基于近紅外技術(shù)對(duì)水果進(jìn)行無損快速檢測(cè)則可為水果品質(zhì)無損快速分級(jí)提供有效的解決方案。根據(jù)水果品質(zhì)的不同制定差異化價(jià)格進(jìn)行銷售,更好地實(shí)現(xiàn)物盡其用,在提高水果利用率的同時(shí)還可避免浪費(fèi)。一些學(xué)者就水果品質(zhì)無損速測(cè)過程中關(guān)鍵變量的篩選開展了研究,并取得了一定的成果。
王轉(zhuǎn)衛(wèi)等[31]采用近紅外漫反射光譜研究了富士蘋果品質(zhì)指標(biāo)的無損快速檢測(cè)方法,采用主成分分析(principal component analysis,PCA)、SPA和UVE篩選關(guān)鍵變量,并結(jié)合LSSVM和極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)建立校正模型;結(jié)果表明,SPA-ELM模型預(yù)測(cè)SSC,pH值準(zhǔn)確度更高,RMSEP分別為0.44和0.006 8,PCA-ELM預(yù)測(cè)硬度、含水率準(zhǔn)確度更高,RMSEP分別為0.26和0.62。Che等[32]采用可見-短波近紅外光譜研究了蘋果淤傷的檢測(cè),采用隨機(jī)森林算法篩選關(guān)鍵變量,平均準(zhǔn)確度達(dá)到99.9%,并根據(jù)隨機(jī)森林模型優(yōu)選出675和960 nm附近2個(gè)特征波段。Dong等[33]采用近紅外高光譜成像對(duì)富士蘋果在13周儲(chǔ)存期內(nèi)的SSC、硬度、水分和pH進(jìn)行無損檢測(cè),采用SPA、UVE算法篩選關(guān)鍵變量,并結(jié)合PLS、LSSVM、反向傳遞網(wǎng)絡(luò)建模(back propagation network modeling,BPNM)方法建立校正模型;結(jié)果表明,全部模型均可準(zhǔn)確預(yù)測(cè)SSC和水分,SPA-LSSVM和全譜BPNM可粗略估算pH值,而采用上述任何模型預(yù)測(cè)硬度皆無法得到準(zhǔn)確結(jié)果。在預(yù)測(cè)SSC、水分和pH值方面,SPA-LSSVM模型更具綜合性,預(yù)測(cè)相關(guān)系數(shù)分別為0.961,0.984和0.882。Li等[34]采用近紅外光譜研究了梨中SSC的無損檢測(cè),采用MC-UVE和SPA算法相結(jié)合篩選關(guān)鍵變量,結(jié)合PLS算法建立校正模型;結(jié)果表明,與MC-UVE-PLS和SPA-PLS模型相比,MC-UVE-SPA-PLS模型穩(wěn)健性更好,而采用MC-UVE-SPA-PLS模型的18個(gè)關(guān)鍵變量所建SSC模型的校正集、預(yù)測(cè)集相關(guān)系數(shù)(r)分別為0.88和0.88,RMSE分別為0.49和0.35。進(jìn)一步地,Li等[35]采用可見-近紅外光譜研究了多品種梨硬度的無損檢測(cè),采用MC-UVE-SPA從全譜1 344個(gè)變量中篩選了17個(gè)關(guān)鍵變量,分別結(jié)合PLS和LSSVM建立校正模型;結(jié)果表明,MC-UVE-SPA-LSSVM模型預(yù)測(cè)準(zhǔn)確度更高,“翠冠”、“黃花”、“清香”三種梨的預(yù)測(cè)集相關(guān)系數(shù)(r)分別為0.94,0.93和0.92,RMSEP分別為0.91,0.92和0.96。Zhang等[36]采用可見-短波近紅外高光譜成像研究了碭山梨糖含量的無損快速檢測(cè),采用MC-UVE,SPA,CARS,GA,CARS-SPA和GA-SPA篩選關(guān)鍵變量,分別結(jié)合PLS、LSSVM、反向傳遞人工神經(jīng)網(wǎng)絡(luò)(back propagation-artificial neural network,BP-ANN)建立校正模型;結(jié)果表明,CARS-PLS和GA-SPA-PLS模型準(zhǔn)確度更高,預(yù)測(cè)相關(guān)系數(shù)(rpre)分別為0.897 1和0.896 9,RMSEP分別為0.39%和0.35%。Guo等[37]采用近紅外光譜研究了4個(gè)品種桃的無損鑒別,采用PCA,UVE和SPA分別從全譜2 074個(gè)變量中篩選出8個(gè)主成分、1 067個(gè)、10個(gè)特征波長(zhǎng),分別結(jié)合LSSVM和ELM建立桃品種鑒別模型;結(jié)果表明,PCA-LSSVM,UVE-LSSVM模型以及PCA-ELM模型的準(zhǔn)確率可達(dá)到100%,其他模型準(zhǔn)確率皆不低于96%。Zhang等[38]采用可見-短波近紅外高光譜成像檢測(cè)桃表面缺陷,采用MC-UVE和SPA篩選關(guān)鍵變量,結(jié)合PLS算法建立判別模型;結(jié)果表明,基于少量特征波長(zhǎng)可建立人工缺陷、非人工缺陷模型,人工缺陷、非人工缺陷、對(duì)照和樣品總準(zhǔn)確度分別為87.5%,96.7%,95.0%和93.3%。Yu等[39]采用可見-短波近紅外高光譜研究枇杷缺陷的識(shí)別,采用CARS算法選擇了12個(gè)關(guān)鍵變量,結(jié)合PLS-DA算法建立判別模型;結(jié)果表明,CARS-PLS-DA模型對(duì)有缺陷枇杷的總體識(shí)別準(zhǔn)確率為92.3%。Huang等[40]采用可見-近紅外高光譜成像研究了桑葚中總花青素含量和抗氧化活性的檢測(cè),采用SPA,UVE和CARS三種波長(zhǎng)選擇算法篩選關(guān)鍵變量,結(jié)合PLS和LSSVM建立校正模型;結(jié)果表明,9變量CARS-LSSVM模型預(yù)測(cè)總花青素含量的準(zhǔn)確度更高,交互驗(yàn)證R2=0.959,RPD=4.964,而18變量CARS-LSSVM模型預(yù)測(cè)抗氧化活性的準(zhǔn)確度更高,交互驗(yàn)證R2=0.995,RPD=14.255。Zhao等[41]采用可見-短波近紅外高光譜成像研究桑葚中總可溶性固形物(total soluble solid,TSS)的檢測(cè),采用隨機(jī)蛙跳(random frog,RF)算法從512個(gè)變量中篩選關(guān)鍵變量,結(jié)合PLS,LSSVM建立TSS的校正模型;結(jié)果表明,RF-LSSVM(徑向核函數(shù))模型的校正集、交互驗(yàn)證集、預(yù)測(cè)集相關(guān)系數(shù)(r)分別為0.999,0.958和0.956,校正均方根誤差(root mean square error of calibration,RMSEC)、交互驗(yàn)證均方根誤差(root mean square error of cross validation,RMSECV)、RMSEP分別為0.061,0.453和0.430。Elfatih Abdel-Rahman等[42]采用可見-近紅外高光譜數(shù)據(jù)研究甘蔗葉中氮濃度的檢測(cè),采用隨機(jī)森林(random forest,RF)算法篩選關(guān)鍵變量,結(jié)合逐步多元回歸算法建立校正模型;結(jié)果表明,非線性RF回歸模型測(cè)定系數(shù)R2=0.67,驗(yàn)證均方根誤差(root mean square error of validation,RMSEV)=0.15%。Zhang等[43]采用可見-短波近紅外光譜建立哈密瓜SSC校正模型,采用CARS,UVE,CARS-SPA,UVE-SPA篩選關(guān)鍵變量,分別結(jié)合PLS和LSSVM建立校正模型;結(jié)果表明,哈密瓜赤道區(qū)域多光譜模型略優(yōu)于總體多光譜模型,UVE-SPA-PLS模型和CARS-SPA-LSSVM模型預(yù)測(cè)相關(guān)系數(shù)(RP)分別為0.914 3和0.914 3,RMSEP分別為0.835 9和0.895 8。Hu等[44]采用可見-短波近紅外光譜對(duì)哈密瓜SSC進(jìn)行定量測(cè)定,采用SPA,MC-UVE,CARS和MC-UVE-SPA篩選關(guān)鍵變量,結(jié)合多元線性回歸(multiple linear regression,MLR),PLS和LSSVM建立校正模型;結(jié)果表明,MC-UVE-SPA篩選的18個(gè)變量建模準(zhǔn)確度更高,MC-UVE-SPA-PLS,MC-UVE-SPA-LSSVM,MC-UVE-SPA-MLR模型預(yù)測(cè)哈密瓜SSC的RMSEP在0.95~0.99之間。Mithun等[45]采用高光譜數(shù)據(jù)結(jié)合RGB數(shù)據(jù)對(duì)天然成熟和人工催熟香蕉進(jìn)行識(shí)別,采用隨機(jī)森林(random forest,RF)篩選關(guān)鍵變量,結(jié)合多層感知前向神經(jīng)網(wǎng)絡(luò)建立校正模型,自然成熟和人工催熟香蕉的識(shí)別準(zhǔn)確度分別達(dá)到98.74%和89.49%。
從以上內(nèi)容可見,變量篩選算法在水果品質(zhì)無損快速檢測(cè)中具有較好的應(yīng)用效果,可為大量水果的品質(zhì)無損快速檢測(cè)提供技術(shù)支持,將為水果收購(gòu)入庫(kù)、精品出庫(kù)、分級(jí)銷售過程中的品質(zhì)無損快速檢測(cè)提供重要技術(shù)支持。
經(jīng)濟(jì)作物亦稱“工業(yè)原料作物”,一般指為工業(yè),特別是輕工業(yè)提供原料的作物。我國(guó)納入人工栽培的經(jīng)濟(jì)作物種類繁多,包括纖維作物(如棉、麻等)、油料作物(如芝麻、花生等)、糖料作物(如甘蔗、甜菜等)、三料(飲料、香料、調(diào)料)作物、藥用作物、染料作物、觀賞作物、水果和其他經(jīng)濟(jì)作物等。近年來,近紅外技術(shù)越來越多地被應(yīng)用于經(jīng)濟(jì)作物品質(zhì)的無損檢測(cè)[46],其中一些學(xué)者就關(guān)鍵變量篩選進(jìn)行了探索并取得了一定的成果。
從以上內(nèi)容可見,變量篩選算法在經(jīng)濟(jì)作物品質(zhì)無損快速檢測(cè)中具有較好的應(yīng)用效果,可為經(jīng)濟(jì)作物的品質(zhì)無損快速檢測(cè)提供技術(shù)支持,進(jìn)而可為提高產(chǎn)品附加值、增強(qiáng)產(chǎn)品市場(chǎng)競(jìng)爭(zhēng)力提供技術(shù)保障。
肉類是指動(dòng)物的皮下組織和肌肉,可以提供豐富的蛋白質(zhì)、脂肪和熱量。我國(guó)肉類消費(fèi)總量近年來穩(wěn)居世界前列;在采用近紅外技術(shù)研究肉類品質(zhì)的無損快速檢測(cè)[55-56]中,針對(duì)肉類品質(zhì)無損檢測(cè)過程中的關(guān)鍵變量篩選,一些學(xué)者進(jìn)行了探索并取得了一定的成果。
從以上內(nèi)容可見,變量篩選算法在肉類品質(zhì)無損快速檢測(cè)中具有較好的應(yīng)用效果,其中不乏采用所選關(guān)鍵變量建立模型優(yōu)于全譜建模的例子,可為肉類品質(zhì)無損快速檢測(cè)提供技術(shù)支持,進(jìn)而可為提高產(chǎn)品附加值、增強(qiáng)產(chǎn)品市場(chǎng)競(jìng)爭(zhēng)力提供技術(shù)保障。
食品一直以來是人們獲取能量的重要來源,對(duì)人類的重要性不言而喻。食品安全(food safety)指食品無毒、無害,符合應(yīng)當(dāng)有的營(yíng)養(yǎng)要求,對(duì)人體健康不造成任何急性、亞急性或者慢性危害。食品安全不僅關(guān)系著人們的身體健康,還關(guān)系到社會(huì)穩(wěn)定甚至國(guó)家安全。在食品品質(zhì)與安全無損檢測(cè)方面,近紅外技術(shù)近年來得以廣泛應(yīng)用;面對(duì)巨大的檢測(cè)工作量,一些學(xué)者就光譜變量篩選在食品品質(zhì)與安全無損檢測(cè)中的應(yīng)用開展了研究,并取得了一定的成果。
綜上所述,變量篩選算法在食品品質(zhì)與安全無損檢測(cè)領(lǐng)域具有一定的應(yīng)用成果,恰當(dāng)?shù)睾Y選關(guān)鍵變量可以使用較少的變量建立和全譜模型效果相近甚至超越全譜模型的校正模型,這將為食品品質(zhì)與安全的無損快速檢測(cè)、提高儀器工作效率等提供技術(shù)參考。
農(nóng)產(chǎn)品及食品是人們獲取能量的主要來源,其品質(zhì)與質(zhì)量安全不僅關(guān)系到百姓生活品質(zhì)與身體健康,而且關(guān)系著社會(huì)穩(wěn)定甚至國(guó)家安全。面對(duì)大量農(nóng)產(chǎn)品及食品的品質(zhì)檢測(cè)工作,通過對(duì)樣本采集全譜數(shù)據(jù)并篩選關(guān)鍵變量,從而簡(jiǎn)化校正模型、提高儀器工作效率是一種較為有效的技術(shù)方案。
就本文獻(xiàn)綜述而言,關(guān)鍵變量篩選工作可主要?dú)w納為以下兩方面趨勢(shì)。(1)多種關(guān)鍵變量篩選算法相結(jié)合,取長(zhǎng)補(bǔ)短。很多學(xué)者將UVE、CARS等算法與SPA算法相結(jié)合,克服了UVE、CARS算法第一輪篩選后所選變量仍較多的缺點(diǎn),并充分發(fā)揮了SPA去共線性的功能。(2)關(guān)鍵變量篩選研究過程越來越多地引入蒙特卡洛(Monte-Carlo,MC)方法,為所選變量穩(wěn)定性提供了保證。在樣本數(shù)有限的前提下,根據(jù)MC方法隨機(jī)生成多個(gè)子校正集并根據(jù)各子校正集篩選關(guān)鍵變量,在此基礎(chǔ)上統(tǒng)計(jì)關(guān)鍵變量出現(xiàn)的頻次,從而為穩(wěn)健關(guān)鍵變量的篩選提供了可能,進(jìn)而克服了基于不同校正集所選關(guān)鍵變量有差異的困難。
然而,光譜關(guān)鍵變量的篩選目前仍存在一些問題,主要體現(xiàn)在以下三個(gè)方面。(1)光譜數(shù)據(jù)預(yù)處理對(duì)關(guān)鍵變量篩選的影響尚不明確。恰當(dāng)?shù)臄?shù)據(jù)預(yù)處理可以增強(qiáng)光譜質(zhì)量,有利于光譜信息的提?。蝗欢?,光譜數(shù)據(jù)預(yù)處理對(duì)光譜關(guān)鍵變量的篩選有何影響,目前尚無定論。因此,在將來的研究中,針對(duì)不同狀態(tài)、不同化學(xué)環(huán)境的樣品,采用不同的光譜數(shù)據(jù)預(yù)處理對(duì)關(guān)鍵變量篩選結(jié)果的影響將會(huì)是下一步工作中值得研究的內(nèi)容之一。(2)所選變量的可靠性以及方法的普適性仍有待提高。光譜關(guān)鍵變量的篩選在精簡(jiǎn)建模變量的同時(shí)剔除了冗余變量是目前對(duì)光譜變量篩選算法的共識(shí)。然而,在關(guān)鍵變量篩選過程中,根據(jù)所選變量建立的校正模型的準(zhǔn)確度是否能達(dá)到實(shí)際工作需要,亦即所選變量的可靠性,以及變量篩選方法的普適性仍然是需要注意的問題。一般而言,對(duì)于統(tǒng)一體系,隨著所選變量數(shù)目的減少,基于所選關(guān)鍵變量數(shù)據(jù)所建校正模型的準(zhǔn)確度大體上呈下降趨勢(shì),但也不乏基于所選關(guān)鍵變量所建校正模型的預(yù)測(cè)準(zhǔn)確度接近甚至優(yōu)于全譜模型的例子;目前普遍認(rèn)為基于所選關(guān)鍵變量建模的準(zhǔn)確度和全譜建模準(zhǔn)確度接近或能夠滿足實(shí)際工作需要即是可行的。值得注意的是,雖然一些學(xué)者的研究表明,恰當(dāng)?shù)睾Y選關(guān)鍵變量并基于所選關(guān)鍵變量數(shù)據(jù)建立校正模型的準(zhǔn)確度完全可以滿足實(shí)際工作需要,接近甚至優(yōu)于全譜建模結(jié)果,但是上述結(jié)論對(duì)于種類、樣式繁多的農(nóng)產(chǎn)品及食品,以及各種各樣品質(zhì)指標(biāo)是否具有普適性,仍存在一定的不確定性。因此,對(duì)于關(guān)鍵變量篩選工作,所選變量的穩(wěn)定性、可靠性以及方法的普適性仍是需要繼續(xù)研究的內(nèi)容之一。(3)所選變量的理化含義有待進(jìn)一步解析。以近紅外光譜為例,近紅外光譜主要來源于分子中含氫基團(tuán)的合頻與倍頻吸收,而對(duì)近紅外光譜篩選關(guān)鍵變量的過程很少有學(xué)者從分子角度討論所選波長(zhǎng)變量的歸屬或其理化意義。雖然一些學(xué)者就所選關(guān)鍵變量的歸屬做了簡(jiǎn)要的分析,但仍然停留在化學(xué)鍵的層面,沒有上升為分子層面。而對(duì)所選關(guān)鍵波長(zhǎng)變量從分子層面進(jìn)行解析不僅可以間接驗(yàn)證變量篩選算法的正確性、有效性和變量篩選算法的普適性,而且有利于從分子角度揭示所建模型的機(jī)理。因此,對(duì)所選光譜關(guān)鍵變量從分子角度解釋其理化意義將成為今后有待進(jìn)一步研究的內(nèi)容之一。
綜上所述,光譜關(guān)鍵變量篩選在精簡(jiǎn)光譜變量數(shù)、提高建模和儀器工作效率方面可以提供良好的解決方案,可為大量農(nóng)產(chǎn)品及食品品質(zhì)與安全檢測(cè)工作提供有效的技術(shù)保障;此外,光譜關(guān)鍵變量的篩選在精簡(jiǎn)輸入變量方面具有十分重要的作用,因此還可為專用型儀器的研發(fā)提供可靠的技術(shù)支持,從而可為降低光譜分析技術(shù)的應(yīng)用成本、擴(kuò)展光譜分析技術(shù)的應(yīng)用范圍奠定堅(jiān)實(shí)的理論基礎(chǔ)。