亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        近紅外光譜分析中的化學(xué)計(jì)量學(xué)算法研究新進(jìn)展

        2020-11-06 09:51:10周羅雄李博巖
        分析測(cè)試學(xué)報(bào) 2020年10期
        關(guān)鍵詞:方法模型

        張 進(jìn),胡 蕓,周羅雄,李博巖*

        (1.貴州醫(yī)科大學(xué) 公共衛(wèi)生學(xué)院 環(huán)境污染與疾病監(jiān)控教育部重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽(yáng) 550025;2.貴州醫(yī)科 大學(xué) 食品科學(xué)學(xué)院,貴州 貴陽(yáng) 550025;3.貴州中煙工業(yè)有限責(zé)任公司 技術(shù)中心,貴州 貴陽(yáng) 550009)

        近紅外(Near-infrared,NIR)光是一種介于紅外和可見(jiàn)光吸收區(qū)域的電磁波,其波長(zhǎng)范圍與分子中含氫基團(tuán)的振動(dòng)倍頻和合頻能量一致,因此常被用于常量有機(jī)成分的檢測(cè)。但隨著實(shí)驗(yàn)技術(shù)和數(shù)學(xué)理論的發(fā)展,近紅外光譜的應(yīng)用范圍也向微量組分[1]或無(wú)機(jī)成分[2]檢測(cè)的領(lǐng)域拓展,主要方式包括:①利用富集技術(shù)對(duì)樣品進(jìn)行預(yù)處理以提高其相對(duì)含量[3];②利用增強(qiáng)的方式放大檢測(cè)信號(hào)[4];③利用擾動(dòng)近紅外光譜技術(shù)增加有效信息含量,提高多元校正模型的檢測(cè)限。例如新興的水光譜組學(xué)綜合利用了溶質(zhì)周?chē)肿訉?duì)目標(biāo)組分吸收的放大作用以及多元校正算法數(shù)據(jù)挖掘的特點(diǎn),實(shí)現(xiàn)對(duì)水體系中多種物質(zhì)的檢測(cè)和分析[5-7]。近紅外光譜技術(shù)具有綠色、快捷的特點(diǎn),其檢測(cè)方式主要包括漫反射和透射兩種。近紅外光譜的漫反射檢測(cè)技術(shù)可用于非接觸式檢測(cè),從而在一定程度上避免了繁瑣的樣品預(yù)處理,為快速檢測(cè)和過(guò)程控制提供了有效的手段。近紅外光譜技術(shù)在科學(xué)研究和工業(yè)生產(chǎn)中具有廣泛應(yīng)用[8],例如,石油冶煉[9]、農(nóng)業(yè)加工[10-11]、醫(yī)療衛(wèi)生[12-14]以及食品安全[15-16]等。

        化學(xué)計(jì)量學(xué)(Chemometrics)是在機(jī)器學(xué)習(xí)的基礎(chǔ)上發(fā)展起來(lái)的用以解決化學(xué)領(lǐng)域中實(shí)際問(wèn)題的一門(mén)學(xué)科。近紅外光譜的吸收強(qiáng)度相對(duì)較弱且重疊嚴(yán)重,很難通過(guò)常規(guī)的單變量分析得到準(zhǔn)確結(jié)果。因此,化學(xué)計(jì)量學(xué)算法在近紅外光譜分析應(yīng)用中占有重要地位[17],尤其在數(shù)據(jù)挖掘方面。利用化學(xué)計(jì)量學(xué)中的多元校正方法能夠?qū)⒔t外光譜的眾多變量結(jié)合起來(lái)共同反映目標(biāo)組分的性質(zhì)。一般來(lái)說(shuō),近紅外光譜的變量數(shù)眾多、共線(xiàn)性嚴(yán)重,因而多采用二維算法建立近紅外光譜模型,這些方法很難像高維算法一樣產(chǎn)生唯一解[18]。因此,在實(shí)際應(yīng)用中,大部分近紅外光譜的建模算法均伴隨著降維和嚴(yán)格的約束條件。譬如,主成分分析(Principal component analysis,PCA)是一種最常見(jiàn)的化學(xué)計(jì)量學(xué)算法,通過(guò)嚴(yán)格的正交和歸一化約束,所有的近紅外光譜變量均可被幾個(gè)甚至十幾個(gè)正交變量簡(jiǎn)化代替,再利用傳統(tǒng)的最小二乘算法建立模型。

        近紅外光譜的數(shù)據(jù)預(yù)處理、信息變量選擇、多元校正模型的建立以及有效模型轉(zhuǎn)移算法是保證近紅外光譜技術(shù)應(yīng)用和模型預(yù)測(cè)效果的重要手段和方法。這些方法的功能主要為消除背景干擾、篩選信息變量以及消除外界擾動(dòng)對(duì)預(yù)測(cè)準(zhǔn)確性的影響。2003年,田高友等[19]評(píng)述了小波變換在近紅外光譜預(yù)處理中的應(yīng)用,指出小波變換能夠有效提取信息以及消除背景干擾。褚小立等[20-21]總結(jié)了多種近紅外光譜的變量選擇和建模算法,并展示了部分算法的原理、具體計(jì)算過(guò)程和應(yīng)用實(shí)例。2017年,張進(jìn)等[22]全面綜述了多種最新的模型轉(zhuǎn)移算法,從算法的角度將其劃分為基于多元校正、因子分析、人工神經(jīng)網(wǎng)絡(luò)、多任務(wù)學(xué)習(xí)和其他5類(lèi)模型轉(zhuǎn)移方法。張學(xué)博[23]、柳艷云[24]、宋相中[25]、Yun[26]等分別從不同角度總結(jié)了近紅外光譜的變量選擇、模型轉(zhuǎn)移和多元校正算法。本文在此基礎(chǔ)上綜述了近年來(lái)針對(duì)近紅外光譜技術(shù)的發(fā)展與應(yīng)用提出的一系列化學(xué)計(jì)量學(xué)新算法,主要包括近5年的光譜預(yù)處理、光譜變量選擇、多元校正和模型轉(zhuǎn)移等算法。

        1 光譜預(yù)處理算法

        光譜預(yù)處理算法主要指利用平滑、求導(dǎo)、濾波等技術(shù)消除光譜中的噪聲和背景干擾,提高模型預(yù)測(cè)效果的一類(lèi)方法[27-29]。

        由于近紅外光譜的檢測(cè)器信噪比不同,測(cè)量信號(hào)中會(huì)不同程度地包含噪聲成分,使得建立的模型預(yù)測(cè)效果變差。在不嚴(yán)重?fù)p失有效信息的情況下,消除部分噪聲可以提高信號(hào)的信噪比,能夠在一定程度上提高模型的預(yù)測(cè)效果。從噪聲分布的角度看,通常認(rèn)為近紅外光譜的噪聲具有獨(dú)立同分布的特點(diǎn)。因此,基于窗口移動(dòng)技巧的平滑算法(Smoothing algorithm)能夠有效降低光譜中的噪聲成分。其中,最具代表性的方法為Savitzky-Golay算法[30]。該方法針對(duì)窗口范圍中心的光譜數(shù)據(jù)點(diǎn)施加大權(quán)重,而邊緣的光譜數(shù)據(jù)點(diǎn)施加較小的權(quán)重,進(jìn)而通過(guò)去卷積的方式對(duì)數(shù)據(jù)進(jìn)行平滑,具有計(jì)算速度快和平滑效果好的特點(diǎn)。盡管有觀(guān)點(diǎn)指出近紅外光譜中存在非等性噪聲和相關(guān)噪聲[31-32],但平滑算法在一定程度上仍能夠有效提高模型的預(yù)測(cè)效果[33-34]。

        近紅外光譜中大部分為樣品吸收信號(hào),還存在部分與樣品發(fā)生彈性碰撞的散射信號(hào)[35]。此外,還可能包括與樣品無(wú)關(guān)的信號(hào),如儀器本身的基線(xiàn),這部分信號(hào)通常稱(chēng)為背景。背景信號(hào)本身不包含樣品信息,因此在建模過(guò)程中會(huì)影響模型的預(yù)測(cè)效果。常見(jiàn)的扣除背景信號(hào)的算法包括有限脈沖響應(yīng)(Finite impulse response,FIR)[36]、多元散射校正(Multiplicative scatter correction,MSC)[35]、標(biāo)準(zhǔn)正態(tài)變換(Standard normal variate,SNV)[37]、正交投影(Orthogonal projections,OP)[38]、擴(kuò)展多元信號(hào)校正(Extended multiplicative signal correction,EMSC)[39]。這些方法大都假設(shè)近紅外光的散射符合一種特定的分布,因此在校正過(guò)程多使用平均光譜的信息作為參照。

        從信號(hào)頻率的分布角度看,近紅外光譜的噪聲具有相對(duì)較高的頻率,而背景的頻率相對(duì)較低,因此,對(duì)于特定頻率成分有過(guò)濾效果的帶通濾波器往往也具有降噪和背景扣除的功效。傅里葉變換(Fourier transform,FT)是一種利用不同頻率的正、余弦疊加的形式表示原始信號(hào)的方法,對(duì)信號(hào)的頻率分析效果顯著。在實(shí)際應(yīng)用中,通常用快速傅里葉變換(Fast Fourier transform,FFT)的方式進(jìn)行傅里葉變換操作。但傅里葉變換缺乏在時(shí)域的分辨能力,故在近紅外光譜實(shí)際分析中應(yīng)用并不廣泛。小波變換(Wavelet transform,WT)是一種多尺度的分析方式,用迅速衰減的小波基進(jìn)行卷積操作,產(chǎn)生的小波系數(shù)同時(shí)具有時(shí)域和頻域的分辨能力。長(zhǎng)期的研究和應(yīng)用證實(shí)小波變換是一種扣除背景和噪聲的有效方法[40]。圖1為小波變換光譜預(yù)處理示意圖。由圖1A可以看出sym12小波在時(shí)域迅速衰減的性質(zhì)。圖1B展示了sym12小波經(jīng)快速傅里葉變換后的系數(shù),sym12實(shí)際為通過(guò)一定頻率信號(hào)的帶通濾波器。圖1C為1.0 s的模擬信號(hào),其中0~0.5 s為低頻,而0.5~1.0 s為高頻。經(jīng)過(guò)小波變換的系數(shù)(圖1D)表明,其無(wú)論是在頻率尺度上還是時(shí)間尺度上均有較好的分辨能力。

        小波變換不僅能夠消除低頻背景和高頻噪聲,也是一種非常有效的數(shù)值求導(dǎo)方法。傳統(tǒng)數(shù)值求導(dǎo)可以提高光譜分辨率,同時(shí)也會(huì)降低光譜的信噪比。小波變換求導(dǎo)法在提高光譜分辨率的同時(shí)可保證光譜的信噪比。Shao等[41]使用小波變換求導(dǎo)法處理水和乙醇的混合融合光譜,展現(xiàn)出更多的特征信息,建立了更加有效的定性定量模型。

        加權(quán)多元散射校正(Weighted multiplicative scatter correction)[42]是一種結(jié)合了變量選擇和多元散射校正的聯(lián)合方法。該方法通過(guò)交替執(zhí)行變量選擇和多元校正過(guò)程,同時(shí)實(shí)現(xiàn)代表性變量選擇與散射校正,得到的結(jié)果優(yōu)于傳統(tǒng)的光譜預(yù)處理算法。對(duì)數(shù)比值法(log-ratios)[43]則利用對(duì)數(shù)變化和數(shù)據(jù)標(biāo)準(zhǔn)化的聯(lián)合方法進(jìn)行散射校正,克服由尺寸效應(yīng)(Size effect)引起的分析誤差。這些聯(lián)合方法同時(shí)考慮了多因素的共同作用,有望進(jìn)一步消除近紅外光譜中的散射效應(yīng),從而提高模型分析的準(zhǔn)確度。

        2 光譜變量選擇算法

        近紅外光譜的吸收區(qū)間大致可歸屬為含氫基團(tuán)C—H、N—H、O—H和S—H基頻分子振動(dòng)的一、二、三級(jí)或更高級(jí)倍頻及其合頻[44],如水分子的合頻大致在5 155 cm-1,伸縮振動(dòng)一級(jí)倍頻在6 944 cm-1;N—H的伸縮振動(dòng)一級(jí)倍頻在6 666 cm-1;酚類(lèi)和醇類(lèi)的一級(jí)倍頻在7 092 cm-1,二級(jí)倍頻在10 000 cm-1。對(duì)于特定的體系目標(biāo)組分,并非所有吸收變量能與之直接相關(guān)聯(lián)。另外,儀器的非等性噪聲等因素也會(huì)產(chǎn)生信噪比較低的光譜吸收變量,這些變量可對(duì)建模造成干擾,引起模型預(yù)測(cè)效果變差。光譜變量選擇算法能夠在眾多近紅外光譜吸收變量中選擇特征性的信息變量,從而在一定程度上提高模型的準(zhǔn)確性。

        簡(jiǎn)單直觀(guān)的變量選擇方法是將所有的光譜變量做全排列,對(duì)每種可能的變量組合進(jìn)行驗(yàn)證,找到一組最優(yōu)的變量組合[45]。然而,對(duì)數(shù)以千計(jì)的近紅外光譜變量,可能的組合數(shù)過(guò)于龐大,以目前的計(jì)算速度幾乎無(wú)法完成。所以,利用優(yōu)化算法進(jìn)行變量選擇是有效可行的策略。以模型的預(yù)測(cè)誤差為優(yōu)化目標(biāo),通過(guò)最小化目標(biāo)函數(shù)尋找有效減低模型預(yù)測(cè)誤差的變量組合,例如,啟發(fā)式并行模擬退火算法(Heuristic and parallel simulated annealing algorithm)[46]等。此類(lèi)算法在一定程度上能夠選擇部分特征性或代表性的變量,但其優(yōu)化算法的設(shè)計(jì)尤為關(guān)鍵,直接影響計(jì)算效率和效果。

        基于變量重要性判據(jù)的方法能夠有效提高計(jì)算效率,例如,回歸系數(shù)絕對(duì)值、回歸系數(shù)的統(tǒng)計(jì)學(xué)參數(shù)stability、P值以及變量之間的冗余程度等。常見(jiàn)的方法有無(wú)信息變量刪除(Uninformative variable elimination,UVE)[47]、蒙特卡羅-無(wú)信息變量刪除(Monte Carlo-uninformative variable elimination,MC-UVE)[48-49]、隨機(jī)測(cè)試(Randomization test,RT)[50]、競(jìng)爭(zhēng)自適應(yīng)重加權(quán)采樣(Competitive adaptive reweighted sampling,CARS)[51]、雙競(jìng)爭(zhēng)自適應(yīng)重加權(quán)采樣(Double competitive adaptive reweighted sampling)[52]、置換正交波長(zhǎng)選擇(Replacement orthogonal wavelengths selection)[53]等。這些方法的計(jì)算效率和效果得到了進(jìn)一步的提高,可以選出特征性或代表性的變量,有效提高了模型的預(yù)測(cè)準(zhǔn)確性。

        變量之間的協(xié)同效應(yīng)包括正協(xié)同和負(fù)協(xié)同作用,可能增加變量選擇的難度[54]。近紅外光譜的變量選擇過(guò)程往往會(huì)受到負(fù)協(xié)同變量的干擾,從而導(dǎo)致計(jì)算的變量重要性判據(jù)失去代表性。為充分考慮變量協(xié)同效應(yīng)的影響,Zhang等[55]提出了一種基于變量排列組合的重要性判據(jù)——C值算法。該判據(jù)定義為每個(gè)變量在有限次排列組合中對(duì)預(yù)測(cè)誤差的平均貢獻(xiàn),用線(xiàn)性模型擬合代表變量組合的采樣矩陣和對(duì)應(yīng)的交互驗(yàn)證誤差向量,得到的回歸系數(shù)即為C值。該方法基于變量直接排列組合的思路選擇代表性變量,有望在存在正負(fù)變量協(xié)同效應(yīng)時(shí)選出代表性變量。

        收縮(Shrinkage)策略是一種改善變量選擇效果的有效方法[56]。該方法通過(guò)多步變量選擇代替單步選擇,每一步均刪除少量的干擾變量來(lái)收縮變量篩選的空間。該策略在CARS方法中被使用,顯著提高了基于回歸系數(shù)絕對(duì)值選擇變量的效果。Zhang等[55]將收縮策略應(yīng)用于更加高效的變量重要性判據(jù)C值中,提出了基于C值的多步變量選擇(Multi-step variable selection based on C value,MSVC)方法。該方法充分利用C值對(duì)負(fù)協(xié)同效應(yīng)變量的識(shí)別能力,通過(guò)多次反復(fù)剔除隱藏的負(fù)協(xié)同效應(yīng)變量達(dá)到選擇重要變量的目的,最終能夠有效提高模型的預(yù)測(cè)準(zhǔn)確性。

        綜合策略也是一種有效改善變量選擇效果的方法。該方法的基本思路是同時(shí)或逐步采用多種方法進(jìn)行變量選擇,然后對(duì)結(jié)果進(jìn)行綜合評(píng)價(jià)。Zhang等[57]在此基礎(chǔ)上提出了一種加權(quán)表決最小收縮和選擇算子(Weighted voting strategy combined with least absolute shrinkage and selection operator)方法。此方法在有放回的重采樣基礎(chǔ)上綜合考慮了稀疏正則化和回歸系數(shù)的信息,可選出最具有代表性的變量。此外,排序預(yù)測(cè)選擇(Ordered predictors selection)[58]、穩(wěn)定自舉軟收縮方法(Stabilized bootstrapping soft shrinkage approach)[59]等也采用了類(lèi)似綜合策略進(jìn)行變量選擇。這些方法能夠在原有的基礎(chǔ)上改善變量選擇,然而選擇效果在很大程度上取決于對(duì)不同方法的平衡和綜合利用度。

        為了降低變量選擇的難度,對(duì)近紅外光譜進(jìn)行分段處理也是一種有效的策略,因此衍生出了很多波段選擇的方法。Zhang等[60]提出了基于排列組合的波段選擇方法——啟發(fā)式最優(yōu)波段組合(Combination of heuristic optimal partner bands),通過(guò)在光譜中選擇冗余性最低的代表性變量,并以此為中心向周?chē)鷶U(kuò)展一定的寬度形成波段,再采用變量排列組合的思路選出具有協(xié)同效應(yīng)的波段組合,從而提高C值的變量選擇效率。區(qū)間組合優(yōu)化(Interval combination optimization)[61]是一種等長(zhǎng)度波段組合優(yōu)化的方法。該方法將整個(gè)波段劃分為若干等長(zhǎng)的波段,然后采用變量選擇的思路進(jìn)行組合優(yōu)化,在選擇變量的同時(shí)大大降低了選擇效率,而波段劃分的合理性可能會(huì)顯著影響最終變量選擇的效果。

        隨著近紅外水光譜組學(xué)[5-7]的發(fā)展,溫度擾動(dòng)相關(guān)的變量選擇問(wèn)題也逐漸凸顯出來(lái)。此外變量選擇往往涉及對(duì)多組不同擾動(dòng)條件下的數(shù)據(jù)進(jìn)行同時(shí)選擇,需要兼顧擾動(dòng)和目標(biāo)組分的共同作用,選出對(duì)擾動(dòng)和目標(biāo)組分變化敏感的變量。Cui等[62]將變量選擇的思路應(yīng)用于溫度依賴(lài)的水光譜組學(xué)數(shù)據(jù)中,選出與溫度變化相關(guān)的代表性變量,從而顯著降低了水光譜組學(xué)分析的復(fù)雜程度。

        3 多元校正算法

        多元校正是化學(xué)計(jì)量學(xué)算法中的重要組成部分,根據(jù)其研究目標(biāo)是否離散,總體上可分為判別分析(即定性分析)與回歸分析(即定量分析)。常見(jiàn)的多元校正方法包括多元線(xiàn)性回歸(Multivariate linear regression,MLR)、主成分回歸(Principal component regression,PCR)、偏最小二乘(Partial least squares,PLS)、支持向量機(jī)(Support vector machine,SVM)和人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)等。這些方法常與光譜預(yù)處理、變量選擇、模型轉(zhuǎn)移等算法聯(lián)用,將近紅外光譜中多個(gè)(或全部)變量結(jié)合起來(lái)共同反映研究目標(biāo)的性質(zhì)。

        基于采樣理論的模型組合方式,主要包括樣本采樣和變量采樣兩種,能夠在一定范圍內(nèi)提高校正模型的預(yù)測(cè)能力。Bian等[63]提出一種基于變量空間采樣偏最小二乘(Variable space boosting partial least squares,VS-BPLS)的模型組合方法,將一系列變量重采樣的子模型通過(guò)加權(quán)的形式組合成一個(gè)總模型,并通過(guò)每個(gè)子模型能夠解釋光譜信號(hào)的總方差決定的其權(quán)重大小。作者使用兩個(gè)近紅外光譜數(shù)據(jù)集驗(yàn)證了該方法在一定程度上能夠提高模型預(yù)測(cè)的準(zhǔn)確性和穩(wěn)定性。

        近紅外光譜的非線(xiàn)性可能會(huì)導(dǎo)致線(xiàn)性模型的預(yù)測(cè)結(jié)果變差。目標(biāo)組分的濃度范圍過(guò)大、光譜數(shù)據(jù)預(yù)處理方法的選擇不當(dāng)以及儀器漂移均可能引起近紅外光譜與組分濃度的非線(xiàn)性關(guān)系問(wèn)題。Liu等[64]提出一種在線(xiàn)LASSO(Just in time-least absolute shrinkage and the selection operator,JIT-Lasso)方法,用來(lái)解決在線(xiàn)近紅外光譜由時(shí)序漂移引起的非線(xiàn)性響應(yīng)問(wèn)題。該方法首先定義了一種基于光譜距離與時(shí)序差加權(quán)的樣本距離盤(pán)踞,然后根據(jù)校正集與驗(yàn)證集樣品的距離對(duì)樣本進(jìn)行動(dòng)態(tài)加權(quán),建立隨驗(yàn)證樣品動(dòng)態(tài)變化的模型,從而能夠在一定程度上提高模型的預(yù)測(cè)準(zhǔn)確度,降低預(yù)測(cè)誤差。

        陳增萍課題組提出光譜形變理論(Spectral shape deformation,SSD)[65]的多元校正框架。該方法認(rèn)為傳統(tǒng)線(xiàn)性校正模型對(duì)于非均相體系和異質(zhì)性樣本可能存在偏差,主要是由于近紅外的光程可能隨樣品發(fā)生變化?;诖思僭O(shè),對(duì)光程可變的樣本進(jìn)行光程修正,再建立多元校正模型,可得到更為準(zhǔn)確的分析結(jié)果。

        深度學(xué)習(xí)(Deep learning)是機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)新方向。近年來(lái),圖形處理器(Graphics processing unit,GPU)加速了數(shù)學(xué)計(jì)算的發(fā)展,使得訓(xùn)練深度學(xué)習(xí)模型不再困難。目前,深度學(xué)習(xí)的基本結(jié)構(gòu)是由不同功能的層(Layer)組成的神經(jīng)網(wǎng)絡(luò),包括卷積層(Convolution layer)、池化層(Pooling layer)、激活函數(shù)層(Activation function layer)、壓平層(Flatten layer)、全聯(lián)層(Full connection layer)、丟棄層(Dropout layer)、輸入層(Input layer)和輸出層(Output layer)等。其中卷積神經(jīng)網(wǎng)絡(luò)(Convolution neural network,CNN)是深度學(xué)習(xí)中最具代表性的一類(lèi)模型。Zhang等[66]提出針對(duì)近紅外光譜分析的CNN模型,由1個(gè)輸入層、3個(gè)卷積層、1個(gè)壓平層、1個(gè)全聯(lián)層和1個(gè)輸出層構(gòu)成。對(duì)4組近紅外光譜數(shù)據(jù)的驗(yàn)證結(jié)果表明,該模型的預(yù)測(cè)效果相比傳統(tǒng)多元校正模型有所提高。Chen等[67]提出的點(diǎn)對(duì)點(diǎn)的卷積神經(jīng)網(wǎng)絡(luò)模型則由1個(gè)輸入層、1個(gè)卷積層、1個(gè)激活函數(shù)層、1個(gè)全聯(lián)層和1個(gè)輸出層組成。組合卷積神經(jīng)網(wǎng)絡(luò)(Ensemble convolutional neural networks)策略[68]通過(guò)訓(xùn)練多個(gè)模型后進(jìn)行加權(quán)組合,可以提高CNN在近紅外光譜分子中的預(yù)測(cè)能力。對(duì)于近紅外光譜的建模,深度學(xué)習(xí)已顯現(xiàn)出一定的優(yōu)勢(shì)。然而,深度學(xué)習(xí)的“黑匣子”特性導(dǎo)致模型解釋性相對(duì)較差;而且深度學(xué)習(xí)的模型也往往較復(fù)雜,易陷入局部最優(yōu)的困境,因此需要較多樣品才能訓(xùn)練出相對(duì)較好的模型。

        近年來(lái)提出的極限學(xué)習(xí)機(jī)(Extreme learning machines,ELM)是一種結(jié)構(gòu)非常簡(jiǎn)單的人工神經(jīng)網(wǎng)絡(luò)模型[69]。由于其泛化性能良好,學(xué)習(xí)速度比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)快很多倍,因此在諸多領(lǐng)域受到廣泛關(guān)注。堆疊組合極限學(xué)習(xí)機(jī)(Stacked ensemble ELM,SE-ELM)[70]將近紅外光譜分為若干區(qū)段,建立多個(gè)ELM模型,再用不同權(quán)重將這些模型組合起來(lái)。該方法對(duì)6組近紅外光譜數(shù)據(jù)的驗(yàn)證結(jié)果表明其預(yù)測(cè)效果和泛化能力(即對(duì)未知樣品的預(yù)測(cè)效果)均優(yōu)于傳統(tǒng)多元校正模型。此類(lèi)模型的優(yōu)點(diǎn)是計(jì)算速度快、預(yù)測(cè)效果好,而且通過(guò)多模型組合或方法間的聯(lián)用可以進(jìn)一步提高模型的泛化性能。

        4 模型轉(zhuǎn)移算法

        近紅外光譜易受外界因素干擾而發(fā)生擾動(dòng)或變化,例如溫度、濕度、樣品形態(tài)、粒度以及儀器升級(jí)、更換等。通過(guò)在不同條件下采集的樣本光譜建立函數(shù)轉(zhuǎn)換關(guān)系校正光譜、模型系數(shù)或預(yù)測(cè)結(jié)果的方法稱(chēng)為模型轉(zhuǎn)移方法。筆者總結(jié)了一些常見(jiàn)的模型轉(zhuǎn)移算法[22],主要包括斜率截距法(Slope/bias,S/B)[71]、專(zhuān)利算法(Shenks algorithm)[72]、直接標(biāo)準(zhǔn)化(Direct standardization,DS)[73]、分段直接標(biāo)準(zhǔn)化(Piecewise direct standardization,PDS)[73]、光譜空間轉(zhuǎn)換(Spectral space transformation,SST)[74]、典型相關(guān)性分析(Canonical correlation analysis,CCA)[75]和交替三線(xiàn)性分解(Alternating tri-linear decomposition,ATLD)[76]等。這些方法大多能夠有效消除光譜間的差異,提高模型的準(zhǔn)確性和適用性。

        近紅外光譜的使用范圍廣泛,產(chǎn)生光譜差異的因素可能互相疊加,導(dǎo)致了模型轉(zhuǎn)移的困難。針對(duì)多因素導(dǎo)致的光譜差異,Zhang等[77]提出了一種穩(wěn)健的模型轉(zhuǎn)移方法——多級(jí)同時(shí)成分分析(Multi-level simultaneous component analysis,MSCA)。該方法將外界環(huán)境擾動(dòng)引起的光譜差異分為兩部分:組分間的通用差異和特異性差異,通過(guò)分步依次校正這兩部分的差異實(shí)現(xiàn)穩(wěn)健的模型轉(zhuǎn)移目的。

        因子分析是將數(shù)據(jù)在低維空間中近似表達(dá)的一類(lèi)方法。利用因子分析將高維空間中的光譜轉(zhuǎn)移轉(zhuǎn)化為低維空間中的抽象因子轉(zhuǎn)移,能夠有效降低模型轉(zhuǎn)移的復(fù)雜程度。例如,聯(lián)合唯一分塊分析(Joint and unique multiblock analysis)[78]、域不變偏最小二乘(Domain-invariant partial-least-squares)[79]、仿射不變式(Affine invariance)[80-81]以及MSCA模型轉(zhuǎn)移方法。Zhang等[82]在此基礎(chǔ)上提出了一種基于權(quán)重系數(shù)的模型轉(zhuǎn)移方法(Calibration transfer based on the weight matrix),該方法在偏最小二乘權(quán)重系數(shù)的基礎(chǔ)上構(gòu)造模型轉(zhuǎn)移函數(shù),轉(zhuǎn)化偏最小二乘權(quán)重為得分,將光譜間的轉(zhuǎn)化變換為光譜與得分間的轉(zhuǎn)化,簡(jiǎn)化了模型轉(zhuǎn)移的復(fù)雜程度,提高了模型轉(zhuǎn)移的可靠性。

        基于拉格朗日乘子法的正則化方法不但能夠?qū)崿F(xiàn)模型的平滑、稀疏等特性,還能夠自由結(jié)合多種約束實(shí)現(xiàn)模型轉(zhuǎn)移和模型更新。此類(lèi)方法通過(guò)超參數(shù)(Hyper-parameter)來(lái)平衡效率(目標(biāo)函數(shù))和模型復(fù)雜程度(約束條件)的關(guān)系,但需通過(guò)交互驗(yàn)證或外部驗(yàn)證決定合適的參數(shù)。Zhang等[83]在此基礎(chǔ)上提出了一種基于嶺回歸的模型更新方法,將預(yù)測(cè)優(yōu)化目標(biāo)和模型系數(shù)的2范數(shù)約束相結(jié)合,實(shí)現(xiàn)了模型系數(shù)的更新,解決了由于儀器漂移或樣本變化引起的模型預(yù)測(cè)能力和可靠性變差的問(wèn)題。

        模型組合方法在模型轉(zhuǎn)移中也有應(yīng)用。Chen等[84]提出了一種組合主成分分析、極限學(xué)習(xí)機(jī)和自適應(yīng)遷移學(xué)習(xí)算法(TrAdaBoost algorithm)的模型轉(zhuǎn)移方法,首先通過(guò)迭代提升的策略建立多個(gè)學(xué)習(xí)機(jī),再通過(guò)加權(quán)將所有學(xué)習(xí)機(jī)綜合起來(lái)建立一個(gè)適用于不同條件下的通用模型。該方法實(shí)際為一種全局建模的策略,思路簡(jiǎn)單,模型預(yù)測(cè)效果有所提高,但相對(duì)傳統(tǒng)基于標(biāo)準(zhǔn)樣品的模型轉(zhuǎn)移策略略顯不足。

        一般來(lái)說(shuō),使用標(biāo)準(zhǔn)樣品的模型轉(zhuǎn)移方法的結(jié)果相對(duì)更加準(zhǔn)確,然而其應(yīng)用性受到限制。南開(kāi)大學(xué)邵學(xué)廣課題組提出了一系列無(wú)需標(biāo)準(zhǔn)樣品的模型轉(zhuǎn)移方法,例如,雙模型策略(Dual model strategy)[85]、偏最小二乘校正(PLS-corrected)[86]和線(xiàn)性模型校正(Linear model correction,LMC)[87]方法。這些算法無(wú)需使用在不同儀器或條件下采集的標(biāo)準(zhǔn)樣品的近紅外光譜,即可實(shí)現(xiàn)不同條件下采集的光譜或模型預(yù)測(cè)值的校正。Zhang等[88]在LMC基礎(chǔ)上提出的修正線(xiàn)性模型校正(Modified linear model correction,mLMC)方法利用拉格朗日乘子法,將預(yù)測(cè)優(yōu)化目標(biāo)函數(shù)與不同條件下模型系數(shù)相關(guān)性約束相結(jié)合,實(shí)現(xiàn)了對(duì)不同儀器設(shè)備基礎(chǔ)上建立的分析模型高效、快速的無(wú)標(biāo)準(zhǔn)樣品轉(zhuǎn)移。

        5 結(jié)論與展望

        隨著現(xiàn)代儀器制造技術(shù)的不斷發(fā)展,近紅外光譜儀逐漸向“微型化”的方向發(fā)展,更多地扮演著一種通用傳感器角色,出現(xiàn)在各種工業(yè)生產(chǎn)和人民的生活中,例如:工業(yè)過(guò)程控制,超市中農(nóng)產(chǎn)品、肉制品、奶制品、蛋類(lèi)等日常檢測(cè)。使用者也逐漸從專(zhuān)業(yè)檢測(cè)分析科研人員轉(zhuǎn)變?yōu)楣と恕⑹忻窈推胀ㄏM(fèi)者。傳統(tǒng)的化學(xué)計(jì)量學(xué)方法的應(yīng)用往往需要謹(jǐn)慎的算法選擇、參數(shù)調(diào)整等一系列過(guò)程,導(dǎo)致大量非專(zhuān)業(yè)人員望而卻步。因此,新時(shí)代背景下的化學(xué)計(jì)量學(xué)方法正朝著“自動(dòng)化”、“智能化”、“云計(jì)算”的方向發(fā)展,同時(shí)助力近紅外光譜技術(shù)走出實(shí)驗(yàn)室,進(jìn)入普通生活的千家萬(wàn)戶(hù)。

        隨著“互聯(lián)網(wǎng)+”和“大數(shù)據(jù)”時(shí)代的到來(lái),近紅外光譜的應(yīng)用前景越來(lái)越廣泛,多種傳感器的聯(lián)用現(xiàn)象也越來(lái)越普遍,同時(shí)化學(xué)計(jì)量學(xué)方法更多地考慮數(shù)據(jù)間的相互融合和補(bǔ)充。近紅外光譜對(duì)水分、濕度、儀器狀態(tài)等外界擾動(dòng)非常敏感,可能會(huì)引起傳統(tǒng)的化學(xué)計(jì)量學(xué)方法所建立的模型效果變差。如果將擾動(dòng)看作補(bǔ)充信息的一種新維度,借助多種傳感器提供的額外信息建立針對(duì)擾動(dòng)的自適應(yīng)算法,能夠化干擾為信息,有效提高近紅外光譜分析的準(zhǔn)確程度。南開(kāi)大學(xué)邵學(xué)廣課題組提出了多種基于溫度擾動(dòng)的水光譜學(xué)算法,將溫度擾動(dòng)作為一種數(shù)據(jù)信息增強(qiáng)的手段,從而提高了近紅外光譜分析的效果和技術(shù)使用范圍。因此,新時(shí)代下化學(xué)計(jì)量學(xué)算法的發(fā)展應(yīng)以“數(shù)據(jù)融合”和“相互補(bǔ)充”為導(dǎo)向,以助力近紅外光譜檢測(cè)分析技術(shù)向更加廣泛、準(zhǔn)確的方向發(fā)展和應(yīng)用。

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線(xiàn)三等角』
        重尾非線(xiàn)性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        學(xué)習(xí)方法
        可能是方法不對(duì)
        3D打印中的模型分割與打包
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢(qián)方法
        亚洲免费一区二区三区视频 | 久久婷婷色香五月综合缴缴情| 中文字幕丰满伦子无码| 丰满岳乱妇在线观看中字无码 | 中文字幕精品久久一区二区三区 | 激情婷婷六月| 无码一区二区三区不卡AV| 国产99视频一区二区三区| 国产一区三区二区视频在线观看| 大香蕉av一区二区三区| 欧洲美熟女乱又伦av影片| 亚洲色大成网站www久久九| 亚洲av成人无码网天堂| 国产精品自产拍在线观看免费| 日本国主产一区二区三区在线观看 | 久久91精品国产91久| 人妻免费黄色片手机版| 久久一区二区av毛片国产| 精品国际久久久久999波多野| 亚洲国色天香卡2卡3卡4| 亚洲综合中文字幕乱码在线| 欧美日韩国产乱了伦| 中文乱码字幕在线亚洲av| 熟妇熟女乱妇乱女网站| 色一情一乱一伦一区二区三欧美| 国产女主播强伦视频网站| 在线观看av不卡 一区二区三区| 老熟女富婆激情刺激对白| 好紧好爽免费午夜视频| 久草热8精品视频在线观看| aⅴ色综合久久天堂av色综合| 亚洲日本一区二区三区四区| 末成年女a∨片一区二区| 国产人在线成免费视频麻豆| 国产亚洲精选美女久久久久 | av在线播放一区二区免费| 亚洲av高清在线观看一区二区| 蜜桃臀无码内射一区二区三区| 午夜视频福利一区二区三区| 国产精品久久婷婷六月丁香| 亚洲av精二区三区日韩|