亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        平均分布差異最小化的NIR標(biāo)定遷移方法研究

        2021-10-17 01:39:20趙煜輝蘆鵬程羅昱博
        光譜學(xué)與光譜分析 2021年10期
        關(guān)鍵詞:標(biāo)準(zhǔn)差異方法

        趙煜輝, 蘆鵬程, 羅昱博, 單 鵬

        東北大學(xué)秦皇島分校, 河北 秦皇島 066000

        引 言

        近紅外光譜(NIR)分析技術(shù)具備操作簡單、 分析數(shù)據(jù)速度快、 成本較低、 不污染樣品等優(yōu)勢, 已在各領(lǐng)域得到廣泛應(yīng)用, 如農(nóng)產(chǎn)品生產(chǎn)、 化工產(chǎn)品生產(chǎn)、 食品生產(chǎn)以及環(huán)境監(jiān)測領(lǐng)域[1-4]。 近紅外光譜技術(shù)在定性分析和快速物質(zhì)成分定量分析以及實(shí)現(xiàn)在線檢測方面具有獨(dú)特優(yōu)勢[5]。 建立多元校正模型是近紅外光譜分析技術(shù)的重要內(nèi)容。 即通過一定的數(shù)學(xué)分析方法, 對近紅外光譜數(shù)據(jù)進(jìn)行分析建模, 從而達(dá)到對一些指標(biāo)進(jìn)行預(yù)測的目的, 這是一種根據(jù)已有樣本總結(jié)出規(guī)律生成模型的方法。 但實(shí)際的工業(yè)生產(chǎn)中, 測量儀器、 環(huán)境和場景通常并不一致, 依據(jù)已有近紅外光譜數(shù)據(jù)建立的模型往往并不適用新的儀器采集的數(shù)據(jù), 原有模型失效, 并且在測量環(huán)境或其他條件變化后, 也需更新模型。

        標(biāo)定遷移是指在不同測量儀器或測量狀態(tài)下的多元標(biāo)定模型遷移方法, 通過將從光譜數(shù)據(jù)遷移到主光譜數(shù)據(jù)空間, 進(jìn)而實(shí)現(xiàn)主光譜數(shù)據(jù)模型對從光譜數(shù)據(jù)模型的預(yù)測, 避免重復(fù)建模[6-7]。

        已有標(biāo)定遷移方法[8-9], 主要是通過一組標(biāo)準(zhǔn)樣品構(gòu)建遷移模型, 它需要在主儀器和從儀器上分別測量一組標(biāo)準(zhǔn)樣本, 通過一組標(biāo)準(zhǔn)樣本來糾正主儀器和從儀器之間光譜的差異。 分段直接標(biāo)準(zhǔn)化(piecewise direct standardization, PDS), 主儀器的每個波長與從儀器的波長窗口相關(guān), 基于每個窗口間回歸系數(shù)形成帶狀遷移矩陣。 實(shí)驗(yàn)結(jié)果與假設(shè)是一致的, 即在各種遷移方法中, 主儀器和從儀器之間的頻譜相關(guān)性被限制在較小的區(qū)域。 PDS的關(guān)鍵是窗口大小的選擇和標(biāo)準(zhǔn)樣本數(shù)目的確定。 在偏差斜率校正(slope and bias correction, SBC)[10]中, 假設(shè)不同儀器的預(yù)測值之間存在線性關(guān)系, 先計(jì)算光譜和響應(yīng)值之間的回歸系數(shù); 并用該系數(shù)分別計(jì)算主儀器和從儀器的預(yù)測值; 最后, 在預(yù)測值之間進(jìn)行線性擬合。 SBC算法為一種單變量方法, 因此在測量儀器和測量條件變化引起系統(tǒng)化的光譜差異的情況下, 才能取得較好的效果。 現(xiàn)實(shí)生活中, 光譜差異往往比較復(fù)雜, 此時它的預(yù)測能力是不確定的。 Liang等提出了基于典型相關(guān)分析(canonical correlation analysis, CCA)的標(biāo)定遷移方法成功地校正了不同光譜之間的差異。 首先, 使用主儀器的標(biāo)定集構(gòu)建PLS模型; 選取主儀器和從儀器的標(biāo)定集的一部分作為標(biāo)準(zhǔn)樣本; 通過典型相關(guān)分析分別提取特征[11]。

        標(biāo)準(zhǔn)樣本要求主從儀器在相同的環(huán)境及條件下測量同一組樣本。 工業(yè)應(yīng)用中, 由于標(biāo)樣組分的揮發(fā)性及可變性, 使保持標(biāo)準(zhǔn)樣品的完整性很難實(shí)現(xiàn)[12], 為此, 需建立標(biāo)準(zhǔn)樣本自由的標(biāo)定遷移模型[13]。

        Bouveresse等提出的多元散射校正(multiplicative scatter/signal correction, MSC)[14]是一種信號預(yù)處理方法。 MSC計(jì)算校準(zhǔn)集的平均光譜作為參考光譜, 并在每個光譜和參考光譜之間找到線性關(guān)系, 得到斜率和偏差, 利用斜率和偏差來校正從光譜, 雖然不需要標(biāo)準(zhǔn)樣本, 但難以處理復(fù)雜情況, 且模型性能多數(shù)情況較差。

        遷移成分回歸(transfer component regression, TCR)也是一種無標(biāo)準(zhǔn)的遷移方法[13], 它結(jié)合了遷移成分分析(transfer component analysis, TCA)[15]和普通最小二乘法(ordinary least square, OLS)。 TCA的基本思想是在再生希爾伯特空間中投影兩個儀器的數(shù)據(jù), 在這個空間中, 主儀器和從儀器的數(shù)據(jù)分布盡可能的接近, 同時保留原始數(shù)據(jù)的關(guān)鍵屬性。 TCR是一個具有良好泛化能力的穩(wěn)健模型, 但無法實(shí)現(xiàn)更準(zhǔn)確的預(yù)測。

        針對標(biāo)準(zhǔn)樣本難以獲得和保存, 現(xiàn)有的標(biāo)準(zhǔn)樣本自由的標(biāo)定遷移方法預(yù)測能力相對一般的情況, 提出了一種標(biāo)準(zhǔn)樣本自由的基于最小化平均分布差異的NIR偏最小二乘標(biāo)定遷移方法(minimizing mean distribution discrepancy Calibration Transfer for NIR, MCT)。 此方法在不考慮從儀器標(biāo)準(zhǔn)樣本的情況下, 為去光譜數(shù)據(jù)的多重共線性, 首先假設(shè)存在一個適用于主從儀器的偏最小二乘子空間, 該子空間通過后續(xù)優(yōu)化主從儀器在此空間中的分布差異獲得, 接著將主從儀器光譜數(shù)據(jù)分別投影到該假設(shè)的公共子空間; 然后引入平均分布差異最小化算法, 即分別給出主從光譜數(shù)據(jù)在子空間的平均分布(中心點(diǎn))表示函數(shù), 最小化兩個光譜平均分布(中心點(diǎn))的差異, 并最大化投影后主儀器光譜的協(xié)方差, 目的是使主儀器投影后的數(shù)據(jù)具有最大相關(guān)性, 推導(dǎo)求解出最佳子空間; 最后, 將主光譜樣本和從光譜預(yù)測樣本分別投影到該子空間中, 利用主光譜數(shù)據(jù)得到回歸模型, 通過此回歸系數(shù)計(jì)算出從光譜預(yù)測濃度。 該方法無需標(biāo)準(zhǔn)樣本的獲取, 便能縮小主從儀器數(shù)據(jù)間的分布差異, 同時對比現(xiàn)有標(biāo)準(zhǔn)自由遷移方法, 更加簡單高效, 并具有更好的預(yù)測性能。 本文使用玉米數(shù)據(jù)集和小麥數(shù)據(jù)集, 將MCT的性能與SBC, PDS, CCACT, TCR和MSC進(jìn)行比較。

        1 理論知識

        1.1 定義符號

        1.2 偏最小二乘法

        在化學(xué)計(jì)量學(xué)中, 偏最小二乘算法(partial least square, PLS)是一種很有效的多元標(biāo)定方法。 PLS算法結(jié)合了多元線性回歸、 主成分分析、 典型相關(guān)分析的優(yōu)點(diǎn), 被廣泛用于建立輸入空間和響應(yīng)空間之間的關(guān)系。 PLS通過分?jǐn)?shù)向量建立輸入空間和響應(yīng)空間之間的關(guān)系。 PLS模型的目的是確保最佳的潛變量數(shù)量。 潛變量是原始變量的線性組合。 它包含了關(guān)于X和y之間關(guān)系的最大相關(guān)信息。 在數(shù)學(xué)上, 由式(1)表示目標(biāo)函數(shù)

        subject to ‖w‖2=1

        (1)

        其中w代表權(quán)重向量。 該目標(biāo)函數(shù)是在一個約束下的最大化問題, 可以通過拉格朗日乘數(shù)法進(jìn)行求解。

        在這個算法中, 第一個權(quán)重向量必須是矩陣XTyyTX的主要的特征向量。 從第二個潛變量開始, 它要求接下來的潛變量與前面的潛變量正交(不相關(guān))。 因此, 接下來的權(quán)重向量也是矩陣的主要特征向量, 重復(fù)這一系列步驟直到收斂。 模型被構(gòu)建通過如下等式

        其中T是得分矩陣,P和Q分別代表X的載荷矩陣和y的載荷矩陣向量;E和F分別表示殘差矩陣;A是PLS模型潛變量的最佳數(shù)量。

        最后, 模型的回歸系數(shù)β可寫如式(2)

        β=W(PTW)-1QT

        (2)

        式(2)中,W=[w1,w2, ……,wA]為權(quán)重矩陣。

        1.3 模型建立

        (3)

        令T=PTX, 最小化問題式(3)可以重新表示為

        (4)

        為了學(xué)習(xí)得到這樣一個能使式(4)中的平均分布差異最小化的基變換矩陣P, 還應(yīng)確保投影后的源數(shù)據(jù)XS與源數(shù)據(jù)濃度yS之間的關(guān)系具有最大相關(guān)信息。 因此, 對于源域的數(shù)據(jù), 合理的做法是將以下項(xiàng)最大化

        (5)

        在求解式(5)時可以看出, 源域數(shù)據(jù)的協(xié)方差在新學(xué)習(xí)的子空間中已經(jīng)被最大化, 那么在這一過程中就保留了盡可能多的可用信息。

        結(jié)合式(4)和式(5), 可以得到以下優(yōu)化目標(biāo)

        (6)

        (7)

        在式(7)的最大化問題中,P有許多的可能解(即并非唯一解), 為了保證解的唯一性, 式(7)施加了一個等式約束, 這樣就可以寫成

        s.t.Tr(PT(μS-μT)(μS-μT)TP)=η

        (8)

        其中η是一個常數(shù)。

        為了解出式(8), 將其改為拉格朗日函數(shù), 見式(9)

        γ(Tr(PT(μS-μT)(μS-μT)TP)-η)

        (9)

        其中γ表示拉格朗日乘子系數(shù)。

        接下來, 將L(P,γ)對P求偏導(dǎo), 令其偏導(dǎo)數(shù)為0, 就得到

        AP=γP

        (10)

        由此得出, 最優(yōu)子空間P*表示矩陣A特征值分解后的前k個最大特征值所對應(yīng)的特征向量, 而γ表示是一個對角矩陣, 對角線上的值分別為前k個最大特征值。

        為了便于實(shí)現(xiàn), 將所提出的MCT算法歸納到下列算法描述中。

        1.4 MCT的算法描述

        輸出: 回歸系數(shù)β。

        (2) 計(jì)算矩陣A

        (3) 根據(jù)公式AP=γP對A進(jìn)行特征值分解。

        (4) 得最優(yōu)子空間P*=[p1,p2, …,pk]

        (5) 計(jì)算投影到子空間后的矩陣

        (6) 計(jì)算回歸系數(shù)

        MCT算法到此結(jié)束。

        (7) 預(yù)測

        2 實(shí)驗(yàn)部分

        為了驗(yàn)證算法的準(zhǔn)確性和實(shí)用性, 使用玉米數(shù)據(jù)集和小麥數(shù)據(jù)集作為實(shí)驗(yàn)對象, 對數(shù)據(jù)集進(jìn)行了數(shù)據(jù)分析, 來檢驗(yàn)MCT方法的性能。

        2.1 數(shù)據(jù)集介紹

        第一個數(shù)據(jù)集是在三個近紅外光譜儀(M5, MP5和MP6)上測量含有80個樣本的玉米數(shù)據(jù)集。 每個樣品含有四種成分: 水分, 油, 蛋白質(zhì)和淀粉。 波長范圍為1 100~2 498 nm, 間隔為2 nm(700個通道)。 該數(shù)據(jù)集可以從http://www.eigenvector.com/Data/Corn/下載。 使用這三個近紅外光譜儀和玉米數(shù)據(jù)集成分中的水分進(jìn)行研究討論。 儀器M5和儀器MP5之間的光譜差異如圖1(a)所示; 儀器M5和儀器MP6之間的光譜差異如圖1(c)所示; 儀器MP5和儀器MP6之間的光譜差異如圖1(e)所示。 其中橫軸表示波長, 縱軸表示吸光度差異, 曲線表示光譜樣本。

        圖1 不同儀器之間的光譜差異

        小麥數(shù)據(jù)集由制造商A的三個儀器(A1, A2和A3)測量的248個樣本組成。 數(shù)據(jù)集只提供蛋白質(zhì)參考值。 波長范圍為730~1 100 nm, 間隔為0.5 nm。 可在http://www.idrc-chambersburg.org/獲取。 使用了三個近紅外光譜儀和蛋白質(zhì)含量進(jìn)行研究討論。 儀器A1和儀器A2之間的光譜差異如圖1(b)所示; 儀器A1和儀器A3之間的光譜差異如圖1(d)所示; 儀器A2和儀器A3之間的光譜差異如圖1(f)所示。 其中橫軸表示波長, 縱軸表示吸光度差異, 曲線表示光譜樣本。

        2.2 數(shù)據(jù)處理

        通過Kennard-Stone算法將玉米數(shù)據(jù)集的80個樣本分成兩組: 80%用做標(biāo)定集樣本, 20%用做測試集樣本; 將小麥數(shù)據(jù)集的248個樣本分成兩組: 80%用作標(biāo)定集樣本, 20%用作測試集樣本。 對于有遷移標(biāo)準(zhǔn)的遷移方法, 使用Kennard-Stone算法在標(biāo)定樣本上選擇若干個標(biāo)準(zhǔn)樣品。

        2.3 性能評估

        在該實(shí)驗(yàn)中, 均方根誤差(root mean square error, RMSE)被用作參數(shù)選擇和模型評估的指標(biāo)。 此外, RMSEC表示標(biāo)定集的訓(xùn)練誤差, RMSEP表示測試集的預(yù)測誤差。 RMSE計(jì)算方法寫為

        (11)

        文中RMSEP代表從儀器測試集。

        3 結(jié)果與討論

        選用玉米和小麥光譜數(shù)據(jù)集檢驗(yàn)?zāi)P偷男阅堋?使用SBC, PDS, CCACT, MSC和TCR五種方法進(jìn)行對比實(shí)驗(yàn)。 對于SBC, PDS, CCACT和MSC算法均采用PLS算法作為主體算法, 使用主儀器的光譜數(shù)據(jù)建立多元標(biāo)定模型作為參考模型, 用于對從儀器的待測樣本進(jìn)行預(yù)測。 實(shí)驗(yàn)結(jié)果主要包含兩個部分: (1) MCT和對比方法的RMSEC和RMSEP比較; (2) MCT和對比方法預(yù)測結(jié)果的擬合能力示意圖。

        MCT和其他五種標(biāo)定遷移方法的標(biāo)定誤差和預(yù)測誤差被展示在表1和表2中。

        表1 SBC, PDS, TCR, CCACT, MSC和MCT六種遷移方法在玉米數(shù)據(jù)集下的RMSEC, RMSEP

        表2 SBC, PDS, TCR, CCACT, MSC和MCT六種遷移方法在小麥數(shù)據(jù)集下的RMSEC, RMSEP

        玉米數(shù)據(jù)集實(shí)驗(yàn)結(jié)果分析如下:

        對于儀器MP5到儀器M5的標(biāo)定遷移, MCT的RMSEP小于TCR和MSC這兩種標(biāo)準(zhǔn)樣本自由的方法, 同時也小于SBC, PDS和CCACT這三種有標(biāo)樣的RMSEP, 并且MCT的RMSEC也低于其他五種遷移方法。 對于儀器MP6到儀器M5的標(biāo)定遷移, 由SBC, PDS, CCACT, TCR和MSC獲得的最低RMSEP分別為0.36, 0.40, 0.41, 0.47和1.92。 表1中列出的結(jié)果清楚地表明MCT具有比其他五種方法更低的RMSEP和RMSEC。 對于從MP6到MP5的標(biāo)定遷移, MCT再一次達(dá)到了最小的RMSEP和RMSEC。

        小麥數(shù)據(jù)集實(shí)驗(yàn)結(jié)果分析如下:

        對于儀器A1到A2的遷移, 當(dāng)標(biāo)準(zhǔn)樣品數(shù)為35, 25和35時, SBC, PDS和CCACT分別取到最小值。 從表2中能夠看出方法MCT的RMSEC和RMSEP都小于其他五種方法的最佳結(jié)果。 對于儀器A2到A3的遷移, 當(dāng)標(biāo)準(zhǔn)樣品數(shù)為35時, SBC, PDS和CCACT均取到最小值, 由表看出MCT的RMSEP均小于其余五種方法。 對于儀器A3到A2的遷移, MCT再一次達(dá)到了最小RMSEP和RMSEC。

        這六組對比實(shí)驗(yàn)可以看出, MCT模型在通常情況下能夠取得最優(yōu)的預(yù)測效果, 并具有更好的魯棒性。

        圖2—圖4和圖5, 圖6分別顯示了在玉米集和小麥集中, 六種不同的標(biāo)定遷移方法的預(yù)測值與測量值的關(guān)系圖。 預(yù)測濃度和測量濃度之間的零差異, 將會使得樣本點(diǎn)在直線上。 對于有標(biāo)準(zhǔn)樣本的標(biāo)定遷移方法, 選取預(yù)測性能最優(yōu)時的數(shù)據(jù)用于比較, 以便更加充分的體現(xiàn)出MCT能夠取得良好的預(yù)測性能。 表3是六種遷移方法的預(yù)測值與測量值曲線擬合斜率表。

        圖2 SBC, PDS, CCACT, TCR, MSC和MCT六種方法在儀器M5和儀器MP5之間預(yù)測結(jié)果的散點(diǎn)圖

        圖3 SBC, PDS, CCACT, TCR, MSC和MCT六種方法在儀器M5和儀器MP6之間預(yù)測結(jié)果的散點(diǎn)圖

        圖4 SBC, PDS, CCACT, TCR, MSC和MCT六種方法在儀器MP5和儀器MP6之間預(yù)測結(jié)果的散點(diǎn)圖

        圖5 SBC, PDS, CCACT, TCR, MSC和MCT六種方法在儀器A2和儀器A1之間預(yù)測結(jié)果的散點(diǎn)圖

        對于玉米數(shù)據(jù)集表, 圖2—圖4顯示MCT方法的預(yù)測結(jié)果相比其他五種遷移方法具有更好的預(yù)測性。 根據(jù)表3中的數(shù)據(jù)也可證明MCT相比其他方法更加接近直線。 通過上面的陳述, 可以得到結(jié)論: MCT能夠在玉米集所有模型中實(shí)現(xiàn)最佳的預(yù)測性能, 同時具有更好的泛化能力。

        對于小麥數(shù)據(jù)集, 圖5—圖7及表3中均可以看出, MCT的樣本點(diǎn)更加接近直線, 相比其他五種方法, 其能夠達(dá)到更好的預(yù)測效果。 通過上述對比, 可以很容易地得到結(jié)論: MCT在小麥集的所有模型中能夠?qū)崿F(xiàn)最佳的預(yù)測性能, 同時具有更好的泛化能力。

        圖7 SBC, PDS, CCACT, TCR, MSC和MCT六種方法在儀器A2和儀器A3之間預(yù)測結(jié)果的散點(diǎn)圖

        表3 SBC, PDS, TCR, CCACT, MSC和MCT六種遷移方法預(yù)測結(jié)果斜率對比表

        3 結(jié) 論

        提出了一種基于最小化平均分布差異的標(biāo)準(zhǔn)樣本自由NIR偏最小二乘標(biāo)定遷移方法。 該方法學(xué)習(xí)了如何找到能夠使主從儀器數(shù)據(jù)投影后, 兩域平均分布差異最小的同時, 還能使主光譜投影后的數(shù)據(jù)相關(guān)性最大的一個公共子空間。 在該子空間中, 主從儀器的數(shù)據(jù)分布得到了極大的校正, 能夠使從儀器共用主儀器模型, 實(shí)現(xiàn)標(biāo)定遷移。

        在玉米和小麥數(shù)據(jù)集中, 使用SBC, PDS, CCACT, TCR和MSC作為對比實(shí)驗(yàn)來檢驗(yàn)MCT方法的性能, 并且所提出的方法(MCT)通常實(shí)現(xiàn)了最佳的RMSEC和RMSEP。 結(jié)果清楚地表明, MCT能夠成功地用于校正在不同儀器上測量的光譜之間的差異。 對于SBC, PDS和CCACT這三種遷移方法, 它們需要標(biāo)準(zhǔn)樣品建立遷移模型。 在TCR中, 從儀器樣品還需要少量的參考值。 這兩個條件在實(shí)際應(yīng)用中, 都會產(chǎn)生很昂貴的代價, 甚至無法滿足這一條件。 因此, 當(dāng)標(biāo)準(zhǔn)樣品在實(shí)際應(yīng)用中不可獲得時, 同時對比現(xiàn)有標(biāo)準(zhǔn)樣本自由方法, MCT是一種有效的標(biāo)定遷移方法。

        猜你喜歡
        標(biāo)準(zhǔn)差異方法
        2022 年3 月實(shí)施的工程建設(shè)標(biāo)準(zhǔn)
        相似與差異
        音樂探索(2022年2期)2022-05-30 21:01:37
        找句子差異
        忠誠的標(biāo)準(zhǔn)
        美還是丑?
        生物為什么會有差異?
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        一家之言:新標(biāo)準(zhǔn)將解決快遞業(yè)“成長中的煩惱”
        專用汽車(2016年4期)2016-03-01 04:13:43
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        国产成人午夜av影院| 精品成人乱色一区二区| 色综合一本| 国产一级黄色av影片| 国产自拍精品在线免费观看| 高潮抽搐潮喷毛片在线播放| 中文字幕人妻中文av不卡专区| 欧美精品日韩一区二区三区| 日本在线免费不卡一区二区三区| 4hu四虎永久免费地址ww416| 中文字幕爆乳julia女教师| 91精品啪在线观看国产色| 网址视频在线成人亚洲| 一区二区三区内射美女毛片| 人禽伦免费交视频播放| 亚洲精品中文字幕不卡在线| 中文字幕亚洲综合久久久| 国产亚州精品女人久久久久久| 国产福利酱国产一区二区| 亚洲一区二区三区久久蜜桃| 亚洲hd高清在线一区二区| 久久无码字幕中文久久无码 | 天天做天天爱天天综合网2021| 亚洲羞羞视频| 亚洲中文字幕永久网站| 在线观看亚洲第一黄片| 亚洲成av人片一区二区| 黑人巨大精品欧美在线观看| 蜜桃网站入口可看18禁| 亚洲日韩中文字幕无码一区| 国产目拍亚洲精品一区二区| 日韩av不卡一二三区| 日本高清一级二级三级| 亚洲一线二线三线写真| 国产亚洲欧美在线播放网站| 五月婷婷开心六月激情| 国产va免费精品高清在线观看 | 久久亚洲AV无码精品色午夜| 99热婷婷一区二区三区| 亚洲国产美女精品久久久久∴| 久久精品日韩av无码|