亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于卷積神經(jīng)網(wǎng)絡(luò)和便攜式拉曼光譜儀的彩色礦物顏料成分分析

        2022-05-24 07:21:14祁文博牟濤濤陳少華
        傳感器世界 2022年3期
        關(guān)鍵詞:分類模型

        祁文博 牟濤濤 陳少華

        北京信息科技大學儀器科學與光電工程學院,北京 100192

        0 前言

        礦物顏料是古代制作藝術(shù)品常用的顏料,分析礦物顏料成分有助于文物的鑒定和修復,因此開發(fā)一種礦物顏料檢測方法是必要的。

        當前主流的檢測技術(shù)有紅外光譜[1]、拉曼光譜[2]和X-射線[3]等。這些技術(shù)被廣泛應(yīng)用于醫(yī)學、農(nóng)業(yè)和食品安全等領(lǐng)域。SI L等人[4]使用近紅外光譜技術(shù)結(jié)合化學計量方法研究藥品摻假情況,對Yaobitong膠囊做定量和定性分析,驗證了紅外光譜技術(shù)在藥品檢測中的可行性。UNAL M等人[5]提出利用拉曼光譜評估軟骨水化狀態(tài)的方法,取得了較好的效果。在這些技術(shù)中,拉曼光譜具有高靈敏度、抗干擾能力強等優(yōu)點,適合應(yīng)用于礦物顏料的檢測。

        1928年,印度科學家C.V.RAMAN發(fā)現(xiàn)了拉曼效應(yīng)的存在。拉曼光譜是基于拉曼效應(yīng)的檢測技術(shù),它是一種散射光譜,可以得到分子振動、轉(zhuǎn)動方面的信息,從而分析物質(zhì)成分。很多學者已經(jīng)把拉曼光譜技術(shù)應(yīng)用于顏料的檢測分析中[6-7]。LEI Z等人[8]使用掃描電鏡-能譜儀、拉曼光譜和偏振光顯微鏡對大高玄殿的彩繪顏料進行研究,實驗中使用了不易移動的儀器,因此不能進行現(xiàn)場檢測。COSANO D等人[9]使用顯微拉曼光譜檢測Annunciation sculptural group上的顏料,實驗中進行了大量的光譜分析,這需要專業(yè)的光譜學知識。上述實驗的局限性限制了拉曼光譜的應(yīng)用。

        深度學習算法可以自動提取拉曼光譜的特征并進行分類,不需要人工的光譜分析。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)作為深度學習的一個分支,被廣泛應(yīng)用于醫(yī)學[10]、自然語言處理[11]和圖像識別[12]等領(lǐng)域,CNN通常包含卷積層、池化層和全連接層:卷積層用于提取特征,池化層用于減小特征圖的大小,并消除冗余的信息,全連接層用于分類。拉曼光譜由于儀器定標、精度等問題可能發(fā)生少量偏移,卷積層的平移不變性特點可以很好地適應(yīng)這種偏移。

        本文提出一種Deep-CNN模型,結(jié)合便攜式拉曼光譜儀,可以自動、準確地識別三元混合礦物顏料的成分,同時解決了實驗室級別的拉曼儀器操作復雜、不易移動的問題。在使用便攜式拉曼儀器時會引入較強的環(huán)境光[13]和噪聲,給分類帶來難度,Deep-CNN模型消除了這些影響。實驗結(jié)果表明,該模型具備以下3點優(yōu)勢:(1)具有良好的抗噪聲能力;(2)使用小數(shù)據(jù)集訓練也能取得準確的分類結(jié)果;(3)對成分不同于實驗樣本的混合物也能做出準確的分類。

        1 CNN算法原理

        CNN是一種包含卷積計算的深度學習算法,通常包含卷積層、池化層和全連接層。卷積層通過卷積核在原始數(shù)據(jù)上滑動,進行卷積計算,由于卷積核共享參數(shù)的特性,使CNN具備平移不變性。卷積層運算公式如下:

        其中,xin-1——第n-1層第i個輸入特征圖;

        *——卷積運算;

        yjn——第n層第j個輸出特征圖;

        kijn——第n-1層與第n層卷積運算所使用的卷積核;

        bjn——第n層第j個特征圖的偏置;

        f——卷積層的激活函數(shù)。

        卷積層后通常使用池化層進行下采樣,池化層可以在保留數(shù)據(jù)重要特征的同時去除冗余信息,常見的池化層包括平均池化層和最大池化層,它們分別是對池化窗口內(nèi)的數(shù)據(jù)取平均值和取最大值。多個卷積層和池化層組合使用構(gòu)成特征提取器。提取的特征輸入全連接層進行分類,為了避免過擬合,全連接層通常會應(yīng)用“輟學技術(shù)”(Dropout),即隨機凍結(jié)部分神經(jīng)元。全連接層的計算公式為:

        其中,W——參數(shù)矩陣;

        x——輸入向量;

        y——輸出向量;

        b——偏置向量;

        n——神經(jīng)元數(shù)量;

        m——輸入向量長度。

        2 數(shù)據(jù)集建立和光譜預處理

        2.1 樣本制備和數(shù)據(jù)集建立

        實驗選用古代繪畫中常用的3種礦物顏料(朱砂、雌黃和淡黃)制備樣本,將這3種礦物顏料混合,最終得到7類樣本,具體成分如表1所示:

        表1 混合礦物顏料的成分

        由于實驗中使用的礦物顏料是彩色的,使用普通的拉曼儀器在較高功率下可能會對樣本產(chǎn)生損傷,因此,本次實驗使用基于數(shù)字鏡像裝置(Digital Mirror Device,DMD)和Lissajous模式調(diào)制的便攜式拉曼儀器采集拉曼光譜[14],可以在保證不損傷樣本的前提下獲得更優(yōu)質(zhì)的光譜(使用更高的激光功率),光譜采集系統(tǒng)如圖1所示。光譜儀的具體參數(shù)為:激光波長是785 nm±0.02 nm;分辨率是8~11 cm-1;激光功率設(shè)置為500 mW;光譜范圍是200~1,800 cm-1。對每個樣本采集40個光譜,共采集280個光譜作為訓練集和驗證集(訓練集和驗證集的比為3:1),其中,每個光譜是一個長度為801的一維數(shù)據(jù)。為了保證模型評估的準確性,按照上述樣本制作方法再次制作7個新的樣本,對每個樣本采集20個光譜作為測試集,圖2為7個樣本的拉曼光譜。

        2.2 數(shù)據(jù)增強

        CNN是一種基于數(shù)據(jù)訓練的模型,數(shù)據(jù)不足會導致模型過擬合,即在訓練集上的表現(xiàn)良好,但在測試集上的表現(xiàn)很差,因此需要進行數(shù)據(jù)增強來擴充數(shù)據(jù)集。拉曼光譜由于儀器定標、誤差和檢測環(huán)境等影響會發(fā)生少量偏移,因此對光譜進行平移變換從而增強數(shù)據(jù)集是合理的。本實驗通過隨機去除光譜首尾共3個數(shù)據(jù)點的方法對光譜進行數(shù)據(jù)增強,將訓練集和驗證集擴充為原來的4倍(1,120條光譜)。

        2.3 光譜預處理

        為了減少拉曼光譜的噪聲和基線漂移,實驗使用Savitzky-Golay、airPLS和歸一化算法對光譜進行預處理,Savitzky-Golay濾波算法可以對光譜進行平滑,減少噪聲,其原理是通過線性最小二乘法將相鄰數(shù)據(jù)點的連續(xù)子集與一個低次多項式進行擬合。airPLS基線矯正算法可以有效減少光譜的基線漂移,其采用了基于誤差的迭代加權(quán)策略,即每一個數(shù)據(jù)點的權(quán)重更新基于上一個循環(huán)擬合的基線和原始信號之間的差異。歸一化可以使不同數(shù)量級的特征易于比較,本實驗為了最大程度保留光譜信息,保留基線矯正后光譜的負值部分,圖3為朱砂、雌黃、淡黃混合物光譜的預處理效果圖。

        3 Deep-CNN模型

        混合物檢測屬于多標簽分類問題,實驗中建立了3個Deep-CNN模型,分別用于判斷樣本是否包含朱砂、雌黃和淡黃。

        本文提出的Deep-CNN模型,包含7個卷積層、7個池化層、2個全連接層和1個輸出層。其中,池化層使用最大池化層,每個全連接層都包含512個神經(jīng)元,輸出層包含1個神經(jīng)元。每個卷積層和全連接層都使用ReLU激活函數(shù)去線性化,輸出層使用Sigmoid激活函數(shù)得到預測概率。激活函數(shù)公式如下:

        模型使用RMSProp作為優(yōu)化器,二值交叉熵損失作為損失函數(shù),表2總結(jié)了該模型每個層的輸出形狀、過濾器尺寸和步長。圖4展示了該模型的結(jié)構(gòu)。經(jīng)過多次訓練確定3個模型的學習率都是0.0001,批大?。╞atch size)都是300。

        表2 Deep-CNN模型各層的輸出形狀、過濾器尺寸和步長

        4 結(jié)果與分析

        4.1 模型準確性評估

        漢明損失(HL)、one-error(OE)和準確率常被用于多標簽分類模型的評估。

        HL用于考察單個標簽被誤分類的情況,公式為:

        其中,N——樣本的數(shù)量;

        Yi′——第i個樣本的預測標簽;

        Yi——第i個樣本的真實標簽;

        M——每個樣本標簽數(shù)量。

        OE用于記錄樣本的預測標簽集中概率最大的標簽不在真實標簽中的情況,其公式為:

        其中,f——模型的映射;

        xi——第i個樣本;

        y——樣本的一個標簽;

        Y——標簽集;

        Yi——第i個樣本的真實標簽集。

        準確率是樣本所有標簽都被正確分類的概率,它是最嚴格的評估標準。

        使用測試集對模型進行評估,140個光譜全部被正確分類,準確率為100%,HL和OE為0,表明模型具備良好的性能。減少訓練集和驗證集大小到140條光譜,對模型進行訓練,準確率依然保持在100%,這說明該模型對數(shù)據(jù)的依賴性小。在數(shù)據(jù)難以采集的場景下,本文提出的Deep-CNN模型是一種具備優(yōu)勢的分類方法。

        4.2 模型魯棒性評估

        4.2.1 抗噪聲能力評估

        相比于實驗室級別的拉曼光譜儀,便攜式拉曼光譜儀具有檢測速度快、方便攜帶等優(yōu)勢,但更容易受到噪聲的干擾,因此模型需要具備較強的抗噪聲能力。向測試集中加入不同大小的高斯白噪聲,得到5個不同信噪比的測試集,信噪比分別為10 dB、20 dB、30 dB、40 dB和50 dB。圖5是添加噪聲后朱砂、雌黃、淡黃混合物的拉曼光譜,分別使用這5個測試集對模型進行測試,HL、OE和準確率見表3。

        表3 加入噪聲后模型的HL、OE和準確率

        實驗結(jié)果表明,Deep-CNN模型可以準確分類信噪比不低于30 dB的光譜。為了直觀觀察10 dB和20 dB 的測試集的分類情況,在圖6中展示了這兩個測試集分類結(jié)果的混淆矩陣,每個矩陣中的數(shù)字代表被分到對應(yīng)類別的光譜的數(shù)量。

        混淆矩陣表明,光譜信噪比為10 dB時,所有的朱砂都可以被正確分類,有40個包含雌黃的拉曼光譜被錯誤分類,60個不包含淡黃的拉曼光譜被錯誤分類;光譜信噪比為20 dB時,所有的朱砂和雌黃都可以被正確分類,60個不包含淡黃的拉曼光譜被錯誤分類。這說明分類器效果由好到壞依次是朱砂、雌黃、淡黃。結(jié)合圖5拉曼光譜分析發(fā)現(xiàn),強噪聲會掩蓋部分強度較弱的特征峰,因此,特征峰更明顯的物質(zhì)分類效果更好。

        4.2.2 未知混合物分類性能評估

        為了進一步評估模型的魯棒性,制作5個新的樣本,樣本成分見表4。由于每個樣本都加入了新的物質(zhì)——蛤白,因此這些樣本對于Deep-CNN模型來說是未知的。

        表4 5個新樣本的成分

        每個樣本采集20個光譜作為測試集,用于對模型測試,HL、OE和準確率分別為0、0和100%,這說明Deep-CNN模型可以準確識別未知的混合物。

        5 結(jié)束語

        本文提出了一種Deep-CNN模型,該模型可以自動、快速、無損地分析彩色礦物顏料的成分,準確率可以達到100%。當訓練集和驗證集的數(shù)量減少到140條光譜時,準確率依然保持在100%,這說明模型可以應(yīng)用于一些不易采集光譜的場景中。

        為了驗證模型的魯棒性,對模型進行了抗噪聲能力的測試和對未知樣本識別能力的測試。試驗結(jié)果表明,該模型在對信噪比不低于30 dB的光譜進行分類時,HL、OE和準確率分別為0、0和100%,而在10 dB和20 dB的情況下,朱砂依然可以被準確分類,20 dB時雌黃也可以被準確分類,這是由于朱砂和雌黃的特征峰更加明顯。使用未知的光譜(加入蛤白)對模型進行測試,準確率也達到了100%。上述結(jié)果表明:該模型具備良好的魯棒性。

        當前使用CNN模型識別礦物顏料拉曼光譜的研究非常少,本文為這個領(lǐng)域的研究提供了有價值的參考。

        猜你喜歡
        分類模型
        一半模型
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        分類討論求坐標
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        久久久精品456亚洲影院| 日韩夜夜高潮夜夜爽无码| 中文字幕日韩精品亚洲精品| 人妻久久一区二区三区| 日本高清视频wwww色| 永久免费不卡在线观看黄网站| 揄拍成人国产精品视频肥熟女| 国产三级精品三级在专区中文 | 伊人久久五月丁香综合中文亚洲 | 手机在线中文字幕国产| 一本色道久久亚洲av红楼| 夜夜爽妓女8888888视频| 天天爽天天爽天天爽| 亚洲免费毛片网| 精品少妇人妻av一区二区蜜桃 | 国产人成亚洲第一网站在线播放| 日本中文字幕人妻精品| 日本少妇又色又爽又高潮| 在线观看免费人成视频| 亚洲AV一二三四区四色婷婷| 中文字幕一区二区在线| 久久精品国产成人午夜福利| 久久精品国产亚洲av大全| 老熟女熟妇嗷嗷叫91| 国产人妻久久精品二区三区老狼| 无码aⅴ精品一区二区三区浪潮| 亚洲av无码久久寂寞少妇| 国产午夜福利不卡在线观看视频| 加勒比东京热综合久久| 人妻少妇满足中文字幕| 欧洲熟妇色xxxxx欧美老妇伦| 无码av免费永久免费永久专区 | 那有一级内射黄片可以免费看 | 亚洲va无码va在线va天堂| 99热免费精品| 色综合久久五十路人妻| 欧美人与善在线com| 国产又黄又爽又色的免费| 亚洲国产麻豆综合一区| 麻豆国产成人av高清在线| 婷婷五月深深久久精品|