亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LIBS的山藥飲片產(chǎn)地溯源研究

        2023-01-31 12:20:26趙志方郭連波陳運中劉思敏張聰子寇衛(wèi)萍胡秀娟黃偉華
        光譜學(xué)與光譜分析 2023年1期
        關(guān)鍵詞:特征提取分類模型

        蔡 羽,趙志方,郭連波,陳運中*,姜 瓊,劉思敏,張聰子, 寇衛(wèi)萍,胡秀娟,鄧 凡,黃偉華

        1.湖北中醫(yī)藥大學(xué)藥學(xué)院,湖北 武漢 430065 2.湖北省中藥保健食品工程技術(shù)研究中心,湖北 武漢 430065 3.北京理工大學(xué)光電學(xué)院,北京 100081 4.咸寧市中心醫(yī)院、湖北科技學(xué)院附屬第一醫(yī)院藥學(xué)部,湖北 咸寧 437100 5.華中科技大學(xué)武漢光電國家研究中心,湖北 武漢 430074 6.華中科技大學(xué)光學(xué)與電子信息學(xué)院,湖北 武漢 430074 7.武漢郵電科學(xué)研究院,湖北 武漢 430074

        引 言

        山藥為薯蕷科植物薯蕷的根莖,其中的多糖、多酚、皂苷、黏蛋白和維生素C等成分使山藥具有抗腫瘤、抗氧化、抗炎癥、降血糖和降血脂等作用[1]。不同產(chǎn)地的山藥由于生長條件存在差異,致使藥用成分含量顯著不同[2-4],結(jié)合獨特的炮制工藝,進而導(dǎo)致市場價格差別大。然而,不同產(chǎn)地的山藥外形相似,難以通過肉眼觀測識別。商家若有意或無意將不同產(chǎn)地的山藥飲片混淆,會導(dǎo)致藥用成分產(chǎn)生差異,致使藥材低效或無效,嚴(yán)重時會與其他藥材發(fā)生反應(yīng)甚至產(chǎn)生毒副作用[5]。常用的藥材產(chǎn)地鑒別技術(shù)主要有色譜技術(shù)[6-7]、電泳方法[8-9]以及同位素質(zhì)譜分析[10]等,但上述方法存在預(yù)處理繁瑣、耗時長、費用昂貴、設(shè)備維護復(fù)雜及無法原位在線分析等問題。因此,尋找一種預(yù)處理簡單、快速、準(zhǔn)確的藥材產(chǎn)地溯源檢測技術(shù)具有重要意義。

        激光誘導(dǎo)擊穿光譜(laser-induced breakdown spectroscopy,LIBS)作為一種新興的基于原子發(fā)射光譜的元素分析技術(shù),憑借樣品前處理簡單、微損甚至無損、在線原位檢測等優(yōu)點,已被廣泛應(yīng)用于地質(zhì)勘探[11-12]、工業(yè)監(jiān)測[13-14]、醫(yī)學(xué)檢測[15]等方面,是一種極具應(yīng)用前景的成分分析技術(shù)。近年來,LIBS在中藥成分檢測領(lǐng)域逐漸興起。2015年,Liu等運用LIBS信號強度變化率結(jié)合移動窗標(biāo)準(zhǔn)差法快速評價朱砂和雄黃混合過程,結(jié)果證明了LIBS在監(jiān)測中藥制藥生產(chǎn)方面的潛力[16]。2017年,Daniel等采用LIBS技術(shù)測定了18種波蘭草藥中鈣、鉀和鎂等其他金屬元素(鈉、銅、鐵、錳、鋅等),并對其中的鈣、鉀和鎂進行定量分析,結(jié)果與ICP-OES一致[17]。2018年,ChanghwanEum等將近紅外光譜與LIBS光譜相結(jié)合來區(qū)分國產(chǎn)和進口黃芪,使用近紅外光譜的SVR系數(shù)與35個LIBS譜峰值進行識別準(zhǔn)確率達(dá)95.8%, 與單獨使用近紅外光譜(91.5%)相比, 準(zhǔn)確率提高了4.3%[18]。

        以上研究證明了LIBS技術(shù)在中藥成分檢測中的可行性[19-21]。然而,基于LIBS技術(shù)的中藥產(chǎn)地溯源研究較少,仍處于起步階段,目前的研究都存在藥材產(chǎn)地數(shù)量少,識別準(zhǔn)確率較低等問題[22-23]。因此,基于LIBS技術(shù)結(jié)合人工智能算法對不同產(chǎn)地的山藥進行系統(tǒng)性研究。

        我們搭建LIBS試驗系統(tǒng)并結(jié)合多元散射矯正-改進遺傳算法-支持向量機(multiplicative signal correction-improved genetic algorithm-support vector machine, MSC-IGA-SVM)模型來識別8種不同產(chǎn)地的山藥飲片。八種產(chǎn)地的山藥飲片磨粉過篩后制成粉末壓片,通過采集山藥飲片的LIBS光譜,分別使用單一分類器與光譜預(yù)處理、特征提取及模式識別算法的模型對光譜的識別結(jié)果進行對比。結(jié)果顯示,LIBS技術(shù)結(jié)合MSC-IGA-SVM模型可以準(zhǔn)確且快速識別山藥產(chǎn)地。

        1 實驗部分

        1.1 儀器及參數(shù)

        所用的LIBS實驗裝置如圖1所示,由Nd∶YAG激光器、光譜儀、探測器等幾部分組成。在數(shù)字延時發(fā)生器(Stanford Research Systems,DG645)的控制下,觸發(fā)信號被輸入到由Q開關(guān)控制的Nd∶YAG激光器(北京鐳寶光電,Nimma-400型,波長:532 nm;脈沖寬度8 ns)中產(chǎn)生激光脈沖,經(jīng)過反射鏡和聚焦鏡后聚焦到樣品表面,與樣品作用產(chǎn)生等離子體。使用采集頭采集等離子體的發(fā)射光信號,將其耦合進光纖并傳輸?shù)搅ǖ拦饫w光譜儀(Avantes,AvaSpec-ULS4096CL-EVO,光譜范圍:196~874 nm,最小門寬:9 μs)。光譜儀分光后的信號由數(shù)字延時發(fā)生器控制的探測器(日本濱松,Complementary metal-oxide-semiconductor,CMOS)進行光電轉(zhuǎn)換,在計算機中生成LIBS光譜。本實驗中,經(jīng)過參數(shù)優(yōu)化激光能量、重復(fù)頻率、延時和門寬分別設(shè)置為35 mJ,10 Hz,1 μs和9 μs。5個脈沖的光譜均值作為一幅光譜,每個樣本采集80幅光譜,共得到1 920幅光譜。

        圖1 LIBS系統(tǒng)實驗裝置示意圖

        1.2 樣品制備

        所用八類不同產(chǎn)地的山藥飲片由湖北中醫(yī)藥大學(xué)鑒定并提供,如表1所示,由于山藥飲片產(chǎn)地、炮制工藝以及價格各不相同,導(dǎo)致它們藥用價值存在差異。實驗中樣本的處理流程如圖2所示。首先,使用研缽將飲片研磨成粉過100目篩。然后,使用電子天平稱量9 g硼酸粉末和1 g樣品粉末,在壓樣機30 t壓力下將待測樣品壓制成直徑為40 mm的圓餅狀壓片。每種產(chǎn)地的山藥飲片使用3個重復(fù)樣本,共制備24個壓片。

        圖2 樣品處理流程圖

        表1 實驗所用藥材飲片

        1.3 算法描述

        多元散射校正(multiplicative signal correction,MSC)、Savitzky-Golay(SG)卷積平滑法和小波變換(wavelet transform,WT)是常用的光譜數(shù)據(jù)預(yù)處理方法。MSC校正譜線漂移和基線平移,能使同類光譜數(shù)據(jù)向平均光譜靠攏,提高數(shù)據(jù)的穩(wěn)定性。SG卷積平滑[24]和WT這兩種預(yù)處理方法注重于去除光譜噪聲,使譜線更加平滑。

        主成分分析(principal component analysis,PCA)和遺傳算法(genetic algorithm,GA)是常用的特征提取算法。PCA特征提取主要是在線性相關(guān)假設(shè)下,消除變量之間可能存在的多重共線性。GA是在模擬自然進化的過程中逐步淘汰對選擇過程影響較小的特征,其使用概率機制迭代,所選個體隨機,容易陷入局部最優(yōu)解的狀況[25]。將GA改進為IGA(improved genetic algorithm,IGA)。IGA是記錄在300個GA迭代過程最優(yōu)個體的特征,并選擇累積次數(shù)超過150次的特征作為最終的特征,其能夠有效解決局部最優(yōu)解的問題。

        本文使用幾種常用的模式識別算法,包括有K最近鄰(K-nearest neighbor,KNN)、支持向量機(support vector machine,SVM)和集成學(xué)習(xí)算法(ensemble machine learning,EML)。KNN使用目標(biāo)最鄰近的K個樣本標(biāo)簽值來表示目標(biāo)的標(biāo)簽[26]。SVM目的是尋找一個最大化間隔的超平面,使得兩類數(shù)據(jù)被超平面分開,同時兩類中最接近超平面的點到超平面的距離最大[27]。EML的原理是將多個弱分類器相結(jié)合進行分類識別[28]。

        將光譜信號按2∶1的比例劃分為訓(xùn)練集和測試集,使用5次交叉驗證KNN模型的測試集準(zhǔn)確率作為預(yù)處理參數(shù)優(yōu)化的評價指標(biāo)。

        2 結(jié)果與討論

        2.1 光譜分析

        各類藥材飲片(S1—S8)的平均光譜及典型峰值如圖3所示。各類藥材的平均光譜整體趨勢一致,所含譜峰基本相同,但峰強度各不相同,分析認(rèn)為不同產(chǎn)地的山藥富集能力存在差異,道地山藥對一些金屬元素的富集能力大于非道地產(chǎn)區(qū)山藥。圖中,譜峰代表的金屬元素有K,Na,Ca,Mg,Al等,非金屬元素有C,H,O及C—N鍵等。其中,K元素特征譜線(769.90 nm)的峰值最強,即山藥飲片中K元素含量最多,相關(guān)研究表明山藥根莖對K元素的富集能力最強[29]。

        為剔除光譜中大量的冗余信息,觀察圖3并選擇峰值較為明顯的35條特征譜線作為特征提取的預(yù)選譜線,如表2所示。

        圖3 藥材飲片的平均光譜

        表2 所選特征譜線

        2.2 單一分類器產(chǎn)地溯源

        對八種產(chǎn)地山藥飲片24565維的原始光譜進行產(chǎn)地溯源,使用SVM,KNN和EML三種模式識別方法的分類結(jié)果如圖4所示。圖中顯示,三種模型的交叉驗證集和測試集準(zhǔn)確率均在90%以上,SVM模型的分類效果最好,交叉驗證集準(zhǔn)確率為93.50%,測試集準(zhǔn)確率為96.43%。由于山藥飲片產(chǎn)地種類多、光譜維度高,原始信號數(shù)據(jù)量大且包含噪聲和冗余特征,致使分類耗時長且分類準(zhǔn)確率低,因此有必要對原始光譜進行數(shù)據(jù)預(yù)處理和特征提取。

        圖4 原信號產(chǎn)地溯源結(jié)果

        2.3 模型改進

        首先,使用三種預(yù)處理方法對八種產(chǎn)地山藥飲片的原始光譜進行處理。在SG卷積平滑法中,選用5,7,9和11的窗口寬度進行參數(shù)優(yōu)化,通過比較識別準(zhǔn)確率,確定本研究中所用窗口寬度為5。在WT預(yù)處理過程中,小波函數(shù)采用常用的db2,db4,db8,sym2,sym5和sym8,分解層數(shù)采用1~9層,最終確定選用db2函數(shù)2層小波分解為WT的最優(yōu)參數(shù)。經(jīng)過預(yù)處理后,各類光譜的CV均值和標(biāo)準(zhǔn)差如圖5所示。圖5顯示,無預(yù)處理時光譜的波動性最大,各類光譜的CV均值為12.54%,經(jīng)過三種預(yù)處理后CV均值明顯下降,光譜的穩(wěn)定性明顯提升。MSC和WT的CV均值較為接近且小于SG卷積平滑法的CV均值,表明MSC和WT對光譜穩(wěn)定性的提升效果好于SG卷積平滑法。WT的CV均值小于MSC,但WT各類光譜CV的標(biāo)準(zhǔn)差較大,即各類光譜的波動差距較大,而MSC各類光譜的波動差距較小,MSC在減小光譜波動性方面整體表現(xiàn)較好。

        圖5 各產(chǎn)地山藥光譜CV均值和標(biāo)準(zhǔn)差

        對預(yù)處理后的光譜數(shù)據(jù)進行特征提取。按表2選出35條特征譜線后,分別使用PCA和IGA進行特征提取。不同光譜預(yù)處理下PCA選擇的主成分?jǐn)?shù)量與累積貢獻(xiàn)率的關(guān)系如圖6所示。當(dāng)累積貢獻(xiàn)率達(dá)到99%以上時,MSC、SG卷積平滑、WT三種預(yù)處理方式下各選擇6,5和5個主成分,其累積貢獻(xiàn)率分別為99.23%(黑線)、99.03%(紅線)、99.07%(藍(lán)線)。針對不同預(yù)處理和模式識別方法處理的光譜,使用IGA提取的特征數(shù)量如表3所示。

        表3 在各方法下IGA提取的特征數(shù)量

        圖6 成分累積貢獻(xiàn)

        使用SVM,KNN及EML三種模式識別方法對預(yù)處理和特征提取后的信號進行分類,各模型分類結(jié)果排序后如表4所示。

        表4 各模型分類結(jié)果排序

        表4顯示,排名前十的模型中接近一半的模型使用了MSC預(yù)處理方法,接近一半的模型使用了SVM模式識別方法。結(jié)果表明,MSC預(yù)處理方法和SVM模式識別方法有助于準(zhǔn)確識別山藥飲片產(chǎn)地。測試集準(zhǔn)確率排名前五的模型均使用了IGA進行特征提取,在識別種類多、識別難度大的情況下,IGA比PCA更能清楚辨別光譜中的非線性關(guān)系,同時受噪聲的影響更小。MSC-IGA-SVM模型的產(chǎn)地溯源效果最好。MSC-IGA-SVM模型的交叉驗證集準(zhǔn)確率為96.9%,測試集的準(zhǔn)確率為97.32%,與直接使用原信號建立的最好模型SVM(96.43%)相比,測試集準(zhǔn)確率提高了0.87%。同時,MSC-IGA-SVM模型將輸入變量的維度減少了99.93%。

        MSC-IGA-SVM模型對八種山藥飲片產(chǎn)地溯源的混淆矩陣如圖7所示,除了S4和S7有錯誤分類現(xiàn)象外,其他類別均能正確識別。S1和S2雖然產(chǎn)地相同,但兩批山藥飲片炮制工藝不同,價格相差較遠(yuǎn),因此品質(zhì)存在差異,能進行精確分類。而對于S4和S7,兩種產(chǎn)地山藥產(chǎn)地雖然不同,但存在錯分現(xiàn)象。10.7%的S4錯分為S7,同時10.7%的S7錯分為S10。

        圖7 MSC-IGA-SVM模型分類結(jié)果的混淆矩陣

        為進一步探究錯誤分類原因,對IGA選取的特征進行三維成像,如圖8所示,S4與S7存在重疊區(qū)域,其數(shù)據(jù)存在相似性。S4為廣西南寧無硫高溫烘焙的價值為31元/500 g的山藥飲片,S7為安徽池州無硫低溫烘焙的價值為18.5元/500 g的山藥飲片。兩者產(chǎn)地相差較遠(yuǎn),且炮制工藝不同,難以辨別的原因推測是山藥種植品種、種植條件等方面存在共性。

        圖8 MSC-IGA數(shù)據(jù)圖

        3 結(jié) 論

        針對山藥飲片的產(chǎn)地溯源問題,使用LIBS技術(shù)結(jié)合MSC-IGA-SVM模型對產(chǎn)地識別的準(zhǔn)確度進行了改善。使用KNN、SVM和EML分類器對八類光譜直接使用原信號進行分類,SVM模型具有較強魯棒性,效果最好,其準(zhǔn)確率為96.43%。使用預(yù)處理(MSC、SG卷積平滑、WT)、特征提取(PCA和IGA)的方法對模型改進,MSC-IGA-SVM模型的識別效果最好,其能有效降低光譜波動性,同時輸入變量維度降低了99.93%,將測試集準(zhǔn)確率提升為97.30%。結(jié)果表明,LIBS技術(shù)結(jié)合MSC-IGA-SVM模型能夠準(zhǔn)確且快速對山藥飲片進行產(chǎn)地溯源。

        猜你喜歡
        特征提取分類模型
        一半模型
        分類算一算
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
        電子制作(2019年15期)2019-08-27 01:12:00
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        一種基于LBP 特征提取和稀疏表示的肝病識別算法
        3D打印中的模型分割與打包
        av无码免费永久在线观看| 亚洲一区二区三区国产| 亚洲自偷自拍另类第1页| 玩弄放荡人妻少妇系列| 国产成人亚洲综合无码精品| 国产黄色一区二区福利| 产美女被爽到高潮免费a| 国内精品毛片av在线播放| 一本色道久在线综合色| 国产午夜手机精彩视频| 激情久久av一区av二区av三区| 国产第一草草影院| 亚洲色偷拍一区二区三区| 日韩伦理av一区二区三区| 国产欧美精品aaaaaa片| 国产午夜伦鲁鲁| 婷婷综合久久中文字幕蜜桃三电影 | 国产av天堂一区二区二区| 无码一区二区三区中文字幕| 精品国产一区二区三区免费| 人妻无码一区二区在线影院| 操老熟妇老女人一区二区| 成人影院在线观看视频免费| 无遮挡呻吟娇喘视频免费播放| av在线色| 18禁成人免费av大片一区| 久久久久99精品成人片欧美| 伊人久久五月丁香综合中文亚洲| AV无码免费不卡在线观看| 亚洲视频在线中文字幕乱码| 少妇人妻综合久久中文字幕| 久久精品国产www456c0m| 国产大片中文字幕| 国产精品国产三级国产剧情| 婷婷色婷婷开心五月四房播播| 精品一级毛片| 长腿丝袜在线观看国产| 中国女人内谢69xxxxxa片| 亚洲欧美精品伊人久久| 亚洲AV无码久久精品国产老人| 日本高清一区二区在线播放|