亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LLE-RF的中藥三維熒光光譜分類識(shí)別

        2020-04-11 04:34:04樊鳳杰軒鳳來(lái)紀(jì)會(huì)芳
        計(jì)量學(xué)報(bào) 2020年2期
        關(guān)鍵詞:特征提取光譜熒光

        樊鳳杰, 軒鳳來(lái), 白 洋, 紀(jì)會(huì)芳

        (1.燕山大學(xué) 電氣工程學(xué)院,河北 秦皇島 066004;2.解放軍第二六一醫(yī)院,北京 100094)

        1 引 言

        中藥指紋圖譜技術(shù)是中藥鑒定與中藥質(zhì)量控制的關(guān)鍵技術(shù)[1],三維熒光光譜由于靈敏、快速等優(yōu)點(diǎn)正逐漸成為中藥指紋圖譜研究的有力工具,因此,對(duì)中藥三維熒光譜信號(hào)進(jìn)行特征提取是中藥光譜分類識(shí)別的關(guān)鍵。

        目前,常用的三維熒光光譜特征提取方法有參量化方法以及主成分分析(principal components analysis,PCA)等方法[2]。胡澤建等[3]于1998年提出了參量化方法,通過(guò)提取三維熒光光譜的平均值、標(biāo)準(zhǔn)差、z值的累積率分布、原點(diǎn)矩、中心矩、重心等特征參量作為光譜特征,該方法雖然有明確的幾何特征意義,但只是將提取的特征簡(jiǎn)單的組合。PCA算法是在不丟失主要信息的基礎(chǔ)上進(jìn)行數(shù)據(jù)降維,用維數(shù)較少的新變量代替原來(lái)維數(shù)較多的變量[4]。

        局部線性嵌入(locally linear embedding,LLE)作為一種非線性的流形學(xué)習(xí)算法,通過(guò)尋找高維數(shù)據(jù)中所隱藏的低維流形結(jié)構(gòu)進(jìn)行特征提取,該算法復(fù)雜度低,便于實(shí)現(xiàn)[5]。

        本文提出了LLE-RF組合算法,采用LLE算法對(duì)補(bǔ)虛類中藥三維熒光光譜數(shù)據(jù)進(jìn)行特征提取,并將LLE算法提取的特征向量輸入隨機(jī)森林(random forest,RF)分類器進(jìn)行分類識(shí)別。

        2 數(shù)據(jù)預(yù)處理

        2.1 樣品配制

        分別配制24味補(bǔ)虛類中藥(表1所示)5個(gè)不同濃度的溶液制劑。

        表1 24味補(bǔ)虛類中藥Tab.1 24 tonifying herbs

        具體配制過(guò)程如下:首先稱取24味補(bǔ)虛類中藥各1 g,分別放入250 mL燒杯中,加入100 mL蒸餾水浸泡30 min,用武火煮沸,再用文火熬煮35 min,冷卻至室溫,過(guò)濾至100 mL容量瓶,加蒸餾水稀釋,得到每味中藥的10 mg/mL溶液制劑;再用膠頭滴管從10 mg/mL的溶液制劑中提取 8 mL 溶液至25 mL量筒中,加蒸餾水至10 mL,即得到濃度為8 mg/mL的溶液制劑。按上述方法依次配制6 mg/mL、4 mg/mL、2 mg/mL的溶液制劑,進(jìn)而得到24味中藥5個(gè)不同濃度的溶液制劑。

        2.2 實(shí)驗(yàn)過(guò)程

        使用英國(guó)Edinburgh Instruments公司生產(chǎn)的FS920號(hào)穩(wěn)態(tài)熒光光譜儀,分別測(cè)量不同濃度的補(bǔ)虛類中藥溶液的熒光光譜。為保證光源的使用壽命,測(cè)量時(shí)需將儀器冷卻降溫至-19 ℃后再進(jìn)行測(cè)量。測(cè)量前需設(shè)置熒光光譜儀的測(cè)量參數(shù),設(shè)置積分時(shí)間0.1 s,激發(fā)波長(zhǎng)EX掃描范圍為220~550 nm,發(fā)射波長(zhǎng)EM掃描范圍為240~570 nm。為盡量避免瑞利散射的干擾,設(shè)置發(fā)射掃描波長(zhǎng)起點(diǎn)始終滯后激發(fā)波長(zhǎng)20 nm,激發(fā)與發(fā)射步長(zhǎng)均為10 nm。

        2.3 光譜去噪

        每一濃度下中藥三維熒光光譜數(shù)據(jù)均采用總體平均經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)[6]算法降噪,以6 mg/mL的人參溶液為例,測(cè)量得到如圖1、圖2所示的人參溶液三維熒光光譜圖以及等高線圖。等高線圖是三維熒光光譜圖在激發(fā)波長(zhǎng)與發(fā)射波長(zhǎng)所在平面的投影。

        圖1 人參溶液三維熒光光譜圖Fig.1 Three dimensional fluorescence spectrum of ginseng solution

        圖2 人參溶液等高線圖Fig.2 Contour map of ginseng solution

        由圖1、圖2可以看出,在激發(fā)波長(zhǎng)270~370 nm、發(fā)射波長(zhǎng)240~440 nm范圍內(nèi)存在主熒光峰與次熒光峰,在激發(fā)波長(zhǎng)220~320 nm、發(fā)射波長(zhǎng)440~540 nm范圍內(nèi)存在噪聲。利用EEMD對(duì)熒光光譜數(shù)據(jù)降噪,降噪后的三維熒光光譜圖及等高線圖如圖3、圖4所示。由圖3、圖4可以看到在激發(fā)波長(zhǎng)220~320 nm、發(fā)射波長(zhǎng)440~540 nm范圍內(nèi)的噪聲已經(jīng)消除。經(jīng)EEMD降噪后的數(shù)據(jù)格式為34×34,將每個(gè)樣本矩陣首尾相接,構(gòu)成1×1 156形式,并將120個(gè)不同濃度的樣本數(shù)據(jù)整理成 120×1 156矩陣形式。

        圖3 降噪后的人參溶液三維熒光光譜圖Fig.3 Three dimensional fluorescence spectra of ginseng solution after denoising

        3 特征提取與分類識(shí)別

        3.1 特征提取

        3.1.1 LLE算法

        LLE是用局部的線性逼近整體的非線性,能夠使降維后的數(shù)據(jù)保持原有的拓?fù)浣Y(jié)構(gòu),具有平移、旋轉(zhuǎn)和伸縮不變性,并且有整體最優(yōu)解,不需要迭代,避免了局部極值問(wèn)題[7~9]。

        設(shè)中藥三維熒光光譜信號(hào)為X,其中,X=[x1,x2,…,xn],xi∈Rm,i=1,2,…,n;m為信號(hào)維數(shù),Rm為m維空間的樣本數(shù)據(jù);映射到低維空間的信號(hào)Y=[y1,y2,…,yn],yi∈Rd,d為光譜信號(hào)降維后的維數(shù),Rd為映射到d維空間的樣本數(shù)據(jù)。

        LLE算法主要步驟如下:

        (1) 采用k近鄰法尋找每個(gè)濃度下中藥光譜的k個(gè)近鄰點(diǎn);

        (2) 依據(jù)近鄰點(diǎn)計(jì)算出該樣本點(diǎn)的局部重建權(quán)值矩陣,要求誤差函數(shù)最小,即:

        (1)

        圖4 降噪后的人參溶液等高線圖Fig.4 Contour map of ginseng solution after denoising

        (3) 由該中藥光譜的局部重建權(quán)值矩陣和其近鄰點(diǎn)計(jì)算出該樣本點(diǎn)的輸出值,即d維嵌入值,并且映射條件應(yīng)該滿足:損失函數(shù)最小,即

        (2)

        為了保證上式有唯一解,低維嵌入應(yīng)該滿足

        (3)

        3.1.2 LLE算法提取特征數(shù)據(jù)

        采用RF對(duì)LLE算法不同嵌入結(jié)果進(jìn)行分類識(shí)別,確定合理的近鄰點(diǎn)數(shù)以及本征維數(shù)。同時(shí),為了驗(yàn)證LLE的有效性,將其與PCA進(jìn)行比較。為解決原始數(shù)據(jù)維數(shù)問(wèn)題,選擇累積貢獻(xiàn)率為95%的前8個(gè)特征量PC1、PC2、PC8代表原始樣本的光譜特征,即每個(gè)中藥光譜樣本選擇8個(gè)特征量代替原來(lái)高維空間的樣本數(shù)據(jù)。當(dāng)LLE中k=8,d=8時(shí),LLE及PCA得到的部分特征數(shù)據(jù)分別如表2、表3所示。

        3.2 分類識(shí)別

        RF算法是一種集成學(xué)習(xí)算法,將多個(gè)決策樹組合在一起達(dá)到分類識(shí)別的目的[10,11]。

        建立RF算法的步驟如下[12,13]:

        (1) 通過(guò)Bootstrap法按不同的比例從原始數(shù)據(jù)中有放回地抽取X個(gè)訓(xùn)練樣本建立X棵決策樹,剩余的樣本數(shù)據(jù)形成OOB數(shù)據(jù),構(gòu)成測(cè)試樣本;

        (2) 在生成每棵樹的過(guò)程中,通常需要在每個(gè)節(jié)點(diǎn)處從所有的特征變量中隨機(jī)抽取N個(gè)變量,然后選擇出最具有分類能力的變量對(duì)樣本分類;

        (3) 每棵樹都完全生長(zhǎng),不進(jìn)行剪枝;

        (4) 根據(jù)生成的多個(gè)樹分類器對(duì)新的數(shù)據(jù)進(jìn)行分類,分類結(jié)果按照每個(gè)樹分類器的投票多少而定。

        表2 LLE提取的特征數(shù)據(jù)Tab.2 Features data extracted from LLE

        表3 PCA提取的特征數(shù)據(jù)Tab.3 Features data extracted from PCA

        3.3 實(shí)驗(yàn)結(jié)果和分析

        采用LLE及PCA對(duì)降噪后的中藥三維熒光光譜數(shù)據(jù)進(jìn)行特征提取,然后分別構(gòu)建LLE-RF、PCA-RF組合算法分類模型,即將LLE、PCA提取的特征向量輸入到RF分類器中進(jìn)行分類識(shí)別。由于訓(xùn)練樣本和測(cè)試樣本比例不同時(shí),RF分類器有不同的分類效果,因此,設(shè)置訓(xùn)練樣本和測(cè)試樣本的比例分別為3:2、7:3、4:1、21:4時(shí),觀察分類識(shí)別的正確率,記訓(xùn)練集的比重r分別為0.6、0.7、0.8、0.84時(shí)從原始數(shù)據(jù)中有放回地抽取訓(xùn)練樣本,建立相應(yīng)的決策樹,剩下的樣本作為測(cè)試樣本。

        當(dāng)采用LLE算法時(shí),為了得到較好的嵌入結(jié)果,即尋找合理的k和d,當(dāng)固定d取6時(shí),k依次取2、3、4、5、6、7、8、9、10、11、12,分析RF分類正確率變化情況。按照同樣的方法,分別固定d取7、8、9、10,k依次取2、3、4、5、6、7、8、9、10、11、12時(shí),分析隨RF分類正確率變化情況。圖5為當(dāng)比例r=0.6、0.7、0.8、0.84時(shí),LLE-RF分類正確率變化情況。

        由圖5可看出,RF的分類效果與r、k以及d有關(guān)。k值越大,LLE得到的嵌入結(jié)果所代表的信息越豐富,同時(shí)要求本征維數(shù)d也要相應(yīng)增大,因此,圖5中的4個(gè)圖都呈現(xiàn)波動(dòng)性增長(zhǎng)。由圖5(d)可以看出,當(dāng)r=0.84、k=8,d=8時(shí),LLE-RF可以得到較好的分類效果,達(dá)到95%。

        因此,本文選擇LLE算法中k=8,d=8,RF中r為0.84時(shí)構(gòu)建LLE-RF組合算法分類模型。為了驗(yàn)證LLE的有效性,將其與主成分分析進(jìn)行比較,構(gòu)建PCA-RF組合算法分類模型。

        分類模型中均標(biāo)記補(bǔ)氣類為第1類,補(bǔ)陽(yáng)類為第2類,補(bǔ)陰類為第3類,補(bǔ)血類為第4類,利用分類準(zhǔn)確率與運(yùn)行時(shí)間評(píng)價(jià)分類性能,分類效果如表4所示,兩種算法分類模型預(yù)測(cè)結(jié)果如圖6與圖7所示。

        圖5 r不同時(shí)LLE-RF分類正確率變化情況Fig.5 The change ofLLE-RF classification accuracy rate with different r

        由表4可以看出,LLE-RF與PCA-RF模型分類精度不同。LLE-RF模型的分類準(zhǔn)確率達(dá)到95%,PCA-RF模型的分類準(zhǔn)確率為90%。此外,LLE-RF模型運(yùn)行時(shí)間較PCA-RF短。

        表4 不同分類模型識(shí)別效果Tab.4 Recognition effect of different classification models

        圖6 LLE-RF模型預(yù)測(cè)結(jié)果Fig.6 LLE-RF model prediction results

        圖7 PCA-RF模型預(yù)測(cè)結(jié)果Fig.7 PCA-RF model prediction results

        由圖6可以看出,LLE-RF模型中有一個(gè)樣本被錯(cuò)誤識(shí)別,實(shí)際類別為第3類,但被錯(cuò)誤識(shí)別為第4類。

        由圖7可以看出,PCA-RF模型中有2個(gè)樣本被錯(cuò)誤識(shí)別,實(shí)際類別為第2類和第4類,但被錯(cuò)誤識(shí)別為第1類和第3類。由于采用LLE提取特征時(shí),通過(guò)局部的線性逼近整體的非線性,使降維后的特征數(shù)據(jù)仍然保持原有數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu),而PCA提取特征時(shí),是從線性的角度提取了互不相關(guān)的特征來(lái)代表原始數(shù)據(jù),因此,當(dāng)提取中藥三維熒光光譜特征時(shí),對(duì)于RF分類器,采用LLE比PCA分類準(zhǔn)確率高。

        4 結(jié) 論

        針對(duì)中藥三維熒光光譜數(shù)據(jù)特征提取問(wèn)題,本文在采用LLE算法提取補(bǔ)虛類中藥三維熒光光譜的非線性特征基礎(chǔ)上,構(gòu)建了LLE-RF組合算法分類模型。實(shí)驗(yàn)結(jié)果表明:LLE特征提取算法在選擇合理的近鄰點(diǎn)數(shù)和本征維數(shù)基礎(chǔ)上,可以得到較好的嵌入結(jié)果。在RF分類器中,通過(guò)選擇合理的訓(xùn)練集與測(cè)試集比例,LLE-RF組合算法分類準(zhǔn)確率優(yōu)于PCA-RF算法。因此,采用LLE算法可以發(fā)現(xiàn)中藥三維熒光光譜數(shù)據(jù)中的非線性結(jié)構(gòu)。在后續(xù)的研究中,將對(duì)LLE算法進(jìn)一步優(yōu)化,更好地提取中藥三維熒光光譜特征,提高分類精度。

        猜你喜歡
        特征提取光譜熒光
        基于三維Saab變換的高光譜圖像壓縮方法
        干式熒光發(fā)光法在HBV感染診療中應(yīng)用價(jià)值
        基于Daubechies(dbN)的飛行器音頻特征提取
        電子制作(2018年19期)2018-11-14 02:37:08
        高熒光量子產(chǎn)率BODIPY衍生物的熒光性能研究
        Bagging RCSP腦電特征提取算法
        星載近紅外高光譜CO2遙感進(jìn)展
        基于MED和循環(huán)域解調(diào)的多故障特征提取
        苦味酸與牛血清蛋白相互作用的光譜研究
        鋱(Ⅲ)與PvdA作用的光譜研究
        熒光增白劑及其安全性和環(huán)保性
        中文字幕无线精品亚洲乱码一区 | 两个人看的www免费视频中文| 欧美两根一起进3p做受视频| 女高中生自慰污免费网站| 国产不卡一区二区av| 日韩极品在线观看视频| 亚洲av成人综合网成人| 免费a级毛片18以上观看精品| 97久久天天综合色天天综合色hd| 妞干网中文字幕| 中文天堂一区二区三区| 亚洲天堂一区二区偷拍| 成人免费看aa片| 亚洲av成人无码网站大全| 精品亚洲午夜久久久久| 亚洲精品精品日本日本| 国产午夜精品视频在线观看| 人人妻人人添人人爽欧美一区| 99精品国产一区二区| 人伦片无码中文字幕| 日本红怡院东京热加勒比| 蜜桃视频在线免费视频| 精品国品一二三产品区别在线观看 | 在线视频国产91自拍| 亚洲中文字幕成人无码| 草草网站影院白丝内射| 亚洲中文字幕无线乱码va| 日本免费久久高清视频| 国产精品亚洲色婷婷99久久精品| 香蕉久久福利院| 91精品国产综合久久青草| 亚洲中字永久一区二区三区| 国产一品二品三品精品在线| 亚瑟国产精品久久| 亚洲AV一二三四区四色婷婷| 亚洲视频在线视频在线视频| 男人的天堂手机版av| 中文无码一区二区不卡av| 一级呦女专区毛片| 一本色道久久88综合亚洲精品| 最新国产熟女资源自拍|