亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于DCGAN的拉曼光譜樣本擴(kuò)充及應(yīng)用研究

        2021-02-03 08:02:54李靈巧李彥暉殷琳琳楊輝華馮艷春尹利輝胡昌勤
        光譜學(xué)與光譜分析 2021年2期
        關(guān)鍵詞:曼光譜光譜卷積

        李靈巧,李彥暉,殷琳琳,楊輝華*,馮艷春,尹利輝,胡昌勤

        1.北京郵電大學(xué)人工智能學(xué)院,北京 100876 2.桂林電子科技大學(xué)計(jì)算機(jī)與信息安全學(xué)院,廣西 桂林 541004 3.中國食品藥品檢定研究院,北京 100050 4.北京師范大學(xué)環(huán)境學(xué)院,北京 100875

        引 言

        食品藥品的安全一直是人們重點(diǎn)關(guān)注的對象,常用的食品藥品檢測手段有吸收系數(shù)法、化學(xué)法和HPLC法等,不僅繁瑣,而且局限于實(shí)驗(yàn)室。因此需要一種可以快速檢測的手段,近年來發(fā)展較好的是近紅外光譜檢測和拉曼光譜檢測。拉曼檢測技術(shù)是基于拉曼光譜特征位移峰而產(chǎn)生的一種檢測技術(shù)。當(dāng)光照射到物體分子上時(shí)會發(fā)生彈性散射,額外會有少量光子發(fā)生非彈性散射,這些光子就是拉曼光子,拉曼光子轉(zhuǎn)移能量到分子上,產(chǎn)生位移散射光,位移的距離對應(yīng)分子的信息。不同的距離長短對應(yīng)了不同的分子結(jié)構(gòu),由此產(chǎn)生拉曼譜圖。根據(jù)譜圖就可以明確樣品化學(xué)與分子信息和含量[1]。相比紅外光譜法,拉曼光譜提供的是無損定性定量分析,對樣品無特殊要求,短時(shí)簡便高靈敏度,避免了因?yàn)闃悠返钠茐幕蛘邩悠纷陨淼娜毕輰?dǎo)致的誤差[2]。

        由于儀器和方法的改進(jìn)升級,使用拉曼分析對食品藥品進(jìn)行鑒別和分類得到了廣泛應(yīng)用。目前主流的分類算法線性學(xué)習(xí)機(jī)(linear learning machine,LLM)、軟獨(dú)立建模分類法[3](soft independent modeling of class analogy,SIMCA)、人工神經(jīng)網(wǎng)絡(luò)[4](artificial neural network,ANN)、K-最近鄰[5](K-nearest neighbor method,KNN)等。最近兩年,我們將淺層機(jī)器學(xué)習(xí)方法應(yīng)用于近紅外光譜藥品分類[6],并取得了較好的分類結(jié)果。這些方法各有優(yōu)點(diǎn)但較為傳統(tǒng),目前深度學(xué)習(xí)方法在圖像分割[7]、圖像增強(qiáng)[8]和圖像檢測[9]等方面大放異彩,將深度學(xué)習(xí)應(yīng)用到光譜學(xué)是必然趨勢。現(xiàn)有拉曼光譜采集需要較高的人力和時(shí)間成本,采集到的數(shù)據(jù)樣本量較少和存在干擾因素,不能滿足深度學(xué)習(xí)需要用大樣本進(jìn)行訓(xùn)練的條件,因此將深度學(xué)習(xí)應(yīng)用在拉曼光譜中的研究較少。

        鑒于此,本文提出一種將深度學(xué)習(xí)應(yīng)用到拉曼光譜的方法:使用深度卷積生成對抗網(wǎng)絡(luò)[10](deep convolutional generative adversarial networks,DCGAN)生成新光譜,并輸入CNN進(jìn)行分類。目前GAN在光譜分析中應(yīng)用不多,僅見應(yīng)用于高光譜分析,而在拉曼和近紅外光譜分析方面未見報(bào)道。

        在搭建深度學(xué)習(xí)模型的過程中,常遇到因訓(xùn)練數(shù)據(jù)集樣本量不夠?qū)е虑窋M合的問題。解決該問題除了在算法層面的優(yōu)化,還需拓展訓(xùn)練集樣本數(shù)量。常用的數(shù)據(jù)增強(qiáng)方法有形狀變換、監(jiān)督式摳取、GAN等。本文采取的DCGAN則是在原始GAN的基礎(chǔ)上引入卷積,借助卷積層的特征提取能力,提取拉曼光譜的深層特征,生成高度相似的光譜。

        采用DCGAN擴(kuò)充拉曼光譜,擴(kuò)充訓(xùn)練集樣本量并提升CNN分類精度。設(shè)置數(shù)據(jù)增強(qiáng)擴(kuò)充光譜并輸入CNN進(jìn)行分類,與DCGAN的結(jié)果進(jìn)行對比。實(shí)驗(yàn)結(jié)果表明:DCGAN生成的光譜能夠被CNN識別并進(jìn)行分類,增加的數(shù)據(jù)集樣本量提升了CNN的分類精度。其次,DCGAN可以實(shí)現(xiàn)使用少量原始拉曼光譜對抗生成新光譜,達(dá)到擴(kuò)充數(shù)據(jù)集的樣本量目的,有效減少人力和時(shí)間成本。

        1 算法描述

        1.1 CNN(卷積神經(jīng)網(wǎng)絡(luò))

        1.1.1 算法介紹

        CNN通常包含卷積層、池化層、全連接層,先正向傳播得到輸入數(shù)據(jù)特征,然后反向傳播使用梯度下降進(jìn)行迭代,完成權(quán)值更新。

        卷積層通過卷積運(yùn)算提取輸入數(shù)據(jù)特征,卷積公式如式(1)

        (1)

        池化層對卷積層提取得到的特征進(jìn)行進(jìn)一步降維,加快運(yùn)算速率。池化層的公式如式(2)

        (2)

        1.1.2 改進(jìn)的CNN

        卷積神經(jīng)網(wǎng)絡(luò)主要用于圖像分類,輸入一般為n×n維的圖像,對應(yīng)卷積核及池化操作均是n×n的矩陣,并不適用于光譜,需要針對光譜對網(wǎng)絡(luò)進(jìn)行修改。這里修改卷積核尺寸為1×5。光譜譜線中最重要的是每個(gè)波長點(diǎn)的峰強(qiáng)信息,然而CNN里的池化操作會使得光譜信息大量丟失并不利于分析,所以這里舍棄池化層。同時(shí)為了減小運(yùn)算量,將網(wǎng)絡(luò)輸出層和中間層修改為單層感知器。經(jīng)過改進(jìn)后設(shè)計(jì)為一個(gè)5層的CNN網(wǎng)絡(luò),具體網(wǎng)絡(luò)結(jié)構(gòu)如表1。

        表1 CNN網(wǎng)絡(luò)各層設(shè)計(jì)Table 1 CNN network design

        1.2 DCGAN(深度卷積生成式對抗網(wǎng)絡(luò))

        1.2.1 算法介紹

        DCGAN的網(wǎng)絡(luò)結(jié)構(gòu)如圖1:圖中左邊是G(Generator)網(wǎng)絡(luò),右邊是D(Discriminator)網(wǎng)絡(luò)。

        圖1 用于拉曼光譜分類的DCGAN網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.1 Diagram of DCGAN network structure for Raman spectrum classification

        G是生成網(wǎng)絡(luò),給它輸入一個(gè)隨機(jī)噪聲z,最終能生成一張圖片,標(biāo)記為G(z)。

        D是判別網(wǎng)絡(luò),用來判別某張圖片真實(shí)的程度。給它輸入一張圖片x,會輸出D(x),代表x是真實(shí)圖片的概率,若概率數(shù)值是1就說明圖片完全真實(shí)。若概率數(shù)值為0就說明圖片作假。

        DCGAN引入卷積計(jì)算圖像整體區(qū)域特征信息,從而具有很強(qiáng)特征提取能力。由于卷積網(wǎng)絡(luò)中池化層(pooling)的下采樣會造成圖像信息部分損失,不能采用,因此把G和D網(wǎng)絡(luò)中的池化層替換為反卷積層和步進(jìn)卷積層,減少圖像信息損失。然后引入Batch Normalization (BN)構(gòu)造更加穩(wěn)定的網(wǎng)絡(luò)。

        1.2.2 改進(jìn)的卷積層

        傳統(tǒng)的DCGAN網(wǎng)絡(luò)的卷積層主要面向圖像分類為主。該網(wǎng)絡(luò)層默認(rèn)輸入一般是二維圖像,因此網(wǎng)絡(luò)層的卷積核和池化窗口都是大小為n×n維的矩陣。如此來看這樣的網(wǎng)絡(luò)結(jié)構(gòu)并不適用于光譜數(shù)據(jù),因此需要對傳統(tǒng)DCGAN網(wǎng)絡(luò)的卷積層進(jìn)行改進(jìn),也就是將DCGAN中卷積層的卷積核修改為一維向量卷積核,使之能夠處理拉曼光譜數(shù)據(jù)。

        1.2.3 DCGAN網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)

        針對Raman光譜數(shù)據(jù)設(shè)計(jì)的生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)的結(jié)構(gòu)見表2。

        表2 用于Raman光譜擴(kuò)充的生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)Table 2 Generator network and Discriminator network for Raman spectral augmentation

        1.3 數(shù)據(jù)增強(qiáng)

        僅使用DCGAN生成光譜來進(jìn)行分類缺少算法效果對照。增加一個(gè)數(shù)據(jù)增強(qiáng)方法生成光譜,通過兩種方法對生成的光譜進(jìn)行分類對比。

        數(shù)據(jù)增強(qiáng)是一個(gè)擴(kuò)展數(shù)據(jù)集最常用的技術(shù),它已成功地應(yīng)用于許多領(lǐng)域,從圖像分類到分子建模。其核心思想是通過模擬數(shù)據(jù)集中的各種數(shù)值變化,從有限的標(biāo)記樣本數(shù)目中擴(kuò)展訓(xùn)練樣本的數(shù)目。對于光譜數(shù)據(jù),采用隨機(jī)偏移量、斜率的隨機(jī)變化和隨機(jī)乘法來擴(kuò)展數(shù)據(jù)集。偏移量為訓(xùn)練集標(biāo)準(zhǔn)差的±0.10倍,疊加次數(shù)為訓(xùn)練集標(biāo)準(zhǔn)差的1±0.10倍,斜率在0.95~1.05之間均勻隨機(jī)調(diào)整。其函數(shù)表達(dá)如式(3)和式(4)

        x′=kx+b

        (3)

        (4)

        式中,k為縮放比例,b為偏移項(xiàng),表示對光譜每個(gè)數(shù)據(jù)點(diǎn)隨機(jī)向上偏移,每個(gè)點(diǎn)的偏移量呈線性遞增或遞減形式。m為傾斜度,n為傾斜時(shí)的偏移,a為步長從0到1之間的向量。x表示原光譜,x′表示用x生成的光譜。

        圖2是數(shù)據(jù)增強(qiáng)生成光譜的示意圖,圖中粗藍(lán)線為原始光譜,其余為偏移法生成光譜。

        圖2 偏移法擴(kuò)增光譜示意圖Fig.2 Spectral augmentation by slope-bias adjusting

        1.4 分類方法

        分類方法有以下幾種:無監(jiān)督分類、半監(jiān)督分類、有監(jiān)督分類。常見的無監(jiān)督分類算法有K聚類、Fuzzy Means[11];半監(jiān)督學(xué)習(xí)則是DBSCAN最常用;對于有監(jiān)督分類來說,常用的有支持向量機(jī)(support vector machine,SVM)。

        根據(jù)需要選擇分類方法,CNN上文已提到不再贅述,增加一個(gè)機(jī)器學(xué)習(xí)分類方法作為CNN分類方法參照,這里選用SVM方法。生成的拉曼光譜數(shù)據(jù)表示為G(z)=[b1,b2,…,bm],m為樣本總數(shù),SVM的分類函數(shù)的對偶形式表示為

        (5)

        0≤αi≤C,i=1,2,…,m

        其中k(bi,bj)本文選擇徑向基函數(shù)(RBF)

        (6)

        建模選擇LibSVM軟件,這里有兩個(gè)參數(shù)c和g,c就是式(5)中的C,g=1/2σ,參數(shù)設(shè)置為:c=200,g=0.01。

        1.5 模型評價(jià)方法

        1.5.1 擴(kuò)充樣本的選取標(biāo)準(zhǔn)

        對生成圖像進(jìn)行評估有一定的困難,一般只能通過人工樣本篩選和主觀判斷的方法來進(jìn)行評價(jià),不僅耗時(shí)而且費(fèi)力。結(jié)構(gòu)相似度(structural similarity index,SSIM)指標(biāo)能夠很好的判斷兩個(gè)樣本的相似性,故引入該指標(biāo)對生成光譜進(jìn)行評判。見式(7)[12]

        (7)

        式中μx,μg,σx,σg為x和g的均值和方差,σxg為x和g協(xié)方差。c1和c2為常數(shù),用來保證函數(shù)穩(wěn)定性,c1=(k1L)2,c2=(k2L)2,L=255,是圖像像素最大值,k1=0.01,k2=0.03。

        SSIM取值范圍[0,1],大小與圖像相似度成正比。這里設(shè)置SSIM閾值為0.9,因?yàn)楦呦嗨贫鹊纳晒庾V才能用于樣本擴(kuò)充。計(jì)算原始光譜和生成光譜之間SSIM值,SSIM值大于等于0.9才采用該生成光譜,否則不用。

        1.5.2 模型分類結(jié)果的評價(jià)方法

        本實(shí)驗(yàn)采用分類準(zhǔn)確率定量評價(jià)分類結(jié)果。

        當(dāng)光譜輸入到分類器時(shí),計(jì)算其分類的準(zhǔn)確率P。分類準(zhǔn)確率P。可表示為

        (8)

        式中:Nc為正確分類的樣本數(shù),Nr為樣本數(shù)。

        2 實(shí)驗(yàn)部分

        2.1 數(shù)據(jù)處理

        實(shí)驗(yàn)中使用的數(shù)據(jù)為中國食品藥品檢定研究院測取的藥品拉曼光譜數(shù)據(jù)集,選取9類藥品,藥品分布如表3。測量儀器為同方威視RT6000、Metage OPAL 3000和Opto Trace RamTracer-200-HS拉曼光譜儀,測量參數(shù)Metage OPAL 3000和Opto Trace RamTracer-200-HS積分時(shí)間設(shè)為25 s,積分次數(shù)設(shè)為3次,同方威視RT6000積分時(shí)間設(shè)為25 s,積分次數(shù)為自動。為了避免實(shí)驗(yàn)中因?yàn)闃颖静ǘ尾灰恢露鴮?dǎo)致的結(jié)果不理想,以下實(shí)驗(yàn)均選擇每種藥品在100~1 000 cm-1的光譜。同時(shí)為了驗(yàn)證DCGAN在生成光譜中具有預(yù)處理的作用,實(shí)驗(yàn)所采用的所有光譜均只進(jìn)行基線校正和歸一化預(yù)處理,為減少計(jì)算量,采樣間隔選擇隔13點(diǎn)采樣。

        表3 中檢院數(shù)據(jù)集對應(yīng)的藥品分布Table 3 Distribution of corresponding drugs in data set National Institute for Food and Drug Control

        2.2 CNN模型訓(xùn)練

        卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率設(shè)置為0.001,梯度更新塊大小設(shè)置為32。訓(xùn)練過程中手動調(diào)整以保持所有層具有相同的迭代速度。對卷積層設(shè)置權(quán)值初始化為0.01標(biāo)準(zhǔn)差的零均值高斯分布。對全連接層的權(quán)重設(shè)置0.005標(biāo)準(zhǔn)偏差。由于卷積后的結(jié)果會導(dǎo)致光譜首尾數(shù)據(jù)的丟失,因此輸入前對原始光譜采用0填充。目標(biāo)函數(shù)采用最小化預(yù)測值和真值的交叉熵

        (9)

        2.3 DCGAN模型訓(xùn)練

        DCGAN中卷積網(wǎng)絡(luò)的激活函數(shù)選擇LeakyReLU,設(shè)定leak的斜度值為0.2,整個(gè)網(wǎng)絡(luò)設(shè)定數(shù)值為2的batch size,網(wǎng)絡(luò)的學(xué)習(xí)率不能太大,否則時(shí)間過長,這里設(shè)置為0.000 2,卷積層還需要使用優(yōu)化器并設(shè)置動量參數(shù),優(yōu)化器使用Adam,參數(shù)設(shè)置為0.5時(shí)可以穩(wěn)定訓(xùn)練。D訓(xùn)練兩次,G訓(xùn)練一次,迭代次數(shù)設(shè)置為800。每迭代10次輸出一次SSIM的平均值,作為選取擴(kuò)充樣本的標(biāo)準(zhǔn)。

        將原始拉曼光譜作為初始數(shù)據(jù)集,通過對抗生成新的數(shù)據(jù)集,為了有所區(qū)別,這里給生成網(wǎng)絡(luò)設(shè)定100個(gè)服從標(biāo)準(zhǔn)正態(tài)分布的噪聲z,通過反卷積網(wǎng)絡(luò)后能夠生成和真實(shí)圖像相似的“假”樣本。然后將真假樣本同時(shí)輸入判別網(wǎng)絡(luò),通過卷積層能夠得到范圍為0到1的概率值,根據(jù)概率值判斷樣本的真假程度。訓(xùn)練分為兩個(gè)部分:

        (1)訓(xùn)練生成網(wǎng)絡(luò),提前設(shè)定好判別參數(shù),用以優(yōu)化生成網(wǎng)絡(luò),直到生成的“假”樣本判別網(wǎng)絡(luò)無法識別,此時(shí)生成網(wǎng)絡(luò)輸出大概率真實(shí)的樣本,映射到函數(shù)內(nèi)就是最大化D(G(z)),亦即最小化1-D(G(z))。

        (2)訓(xùn)練判別網(wǎng)絡(luò),類似地,給定生成網(wǎng)絡(luò)的參數(shù),區(qū)性優(yōu)化判別網(wǎng)絡(luò),這樣能大大提高判別網(wǎng)絡(luò)的精度,這里期望最大化D(x)。生成樣本G(z)需要使得D(G(z))最小。對判別網(wǎng)絡(luò)的目標(biāo)函數(shù)優(yōu)化為lnD(x)+ln(1-D(G(x)))。

        最終得到目標(biāo)函數(shù)

        Ez-Pz(z)[ln(1-D(G(z)))]

        (10)

        然后固定生成網(wǎng)絡(luò)的參數(shù),以優(yōu)化判別網(wǎng)絡(luò),使得V(D,G)最大

        Pg(x)ln(1-D(x))]dx

        (11)

        為了式(11)最大,這需要式(12)

        Pdata(x)ln(D(x))+Pg(x)ln(1-D(x))

        (12)

        取得最大值。顯然有:對任意非零的Pdata(x),Pg(x),且實(shí)數(shù)值D(x)∈[0,1]時(shí),式(12)在Pdata(x)/(Pdata(x)+Pg(x))處取得最大值,列出最優(yōu)的生成網(wǎng)絡(luò)D的函數(shù)

        (13)

        對生成網(wǎng)絡(luò)進(jìn)行優(yōu)化時(shí),有Pdata=Pg時(shí)生成網(wǎng)絡(luò)取得最優(yōu)解,使得生成網(wǎng)絡(luò)更好地再現(xiàn)真實(shí)樣本的分布。

        3 結(jié)果與討論

        設(shè)計(jì)四組實(shí)驗(yàn)。分別是SVM對原始光譜進(jìn)行分類的參照組、CNN對原始光譜進(jìn)行分類的對照組、CNN對DCGAN生成光譜進(jìn)行分類的實(shí)驗(yàn)組和CNN對偏移法生成光譜進(jìn)行分類的實(shí)驗(yàn)組。

        由于SVM和CNN需要進(jìn)行訓(xùn)練,在原始光譜的實(shí)驗(yàn)中,選取70%作為訓(xùn)練集,剩下30%作為測試集。在生成光譜的實(shí)驗(yàn)中,分別用數(shù)據(jù)增強(qiáng)方式和DCGAN方式將每種藥品的譜圖數(shù)擴(kuò)充到100個(gè),再選取70%的光譜對CNN進(jìn)行訓(xùn)練,剩下30%的光譜進(jìn)行測試。

        3.1 原始光譜直接SVM分類

        表4展示了對原始光譜的訓(xùn)練集和測試集的劃分情況,SVM分類原始拉曼光譜的結(jié)果如表5所示。以SVM直接對原始的拉曼光譜分類產(chǎn)生的結(jié)果來看,對拉曼光譜的分類準(zhǔn)確率并不高。對于Pefloxacin和Cefixime兩個(gè)樣本最少的藥品來說,幾乎無法準(zhǔn)確分類。從表5中可以看出由于總體數(shù)據(jù)集樣本量不大,其分類精度依然有待提高。

        表4 藥品樣本訓(xùn)練集、測試集劃分情況Table 4 The training set,test set distribution of drug samples

        表5 中檢院拉曼光譜數(shù)據(jù)判別詳細(xì)結(jié)果-SVM(%)Table 5 Detailed results of Raman spectrum discrimination of China food and drug institute-SVM (%)

        3.2 原始光譜直接CNN分類

        用于CNN分類的訓(xùn)練集和測試集的劃分同表4。表6展示了相同波段的原始光譜輸入CNN的分類實(shí)驗(yàn)結(jié)果。表中分別列出了CNN對原始拉曼光譜分類結(jié)果(訓(xùn)練集分類準(zhǔn)確率78.38%,測試集分類準(zhǔn)確率75.00%)。同樣對于Pefloxacin和Cefixime兩個(gè)樣本最少的藥品來說,分類準(zhǔn)確率略有提升。由于CNN具有很強(qiáng)的特征提取和分類能力,因此CNN對拉曼光譜的總體分類精度高于SVM。

        表6 拉曼光譜數(shù)據(jù)判別詳細(xì)結(jié)果-CNN(%)Table 6 Detailed results of Raman spectrum discrimination CNN (%)

        3.3 數(shù)據(jù)增強(qiáng)生成光譜直接CNN分類

        上述實(shí)驗(yàn)僅用原始光譜進(jìn)行分類對比實(shí)驗(yàn),為了實(shí)驗(yàn)的嚴(yán)謹(jǐn)性,需要考慮到生成的光譜是否具有相同的優(yōu)越性。因此需要擴(kuò)增譜圖和原始譜圖分類對比來查看情況,先用偏移法將每個(gè)藥品光譜擴(kuò)充到100個(gè),訓(xùn)練集和測試集劃分見表7。分別輸入CNN訓(xùn)練并分類得到結(jié)果,圖3為單個(gè)藥品生成10個(gè)譜圖和原始譜圖的疊加圖。表8是生成光譜數(shù)據(jù)判別詳細(xì)情況。實(shí)驗(yàn)結(jié)果表明,偏移法生成譜圖具有較好的分類準(zhǔn)確率;另一方面,分類過程中出現(xiàn)了一些誤分類的情況,即把本該分類到某種藥品的譜圖認(rèn)為是另一種藥品的譜圖。出現(xiàn)這種現(xiàn)象的原因是偏移法生成的光譜有些波長點(diǎn)的峰強(qiáng)信息會改變,此時(shí)該拉曼峰可能會被認(rèn)為是另一種分子。同時(shí),由于偏移法生成光譜是對原光譜的重塑,因此有必要評估生成光譜相比原光譜的失真度。局部方差估計(jì)法LVE(local variance estimation method)是一個(gè)較好的能夠估計(jì)圖像失真程度的方法,其算法原理是先計(jì)算每張圖片像素局部方差,最大的局部方差為信號方差,最小的局部方差為噪聲方差,計(jì)算信號方差和噪聲方差的比值,并轉(zhuǎn)換成dB表示。表9為圖3生成的10個(gè)譜圖對比原始譜圖的信噪比,從實(shí)驗(yàn)結(jié)果可以看出生成光譜相對原始光譜的失真程度。

        表7 藥品樣本訓(xùn)練集、測試集劃分情況Table 7 The training set,test set distribution of drug samples

        圖3 偏移法生成譜圖Fig.3 Spectral generation by data augmentation

        表8 中檢院拉曼光譜數(shù)據(jù)判別詳細(xì)結(jié)果-偏移法+CNN(%)Table 8 Detailed results of Raman spectrum discrimination of China food and drug institute-Data augmentation and CNN (%)

        表9 偏移法擴(kuò)增譜圖的LVE方法信噪比(對應(yīng)圖3)Table 9 LVE signal to noise ratio of augmented spectral by slope-bias adjusting (corresponding to Fig.3)

        3.4 DCGAN生成光譜直接CNN分類

        同樣使用DCGAN將每個(gè)藥品光譜數(shù)量擴(kuò)充到100,訓(xùn)練集與測試集劃分同表7。圖4為原始的中檢院數(shù)據(jù)中隨機(jī)選取的10個(gè)藥品光譜如圖4(a),和DCGAN進(jìn)行對抗生成的10個(gè)新的光譜如圖4(b)的展示。從視覺上看出生成的光譜相較原始光譜更加平滑清晰,說明DCGAN在生成光譜的過程中能夠起到預(yù)處理的作用。將劃分好的訓(xùn)練集和測試集輸入CNN進(jìn)行訓(xùn)練分類,得到如表10所示的判別結(jié)果。實(shí)驗(yàn)結(jié)果表明生成譜圖具有高分類準(zhǔn)確率。同樣評估DCGAN生成光譜相比原光譜的失真度,實(shí)驗(yàn)結(jié)果見表11,從實(shí)驗(yàn)結(jié)果可以看出生成光譜的失真程度對比原始光譜差異較小,相比偏移法,DCGAN生成的光譜較好的保留了原始譜圖的信息。圖5是四個(gè)實(shí)驗(yàn)的訓(xùn)練集和測試集的分類準(zhǔn)確率對比,從分類準(zhǔn)確率來看,DCGAN生成的拉曼光譜數(shù)據(jù)更有利于準(zhǔn)確分類。

        表10 拉曼光譜數(shù)據(jù)判別詳細(xì)結(jié)果-DCGAN+CNN(%)Table 10 Detailed results of Raman spectrum discrimination of DCGAN and CNN (%)

        表11 DCGAN擴(kuò)增譜圖的LVE信噪比(對應(yīng)圖4)Table 11 LVE signal to noise ratio of augmented spectral by DCGAN (corresponding to Fig.4)

        圖4 原始譜圖(a)和DCGAN生成譜圖(b)對比Fig.4 The original spectra (a) were compared with the generated spectra (b) of DCGAN

        圖5 訓(xùn)練集和測試集的分類準(zhǔn)確率對比圖Fig.5 Comparison of classification accuracy of training set and test set

        4 結(jié) 論

        本文提出的基于DCGAN的數(shù)據(jù)擴(kuò)充可有效擴(kuò)充Raman光譜數(shù)據(jù),并可由此提高對擴(kuò)充后數(shù)據(jù)分類的準(zhǔn)確率。使用中檢院的藥品拉曼光譜數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明:

        (1)由于中檢院藥品數(shù)據(jù)集樣本量不大,該方法實(shí)現(xiàn)由少量的拉曼光譜生成更多的拉曼光譜擴(kuò)充數(shù)據(jù)集,對解決由于數(shù)據(jù)集樣本量不夠而引發(fā)的深度學(xué)習(xí)分類精度較低的問題提出了一個(gè)新的思路;

        (2)使用DCGAN網(wǎng)絡(luò)對光譜進(jìn)行生成甚至超分辨率重建是可行的,并且效果較好;

        (3)基于DCGAN左右互搏的思想,使得生成的光譜圖和原始光譜圖在不斷互相“欺騙”的過程中,提高了模型對光譜特征的識別和分類精度。

        本文提出方法也存在不足之處,例如DCGAN是對原譜圖進(jìn)行重塑,不能應(yīng)用常用的圖像評價(jià)指標(biāo),因此如何更直觀地反映生成譜圖和原譜圖的關(guān)系還有待研究;另一方面由于數(shù)據(jù)集的樣本量不夠大,在大樣本容量時(shí)的實(shí)驗(yàn)結(jié)果仍需進(jìn)一步驗(yàn)證。

        猜你喜歡
        曼光譜光譜卷積
        基于三維Saab變換的高光譜圖像壓縮方法
        基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        基于傅里葉域卷積表示的目標(biāo)跟蹤算法
        星載近紅外高光譜CO2遙感進(jìn)展
        苦味酸與牛血清蛋白相互作用的光譜研究
        一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識別方法
        鋱(Ⅲ)與PvdA作用的光譜研究
        BMSCs分化為NCs的拉曼光譜研究
        便攜式薄層色譜-拉曼光譜聯(lián)用儀重大專項(xiàng)獲批
        日本免费看片一区二区三区| 亚洲中文字幕无码爆乳av| 无码国产精品一区二区免费97| 两个人免费视频大全毛片| 日本女同av在线播放| 久久久精品中文字幕麻豆发布| 亚洲熟女乱色综合亚洲av| 日本成人久久| 久久精品国产亚洲一级二级| 亚洲国产中文字幕一区| 四川丰满妇女毛片四川话| 国产麻无矿码直接观看| 好爽~又到高潮了毛片视频| 国产乱淫h侵犯在线观看| 久久久久亚洲av无码专区喷水| 久久无码av三级| 国产精品亚洲综合天堂夜夜| 大陆少妇一区二区三区| 无码熟妇人妻av影音先锋| 少妇熟女视频一区二区三区| 日日噜噜夜夜狠狠久久av| 日韩午夜免费视频精品一区| 一二三四日本中文在线| 91麻豆国产香蕉久久精品| 久久精品国产亚洲av热九 | 国产无遮挡又黄又爽在线观看 | 国产精品v欧美精品v日韩精品| 亚洲中文字幕久久精品蜜桃| 亚洲精品av一区二区日韩| 久久不见久久见www日本网| 亚洲国产av导航第一福利网| 国产成人精品日本亚洲直播| 久久久人妻一区二区三区蜜桃d| 国产精品亚洲а∨天堂2021| 国产成人精品电影在线观看18 | 日本丰满老妇bbw| 亚洲永久无码7777kkk| 国产伦码精品一区二区| 蜜桃视频在线免费视频| 亚洲av中文无码乱人伦在线播放 | 亚洲中文字幕人成乱码在线 |