亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于一維卷積神經(jīng)網(wǎng)絡(luò)和拉曼光譜的肺炎支原體菌株分類

        2022-05-05 13:52:02何夢園王泊林
        光譜學(xué)與光譜分析 2022年5期
        關(guān)鍵詞:分類模型

        趙 勇, 何夢園, 王泊林, 趙 榮, 孟 宗*

        1. 燕山大學(xué)電氣工程學(xué)院, 河北省測試計量技術(shù)及儀器重點實驗室, 河北 秦皇島 066004

        2. 燕山大學(xué)信息科學(xué)與工程學(xué)院, 河北省特種光纖與光纖傳感重點實驗室, 河北 秦皇島 066004

        引 言

        肺炎支原體(mycoplasma pneumoniae, MP)感染是社區(qū)獲得性肺炎最常見的病因之一[1]。 它是引起人類呼吸道感染的常見病原體, 如支氣管炎、 肺炎等, 嚴(yán)重可誘發(fā)哮喘等疾病[2]。 目前, 肺炎支原體菌株傳統(tǒng)實驗室診斷方法主要包括培養(yǎng)法、 血清學(xué)法和聚合酶鏈反應(yīng)(polymerase chain reaction, PCR)分析[3]。 然而培養(yǎng)實驗的培養(yǎng)周期長, 出結(jié)果慢; 血清學(xué)分析使用抗體作為生物標(biāo)志物, 缺乏對疾病發(fā)作的敏感性[1]; PCR技術(shù)具有較高靈敏度和特異性, 但需要熟練的操作人員、 昂貴的儀器和復(fù)雜的樣品預(yù)處理, 不能廣泛應(yīng)用于早期即時檢測[4]。 目前各種檢測方法都存在耗時長, 對實驗條件、 環(huán)境和人員要求高, 培養(yǎng)過程中易受細(xì)菌和真菌干擾, 診斷敏感性和特異性低等問題, 限制了其在臨床上的廣泛應(yīng)用[5-6]。 因此, 快速、 靈敏、 特異的肺炎支原體菌株檢測方法研究具有重要臨床意義。

        拉曼光譜是一種非彈性散射的電磁輻射, 是分子振動和輻射之間能量交換的結(jié)果。 拉曼光譜技術(shù)具有所需樣品少、 無需復(fù)雜預(yù)處理、 不破壞樣品、 檢測速度快且靈敏度高等特點, 廣泛應(yīng)用于乙肝[7]、 肺癌、 胃癌、 腎病[8]等疾病的診斷。 感染肺炎支原體的患者血液分子結(jié)構(gòu)發(fā)生變化并反映在其拉曼光譜中, 為基于拉曼光譜法判斷肺炎支原體菌株類型提供理論依據(jù)。

        隨著深度學(xué)習(xí)在圖像處理、 語音識別等許多領(lǐng)域都取得成功應(yīng)用, 卷積神經(jīng)網(wǎng)絡(luò)獲得廣泛關(guān)注和極大發(fā)展, 但目前應(yīng)用于疾病診斷領(lǐng)域的光譜識別算法大多采用傳統(tǒng)機(jī)器學(xué)習(xí)方法。 相對于傳統(tǒng)拉曼光譜分類算法而言, 深度學(xué)習(xí)方法可以省去特征提取環(huán)節(jié), 簡化光譜分類過程, 提高識別準(zhǔn)確率。 一維卷積神經(jīng)網(wǎng)絡(luò)可以從包含各種特征的光譜中提取與目標(biāo)分析物相關(guān)的信息。 Liu等[9]采用包括特征提取的金字塔形卷積層和用于分類的2個全連接層的LetNet變體的深度卷積神經(jīng)網(wǎng)絡(luò)對拉曼光譜數(shù)據(jù)分類的方法, 在RRUFF礦物拉曼光譜數(shù)據(jù)庫上取得很好的分類效果。 Shao等[10]使用2個卷積和1個全連接的卷積神經(jīng)網(wǎng)絡(luò)結(jié)合拉曼數(shù)據(jù)篩選前列腺癌骨轉(zhuǎn)移的能力, 使用五倍交叉驗證方法對模型進(jìn)行訓(xùn)練和測試, 模型平均檢測正確率81.70%。 李慶旭等[11]將可見-近紅外透射光譜技術(shù)與3個卷積層和1個全連接層的卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合, 用于入孵前種鴨蛋受精信息的無損鑒別, 測試集分類正確率97.41%, 高于邏輯回歸、 SVM等傳統(tǒng)方法。

        本文提出將一維卷積神經(jīng)網(wǎng)絡(luò)(one-dimensional convolution neural network, 1D-CNN)模型應(yīng)用到肺炎支原體菌株拉曼光譜識別問題, 優(yōu)化卷積核大小和數(shù)目等模型參數(shù), 針對M129型和FH型兩類肺炎支原體光譜, 模擬高斯噪聲、 泊松噪聲和乘性噪聲等測量拉曼光譜數(shù)據(jù)時的常見噪聲, 驗證模型抗噪能力, 通過和傳統(tǒng)機(jī)器學(xué)習(xí)算法所建模型分類結(jié)果進(jìn)行比較, 證明所提出方法的有效性, 為肺炎支原體肺炎快速診斷提供一個新的思路。

        1 數(shù)據(jù)集

        1.1 肺炎支原體拉曼光譜數(shù)據(jù)

        本文研究的肺炎支原體菌株拉曼光譜數(shù)據(jù)來源于Dryad光譜數(shù)據(jù)集(https://doi.org/10.5061/dryad.s5h20)[12], 具體選擇兩種主要的肺炎支原體菌株基因型M129型和FH型菌株的各25條拉曼光譜作為基礎(chǔ)光譜樣本模板。 原始數(shù)據(jù)庫中采集兩類菌株拉曼光譜時, 激光器光源功率為28 mW, 積分時間為10 s, 光譜采集范圍400~1 800 cm-1, 兩類肺炎支原體菌株的基線校正后的平均拉曼光譜圖如圖1所示。

        圖1 兩類肺炎支原體菌株拉曼光譜圖

        1.2 光譜數(shù)據(jù)增強(qiáng)

        卷積神經(jīng)網(wǎng)絡(luò)的建立通常要求基于大規(guī)模數(shù)據(jù)庫作為訓(xùn)練數(shù)據(jù), 充足的訓(xùn)練數(shù)據(jù)可以使神經(jīng)網(wǎng)絡(luò)模型充分學(xué)習(xí)到數(shù)據(jù)類別內(nèi)部特征和類別間的區(qū)別, 增強(qiáng)模型的魯棒性, 盡可能避免過擬合現(xiàn)象。 然而在實際應(yīng)用領(lǐng)域中, 由于臨床樣本的限制往往無法獲得足夠的拉曼光譜來訓(xùn)練深度學(xué)習(xí)模型。

        數(shù)據(jù)增強(qiáng)是一種從有限的標(biāo)記樣本中擴(kuò)大樣本數(shù)量來訓(xùn)練神經(jīng)網(wǎng)絡(luò), 從而提高模型魯棒性的技術(shù)。 對于光譜數(shù)據(jù), 本文通過給拉曼光譜加入隨機(jī)基線偏移量, 設(shè)定樣本光譜的不同基線斜率和隨機(jī)乘性擴(kuò)大光譜幅值的方法進(jìn)行光譜數(shù)據(jù)增強(qiáng)。 隨機(jī)偏移量設(shè)定為樣本±0.10倍光譜標(biāo)準(zhǔn)差; 在0.95~1.05之間隨機(jī)設(shè)定基線的斜率; 按照樣本光譜的1±0.10倍標(biāo)準(zhǔn)差進(jìn)行幅值乘性擴(kuò)大。 一個光譜樣本進(jìn)行10倍增強(qiáng)后的光譜如圖2所示。

        圖2 拉曼光譜數(shù)據(jù)增強(qiáng)

        1.3 光譜噪聲疊加

        實際光譜數(shù)據(jù)采集過程中, 由于受傳感器材料屬性、 工作環(huán)境、 電子元器件和結(jié)構(gòu)等影響, 會引入各種噪聲, 如電阻引起的熱噪聲、 光子噪聲、 暗電流噪聲、 光響應(yīng)的非均勻性、 環(huán)境噪聲等。 噪聲以無用的信息形式出現(xiàn), 擾亂光譜的可觀測信息, 呈現(xiàn)與物質(zhì)不相連的譜峰。 傳統(tǒng)算法很難完全去除噪聲影響, 因此模型的抗噪性能顯得尤為重要。

        高斯噪聲是最主要的隨機(jī)噪聲類型, 主要是由于傳感器亮度不均勻, 長期工作溫度過高引起; 由于光具有量子特效, 到達(dá)檢測器表面的量子數(shù)目存在統(tǒng)計漲落, 因此對光譜細(xì)節(jié)信息遮蓋, 這種由于光量子而造成的測量不確定性稱為泊松噪聲; 乘性噪聲往往由于信道不理想引起, 噪聲部分隨信號變化而變化, 且與信號是相乘關(guān)系。 根據(jù)以上對噪聲的分析, 本文在M129型和FH型肺炎支原體菌株的原始光譜中分別疊加均值為0, 方差為0.000 1的高斯噪聲、 泊松噪聲以及方差為0.002的乘性噪聲, 疊加噪聲后的光譜如圖3所示。

        圖3 原始光譜和疊加噪聲光譜

        2 模型建立與訓(xùn)練

        根據(jù)光譜數(shù)據(jù)特點, 本文構(gòu)造1D-CNN模型進(jìn)行光譜分類。 整個1D-CNN包含3個卷積層和3個池化層, 其網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。

        圖4 一維卷積神經(jīng)網(wǎng)絡(luò)拉曼光譜分類模型

        光譜數(shù)據(jù)以2 746×1的矩陣形式輸入卷積層, 在卷積運(yùn)算層中, 使用線性修正單元變體LeakyReLU作為激活函數(shù), 表示式如式(1)所示

        (1)

        為了降低運(yùn)算復(fù)雜度, 卷積神經(jīng)網(wǎng)絡(luò)每層內(nèi)的神經(jīng)元權(quán)值共享, 通過大量仿真優(yōu)化比較, 卷積核尺寸參數(shù)分別設(shè)定為10×1, 5×1和2×1, 卷積核個數(shù)分別設(shè)定為64, 64和128。 卷積可提取前一層信息的不同特征, 這些不同特征共同作為下一層網(wǎng)絡(luò)的輸入數(shù)據(jù)。 一維信號卷積運(yùn)算公式如式(2)所示

        (2)

        式(2)中, *表示卷積運(yùn)算,yj為第j個輸出特征圖,xj為第j個輸入特征圖,kij為本層卷積運(yùn)算所使用的卷積核,bj為第j個特征圖的偏置。

        每個卷積運(yùn)算層后對應(yīng)一個池化層, 對卷積運(yùn)算生成的特征圖采樣, 池化層運(yùn)算并未減少特征圖個數(shù), 而是減小每個特征圖的維度, 縮減數(shù)據(jù)量, 提升運(yùn)算速度, 本文采用最大池化(Max-pooling)對信號進(jìn)行降采樣, 其表達(dá)式如式(3)所示。

        f(Xk)=max{a1, …,as}

        (3)

        式(3)是最大池化對信號降采樣計算方法, 對卷積層運(yùn)算所得的一個特征映射將其劃分多個不重疊Xk,k=1, 2, 3, …,K, 區(qū)域大小為s。

        卷積及池化層獲取光譜數(shù)據(jù)特征后, 將其展開并輸入全連接層進(jìn)行分類, 使用tanh激活函數(shù), 并在全連接層后加入應(yīng)用比例為0.5的隨機(jī)失活層, 避免過擬合, 加快收斂速度, 提高神經(jīng)網(wǎng)絡(luò)魯棒性。 設(shè)置批處理樣本數(shù)目參數(shù)為90, 采用交叉熵?fù)p失函數(shù), 計算公式如式(4)所示

        (4)

        式(4)中,xn是訓(xùn)練光譜數(shù)據(jù),yn,k是第n個樣本預(yù)測第k個數(shù)據(jù)的標(biāo)簽,pn,k是第n個樣本預(yù)測第k個標(biāo)簽值的概率,N是總共的樣本數(shù),k為總標(biāo)簽類數(shù)。

        原始光譜數(shù)據(jù)經(jīng)過增強(qiáng)和三類噪聲疊加構(gòu)成建模所需的光譜數(shù)據(jù)集, 將數(shù)據(jù)集隨機(jī)劃分為3部分: 70%光譜數(shù)據(jù)作為訓(xùn)練集, 10%光譜數(shù)據(jù)作為驗證集, 用于在反向傳播訓(xùn)練過程中調(diào)整神經(jīng)元權(quán)重參數(shù); 20%光譜數(shù)據(jù)作為測試集, 用于測試已訓(xùn)練后的網(wǎng)絡(luò)模型性能。 模型經(jīng)過200個epoch訓(xùn)練之后的正確率和損失值曲線如圖5所示, 可以看出網(wǎng)絡(luò)基本收斂。

        圖5 1D-CNN模型損失率和準(zhǔn)確率曲線

        3 模型分類結(jié)果

        3.1 不同算法分類結(jié)果對比

        本文提出的1D-CNN方法與LDA, KNN和SVM三種傳統(tǒng)方法進(jìn)行比較, 結(jié)果如表1所示。 從表1中可以看出, CNN對加入高斯噪聲的M129和FH肺炎支原體菌株光譜數(shù)據(jù)所建模型分類正確率為98%, 泊松噪聲的M129和FH肺炎支原體菌株光譜數(shù)據(jù)所建模型的分類正確率為97%, 乘性噪聲的M129和FH肺炎支原體光譜菌株數(shù)據(jù)所建模型的分類正確率為97%, 均高于傳統(tǒng)算法所建模型的分類正確率。

        表1 不同算法分類結(jié)果對比

        為了進(jìn)一步比較1D-CNN模型和傳統(tǒng)算法對不同種類噪聲的抗噪能力, 分別得到KNN, SVM, LDA和CNN模型的混淆矩陣, 如圖6所示。 從圖6中可以看出, 基于1D-CNN方法所建模型的誤判個數(shù)最少, 同時1D-CNN模型對肺炎支原體菌株類型的靈敏度和特異性均高于其他算法所建模型, 結(jié)果表明1D-CNN模型相比傳統(tǒng)算法模型在抗噪聲方面具有明顯優(yōu)勢。

        圖6 不同算法針對三種噪聲的混淆矩陣對比

        3.2 不同分類算法ROC曲線對比

        對于肺炎支原體菌株類型的定性分析, ROC曲線下面積AUC(area under the curve)與準(zhǔn)確率呈正相關(guān), AUC值越大, 模型準(zhǔn)確率越高。 不同算法針對不同種類噪聲的ROC曲線對比結(jié)果如圖7所示。 由圖7(a)可知, 加入高斯噪聲后,CNN模型的AUC值為0.982, 傳統(tǒng)分類算法LDA, KNN和SVM模型的AUC值分別為0.612, 0.624和0.658; 由圖7(b)和(c)可知, 加入泊松噪聲和乘性噪聲后, CNN模型的AUC值也均高于其他算法。

        圖7 疊加三類噪聲的不同算法ROC曲線對比

        3.3 疊加不同強(qiáng)度噪聲結(jié)果對比

        噪聲強(qiáng)度對拉曼光譜定性分析模型提出更高要求, 因此在肺炎支原體菌株原始拉曼光譜中分別疊加5, 15, 25, 35, 45和55 dBW六種不同強(qiáng)度的高斯白噪聲, 以測試模型的抗噪聲性能, 四種算法在不同噪聲強(qiáng)度下的分類結(jié)果對比如圖8所示。

        從圖8可以看出, 隨著噪聲強(qiáng)度的不斷增大, LDA, KNN和SVM算法所建模型分類正確率下降幅度較大, 而1D-CNN 方法所建模型的分類正確率變化幅度較小, 當(dāng)添加噪聲強(qiáng)度達(dá)到55 dBW時, 1D-CNN模型依然能夠提取到拉曼光譜特征, 獲得92.5%的分類正確率。 因此, 1D-CNN 所建模型抗噪性能遠(yuǎn)優(yōu)于傳統(tǒng)算法所建模型性能。

        圖8 不同算法針對不同強(qiáng)度噪聲分類結(jié)果

        4 結(jié) 論

        為實現(xiàn)肺炎支原體菌株類型的準(zhǔn)確分類, 提出1D-CNN拉曼光譜分類方法。 針對小樣本肺炎支原體菌株的拉曼光譜, 提出適用于拉曼光譜數(shù)據(jù)的數(shù)據(jù)增強(qiáng)方法, 擴(kuò)充光譜數(shù)據(jù)以滿足建模樣本需求。 同時模擬光譜采集時不同種類噪聲影響, 驗證模型的抗噪能力。 結(jié)果表明利用拉曼光譜結(jié)合1D-CNN, 無需光譜預(yù)處理可以有效篩選信息, 同時能夠更好地挖掘出光譜特征, 從而減少計算量和縮短計算時間。 相比傳統(tǒng)算法能得到更高的分類正確率, 并具有很好地抗噪聲能力, 具有明顯的優(yōu)勢和重要的實際應(yīng)用價值。

        猜你喜歡
        分類模型
        一半模型
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        91亚洲免费在线观看视频| 日日噜噜夜夜爽爽| 一个人看的视频在线观看| 中国杭州少妇xxxx做受| 桃花影院理论片在线| 欧美精品中文| 日本在线中文字幕一区| 中文字幕av人妻少妇一区二区| 成人日韩精品人妻久久一区| 久久精品国产视频在热| 最近日本中文字幕免费完整| 亚洲色图视频在线观看网站| 午夜麻豆视频在线观看| 国产麻花豆剧传媒精品mv在线| 性色av一区二区三区| 国产哟交泬泬视频在线播放| 国产精品午夜高潮呻吟久久av| 亚洲视频专区一区二区三区| 国产精品欧美久久久久久日本一道| 国产av无码专区亚洲av| 久久99久久99精品观看| 亚洲精品中文字幕导航| 少妇被粗大的猛烈进出免费视频| 免费网站国产| 国产人妖一区二区av| 日韩免费视频| 国产午夜精品一区二区三区不卡| 欧美成人高清手机在线视频| 国产三级国产精品国产专播| 九色综合九色综合色鬼| 18无码粉嫩小泬无套在线观看| 免费精品美女久久久久久久久久| 国产精品高清免费在线| 亚洲成a人片在线观看无码专区| 欧美日韩视频在线第一区| 精品人妻VA出轨中文字幕| 亚洲一区二区三区最新视频| 国产精品美女一区二区视频| 免费a级毛片无码a| 国产一区二区三区高清视频| 精品视频手机在线免费观看|