亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的慢性阻塞性肺病與哮喘-慢性阻塞性肺疾病重疊分類

        2019-08-01 08:59:18許飛飛俊2宋亞男2菲3謝惠敏4陳廣飛
        關(guān)鍵詞:分類特征模型

        許飛飛,應(yīng) 俊2,宋亞男2,齊 菲3,謝惠敏4,陳廣飛

        慢性阻塞性肺病(Chronic Obstructive Pulmonary Disease,COPD)和哮喘類阻塞性氣道疾病(Obliterative Airway Disease,OAD)是造成嚴(yán)重疾病負(fù)擔(dān)和影響生活質(zhì)量的常見慢性肺病。盡管COPD和哮喘在炎癥模式、免疫機(jī)制和氣流阻塞的可逆性程度不同,但仍有大量COPD和哮喘患者表現(xiàn)出相似的臨床癥狀。哮喘通常表現(xiàn)為間歇性和可逆性的氣道阻塞,而COPD則是進(jìn)行性和不可逆轉(zhuǎn)的。COPD和哮喘合并癥稱為哮喘-慢性阻塞性肺疾病重疊(asthma-COPD overlap,ACO),其發(fā)病率隨著年齡增長而升高[1]。因此,ACO的診斷和治療變得尤其重要[2]。與單純患有慢性阻塞性肺炎或哮喘的患者相比,哮喘-慢性阻塞性肺疾病重疊患者急性發(fā)作更頻繁,生活質(zhì)量更差,肺功能下降更快,死亡率更高,醫(yī)療成本更高[3]。慢阻肺、哮喘及ACO均為異質(zhì)性疾病,在病因、病理改變及臨床表現(xiàn)存在較多相似之處。Soriano認(rèn)為[4],COPD和哮喘之所以難以區(qū)分,是因為某些癥狀只是疾病發(fā)展過程中的一部分,存在較多相似特征,而且沒有判定相應(yīng)治療措施與預(yù)后是否一致的標(biāo)準(zhǔn),因此如何辨別ACO與單純患有COPD是呼吸科研究的熱點。雖然研究表明,COPD與哮喘-慢性阻塞性肺疾病重疊在肺功能、臨床特征、肺活量測定、胸部CT掃描、6MWD、SGRQ等特征上存在統(tǒng)計學(xué)差異,但是以上特征不能單獨作為哮喘-慢性阻塞性肺疾病重疊與COPD患者分類的依據(jù)。

        本文假設(shè)在原有的臨床特征中存在與疾病診斷相關(guān)的潛在關(guān)聯(lián),這種潛在關(guān)聯(lián)可以建立一個穩(wěn)健的模型來提供計算機(jī)化的臨床決策支持。深度學(xué)習(xí)方法可以發(fā)現(xiàn)高維數(shù)據(jù)潛在的相關(guān)性,深度信念網(wǎng)絡(luò)(Deep Belief Networks,DBNs)是深度學(xué)習(xí)方法中最成功的一種結(jié)構(gòu),其良好的特征提取能力在影像和語音識別中均得到很好的體現(xiàn)[5-6]。DBNs是一種高度復(fù)雜的非線性特征提取器,其隱藏單元的每一層都能從原始輸入數(shù)據(jù)中學(xué)習(xí)并捕獲更高級的特征[7]。因此,本文利用大量的臨床數(shù)據(jù)樣本,使用DBNs算法和支持向量機(jī)算法構(gòu)建COPD和ACO的鑒別診斷模型,為臨床診斷提供參考。

        1 數(shù)據(jù)與方法

        1.1 數(shù)據(jù)來源

        本文研究數(shù)據(jù)來自美國國家心臟、肺與血液研究機(jī)構(gòu)(NHLBI)建設(shè)的COPDGene數(shù)據(jù)庫。根據(jù)給定的數(shù)據(jù)將研究對象分為單純COPD組(2 919例)和哮喘-慢性阻塞性肺疾病重疊組(1 116例)。參與研究受試者的數(shù)據(jù)項總計為361項,包括人口信息學(xué)、病史、臨床評估量表、檢驗、體格檢查等[8]。

        1.2 研究方法

        本研究使用的COPDGene數(shù)據(jù)集包含361項特征,除去數(shù)據(jù)缺失較大的特征后剩余320項特征。使用10折交叉驗證(10FCV)的方法將數(shù)據(jù)集隨機(jī)分成10份,其中90%作為訓(xùn)練樣本,10%作為預(yù)測樣本。為提高模型對疾病分類的準(zhǔn)確性,使用Fisher評分法對特征進(jìn)行選擇,即計算特征的Fisher評分值來表示特征對分類結(jié)果敏感程度[9]。根據(jù)評分值由高到低選擇4個特征子集,分別是評分值前320、240、120、80個的特征子集,根據(jù)模型的準(zhǔn)確率來選擇合適的特征子集。研究方法主要有以下2個數(shù)學(xué)模型。

        一個是支持向量機(jī)模型(SVM)。支持向量機(jī)是基于不同核的一種機(jī)器學(xué)習(xí)算法。本研究使用了線性核(SVM-linear)、多項式核(SVM-polynomial)、徑向基函數(shù)核(SVM-radial basis function)和sigmoid核(SVM-sigmoid)4種核,根據(jù)模型分類準(zhǔn)確率和ROC曲線2個評價指標(biāo)選擇適合的核構(gòu)建支持向量機(jī)模型。

        另一個是深度信念網(wǎng)絡(luò)模型(DBNs)。深度信念網(wǎng)絡(luò)是深度學(xué)習(xí)中最常見的一種架構(gòu)。對于一個實際問題,為找到合適結(jié)構(gòu)的DBNs,需要確定隱藏層層數(shù)和每一隱藏層節(jié)點的數(shù)量,可見層節(jié)點數(shù)量等同于輸入特征數(shù)量。本文構(gòu)建了3個結(jié)構(gòu)不同的3層DBNs,隱藏層節(jié)點數(shù)分別為50-50、100-50及100-100,根據(jù)模型分類準(zhǔn)確率選擇合適的結(jié)構(gòu)構(gòu)建DBNs模型。

        2 結(jié)果與分析

        2.1 特征選擇和模型參數(shù)選擇

        特征選擇后,DBNs模型分類準(zhǔn)確率結(jié)果如表1所示。使用Fisher評分值的前160個特征作為DBNs模型的輸入所得的準(zhǔn)確率最高,因此選用這160個特征作為SVM模型和DBNs模型的輸入特征。圖1是3種隱藏單元結(jié)構(gòu)的DBNs模型在不同迭代次數(shù)下2種疾病的分類準(zhǔn)確率,顯示不同結(jié)構(gòu)的DBNs模型的分類準(zhǔn)確率,50-50隱藏單元結(jié)構(gòu)的DBNs模型準(zhǔn)確率高于100-50和100-100,因此選擇50-50隱藏單元結(jié)構(gòu)構(gòu)建最終的DBNs模型。

        表1 特征選擇后DBNs模型的準(zhǔn)確率

        圖1 不同結(jié)構(gòu)隱藏單元的DBNs模型在不同迭代次數(shù)下COPD和ACO分類準(zhǔn)確率

        2.2 模型構(gòu)建結(jié)果

        使用訓(xùn)練樣本構(gòu)建支持向量機(jī)模型和深度信念網(wǎng)絡(luò)模型,通過預(yù)測樣本計算模型的準(zhǔn)確率、靈敏度(表示預(yù)測樣本中COPD被劃分對的比例)和特異度(表示預(yù)測樣本中ACO被劃分對的比例),見表2,得到ROC曲線(圖2)。從表2看出,DNBs準(zhǔn)確率最高(為93.56%),4種不同核的支持向量機(jī)算法準(zhǔn)確率均未達(dá)到90%。在預(yù)測樣本中,COPD識別率(Sensitive)最高為DBNs模型(95.21%),而SVM模型最高為89.73%,ACO識別率(Specificity)最高仍為DBNs模型(89.29%),對應(yīng)SVM模型最高為74.11%。圖2顯示了5個模型受試者工作特征曲線(ROC),DBNs模型的ROC曲線最靠近左上角并且完全處于4種不同核的支持向量機(jī)模型ROC曲線之上,說明DBNs模型分類性能要高于支持向量機(jī)模型。

        表2 DBNs和4種不同核的SVM的分類準(zhǔn)確率、靈敏度和特異度

        圖2 DBNs和4種核的SVM的ROC曲線

        2.3 特征重要性排序

        COPDGene數(shù)據(jù)庫包含了研究受試者在臨床、生理學(xué)、影像學(xué)、生物學(xué)等多方面的數(shù)據(jù)。從DBNs模型中計算出敏感度前10的特征,它們來自COPDGene數(shù)據(jù)庫5個不同的量表,分別是吸煙狀態(tài)量表、CT影響結(jié)果量表、臨床診斷量表、健康狀態(tài)量表和肺功能量表。10個特征包括5類指標(biāo),其中1個屬于吸煙狀態(tài)(Duration_Smoking),3個屬于CT影像結(jié)果(TLC_CT,Slicer_IntensityMean_Ex,Vida_15perc_Exp),2個屬于臨床診斷(BronchDxByDr,SleepApStillHav),2個屬于健康狀態(tài)(distwalked,SF36_PF_t_score),還有2個屬于肺功能(pre_FEV1,pre_FVC)。應(yīng)用統(tǒng)計分析的方法,分類變量用Pearson x2檢驗,數(shù)值型變量用t檢驗,10個特征在COPD和ACO中有明顯的統(tǒng)計學(xué)差異,p值小于0.05。通過假設(shè)檢驗,發(fā)現(xiàn)這10個敏感特征存在不同的分布。

        表3 COPD與ACO分類前10個相對重要特征的分布

        3 討論

        本文首次使用DBNs提出了一種ACO與COPD鑒別診斷的新方法,并且與支持向量機(jī)模型在準(zhǔn)確率、靈敏度、特異度和ROC曲線上進(jìn)行了比較。結(jié)果顯示,DBNs模型的分類性要好于支持向量機(jī)模型,證明DBNs模型能從數(shù)據(jù)集中學(xué)習(xí)到本質(zhì)特征。與傳統(tǒng)的危險因素分析臨床意義不同,DBNs模型預(yù)測變量的重要性大小反映的是對應(yīng)指標(biāo)在區(qū)分這2種疾病時對模型的貢獻(xiàn)程度,即排序越靠前的預(yù)測變量就越有助于使用模型來區(qū)分這2種疾病。

        在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的眾多應(yīng)用中會遇到高維數(shù)據(jù)的問題,常見的方法是用降維來選擇最敏感的特征[10-11]。高維增加了數(shù)據(jù)處理的時間和空間要求,基于存在不相關(guān)或冗余的特征,學(xué)習(xí)方法往往會過度擬合,模型變得難以解釋。選擇本文中的320個特征中Fisher評分較高的特征作為DBNs模型的輸入向量,結(jié)果表明,使用Fisher評分篩選特征后建立的DBNs模型能獲得更高的準(zhǔn)確率。

        高水平的多元特征可能與疾病的某些特點有關(guān),并且可以使用這些特征建立一個復(fù)雜的數(shù)據(jù)驅(qū)動模型對疾病進(jìn)行分類。本文構(gòu)建的參數(shù)最優(yōu)化的DBNs模型找到的敏感因素與臨床先驗知識保持了一定的一致性。在評價本文的優(yōu)缺點時,將DBNs與SVM進(jìn)行了比較。對于這個二分類問題,DBNs的準(zhǔn)確率高達(dá)93.56%,靈敏度高達(dá)95.21%,特異度為89.29%;而4種典型支持向量機(jī)模型的最高準(zhǔn)確率為85.40%,靈敏度最高為89.73%,特異度為74.11%,說明相比于支持向量機(jī)這個傳統(tǒng)機(jī)器學(xué)習(xí)模型,DBNs具有更好的分類能力。

        本文利用DBNs模型確定與COPD疾病有關(guān)的敏感特征。DBNs模型輸出的預(yù)測重要性前10的變量包括受試者的CT影像結(jié)果、臨床診斷、健康狀態(tài)、吸煙情況以及肺功能,這些特征與COPD和ACO的病因密切相關(guān)[12-15],說明DBNs模型發(fā)現(xiàn)的敏感特征與目前ACO臨床診斷的主要因素是一致的。此外,描述性分析結(jié)果表明,COPD與ACO在前10個敏感特征上存在統(tǒng)計學(xué)差異。通過DBNs模型提取的特征可以有效區(qū)分這2種癥狀相似的疾病。本文確定的前10個敏感特征指出內(nèi)科醫(yī)生在對COPD或ACO患者進(jìn)行診斷時,不僅要考慮生化檢查、實驗室檢查和影像數(shù)據(jù),還要考慮流行病學(xué)因素、健康狀況甚至個人習(xí)慣。

        4 結(jié)語

        研究結(jié)果表明,使用肺功能、疾病狀況、人口統(tǒng)計學(xué)數(shù)據(jù)和健康狀況數(shù)據(jù)多種類型的特征建立的深度信念網(wǎng)絡(luò)模型可以有效區(qū)分COPD和ACO。與COPD和ACO分類相關(guān)的敏感特征與臨床診斷策略具有較好的一致性,有助于更好地了解成人慢性阻塞性肺病和哮喘-慢性阻塞性肺疾病重疊的病因和癥狀。由于COPD和ACO在治療方法和發(fā)病率及死亡率方面都不同,所以這2種疾病的鑒別診斷十分重要。借助深度學(xué)習(xí)方法,COPD和ACO的預(yù)防及個體化治療可以提高患者的生活質(zhì)量和潛在生存率。本文建立的DBNs模型能夠?qū)崿F(xiàn)較高的判斷準(zhǔn)確率,表明深度學(xué)習(xí)模型有望成為診斷決策的輔助工具。

        猜你喜歡
        分類特征模型
        一半模型
        分類算一算
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        如何表達(dá)“特征”
        不忠誠的四個特征
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        抓住特征巧觀察
        中文字幕亚洲入口久久| 国产成人一区二区三中文| 中文乱码字慕人妻熟女人妻| 欧美老妇与禽交| 国产对白刺激在线观看| 最新天堂一区二区三区| 亚洲av国产av综合av卡| 久久久久久久性潮| 亚洲AV无码一区二区三区少妇av| 久久久人妻精品一区bav| 三级做a全过程在线观看| 韩日美无码精品无码| 中国产无码一区二区三区| 成年网站在线91九色| 国产一精品一av一免费| 久久免费视频国产| 最新亚洲av日韩av二区一区| 日本人妻免费一区二区三区| 97高清国语自产拍| 国产成人美女AV| 中文字幕亚洲综合久久久| 色多多性虎精品无码av| 日本丰满熟妇videossex8k| 国产精品亚洲综合久久婷婷| 风韵丰满妇啪啪区老老熟女杏吧| 国产人妖伦理视频在线观看| 国产av国片精品jk制服| 免费特级黄毛片| 97国产精品麻豆性色| 一区二区三区观看视频在线| 国产激情视频在线观看的 | 日韩肥臀人妻中文字幕一区| 无码中文字幕免费一区二区三区| 日韩AV无码一区二区三区不卡毛片| 在线偷窥制服另类| 一区二区视频在线国产| 亚洲中文字幕成人无码| 国产91色在线|亚洲| 国产一区二区三区在线爱咪咪| 国产精品福利一区二区| 波多野结衣aⅴ在线|