亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于非局部先驗(yàn)的高維影像數(shù)據(jù)計(jì)算機(jī)輔助診斷與應(yīng)用*

        2020-06-28 10:30:40鄭茜茜侯雅文
        關(guān)鍵詞:方法模型

        鄭茜茜 陳 征 侯雅文△

        【提 要】 目的 探索基于胃腸道病變高維影像數(shù)據(jù)的計(jì)算機(jī)輔助診斷模型,特別為醫(yī)療資源匱乏地區(qū)提供胃腸腺瘤檢測(cè)的機(jī)器學(xué)習(xí)技術(shù)。方法 選取UCI Gastrointestinal數(shù)據(jù)集中76位增生或腺瘤患者的698維結(jié)腸鏡的白光影像資料。采取非局部先驗(yàn)的貝葉斯變量選擇方法進(jìn)行變量篩選,與傳統(tǒng)高維數(shù)據(jù)變量篩選Lasso方法比較,根據(jù)logistic回歸模型預(yù)測(cè)結(jié)果計(jì)算正確率、Youden指數(shù)、靈敏度和特異度,運(yùn)用該模型結(jié)果與醫(yī)生個(gè)人和團(tuán)隊(duì)診斷結(jié)果比較上述評(píng)價(jià)指標(biāo)。結(jié)果 與Lasso結(jié)果比較顯示,非局部先驗(yàn)的貝葉斯變量選擇方法能夠更為有效地篩選出預(yù)測(cè)變量,模型具有較強(qiáng)的泛化能力。與醫(yī)生和其團(tuán)隊(duì)診斷結(jié)果比較發(fā)現(xiàn),模型分類結(jié)果在正確率、Youden指數(shù)和特異度都具有最優(yōu)效果,靈敏度也優(yōu)于醫(yī)生個(gè)人水平。結(jié)論 基于非局部先驗(yàn)貝葉斯變量篩選的logistic回歸模型,運(yùn)用到計(jì)算機(jī)輔助診斷技術(shù)中,具有較好的預(yù)測(cè)性能,可為醫(yī)療診斷提供高效的決策支持。

        世界衛(wèi)生組織(WHO)將胃腺瘤定義為局部息肉病變,由異常發(fā)育的上皮細(xì)胞的管狀或絨毛狀結(jié)構(gòu)組成[1]。根據(jù)其組織學(xué)結(jié)構(gòu),Nakamura將胃息肉分為Ⅰ型和Ⅱ型(增生性息肉),Ⅲ型和Ⅳ型(腺瘤)[2]。在西半球國(guó)家,胃腺瘤的發(fā)病率在0.5%~3.75%之間,而在患胃癌風(fēng)險(xiǎn)高的國(guó)家,如中國(guó),胃腺瘤的發(fā)病率高達(dá)9%~20%[3]。胃腺瘤性息肉通常位于胃竇中,且在潛伏期無明顯癥狀,但存在腺瘤惡化的重大風(fēng)險(xiǎn),隨著腫瘤大小的增加,惡化的風(fēng)險(xiǎn)也會(huì)增加[4]。Rubio在對(duì)胃鋸齒狀腺瘤(gastric serrated adenoma)病例研究中發(fā)現(xiàn),該患者同時(shí)也是一名Lynch綜合癥患者,表明鋸齒狀腺瘤可能帶有遺傳特征[5]。腸腺瘤與胃腺瘤類似,由腺瘤發(fā)展為腺癌的情況日益受到重視,在我國(guó)呈現(xiàn)出年輕化趨勢(shì)。因此,在早期進(jìn)行胃鏡和腸鏡檢查以盡快發(fā)現(xiàn)胃腸道病變對(duì)治療有著重要意義[6]。

        醫(yī)生觀察胃腸鏡影像并做出診斷,是目前國(guó)內(nèi)醫(yī)院確診胃腸腺瘤普遍采用的診斷方式。這種主觀判斷的行為,更易受到自身專業(yè)水平和經(jīng)驗(yàn)的影響,存在誤判或遺漏細(xì)節(jié)的可能性,而計(jì)算機(jī)輔助診斷(computer-aided diagnosis,CAD)能客觀地給出參考意見[7]。近年一些CAD[8]或計(jì)算機(jī)輔助支持系統(tǒng)(computer-aided decision support systems,CADSSs)[9]應(yīng)用到疾病診斷之中,降低醫(yī)師臨床診斷的主觀性,減少誤診率和漏診率,提高診斷水平。CAD技術(shù)首先對(duì)圖像資料進(jìn)行病變特征提取,再基于提取的特征進(jìn)行統(tǒng)計(jì)建模,分類判別。其中,國(guó)內(nèi)外學(xué)者大多采用人工神經(jīng)網(wǎng)路、支持向量機(jī)等機(jī)器學(xué)習(xí)方法[10-12]。這些方法能夠在一定程度上對(duì)病變進(jìn)行判別分類。但隨著影像資料所記錄下的病變信息維度增多,如病變處的紋理、形態(tài)以及顏色等等,相對(duì)于病患樣本,這種形式的數(shù)據(jù)被視為高維數(shù)據(jù)[13],上述算法可能會(huì)導(dǎo)致過度擬合的算法失效問題。隨著數(shù)據(jù)維度由百維以內(nèi)增至千維級(jí)別時(shí),處理高維數(shù)據(jù)常用的Lasso方法同樣存在過擬合等問題。

        因此,本文基于高維數(shù)據(jù)的非局部先驗(yàn)貝葉斯變量選擇方法[14],對(duì)UCI數(shù)據(jù)庫中關(guān)于胃腸道病變的常規(guī)胃腸鏡檢查的影像資料進(jìn)行特征篩選,并通過特征變量進(jìn)行l(wèi)ogistic回歸,對(duì)比傳統(tǒng)Lasso方法和貝葉斯方法在計(jì)算機(jī)輔助診斷的有效性。對(duì)比模型預(yù)測(cè)結(jié)果、醫(yī)師診斷結(jié)果與病患真實(shí)情況的正確率、Youden指數(shù)、靈敏度和特異度指標(biāo)。

        方法介紹

        1.基本原理

        以影像數(shù)據(jù)信息為自變量,病患是否診斷為胃腸腺瘤作響應(yīng)變量,建立logistic回歸模型。對(duì)任意一個(gè)可能的模型γj(j=1,2,…,2p),后驗(yàn)概率表示為:

        2.參數(shù)先驗(yàn)

        基于局部先驗(yàn)(local prior)的貝葉斯變量選擇方法會(huì)導(dǎo)致真實(shí)模型的后驗(yàn)概率趨近于0,如intrinsic bayes factors[15],fractional bayes factors[16]和g-先驗(yàn)[17]等。Johnson和Rossell提出非局部先驗(yàn)[14],不同于local先驗(yàn)密度函數(shù)在回歸系數(shù)為零時(shí),其函數(shù)值大于零,非局部先驗(yàn)密度函數(shù)在回歸系數(shù)為零時(shí),其函數(shù)值等于零,從而篩選出最佳預(yù)測(cè)變量。通過非局部先驗(yàn)可將真實(shí)模型的后驗(yàn)概率逼近于1,使模型具有一致性。且控制假陽性率的同時(shí)保持參數(shù)的敏感性[18]。

        非局部先驗(yàn)密度有兩種形式:乘積矩先驗(yàn)(pMOM)和乘積逆矩先驗(yàn)(piMOM)。本文采用PiMOM先驗(yàn),表達(dá)式為:

        其中τ>0,為尺度參數(shù),該參數(shù)決定了密度函數(shù)在β=0周圍圖形的分散程度,r是密度函數(shù)的序(r=1,2,…),βk為模型系數(shù)βj中第k個(gè)系數(shù)值,K=|βj|,表示模型γj對(duì)應(yīng)系數(shù)總數(shù)。Nikooienejad等人通過從模型的空間先驗(yàn)中抽樣的方式以選擇合適的超參數(shù)r和τ[19]。

        3.模型空間先驗(yàn)

        4.模型后驗(yàn)概率

        結(jié)合模型先驗(yàn)、參數(shù)先驗(yàn)和模型后驗(yàn),模型后驗(yàn)概率表示為:

        Johnson和Rossell認(rèn)為由于在確定模型后驗(yàn)概率時(shí),模型的邊緣密度計(jì)算過于復(fù)雜。為了減少參數(shù)空間的維度,首先對(duì)每個(gè)模型的邊緣密度進(jìn)行Laplace近似,得到邊緣密度的近似表示:

        通過MCMC(Markov chain Monte Carlo)[12]算法最大化模型的后驗(yàn)概率,從而得到最高后驗(yàn)概率模型。利用修正的耦合檢驗(yàn)[19]驗(yàn)證MCMC算法的收斂性,從而保證通過適量的迭代次數(shù)可以得到確定的最高后驗(yàn)概率模型。

        實(shí)例分析

        1. 數(shù)據(jù)來源

        數(shù)據(jù)來自UCI數(shù)據(jù)庫(http://archive.ics.uci.edu/)常規(guī)胃腸鏡2D和3D檢查影像,共有76名患者的內(nèi)鏡影像,將其分別在白光(WL)和窄帶成像技術(shù)(NBI)兩種不同視角下觀察,本文選取白光下的影像資料進(jìn)行輔助診斷。每段影像記錄時(shí)間在30sec~1min之間,共記錄病變屬性698個(gè),包括:2D紋理特征(422個(gè))、2D顏色特征(76個(gè))和3D形狀特征(200個(gè)),其中3D形狀特征是通過SFM算法提取得到[21]。數(shù)據(jù)集包含三種病變結(jié)果:鋸齒狀腺瘤(15個(gè)),腺瘤(40個(gè))和增生(21個(gè)),鋸齒狀腺瘤和腺瘤歸為一類,增生歸為一類。

        同時(shí),數(shù)據(jù)集包含4名專家和3名初學(xué)者的臨床診斷意見(將具有8年及以上臨床經(jīng)驗(yàn)的胃腸道醫(yī)生視為專家,將具有4年及以下臨床經(jīng)驗(yàn)的胃腸道醫(yī)生視為初學(xué)者),以及樣本的真實(shí)診療情況:若是良性增生則無需手術(shù),而若是腺瘤則需要進(jìn)行手術(shù)。

        2.分析過程

        數(shù)據(jù)按照6∶4劃分訓(xùn)練集和測(cè)試集,訓(xùn)練集樣本數(shù)為45,測(cè)試集樣本數(shù)為31。將數(shù)據(jù)集的影像資料變量標(biāo)示為x1,…,x698,其中x1,…,x422表示2D紋理特征,x423,…,x498表示2D顏色特征,x499,…,x698表示3D形狀特征。首先對(duì)預(yù)測(cè)變量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,分別通過貝葉斯變量選擇方法和Lasso方法篩選最佳模型。

        白光下698個(gè)變量使用基于非局部先驗(yàn)貝葉斯變量選擇方法對(duì)訓(xùn)練集建模,選擇變量為x170,屬于2D紋理特征。將變量x170作為預(yù)測(cè)變量,病變類型作為響應(yīng)變量進(jìn)行l(wèi)ogistic回歸,結(jié)果如表1所示。截距項(xiàng)和變量的系數(shù)顯著,logistic回歸模型有效,AIC=34.278。

        表1 非局部先驗(yàn)貝葉斯方法logistic模型回歸結(jié)果

        Lasso方法共選擇出包含x170在內(nèi)的23個(gè)變量,來自2D紋理特征變量12個(gè),分別為x6,x8,x11,x12,x98,x110,x132,x133,x135,x137,x170,x218,2D顏色特征10個(gè),分別為x424,x448,x464,x465,x471,x472,x474,x475,x483,x486,3D形狀特征1個(gè),為x600。logistic回歸模型效果較差,23個(gè)預(yù)測(cè)變量系數(shù)均不顯著,且P值都為1,AIC=48。

        根據(jù)上述兩種方法的變量篩選結(jié)果,結(jié)合logistic回歸模型,分別針對(duì)訓(xùn)練集和測(cè)試集進(jìn)行預(yù)測(cè),與胃息肉的真實(shí)情況(增生為0,腺瘤為1)進(jìn)行比較,計(jì)算評(píng)價(jià)指標(biāo):正確率、Youden指數(shù)、靈敏度和特異度,如表2所示。

        表2 Lasso方法與非局部先驗(yàn)貝葉斯方法模型評(píng)價(jià)

        同時(shí),根據(jù)預(yù)測(cè)結(jié)果和真實(shí)結(jié)果,分別針對(duì)訓(xùn)練集和測(cè)試集作兩種方法的ROC曲線,如圖1所示。

        圖1 Lasso法與非局部先驗(yàn)貝葉斯法的ROC曲線

        根據(jù)上述結(jié)果,采用非局部先驗(yàn)貝葉斯方法作為計(jì)算機(jī)輔助診斷模型(記為Model),與醫(yī)生診斷結(jié)果進(jìn)行比較。在醫(yī)生診斷結(jié)果中,考慮醫(yī)生的最高、最低和團(tuán)隊(duì)決策能力。首先從4名專家中選擇出診斷準(zhǔn)確率最高的1名醫(yī)生作為該醫(yī)院的最高水平(記為Expert),從3名初學(xué)者中選擇出診斷準(zhǔn)確率最低的1名醫(yī)生作為該醫(yī)院的最低水平(記為Beginner)。綜合考慮4名專家的診斷結(jié)果,若有2人及以上的醫(yī)生認(rèn)為該病變屬于腺瘤,則專家綜合的評(píng)價(jià)結(jié)果即為需要手術(shù)(記為Average_Expert);再考慮3名初學(xué)者的診斷結(jié)果,若認(rèn)為該病變類型為腺瘤的人數(shù)超過1人,則初學(xué)者綜合評(píng)價(jià)的結(jié)果即為需要手術(shù)(記為Average_Beginner);最后考慮全部醫(yī)師的診斷結(jié)果,若有超過3人認(rèn)為該病變屬于腺瘤,則全部醫(yī)師的綜合評(píng)價(jià)結(jié)果即為需要手術(shù)(記為Average_All)。

        根據(jù)表1的計(jì)算機(jī)輔助診斷模型給出預(yù)測(cè)結(jié)果和醫(yī)生診斷結(jié)果,計(jì)算各評(píng)價(jià)指標(biāo)如表3所示。

        表3 計(jì)算機(jī)輔助診斷與醫(yī)生診斷結(jié)果指標(biāo)對(duì)比

        *:A_E表示Average_Expert,A_B表示Average_Beginner,A_A表示Average_All

        3.分析結(jié)果

        針對(duì)高達(dá)698維影像數(shù)據(jù),Lasso方法出現(xiàn)變量選擇的過擬合問題,模型泛化能力差,非局部先驗(yàn)貝葉斯方法具有更少的變量個(gè)數(shù),從訓(xùn)練集到測(cè)試集的評(píng)價(jià)結(jié)果比較如表2顯示,4個(gè)指標(biāo)均有較大提高,Lasso方法正相反,從圖1的ROC曲線也可看出,非局部先驗(yàn)貝葉斯方法泛化能力更強(qiáng)。

        計(jì)算機(jī)輔助診斷和醫(yī)生診斷對(duì)比中,如表3所示,在正確率指標(biāo)上,Model值為0.8684,相較于Expert、Beginner和A_B都有明顯優(yōu)勢(shì),與A_E和A_A水平持平,表明Model總體診斷能力較優(yōu)。在Youden指數(shù)上,Model值為0.7299,真實(shí)性最優(yōu)。在靈敏度指標(biāo)上,A_A的評(píng)價(jià)結(jié)果最優(yōu)。靈敏度數(shù)值越高表明更多的惡性樣本能被正確檢測(cè)出來??紤]到將腺瘤誤判為增生給患者帶來的嚴(yán)重性,A_E的團(tuán)隊(duì)4人投票規(guī)則設(shè)置,會(huì)增強(qiáng)靈敏度值。Model在靈敏度指標(biāo)的診斷能力相較于單人醫(yī)生更強(qiáng)。在特異度指標(biāo)上,Model和Expert的評(píng)價(jià)結(jié)果最優(yōu)。特異度數(shù)值越高表明更多的良性樣本能被正確檢測(cè)出來,模型和最高水平的醫(yī)生能夠?qū)α夹詷颖揪哂凶顑?yōu)的診斷能力,大大降低病患心理負(fù)擔(dān)。

        綜合而言,通過基于非局部先驗(yàn)的貝葉斯方法篩選出的變量,進(jìn)而建立的logistic回歸模型,其預(yù)測(cè)效果在各個(gè)指標(biāo)上都處于中等或最優(yōu)水平。表明在高維情況下,利用貝葉斯方法篩選出的變量X170解釋性強(qiáng),代表性好,具有很好的計(jì)算機(jī)輔助診斷價(jià)值。

        討 論

        本文通過基于非局部先驗(yàn)設(shè)置的貝葉斯變量選擇方法對(duì)UCI數(shù)據(jù)庫的Gastrointestinal數(shù)據(jù)集進(jìn)行實(shí)證分析,針對(duì)76段病變處的影像資料,從698個(gè)病變特征中篩選出最佳的預(yù)測(cè)變量X170(2D紋理特征)。在變量篩選方法上,對(duì)比傳統(tǒng)高維數(shù)據(jù)的Lasso方法,測(cè)試集評(píng)價(jià)結(jié)果表明非局部先驗(yàn)的貝葉斯方法更為有效、簡(jiǎn)潔。并將該模型與醫(yī)院醫(yī)生各種可能診斷配置比較結(jié)果顯示,醫(yī)生投票方式能有效地將腺瘤樣本正確分類,模型的靈敏度雖略差于醫(yī)生投票診斷結(jié)果,但明顯優(yōu)于單人的診斷;除此之外,模型預(yù)測(cè)結(jié)果可以達(dá)到與醫(yī)生投票或最好的醫(yī)生結(jié)果一致,甚至更優(yōu)。從各個(gè)指標(biāo)結(jié)果綜合分析,模型的診斷結(jié)果表現(xiàn)較好,體現(xiàn)出基于非局部先驗(yàn)設(shè)置的貝葉斯變量選擇方法的優(yōu)勢(shì),相比于其他應(yīng)用到醫(yī)學(xué)圖像判別的機(jī)器學(xué)習(xí)方法,該方法更加適用于高維的醫(yī)學(xué)影像數(shù)據(jù)。在鼓勵(lì)創(chuàng)新檢測(cè)技術(shù)與產(chǎn)品研發(fā),通過技術(shù)更新提升我國(guó)防癌體檢效率的大背景下,論文采用貝葉斯變量選擇與logistic回歸模型作為計(jì)算機(jī)輔助診斷技術(shù),有效降低醫(yī)生個(gè)體診斷的主觀性,特別針對(duì)醫(yī)療師資條件匱乏的地區(qū),達(dá)到提高診療效率的根本目的。

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        學(xué)習(xí)方法
        可能是方法不對(duì)
        3D打印中的模型分割與打包
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        一区二区三区福利在线视频| 亚洲av永久中文无码精品综合| 国产一区二区内射最近更新| 97se在线观看| 久久亚洲精彩无码天堂| 亚洲av熟女少妇一区二区三区| 琪琪色原网站在线观看| 国外精品视频在线观看免费| 超碰Av一区=区三区| 91麻豆精品久久久影院| 国产欧美在线观看不卡| 性生交大全免费看| 国产亚洲女在线线精品| 人妻熟女中文字幕av| 亚洲中国精品精华液| 久久人人玩人妻潮喷内射人人| 亚洲中文欧美日韩在线| 少妇被躁到高潮和人狍大战| 国产免费观看黄av片| 国产福利酱国产一区二区| 中文字幕第一页亚洲观看| 国产人妖在线观看一区二区三区| 亚洲精品久久激情国产片| 精品久久亚洲中文无码| 无码一区二区三区人| 国产av剧情久久精品久久| 无码视频在线观看| 日本精品a在线观看| 丝袜美腿亚洲综合玉足| 插插射啊爱视频日a级| 1000部夫妻午夜免费| 欧洲国产精品无码专区影院| 日本一区二区不卡二区| 国产成人亚洲综合无码品善网 | 国产 在线播放无码不卡| 东京热加勒比视频一区| 欧美精品videosex极品| 欧美国产亚洲日韩在线二区| 手机在线观看亚洲av| 国产狂喷水潮免费网站www| 女女女女bbbbbb毛片在线|