亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的醫(yī)學(xué)影像數(shù)據(jù)的瑕疵及對(duì)策

        2022-03-06 06:13:08任曉麗
        醫(yī)療裝備 2022年3期
        關(guān)鍵詞:深度模型

        任曉麗

        山西醫(yī)科大學(xué)汾陽(yáng)學(xué)院 (山西汾陽(yáng) 032200)

        近年來(lái),隨著數(shù)據(jù)的劇增、算法的不斷優(yōu)化及計(jì)算能力的迅猛提高,大規(guī)模的神經(jīng)網(wǎng)絡(luò)逼近不同函數(shù)及大數(shù)據(jù)擬合成為可能。深度學(xué)習(xí)(deep learning,DL)融入醫(yī)學(xué)影像數(shù)據(jù),逐步涌現(xiàn)出了各種輔助診斷、預(yù)后預(yù)測(cè)和決策分析的智能模型[1]?;卺t(yī)學(xué)影像智能計(jì)算是目前智慧醫(yī)療領(lǐng)域的研究熱點(diǎn)[2],相應(yīng)的產(chǎn)品也已落地,相關(guān)文獻(xiàn)[3]全面分析了使用DL 技術(shù)為新型冠狀病毒肺炎診斷所開(kāi)發(fā)的系統(tǒng)應(yīng)用?;贒L 醫(yī)學(xué)影像正逐步邁向智慧醫(yī)療下精準(zhǔn)診斷的環(huán)節(jié),期間也存在尚待解決的些許問(wèn)題。

        1 DL 概述

        DL 是先進(jìn)的機(jī)器學(xué)習(xí)(machine learning)方法,以數(shù)據(jù)驅(qū)動(dòng)方式分析任務(wù),針對(duì)特定問(wèn)題的大規(guī)模數(shù)據(jù)集自動(dòng)學(xué)習(xí)數(shù)據(jù)特性,從訓(xùn)練數(shù)據(jù)中選擇正確的特征,最后在測(cè)試數(shù)據(jù)中做出正確決策。其中深度模型是手段,特征學(xué)習(xí)是目的。迄今為止在醫(yī)學(xué)影像領(lǐng)域,國(guó)內(nèi)外學(xué)者主要就MRI、CT、X 線、超聲、正電子發(fā)射計(jì)算機(jī)斷層顯像(positron emission tomography,PET)、病理、光學(xué)圖像等開(kāi)展了DL研究工作[4]。

        1.1 DL 算法機(jī)理

        DL是具有多層非線性處理單元的神經(jīng)網(wǎng)絡(luò)[5],基礎(chǔ)模型主要是深度神經(jīng)網(wǎng)絡(luò),從函數(shù)逼近論的角度講,深度神經(jīng)網(wǎng)絡(luò)是一個(gè)多層復(fù)合函數(shù)。理論上任意一個(gè)多元函數(shù)可以表示成若干個(gè)單變量函數(shù)的復(fù)合,這是機(jī)器學(xué)習(xí)中通過(guò)深度神經(jīng)網(wǎng)絡(luò)來(lái)逼近任意高維函數(shù)的理論依據(jù),故可基于多層次的“神經(jīng)元”結(jié)構(gòu),采用多隱層,進(jìn)行分層非線性映射學(xué)習(xí)。其中非線性激活函數(shù)為最終擬合函數(shù)生成基函數(shù),訓(xùn)練神經(jīng)網(wǎng)絡(luò)就是在學(xué)習(xí)這些基函數(shù),通過(guò)數(shù)量眾多的激活函數(shù)的線性變換及復(fù)合來(lái)逼近非常復(fù)雜的函數(shù),由此解決了人工設(shè)計(jì)基函數(shù)的困惑。

        1.2 DL 主要優(yōu)勢(shì)

        DL將特征提取融入算法,省去了傳統(tǒng)機(jī)器學(xué)習(xí)中手工提取的步驟,直接的好處在于,從原始輸入到最終輸出無(wú)需人工設(shè)計(jì)模塊,模型根據(jù)數(shù)據(jù)自動(dòng)調(diào)節(jié)的空間變大,模型的整體契合度增加。DL借助多層函數(shù)(或深度)復(fù)合的多次變換,將樣本在原空間的特征表示變換到一個(gè)新特征空間,通過(guò)逐層特征變換,自動(dòng)提取不同空間的“特征”,進(jìn)而發(fā)現(xiàn)高維數(shù)據(jù)中的復(fù)雜結(jié)構(gòu),從輸入端的數(shù)據(jù)直接得到輸出端的結(jié)果,是一種端到端的學(xué)習(xí)方法。其中卷積神經(jīng)網(wǎng)絡(luò)憑借強(qiáng)大的特征自動(dòng)提取功能,成為DL的一個(gè)重要組成部分[6],傳統(tǒng)CNN由輸入層、卷積層和池化層的組合、全連接層及輸出層構(gòu)成,如圖1所示。深度神經(jīng)網(wǎng)絡(luò)具有不同的體系結(jié)構(gòu)和拓?fù)?,適合某些特定的應(yīng)用程序[7],目前有關(guān)醫(yī)學(xué)圖像分割的DL最新研究大多數(shù)都依賴于U-Net網(wǎng)絡(luò),針對(duì)不同的分割任務(wù),網(wǎng)絡(luò)結(jié)構(gòu)也有相應(yīng)的更改[8]。

        圖1 傳統(tǒng)CNN 結(jié)構(gòu)圖

        2 醫(yī)學(xué)影像數(shù)據(jù)在DL 中的不完備性

        當(dāng)前醫(yī)療中高達(dá)90% 的數(shù)據(jù)來(lái)自醫(yī)學(xué)影像,影像歸檔和通信系統(tǒng)(picture archiving and communications system,PACS)融合了不同設(shè)備(如MRI、CT、超聲等圖像)的數(shù)據(jù),并進(jìn)行統(tǒng)一存儲(chǔ)、管理。醫(yī)學(xué)數(shù)字成像與通信標(biāo)準(zhǔn)(digital imaging and communication in medicine,DICOM)定義了臨床影像數(shù)據(jù)交換的格式,其發(fā)展和完善為醫(yī)學(xué)影像的發(fā)展創(chuàng)造了新的契機(jī)。據(jù)不完全統(tǒng)計(jì)影像數(shù)據(jù)的年增長(zhǎng)率高達(dá)30%之多[5],總量已然達(dá)到“5V”數(shù)據(jù),即大量(volume)、高速(velocity)、多樣(variety)、價(jià)值(value)、真實(shí)性(authenticity)。

        醫(yī)學(xué)影像屬非結(jié)構(gòu)化數(shù)據(jù)(患者受保護(hù)類的信息屬結(jié)構(gòu)化數(shù)據(jù)),數(shù)據(jù)對(duì)象的空間關(guān)系信息及蘊(yùn)含的特異性情況具有重要的統(tǒng)計(jì)學(xué)意義,對(duì)各種疾病信息的挖掘會(huì)產(chǎn)生潛在的利用價(jià)值。DL模型“訓(xùn)練”和“驗(yàn)證”得以穩(wěn)定運(yùn)行的根本是大數(shù)據(jù),尤其是高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù),而醫(yī)學(xué)影像中數(shù)據(jù)的諸多變化及不完備因素一度成為DL在醫(yī)學(xué)領(lǐng)域發(fā)展的瓶頸。

        2.1 數(shù)據(jù)的孤立、異構(gòu)性

        由于缺乏標(biāo)準(zhǔn)約束和整體規(guī)劃,不同的醫(yī)院或醫(yī)師使用的操作系統(tǒng)的無(wú)線多址協(xié)議不同,對(duì)于不同的醫(yī)用場(chǎng)景,成像模態(tài)、掃描參數(shù)、重建卷積、質(zhì)控各不相同,以及針對(duì)特定需求的特殊設(shè)計(jì)等,諸多因素導(dǎo)致數(shù)據(jù)的廣泛異質(zhì)異構(gòu)性,如數(shù)據(jù)本身異構(gòu),表現(xiàn)為數(shù)據(jù)結(jié)構(gòu)、語(yǔ)義等差異;數(shù)據(jù)環(huán)境異構(gòu),表現(xiàn)為硬件平臺(tái)、操作系統(tǒng)、數(shù)據(jù)庫(kù)管理系統(tǒng)等差異。上述迥異性整體上使得數(shù)據(jù)信息孤立、分布漂移,制約共享。當(dāng)影像數(shù)據(jù)與疾病類型相結(jié)合時(shí),DL 在醫(yī)學(xué)影像各類任務(wù)(重建、分類、檢測(cè)、分割和配準(zhǔn)等)中,以及與一些應(yīng)用程序相關(guān)聯(lián)的任務(wù)中,面臨著大量的高度復(fù)雜性[9]。由此如何將大量不同數(shù)據(jù)提取、篩選并標(biāo)注以便捷地用于DL,是醫(yī)學(xué)影像數(shù)據(jù)處理的根本問(wèn)題。

        2.2 樣本數(shù)據(jù)分布不平衡

        不同類別的醫(yī)學(xué)影像的樣本數(shù)量差異很大,陰性和陽(yáng)性樣本數(shù)往往表現(xiàn)為陽(yáng)性明顯少于陰性。臨床病例數(shù)據(jù)規(guī)模表現(xiàn)出典型的長(zhǎng)尾分布[9],少數(shù)的常見(jiàn)疾病有足夠的數(shù)量供大規(guī)模分析,而多數(shù)疾病在臨床上的數(shù)據(jù)量缺欠。但少數(shù)樣本有時(shí)恰是DL 關(guān)注的根本。這種不平衡現(xiàn)象通常用不平衡率(imbalance rate,IR)衡量:

        式中nmaj為多數(shù)類樣本數(shù)據(jù)量,nmin表示少數(shù)類樣本數(shù)據(jù)量[10]。

        網(wǎng)絡(luò)在類別不平衡的數(shù)據(jù)中進(jìn)行訓(xùn)練,結(jié)果易偏向較大數(shù)量的類別[11],因?yàn)镈L 在關(guān)系抽取任務(wù)中,往往基于類別平衡、數(shù)據(jù)分布均勻的假設(shè)。這種天然的樣本不平衡問(wèn)題導(dǎo)致DL 在醫(yī)學(xué)影像領(lǐng)域的算法泛化能力下降。

        綜上由于醫(yī)學(xué)影像數(shù)據(jù)各異不均,且數(shù)據(jù)的采集、整理及標(biāo)注過(guò)程煩瑣且代價(jià)昂貴,使得大型標(biāo)注數(shù)據(jù)集匱乏,嚴(yán)重影響DL算法的普適性,因?yàn)闃?biāo)注數(shù)據(jù)的多少?zèng)Q定了DL擬合函數(shù)的“智能”。目前DL技術(shù)在針對(duì)新型冠狀病毒肺炎的診斷應(yīng)用中,主要挑戰(zhàn)是患者的影像數(shù)據(jù)不完整、雜亂、不明確及缺乏標(biāo)準(zhǔn)性[3]。

        3 應(yīng)對(duì)策略

        3.1 數(shù)據(jù)的采集與規(guī)范

        構(gòu)建高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù)集,有效提高DL模型的準(zhǔn)確性和魯棒性,具體如下。(1)采集:進(jìn)一步規(guī)范相關(guān)醫(yī)療系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn),以滿足DL模型對(duì)數(shù)據(jù)參數(shù)及質(zhì)量的要求,盡量覆蓋各種成像模態(tài)設(shè)備的機(jī)型、質(zhì)控指標(biāo)及疾病類型等參數(shù)變量,弱化影像多源數(shù)據(jù)的異質(zhì)性;進(jìn)一步優(yōu)化影像的采集與重建過(guò)程,對(duì)數(shù)據(jù)進(jìn)行高倍降采樣,充分利用DL技術(shù)填充未采集的數(shù)據(jù),DL技術(shù)可以突破傳統(tǒng)依靠圖像稀疏性的假設(shè),利用大量數(shù)據(jù)來(lái)優(yōu)化求解圖像重建問(wèn)題[12],替代了常見(jiàn)的基于多次迭代優(yōu)化的圖像重建的逆問(wèn)題求解算法,提高了采集效率,同時(shí)可降低噪聲、提高圖像質(zhì)量,基于數(shù)據(jù)驅(qū)動(dòng)DL的 MRI重建,重點(diǎn)在于利用深度網(wǎng)絡(luò)學(xué)習(xí)欠采樣數(shù)據(jù)到全采樣數(shù)據(jù)(k空間或圖像)的端到端映射關(guān)系[2]。(2)標(biāo)注:立足數(shù)據(jù)和場(chǎng)景需求,直接面向?qū)W習(xí)目標(biāo),利用專業(yè)醫(yī)師的領(lǐng)域量化知識(shí),如病變位置、范圍、良惡性評(píng)分等,盡量使用“金標(biāo)準(zhǔn)”進(jìn)行學(xué)習(xí)標(biāo)簽標(biāo)注(如病理、基因型、生存期等),提高標(biāo)注的準(zhǔn)確性。(3)建立數(shù)據(jù)集:建立多中心數(shù)據(jù)集,創(chuàng)新數(shù)據(jù)共享機(jī)制,建立標(biāo)準(zhǔn)的醫(yī)學(xué)影像大樣本數(shù)據(jù)庫(kù)。

        3.2 學(xué)習(xí)方法融合

        基于DL 對(duì)高維數(shù)據(jù)強(qiáng)大的特征提取能力,有機(jī)融合其他方法,具體如下。(1)深度主動(dòng)學(xué)習(xí):主動(dòng)學(xué)習(xí)即通過(guò)標(biāo)記少量的樣本獲得模型的收益最大化[13],從數(shù)據(jù)集入手,設(shè)計(jì)精妙的查詢規(guī)則,從未標(biāo)記的數(shù)據(jù)中選擇最佳樣本并查詢其標(biāo)簽[13],學(xué)習(xí)算法主動(dòng)地提出一些標(biāo)注請(qǐng)求,將經(jīng)過(guò)篩選的數(shù)據(jù)反饋給專家以備標(biāo)注,這樣可減少訓(xùn)練數(shù)據(jù)集及其標(biāo)注成本,其核心過(guò)程是篩選,有機(jī)結(jié)合深度、主動(dòng)學(xué)習(xí),將深度主動(dòng)學(xué)習(xí)應(yīng)用于醫(yī)學(xué)影像領(lǐng)域的具體工作有很多。(2)深度遷移學(xué)習(xí):適當(dāng)解脫DL 的數(shù)據(jù)獨(dú)立且分布均勻的依據(jù),將知識(shí)從源域遷移到目標(biāo)域以解決數(shù)據(jù)不足的問(wèn)題,基于網(wǎng)絡(luò)的深度遷移學(xué)習(xí),首先在原領(lǐng)域預(yù)訓(xùn)練網(wǎng)絡(luò)(如結(jié)構(gòu)、參數(shù)等),再用于目標(biāo)任務(wù)中,使其成為新的神經(jīng)網(wǎng)絡(luò)的一部分[14],即在多種類別的大規(guī)模基準(zhǔn)數(shù)據(jù)集上預(yù)訓(xùn)練網(wǎng)絡(luò),幫助網(wǎng)絡(luò)學(xué)習(xí)在目標(biāo)任務(wù)上重用的通用特征,之后在預(yù)訓(xùn)練網(wǎng)絡(luò)感興趣的目標(biāo)(對(duì)應(yīng)的標(biāo)簽數(shù)據(jù)集較少)上進(jìn)行微調(diào),遷移學(xué)習(xí)已成功應(yīng)用于某些器官的影像分析中,但其推廣還需要更多的證據(jù)[7]。

        3.3 探索基于因果表征的算法模型

        目前,機(jī)器學(xué)習(xí)主要存在于產(chǎn)生統(tǒng)計(jì)依賴性的物理機(jī)制中[15],現(xiàn)有的DL同樣依據(jù)樣本數(shù)據(jù)獨(dú)立且均勻分布的假設(shè),沒(méi)有考慮變量的因果屬性。DL關(guān)注的重點(diǎn)是學(xué)習(xí),缺乏良好的被理解的方式,故DL通常被認(rèn)為是不易解釋的“黑匣子”,與醫(yī)師依據(jù)因果關(guān)系溯源病因不同。由于目前關(guān)于模型是基于何種特征做預(yù)測(cè)的研究較少,當(dāng)模型預(yù)測(cè)結(jié)果與醫(yī)師判斷不一致時(shí),醫(yī)師就得不到有效證據(jù)的解釋[16]。醫(yī)師如要理解DL在醫(yī)學(xué)影像中的現(xiàn)實(shí)性、可行性和實(shí)用性意義[7],這種費(fèi)解確實(shí)是一個(gè)鴻溝。因此,探索基于因果關(guān)系的學(xué)習(xí)算法將有助于發(fā)現(xiàn)更豐富、更自然的醫(yī)學(xué)問(wèn)題[17]。未來(lái)的模型應(yīng)注重系統(tǒng)變量的因果生成過(guò)程,于學(xué)習(xí)中介入推理,生成基于因果性的接近醫(yī)師的診病方式,如利用因果關(guān)系的某一層級(jí)——反事實(shí)的方法賦予機(jī)器一種“想象”,當(dāng)患者的疾病與原有模板中的病例不同時(shí),可能對(duì)此自動(dòng)聯(lián)想加工,做出正確的診斷。相關(guān)文獻(xiàn)[17]使用由1 617個(gè)臨床場(chǎng)景組成的測(cè)試集,得到反事實(shí)算法性能較關(guān)聯(lián)算法有大幅提升,這有利于通常難以診斷的罕見(jiàn)病及重癥病例的檢測(cè),同時(shí)避免了基于相關(guān)性的診斷產(chǎn)生的誤差對(duì)這些病例帶來(lái)的嚴(yán)重后果??梢?jiàn)因果推理是將機(jī)器學(xué)習(xí)應(yīng)用到醫(yī)學(xué)診療中的重要元素,它可促進(jìn)統(tǒng)計(jì)依賴結(jié)構(gòu)的表象學(xué)習(xí)方法向支持干預(yù)、計(jì)劃和推理的模型改進(jìn)[15]。同時(shí)基于因果屬性的學(xué)習(xí)模型對(duì)數(shù)據(jù)集所蘊(yùn)含的規(guī)律、知識(shí)的理解,也有助于解決目前DL的弱解釋性問(wèn)題。

        4 結(jié)語(yǔ)

        醫(yī)學(xué)影像是以DL為核心的醫(yī)療人工智能最有潛力的落地領(lǐng)域[16],DL的中心任務(wù)是提取蘊(yùn)含在圖像中的信息,目前學(xué)習(xí)主要是基于數(shù)據(jù)驅(qū)動(dòng)進(jìn)行多層復(fù)合函數(shù)的擬合,其擬合的智能程度深受影像數(shù)據(jù)的諸多變化、不確定因素的制約,故需規(guī)范數(shù)據(jù)、改善采集,讓數(shù)據(jù)成為新的范式,并結(jié)合其他方法改進(jìn)算法,如在DL中有機(jī)嵌入主動(dòng)學(xué)習(xí)等方法,削弱DL對(duì)標(biāo)注數(shù)據(jù)的貪婪程度,同時(shí)鑒于現(xiàn)階段DL在數(shù)學(xué)本質(zhì)上只有“記憶”能力,沒(méi)有“理解”能力,從而探索基于因果關(guān)系的學(xué)習(xí)方法,以增強(qiáng)影像輔助診療的準(zhǔn)確性,有助于未來(lái)DL精準(zhǔn)賦能醫(yī)療,以及促進(jìn)智慧醫(yī)療距離真正落地更進(jìn)一步。

        猜你喜歡
        深度模型
        一半模型
        深度理解一元一次方程
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        深度觀察
        深度觀察
        深度觀察
        深度觀察
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        精品亚洲少妇一区二区三区| 最新四色米奇影视777在线看| 国产乱人偷精品人妻a片| 麻豆╳╳╳乱女另类| 女性女同性aⅴ免费观女性恋| 国内精品久久久久久久久久影院| 国产小屁孩cao大人| 免费观看视频在线播放| 久久中文字幕国产精品| 麻豆最新国产av原创| а√天堂8资源中文在线| 狠狠色噜噜狠狠狠狠7777米奇| 成全视频高清免费| 尤物无码一区| 自拍视频在线观看成人| 久久精品国产亚洲综合av| 东北女人啪啪对白| 成人综合网站| 初尝黑人巨砲波多野结衣| 亚洲日韩欧美一区二区三区| 日本一区二区三区的免费视频观看 | 少妇性俱乐部纵欲狂欢电影| 日日摸日日碰夜夜爽无码| 久久中文字幕av一区二区不卡| 久久久亚洲精品午夜福利| 色妞一区二区三区免费视频| 亚洲一区二区三区2021| 久久人妻无码一区二区| 欧美国产成人精品一区二区三区| 欧美成人网视频| 亚洲hd高清在线一区二区| 亚洲精品国产一二三区| 亚洲av综合久久九九| 国产精品日韩欧美一区二区区| 日韩不卡无码三区| 国产91在线播放九色快色| 中国娇小与黑人巨大交| 成人欧美一区二区三区1314| 国产一级农村无码| 男女男在线精品免费观看| 无码人妻久久久一区二区三区|