亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        影像組學及分析工具淺談

        2022-12-02 12:07:42王麗嘉
        生物醫(yī)學工程與臨床 2022年4期
        關鍵詞:特征選擇組學特征提取

        劉 鵬,王麗嘉,馬 超

        人工智能(artificial intelligence,AI)和醫(yī)學成像技術發(fā)展迅速,使得醫(yī)學圖像可轉換為適合深度挖掘的高維數(shù)據(jù)[1],影像組學(radiomics)應運而生,成為AI 領域的重要組成部分[2]。作為醫(yī)工交叉的產(chǎn)物,影像組學有著廣闊的臨床應用前景,筆者就影像組學概念及相關分析工具等展開綜述。

        1 影像組學概念

        影像組學屬于計算機輔助診斷 (computer-aided diagnosis,CAD)的范疇。2012年由荷蘭學者Lambin P等[3]提出,當時主要使用計算機體層攝影術(computed tomography,CT)數(shù)據(jù)。近幾年影像組學的概念不斷被完善,數(shù)據(jù)從CT 擴展到磁共振成像(magnetic resonance imaging,MRI)、超聲(ultrasound,US)等[4],即高通量地從影像圖像中提取并分析大量的影像學定量特征。影像組學從醫(yī)學圖像中提取特征,通過統(tǒng)計學方法建立用于疾病診斷、預后預測、療效評價的模型,以指導治療方式的選擇、實現(xiàn)個性化和精準化治療[5,6]。近年來,影像組學已用于多種疾病研究,如膠質瘤[7]、肺癌[8]、乳腺癌[9]、肝腫瘤[10]、胰腺腫瘤[11]、前列腺癌[12]等。

        2 影像組學分析流程

        影像組學分析步驟包括獲取影像數(shù)據(jù)、感興趣區(qū)(region of interest,ROI)分割、特征提取、特征選擇、模型建立與結果分析。

        2.1 獲取影像數(shù)據(jù)

        影像組學可用于CT、MRI、正電子發(fā)射計算機體層攝影術(positron emission tomography,PET)、X 射線和US 等多種模態(tài)影像數(shù)據(jù)[4],研究者要根據(jù)臨床需求選擇合適的成像方式。臨床使用的影像設備種類繁多,圖像采集和重建缺乏跨中心的標準協(xié)議,圖像的信噪比、對比度和空間分辨率等會影響形狀、直方圖、紋理和高階特征[13]?;贑T 研究發(fā)現(xiàn)體素大小對圖像特征的可重復性影響顯著,尤其是層厚,而管電壓、管電流等對圖像特征的可重復性影響較小,推薦使用1.0~2.5 mm 層厚的CT 圖像進行影像組學分析。Dercle L 等[14]統(tǒng)計了161 項影像組學研究,發(fā)現(xiàn)多數(shù)PET-CT 研究使用18F-氟代脫氧葡萄糖 (18F-fluorodeoxyglucose,18F-FDG)作為示蹤劑;40%MRI 研究中除了T1和T2序列外,還使用擴散加權成像(diffusion weighted imaging,DWI),患者數(shù)量的中位數(shù)為64,僅少數(shù)研究(9%)是多中心的。研究者可采用大隊列數(shù)據(jù)進行影像組學研究,以降低成像參數(shù)引起的誤差,也可使用相同參數(shù)影像數(shù)據(jù)的小隊列開展相關研究[15]。

        2.2 感興趣區(qū)分割

        ROI 分割是影像組學的關鍵步驟之一,需要較高的可重復率和準確度,因為影像組學特征主要是從ROI 中提取的。有手動分割、半自動分割和全自動分割3 種方式,手動分割精度高但耗時;半自動分割方法通過人機交互提高了分割速度,對邊界模糊的區(qū)域可以通過人工二次矯正以提高分割的精度;全自動分割由計算機獨立完成,重復性好、耗時短且工作量小,但對于邊界模糊的腫瘤或病變的高精確度分割較為困難[16],目前尚無通用的腫瘤或病變的自動分割工具。傳統(tǒng)自動分割方法有基于弱先驗知識的閾值、區(qū)域生長和邊緣檢測算法等,基于強先驗知識的可變形模型、多圖譜等[17]。深度學習在自動分割中展示出優(yōu)于傳統(tǒng)方法的性能,常用的圖像分割網(wǎng)絡框架包括全卷積網(wǎng)絡 (fully convolutional networks,F(xiàn)CN)、U 型網(wǎng)絡(U-net)等,已應用于腦[18]、肺[19]、胰腺[20]、前列腺[21]和多器官[22]圖像的分割。

        2.3 特征提取

        常用影像組學特征有4 類:形態(tài)特征,一階統(tǒng)計特征,紋理特征,基于濾波或變換的特征。形態(tài)特征用于描述腫瘤的幾何形態(tài),包括形狀和大小等;一階統(tǒng)計特征用來分析ROI 內的體素強度分布;紋理特征用來描繪圖像中灰度值的空間分布關系,量化腫瘤異質性,需要先提取圖像紋理特性,保存到變換矩陣(例如灰度共生矩陣)后再計算相應特征;基于濾波或變換的特征是通過對原圖進行變換后再提取變換圖像的灰度或紋理特征,常用變換方法有小波變換、高斯濾波等。見表1。

        表1 常用影像組學特征Tab.1 Features of radiomics

        國際成像生物標記物標準化倡議小組(Image Biomarker Standardization Initiative,IBSI) 提出了11種特征174 個參數(shù)作為影像組學特征提取的參考[23](表2)。紋理特征沒有明確標準,不同的研究內容所需的圖像處理方式多樣,研究人員可以根據(jù)研究需要進行圖像變換,探究不同變換下特征對研究目標的影響。

        表2 IBSI 標準化特征Tab.2 Standardization features of IBSI

        2.4 特征選擇

        影像組學提取的特征數(shù)量較多,樣本量有限時會導致預測模型出現(xiàn)過擬合并增加特征分析和模型訓練的時間,因此需要對特征進行降維以獲取與結果相關性最大、彼此相關性最小的最優(yōu)特征子集。根據(jù)數(shù)據(jù)具有的標簽(ground truth),特征選擇可以分為有監(jiān)督(有標簽)、無監(jiān)督(無標簽)和半監(jiān)督(部分標簽)3種方式[24](表3)。Parmar C 等[25]評估了14 種基于濾波的特征選擇方法對兩組肺癌患者的預測能力,其中Wilcoxon 檢驗法預測結果最好。在監(jiān)督法中,嵌入式可以同時實現(xiàn)特征選擇和模型構建,常用的如最小絕對收斂和選擇算子(least absolute shrinkage and selection operator,LASSO)[26],封裝式根據(jù)不同特征子集得到的模型性能選擇特征;特征選擇后需要重新構建模型,常用的有回歸特征消除(recursive feature elimination,RFE)等。在實際研究中,獲得完整的標簽數(shù)據(jù)較為困難,此時可以同時使用有標簽和無標簽的數(shù)據(jù)進行特征選擇,即半監(jiān)督方法[27]。無監(jiān)督方法常用的有主成分分析 (principal components analysis,PCA)、聚類等;在實際應用中,研究人員可以通過試驗不同方法以獲得最佳結果。

        表3 常用的特征選擇方法Tab.3 Methods of features selection

        2.5 模型建立與結果分析

        影像組學通常使用監(jiān)督學習算法來構建模型,即通過分析特征分布,建立從特征到目標問題的映射模型,以達到研究目的[28]。模型構建方法的選擇通常是根據(jù)研究任務及研究人員的經(jīng)驗,在模型的預測能力和解釋能力兩個方面進行權衡,最終選擇適合目標問題的方法進行建模。Parmar C 等[25]評估了12 種分類方法對兩組肺癌患者的預測能力,其中隨機森林分類器結合大多數(shù)特征選擇技術的表現(xiàn)最好,貝葉斯模型最穩(wěn)定,而在臨床研究中,通常對建立的模型有性能好、穩(wěn)定、可復現(xiàn)性高的要求。

        機器學習模型通??梢苑譃榉诸惸P秃突貧w模型。在分類任務中,可選擇邏輯回歸進行疾病的二分類;支持向量機求解劃分數(shù)據(jù)集;隨機森林分類器利用多個決策樹進行分類,通過統(tǒng)計每個決策樹的結果,選擇投票數(shù)最多的結果作為其最終結果。在生存分析任務中,可選擇比例風險回歸模型(cox proportional hazards model,Cox),該模型能同時分析眾多因素對生存期的影響。

        除了常用于分類回歸的模型外,深度學習也是重要方法,其使用多次線性加權和非線性激活函數(shù)的組合來對特征進行映射,得到目標問題。卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)可從圖像中學習特征并進行預測,不需要特征選擇。深度學習也分為監(jiān)督、半監(jiān)督和無監(jiān)督3 種方式,研究人員可自行設計CNN,也可以使用現(xiàn)有的網(wǎng)絡,如視覺幾何群網(wǎng)絡 (visual geometry group network,VGG)[29]、殘差網(wǎng)絡(residual network,ResNet)[30]等,根據(jù)數(shù)據(jù)大小,可以選擇固定參數(shù)或使用遷移學習對網(wǎng)絡參數(shù)微調。

        影像組學的目標是得到一個高精度和高效率的預測模型,模型計算結果和泛化性等需要通過性能指標來衡量,因此需要數(shù)據(jù)來訓練和驗證模型(內部驗證),通常使用交叉驗證的方法優(yōu)化模型,也可提供其他來源數(shù)據(jù)評估模型的準確度(外部驗證)。在分類任務中,性能指標包括受試者工作特性(receiver operating characteristic,ROC)曲線和曲線下面積(area under curve,AUC)等,其中AUC 越接近1 說明結果越好。也可使用臨床相關指標,如準確度、靈敏度、特異度等。對于預測風險比和生存曲線等任務,主要衡量一致性指數(shù),即比較觀察結果與預測結果之間的一致性,越接近1 說明結果越好。生存分析還可繪制Kaplan-Meier(KM)曲線,通過對數(shù)秩檢測(Log-rank test)等方法進行評估[31]。

        3 影像組學分析工具

        多個研究小組開發(fā)了軟件/工具包用于影像組學研究(表4)。ITK-SNAP 是一款醫(yī)學圖像處理軟件,能對數(shù)據(jù)可視化和分割,支持多種格式的數(shù)據(jù),如醫(yī)學數(shù)字成像與通信 (digital imaging and communications in medicine,DICOM)、神經(jīng)成像信息技術倡議(neuroimaging informatics technology initiative,NiFTI)、近原始光柵數(shù)據(jù)(nearly raw raster data,NRRD)、可視化工具箱(visualization Tool kit,VTK)等,對計算機配置要求較低,軟件提供了手動和自動分割方式。自動化方法使用的是可調參數(shù)的活動輪廓方法,在冠狀面、矢狀面及橫斷面三個方向上進行分割并可以三維顯示。三維slicer 可在Linux、MacOSX 和Windows 等多種操作系統(tǒng)上使用,支持DICOM、NiFTI、NRRD、VTK、位圖(Bitmap,BMP)等格式;同樣支持三個方向的分割,可實現(xiàn)配準及二維、三維和四維數(shù)據(jù)集的可視化功能,其半自動分割方法有追蹤相同強度值、區(qū)域生長、選定閾值等;其擴展的PyRadiomics 包可用于圖像特征的提取。影像標記物開發(fā)軟件(imaging biomarker explorer,IBEX) 使用MATLAB 和C/C++編程語言開發(fā),可以在Windows 系統(tǒng)和1 GB 內存的計算機上運行,支持DICOM 和Pinnacle 數(shù)據(jù),能構建特征集,方便用戶進行特征提取,支持在三個方向上的分割,但不能顯示三維結果。LIFEx 可以從PET、單光子發(fā)射計算機體層攝影術 (single-photon emission computed tomography,SPECT)、MRI、CT 和US 圖像或任何成像模式的組合中計算紋理和形狀特征,使用該軟件不需要任何編程技能,適用于Windows、Linux 和Mac 操作系統(tǒng),支持DICOM、NiFTI、聯(lián)合圖像專家組(joint photographic experts group,JPEG)、標簽圖像文件格式(tag image file format,TIFF)、可移植網(wǎng)絡圖形格式(portable network graphic format,PNG)和BMP 等格式的數(shù)據(jù)。MaZda 是一個廣泛用于圖像分析任務的二維和三維圖像紋理分析軟件,包括簡單的輪廓工具和一些用于特征降維及分析的工具。長庚圖像紋理分析工具(Chang Gung image texture analysis,CGITA)是長庚紀念醫(yī)院研究人員基于MATLAB 開發(fā)的紋理分析軟件,可用于分子影像、CT、MRI 數(shù)據(jù)的分析。PyRadiomics 是一個開源python 包,可擴展到其他軟件,旨在為影像組學分析建立一個參考標準,并提供一個經(jīng)過測試和維護的易于重復的特征提取平臺。特征探索者(FeAture Explorer,F(xiàn)AE)由華東師范大學上海市磁共振重點實驗室開發(fā),可用于影像組學特征提取及模型參數(shù)的建立,支持NiFTI 格式文件,其提供了一個超參數(shù)探索平臺,包括多種數(shù)據(jù)處理方法及模型建立方法,方便研究人員橫向比較不同方法在處理特定數(shù)據(jù)時的效果。

        表4 影像組學分析開源軟件/工具包Tab.4 Open source softwares/toolkits of radiomics analysis

        3.1 分割工具

        選擇分割工具首先要確定軟件支持的數(shù)據(jù)格式和ROI 保存格式,確保數(shù)據(jù)的成功導入和保存;其次,軟件界面應簡潔友好,以便用戶能快速正確地進行相應操作;另外,軟件對計算機的硬件配置需求也在考慮范圍內[40]。分割工具使用流程如圖1所示。

        ITK-SNAP 是應用廣泛的ROI 分割軟件,對計算機要求較低,操作簡便,且支持保存的格式較多,圖2展示了ROI 分割具體操作流程。

        3.2 特征提取工具

        影像組學特征提取時首先要確定特征數(shù)量及類別,選擇特征提取工具時應考慮是否能導入相應的圖像和ROI 格式,還要注意結果的保存格式和對計算機的配置要求等。不同軟件之間特征的命名及計算方式不盡相同,即便在使用同一軟件進行特征提取時,研究人員也應確認其使用的參數(shù)是否相同。

        FAE 兼具特征提取及建模工具,包括特征提取、數(shù)據(jù)清洗、模型建立和結果描述4 個模塊。圖3展示了其特征提取功能,在導入數(shù)據(jù)前,每例數(shù)據(jù)需要把原始圖像和ROI 圖像放在一個單獨文件夾中。FAE 可選擇圖像的變換及特征類型,結果保存為數(shù)據(jù)表格形式,進一步分析前需手動添加標簽信息來標記臨床結論或分類。

        3.3 建模及數(shù)據(jù)分析

        影像組學提取的特征較多,但并不是所有提取的特征都對研究任務有意義,因此數(shù)據(jù)分析和任務模型建立是重要的步驟。FAE 軟件有多種數(shù)據(jù)處理和建模方法可供選擇,圖4為模型建立模塊,F(xiàn)AE 對不同的建模方法進行組合以橫向比較各方法的效果,建模結果保存為字符分隔值 (comma-separated values,csv)格式文件。

        3.4 結果展示和分析

        模型結果的好壞需要通過性能指標來衡量。圖5展示了FAE 對分類模型結果的描述,以表格方式顯示了不同模型在訓練集、驗證集和獨立測試集上的臨床指標(如AUC、靈敏度、特異度等),并展示了ROC曲線及不同模型的AUC 比較,以及特定模型的特征貢獻程度。同時FAE 以csv 格式保存了模型建立過程中的所有中間結果,從而允許研究者進行后續(xù)的分析。

        4 影像組學質量評估及挑戰(zhàn)

        統(tǒng)一的評價標準和報告準則可以有效地提高影像組學模型的質量和準確度。Lambin P 等[6]提出了影像組學質量評分(radiomics quality score,RQS)來評估研究結果,其包含16 個評分準則,滿分36 分。目前有多個組織正努力構建影像組學研究的標準化,如前文所述的IBSI 為影像組學特征提供標準定義、命名和計算方法、報告指南等。另外有定量成像網(wǎng)絡[41]、北美放射學會、定量成像生物標志物聯(lián)盟[42]、中國醫(yī)學影像AI 產(chǎn)學研用創(chuàng)新聯(lián)盟等都致力于建立標準化成像協(xié)議。

        影像組學研究增長顯著,大多數(shù)影像組學的研究結果并沒有得到充分驗證,患者人群的普適性不高[43],其數(shù)據(jù)來源多為單一機構且樣本數(shù)量較少,缺乏有效的外部驗證。量大高質的數(shù)據(jù)集和共享對提高研究的有效性有巨大幫助,也是影像組學研究需要努力的方向[44]。

        對于回顧性影像組學研究,需要進行獨立的外部驗證,以保證結果的準確度;在前瞻性影像組學研究中,研究者在試驗設計時需制定完善和統(tǒng)一的影像采集標準和臨床數(shù)據(jù)搜集方案,以獲得高質量的圖像和臨床信息,避免因設計缺陷或人工失誤帶來的數(shù)據(jù)損失,提高處理效率,推薦使用標準化的電子病歷系統(tǒng)和結構化報告等,以建立數(shù)據(jù)間的有效鏈接和數(shù)據(jù)的深度挖掘。應加強學術交流,建立多中心間的合作,推動標準化成像協(xié)議發(fā)展,促進數(shù)據(jù)共享、研究過程及結果共享,以便于影像組學模型的對比和改進。

        5 總結與展望

        筆者介紹了影像組學的分析流程和相關軟件,旨在使研究人員能便捷地開展影像組學研究,還有許多影像組學分析軟件沒有涉及,且每個軟件都有各自的優(yōu)缺點,研究人員應根據(jù)實際需求進行權衡和選擇。影像組學具有廣闊的臨床應用前景,臨床醫(yī)生和影像學家應共同合作,快速掌握分析方法。當然,有條件的小組或實驗室也可以招募一些計算機領域或生物醫(yī)學工程背景的專業(yè)人員進行相關軟件的開發(fā)等,以提高模型的魯棒性,不斷為實現(xiàn)精準醫(yī)療和臨床實踐而努力。

        猜你喜歡
        特征選擇組學特征提取
        口腔代謝組學研究
        基于Daubechies(dbN)的飛行器音頻特征提取
        電子制作(2018年19期)2018-11-14 02:37:08
        基于UHPLC-Q-TOF/MS的歸身和歸尾補血機制的代謝組學初步研究
        Bagging RCSP腦電特征提取算法
        Kmeans 應用與特征選擇
        電子制作(2017年23期)2017-02-02 07:17:06
        聯(lián)合互信息水下目標特征選擇算法
        代謝組學在多囊卵巢綜合征中的應用
        基于MED和循環(huán)域解調的多故障特征提取
        基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
        基于二元搭配詞的微博情感特征選擇
        計算機工程(2014年6期)2014-02-28 01:26:36
        久久久男人天堂| 丰满人妻被两个按摩师| 国产精品国产三级国产专播| 国产欧美日韩一区二区三区在线 | 无码人妻久久一区二区三区免费丨| 国产农村妇女毛片精品久久 | 无码国产精品一区二区免费式直播 | 日韩麻豆视频在线观看| 日本又色又爽又黄的a片18禁| 人妻妺妺窝人体色www聚色窝| 亚洲性69影视| 精品国产日韩亚洲一区在线| 观看在线人视频| 国产色综合天天综合网| 久久99精品这里精品动漫6| 国产夫妻精品自拍视频| 国产不卡视频一区二区三区| 无码人妻精品一区二区三18禁| 日韩精品欧美激情国产一区| 亚洲av乱码一区二区三区人人 | 国产精品一区二区三区播放| 猫咪av成人永久网站在线观看| 亚洲一区二区三区偷拍女厕| 九九日本黄色精品视频| 91久久综合精品久久久综合| 国产午夜福利片| 亚洲中文欧美日韩在线人| 久久久亚洲一区二区三区| 日本熟妇人妻xxxx| 日日碰狠狠躁久久躁96avv| 久久久99久久久国产自输拍 | 国产目拍亚洲精品区一区| 国产日韩厂亚洲字幕中文| 无码ol丝袜高跟秘书在线观看 | a人片在线观看苍苍影院| 中日韩欧美成人免费播放 | 精品视频在线观看一区二区三区| av免费网站免费久久网| 人妻少妇乱子伦精品| 国产午夜福利精品| 伊人狼人激情综合影院|