亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        腫瘤預后預測領域機器學習應用的文獻計量與熱點可視化分析

        2022-05-11 10:30:52王子為趙靖萱劉子琦崔祉盈閆佰薈
        醫(yī)學信息 2022年9期
        關鍵詞:研究

        李 軒,王子為,趙靖萱,劉子琦,崔祉盈,閆佰薈,李 范

        (中國醫(yī)科大學創(chuàng)新學院1,中英聯(lián)合學院2,健康管理學院3,遼寧 沈陽 110122)

        腫瘤(tumor)是機體在各種因素作用下,局部組織的細胞在基因水平上失去對其生長的正常調控,導致細胞克隆性異常增生而形成的新生物,多表現(xiàn)為占位性塊狀病變。在醫(yī)學領域,通常將其分為良性和惡性兩大類。其中,惡性腫瘤近年來已成為危害人類健康的重要疾病,其發(fā)病率和死亡率逐年上升,是全球主要死因之一,阻礙了人類期望壽命的延長,也導致了巨大的疾病負擔[1,2]。預后是指根據(jù)個人狀況和常見的病程預測疾病可能的結局。在個性化精準醫(yī)療時代,臨床醫(yī)生向患者提供準確的預后預測信息的能力變得愈加重要,準確的惡性腫瘤預后分析有助于醫(yī)患選擇合適的治療方式,從而提高腫瘤患者的生存時間與生活質量。較早的研究采用統(tǒng)計學方法評估和篩選影響腫瘤預后的相關因素。隨著信息化技術的發(fā)展,為了更好地輔助臨床醫(yī)生選擇合適的治療方法并評估療效,各種腫瘤預后預測模型應運而生[3-6]。機器學習是一門涉及概率論、數(shù)理統(tǒng)計、逼近論、算法復雜度理論等多領域的交叉學科,主要研究如何使用計算機模擬或實現(xiàn)人類學習活動,以獲取新的知識或技能,重新組織已有的知識結構并不斷改善自身的性能。作為人工智能的核心技術,對于給定數(shù)據(jù)集,機器學習能評估其中未知的相互關系,并根據(jù)識別出的關系來預測新的結果。有研究已經(jīng)證實[7,8],機器學習方法與傳統(tǒng)的統(tǒng)計學方法相比能夠做出更為準確的腫瘤診斷及預后判定。目前,國際上已積累了相當數(shù)量的采用機器學習方法構建腫瘤預后模型的科研成果,但缺乏對該領域研究概況的系統(tǒng)全面梳理。鑒于此,本研究利用PubMed 數(shù)據(jù)庫收集腫瘤預后預測領域機器學習相關的原始研究論文,通過文獻計量和共詞雙聚類分析,探討該領域研究的熱點問題和發(fā)展趨勢,以期為研究人員的后續(xù)研究提供信息支持和參考借鑒。

        1 數(shù)據(jù)與方法

        1.1 數(shù)據(jù)來源 本研究的數(shù)據(jù)來源于國際權威生物醫(yī)學文獻數(shù)據(jù)庫PubMed,通過該數(shù)據(jù)庫的主題詞途徑進行檢索,檢索策略為:"machine learning"[MeSH Terms] AND "neoplasms"[MeSH Terms] AND"prognosis"[MeSH Terms],檢索的時間范圍從PubMed 建庫至2021 年7 月,最后檢索時間為2021年7 月20 日。依據(jù)以上檢索策略,共檢索文獻898篇。然后根據(jù)納入和排除標準,對檢出文獻進行人工篩選。最終納入838 篇腫瘤預后預測領域機器學習相關的原始學術研究性論文作為本研究的文獻數(shù)據(jù)集。

        1.2 納入和排除標準 納入標準:①文獻的主題內容是應用機器學習進行腫瘤預后的預測;②文獻類型為原始學術研究性論文。排除標準:綜述、評論、通信、編者述評、新聞等非原始研究性論文。

        1.3 方法 對納入文獻的年代和主要主題詞/副主題詞進行統(tǒng)計,對高頻主要主題詞/副主題詞進行篩選,構建高頻主要主題詞/副主題詞-文獻矩陣,對矩陣進行共詞雙聚類分析,獲得矩陣中行與列的可視化聚類結果并對結果進行分析。具體操作方法:將納入文獻通過PubMed 的格式下載,然后將其導入書目共現(xiàn)矩陣構建工具(Bibliographic Item Co-Occurrence Matrix Builder,BICOMB)中,統(tǒng)計每年發(fā)文量和主要主題詞/副主題詞的頻次。篩選高頻主要主題詞/副主題詞,利用BICOMB 構建高頻主要主題詞/副主題詞-文獻矩陣,導入gCluto 軟件進行共詞雙聚類分析,獲得矩陣中行與列的可視化聚類結果,結合專業(yè)知識及相關論文剖析應用機器學習進行腫瘤預后預測的研究熱點。

        2 結果

        2.1 文獻增長趨勢 從PubMed 數(shù)據(jù)庫中共獲得腫瘤預后預測領域機器學習相關原始研究論文838 篇,2010 年-2021 年7 月PubMed 收錄的相關論文數(shù)量呈指數(shù)增長趨勢,見圖1。

        圖1 PubMed 數(shù)據(jù)庫中腫瘤預后預測領域機器學習研究論文的年代分布

        2.2 高頻主要主題詞/副主題詞 838 篇論文共標引1265 個主要主題詞/副主題詞。選取頻次在15 次及以上的主要主題詞/副主題詞作為高頻詞,共計39個,總頻次合計1323 次,占全部主要主題詞/副主題詞總頻次的33.91%,見表1。高頻詞中,“Machine Learning”(機器學習)的詞頻居于首位,頻次為228次,占全部主要主題詞/副主題詞總頻次的5.84%;“Prognosis”(預后)的詞頻為17 次,占全部主要主題詞/副主題詞總頻次的0.44%。因為本研究的主題與機器學習和預后有關,故后續(xù)不再對這2 個主要主題詞/副主題詞做特別分析,重點放在其他37 個關鍵詞及其關系的分析上。去除“Machine Learning”(機器學習)和“Prognosis”(預后)之后,詞頻位于前10 位的高頻詞分別是:“Deep Learning”(深度學習)、“Magnetic Resonance Imaging/methods”(磁共振成像/方法)、“Support Vector Machine”(支持向量機)、“Algorithms”(算法)、“Biomarkers,Tumor/genetics”(生物標志物,腫瘤/遺傳學)、“Image Interpretation,Computer-Assisted/methods”(圖像解釋,計算機輔助/方法)”、“Brain Neoplasms/diagnostic imaging”(腦腫瘤/診斷成像)、“Tomography,X-Ray Computed/methods”(斷層掃描,X 射線計算/方法)、“Neural Networks,Computer”(神經(jīng)網(wǎng)絡,計算機)。

        表1 腫瘤預后預測領域機器學習相關論文的高頻主要主題詞/副主題詞

        2.3 共詞雙聚類結果 對納入分析的37 個高頻主要主題詞/副主題詞-文獻矩陣進行雙聚類分析可視化,結果見圖2,高頻主要主題詞/副主題詞聚為6個大類:①磁共振成像的計算機輔助影像解釋方法學研究;②利用CT 影像進行肺腫瘤的病理診斷;③支持向量機在腫瘤預后預測中的應用;④計算生物學的方法學研究;⑤神經(jīng)網(wǎng)絡、統(tǒng)計模型等算法研究;⑥深度學習在腫瘤預后預測中的研究。

        圖2 高頻主要主題詞/副主題詞-文獻矩陣雙向聚類圖

        3 討論

        某一研究領域的發(fā)展趨勢一般可以通過相關論文的數(shù)量變化來反映。本研究發(fā)現(xiàn),在腫瘤預后領域應用機器學習進行預測的研究論文數(shù)量呈現(xiàn)指數(shù)上升的趨勢。尤其在2015 年后,文獻量快速增長,這可能受益于數(shù)據(jù)科學與機器學習,特別是深度學習技術的飛速發(fā)展,這些知識與技術在腫瘤預后預測領域快速滲透,進而加大了相關領域的研究力度。從表1 的高頻詞詞頻可以發(fā)現(xiàn),在腫瘤預后預測中,研究的腫瘤集中在腦腫瘤、乳腺腫瘤、肺腫瘤、前列腺腫瘤;所利用的數(shù)據(jù)多來自于磁共振成像、斷層X射線掃描、基因表達譜以及臨床病理;所使用建模的方法主要涉及深度學習、支持向量機、計算機神經(jīng)網(wǎng)絡和統(tǒng)計模型。通過聚類分析所獲得的同類高頻詞的語義關系,結合專業(yè)知識和相關論文,獲得6 個應用機器學習進行腫瘤預后預測的研究熱點。

        類1:磁共振成像計算機輔助影像解釋的方法學研究。磁共振成像對腦和脊髓、心臟、直腸、膀胱等部位檢查的敏感性和特異性優(yōu)于CT。特別在腦部檢查中,磁共振成像能獲得腦的立體圖像,很好地顯示腦腫瘤及其與周圍組織的解剖關系,在腦腫瘤的影像學檢查中的診斷和監(jiān)測價值居第1 位[9]。因此,磁共振圖像是腦部腫瘤預后預測中一個重要的依據(jù)和數(shù)據(jù)來源。腦腫瘤會表現(xiàn)出相似的磁共振影像特征,導致不能通過人工準確地判斷腦腫瘤的高、低級別。這可以通過提取磁共振圖像海量紋理特征,聯(lián)合臨床指標,構建數(shù)學模型加以解決,并通過機器學習自我完善,改善對腫瘤預后的有效評估。如Chaudhary K 等[6]將磁共振圖像上的局部紋理轉換為強度不變的局部二值模式,然后從中提取定量圖像特征,并在邏輯回歸分類器中建立惡性腫瘤預測模型,結果發(fā)現(xiàn)基于局部二值模式特征的計算機輔助系統(tǒng)性能顯著優(yōu)于使用常規(guī)紋理特征的系統(tǒng)。又如Ahammed MKV 等[10]使用基于Wndchrm 工具的分類器和VGG-19 深度卷積神經(jīng)網(wǎng)絡從磁共振圖像中自動識別神經(jīng)膠質瘤的級別,結果顯示其所提出的系統(tǒng)具有更好的性能。

        類2:利用CT 影像進行肺腫瘤的病理診斷。多項研究證據(jù)表明,CT 成像指標對肺腫瘤治療結果具有預后預測作用。如Sun Y 等[11]探討基于CT 成像的放射組學在預測純磨玻璃結節(jié)表現(xiàn)的浸潤性腺癌中的價值。研究人員從每個標記的結節(jié)中提取放射組學特征,使用訓練集中最小絕對收縮和選擇算子(LASSO)構建Rad 評分,然后進行多因素Logistic回歸分析,建立影像學模型和影像學-影像組學組合模型。并基于多變量邏輯回歸分析建立了個體預測列線圖,結果顯示基于放射組學的列線圖結合了Rad 評分、邊緣、毛刺和大小,可作為純磨玻璃結節(jié)患者浸潤性預測的非侵入性生物標志物。Yu L 等[12]利用基于CT 圖像特征的多種機器學習算法,探索可用于診斷和預測非小細胞肺癌病理分期的成像生物標志,發(fā)現(xiàn)CT 影像特征可以準確預測非小細胞肺癌患者的病理分期,并且該研究確定了可用于診斷非小細胞肺癌患者病理分期的潛在成像生物標志。

        類3:支持向量機在腫瘤預后預測中的應用。支持向量機是腫瘤預測中廣泛使用的一種機器學習方法,其原理是將數(shù)據(jù)的初始向量映射到高維空間,最終尋找到一個超平面,將標注的訓練集中的數(shù)據(jù)分成兩類,并且該超平面與類域邊界的垂直距離最大[13]。本研究發(fā)現(xiàn),支持向量機在腫瘤預后預測中有較多的應用。有研究使用最小二乘支持向量機和隨機森林算法來識別與乳腺癌細胞系對治療劑反應相關的分子特征。Yang HX 等[14]構建了8 個基于支持向量機的列線圖,用以預測食管鱗狀細胞癌術后的遠處轉移,結果發(fā)現(xiàn)以臨床病理特征和分子標志物為變量建立的支持向量機模型有助于識別術后遠處轉移高風險的食管鱗狀細胞癌患者。

        類4:計算生物學的方法學研究。生物信息學和機器學習的進步促進了基于生物信息組學的生物標志物的發(fā)現(xiàn)和驗證,本研究也發(fā)現(xiàn)研究人員開展了較多的計算生物學方法研究。研究人員從遺傳學角度出發(fā),主要利用基因表達譜、腫瘤表達調節(jié)、突變等各類數(shù)據(jù)進行各種機器學習建模,尋找腫瘤生物標志物。如van Ijzendoorn D 等[15]使用基因表達數(shù)據(jù)通過機器學習分析確定軟組織肉瘤的新型診斷和預后標志物以及治療靶點,該研究通過隨機森林算法確定了軟組織肉瘤的新診斷標志物,并用k 近鄰算法識別出一些預后基因是預測疾病結局的重要因子。Long NP 等[16]用隨機森林方法對多平臺結直腸癌的轉錄組學數(shù)據(jù)進行特征選擇,并使用隨機森林、邏輯回歸、樸素貝葉斯和k 近鄰模型對所提出的生物標志物的診斷性能進行了基準測試。

        類5:神經(jīng)網(wǎng)絡、統(tǒng)計模型等算法研究。本研究所提及的神經(jīng)網(wǎng)絡指人工神經(jīng)網(wǎng)絡,亦稱計算機神經(jīng)網(wǎng)絡,是一種模仿動物的神經(jīng)網(wǎng)絡特征,進行分布式并行信息處理的數(shù)學模型。這種網(wǎng)絡依靠系統(tǒng)的復雜程度,通過調整內部大量節(jié)點之間相互連接的關系,從而達到處理信息的目的。在腫瘤預后預測領域,神經(jīng)網(wǎng)絡是一種經(jīng)典的算法,研究人員常將其與其他統(tǒng)計模型算法進行比較。Hu SB 等[17]從電子病歷中獲得血液惡性腫瘤患者的常規(guī)生命體征和實驗室檢查數(shù)據(jù),使用神經(jīng)網(wǎng)絡算法建立預測成年住院患者臨床惡化(進入ICU 和心臟驟停)事件的模型,并將神經(jīng)網(wǎng)絡模型的性能與VitalPac 早期預警評分進行比較,結果顯示神經(jīng)網(wǎng)絡模型優(yōu)于現(xiàn)有模型,顯著提高了陽性預測值。Kuo RJ 等[18]建立了一種預測前列腺癌預后的兩階段模糊神經(jīng)網(wǎng)絡,結果表明其所提出的兩階段模糊神經(jīng)網(wǎng)絡比其他算法可以更準確地預測前列腺癌的預后。

        類6:深度學習在腫瘤預后預測中的研究。深度學習是機器學習領域中一個新的研究方向,深度學習的引入使機器學習更接近于人工智能。和其他機器學習算法相比,深度學習出現(xiàn)較晚,本研究發(fā)現(xiàn)其在腫瘤預后預測中的相關研究始于2016 年,但很快有學者開展了大量的研究,使其成為腫瘤預后預測機器學習領域研究數(shù)量最多的熱點方向,尤其是在乳腺腫瘤和前列腺腫瘤的診斷影像分析、病理學中具有較多應用。

        綜上所述,目前國際上腫瘤預后預測領域的機器學習研究快速發(fā)展,其中深度學習在該領域表現(xiàn)出最大的研究熱度。但該領域目前所研究的腫瘤主要集中在腦腫瘤、乳腺腫瘤、肺腫瘤、前列腺腫瘤,科研人員可以關注其他部位的腫瘤,充分運用機器學習的方法開展預后預測研究。

        猜你喜歡
        研究
        FMS與YBT相關性的實證研究
        2020年國內翻譯研究述評
        遼代千人邑研究述論
        視錯覺在平面設計中的應用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        關于遼朝“一國兩制”研究的回顧與思考
        EMA伺服控制系統(tǒng)研究
        基于聲、光、磁、觸摸多功能控制的研究
        電子制作(2018年11期)2018-08-04 03:26:04
        新版C-NCAP側面碰撞假人損傷研究
        關于反傾銷會計研究的思考
        焊接膜層脫落的攻關研究
        電子制作(2017年23期)2017-02-02 07:17:19
        久久一区二区国产精品| 日韩人妻系列在线视频| 国产一区二区白浆在线观看| 77777亚洲午夜久久多喷| 樱桃视频影视在线观看免费| 精品视频入口| 亚洲一本之道高清在线观看| 丝袜美腿国产一区精品| 丰满人妻一区二区三区视频53| 国产精品久久久久久久久KTV| 亚洲啪啪AⅤ一区二区三区| 亚洲黄色av一区二区三区| 又色又爽又黄高潮的免费视频| 国产第19页精品| 国产成人精品cao在线| 日韩精品中文字幕第二页 | 少妇人妻综合久久中文字幕| 精品久久无码中文字幕| 极品美女尤物嫩模啪啪| 自由成熟女性性毛茸茸应用特色| 亚洲精品无码久久久影院相关影片| 人人看人人做人人爱精品| 永久免费在线观看蜜桃视频| 国产精品女同一区二区免费站| 国产精品ⅴ无码大片在线看| 久精品国产欧美亚洲色aⅴ大片 | 国产精品视频一区日韩丝袜| 韩国黄色三级一区二区| 无码人妻精品一区二区三区蜜桃| 国产成人av 综合 亚洲| 色窝窝手在线视频| 亚洲av综合色区一区二区| 国产乱了真实在线观看| 久久久久久人妻精品一区百度网盘 | 亚洲av永久综合网站美女| 丰满人妻久久中文字幕| 自拍偷自拍亚洲精品情侣| 在线毛片一区二区不卡视频| 国产av天堂一区二区二区| 亚欧中文字幕久久精品无码| 中文字幕免费观看视频|