劉桑雪 何慧敏
摘? 要:對(duì)肺癌的分析診斷是人工智能應(yīng)用的重點(diǎn)領(lǐng)域,檢索Web of Science數(shù)據(jù)庫(kù)2012年—2021年國(guó)內(nèi)外人工智能在肺癌領(lǐng)域應(yīng)用的相關(guān)研究文獻(xiàn),通過(guò)文獻(xiàn)計(jì)量軟件CiteSpace對(duì)國(guó)內(nèi)外人工智能在肺癌領(lǐng)域應(yīng)用的研究現(xiàn)狀、熱點(diǎn)以及前沿趨勢(shì)進(jìn)行可視化分析,為人工智能在癌癥疾病領(lǐng)域的進(jìn)一步研究提供參考,推動(dòng)中國(guó)人工智能技術(shù)與腫瘤領(lǐng)域的交叉研究。
關(guān)鍵詞:人工智能;肺癌;可視化分析;文獻(xiàn)計(jì)量
中圖分類號(hào):TP391;R730.2 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2023)03-0110-04
Literature Visual Analysis of Artificial Intelligence Applied in the Field of Lung Cancer
LIU Sangxue, HE Huimin
(Guangxi Medical University, Nanning? 530021, China)
Abstract: The analysis and diagnosis of lung cancer is the key field for the application of artificial intelligence. Search the relevant research literature of the application of artificial intelligence in lung cancer field at home and abroad from 2012 to 2021 in the Web of Science database, and visually analyze the research status, hotspots and frontier trends of the application of artificial intelligence in lung cancer field at home and abroad through the bibliometric software CiteSpace, to provide reference for further research of artificial intelligence in the field of cancer disease, promote the cross research of artificial intelligence technology and tumor field in China.
Keywords: artificial intelligence; lung cancer; visual analysis; bibliometrics
0? 引? 言
人工智能利用計(jì)算機(jī)模型和算法模擬人類大腦,擁有強(qiáng)大的特征學(xué)習(xí)能力,能夠整合海量數(shù)據(jù)信息,以提高人們分析、處理信息的效率。隨著人工智能技術(shù)的成熟,其在醫(yī)學(xué)領(lǐng)域應(yīng)用逐漸加深,人工智能技術(shù)為癌癥的風(fēng)險(xiǎn)評(píng)估、臨床診斷、精準(zhǔn)治療、生存預(yù)測(cè)等方面提供快速、有效的方法手段,可以在某種程度上降低癌癥發(fā)生率和死亡率[1]。肺癌的發(fā)病率很高,是世界范圍內(nèi)致人死亡的主要疾病,準(zhǔn)確診斷對(duì)肺癌患者的治療至關(guān)重要。本文通過(guò)檢索近十年的相關(guān)文獻(xiàn),通過(guò)知識(shí)圖譜分析國(guó)際人工智能在肺癌領(lǐng)域的應(yīng)用現(xiàn)狀和發(fā)展前沿,為中國(guó)的人工智能技術(shù)在癌癥領(lǐng)域的研究和應(yīng)用提供參考。
1? 資料來(lái)源與統(tǒng)計(jì)方法
1.1? 資料來(lái)源
在Web of Science數(shù)據(jù)庫(kù)中以Artificial Intelligence、AI、Deep Learning、Machine Learning、Lung Tumors、Lung Cancer等主題詞組成檢索式檢索2012年01月01日—2021年12月31日公開(kāi)發(fā)表的關(guān)于人工智能在肺癌領(lǐng)域中應(yīng)用的相關(guān)文獻(xiàn),文獻(xiàn)類型選擇“article”,語(yǔ)種選擇“English”,通過(guò)去除重復(fù)性文獻(xiàn)和非學(xué)術(shù)性文獻(xiàn),共納入1 940篇文獻(xiàn)進(jìn)行計(jì)量分析。
1.2? 統(tǒng)計(jì)方法
應(yīng)用CiteSpace 5.8.R3進(jìn)行統(tǒng)計(jì)分析,將時(shí)間跨度設(shè)為2012年—2021年,以每一年作為一個(gè)時(shí)間切片,選擇相應(yīng)的節(jié)點(diǎn)類型分別將總體發(fā)文量、國(guó)家和機(jī)構(gòu)發(fā)文合作、作者發(fā)文合作、研究熱點(diǎn)和前沿趨勢(shì)等方面的統(tǒng)計(jì)結(jié)果可視化展示。共現(xiàn)網(wǎng)絡(luò)圖譜節(jié)點(diǎn)的大小表示該節(jié)點(diǎn)發(fā)文量的多少,節(jié)點(diǎn)之間的線條粗細(xì)表示合作強(qiáng)度,節(jié)點(diǎn)年輪外圈的顏色深淺代表中心度大小,指示該節(jié)點(diǎn)在聯(lián)系整個(gè)網(wǎng)絡(luò)中發(fā)揮的作用大小[2]。國(guó)際研究熱點(diǎn)基于高頻詞和高中心性關(guān)鍵詞來(lái)分析,研究前沿通過(guò)詞頻變化率較高的突現(xiàn)詞來(lái)反映。
2? 結(jié)果與分析
2.1? 總體趨勢(shì)分析
國(guó)際年度發(fā)文量反映該領(lǐng)域知識(shí)量增長(zhǎng)的情況。根據(jù)檢索結(jié)果,2012年—2021年發(fā)表相關(guān)文獻(xiàn)共1 940篇,呈現(xiàn)逐年增長(zhǎng)的趨勢(shì)。2012—2017年處于該研究領(lǐng)域發(fā)展的起步階段,發(fā)展平緩;2018—2021年處于快速發(fā)展階段。2012年國(guó)際發(fā)文僅21篇,2021年發(fā)文量高達(dá)730篇。
2.2? 國(guó)家與研究機(jī)構(gòu)發(fā)文分析
研究結(jié)果顯示,一共有17個(gè)國(guó)家發(fā)表關(guān)于人工智能在腫瘤領(lǐng)域的研究超過(guò)30篇,中國(guó)和美國(guó)的發(fā)文量遠(yuǎn)遠(yuǎn)高于其他國(guó)家,發(fā)文量分別達(dá)691篇和636篇。韓國(guó)發(fā)文126篇,位列第3;印度116篇,位列第4;荷蘭發(fā)文101篇,位列第5。
通過(guò)對(duì)研究機(jī)構(gòu)的分析,發(fā)文量居于首位的是中國(guó)科學(xué)院,共52篇;排第2的機(jī)構(gòu)有3家,分別是上海交通大學(xué)、復(fù)旦大學(xué)和哈佛醫(yī)學(xué)院,發(fā)文量43篇;斯隆-凱特森癌癥研究中心發(fā)文量位列第3,發(fā)文37篇。發(fā)文量前10的研究機(jī)構(gòu)中包括了6家中國(guó)研究機(jī)構(gòu)。
2.3? 國(guó)際合作分析
根據(jù)國(guó)家合作網(wǎng)絡(luò)圖譜,國(guó)際合作中心度排名前5位的國(guó)家分別為英國(guó)(0.17)、西班牙(0.14)、德國(guó)(0.13)、美國(guó)(0.11)、中國(guó)(0.10)。英國(guó)的中心度最高,表示與其他國(guó)家之間的合作關(guān)系最緊密最重要。
機(jī)構(gòu)合作中心度排名前5位的機(jī)構(gòu)分別為馬斯特里赫特大學(xué)(0.22)、上海交通大學(xué)(0.21)、拉德堡德大學(xué)(0.21)、丹娜法伯癌癥研究院(0.19)、德克薩斯大學(xué)安德森癌癥中心(0.19)。研究機(jī)構(gòu)合作網(wǎng)絡(luò)圖譜如圖1所示。
2.4? 作者發(fā)文合作分析
通過(guò)作者合作網(wǎng)絡(luò)圖譜尋找對(duì)人工智能應(yīng)用于肺癌研究領(lǐng)域有重大貢獻(xiàn)和影響力的核心作者群,如圖2所示。最高產(chǎn)作者是來(lái)自美國(guó)的Robert Gillies,其合作中心度和文獻(xiàn)被引頻次也較高。發(fā)文量排名前10的作者共有11位,其中中國(guó)作者僅有2位,分別是Wei Qian、Ming Li。
2.5? 共被引文獻(xiàn)分析
根據(jù)共被引文獻(xiàn)分析統(tǒng)計(jì),共有22篇文獻(xiàn)被引次數(shù)超過(guò)50次,其中最高被引量達(dá)157次,表1列出了被引量排名前10位的關(guān)鍵經(jīng)典文獻(xiàn)。高被引文獻(xiàn)內(nèi)容主要集中在利用深度學(xué)習(xí)方法進(jìn)行醫(yī)學(xué)圖像分析的研究。
2.6? 研究熱點(diǎn)
關(guān)鍵詞共現(xiàn)圖譜結(jié)果顯示,人工智能應(yīng)用于肺癌領(lǐng)域的內(nèi)容主要有分類、診斷、生存分析等,運(yùn)用人工智能的方法手段主要為深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)等。高頻關(guān)鍵詞和高中心性關(guān)鍵詞如表2所示。
2.7? 研究前沿
突現(xiàn)詞是短時(shí)間內(nèi)詞頻變化率較高的關(guān)鍵詞,更適合探測(cè)學(xué)科發(fā)展的新興趨勢(shì)和突然變化[3]。顯示持續(xù)至今的突現(xiàn)詞有紋理特征、圖像分類、標(biāo)志物和斷層攝影術(shù),根據(jù)強(qiáng)度排序得到近十年人工智能在肺癌領(lǐng)域Top15的突現(xiàn)詞,如圖3所示。
3? 趨勢(shì)與難題
3.1? 人工智能在肺癌中的應(yīng)用仍是當(dāng)前醫(yī)療領(lǐng)域的研究趨勢(shì)
自2012年起,國(guó)際間針對(duì)人工智能在肺癌領(lǐng)域的研究呈現(xiàn)持續(xù)增長(zhǎng)的趨勢(shì)。統(tǒng)計(jì)發(fā)現(xiàn),肺癌為排名第1的高頻關(guān)鍵詞,說(shuō)明人工智能在癌癥領(lǐng)域的研究中,肺癌是應(yīng)用較為廣泛和典型的疾病,且通過(guò)2021年相關(guān)文獻(xiàn)量達(dá)到730篇可知,人工智能在肺癌領(lǐng)域應(yīng)用的熱潮日益高漲。
從國(guó)家發(fā)文量和中心度來(lái)看,美國(guó)和中國(guó)均排在前5位,說(shuō)明這兩個(gè)國(guó)家針對(duì)人工智能在肺癌領(lǐng)域的研究與合作處于世界前列;但由于中國(guó)人口基數(shù)大,且發(fā)表文獻(xiàn)篇均被引次數(shù)為15.48次/篇,低于美國(guó)的32.86次/篇,而世界發(fā)表文獻(xiàn)的篇均被引次數(shù)為22.43次/篇,說(shuō)明中國(guó)的人均發(fā)文量和發(fā)文影響力均比不上美國(guó),而美國(guó)文獻(xiàn)影響力處于世界先進(jìn)水平。荷蘭的發(fā)文量和國(guó)家合作中心度都位居世界前5,且文獻(xiàn)篇均被引高達(dá)109.36次/篇,遠(yuǎn)遠(yuǎn)超出世界水平,表明荷蘭在該領(lǐng)域中具有較突出的貢獻(xiàn)和較強(qiáng)的代表性。當(dāng)前,AI在醫(yī)學(xué)領(lǐng)域應(yīng)用呈現(xiàn)爆發(fā)式增長(zhǎng)的態(tài)勢(shì),人工智能理論與實(shí)踐均達(dá)到了一定高度。各國(guó)爭(zhēng)相出臺(tái)有關(guān)政策和方案,以期為人工智能技術(shù)的發(fā)展和創(chuàng)新保駕護(hù)航。與中國(guó)相比,美國(guó)人工智能戰(zhàn)略更加強(qiáng)調(diào)跨學(xué)科交叉和對(duì)人工智能產(chǎn)業(yè)的投入[4]。人工智能是新興產(chǎn)業(yè)的核心,中國(guó)應(yīng)立足于國(guó)務(wù)院《新一代人工智能發(fā)展規(guī)劃》的要求[5],提高投入產(chǎn)出比,加強(qiáng)國(guó)際與國(guó)內(nèi)研究機(jī)構(gòu)和企業(yè)的交流,助力人工智能在醫(yī)療產(chǎn)業(yè)的發(fā)展,輸出有較高影響力的成果。
從作者發(fā)文分析得出,居于前10的中國(guó)作者僅有2位,說(shuō)明中國(guó)對(duì)人工智能在肺癌領(lǐng)域的研究有突出貢獻(xiàn)的研究者較少,醫(yī)療人工智能涉及多專業(yè)融合,提示中國(guó)應(yīng)建立規(guī)范化的復(fù)合型人才培養(yǎng)體系,積極引進(jìn)高端人才、留住人才,保證人工智能在醫(yī)學(xué)領(lǐng)域的可持續(xù)發(fā)展[6]。
3.2? 人工智能在肺癌領(lǐng)域的研究涉及多方面應(yīng)用
通過(guò)關(guān)鍵詞共現(xiàn)分析得出,研究熱點(diǎn)主要集中在兩個(gè)方面:(1)利用AI技術(shù)對(duì)肺癌預(yù)測(cè)、分類和生存分析。其一,研究者重點(diǎn)關(guān)注分析醫(yī)學(xué)影像特征實(shí)現(xiàn)肺癌的預(yù)測(cè)和分類。肺結(jié)節(jié)是肺癌早期的臨床表現(xiàn),計(jì)算機(jī)斷層攝影(CT)是早期結(jié)節(jié)良惡性鑒別的有效手段,由于海量數(shù)據(jù)和人工閱片耗時(shí)長(zhǎng)伴隨著漏診誤診等問(wèn)題,人工智能輔助實(shí)現(xiàn)肺結(jié)節(jié)的篩查診斷是現(xiàn)階段精準(zhǔn)醫(yī)療的研究熱點(diǎn)。其二,AI技術(shù)聯(lián)合生物標(biāo)志物的應(yīng)用[7]。利用機(jī)器學(xué)習(xí)方法研究生物標(biāo)志物對(duì)肺癌的診斷、治療選擇和預(yù)后預(yù)測(cè)是該領(lǐng)域的重點(diǎn)方向。(2)對(duì)人工智能的方法學(xué)研究,主要的方法學(xué)有機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等,通過(guò)分類器、支持向量機(jī)、隨機(jī)森林和微陣列等算法結(jié)合大數(shù)據(jù)構(gòu)建模型來(lái)預(yù)測(cè)分類肺癌,以及研究如何進(jìn)一步優(yōu)化模型或提高算法對(duì)癌癥預(yù)測(cè)的靈敏度。
突現(xiàn)詞反映了人工智能在肺癌應(yīng)用研究中的前沿趨勢(shì)。根據(jù)統(tǒng)計(jì)結(jié)果發(fā)現(xiàn),人工智能對(duì)肺癌的影像分析既是研究熱點(diǎn),也是前沿。基因表達(dá)、蛋白質(zhì)研究、治療、人工智能的方法學(xué)手段等也是前沿的體現(xiàn)。由于分析工具數(shù)量和數(shù)據(jù)集的增多,醫(yī)學(xué)圖像分析領(lǐng)域呈指數(shù)級(jí)增長(zhǎng)。圖像識(shí)別技術(shù)不僅用于肺癌的診斷篩查,且用于放射治療過(guò)程中腫瘤靶區(qū)和危機(jī)器官的自動(dòng)勾畫(huà)以及對(duì)放療不良反應(yīng)的預(yù)測(cè)等[8]。目前應(yīng)用較廣泛的圖像識(shí)別技術(shù)可以通過(guò)高通量計(jì)算從CT、PET等醫(yī)學(xué)影像中快速提取定量特征,分析特征與治療結(jié)果或基因表達(dá)的關(guān)系,挖掘圖像中潛在的信息,這一過(guò)程也被稱為放射組學(xué)[9]。紋理特征分析是目前的一個(gè)研究前沿,它在腫瘤診斷中被要求具有更高的計(jì)算標(biāo)準(zhǔn)[10]。基于人工智能技術(shù),癌細(xì)胞的蛋白質(zhì)研究可以預(yù)測(cè)腫瘤發(fā)生、生長(zhǎng)、轉(zhuǎn)移、治療等過(guò)程,蛋白質(zhì)研究與基因表達(dá)息息相關(guān),微陣列基因表達(dá)數(shù)據(jù)可用于癌癥類型預(yù)測(cè)[11],微陣列技術(shù)為分析基因表達(dá)數(shù)據(jù)提供了方法。
近年來(lái),研究者們更多的關(guān)注人工智能在肺癌應(yīng)用領(lǐng)域的方法學(xué)研究,人工智能技術(shù)的創(chuàng)新和發(fā)展為肺癌研究應(yīng)用創(chuàng)造了新可能。機(jī)器學(xué)習(xí)是人工智能的核心,高度準(zhǔn)確和可靠的機(jī)器學(xué)習(xí)方法在整合和分析龐大而復(fù)雜的數(shù)據(jù)集方面發(fā)揮著關(guān)鍵作用。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一大分支,2015年Lecun Y表示深度學(xué)習(xí)允許計(jì)算模型來(lái)學(xué)習(xí)具有多個(gè)抽象級(jí)別的數(shù)據(jù)表示,深度卷積網(wǎng)絡(luò)在處理圖像等方面帶來(lái)了突破進(jìn)展[12],成為受歡迎的特征提取器,已被證明在自然圖像分類方面明顯優(yōu)于經(jīng)典的機(jī)器學(xué)習(xí)方法。圖像分類的深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)越來(lái)越多樣,VGG系列網(wǎng)絡(luò)、ResNet和U-Net等網(wǎng)絡(luò)的誕生驗(yàn)證了圖像分類分割的性能在逐步提高。研究者們?yōu)榘┌Y的預(yù)測(cè)和診斷不斷提出新的方法和網(wǎng)絡(luò)訓(xùn)練策略以提高模型的準(zhǔn)確性,并優(yōu)化改進(jìn)模型可能出現(xiàn)的過(guò)擬合、研究可重復(fù)性和操作性等技術(shù)問(wèn)題,這些是未來(lái)人工智能在肺癌或其他癌癥應(yīng)用中方法學(xué)研究突破的關(guān)鍵。
3.3? 人工智能在醫(yī)學(xué)應(yīng)用領(lǐng)域面臨的難題
隨著個(gè)性化決策和精準(zhǔn)醫(yī)療的普及,人工智能在肺癌領(lǐng)域的應(yīng)用正在一步步深化。然而在日常臨床實(shí)踐中建立可靠的癌癥結(jié)果預(yù)測(cè)模型仍是一個(gè)挑戰(zhàn)。例如圖像識(shí)別、藥物效果預(yù)測(cè)等都需要大規(guī)模數(shù)據(jù)來(lái)訓(xùn)練模型,過(guò)程中消耗大量計(jì)算資源,對(duì)硬件要求較高;對(duì)于醫(yī)學(xué)影像數(shù)據(jù),前期的獲取和手工標(biāo)注對(duì)于研究機(jī)構(gòu)來(lái)說(shuō)比較困難。醫(yī)療人工智能涉及法律法規(guī)和倫理道德,特別是AI技術(shù)挖掘分析醫(yī)療大數(shù)據(jù)時(shí),可能會(huì)造成個(gè)人隱私信息的泄露,而相比其他國(guó)家,中國(guó)對(duì)個(gè)人隱私安全保護(hù)的法制體系尚不完善,因此需要不斷豐富體系內(nèi)涵來(lái)適應(yīng)人工智能的更新迭代。《人工智能白皮書(shū)(2022年)》[13]中表明安全可信的人工智能要朝著一體化的方向發(fā)展,加速推進(jìn)風(fēng)險(xiǎn)防控體系。因此勢(shì)必要完善法律法規(guī),推進(jìn)國(guó)家監(jiān)管體系建設(shè),加強(qiáng)人工智能在醫(yī)療應(yīng)用中的技術(shù)保護(hù),明確人工智能與醫(yī)療使用人員之間的責(zé)任,以實(shí)現(xiàn)精準(zhǔn)醫(yī)療與人工智能戰(zhàn)略目標(biāo)。
4? 結(jié)? 論
綜上所述,目前人工智能在肺癌領(lǐng)域的研究已成為國(guó)際研究熱點(diǎn)。在我國(guó),應(yīng)充分吸收國(guó)外的前沿?zé)狳c(diǎn),加強(qiáng)國(guó)際及研究機(jī)構(gòu)間的交流合作,并在中國(guó)腫瘤防治的基礎(chǔ)上,推動(dòng)中國(guó)人工智能技術(shù)與腫瘤領(lǐng)域的交叉研究。
參考文獻(xiàn):
[1] 楊文靜,呂章艷,馮小雙,等.人工智能在癌癥研究領(lǐng)域的文獻(xiàn)可視化分析 [J].腫瘤防治研究,2021,48(2):133-139.
[2] 陳悅,陳超美,劉則淵,等.CiteSpace知識(shí)圖譜的方法論功能 [J].科學(xué)學(xué)研究,2015,33(2):242-253.
[3] 楊文靜,杜然然,呂章艷,等.人工智能在疾病預(yù)測(cè)研究中可視化分析 [J].中國(guó)公共衛(wèi)生,2021,37(5):871-874.
[4] 王迎春,李輝,楊丞磊,等.美國(guó)人工智能研發(fā)戰(zhàn)略計(jì)劃2019更新版重點(diǎn)及啟示 [J].科技導(dǎo)報(bào),2020,38(11):26-30.
[5] 國(guó)務(wù)院.國(guó)務(wù)院關(guān)于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知 [R/OL].(2017-07-20)[2022-07-19].http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.
[6] 董星宇,陳敏.醫(yī)療人工智能發(fā)展存在的問(wèn)題及對(duì)策 [J].醫(yī)學(xué)與社會(huì),2019,32(5):80-82.
[7] HAO X K,LUO H Y,KRAWCZYK M,et al. DNA methylation markers for diagnosis and prognosis of common cancers [J].Proc Natl Acad Sci U S A,2017,114(28):7414-7419.
[8] 甘武田,應(yīng)延辰,全紅,等.肺癌放射治療中人工智能的應(yīng)用進(jìn)展 [J].中華腫瘤防治雜志,2021,28(18):1428-1432.
[9] GILLIES R J,KINAHAN P E,HRICAK H. Radiomics:Images Are More than Pictures,They Are Data [J].Radiology,2016,278(2):563-577.
[10] WANG H K,ZHOU Z W,LI Y C,et al. Comparison of machine learning methods for classifying mediastinal lymph node metastasis of non-small cell lung cancer from (18)F-FDG PET/CT images [J].EJNMMI research,2017,7(1):11.
[11] YANG Y,XU L,SUN L D,et al. Machine learning application in personalised lung cancer recurrence and survivability prediction [J].Comput Struct Biotechnol J,2022,20:1811-1820.
[12] LECUN Y,BENGIO Y,HINTON G. Deep learning [J].Nature,2015,521(7553):436-444.
[13] 中國(guó)信息通信研究院.人工智能白皮書(shū)(2022年) [EB/
OL].[2022-07-19].http://scdsjzx.cn/scdsjzx/ziliaoxiazai/2022/
4/18/d03a2d33b67d4c398ddfca504cf410ab/files/43b00b8feccd423ea2e2a4014e9d672a.pdf.
作者簡(jiǎn)介:劉桑雪(1997—),女,漢族,廣東汕尾人,碩士研究生在讀,研究方向:醫(yī)學(xué)信息管理、計(jì)算機(jī)及應(yīng)用等;通訊作者:何慧敏(1973—),女,漢族,湖南岳陽(yáng)人,研究生導(dǎo)師,博士,研究方向:教育管理、醫(yī)學(xué)信息管理、計(jì)算機(jī)及應(yīng)用等。
收稿日期:2022-09-15
基金項(xiàng)目:2022年自治區(qū)級(jí)新工科、新醫(yī)科、新農(nóng)科、新文科研究與實(shí)踐項(xiàng)目(02506222234C)