亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于UMLS的肺癌治療研究熱點(diǎn)分析

        2017-03-22 00:31:10,,
        關(guān)鍵詞:文檔靶向肺癌

        ,,

        肺癌是全球最為常見(jiàn)的惡性腫瘤之一,發(fā)病率和死亡率呈明顯的升高趨勢(shì),迄今為止,肺癌的病死率已居惡性腫瘤之首[1]。肺癌分為小細(xì)胞肺癌(small cell lung cancer,SCLC)和非小細(xì)胞肺癌(non-small cell lung cancer,NSCLC) ,其中80%-85%的肺癌為非小細(xì)胞肺癌。

        隨著對(duì)肺癌研究的不斷深入,各種治療方法如手術(shù)[2]、放療、化療、分子靶向藥物治療[3]、基因治療[4]等在不斷創(chuàng)新和改進(jìn),國(guó)內(nèi)外有關(guān)肺癌治療的論文數(shù)量持續(xù)增加。伴隨著新概念、新技術(shù)、新方法及新的科研主題的不斷產(chǎn)生、繁衍及更替,快速識(shí)別主題有助于科研人員及時(shí)了解前沿?zé)狳c(diǎn)的發(fā)展動(dòng)向和確定科研方向,有助于醫(yī)學(xué)科研管理人員制定科研規(guī)劃。

        通過(guò)對(duì)文本信息的整理和分析,可以監(jiān)測(cè)肺癌治療方面研究的前沿?zé)狳c(diǎn)。目前較多采用基于主題詞的前沿?zé)狳c(diǎn)監(jiān)測(cè),由于主題詞均經(jīng)過(guò)規(guī)范化,不能及時(shí)反應(yīng)較新的詞或概念,不能完全反映文章的內(nèi)容含義,忽略文中較為細(xì)節(jié)的知識(shí)。而采用基于自然語(yǔ)言的處理方式,通過(guò)UMLS的概念映射則可以解決上述問(wèn)題。

        1 方法與工具

        1.1 方法

        主題識(shí)別通常包括主題特征表示、主題特征抽取、主題獲取3個(gè)階段。現(xiàn)有的主題特征表示方式大都是基于關(guān)鍵詞或是Mesh主題詞,不能夠完全反映文章的內(nèi)容含義。本研究利用醫(yī)學(xué)領(lǐng)域現(xiàn)有的知識(shí)組織體系——一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)(Unified Medical Language System, UMLS)進(jìn)行概念映射,以盡可能反映文章的內(nèi)容含義,然后根據(jù)映射結(jié)果抽取第一組Meta Mapping概念,并進(jìn)行語(yǔ)義類型的限定,最后利用主題模型進(jìn)行主題獲取。

        Blei[5]等在2003年提出了(Latent Dirichlet Allocation,LDA)模型。LDA模型是一個(gè)概率生成模型,同時(shí)也是一個(gè)話題模型,它的參數(shù)不會(huì)隨著文集增長(zhǎng)而線性增長(zhǎng)。LDA還是一個(gè)3層貝葉斯概率模型,包括詞、主題和文檔3層結(jié)構(gòu)。它假設(shè)一篇文檔的每個(gè)詞都是通過(guò)“以一定概率選擇了某個(gè)主題,并從這個(gè)主題中以一定概率選擇某個(gè)詞語(yǔ)”過(guò)程得到的,并假設(shè)一篇文檔是由一些潛在的話題的多項(xiàng)式分布表示,而話題由一組詞的多項(xiàng)式分布組成,模型描述了文檔的生成過(guò)程。

        也可將LDA看成是一種軟聚類的方法,它用詞頻分布表示每一個(gè)類別。與普通層次聚類等硬聚類方法不同,LDA聚類的結(jié)果中每篇文檔可以屬于多個(gè)不同的類別。

        檢索2013-2014年P(guān)ubMed數(shù)據(jù)庫(kù)中肺癌治療的相關(guān)文獻(xiàn),檢索式為(“Lung Neoplasms/therapy”[Mesh] AND (“2013/01/01”[PDAT] : “2014/12/31”[PDAT]),檢索時(shí)間為2015年10月26日,檢索到9 055條文獻(xiàn),用MEDLINE格式下載。

        利用MetaMap進(jìn)行UMLS概念映射,通過(guò)語(yǔ)義類型的限定去除較為寬泛意義的詞,利用LDA進(jìn)行主題識(shí)別,用以監(jiān)測(cè)肺癌治療的研究熱點(diǎn)。

        1.2 工具

        1.2.1 MetaMap(https://mmtx.nlm.nih.gov/)

        MetaMap是一個(gè)把生物醫(yī)學(xué)文本與UMLS超級(jí)詞表中的概念匹配起來(lái)的程序,可以選擇設(shè)置參數(shù),控制內(nèi)部的運(yùn)行方式及結(jié)果的輸出形式。

        1.2.2 LDA[6]模型

        LDA是一種文檔主題生成模型,也稱為三層貝葉斯概率模型,包含詞、主題和文檔3層結(jié)構(gòu)。LDA是一種非監(jiān)督機(jī)器學(xué)習(xí)技術(shù),可以用來(lái)識(shí)別大規(guī)模文檔集(document collection)或語(yǔ)料庫(kù)(corpus)中潛藏的主題信息。

        1.2.3 自編的java和MySQL程序

        利用java自編程序完成格式的轉(zhuǎn)換。

        2 實(shí)驗(yàn)與結(jié)果

        2.1 數(shù)據(jù)預(yù)處理

        利用MetaMap進(jìn)行概念映射,提交并得出結(jié)果(圖1),平均一篇文摘對(duì)應(yīng)100個(gè)UMLS概念。Meta Mapping為詞語(yǔ)匹配結(jié)果,數(shù)字為分?jǐn)?shù),分?jǐn)?shù)越高,匹配程度越大,括弧內(nèi)為語(yǔ)義類型。通過(guò)語(yǔ)義類型的限定去除無(wú)實(shí)質(zhì)意義的詞,如with、advanced、due to等,以免影響對(duì)結(jié)果的解讀。

        使用Java自編程序?qū)τ成浣Y(jié)果進(jìn)行處理,并用MySQL數(shù)據(jù)庫(kù)存儲(chǔ)。選擇第一組Meta Mapping 結(jié)果,并進(jìn)行語(yǔ)義類型的限定,只包括語(yǔ)義類型為Neoplastic Process、Therapeutic or Preventive Procedure、Amino Acid, Peptide, or Protein,Immunologic Factor、Pathologic Function、Health Care Activity、Diagnostic Procedure、Sign or Symptom、Biomedical Occupation or Discipline、Disease or Syndrome、Substance、Organic Chemical,Pharmacologic Substance、Cell、Cell Function的詞。

        2.2 主題模型識(shí)別主題

        本文選擇的LDA開(kāi)源工具是JGibbLDA,輸入文件格式見(jiàn)圖2。其中第一行表示語(yǔ)料文檔的數(shù)目,之后每一行是一個(gè)文檔,每一行的內(nèi)容是文檔中的詞語(yǔ),詞語(yǔ)內(nèi)用點(diǎn)“.”連接,詞語(yǔ)間用空格連接,經(jīng)過(guò)語(yǔ)義類型限定,得到的文獻(xiàn)數(shù)少于9 055條。

        圖2 LDA的輸入文件格式

        反復(fù)試驗(yàn)、調(diào)整相關(guān)參數(shù),最終將主題數(shù)設(shè)定為10,此時(shí)經(jīng)專家評(píng)議效果較好。對(duì)2013-2014年P(guān)ubMed中關(guān)于肺癌治療研究的文獻(xiàn)進(jìn)行主題識(shí)別,各主題概率相對(duì)較大的前10個(gè)詞詳見(jiàn)表1、表2。

        表1 應(yīng)用主題模型后生成的前5個(gè)主題

        表2 應(yīng)用主題模型后生成的后5個(gè)主題

        3 分析

        通過(guò)應(yīng)用主題模型,得到了肺癌治療研究的10個(gè)主題,對(duì)相關(guān)主題進(jìn)行分析。

        主題1為非小細(xì)胞肺癌的化療方案。相關(guān)的藥物研究包括順鉑、培美曲塞、貝伐單抗、多烯紫杉醇、紫杉醇、卡鉑、吉西他濱、伊立替康等一些常見(jiàn)藥和新藥。耿慧琴[7]用相關(guān)實(shí)驗(yàn)證實(shí)貝伐單抗聯(lián)合培美曲塞+順鉑化療方案,有助于促進(jìn)腫瘤緩解,降低VEGF水平,抑制腫瘤血管新生及延長(zhǎng)整體生存時(shí)間。

        主題2為肺癌的轉(zhuǎn)移研究。包括肺癌的腦轉(zhuǎn)移、肺癌的肝轉(zhuǎn)移、肺癌的腎轉(zhuǎn)移,以及乳房、結(jié)腸、直腸轉(zhuǎn)移,相關(guān)的治療方式包括放療、化療、轉(zhuǎn)移灶切除術(shù)等,主題鮮明直觀?,F(xiàn)有相關(guān)研究如李永豪[8]等人證實(shí)對(duì)非小細(xì)胞肺癌伴腦轉(zhuǎn)移患者積極進(jìn)行肺原發(fā)癌及腦轉(zhuǎn)移病灶切除術(shù)聯(lián)合放療和吉西他濱、替莫唑胺治療,可顯著提高患者的臨床療效,且先行腦部手術(shù)患者并發(fā)癥少,N0患者獲益明顯。

        主題3為肺癌的癥狀和診斷。肺癌的癥狀包括咳嗽、咳血、胸痛、呼吸困難等,肺癌的診斷包括X射線計(jì)算機(jī)斷層掃描、血清檢測(cè)、支氣管鏡檢查、胸部CT、普通的胸部X光片、MRI、DSA等,主題3對(duì)癥狀和診斷總結(jié)的較好?,F(xiàn)有的研究如劉青等人[9]證實(shí)CT是周圍型肺癌檢查的首選方法,X 線胸片是不可缺少的基礎(chǔ),MRI 可作為參考補(bǔ)充,而 DSA 是周圍型肺癌診斷與治療的最好方法。

        主題4為小細(xì)胞肺癌的治療研究。相關(guān)的研究包括小細(xì)胞肺癌的化療、靶向治療、化療方案、姑息治療、支持性護(hù)理、局限期小細(xì)胞肺癌、拓?fù)涮婵?藥物)、依托泊苷(藥物)、系統(tǒng)性治療、預(yù)防性治療、預(yù)防性腦放療、臨終關(guān)懷等,主題4對(duì)治療方式總結(jié)的全面、鮮明?,F(xiàn)有的研究如李肇彥[10]證實(shí)同步放化療治療局限期小細(xì)胞肺癌,近期療效好,生存率高,且不良反應(yīng)無(wú)明顯增加。

        主題5為肺腺癌、肺鱗狀細(xì)胞癌的治療研究。相關(guān)的研究包括X射線計(jì)算機(jī)斷層掃描、正電子發(fā)射斷層掃描、外科手術(shù)、活組織檢查、射頻消融術(shù)、免疫組織化學(xué)、骨橋蛋白、光化學(xué)療法、胸部CT、胸膜外的全肺切除術(shù)、組織病理學(xué)、原位腺癌、診斷成像等,主題5對(duì)這兩種病的現(xiàn)有治療技術(shù)陳列較全面?,F(xiàn)有的研究如張標(biāo)[11]等人通過(guò)免疫組化方法研究 MTA1與 Bcl- 2在肺腺癌的表達(dá)與關(guān)系,證實(shí)Bcl-2蛋白的表達(dá)與肺腺癌的臨床分期、分化程度及癌灶轉(zhuǎn)移范圍密切相關(guān),M TA1蛋白的表達(dá)與肺腺癌的發(fā)生發(fā)展及臨床分期密切相關(guān)。

        主題6為肺癌的免疫療法、靶向治療。相關(guān)的研究包括重組血管內(nèi)皮生長(zhǎng)因子、疫苗接種、HSP90熱休克蛋白、單克隆抗體、血管生成抑制劑、抗體、阿扎胞苷、過(guò)繼免疫療法、色瑞替尼、克唑替尼、免疫佐劑等,主題6對(duì)免疫療法的相關(guān)技術(shù)總結(jié)全面?,F(xiàn)有的研究如蔣濤[12]等人就 T 細(xì)胞相關(guān)的細(xì)胞免疫療法在非小細(xì)胞肺癌治療中的進(jìn)展展開(kāi)綜述,證實(shí)T 細(xì)胞為基礎(chǔ)的免疫療法在 NSCLC 的治療中顯示出了初步的臨床效果。

        主題7為肺癌的手術(shù)治療。相關(guān)的研究包括葉切除術(shù)、電視胸腔鏡手術(shù)、淋巴結(jié)切除、全肺切除術(shù)、節(jié)段性乳房切除術(shù)、楔形切除術(shù)、術(shù)后并發(fā)癥、袖葉切除術(shù)、組織解剖、淋巴結(jié)解剖、縱隔鏡檢查、肺葉切除、術(shù)后化療、化療、輔助、并發(fā)癥、新輔助治療等,主題7將肺癌手術(shù)治療的相關(guān)技術(shù)總結(jié)的全面、系統(tǒng)。現(xiàn)有的研究如成德生[13]證實(shí)肺癌患者肺功能減低與否,均可接受手術(shù)治療,手術(shù)切除是治療肺癌患者的有效方法,值得進(jìn)一步推廣。

        主題8為肺癌的放射療法。相關(guān)的研究包括肺腫瘤、放射治療、立體定向放射治療、放療,強(qiáng)度、體積調(diào)制電弧療法(Volumetric-Modulated Arc Therapy)、放療,適形、放射性核素顯像、四維計(jì)算機(jī)斷層掃描、質(zhì)子治療、輻射電離放射治療、搶救治療、皮疹,皮炎不良事件與放化療、肺毒性、I期非小細(xì)胞肺癌、III期非小細(xì)胞肺癌、劑量分餾、體外放射療法、碳離子放射治療、螺旋斷層放療等,主題8對(duì)放射療法的相關(guān)概念總結(jié)的較為全面?,F(xiàn)有的研究如張千仕[14]證實(shí)肺癌放療后復(fù)發(fā)患者應(yīng)用適形放療能提高近期治療效果,延長(zhǎng)患者的生存期,毒性反應(yīng)與常規(guī)放療相同,可在臨床推廣應(yīng)用。

        主題9為肺癌的miRNA及DNA研究。相關(guān)的研究包括肺癌、MicroRNAs、表達(dá)過(guò)程、蛋白質(zhì)、順鉑、小干擾RNA、信使RNA、姜黃素、活性氧、三氧化二砷、免疫組織化學(xué)、異種移植過(guò)程、Stat3蛋白、索拉非尼、啟動(dòng)子、質(zhì)粒、DNA、腫瘤細(xì)胞轉(zhuǎn)化、白藜蘆醇等,主題9對(duì)有關(guān)miRNA和DNA的研究總結(jié)的較好?,F(xiàn)有的研究如江娟[15]等人對(duì)miRNA 與肺癌早期診斷、治療和預(yù)后的研究進(jìn)展展開(kāi)綜述,證實(shí)miRNA 應(yīng)用于肺癌的早期無(wú)創(chuàng)性診斷、治療和預(yù)后檢測(cè)潛在的應(yīng)用信息已經(jīng)大量涌現(xiàn)。

        主題10為非小細(xì)胞肺癌的化療和靶向治療。相關(guān)的研究包括非小細(xì)胞肺癌、埃羅替尼、吉非替尼、表皮生長(zhǎng)因子受體抑制劑、外顯子、西妥昔單抗、阿法替尼、酪氨酸蛋白激酶抑制劑、四期非小細(xì)胞肺癌、DNA、靶向治療、Mucin-1蛋白質(zhì)、達(dá)克米替尼、蛋白質(zhì)酪氨酸激酶抑制劑治療等,主題10對(duì)非小細(xì)胞肺癌的治療總結(jié)的較好。現(xiàn)有的研究如曲進(jìn)[16]等人證實(shí)非小細(xì)胞肺癌小分子化合物(EGFR-TKI)靶向治療疾病進(jìn)展后與化療交替治療可部分恢復(fù)小分子化合物敏感性,副反應(yīng)可耐受,治療可行。

        通過(guò)以上方法得到的主題,其內(nèi)部含義比較清晰,主題間的區(qū)分比較明顯,可以幫助相關(guān)的科研人員和管理人員快速了解研究領(lǐng)域的發(fā)展前沿?zé)狳c(diǎn),把握研究動(dòng)向,了解熱點(diǎn)主題。

        4 結(jié)論

        針對(duì)主題詞不能完全反映文章內(nèi)容的缺陷,本文采用自然語(yǔ)言處理的方式,對(duì)PubMed數(shù)據(jù)庫(kù)中的文獻(xiàn)進(jìn)行UMLS概念映射,并利用LDA進(jìn)行主題識(shí)別,識(shí)別出肺癌治療研究的前沿?zé)狳c(diǎn),包括非小細(xì)胞肺癌的化療、靶向治療和化療方案研究,肺癌的癥狀、診斷和轉(zhuǎn)移研究,肺腺癌、肺鱗狀細(xì)胞癌和小細(xì)胞肺癌的治療研究,肺癌的免疫療法、靶向治療、手術(shù)治療和放射療法研究以及肺癌的miRNA及DNA研究,為相關(guān)醫(yī)學(xué)科研人員和管理人員提供參考借鑒,為同行進(jìn)行文本挖掘研究提供借鑒。

        本文不足之處在于主題數(shù)的設(shè)定受人為因素的干擾,主題內(nèi)容的解讀還需結(jié)合人工判斷,今后研究應(yīng)結(jié)合醫(yī)學(xué)領(lǐng)域的語(yǔ)義網(wǎng)向更加智能化的方向發(fā)展。

        猜你喜歡
        文檔靶向肺癌
        中醫(yī)防治肺癌術(shù)后并發(fā)癥
        如何判斷靶向治療耐藥
        對(duì)比增強(qiáng)磁敏感加權(quán)成像對(duì)肺癌腦轉(zhuǎn)移瘤檢出的研究
        MUC1靶向性載紫杉醇超聲造影劑的制備及體外靶向?qū)嶒?yàn)
        有人一聲不吭向你扔了個(gè)文檔
        毛必靜:靶向治療,你了解多少?
        肝博士(2020年5期)2021-01-18 02:50:18
        基于RI碼計(jì)算的Word復(fù)制文檔鑒別
        Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
        靶向超聲造影劑在冠心病中的應(yīng)用
        microRNA-205在人非小細(xì)胞肺癌中的表達(dá)及臨床意義
        国产成人77亚洲精品www| 乱码1乱码2美美哒| 东京热人妻一区二区三区| 亚洲产国偷v产偷v自拍色戒| 亚洲日本VA午夜在线电影| 国产69精品麻豆久久| 久久亚洲av成人无码电影a片| 日韩精品人妻系列无码专区免费| 国产精品98福利小视频| 男女深夜视频网站入口| 又大又粗欧美黑人aaaaa片 | 亚洲日韩AV无码美腿丝袜| 久久精品国产亚洲综合av| 国产激情视频在线观看的| 国产69精品久久久久9999| 九九99久久精品在免费线97| 国产人妻久久精品二区三区老狼| 免费观看交性大片| 久久亚洲精品无码gv| 中文字幕亚洲区第一页| 国产精品亚洲一级av第二区| 亚洲人成色7777在线观看| 成人久久免费视频| 丰满少妇又爽又紧又丰满动态视频| 亚洲精品国产老熟女久久| 中文字幕亚洲视频三区| 国产成人精品免费久久久久| 又白又嫩毛又多15p| 精品无码成人片一区二区| 国产91精品一区二区麻豆亚洲 | 麻豆av毛片在线观看| 国产成人精品无码片区在线观看| 亚洲午夜福利在线观看| 国产成人亚洲精品2020| 久久热免费最新精品视频网站| 国产h视频在线观看| 九色综合九色综合色鬼| а中文在线天堂| 国产成人夜色在线视频观看| 午夜秒播久久精品麻豆| 无码人妻丰满熟妇区五十路百度 |