亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        共詞分析及網(wǎng)絡(luò)分析法探測(cè)乳腺癌轉(zhuǎn)移相關(guān)基因

        2016-03-21 08:58:52,
        關(guān)鍵詞:語(yǔ)義乳腺癌概念

        ,

        乳腺癌是女性最常見(jiàn)的惡性腫瘤之一,大約有10%-15%的乳腺癌患者在首次確診為原發(fā)腫瘤3年后都會(huì)伴發(fā)其他嚴(yán)重疾病或發(fā)生遠(yuǎn)處轉(zhuǎn)移。轉(zhuǎn)移是導(dǎo)致乳腺癌患者死亡的主要原因,因此阻止乳腺癌的浸潤(rùn)和轉(zhuǎn)移是現(xiàn)代乳腺癌治療中的關(guān)鍵環(huán)節(jié)。

        乳腺癌轉(zhuǎn)移是一個(gè)由多基因參與及多步驟完成的復(fù)雜過(guò)程。乳腺癌轉(zhuǎn)移相關(guān)基因是一類(lèi)功能上能促進(jìn)或阻斷腫瘤轉(zhuǎn)移潛能而不影響腫瘤細(xì)胞生長(zhǎng)增殖的基因,可分為轉(zhuǎn)移促進(jìn)基因和轉(zhuǎn)移抑制基因兩大類(lèi)。轉(zhuǎn)移促進(jìn)基因有HER-2、BCSG1、MMPs等,轉(zhuǎn)移抑制基因有nm23、BRMS1等。相關(guān)研究較多,但目前未見(jiàn)從文本角度挖掘乳腺癌轉(zhuǎn)移相關(guān)基因的研究。

        共詞分析法是20世紀(jì)70年代由法國(guó)的文獻(xiàn)計(jì)量學(xué)家提出的,其原理是對(duì)一組詞兩兩統(tǒng)計(jì)它們?cè)谕黄墨I(xiàn)中出現(xiàn)的次數(shù)。以此為基礎(chǔ)對(duì)這些詞進(jìn)行聚類(lèi)分析或網(wǎng)絡(luò)分析等,可以反映這些詞之間的親疏關(guān)系及其代表的學(xué)科和主題的結(jié)構(gòu)變化[1]。國(guó)內(nèi)最早將共詞分析法應(yīng)用于醫(yī)學(xué)文獻(xiàn)分析[2],目前已廣泛應(yīng)用于知識(shí)管理、生物信息學(xué)、納米科技、土地研究、人力資源、城市信息化、閱讀療法研究、奶牛繁殖研究等各個(gè)領(lǐng)域的文獻(xiàn)分析[3-6]。社會(huì)網(wǎng)絡(luò)分析是綜合運(yùn)用圖論、數(shù)學(xué)模型來(lái)研究行動(dòng)者與行動(dòng)者、行動(dòng)者與其所處社會(huì)網(wǎng)絡(luò)及一個(gè)社會(huì)網(wǎng)絡(luò)與另一個(gè)社會(huì)網(wǎng)絡(luò)之間關(guān)系的一種結(jié)構(gòu)分析方法,近年來(lái)在圖書(shū)情報(bào)、計(jì)算機(jī)軟件與計(jì)算機(jī)應(yīng)用、新聞傳媒、企業(yè)管理、醫(yī)學(xué)等領(lǐng)域得到了廣泛應(yīng)用[7-10]。

        本文嘗試基于共詞分析法,從PubMed數(shù)據(jù)庫(kù)檢索獲取乳腺癌轉(zhuǎn)移與基因關(guān)系的研究文獻(xiàn),利用MetaMap進(jìn)行概念匹配后抽取乳腺癌轉(zhuǎn)移相關(guān)基因,建立乳腺癌轉(zhuǎn)移-基因矩陣和基因-基因矩陣,再利用Ucinet軟件建立乳腺癌轉(zhuǎn)移相關(guān)基因的相互作用網(wǎng)絡(luò),分析網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)及其作用,以探測(cè)基因與轉(zhuǎn)移癌的關(guān)系,為乳腺癌轉(zhuǎn)移的早期診斷和治療提供參考。

        1 研究工具

        1.1 概念匹配程序MetaMap

        由Lister Hill National Center for Biomedical Communications(美國(guó)生物醫(yī)學(xué)通訊中心)開(kāi)發(fā)的MetaMap,是一個(gè)將生物醫(yī)學(xué)文本與一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)(Unified Medical Language System,UMLS)超級(jí)詞表中的概念匹配的程序。MetaMap使用知識(shí)密集方法,采用符號(hào)、自然語(yǔ)言處理和計(jì)算機(jī)語(yǔ)言學(xué)等技術(shù),能基于語(yǔ)義關(guān)系提取疾病、基因、蛋白等知識(shí),完成概念組配。MetaMap首先把題目和文摘中的各個(gè)句子解析成多個(gè)詞或短語(yǔ),然后列出每個(gè)詞或短語(yǔ)候選詞,根據(jù)所選擇的候選詞在UMLS所出現(xiàn)的相關(guān)語(yǔ)義類(lèi)型和研究領(lǐng)域進(jìn)行匹配,得到文本中的主要概念。MetaMap主要應(yīng)用于信息檢索和數(shù)據(jù)挖掘,是美國(guó)國(guó)立醫(yī)學(xué)圖書(shū)館(NLM)初步標(biāo)引系統(tǒng)(indexing initiative system)的基礎(chǔ)之一,這個(gè)標(biāo)引系統(tǒng)應(yīng)用于圖書(shū)館半自動(dòng)和全自動(dòng)的生物醫(yī)學(xué)文獻(xiàn)標(biāo)引[11]。

        1.2 dataMiner數(shù)據(jù)分析軟件

        dataMiner軟件是由中國(guó)醫(yī)科大學(xué)閆雷開(kāi)發(fā)的。它可根據(jù)UMLS超級(jí)詞表,選擇需要的語(yǔ)義類(lèi)型,將所得結(jié)果按所需的百分比或前幾位列出,用于統(tǒng)計(jì)概念匹配后文本中兩個(gè)詞或詞組在同一標(biāo)題、摘要、句子及正文中出現(xiàn)的次數(shù),形成矩陣。

        1.3 社會(huì)網(wǎng)絡(luò)分析軟件 Ucinet

        Ucinet(University of California at Irvine NETwork)最初由加州大學(xué)爾灣分校學(xué)者Linton Freeman編寫(xiě)的,集成了可以對(duì)一維和二維數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和可視化分析的NetDraw軟件,將網(wǎng)絡(luò)結(jié)構(gòu)可視化,是綜合性社會(huì)網(wǎng)絡(luò)分析工具[12]。Ucinet可以對(duì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行統(tǒng)計(jì)分析,包括網(wǎng)絡(luò)密度、中心度、最短路徑、子群等。

        2 研究步驟和結(jié)果分析

        2.1 利用MetaMap進(jìn)行概念匹配

        以“breast neoplasms[majr] AND genes[majr] AND Neoplasm Metastasis[Mesh] AND humans[mesh]”為檢索策略(1966年1月1日-2015年7月31日),在PubMed共檢索到375篇乳腺癌轉(zhuǎn)移相關(guān)基因文獻(xiàn),以MEDLINE格式進(jìn)行保存,作為挖掘樣本。將MEDLINE格式文本上傳到在線MetaMap,選擇UMLS涵蓋的所有詞表及所有語(yǔ)義類(lèi)型,進(jìn)行概念匹配,得到所保存文獻(xiàn)題名和摘要的UMLS概念匹配結(jié)果。

        2.2 利用數(shù)據(jù)分析軟件得到矩陣

        首先,將概念匹配結(jié)果導(dǎo)入數(shù)據(jù)挖掘軟件,基因選擇的語(yǔ)義類(lèi)型為[Gene or Genome],轉(zhuǎn)移癌的語(yǔ)義類(lèi)型為[neoplastic process],選取同句共現(xiàn)的矩陣,得到與乳腺癌轉(zhuǎn)移相關(guān)基因。然后,再將X軸和Y軸共同選擇語(yǔ)義類(lèi)型[Gene or Genome],得到基因之間相互作用的矩陣。刪除范圍過(guò)于廣泛的基因名稱(chēng)(如genes,alleles,locus,tumor suppressor genes,proto-oncogenes等)和重復(fù)的基因名稱(chēng)(如tp53 gene與tp53 wt allele等),合并表示同一基因的不同基因名稱(chēng)(如erbb、egfr和c-erbb-1合并為egfr,使用Genebank中的官方名稱(chēng)),刪除錯(cuò)配的基因名(如gene A錯(cuò)配為genes,vif),最終得到44×44的基因-基因矩陣,并將對(duì)角線的基因出現(xiàn)次數(shù)設(shè)置為0(表1)。

        表1 基因-基因共現(xiàn)矩陣(44行×44列)(部分)

        2.3 基因相互作用網(wǎng)絡(luò)的建立和拓?fù)浣Y(jié)構(gòu)分析

        利用Ucinet 6的數(shù)據(jù)轉(zhuǎn)換功能將處理后的基因-基因共現(xiàn)矩陣進(jìn)行二值化處理,利用自帶的Netdraw生成基因相互作用網(wǎng)絡(luò)(圖1),利用network功能分析基因網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),包括核心和外緣(圖2)、度數(shù)中心度(圖3)、中間中心度(圖4)、結(jié)構(gòu)洞。

        圖1 乳腺癌轉(zhuǎn)移相關(guān)基因相互作用網(wǎng)絡(luò)圖

        圖2 乳腺癌轉(zhuǎn)移相關(guān)基因相互作用核心和外緣(部分)

        圖3 乳腺癌轉(zhuǎn)移相關(guān)基因相互作用度數(shù)中心度(部分)

        圖4 乳腺癌轉(zhuǎn)移相關(guān)基因相互作用中間中心度(部分)

        由圖1可知,網(wǎng)絡(luò)圖共有44個(gè)節(jié)點(diǎn)、146條線。

        從圖2可以看出,核心基因?yàn)閎cl2、brca1、brca2、cd69、cdh1、cdkn2a、Egfr、erbb2、esr1、myc、nr4a1、thra、tp53,其余31個(gè)基因?yàn)檫吘壔颉?/p>

        絕對(duì)度數(shù)中心度是某點(diǎn)與其他點(diǎn)直接相連的個(gè)數(shù)。如果某點(diǎn)具有最高的度數(shù),則稱(chēng)該點(diǎn)居于中心,有可能擁有最大的權(quán)力[12]。從圖3可知,tp53度數(shù)最大為13,度數(shù)中心度排在前10的基因是tp53、thra、erbb2、esr1、cdh1、egfr、nr4a1、cd69、cdkn2a、bcl2,最小度數(shù)是1。因此,tp53、thra、erbb2、esr1、cdh1、egfr、nr4a1、cd69、cdkn2a和bcl2的度數(shù)最多,權(quán)力最大,處于中心位置。

        另一個(gè)表征行動(dòng)者個(gè)體中心度的指標(biāo)是中間中心度,它測(cè)量的是行動(dòng)者對(duì)資源控制的程度。如果一個(gè)點(diǎn)處于許多其他點(diǎn)對(duì)的捷徑(最短路徑)上,則該點(diǎn)具有較高的中間中心度[12]。從圖4可知,blid、bcpr、akr1a1、chafla、bcl2l1、kidins220、cxcr4和mir200b等19個(gè)基因的中間中心度為0,不能控制任何其他行動(dòng)者,處于網(wǎng)絡(luò)邊緣[12];erbb2、esr1、cdh1、cd69、egfr、nr4a1、tp53、s100a4和thra處于網(wǎng)絡(luò)的中間連接位置,連接能力依次遞減。

        結(jié)構(gòu)洞是“社會(huì)網(wǎng)絡(luò)中的某個(gè)或某些個(gè)體和有些個(gè)體發(fā)生直接聯(lián)系,但與其他個(gè)體不發(fā)生直接聯(lián)系,無(wú)直接聯(lián)系或關(guān)系間斷(disconnection)的現(xiàn)象,從網(wǎng)絡(luò)整體看好像網(wǎng)絡(luò)結(jié)構(gòu)中出現(xiàn)了洞穴”。結(jié)構(gòu)洞的等級(jí)度越高,該點(diǎn)越居于網(wǎng)絡(luò)的核心,其控制力也越大[12],tp53、thra、erbb2、esr1、cdh1和egfr等級(jí)度依次遞減,說(shuō)明其控制力也依次遞減。

        3 結(jié)論與討論

        與乳腺癌轉(zhuǎn)移相關(guān)的基因中,13個(gè)核心基因按照核心程度由高到低排列依次為tp53、thra、erbb2、esr1、cdh1、egfr、nr4a1、cd69、bcl2、cdkn2a、brca2、myc、brca1,其余31個(gè)為邊緣基因。

        tp53官方全稱(chēng)為腫瘤蛋白p53(tumor protein p53),別稱(chēng)有P53、BCC7、LFS1和TRP53。tp53蛋白能通過(guò)調(diào)節(jié)細(xì)胞周期和避免細(xì)胞癌變發(fā)生,保持基因組的穩(wěn)定性,避免突變發(fā)生。在遺傳性乳腺癌和散發(fā)性乳腺癌患者中,tp53突變均會(huì)引起雜合性丟失增強(qiáng)和等位基因失衡,但遺傳性乳腺癌患者的突發(fā)率高于散發(fā)性。端粒紊亂激活p53,反過(guò)來(lái)結(jié)合pgc1-α和pgc1-β將其抑制,從而促進(jìn)端粒和線粒體直接連接[13]。

        目前關(guān)于tp53基因突變能否預(yù)測(cè)乳腺癌轉(zhuǎn)移有很大爭(zhēng)議。劉祖宏等[14]對(duì)92例乳腺潤(rùn)性導(dǎo)管癌患者的標(biāo)本進(jìn)行檢測(cè)發(fā)現(xiàn),乳腺淋巴結(jié)轉(zhuǎn)移與p53蛋白表達(dá)呈正相關(guān),提示p53基因突變與腫瘤細(xì)胞的侵襲轉(zhuǎn)移有相關(guān)性,可能增強(qiáng)腫瘤細(xì)胞的增殖能力,促進(jìn)腫瘤浸潤(rùn)轉(zhuǎn)移。汪海新等[15]通過(guò)免疫組化方法檢測(cè)359例乳腺浸潤(rùn)性導(dǎo)管癌組織中p53的表達(dá)情況卻得出了相反的結(jié)論,即p53蛋白的表達(dá)在區(qū)域淋巴結(jié)無(wú)轉(zhuǎn)移之間的差異均無(wú)統(tǒng)計(jì)學(xué)意義。

        Erbb2(c-erbb2原癌基因)、Brca1(breastCancer SusceptibilityGene 1,腫瘤易感基因)、egfr(epidermal growth factor receptor,表皮生長(zhǎng)因子受體)均參與乳腺癌轉(zhuǎn)移。

        鄭偉等[16]選擇42例乳腺癌患者石蠟固定的組織標(biāo)本,用SABC免疫組織化學(xué)方法檢測(cè)EGFR、C-erbB-2蛋白發(fā)現(xiàn),EGFR的陽(yáng)性率為42.9%,C-erbB-2的陽(yáng)性率為31%,EGFR、C-erbB-2表達(dá)與乳腺癌骨髓微小轉(zhuǎn)移有密切關(guān)系,可以作為判斷乳腺癌預(yù)后的重要指標(biāo)。韓芳芳等[17]應(yīng)用免疫組織化學(xué)PV-9000法檢測(cè)83例乳腺基底細(xì)胞樣癌腫BRCA1、EGFR的表達(dá)發(fā)現(xiàn)BRCA1的陽(yáng)性表達(dá)率為57.83%,EGFR的陽(yáng)性表達(dá)率為87.95%,且各組間的不同臨床分期、不同淋巴結(jié)轉(zhuǎn)移情況各組間均有統(tǒng)計(jì)學(xué)意義,但與二者的表達(dá)無(wú)相關(guān)性。

        文獻(xiàn)調(diào)研發(fā)現(xiàn),tp53、thra、erbb2、esr1、cdh1、egfr、nr4a1、cd69等13個(gè)核心基因中,大部分都與乳腺癌轉(zhuǎn)移有直接或間接的關(guān)系,但cd69對(duì)于乳腺癌轉(zhuǎn)移的具體病理生理學(xué)過(guò)程尚不明確,需要進(jìn)一步驗(yàn)證。這可能是因?yàn)閏d69基因?qū)儆贜K細(xì)胞信號(hào)傳導(dǎo)基因復(fù)合體家族參與細(xì)胞增殖,表達(dá)蛋白在自然殺傷細(xì)胞和血小板中傳導(dǎo)信號(hào),與血液系統(tǒng)疾病及免疫相關(guān)性疾病的發(fā)生與發(fā)展密切相關(guān),也可能與乳腺癌轉(zhuǎn)移相關(guān)。

        4 結(jié)語(yǔ)

        本文利用MetaMap概念匹配PubMed中375篇乳腺癌轉(zhuǎn)移相關(guān)基因文獻(xiàn)的標(biāo)題和摘要,用數(shù)據(jù)挖掘軟件得到乳腺癌轉(zhuǎn)移相關(guān)基因和基因-基因相互作用矩陣,用Ucinet 6分析網(wǎng)絡(luò)相關(guān)指標(biāo),得到13個(gè)核心基因,希望利用基因與轉(zhuǎn)移癌的關(guān)系對(duì)乳腺癌轉(zhuǎn)移的早期診斷和個(gè)性治療提供參考。

        此外,不足之處是cd69基因?qū)τ谌橄侔┺D(zhuǎn)移的具體過(guò)程尚不明確,還需進(jìn)一步實(shí)驗(yàn)驗(yàn)證。MetaMap存在錯(cuò)誤匹配和遺漏匹配的現(xiàn)象,在準(zhǔn)確性和全面性方面有所欠缺。

        猜你喜歡
        語(yǔ)義乳腺癌概念
        絕經(jīng)了,是否就離乳腺癌越來(lái)越遠(yuǎn)呢?
        中老年保健(2022年6期)2022-08-19 01:41:48
        Birdie Cup Coffee豐盛里概念店
        語(yǔ)言與語(yǔ)義
        幾樣概念店
        乳腺癌是吃出來(lái)的嗎
        胸大更容易得乳腺癌嗎
        學(xué)習(xí)集合概念『四步走』
        別逗了,乳腺癌可不分男女老少!
        祝您健康(2018年5期)2018-05-16 17:10:16
        聚焦集合的概念及應(yīng)用
        “上”與“下”語(yǔ)義的不對(duì)稱(chēng)性及其認(rèn)知闡釋
        极品粉嫩小泬无遮挡20p| 久久国产精品美女厕所尿尿av| 中文字幕一区二区人妻秘书| 97在线观看视频| 午夜精品久久久| 免费人成视频网站在线观看不卡| 亚洲成人一区二区三区不卡| 久久精品国产只有精品96 | 国产一区亚洲二区三区| 日本三级欧美三级人妇视频黑白配| 欧美激情二区| 久久精品国产亚洲av高清蜜臀 | 国产在线精品观看一区二区三区| 中文字幕人妻在线中字| 亚洲日韩精品欧美一区二区一| 四虎影视国产884a精品亚洲| 久久久黄色大片免费看| 免费无码一区二区三区a片百度| 日韩精品一区二区亚洲av| 国产9 9在线 | 免费| 亚洲精品国产一区二区免费视频 | 久久九九av久精品日产一区免费 | 国产女人18毛片水真多| 久久AⅤ无码精品色午麻豆| 国产婷婷成人久久av免费| 又爽又黄又无遮挡的视频| 伊人色综合久久天天人手人停| 中文在线最新版天堂av| 中国一级特黄真人片久久| 大肉大捧一进一出好爽视色大师| 亚洲不卡电影| 国产女主播福利在线观看| 亚洲国产成人一区二区精品区| 草莓视频成人| 91亚洲精品久久久蜜桃| 日本一区二区三区高清在线视频 | 日本老熟妇五十路一区二区三区| 久久亚洲精品成人av无码网站| 久久精品日韩av无码| 国产免费人成网站在线播放| 日本亚洲国产精品久久|