亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        TCGA數(shù)據(jù)庫中不同種族肝細胞癌相關(guān)lncRNAs的篩選及功能預(yù)測

        2019-10-24 08:28:08馬佳康任凱凱李雨濛孫金旗
        醫(yī)學研究生學報 2019年10期
        關(guān)鍵詞:數(shù)據(jù)庫差異分析

        馬佳康,任凱凱,李雨濛,李 南,張 玲,王 健,孫金旗,周 博,馬 軍

        0 引 言

        原發(fā)性肝細胞癌是常見的惡性腫瘤[1],據(jù)歐美國家統(tǒng)計顯示,從2010年開始,男性肝細胞癌發(fā)病率處于平臺期,而女性肝細胞癌發(fā)病率卻在迅速增加;通過加強肝炎病毒篩檢和研發(fā)新的抗病毒藥物,可明顯降低肝細胞癌的風險[2]。因此,我們需要進一步探索其發(fā)病機制,找到更有效的診斷標記和治療靶點。

        數(shù)據(jù)顯示人類基因組中90%以上的序列可以被轉(zhuǎn)錄,但只有1%~2%的序列可以編碼蛋白質(zhì)。根據(jù)其轉(zhuǎn)錄本的長度可以分為<200 個核苷酸的小RNA,和>200 個核苷酸的長RNA(lncRNAs)。近年來發(fā)現(xiàn)lncRNAs可能在腫瘤發(fā)生發(fā)展中發(fā)揮重要作用,但對于其生物學功能目前僅有少部分被證實。lncRNAs 具有多種功能,如誘餌、支架,指導(dǎo)信號分子參與許多重要的生物過程,如染色體沉默、基因組印記、染色質(zhì)修飾、轉(zhuǎn)錄調(diào)節(jié)和miRNAs 功能調(diào)節(jié)[3-4]。其中,lncRNAs 通過競爭性內(nèi)源RNA(ceRNA)機制調(diào)控基因表達也已經(jīng)被證實[5-6]。肝細胞癌相關(guān)lncRNAs 的研究,將為其預(yù)防和控制提供新的思路和方法[7]。目前,已發(fā)現(xiàn)數(shù)十種和肝細胞癌相關(guān)的lncRNAs,如H19、HULC、MALAT-1、HOTAIR和HOTTIP 等[5,8-13]。本研究旨在分析TCGA 數(shù)據(jù)庫中白色人種、黑色人種和黃色人種肝細胞癌共有和特有l(wèi)ncRNAs差異譜并預(yù)測其功能和調(diào)控機制。

        1 資料與方法

        1.1 數(shù)據(jù)下載和差異基因篩選從TCGA 數(shù)據(jù)庫共下載349例肝細胞癌患者的臨床資料和轉(zhuǎn)錄組數(shù)據(jù)。另外下載相應(yīng)病例的miRNAs 測序數(shù)據(jù)。通過R 語言edgeR 包對mRNAs、lncRNAs 及miRNAs 的基因樣本分別進行差異分析,標準為|log2FC|>2 且FDR<0.05[14]。

        1.2 lncRNAs 篩選和功能分析通過對白色人種、黑色人種和黃色人種肝細胞癌患者的癌和癌旁組織進行差異分析得到各自的差異的lncRNAs,并比較3 個人種差異lncRNAs 基因譜情況,采用韋恩圖找出3個人種共有的差異lncRNAs。

        1.2.1 ceRNA 網(wǎng)絡(luò)構(gòu)建用肝細胞癌中差異的lncRNAs、mRNAs 和miRNAs,通過數(shù)據(jù)庫miRcode、starBase、miRDB、miRTarBase 和TargetScan 建立lncRNAs-miRNAs-mRNAs的關(guān)系對,通過Cytoscape 軟件從而構(gòu)建ceRNA網(wǎng)絡(luò)。

        1.2.2 lncRNAs 預(yù)后分析以本組所有肝細胞癌患者的臨床數(shù)據(jù)為基礎(chǔ),對3 個人種共同差異的lncRNAs 進行Cox 回歸分析,按P<0.05 或P<0.01 選取lncRNAs,最終得到和肝細胞癌生存相關(guān)的lncRNAs組合。

        1.2.3 lncRNAs 靶基因預(yù)測和功能預(yù)測對多因素Cox 分析得到的lncRNAs,通過MEM-Multi Experiment Matrix(https://biit.cs.ut.ee/mem/)做靶基因預(yù)測(pearson 相關(guān))。對lncRNAs 的靶基因通過R語言的clusterProfiler 包,進行GO 及KEGG 分析,并對結(jié)果進行可視化;使用Cytoscape 軟件的iRegulon插件預(yù)測分析調(diào)控這些靶基因的轉(zhuǎn)錄因子;以FDR<0.001,富集分數(shù)>3.0 以及Targets>10 為篩選條件,來篩選相應(yīng)靶基因的轉(zhuǎn)錄因子。

        1.3 特有的lncRNAs 相關(guān)分析分別對白色人種和黃色人種特有的lncRNAs 進行多因素Cox 分析(黑色人種病例數(shù)太少不做分析),對靶基因分別進行GO、KEGG分析和可視化;iRegulon插件預(yù)測相關(guān)轉(zhuǎn)錄因子。

        2 結(jié) 果

        2.1 差異lncRNAs 篩選白色人種篩選出的差異lncRNAs 上調(diào)989(94%),下調(diào)60(6%);黃色人種上調(diào)152(65%),下調(diào)83(35%);黑色人種上調(diào)301(77%),下調(diào)88(23%)。見圖1。

        2.2 3 個人種共有l(wèi)ncRNAs 篩選、生存分析和功能預(yù)測通過韋恩圖取交集發(fā)現(xiàn),3 個人種共有的差異表達的lncRNAs 有49 個,白色人種和黑色人種重疊基因21.5%,白色人種和黃色人種、黑色人種與黃色人種差別較大,其差異lncRNAs 重疊率僅為7.8%和5.8%,見圖2a。對49 個lncRNAs 進行靶基因預(yù)測,并建立了相關(guān)ceRNA 網(wǎng)絡(luò)圖,見圖2b,其中l(wèi)ncRNA HOTTIP、hsa-mir-424、hsa-mir-373、hsa-mir-182和hsa-mir-519d是重要的節(jié)點基因。

        49個差異的lncRNAs行多因素Cox分析,建立了預(yù) 后 診 斷 組 合,含 有7 個lncRNAs(AC010280.2、AC099508.2、LINC02475、LINC02313、AC138356.1、LINC01224 以及LINC02561),組合能很好判斷患者的預(yù)后(AUC=0.709),其中LINC01224可預(yù)測到相應(yīng)的靶基因。對LINC01224預(yù)測的靶基因行GO富集發(fā)現(xiàn),其功能和DNA復(fù)制、轉(zhuǎn)位、基因表達調(diào)控、表觀遺傳、miRNAs 基因沉默及RNA 轉(zhuǎn)錄后基因沉默等有關(guān)。KEGG 分析顯示,LINC01224 和細胞周期調(diào)控、DNA 復(fù)制相關(guān)。見圖3。其靶基因的轉(zhuǎn)錄因子預(yù)測發(fā)現(xiàn),LINC01224 和TAF7、E2F4、HDAC2、NANOG、SOX5、E2F1、DEAF1、FOXN4、MAFB、ZNF513、TFDP3、ATF2、NKX2-3和EBF1相關(guān),見圖4。

        圖1 不同人種肝細胞癌差異lncRNAs篩選Figure 1 Screening of differentially expressed lncRNAs in different human races in the TCGA database

        圖2 共有的差異lncRNAs篩選和ceRNA調(diào)控網(wǎng)絡(luò)的構(gòu)建Figure 2 Screening of shared differentially expressed lncRNAs and construction of the ceRNA regulatory network

        2.3 白色人種和黃色人種特有的lncRNAs相關(guān)分析維恩圖分析發(fā)現(xiàn),白色人種有724個特有l(wèi)ncRNAs。Cox生存相關(guān)分析后發(fā)現(xiàn)含11 個lncRNAs 的預(yù)后組合(AC008892.1、AC015722.2、AC073987.1、AC090568.2、AC136188.1、AL356215.1、AL591501.1、GACAT3、LINC02327、PLUT以及Z93403.1),組合能很好判斷患者的預(yù)后(AUC=0.767),但在11個基因中未預(yù)測到靶基因。黃色人種特有的lncRNAs 110個,Cox分析后篩選出含6 個lncRNAs 的預(yù)后基因組合(AC006252.1、AC009005.1、AC025048.4、AC093609.1、AC126118.1以及AL024498.1),組合能很好判斷患者的預(yù)后(AUC=0.846)。黃色人種肝細胞癌生存相關(guān)的6個lncRNAs中,lncRNAs AC126118.1和AC093609.1可在現(xiàn)有MEM數(shù)據(jù)庫中找到靶基因,分別預(yù)測到34、37個靶基因。

        圖3 LINC01224的GO、KEGG分析Figure 3 GO and KEGG analyses of LINC01224

        圖4 LINC01224轉(zhuǎn)錄因子預(yù)測Figure 4 Transcription factor prediction analysis of LINC01224

        AC093609.1 的靶基因通過GO 富集后結(jié)果顯示,其功能和離子通道活性如鈣通道活性、被動跨膜轉(zhuǎn)運蛋白活性有關(guān);KEGG 結(jié)果顯示其參與心肌病、心肌細胞腎上腺素能等信號通路的調(diào)控。預(yù)測得到AC093609.1 的轉(zhuǎn)錄因子為GLI2、FLI1 和HOXB7。AC126118.1 的靶基因通過GO 富集后發(fā)現(xiàn),其靶基因和多種代謝功能相關(guān),如羧酸分解代謝過程、脂肪酸β-氧化、脂肪酸分解代謝等;也與酶活性有關(guān),如?;o酶A 脫氫酶活性、氧化還原酶活性、ATP 酶活性等,還與跨膜運動相關(guān);KEGG 結(jié)果也顯示其參與脂肪酸降解、ABC 轉(zhuǎn)運蛋白、氨基酸代謝等信號通路。AC126118.1 靶基因相關(guān)的轉(zhuǎn)錄因子有ESR1、ELK1、FOS、MYBL1、JDP2、EGR1、DEAF1 和POLR2A,見圖5、圖6。

        圖5 lncRNAs AC126118.1和AC093609.1的功能預(yù)測分析Figure 5 Functional prediction analysis of the lncRNAs AC126118.1 and AC093609.1

        圖6 lncRNAs AC126118.1和AC093609.1的轉(zhuǎn)錄因子預(yù)測Figure 6 Transcription factor prediction analysis of the lncRNAs AC126118.1 and AC093609.1

        3 討 論

        本研究首先分析了TCGA 數(shù)據(jù)庫中的HCC 的lncRNAs表達數(shù)據(jù),發(fā)現(xiàn)在3個人種中l(wèi)ncRNAs表達譜差異較大,其中白色人種和黑色人種的lncRNAs表達譜相似性更高一些,而黃色人種和白色人種以及黑色人種的差異較大。其中有49 個共同表達的差異lncRNAs 可以作為HCC 的共有診療標志物。為了進一步研究HCC 的發(fā)生機制和判斷這些指標在診療中的價值,對49 個lncRNAs 進一步行生物信息學分析,利用現(xiàn)有數(shù)據(jù)庫信息,成功構(gòu)建了ceRNA 網(wǎng)絡(luò),其中以hsa-mir-424,hsa-mir-519d,hsa-mir-182,hsa-mir-373 為中心,組成了lncRNAs 和mRNAs的調(diào)控網(wǎng)絡(luò),為今后進一步研究HCC 的表觀遺傳學調(diào)控提供了一定線索。生存相關(guān)的基因常常在腫瘤發(fā)生發(fā)展中起著重要作用,因此本研究對共有l(wèi)ncRNAs 進行Cox 回歸分析,發(fā)現(xiàn)了含有7 個lncRNAs的組合對HCC具有重要的預(yù)后價值。由于lncRNAs的研究數(shù)據(jù)尚少,本研究只發(fā)現(xiàn)LINC01224 有相應(yīng)的功能和信號通路數(shù)據(jù)。本研究對LINC01224進行GO、KEGG 和轉(zhuǎn)錄因子網(wǎng)絡(luò)分析,這為LINC01224的調(diào)控機制的研究奠定了基礎(chǔ)。

        由于各人種存在一定的遺傳差異,因此在HCC發(fā)生發(fā)展中,lncRNAs 的表達譜有明顯差異,其中起重要調(diào)控作用的lncRNAs 也不同,在Venn 圖分析中,有更多的lncRNAs 表現(xiàn)為人種特異性。通過對這些人種特異lncRNAs 行COX 回歸分析,我們分別找出了與白色人種(11個)和黃色人種(6個)預(yù)后相關(guān)的lncRNAs組合,由于黑色人種例數(shù)較少,所以未對其進行生存分析。2 個人種的生存相關(guān)lncRNAs組合中無重疊組分,說明HCC 相關(guān)的關(guān)鍵預(yù)后lncRNAs 存在差異。為了對白色人種和黃色人種預(yù)后相關(guān)的差異lncRNAs 作進一步研究,我們對其進行靶基因預(yù)測,在MEM 數(shù)據(jù)中,未發(fā)現(xiàn)與白色人種HCC 預(yù)后相關(guān)的lncRNAs 的靶基因,說明對這些IncRNA 的功能目前未知。在黃色人種預(yù)后相關(guān)的lncRNAs 中,可 以 找 到lncRNAs AC126118.1 和AC093609.1 靶基因,通過GO、KEGG 和轉(zhuǎn)錄因子預(yù)測分析,有助于今后的功能研究。

        TCGA 數(shù)據(jù)庫擁有海量的信息,包含轉(zhuǎn)錄組、表達譜、基因突變、單核苷酸多態(tài)性及甲基化等信息。通過生物信息學對現(xiàn)有的數(shù)據(jù)庫進行挖掘,我們可以整合分析腫瘤相關(guān)異常信息,為進一步的功能驗證和機制研究奠定基礎(chǔ)。已發(fā)表的關(guān)于HCC 的數(shù)據(jù)挖掘報道,主要針對GEO 數(shù)據(jù),因為GEO 數(shù)據(jù)庫建立較早[6,15],GEO 數(shù)據(jù)主要是芯片數(shù)據(jù),病例數(shù)較少,臨床信息不全面,影響了數(shù)據(jù)挖掘結(jié)果的質(zhì)量。在已發(fā)表的TCGA 數(shù)據(jù)挖掘文獻中,關(guān)于lncRNAs相關(guān)的整合分析[9,16],未考慮人種不同和lncRNAs表達的相關(guān)性。

        本研究針對人種不同,分析了白色人種、黃色人種和黑色人種共有及特有的相關(guān)lncRNAs差異表達譜,并發(fā)現(xiàn)了一些不同人種共有和特有的和預(yù)后相關(guān)的重要lncRNAs,為今后深入的了解肝細胞癌的發(fā)病機制、尋找新的診療靶點提供了重要依據(jù)。

        猜你喜歡
        數(shù)據(jù)庫差異分析
        相似與差異
        音樂探索(2022年2期)2022-05-30 21:01:37
        隱蔽失效適航要求符合性驗證分析
        找句子差異
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        生物為什么會有差異?
        數(shù)據(jù)庫
        財經(jīng)(2017年2期)2017-03-10 14:35:35
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        數(shù)據(jù)庫
        財經(jīng)(2016年15期)2016-06-03 07:38:02
        數(shù)據(jù)庫
        財經(jīng)(2016年3期)2016-03-07 07:44:46
        數(shù)據(jù)庫
        財經(jīng)(2016年6期)2016-02-24 07:41:51
        欧美成人免费看片一区| 亚洲精品少妇30p| 免费人成再在线观看视频| 日本免费人成视频播放| 91蜜桃国产成人精品区在线| 精品一区二区三区久久| 成人做受黄大片| 亚洲av区无码字幕中文色| 亚洲AV无码一区二区三区少妇av| 国产亚洲一区二区精品| 亚洲中字幕日产av片在线| a级毛片100部免费看| 97中文字幕在线观看| 亚洲专区一区二区三区四区五区 | 80s国产成年女人毛片| 亚洲国产精品成人无码区| 国产精品视频免费的| 亚洲av天堂在线免费观看| 波多野结衣av一区二区全免费观看| 亚洲精品国产av成拍色拍| 99久久综合国产精品免费| 亚洲一区二区三区成人网| 亚洲日韩欧美一区、二区| 丰满少妇人妻无码专区| 亚洲av色在线观看网站| 精品日韩一级免费视频| 国产麻豆精品一区| 亚洲免费一区二区三区视频| 久久一区二区视频在线观看| 玩弄放荡人妇系列av在线网站| 国产成人av一区二区三区无码| 亚洲精品日本久久久中文字幕| 亚洲中文字幕精品乱码2021| 亚洲日本中文字幕天天更新| 美女超薄透明丝袜美腿| 中文字幕一区二区黄色| 无码欧美毛片一区二区三| 99热这里只有精品4| 久久精品久久精品中文字幕| 东京热人妻系列无码专区| 日本a级特黄特黄刺激大片|