孫潔 查秀芳 張楠楠 桑楠 趙君寧 何偉‰
胃癌(GC)是全世界第五大常見的癌癥,并且是與癌癥相關(guān)的第三大死亡原因。大多數(shù)GC病人有鄰近器官或遠(yuǎn)處轉(zhuǎn)移,這是GC病人死亡的主要原因[1]。因此對(duì)GC病人組織表達(dá)的變化進(jìn)行深入研究,發(fā)現(xiàn)早期GC病人潛在的生物標(biāo)志物和用于治療的新型靶標(biāo)對(duì)改善病人預(yù)后至關(guān)重要。
miRNA是內(nèi)源性微小RNA,通過作用于靶基因從而在許多生物學(xué)功能中起關(guān)鍵作用[2]。目前尚無關(guān)于miR-3934-5p在GC病人中的表達(dá)及其潛在作用機(jī)制的研究。本研究通過利用癌癥基因組圖譜(TCGA)數(shù)據(jù)庫對(duì)GC病人的臨床特征和生存預(yù)后進(jìn)行生物信息學(xué)分析,評(píng)估m(xù)iR-3934-5p的表達(dá)在老年GC病人中的預(yù)后意義以及與臨床特征之間的關(guān)聯(lián),并通過生物信息學(xué)分析預(yù)測miR-3934-5p的靶基因及其潛在作用,探討miR-3934-5p在GC發(fā)生、發(fā)展中的作用。
1.1 數(shù)據(jù)來源及分析工具 從TCGA 數(shù)據(jù)庫(https://portal.gdc.cancer.gov/) GC(STAD)項(xiàng)目中獲得level 3 BCGSC miRNA Profiling的miRNAseq數(shù)據(jù)和臨床數(shù)據(jù)。使用非配對(duì)樣本散點(diǎn)圖及配對(duì)樣本的散點(diǎn)連線圖評(píng)估GC病人中miR-3934-5p的表達(dá)水平。使用R軟件(3.6.3版)中的limma包分析GC組織和匹配的正常組織之間表達(dá)水平的差異,pROC包進(jìn)行ROC分析,survminer包、survival包進(jìn)行生存資料的統(tǒng)計(jì)分析,ggplot2包用于數(shù)據(jù)可視化[3]。由于數(shù)據(jù)是從TCGA數(shù)據(jù)庫中獲得的,因此無需倫理委員會(huì)批準(zhǔn)。UALCAN(http://ualcan.path.uab.edu/)是一個(gè)挖掘TCGA數(shù)據(jù)庫的在線分析網(wǎng)站[4],在網(wǎng)站主頁輸入miR-3934-5p,獲得其在GC組織和正常胃黏膜組織中的表達(dá)情況,并從年齡、腫瘤分期、腫瘤分級(jí)、淋巴結(jié)轉(zhuǎn)移、TP53突變等不同亞組分析miR-3934-5p的表達(dá)差異。
1.2 miR-3934-5p靶基因預(yù)測及功能富集分析 使用在線分析工具miRDB(http://www.mirdb.org)[5]、TargetScan(http://www.targetscan.org/)[6]、miRWalk(http://mirwalk.umm.uni-heidelberg.de/)和DIANA-microT-CDS(http://diana.imis.athena-innovation.gr/)[7]預(yù)測miR-3934-5p的靶基因。為了提高預(yù)測的可靠性,通過Venn圖鑒定了重疊的靶基因。使用STRING(http://string-db.org/)數(shù)據(jù)庫構(gòu)建這些基因的 蛋白互作(protein protein interaction,PPI)網(wǎng)絡(luò),截止標(biāo)準(zhǔn)為綜合得分>0.9。 Cytoscape 3.7.2軟件的cytoHubba插件用于識(shí)別PPI網(wǎng)絡(luò)的關(guān)鍵基因,然后使用R包“ Clusterprofile”包對(duì)這些基因進(jìn)行基因本體(GO)富集分析和《京都基因與基因組百科全書》(KEGG)通路富集分析[8]。臨界標(biāo)準(zhǔn)包括基因計(jì)數(shù)≥5和P<0.05。
1.3 統(tǒng)計(jì)學(xué)方法 統(tǒng)計(jì)分析使用SPSS 24.0軟件包。2組間的計(jì)量資料比較采用成組t檢驗(yàn)或配對(duì)樣本t檢驗(yàn),分類資料比較采用卡方檢驗(yàn),等級(jí)資料比較采用Wilcoxon秩和檢驗(yàn)。二分類Logistic回歸分析miR-3934-5p的表達(dá)與GC病人臨床特征之間的關(guān)系。以P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。
2.1 一般情況 從TCGA數(shù)據(jù)庫中共下載446名具有詳細(xì)臨床資料的GC病人數(shù)據(jù)。年齡30~90歲,平均(65.7±10.8)歲。按照miR-3934-5p表達(dá)的中位數(shù)將病人分為低表達(dá)組和高表達(dá)組,其中位年齡分別為65.0歲和68.5歲,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。此外,低表達(dá)組Grade分級(jí)分布與高表達(dá)組的差異有統(tǒng)計(jì)學(xué)意義(P=0.028)。見表1。
2.2 miR-3934-5p在GC組織中的表達(dá)及與臨床特征的關(guān)系分析 limma包分析結(jié)果顯示,與正常組織相比,miR-3934-5p在GC組織中表達(dá)上調(diào)(P<0.001);在配對(duì)樣本中,正常組織和GC組織的miR-3934-5p表達(dá)差異具有統(tǒng)計(jì)學(xué)意義(P<0.001)。見圖1。
注:a:非配對(duì)樣本散點(diǎn)圖;b:配對(duì)樣本散點(diǎn)圖;***P<0.001圖1 正常組織和GC組織中miR-3934-5p的表達(dá)情況
2.3 不同臨床特征的GC病人中miR-3934-5p的表達(dá)水平 UALCAN分析了不同臨床特征的GC病人中miR-3934-5p表達(dá)水平,結(jié)果顯示,miR-3934-5p表達(dá)上調(diào)與年齡、Grade級(jí)別和TP53突變相關(guān)(P<0.05),提示miR-3934-5p在GC中發(fā)揮了重要作用。見圖2。
注:*P<0.05,**P<0.01,***P<0.001圖2 UALCAN分析miR-3934-5p在不同臨床特征GC中的表達(dá)箱形圖
2.4 miR-3934-5p高表達(dá)與臨床特征的二分類Logistic回歸分析 二分類Logistic回歸分析表明,miR-3934-5p的高表達(dá)與年齡(OR=1.901, 95%CI:1.302~2.787,P<0.001)、T分期(OR=0.585,95%CI:0.378~0.899)顯著相關(guān)。見表2。
表2 miR-3934-5p高表達(dá)與臨床特征的二分類Logistic回歸分析
2.5 miR-3934-5p水平對(duì)GC的潛在診斷價(jià)值及對(duì)老年GC病人預(yù)后的影響 使用ROC曲線分析評(píng)估m(xù)iR-3934-5p對(duì)GC診斷的敏感度和特異度(圖3a),結(jié)果顯示,miR-3934-5p的AUC為0.808,95%CI為0.743~0.872,最佳截?cái)嘀禐?.517,靈敏度為0.854,特異度為0.622,說明miR-3934-5p具備較好的區(qū)分GC的能力,可作為臨床診斷GC的潛在生物標(biāo)志物。此外,對(duì)年齡>65歲的GC病人進(jìn)行生存分析(圖3b),結(jié)果顯示,與miR-3934-5p低表達(dá)組相比,miR-3934-5p高表達(dá)病人的總體生存率較差,差異有統(tǒng)計(jì)學(xué)意義(P=0.024)。見圖3b。
注:a:ROC曲線分析miR-3934-5P在GC中的診斷價(jià)值;b:>65歲病人中miR-3934-5P高、低表達(dá)組Kaplan-Meier生存曲線圖圖3 miR-3934-5p在GC中的診斷價(jià)值及預(yù)后意義
2.6 miR-3934-5p的靶基因預(yù)測及GO/KEGG富集分析結(jié)果 通過TargetScan、miRDB、miRWalk和DIANA等數(shù)據(jù)庫對(duì)miR-3934-5p的靶基因進(jìn)行預(yù)測并取交集,共檢測到182個(gè)重疊基因(圖4a)。使用STRING數(shù)據(jù)庫構(gòu)建這些基因的PPI網(wǎng)絡(luò),然后通過Cytoscape 軟件的cytoHubba插件可以識(shí)別關(guān)鍵基因,前13個(gè)最重要的基因分別是YY1、BRCA1、HDAC3、RBBP4、POU2F1、ASH2L、STAG1、TOPBP1、RAD1、FOXK1、MAML2、MECP2、TAOK1。對(duì)這些基因進(jìn)行GO/KEGG富集分析,結(jié)果如圖4b所示,這些基因主要與p53介導(dǎo)的細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)途徑、細(xì)胞周期、細(xì)胞衰老、DNA復(fù)制、同源重組等相關(guān)。表明miR-3934-5p可能在GC發(fā)生和發(fā)展中起重要作用。
注:a:使用miRWalk、DIANA、TargetScan和miRDB數(shù)據(jù)庫預(yù)測的miR-3934-5p靶基因;b:GO和KEGG通路富集分析結(jié)果;BP:生物過程;CC:細(xì)胞成分;MF:分子功能圖4 miR-3934-5p的靶基因預(yù)測及GO/KEGG富集分析結(jié)果
GC是全球最常見的惡性腫瘤之一,盡管在GC的診斷和治療方面已取得很大進(jìn)展,但5年總生存率仍然很差(約20%~25%)[9]。在中國,GC的發(fā)生率僅低于肺癌,其死亡率僅次于肺癌和肝癌。大多數(shù)早期GC病人無癥狀,并且在診斷時(shí)常常已發(fā)生遠(yuǎn)處轉(zhuǎn)移[10]。因此,迫切需要研究GC發(fā)生和發(fā)展的潛在機(jī)制,以實(shí)現(xiàn)GC的早期診斷,有效治療和提高預(yù)后。
miRNAs是一組長度為18~25個(gè)核苷酸,miRNA可通過結(jié)合相應(yīng)的3′非翻譯區(qū)(3′UTR)來抑制相應(yīng)mRNA的翻譯,從而在轉(zhuǎn)錄后水平上調(diào)節(jié)基因的表達(dá)[11]。越來越多的證據(jù)表明,miRNA可以調(diào)節(jié)許多生物學(xué)功能,包括器官發(fā)育、細(xì)胞凋亡、腫瘤發(fā)生、增殖、應(yīng)激和脂肪代謝[12]。先前已有研究表明,哮喘病人的外周血單個(gè)核細(xì)胞(PBMC)中miR-3934水平顯著降低,重度哮喘與輕度哮喘病人相比,PBMC中miR-3934水平顯著降低[13]。Ye等[2]發(fā)現(xiàn)下調(diào)的miR-3934-5p通過直接調(diào)節(jié)TP53INP1的表達(dá)顯著抑制神經(jīng)母細(xì)胞瘤細(xì)胞的活力并誘導(dǎo)細(xì)胞凋亡。此外,miR-3934-5P的表達(dá)與非小細(xì)胞肺癌(NSCLC)病人的存活率和腫瘤發(fā)展相關(guān),miR-3934-5p在NSCLC中上調(diào),抑制miR-3934-5p可以增強(qiáng)NSCLC細(xì)胞對(duì)順鉑的敏感性,miR-3934-5p可能成為NSCLC的治療靶標(biāo)[14]。但是miR-3934-5p在GC中的作用仍不清楚。
近年來,多種生物信息學(xué)方法為發(fā)現(xiàn)與腫瘤發(fā)生、診斷和預(yù)后相關(guān)的生物標(biāo)志物做出了巨大貢獻(xiàn),多種生物信息數(shù)據(jù)庫的組合用于癌癥分析也取得了一些突破[15]。生物信息學(xué)分析方法可以克服由于個(gè)體研究中不同的樣本量或微陣列平臺(tái)而導(dǎo)致的文獻(xiàn)中不一致的結(jié)果。目前關(guān)于miR-3934-5p的功能作用報(bào)道較少,尤其miR-3934-5p在GC中的功能機(jī)制未見任何研究。
本文研究了miR-3934-5p在GC中的潛在臨床意義,發(fā)現(xiàn)GC病人中miR-3934-5p表達(dá)顯著升高,miR-3934-5p高表達(dá)可用于區(qū)分GC和正常人群。對(duì)GC病人總體生存率進(jìn)行分析發(fā)現(xiàn),65歲以上人群中miR-3934-5p高表達(dá)與不良預(yù)后相關(guān)。本文通過UALCAN分析提示miR-3934-5p表達(dá)上調(diào)與年齡、Grade級(jí)別和TP53突變相關(guān),此外隨著腫瘤分期進(jìn)展,miR-3934-5p表達(dá)似乎呈現(xiàn)先升后降的趨勢,提示miR-3934-5p可能在GC早期發(fā)揮更為重要的作用或通過某些機(jī)制觸發(fā)腫瘤形成,其中具體作用機(jī)制尚待進(jìn)一步研究。GO/KEGG富集分析表明miR-3934-5p調(diào)控了一些重要的生物學(xué)功能,例如,p53介導(dǎo)的細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)途徑、細(xì)胞周期、細(xì)胞衰老、DNA復(fù)制、同源重組等,提示miR-3934-5p可能是促進(jìn)GC發(fā)生的因素,并參與GC的發(fā)生和發(fā)展,有可能成為新的治療靶標(biāo)。
本文存在一定的局限性,首先,本研究缺乏相應(yīng)的實(shí)驗(yàn)和臨床驗(yàn)證;其次,無法消除不同組織學(xué)類型對(duì)結(jié)果影響的可能性。因此,后續(xù)可進(jìn)行實(shí)驗(yàn)驗(yàn)證miR-3934-5p對(duì)GC細(xì)胞增殖、腫瘤生長等方面的影響并探討其機(jī)制。綜上所述,本研究利用生物信息分析的方法最終認(rèn)為miR-3934-5p可能是GC中潛在的促癌因素,同時(shí)生存分析說明miR-3934-5p可能成為預(yù)測老年GC病人預(yù)后的一個(gè)重要的生物學(xué)指標(biāo)。這些發(fā)現(xiàn)可能為GC病人臨床治療發(fā)現(xiàn)新的靶點(diǎn)提供一定的理論依據(jù)。