李 楠,遲少麗,劉 巖,王連友
目前肺腺癌(lung adenocarcinoma,LUAD)是人類最常見(jiàn)的惡性腫瘤之一,且其發(fā)病率和病死率呈逐漸上升趨勢(shì)[1,2]。肺腺癌診斷及預(yù)后方面的研究對(duì)臨床治療有重要意義。目前研究認(rèn)為L(zhǎng)UAD的發(fā)生發(fā)展是多因素、多階段以及多基因共同改變作用的結(jié)果,其中長(zhǎng)鏈非編碼RNA(lncRNA)被認(rèn)為發(fā)揮了重要作用[3]。lncRNA是一類長(zhǎng)度大于200 nt的RNA分子,不編碼蛋白質(zhì),可以在不同水平調(diào)控基因的表達(dá),包括染色質(zhì)修飾、轉(zhuǎn)錄水平以及轉(zhuǎn)錄后水平的調(diào)節(jié),與人類多種疾病尤其是腫瘤密切相關(guān)[4-6],目前已有研究發(fā)現(xiàn),某些 lncRNA 在胰腺癌、直腸癌及肝細(xì)胞癌中表達(dá)明顯升高[7-9],提示其與腫瘤的發(fā)生發(fā)展密切相關(guān),但目前關(guān)于lncRNA在肺腺癌中作為腫瘤標(biāo)志物的研究較少。為此,該次研究擬通過(guò)對(duì)TCGA (The Cancer Genome Atlas)公共數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘,探索其在LUAD中差異表達(dá)的lncRNAs作為L(zhǎng)UAD腫瘤標(biāo)志物的效果及指導(dǎo)判斷預(yù)后的意臨床義。
1.1 數(shù)據(jù)收集 高通量RNA-seq結(jié)果于2017年8月2日從TCGA數(shù)據(jù)庫(kù)利用Bioconductor/TCGA biolink從TCGA數(shù)據(jù)庫(kù)下載。利用Kaplan-Meier Plotter數(shù)據(jù)(http://kmplot.com/analysis/)中的肺腺癌數(shù)據(jù)集進(jìn)行在線生存分析。先在LUAD樣本中篩選高突變頻率的lncRNAs。該研究在 HGNC(www.genenames.org)數(shù)據(jù)庫(kù)中搜集了265個(gè)經(jīng)證實(shí)的lncRNAs,將獲得的lncRNAs名稱全部導(dǎo)入cBioPortal數(shù)據(jù)庫(kù)(http://www.cbioportal.org),在基因組和轉(zhuǎn)錄組層面進(jìn)行變異分析,RNA表達(dá)差異Z-score閾值為±2,在所有病例中改變超過(guò)10%的lncRNAs被認(rèn)為有顯著性差異。再驗(yàn)證具有顯著性差異的lncRNAs在腫瘤和正常組織中的表達(dá)差異。所有篩選出具有明顯變異的lncRNAs均使用oncomine數(shù)據(jù)庫(kù)(www.oncomine.org)在 LUAD和正常組織中進(jìn)行轉(zhuǎn)錄水平的表達(dá)差異驗(yàn)證。若Fold change(FC)>1.5且P值<0.05則認(rèn)為結(jié)果有統(tǒng)計(jì)學(xué)意義。
1.2 統(tǒng)計(jì)學(xué)分析 使用Graphpad prism 6.0軟件進(jìn)行統(tǒng)計(jì)學(xué)分析, 包括 t-test、heatmap、ROC 分析。生存分析采用Kaplan-Meier和log-rank檢驗(yàn)法。P<0.05則認(rèn)為結(jié)果有統(tǒng)計(jì)學(xué)意義。
2.1 肺腺癌中變異明顯的lncRNAs 所有備選的lncRNAs均為出現(xiàn)突變的,但是,在265個(gè)lncRNA中有8個(gè)lncRNA的拷貝數(shù)和表達(dá)量的總變異率超過(guò) 10%(圖 1)。 分別為 CASC8 (10%)、HCG11(10% )、DGCR5 (11% )、TP53TG1 (14% )、PVT1(21% )、PTCSC3(13%)、HAR1A (13%)及 HAR1B(10%)。
圖1 基因拷貝數(shù)和mRNA差異熱圖
2.2 總變異率超過(guò)10%的lncRNA對(duì)肺腺癌診斷及預(yù)后價(jià)值的相關(guān)性 利用Kaplan-Meier Plotter在線數(shù)據(jù)對(duì)上述得到的8個(gè)lncRNA進(jìn)行生存分析, 結(jié)果得出,PVT1、HCG11、TP53TG1 和 DGCR5高表達(dá)患者的預(yù)后低于低表達(dá)患者,且結(jié)果具有顯著性差異 (P<0.05, 圖2)。 以上結(jié)果顯示,PVT1、HCG11、TP53TG1和DGCR5是 LUAD預(yù)后不良因素,四者的高表達(dá)與患者生存期縮短呈顯著性相關(guān)(P<0.05)。利用Oncomine中的肺腺癌組織和正常肺組織的RNA-seq數(shù)據(jù)對(duì)上述 4個(gè) lncRNA進(jìn)行ROC分析,TP53TG1和HCG11結(jié)果無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05);PVT1 和 DGCR5 AUC 分別為 0.975 (P<0.01),0.9722(P<0.01),說(shuō)明具有良好診斷效率(圖3)。綜合上述結(jié)果,PVT1和DGCR5可能成為判斷肺腺癌患者預(yù)后的標(biāo)志物。
圖2 總變異率超過(guò)10%的8個(gè)lncRNAs生存分析
圖3 4個(gè)lncRNAs ROC分析
2.3 4個(gè)lncRNAs在腫瘤和正常組織中表達(dá)差異驗(yàn)證 利用Oncomine數(shù)據(jù)庫(kù)的TCGA肺腺癌和正常 組 織 中 PVT1、HCG11、TP53TG1 和 DGCR5 的RNA-seq數(shù)據(jù)進(jìn)行分析,驗(yàn)證其差異表達(dá)。結(jié)果顯示,PVT1在LUAD組織中比正常肺癌組織升高了2.232 倍 (P<0.01),TP53TG1 升高 1.467 (P=0.021)倍,DGCR5 升高了 1.702 倍 (P=2.24E-12)。 而HCG11沒(méi)有顯著性差異。筆者所在課題組將P<0.01的作為有極顯著性差異。上述結(jié)果顯示,PVT1和DGCR5在LUAD組織中的表達(dá)量明顯高于正常肺癌組織,且差異具有極顯著性(P<0.01)。見(jiàn)圖4。
圖4 PVT1、TP53TG1、HCG11 和 DGCR5 在正常肺組織和LUAD組織中的表達(dá)驗(yàn)證
2.4 PVT 1和DGCR5在其他類型腫瘤組織中的表達(dá)分析 利用Oncimne數(shù)據(jù)庫(kù)對(duì)PVT1和DGCR5在29種腫瘤和正常組織中的表達(dá)數(shù)據(jù)進(jìn)行分析,PVT1 在結(jié)腸腺癌(colon adenocarcinoma,COAD)、肝臟肝細(xì)胞癌(liver hepatocellular carcinoma,LIHC)、LUAD、肺鱗狀細(xì)胞癌(lung squamous cell carcinoma,LUSC)、 胰 腺 癌 (pancreatic adenocarcinoma,PAAD)、直腸腺癌(rectum adenocarcinoma,READ)、胃腺癌 (stomach adenocarcinoma,STAD)、胸腺瘤(thymoma,THYM)中明顯升高,在 LAML,OV,THCA中明顯下降。而DECR5僅在LUAD明顯上升,在LGG、PAAD和TGCT中明顯下降。結(jié)果顯示作為L(zhǎng)UAD的標(biāo)志物,DGCR5更具有特異性。
LUAD是常見(jiàn)的惡性腫瘤之一,嚴(yán)重威脅人類健康的惡性腫瘤,早期發(fā)現(xiàn)、診斷、治療可以大大提高肺腺癌患者的存活率[10]。目前臨床常規(guī)物理診斷很難發(fā)現(xiàn)<1 cm的腫瘤,而傳統(tǒng)的腫瘤標(biāo)志物的靈敏度和特異性也不夠高[11]。因此,采用現(xiàn)代分子生物學(xué)技術(shù),尋找理想的腫瘤標(biāo)志物對(duì)于提高惡性腫瘤診治水平具有重大意義。近年來(lái)研究發(fā)現(xiàn)lncRNA具有多種生物活性,參與了X染色體沉默、染色體修飾、轉(zhuǎn)錄激活與抑制及RNA剪切等過(guò)程,在細(xì)胞分化、胚胎與組織發(fā)育、腫瘤中均發(fā)揮重要功能[12-14],但 lncRNA 的數(shù)量眾多,生物學(xué)功能尚不完全清楚。 Han等[15]發(fā)現(xiàn),與癌旁組織相比,lncRNA GAS6-AS1(growth arrest specific gene6 antisense,RNA1)在 NSCLC組織中的表達(dá)水平顯著下調(diào)。且GAS6-AS1的水平與患者淋巴結(jié)轉(zhuǎn)移、腫瘤分期及預(yù)后密切相關(guān),GAS6-AS1表達(dá)水平越低,患者生存期越短。 Zhang 等[16]通過(guò) qRT-PCR 技術(shù),分析 62組肺腺癌組織和鄰近的癌旁組織ZXF1表達(dá)的差別,發(fā)現(xiàn)與鄰近的正常組織相比,肺腺癌組織中ZXF1水平顯著增高;進(jìn)一步分析ZXF1與患者的臨床病理學(xué)特征、預(yù)后之間的關(guān)系,發(fā)現(xiàn)ZXF1表達(dá)上調(diào)與淋巴結(jié)的轉(zhuǎn)移、腫瘤的病理分期以及淋巴結(jié)轉(zhuǎn)移的范圍有關(guān)。這說(shuō)明,長(zhǎng)鏈非編碼RNA在肺腺癌中呈現(xiàn)高表達(dá),并且在腫瘤細(xì)胞增殖和侵襲中發(fā)揮重要作用。
lncRNA在肺癌的發(fā)生、發(fā)展和耐藥過(guò)程中有重要的調(diào)控作用,這些lncRNA部分發(fā)揮致癌作用,因此,加深加快對(duì)lncRNA在腫瘤發(fā)生發(fā)展過(guò)程中的機(jī)制研究有助于對(duì)肺癌的早期診斷及預(yù)后判斷。在該次研究中,利用TCGA數(shù)據(jù)庫(kù)對(duì)肺腺癌中l(wèi)ncRNA進(jìn)行挖掘,發(fā)現(xiàn)8個(gè)在基因拷貝數(shù)和表達(dá)差異超過(guò)10%的lncRNA,并利用在線數(shù)據(jù)分析其在肺腺癌診斷和預(yù)后判斷中的臨床價(jià)值,找到了PVT1和DRCG5兩個(gè)較大臨床價(jià)值的lncRNA,通過(guò)兩種分子在LUAD表達(dá)的驗(yàn)證和其他腫瘤類型中表達(dá)分析,確定DGCR5可以作為特異的對(duì)LUAD進(jìn)行診斷和判斷預(yù)后的指標(biāo),為臨床腫瘤標(biāo)記物的篩選建立提供了研究依據(jù)。