邢 晨,拜合提亞·阿扎提,馬 軍,木拉提·熱夏提,王玉杰
(新疆醫(yī)科大學(xué)第一附屬醫(yī)院 泌尿外科,新疆泌尿男生殖系統(tǒng)臨床醫(yī)學(xué)研究中心,新疆 烏魯木齊 830054)
膀胱癌的發(fā)病原因目前尚不清楚,主要和吸煙、膀胱結(jié)石、以及化學(xué)物質(zhì)接觸有關(guān)[1]。2018年全球新發(fā)膀胱癌患者約54.9萬(wàn)例,死亡約20萬(wàn)例,男性發(fā)病率為女性的4倍[2]。經(jīng)尿道膀胱腫瘤電切術(shù)是非肌層浸潤(rùn)性膀胱癌的標(biāo)準(zhǔn)治療手段。肌層浸潤(rùn)性膀胱尿路上皮癌、鱗狀細(xì)胞癌、腺癌等以根治性膀胱全切除術(shù)為主。無(wú)論膀胱癌是否發(fā)生肌層浸潤(rùn),術(shù)后多建議常規(guī)進(jìn)行膀胱內(nèi)灌注治療[3]。本研究擬通過(guò)對(duì)膀胱癌基因數(shù)據(jù)庫(kù)的檢索以及應(yīng)用現(xiàn)代高通量生物信息學(xué)分析對(duì)膀胱癌的發(fā)病機(jī)制進(jìn)行深入挖掘,進(jìn)而尋找到膀胱癌發(fā)病的關(guān)鍵基因以及分子通路,為新型診療標(biāo)志物以及藥物治療靶點(diǎn)提供理論依據(jù)。
1.1 數(shù)據(jù)挖掘膀胱癌測(cè)序數(shù)據(jù)來(lái)源于GEO數(shù)據(jù)庫(kù)(www.ncbi.nlm.nih.gov/geo)。其中GSE61615包含4例樣本,分別為2例膀胱癌組織和2例癌旁正常對(duì)照組組織。GSE100926包含6例樣本,分別為3例膀胱癌組織和3例癌旁正常對(duì)照組組織。DAVID(david.ncifcrf.gov/summary.jsp)在線分析軟件對(duì)基因進(jìn)行通用代碼轉(zhuǎn)換。
1.2 高通量生物信息分析對(duì)GSE61615和GSE100926的測(cè)序原始數(shù)據(jù)進(jìn)行均一化處理,剔除差異表達(dá)倍數(shù)過(guò)大或過(guò)小的基因,均一化處理采用R(R i386 3.6.3)語(yǔ)言以及l(fā)ibrary(limma,3.26.8)包進(jìn)行處理,R語(yǔ)言腳本詳見(jiàn)(www.ncbi.nlm.nih.g ov/geo/geo2r/? acc= GSE61615和GSE100926)。應(yīng)用GEO2R對(duì)均一化處理后的原始數(shù)據(jù)進(jìn)行差異基因處理,共同差異表達(dá)基因采用Venn(http://bioinformatics.psb.ugent.be/webtools/Venn/)分析,并應(yīng)用SangerBox進(jìn)行可視化處理?;蚓垲惙治霾捎肕eV數(shù)據(jù)軟件進(jìn)行可視化處理。全部差異表達(dá)基因輸入DAVID進(jìn)行信號(hào)通路預(yù)測(cè),隨后輸入String(string-db.org/cgi/network.pl?)分析軟件獲得蛋白互作關(guān)系信息。最后將蛋白互作關(guān)系信息輸入cytoscape軟件,應(yīng)用cytohubba進(jìn)行關(guān)鍵發(fā)病基因預(yù)測(cè),預(yù)測(cè)方法選擇Degree評(píng)分。
1.3 統(tǒng)計(jì)學(xué)方法以差異表達(dá)倍數(shù)的絕對(duì)值≥2判別差異基因。DAVID信號(hào)通路富集基因最少為2,String蛋白互作標(biāo)準(zhǔn)為聯(lián)系>0.4,P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2.1 測(cè)序數(shù)據(jù)均一化處理GSE61615和GSE100926分別含有42407個(gè)基因測(cè)序的原始數(shù)據(jù),數(shù)據(jù)檢測(cè)結(jié)果顯示數(shù)據(jù)間離散度較大(圖1 A)。應(yīng)用R(R i386 3.6.3)語(yǔ)言以及l(fā)ibrary(limma,3.26.8)包過(guò)濾差異表達(dá)倍數(shù)過(guò)高以及差異表達(dá)倍數(shù)過(guò)低的數(shù)據(jù)后,結(jié)果均一性較好,可供后續(xù)進(jìn)行高通量生物信息學(xué)分析(圖1B)。
圖1 GEO數(shù)據(jù)庫(kù)均一化處理
2.2 差異表達(dá)基因篩選GEO2R對(duì)GSE61615進(jìn)行分析后顯示263個(gè)差異上調(diào)表達(dá)基因和669個(gè)差異下調(diào)表達(dá)基因,GSE100926包含1176個(gè)差異上調(diào)表達(dá)基因和2008個(gè)差異下調(diào)表達(dá)基因。Venn分析顯示共同差異上調(diào)109個(gè),差異下調(diào)408個(gè),SangerBox火山圖可視化結(jié)果(圖略)。MeV數(shù)據(jù)軟件對(duì)517個(gè)共同差異表達(dá)分析,顯示基因間具有可聚類性。
2.3 膀胱癌信號(hào)通路對(duì)517個(gè)共同差異表達(dá)基因應(yīng)用DAVID數(shù)據(jù)庫(kù)進(jìn)行信號(hào)轉(zhuǎn)換,然后輸入DAVID數(shù)據(jù)庫(kù)進(jìn)行富集分析,結(jié)果提示補(bǔ)體與凝血級(jí)聯(lián)通路,軸突導(dǎo)向,鞘脂信號(hào)通路可能是膀胱癌發(fā)病的關(guān)鍵通路(表1)。
表1 KEGG信號(hào)通路分析
2.4 膀胱癌發(fā)病基因預(yù)測(cè)將517個(gè)共同差異表達(dá)基因輸入STRING進(jìn)行互作網(wǎng)絡(luò)分析,結(jié)果顯示482個(gè)差異基因有互作關(guān)系,互作線為1558條,富集平均評(píng)分為6.46。將差異基因互作關(guān)系輸入cytoscape軟件后,應(yīng)用cytohubba計(jì)算提示IL-6(72分)為膀胱癌發(fā)病最相關(guān)基因,其余分別為PTPRC(69分),F(xiàn)CGR3A(52分),CD8A(51分),CSF1R(47分),ITGAX(45分),C1QA(42分),LCP2(41分),F(xiàn)GF2(38分),F(xiàn)CGR2A(37分)。聚類分析提示發(fā)病前10位基因間具有可聚類性。
膀胱癌是發(fā)病率排名第11位的癌癥。其中尿路上皮腫瘤占膀胱癌的95%,包括乳頭狀瘤、低度惡性潛能的尿路上皮乳頭狀瘤、低級(jí)別乳頭狀尿路上皮癌、高級(jí)別乳頭狀尿路上皮癌。膀胱癌發(fā)病原因目前尚不清晰,高發(fā)于50-70歲男性。每年新增43萬(wàn)例,死亡16.5萬(wàn)例[4]。膀胱癌的生存率主要和腫瘤TNM分期有關(guān),5年相對(duì)生存率從Ⅰ期的98%分別下降到Ⅱ、Ⅲ和Ⅳ期的63%、46%和15%[3]。盡管手術(shù)技術(shù)有所改進(jìn),但局部復(fù)發(fā)和(或)遠(yuǎn)處轉(zhuǎn)移的比率仍然很高,主要和膀胱癌的分子發(fā)病機(jī)制尚不明確有關(guān)。因此針對(duì)膀胱癌發(fā)病基因以及通路的研究仍需要更加深入。
生物信息學(xué)是21世紀(jì)發(fā)展的以計(jì)算機(jī)為工具對(duì)生物信息進(jìn)行儲(chǔ)存、檢索和分析的交叉科學(xué)。生物信息學(xué)主要研究生命科學(xué),并且是當(dāng)今生命科學(xué)和自然科學(xué)的重大前沿領(lǐng)域之一,同時(shí)也將是21世紀(jì)自然科學(xué)的核心領(lǐng)域之一[5]。其研究重點(diǎn)主要體現(xiàn)在基因組學(xué)和蛋白質(zhì)組學(xué)兩方面,從核酸和蛋白質(zhì)序列出發(fā),分析序列中表達(dá)的結(jié)構(gòu)功能的生物信息。隨著測(cè)序成本的不斷降低,大量的生物學(xué)數(shù)據(jù)呈現(xiàn)指數(shù)倍增長(zhǎng)。如何利用生物信息學(xué)高效的處理海量數(shù)據(jù)將搶占后基因組時(shí)代的先機(jī)。
既往有研究利用生物信息分析對(duì)膀胱癌的核心基因進(jìn)行預(yù)測(cè),但所得到的結(jié)果各不相同[6-7]。原因可能和不同的數(shù)據(jù)庫(kù)之間數(shù)據(jù)離散度較大有關(guān),而且測(cè)序結(jié)果受到不同的人種、年齡、性別以及基礎(chǔ)疾病等多方面影響。因此在進(jìn)行生物信息分析之前,必要的數(shù)據(jù)矯正勢(shì)在必行。本研究通過(guò)對(duì)膀胱癌測(cè)序原始數(shù)據(jù)進(jìn)行均一化處理發(fā)現(xiàn),未均一化前,數(shù)據(jù)間離散度較大(圖1A),而均一化處理后,數(shù)據(jù)間離散度明顯減少,使得后續(xù)生物信息分析結(jié)果更加可靠。另外本研究同時(shí)選取膀胱癌的2個(gè)測(cè)序結(jié)果進(jìn)行融合分析,從而避免樣本之間差異造成的數(shù)據(jù)偏倚,最終鎖定IL-6為膀胱癌的核心發(fā)病基因。
IL-6是一種多效性細(xì)胞因子,可調(diào)節(jié)多種病理生理學(xué)過(guò)程,包括代謝、炎癥和免疫反應(yīng)[8]。經(jīng)典信號(hào)的激活需要IL-6與其受體(IL-6R)結(jié)合,誘導(dǎo)信號(hào)轉(zhuǎn)導(dǎo)分子和轉(zhuǎn)錄激活因子3(STAT3)的磷酸化,STAT3二聚化并移位到細(xì)胞核中進(jìn)而調(diào)節(jié)靶基因轉(zhuǎn)錄。有研究提示IL-6在腫瘤中呈現(xiàn)過(guò)度表達(dá),并且在促進(jìn)腫瘤轉(zhuǎn)移中起著關(guān)鍵的作用[9-11]。在mRNA和蛋白質(zhì)水平上,IL-6在膀胱癌組織中過(guò)度表達(dá),且IL-6水平升高與更高的臨床分期、治療后更高的復(fù)發(fā)率和更低的生存率相關(guān)[12]。既往研究發(fā)現(xiàn)IL-6在膀胱癌原代培養(yǎng)細(xì)胞以及細(xì)胞系(HT1376 and HT1197)中呈現(xiàn)高表達(dá)趨勢(shì)[13],而在肌層浸潤(rùn)性膀胱癌組織標(biāo)本中表達(dá)更加豐富[14]。IL-6在臨床上可作為膀胱癌患者宿主免疫的替代標(biāo)志物[15]。并且過(guò)度激活的IL-6可以導(dǎo)致膀胱癌患者免疫功能紊亂[16]。因此IL-6在膀胱癌的發(fā)生、發(fā)展以及局部侵襲等病理生理過(guò)程中發(fā)揮重要作用,這與本研究生物信息分析結(jié)果類似。而本文是首次通過(guò)高通量生物信息學(xué),結(jié)合膀胱癌基因測(cè)序以及融合分析提出IL-6在膀胱癌發(fā)病過(guò)程中起著關(guān)鍵作用,更加驗(yàn)證了既往對(duì)IL-6在膀胱癌發(fā)病過(guò)程中的重要作用的猜想。
綜上,本研究通過(guò)融合膀胱癌患者基因測(cè)序結(jié)果以及利用高通量生物信息學(xué)分析,預(yù)測(cè)IL-6在膀胱癌發(fā)病過(guò)程的核心基因,而補(bǔ)體與凝血級(jí)聯(lián)通路可能為膀胱癌發(fā)病中的信號(hào)通路。IL-6可能成為膀胱癌診斷血清標(biāo)志物以及新的治療靶點(diǎn)。