陳 靖,許 諾,,崔 乙,牟 寧,簡(jiǎn)天明,吉 玲
視網(wǎng)膜母細(xì)胞瘤是一種嬰幼兒最常見(jiàn)的眼內(nèi)發(fā)育性惡性腫瘤[1-3]。隨著臨床醫(yī)生對(duì)視網(wǎng)膜母細(xì)胞瘤認(rèn)識(shí)的逐漸深入,在不影響生存率的前提下出現(xiàn)了全身靜脈、眼動(dòng)脈化學(xué)治療,局部激光光凝治療、玻璃體腔化療、冷凍治療、鞏膜敷貼外放射治療、經(jīng)瞳孔溫?zé)嶂委煹缺Q叟c保視力的治療方式[4]。然而,盡管視網(wǎng)膜母細(xì)胞瘤在發(fā)達(dá)國(guó)家的生存率大于95%,但在中低收入國(guó)家由于診斷不及時(shí)等原因其總體生存率僅為25%~65%[5]。因此深入了解視網(wǎng)膜母細(xì)胞瘤發(fā)生發(fā)展的關(guān)鍵分子,尋找患者早期診斷與治療新靶點(diǎn)仍具有重要的基礎(chǔ)與臨床意義。
隨著基因芯片的轉(zhuǎn)錄組數(shù)據(jù)與生物信息學(xué)分析算法的發(fā)展,學(xué)者們可以利用全世界范圍內(nèi)的高通量數(shù)據(jù)進(jìn)行整合分析并篩選出差異表達(dá)的基因,并能夠提供更敏感和更特異的靶點(diǎn)來(lái)預(yù)測(cè)腫瘤預(yù)后并輔助治療。然而目前基于公共數(shù)據(jù)庫(kù)中視網(wǎng)膜母細(xì)胞瘤數(shù)據(jù)進(jìn)行診斷與治療靶點(diǎn)篩選的研究報(bào)道較為稀缺。因此本研究擬通過(guò)生物信息學(xué)方法對(duì)視網(wǎng)膜母細(xì)胞瘤患者與正常視網(wǎng)膜的轉(zhuǎn)錄組芯片數(shù)據(jù)進(jìn)行挖掘并篩選出候選關(guān)鍵基因,并在視網(wǎng)膜母細(xì)胞瘤細(xì)胞系中進(jìn)行表達(dá)水平驗(yàn)證,為進(jìn)一步明確視網(wǎng)膜母細(xì)胞瘤的發(fā)病機(jī)制提供數(shù)據(jù)支持。
1.1材料從Gene Expression Omnibus(GEO)(https://www.ncbi.nlm.nih.gov/geo/) 數(shù)據(jù)庫(kù)下載基因芯片GSE97508與GSE110811。數(shù)據(jù)集GSE97508于2017-04提交并于2018-08更新。該數(shù)據(jù)集所用實(shí)驗(yàn)平臺(tái)為 Affymetrix 公司提供的人類基因表達(dá)芯片平臺(tái) GPL15207,總共包含9個(gè)樣本,其中3例為正常成年人視網(wǎng)膜組織,6例為視網(wǎng)膜母細(xì)胞瘤組織。數(shù)據(jù)集GSE110811于2018-02提交并于2019-05更新。該數(shù)據(jù)集所用實(shí)驗(yàn)平臺(tái)為Affymetrix公司提供的人類基因轉(zhuǎn)錄檢測(cè)2.0 ST平臺(tái)GPL16686,總共包含34個(gè)樣本,其中3例為正常成年人視網(wǎng)膜組織,3例為良性視網(wǎng)膜細(xì)胞瘤組織,28例為視網(wǎng)膜母細(xì)胞瘤組織。
1.2方法
1.2.1數(shù)據(jù)預(yù)處理與差異表達(dá)基因的獲取使用R語(yǔ)言中的affy 軟件包讀取基因表達(dá)芯片數(shù)據(jù)(CEL格式數(shù)據(jù)),處理成表達(dá)矩陣,用RMA(robust multi-array average)算法對(duì)數(shù)據(jù)進(jìn)行歸一化處理,用Sva包ComBat函數(shù)校正批次效應(yīng),并利用各自平臺(tái)注釋文件進(jìn)行探針注釋,去除未匹配的基因探針信息。進(jìn)一步使用limma軟件包對(duì)GSE97508與GSE110811中視網(wǎng)膜母細(xì)胞瘤腫瘤樣本和正常視網(wǎng)膜樣本進(jìn)行差異表達(dá)基因(differentially expressed gene,DEG)分析。選取|Log2 (Fold Change)| >1.5且P<0.05作為篩選DEG的標(biāo)準(zhǔn)。將以上兩個(gè)數(shù)據(jù)集獲取的DEG取交集得到本研究的目標(biāo)DEG。
1.2.2DEG的功能富集分析使用在線分析工具包括DAVID,KEGG對(duì)DEG進(jìn)行生物學(xué)功能與通路的分析并用R進(jìn)行可視化。DAVID是一個(gè)用于功能注釋和集成發(fā)現(xiàn)基因所代表的生物學(xué)意義的在線數(shù)據(jù)庫(kù)[6]。KEGG是一個(gè)整合了基因組、化學(xué)和系統(tǒng)功能信息的數(shù)據(jù)庫(kù),本研究使用KEGG的PATHWAY數(shù)據(jù)庫(kù)整合當(dāng)前DEG涉及的通路信息[7]?;虮倔w論(gene ontology,GO)分析包括細(xì)胞組分(cellular component,CC),用于描述基因產(chǎn)物在細(xì)胞中的位置;分子功能(molecular function,MF),用于描述單個(gè)基因產(chǎn)物的功能;生物學(xué)過(guò)程(biological process,BP),用于描述具有多個(gè)步驟的有序的生物過(guò)程。以P<0.05且錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,FDR)閾值設(shè)置在<0.01。
1.2.3蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)與子網(wǎng)絡(luò)模塊分析獲取樞紐基因使用在線分析工具STRING (http://string-db.org)進(jìn)行蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)構(gòu)建[8]。為進(jìn)一步獲得PPI中的樞紐基因,使用Cytoscape軟件(http://www.cytoscape.org/)中的CytoHubba與Molecular Complex Detection(MCODE)兩個(gè)插件篩選樞紐基因[9]。MCODE模塊用以發(fā)現(xiàn)PPI網(wǎng)絡(luò)中緊密聯(lián)系的基因,參數(shù)設(shè)置:網(wǎng)絡(luò)分?jǐn)?shù)閾值:2;節(jié)點(diǎn)分?jǐn)?shù)閾值:0.2;K-score:2;最大深度:100。CytoHubba采用11種拓?fù)浞治龇椒▽?duì)PPI網(wǎng)絡(luò)數(shù)據(jù)節(jié)點(diǎn)進(jìn)行排名以推測(cè)在基因調(diào)控,細(xì)胞路徑和信號(hào)轉(zhuǎn)導(dǎo)中的樞紐基因。本研究采用Degree法納入值≥10的基因。
1.2.4驗(yàn)證樞紐基因及診斷效能評(píng)估本研究納入一個(gè)獨(dú)立的驗(yàn)證數(shù)據(jù)集GSE24673對(duì)篩選到的樞紐基因進(jìn)行驗(yàn)證。數(shù)據(jù)集GSE24673于2010-10提交并于2019-08更新,所用實(shí)驗(yàn)平臺(tái)為 Affymetrix公司提供的人類基因轉(zhuǎn)錄檢測(cè)1.0 ST平臺(tái)GPL6244,總共包含11個(gè)樣本,其中2例為正常成年人視網(wǎng)膜組織,9例為視網(wǎng)膜母細(xì)胞瘤組織。并在GSE110811中采用受試者工作特征(receiver operating characteristic,ROC)曲線從基因表達(dá)量與診斷效能方面驗(yàn)證樞紐基因。采用ROC曲線下的面積(area under ROC curve,AUC)作為判斷診斷效能的評(píng)價(jià)指標(biāo)。
1.2.5細(xì)胞培養(yǎng)本研究采用視網(wǎng)膜母細(xì)胞瘤細(xì)胞系Y79、Weri-Rb1與HXO-Rb44,對(duì)照細(xì)胞系采用人RPE細(xì)胞系A(chǔ)RPE-19。Y79、Weri-Rb1與HXO-Rb44細(xì)胞系采用90% RPMI-1640+10%FBS條件培養(yǎng);ARPE-19細(xì)胞系采用90%DMEM+10%FBS條件培養(yǎng)。置于37℃、體積分?jǐn)?shù)5%CO2培養(yǎng)箱中,隔天換液。顯微鏡下觀察細(xì)胞生長(zhǎng)至80%~90%進(jìn)行細(xì)胞傳代。
1.2.6qRT-PCR驗(yàn)證樞紐基因按照RNA逆轉(zhuǎn)錄試劑盒步驟將提取的RNA逆轉(zhuǎn)錄合成cDNA。將獲取的cDNA分別加入各引物的反應(yīng)體系中進(jìn)行實(shí)時(shí)熒光定量PCR。擴(kuò)增后進(jìn)行熔解曲線分析,以β-actin為內(nèi)參照,采用2-ΔΔCt法計(jì)算各目的基因mRNA相對(duì)表達(dá)量。引物序列見(jiàn)表1。
表1 引物序列
統(tǒng)計(jì)學(xué)分析:應(yīng)用R v.3.4.3進(jìn)行上述生物信息學(xué)分析可視化。應(yīng)用GraphPad Prism v.8.01進(jìn)行樞紐基因在驗(yàn)證數(shù)據(jù)集的表達(dá)差異驗(yàn)證。兩組間比較采用獨(dú)立樣本t檢驗(yàn);多組間比較采用單因素方差分析,進(jìn)一步兩兩比較采用LSD-t檢驗(yàn),以P<0.05認(rèn)為差異具有統(tǒng)計(jì)學(xué)意義。
2.1視網(wǎng)膜母細(xì)胞瘤的差異表達(dá)基因與功能富集分析數(shù)據(jù)集GSE97508篩選出DEG共715個(gè),包括上調(diào)基因192個(gè),下調(diào)基因523個(gè)。數(shù)據(jù)集GSE110811篩選出DEG共273個(gè),包括上調(diào)基因104個(gè),下調(diào)基因169個(gè)。兩者取交集共獲得DEG 121個(gè)。對(duì)DEG的富集分析中KEGG通路富集分析結(jié)果發(fā)現(xiàn)差異基因主要富集于細(xì)胞周期、光傳導(dǎo)通路與p53信號(hào)通路上(圖1),GO分析結(jié)果發(fā)現(xiàn)DEG的生物學(xué)過(guò)程(GO-BP)主要富集于可見(jiàn)光接收、視紫紅質(zhì)信號(hào)傳導(dǎo)通路、有絲分裂細(xì)胞核分裂、染色體分離與視紫紅質(zhì)信號(hào)傳導(dǎo)調(diào)節(jié)通路上(圖2A);細(xì)胞組分(GO-CC)主要富集于凝縮的染色體中心粒、紡錘體微管與極點(diǎn)、光感受器內(nèi)外節(jié)膜與光感受器外節(jié)等上(圖2B);分子功能(GO-MF)主要富集于G蛋白偶連光感受器活性、蛋白結(jié)合、微管結(jié)合、蛋白激酶活性、ATP結(jié)合等功能上(圖2C)。
圖1 視網(wǎng)膜母細(xì)胞瘤DEG的KEGG分析結(jié)果。
圖2 視網(wǎng)膜母細(xì)胞瘤DEG的GO分析結(jié)果 A:生物學(xué)過(guò)程;B:細(xì)胞組分;C:分子功能。
2.2PPI網(wǎng)絡(luò)構(gòu)建及子網(wǎng)絡(luò)模塊分析視網(wǎng)膜母細(xì)胞瘤DEG 為進(jìn)一步了解上述差異基因的蛋白互作網(wǎng)絡(luò),我們通過(guò)構(gòu)建DEG的PPI網(wǎng)絡(luò)(圖3A)并利用MCODE插件發(fā)現(xiàn)3個(gè)子模塊,包括子模塊1包含的35個(gè)上調(diào)樞紐基因(圖3B);子模塊2包含的8個(gè)下調(diào)樞紐基因(圖3C);子模塊3包含的3個(gè)下調(diào)樞紐基因(圖3D)。采用CytoHubba插件共得到39個(gè)樞紐基因,采用MCODE插件共富集得到46個(gè)樞紐基因,兩者分別與GSE97508與GSE110811數(shù)據(jù)集中差異最大的30個(gè)基因取交集最終得到MCM6、DTL、UBE2T、TOP2A、NUSAP1、CENPK、RRM2、RLBP1、RHO共9個(gè)樞紐基因(表2,圖4)。
圖3 PPI網(wǎng)絡(luò)構(gòu)建與子網(wǎng)絡(luò)模塊圖 A:PPI網(wǎng)絡(luò)圖;B:MCODE子模塊1;C:MCODE子模塊2;D:MCODE子模塊3;紅色:上調(diào)基因;綠色:下調(diào)基因。
表2 視網(wǎng)膜母細(xì)胞瘤樞紐基因
圖4 MCODE和CytoHubba及Top DEG韋恩圖。
2.3驗(yàn)證數(shù)據(jù)集與ROC曲線驗(yàn)證視網(wǎng)膜母細(xì)胞瘤的樞紐基因?yàn)轵?yàn)證上述9個(gè)樞紐基因是否在視網(wǎng)膜母細(xì)胞瘤發(fā)生發(fā)展中起到作用,我們納入一個(gè)獨(dú)立數(shù)據(jù)集GSE24673驗(yàn)證他們的表達(dá)量。結(jié)果顯示:9個(gè)樞紐基因在GSE24673中的表達(dá)趨勢(shì)與上述測(cè)試數(shù)據(jù)集的表達(dá)結(jié)果一致,差異均有統(tǒng)計(jì)學(xué)意義(P<0.001,圖5)。進(jìn)一步利用ROC曲線在GSE110811中對(duì)上述9個(gè)樞紐基因的表達(dá)量對(duì)視網(wǎng)膜母細(xì)胞瘤的診斷價(jià)值進(jìn)行驗(yàn)證。結(jié)果顯示:上調(diào)基因中UBE2T、RRM2與下調(diào)基因中的RHO共3個(gè)基因有統(tǒng)計(jì)學(xué)意義且曲線下面積(AUC)≥80%(圖6)。
圖5 數(shù)據(jù)集GSE24673中9個(gè)樞紐基因表達(dá)量 A:MCM6;B:DTL;C:UBE2T;D:TOP2A;E:NUSAP1;F:CENPK;G:RLBP1;H:RRM2;I:RHO;bP<0.001 vs 正常視網(wǎng)膜組。
圖6 AUC大于80%的樞紐基因ROC曲線 A:UBE2T;B:RRM2;C:RHO。
2.4qRT-PCR驗(yàn)證視網(wǎng)膜母細(xì)胞瘤的樞紐基因利用qRT-PCR驗(yàn)證上述3個(gè)樞紐基因在視網(wǎng)膜母細(xì)胞瘤細(xì)胞系Y79、Weri-Rb1、HXO-Rb44與視網(wǎng)膜色素上皮細(xì)胞系A(chǔ)RPE-19中表達(dá)情況。結(jié)果確認(rèn)UBE2T與RRM2在3種視網(wǎng)膜母細(xì)胞瘤細(xì)胞系中mRNA表達(dá)量均顯著高于細(xì)胞系A(chǔ)RPE-19,而RHO的mRNA表達(dá)量顯著低于細(xì)胞系A(chǔ)RPE-19,差異均有統(tǒng)計(jì)學(xué)意義(P<0.001,表3,圖7)。
圖7 qRT-PCR驗(yàn)證視網(wǎng)膜母細(xì)胞瘤樞紐基因表達(dá)水平 A:UBE2T;B:RRM2;C:RHO;bP<0.001 vs ARPE-19。
表3 qRT-PCR驗(yàn)證視網(wǎng)膜母細(xì)胞瘤樞紐基因表達(dá)水平
生物信息學(xué)已被廣泛運(yùn)用于各類疾病關(guān)鍵致病基因和信號(hào)通路的篩選。在視網(wǎng)膜母細(xì)胞瘤發(fā)病機(jī)制的相關(guān)研究中,生物信息學(xué)方法的使用也越來(lái)越多[10-11]。Zhao等[10]利用GEO數(shù)據(jù)庫(kù)對(duì)罹患單側(cè)與雙側(cè)視網(wǎng)膜母細(xì)胞瘤的患者進(jìn)行差異表達(dá)基因與功能富集分析,但該研究缺少腫瘤組織與正常視網(wǎng)膜組織的比較。Huang等[11]也利用公共數(shù)據(jù)庫(kù)進(jìn)行視網(wǎng)膜母細(xì)胞瘤關(guān)鍵致病基因的篩選,但未進(jìn)行細(xì)胞實(shí)驗(yàn)驗(yàn)證預(yù)測(cè)結(jié)果的可靠性。本研究通過(guò)生物信息學(xué)方法篩選并在細(xì)胞水平驗(yàn)證網(wǎng)膜母細(xì)胞瘤與正常視網(wǎng)膜的關(guān)鍵差異基因,為進(jìn)一步明確視網(wǎng)膜母細(xì)胞瘤的發(fā)病機(jī)制提供重要信息。
本研究發(fā)現(xiàn)視網(wǎng)膜母細(xì)胞瘤的DEG除了富集于細(xì)胞周期以外,光傳導(dǎo)與p53通路也參與了視網(wǎng)膜母細(xì)胞瘤的發(fā)病。光傳導(dǎo)通路包括一系列的生化反應(yīng),可將光子轉(zhuǎn)化為視錐與視桿細(xì)胞中的神經(jīng)沖動(dòng)。本研究結(jié)果中光傳導(dǎo)通路涉及的基因均為下調(diào)基因,說(shuō)明視網(wǎng)膜光感受器去分化是視網(wǎng)膜母細(xì)胞瘤進(jìn)展的重要原因之一。既往對(duì)視網(wǎng)膜母細(xì)胞瘤光傳導(dǎo)通路相關(guān)基因的研究提示該腫瘤為視錐細(xì)胞來(lái)源,且該通路基因與視網(wǎng)膜母細(xì)胞瘤的進(jìn)展相關(guān)[12]。p53通路在眾多腫瘤的發(fā)病中起到關(guān)鍵作用。相關(guān)研究已經(jīng)證實(shí)p53基因敲除的小鼠可發(fā)展成雙側(cè)視網(wǎng)膜母細(xì)胞瘤。然而視網(wǎng)膜母細(xì)胞瘤基因組中p53基因并未產(chǎn)生突變。文獻(xiàn)報(bào)道其可能的激活機(jī)制為:Rb1基因失活導(dǎo)致Arf、MDM2與MDMX激活,磷酸化的MDM2或MDMX轉(zhuǎn)位到細(xì)胞核與p53結(jié)合,通過(guò)增加p53蛋白的降解而影響細(xì)胞存活,促進(jìn)視網(wǎng)膜母細(xì)胞瘤的進(jìn)展[13]。本研究從生物信息學(xué)的角度再次證實(shí)了p53通路失活在視網(wǎng)膜母細(xì)胞瘤發(fā)病機(jī)制中的作用。
本研究發(fā)現(xiàn)UBE2T、RRM2與RHO為視網(wǎng)膜母細(xì)胞瘤的關(guān)鍵基因。其中RRM2是核糖核苷酸還原酶(ribonucleotide reductase,RNR)的一個(gè)亞基。它是細(xì)胞周期中維持DNA合成與修復(fù)的重要蛋白,并且早有研究發(fā)現(xiàn)其存在惡性潛能[14]。Nie等[15]應(yīng)用RNA-seq技術(shù)對(duì)比視網(wǎng)膜母細(xì)胞瘤與正常視網(wǎng)膜轉(zhuǎn)錄組差異基因同樣發(fā)現(xiàn)了RRM2是視網(wǎng)膜母細(xì)胞瘤發(fā)生發(fā)展中的關(guān)鍵基因。既往研究表明RRM2可促進(jìn)膠質(zhì)母細(xì)胞瘤的增殖、遷移和侵襲,并抑制癌細(xì)胞凋亡,靶向抑制RRM2可抑制DNA復(fù)制,導(dǎo)致包括胰腺癌、卵巢癌與結(jié)腸癌等癌細(xì)胞的凋亡[16]。Rahman等[17]也報(bào)道利用納米顆粒靶向抑制RRM2可調(diào)節(jié)Bcl2抑制頭頸部腫瘤與肺癌的生長(zhǎng)。RHO編碼視紫紅質(zhì),它屬于G蛋白偶聯(lián)受體,是視桿細(xì)胞的特異性標(biāo)記物。作為成熟視網(wǎng)膜標(biāo)記物,RHO在既往視網(wǎng)膜母細(xì)胞瘤高通量表達(dá)譜芯片數(shù)據(jù)中均證明為低表達(dá)狀態(tài)[18]。對(duì)視網(wǎng)膜母細(xì)胞瘤的組織病理學(xué)研究也確定光感受器的低分化與視網(wǎng)膜母細(xì)胞瘤的惡性程度呈正相關(guān)[19]。有研究同樣利用全基因組表達(dá)譜芯片分析發(fā)現(xiàn)視網(wǎng)膜母細(xì)胞瘤中包括RHO在內(nèi)的光感受器標(biāo)志物的喪失可導(dǎo)致視網(wǎng)膜母細(xì)胞瘤惡性程度增高[20]。UBE2T編碼的功能蛋白屬于泛素結(jié)合酶E2家族。它的功能最早發(fā)現(xiàn)于范可尼貧血綜合征中[21]。而近年來(lái)UBE2T被認(rèn)為是促癌基因在不同腫瘤的發(fā)生發(fā)展中發(fā)揮重要作用。已經(jīng)證明UBE2T在包括乳腺癌、肺癌、胃癌、肝癌、前列腺癌、鼻咽癌與骨肉瘤中表達(dá)量均較對(duì)照組升高,并且其表達(dá)量在其中大多數(shù)腫瘤中可作為預(yù)測(cè)不良預(yù)后的獨(dú)立危險(xiǎn)因素[22-24]。本團(tuán)隊(duì)成員也進(jìn)一步對(duì)UBE2T在視網(wǎng)膜母細(xì)胞瘤發(fā)生發(fā)展中的功能進(jìn)行深入研究,確認(rèn)了在蛋白層面UBE2T在視網(wǎng)膜母細(xì)胞瘤中高表達(dá),其表達(dá)量與視網(wǎng)膜母細(xì)胞瘤的惡性程度相關(guān),并通過(guò)激活STAT3通路促進(jìn)腫瘤的形成[25]。
本文也存在一些局限性,如使用的數(shù)據(jù)集均來(lái)源于視網(wǎng)膜母細(xì)胞瘤的大體腫瘤,且更新于2019-05,而近年來(lái)有學(xué)者采用單細(xì)胞測(cè)序技術(shù)對(duì)視網(wǎng)膜母細(xì)胞瘤的分子亞型進(jìn)行分類,為其精準(zhǔn)治療提供方向[26]。另外,本研究納入的基因均屬于功能基因,而目前認(rèn)為包括miRNA、lncRNA與circRNA在內(nèi)的眾多非編碼RNA也參與了視網(wǎng)膜母細(xì)胞瘤的發(fā)生與發(fā)展[27]。因此需要多組學(xué)測(cè)序技術(shù)對(duì)其治療新靶點(diǎn)進(jìn)行探討,為視網(wǎng)膜母細(xì)胞瘤的生物信息學(xué)分析提供新方向[28]。
綜上,本研究通過(guò)生物信息學(xué)綜合分析視網(wǎng)膜母細(xì)胞瘤數(shù)據(jù)集篩選出UBE2T、RRM2與RHO這三個(gè)關(guān)鍵基因未來(lái)可能成為視網(wǎng)膜母細(xì)胞瘤的潛在治療靶點(diǎn)。