張艷,吳瑜瑜
(福建醫(yī)科大學(xué)附屬第二醫(yī)院眼科,福建 泉州 362000)
視網(wǎng)膜母細(xì)胞瘤(retinoblastoma,RB)是兒童最常見眼內(nèi)惡性腫瘤,可損害患兒視力、眼球,甚至危及生命。2/3患者3歲以內(nèi)發(fā)病,在世界范圍內(nèi),新生兒發(fā)病率為1:16 000~1:18 000,每年約有8 000例新生病例確診[1]。雖然已經(jīng)發(fā)現(xiàn)RB1基因的突變或缺失是RB發(fā)生的主要原因,即使RB具有明確RB1突變,癌變發(fā)展過程中也會(huì)發(fā)生其他基因組的變化,例如轉(zhuǎn)錄相關(guān)基因(BCOR)是繼RB1之后最常見的突變基因[2]。而且有一部分單側(cè)發(fā)病的病例未發(fā)現(xiàn)RB1突變,因此近年來在探索RB1突變之外的其他發(fā)病機(jī)制。基因芯片技術(shù)能快速檢測(cè)差異表達(dá)基因(differentially expressed genes,DEGs),經(jīng)過十余年的應(yīng)用,已被證明是一種可靠的技術(shù)[3],大量基因芯片上的數(shù)據(jù)存儲(chǔ)在公共數(shù)據(jù)庫(kù)中,通過這些數(shù)據(jù)庫(kù),整合生物信息學(xué)方法對(duì)RB和正常視網(wǎng)膜組織進(jìn)行DEGs篩選,對(duì)其進(jìn)行生物學(xué)功能、信號(hào)通路及差異基因的蛋白互作網(wǎng)絡(luò)(protein-protein interaction,PPI)分析,從而幫助我們進(jìn)一步研究和更好地探索RB發(fā)生發(fā)展的潛在機(jī)制。
從美國(guó)國(guó)立生物技術(shù)信息中心(National Center of Biotechnolog y Information,NCBI)公共數(shù)據(jù)平臺(tái)GEO中獲取2 組基因芯片數(shù)據(jù)譜GSE97508芯片,平臺(tái)是GPL15207 [(PrimeView) Affymetrix Human Gene Expression Array)和GSE110811[4],芯片平臺(tái)是GPL16686 [(HuGene-2_0-st) Affymetrix Human Gene 2.0 ST Array transcript (gene) version],該2個(gè)芯片數(shù)據(jù)分別包括6個(gè)RB組織和3個(gè)正常視網(wǎng)膜組織和28個(gè)RB組織和3個(gè)正常視網(wǎng)膜組織。
采用GEO2R在線工具對(duì)2組芯片的RB組織標(biāo)本與正常視網(wǎng)膜組織標(biāo)本之間的DEGs進(jìn)行篩選,篩選條件為|log(差異倍數(shù)FC)|>2,差異顯著性矯正P<0.05,log FC<0為下調(diào)DEGs,而log FC>0為上調(diào)DEGs。然后對(duì)2組芯片篩選出的DEGs用在線Draw Venn Diagrams(http://bioinformatics.psb.ugent.be/webtools/Venn/)軟件取交集進(jìn)一步找出共同的DEGs。
基因本體注釋(gene ontology analysis,GO)是一種常用的定義基因及其RNA或蛋白產(chǎn)物的方法,用于識(shí)別高通量轉(zhuǎn)錄組或基因組數(shù)據(jù)的獨(dú)特生物學(xué)特性[5]。GO注釋目前包括3個(gè)方面的生物學(xué)內(nèi)容:分子功能(molecular function,MF)、細(xì)胞成分(cellular components,CC)、生物過程(biological process,BP)。KEGG是1個(gè)關(guān)于基因組、疾病、生物途徑、藥物和化學(xué)物質(zhì)的數(shù)據(jù)庫(kù)集合[6]。本研究采用在線STRING檢索工具(search tool for the retrieval of interacting genes,STRING)對(duì)DEGs進(jìn)行GO注釋和KEGG富集通路分析,并對(duì)KEGG通路進(jìn)行可視化圖形展示(P<0.05)。
采用STRING數(shù)據(jù)庫(kù)對(duì)DEGs的PPI進(jìn)行可視化[7],去除網(wǎng)絡(luò)未連接點(diǎn),并進(jìn)一步篩選出中心性最高,即與其他節(jié)點(diǎn)關(guān)系最密切的核心基因。
本研究中有34個(gè)RB組織和6個(gè)正常視網(wǎng)膜組織。通過GEO2R在線工具,我們分別從基因芯片GSE97508和GSE110811中根據(jù)篩選條件為|log(差異倍數(shù)FC)|>2,差異顯著性矯正P<0.05,分別篩選出1 356和1 150個(gè)DEGs。然后利用Draw Venn Diagrams軟件對(duì)2組DEGs進(jìn)一步取交集共篩選到20個(gè)常見DEGs,其中RB組織中有17個(gè)下調(diào)DEGs (logFC<0),3個(gè)上調(diào)DEGs (logFC>0) (表1,圖1)。
圖1 通過Venn Diagrams軟件對(duì)2組芯片數(shù)據(jù)(GSE97508和GSE118011)DEGs取交集共20個(gè)DEGsFigure 1 Venn Diagrams are used to intersect two groups of chip data (GSE97508 and GSE118011)DEGs,and there are 20 DEGs in total
表1 20個(gè)DEGsTable 1 20 DEGs
20個(gè)RB的DEGs的GO分析結(jié)果如下,1)上調(diào)DEGs對(duì)于生物過程(biological process,BP):DNA構(gòu)象改變、染色體濃縮、調(diào)控有絲分裂細(xì)胞周期過程、姐妹染色單體分離、核分裂、細(xì)胞分裂;2)上調(diào)DEGs對(duì)于分子功能(molecular function,MF):DNA催化劑;3)下調(diào)DEGs對(duì)于BP:調(diào)節(jié)視紫紅質(zhì)介導(dǎo)的信號(hào)通路、光刺激的感覺、光感受器細(xì)胞的修復(fù)、視覺感知、磷酸鹽代謝過程負(fù)調(diào)控、蛋白質(zhì)修飾過程的負(fù)調(diào)控、類維生素A代謝過程;4)下調(diào)DEGs對(duì)于MF:細(xì)胞內(nèi)環(huán)狀核苷酸激活了陽離子通道活性、cGMP連接;5)下調(diào)DEGs對(duì)于CC:光感受器外節(jié)、睫狀體、睫狀體膜、細(xì)胞膜、質(zhì)膜、感光細(xì)胞內(nèi)外節(jié)、神經(jīng)投射、高爾基體膜和突觸(表2)。KEGG通路分析結(jié)果表明:DEGs富集于光傳導(dǎo)信號(hào)通路,其中包括CNGA1,CNGB1,RHO,SAG四個(gè)基因均為下調(diào)DEGs,并對(duì)通路進(jìn)行可視化圖形展現(xiàn)(表3,圖2)。而上調(diào)DEGs沒有顯著的信號(hào)通路(P<0.05)。
圖2 DEGs 的KEGG 富集在光傳導(dǎo)通路,標(biāo)紅色五角星為4 個(gè)DEGs,其中CNG 為CNGA1,CNGB1,RH 為RHO,Arr 為SAGFigure 2 KEGG of DEGs was enriched in the photoconductive pathway,and there were four DEGs marked with red pentagrams,among which CNG was CNGA1,CNGB1,RH was Rho,and Arr was SAG
表2 DEGs的GO功能注釋Table 2 GO analysis of DEGs
表3 DEGs的KEGG富集通路Table 3 KEGG pathway of DEGs
使用Str ing在線工具對(duì)20個(gè)DEGs進(jìn)行蛋白質(zhì)與蛋白質(zhì)相互作用網(wǎng)絡(luò)的構(gòu)建,結(jié)果顯示 20節(jié)點(diǎn)和9條相互作用關(guān)系(圖3)。發(fā)現(xiàn)與其他節(jié)點(diǎn)連接最緊密核心基因RHO,連接基因包括CNGA1,CNGB1,SAG,CABP5和BCO2。
圖3 使用String (https://string-db.org/)在線工具對(duì)20 個(gè)DEGs 進(jìn)行蛋白質(zhì)與蛋白質(zhì)相互作用網(wǎng)絡(luò)的構(gòu)建,結(jié)果顯示20節(jié)點(diǎn)和9 條相互作用關(guān)系。與其他節(jié)點(diǎn)連接最緊密核心基因?yàn)镽HO,連接基因包括CNGA1,CNGB1,SAG,CABP5 和BCO2Figure 3 The String (https://string-db.org/) online tool showed PPI network of 20 DEGs,and the results showed 20 nodes and 9 interaction relationships.The most closely linked core gene was Rho,which included CNGA1,CNGB1,SAG,CABP5 and BCO2
RB是兒童最常見的眼內(nèi)惡性腫瘤,在RB早期及時(shí)診斷和干預(yù),患兒的存活率超過95%,而一旦發(fā)生眼外轉(zhuǎn)移,其存活率低于50%[8]。近年來對(duì)RB基因組學(xué)研究增多,本研究利用生物信息學(xué)分析方法對(duì)GEO數(shù)據(jù)庫(kù)下載的RB組織和正常視網(wǎng)膜組織的基因片數(shù)據(jù)進(jìn)行DEGs分析,并對(duì)其進(jìn)行功能聚類分析、功能富集分析和相互作用網(wǎng)絡(luò)分析,從而深入了解RB發(fā)生、發(fā)展的分子機(jī)制,篩選可作為除RB基因以外的診斷的關(guān)鍵基因和治療藥物靶點(diǎn)。
在本研究通過R B組織和正常視網(wǎng)膜組織的比較,共篩出20個(gè)DEGs,其中上調(diào)基因3個(gè),下調(diào)基因17個(gè),應(yīng)用在線STRING數(shù)據(jù)庫(kù)進(jìn)行GO功能注釋結(jié)果顯示表達(dá)上調(diào)基因所富集的功能主要在細(xì)胞分裂、染色體濃縮、核分裂和DNA構(gòu)象改變。下調(diào)基因主要富集在光傳導(dǎo)、視覺感知、光感受器細(xì)胞修復(fù)、感光細(xì)胞內(nèi)外節(jié)和調(diào)節(jié)視紫紅質(zhì)介導(dǎo)的信號(hào)通路等。這些生物學(xué)過程的調(diào)節(jié)異常是參與RB發(fā)生發(fā)展。KEGG通路顯示上調(diào)基因上調(diào)DEGs沒有顯著的信號(hào)通路,下調(diào)基因參與光傳導(dǎo)信號(hào)通路,其中包括CNGA1,CNGB1,RHO,SAG四個(gè)基因,通過PPI網(wǎng)絡(luò)提示這4個(gè)基因相互聯(lián)系,并發(fā)現(xiàn)與其他節(jié)點(diǎn)連接最緊密核心基因RHO?;騌HO(rhodopsin)為視紫紅質(zhì),早先Donoso等[9]使用單克隆抗體組織病理研究在人胎兒視網(wǎng)膜和五個(gè)視網(wǎng)膜母細(xì)胞瘤中鑒定了視紫紅質(zhì),視網(wǎng)膜母細(xì)胞瘤中視紫紅質(zhì)和s抗原的存在可能有助于理解光感受器細(xì)胞的發(fā)育,并參與視覺光轉(zhuǎn)導(dǎo)蛋白的表達(dá)。包括與視覺直接相關(guān)的事件。之后Hurwitz等[10]研究發(fā)現(xiàn):只有2種抗視紫紅質(zhì)抗體識(shí)別腫瘤上的表位,而在正常人視網(wǎng)膜上完整識(shí)別的五種表位的視紫紅質(zhì)分子可能在視網(wǎng)膜母細(xì)胞瘤中不表達(dá)。二者均與本研究篩選出核心基因RHO為下調(diào)基因情況相符,因此視紫紅質(zhì)低表達(dá)為RB的發(fā)生發(fā)展提供了一個(gè)新的思路,由于近年鮮有對(duì)RHO與RB相關(guān)性研究,需要對(duì)其進(jìn)一步實(shí)驗(yàn)驗(yàn)證,希望有助于成為新的抗腫瘤治療靶點(diǎn)。本研究KEGG通路富集在光傳導(dǎo)信號(hào)通路與Hurwitz等[10]在RB中發(fā)現(xiàn)存在錐細(xì)胞特異性光轉(zhuǎn)導(dǎo)級(jí)聯(lián)反應(yīng)相符,該研究推測(cè)該腫瘤沿著錐細(xì)胞譜系進(jìn)行了生化分化。也與數(shù)據(jù)譜GSE11081發(fā)現(xiàn)感光細(xì)胞表達(dá)與視網(wǎng)膜母細(xì)胞瘤嚴(yán)重程度呈負(fù)相關(guān)有關(guān)聯(lián)。因此考慮RB與正常視網(wǎng)膜組織差異基因通路可能與光信號(hào)轉(zhuǎn)導(dǎo)有關(guān)。
本研究也有局限性,一是GSE11081對(duì)其提供28例RB組織進(jìn)行間變質(zhì)輕中重的分級(jí),從而得出感光細(xì)胞表達(dá)與視網(wǎng)膜母細(xì)胞瘤嚴(yán)重程度呈負(fù)相關(guān),而本研究并未對(duì)RB分級(jí)而是直接將RB組織與正常視網(wǎng)膜差異進(jìn)行篩選,因此GSE110811研究表明的核孔蛋白表達(dá)增加,光感受器表達(dá)減少,是嚴(yán)重間變性RB的特征在本研究中并未發(fā)現(xiàn)。今后若有更多對(duì)RB輕中重分級(jí)的數(shù)據(jù)譜,可對(duì)其納入及進(jìn)行分級(jí)研究;二是基因芯片數(shù)據(jù)譜才2組偏少,且發(fā)現(xiàn)共同差異基因過少,這些對(duì)基因功能富集和通路分析意義都是比較有限的,期待今后能從更多的數(shù)據(jù)庫(kù)納入發(fā)現(xiàn)更多研究RB基因的數(shù)據(jù)譜,從而豐富差異基因。
綜上所述,本文采用生物信息學(xué)方法對(duì)RB基因芯片數(shù)據(jù)進(jìn)行挖掘,通過對(duì)RB發(fā)生發(fā)展的生物過程、分子功能、細(xì)胞定位和信號(hào)通路等分析,以期往能為RB發(fā)生的機(jī)制研究、腫瘤標(biāo)志物的篩選及藥物靶點(diǎn)提供參考。