盧振權(quán) 侯 健 梁松武 易 翔 段永剛 許 祥 羅兵鋒袁 淵 程小寶 廖蘇才 季瑞東 呂嫻媛 羅光彥
香港大學(xué)深圳醫(yī)院泌尿外科(廣東 深圳 518000)
世界衛(wèi)生組織將不孕癥定義為在無保護(hù)措施的性交后一年內(nèi)未能懷孕。而無精癥是男性不育的原因之一,可分為兩大類:輸精管道機(jī)械性梗阻(阻塞性無精子癥,OA)和原發(fā)性生精衰竭(非阻塞性無精子癥,NOA)。其中,約60%的無精癥患者被診斷為NOA[1]。精原干細(xì)胞的維持、分化的準(zhǔn)備以及隨后的減數(shù)分裂和精子生成是精子發(fā)生的關(guān)鍵事件[2]。由于精子生成失敗,射精時(shí)精子缺失[3],NOA成為最嚴(yán)重的男性不育癥。NOA可繼發(fā)于多種原因,常見原因包括性染色體異常、隱睪、易位、Y染色體微缺失和其他導(dǎo)致睪丸功能衰竭的遺傳疾病[1,4,5]。遺憾的是,NOA治療較為棘手,因此了解NOA的發(fā)生機(jī)制甚為重要。隨著二代測序技術(shù)的逐漸成熟,我們可以通過基因?qū)用孢M(jìn)一步了解疾病發(fā)生發(fā)展的過程。2019年的一項(xiàng)回顧性分析顯示[6],已有78個(gè)基因與男性不育相關(guān)。但精子發(fā)生是一個(gè)復(fù)雜而又高度有序的持續(xù)供應(yīng)精子的過程。關(guān)于NOA的發(fā)生機(jī)制尚不明確,為診治NOA帶來了一定的困難。幸運(yùn)的是,本研究通過對比76例NOA患者睪丸組織及10例正常生精男性睪丸組織的表達(dá)譜數(shù)據(jù),提取兩者差異基因并分析其生物學(xué)特性,共篩選出489個(gè)差異基因及30個(gè)樞紐基因,并且預(yù)測其關(guān)鍵通路,以便為臨床治療尋找潛在的生物標(biāo)記物和治療靶點(diǎn),為男性不育治療靶點(diǎn)進(jìn)行探索。
我們從GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)下載了人類無精子癥的表達(dá)譜數(shù)據(jù)相關(guān)數(shù)據(jù)集:GSE145467,GSE25518,GSE9210。并 使 用R包“sva”combat函數(shù)完成了數(shù)據(jù)集的合并及批次矯正。并利用R包“VennDiagram”對交集基因進(jìn)行可視化展示combat(如圖1A-C)。
我們使用R包“Limma”對轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,截取值標(biāo)準(zhǔn)為|log2(FC)|>1,F(xiàn)DR<0.05。在此基礎(chǔ)上利用R包“Pheatmap”包和聚類分析的方法,對兩組樣本表達(dá)的基因進(jìn)行聚類分析。同時(shí)我們使用R包“ggplot2”繪制火山圖。將顯著表達(dá)的基因進(jìn)行可視化展示,截取值標(biāo)準(zhǔn)為|log2(FC)|>1,F(xiàn)DR<0.05。我們對兩組樣本進(jìn)行同樣的分析。
互作基因數(shù)據(jù)庫檢索工具(STRING;https://stringdb.org/cgi/input.pl)是分析PPI信息的在線工具。我們構(gòu)建了一個(gè)基于差異基因(DEGs)的PPI網(wǎng)絡(luò)圖,(最低要求交互評分為0.7)。然后,我們使用Cytoscape軟件v3.7.1(https:/cytoscape.org/)可視化來自STRING數(shù)據(jù)庫的PPI網(wǎng)絡(luò)。利用Cytoscape中的CytoHubba插件,根據(jù)程度計(jì)算方法(12)對PPI網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行排序,其中前32個(gè)基因被認(rèn)為是樞紐基因。
分別使用“colorspace、stringi、ggplot2”這三個(gè)R包基于可視化和集成發(fā)現(xiàn)數(shù)據(jù)庫(DAVID;https://david.ncifcrf.gov/)來進(jìn)行基因本體(Gene Ontology,GO)功能和KEGG通路富集分析,前者通過對其生物過程(BP),或細(xì)胞成分(CC)來識(shí)別確定其基因的功能,后者通過對KEGG途徑進(jìn)行富集分析,將P值設(shè)定為P≤0.05作為截止值。將GO和KEGG途徑富集分析的結(jié)果作為TXT文件下載,以供后續(xù)分析。使用R軟件版本3.6.2對結(jié)果進(jìn)行可視化。接著使用在線數(shù)據(jù)庫Metascape(http://metascape.org)同樣將差異基因進(jìn)行GO和KEGG分析,以描繪基于不同群體之間DEG的獨(dú)特生物學(xué)意義。京都基因與基因組百科全書(KEGG)數(shù)據(jù)庫用于確定重要途徑,并與DAVID富集結(jié)果進(jìn)行對比。將P值設(shè)定為P≤0.05作為截止值。
我們使用了R軟件版本3.6.2進(jìn)行統(tǒng)計(jì)分析。采用Wilcox檢驗(yàn)比較兩組。P值<0.05被認(rèn)為是有統(tǒng)計(jì)學(xué)意義。
我們從GEO數(shù)據(jù)庫下載了3個(gè)人類無精子癥的表達(dá)譜數(shù)據(jù)的相關(guān)數(shù)據(jù)集:GSE145467,GSE25518,GSE9210。分別使用在線工具對其提取每個(gè)數(shù)據(jù)集的基因轉(zhuǎn)錄組表達(dá)譜(圖1A-B)。在GSE145467中我們提取到19749個(gè)基因,GSE25518數(shù)據(jù)集中我們提取到了21654個(gè)基因,GSE9210芯片中我們提取到了16539個(gè)基因,使用在線工具Sangerbox對其進(jìn)行數(shù)據(jù)合并和進(jìn)行批次矯正,然后使用R包“VennDiagram”將三個(gè)基因集的交集基因數(shù)進(jìn)行可視化展示(圖1C),并將這個(gè)基因集留后續(xù)分析。
圖1 NOA數(shù)據(jù)集下載及差異分析
我們使用R包“Limma”包對這12782個(gè)基因進(jìn)行差異基因的提?。≒<0.001,Log2FC)。我們得到了489個(gè)與無精子癥相關(guān)差異基因。其中上調(diào)的10個(gè),下調(diào)的479個(gè)。這些結(jié)果在圖1D-E中展示。
常見DEG的GO富集分析包括以下三個(gè)部分:生物過程(BP),分子功能(MF)和細(xì)胞成分(CC)。我們將常見的DEGs使用R包“colorspace、stringi、ggplot2”對489個(gè)無精癥相關(guān)的差異基因進(jìn)行基因本體富集分析(Gene Ontology)。從結(jié)果我們可以看到,對于BP大部分基因與多細(xì)胞生物繁殖中涉及的細(xì)胞過程,細(xì)胞生物發(fā)育,細(xì)胞分化,精子發(fā)育和精子活動(dòng)力的調(diào)控等方面相關(guān)。在CC中大部分基因與精子的組成,細(xì)胞外囊泡,細(xì)胞外空間,細(xì)胞外區(qū)域、細(xì)胞核,細(xì)胞質(zhì),中心體,運(yùn)動(dòng)性纖毛和頂體囊泡等相關(guān)。接下來對使用Cytoscape軟件基于degree值篩選得到的與NOA相關(guān)的Hub基因同樣進(jìn)行GO分析:對于BP大部分基因同樣與多細(xì)胞生物繁殖中涉及的細(xì)胞過程,細(xì)胞生物發(fā)育,細(xì)胞分化,精子發(fā)育和精子活動(dòng)力的調(diào)控等方面相關(guān)。在CC中大部分基因同樣基本上與精子的組成,細(xì)胞外囊泡,細(xì)胞外空間,細(xì)胞外區(qū)域、細(xì)胞核,細(xì)胞質(zhì),中心體,運(yùn)動(dòng)性纖毛和頂體囊泡等相關(guān)。在細(xì)胞成分(MF)方面與蛋白質(zhì)的空間結(jié)構(gòu),微管運(yùn)動(dòng)活性,各種生物酶的活性組成相關(guān),這些結(jié)果在圖2-A中及表1中展示。
圖2 DEGs的富集分析及相互作用的結(jié)果可視化
表1 GO信號通路
通過R包基于DAVID數(shù)據(jù)庫分析常見的DEGs的相關(guān)KEGG通路。NOA相關(guān)的DEGs主要參與糖代謝,脂肪酸代謝,炭代謝、氨基酸合成、細(xì)胞周期及肌肉萎縮這些通路的調(diào)控。這些結(jié)果在圖2-B中及表1-2中展示。同樣我們也用Metascape在線工具進(jìn)行DEGs的GO/KEGG富集分析:從結(jié)果我們可以看到富集的結(jié)果與DAVID富集的結(jié)果大致相同,具體結(jié)果如圖2C-E展示。
表2 KEGG信號通路
根據(jù)STRING數(shù)據(jù)庫,構(gòu)建了DEGS的PPI網(wǎng)絡(luò),映射了328個(gè)節(jié)點(diǎn)和604個(gè)邊緣,如圖3-A所示。使用Cytohubba插件的Degree算法對前30個(gè)Hub基因進(jìn)行了評估,如圖3-B和表3所示。
圖3 DEGs的PPI網(wǎng)絡(luò)
精子形成是一個(gè)復(fù)雜的過程,它包括精原細(xì)胞增殖(有絲分裂)、精母細(xì)胞減數(shù)分裂和精子細(xì)胞分化[7]。在本研究中,我們整合了GSE145467,GSE25518和GSE9210數(shù)據(jù)集,并利用生物信息學(xué)方法鑒定了489個(gè)與NOA相關(guān)的DEGs,包括NOA中10個(gè)常見的上調(diào)基因和479個(gè)常見的下調(diào)基因。GO富集分析表明,對于生物過程(biological process,BP)中的DEGs主要與細(xì)胞生物發(fā)育,細(xì)胞分化,精子發(fā)育和精子活動(dòng)力的調(diào)控相關(guān),在細(xì)胞組分(cellular component,CC)中大部分基因同樣基本上與精子的組成,細(xì)胞外囊泡,細(xì)胞外空間,細(xì)胞外區(qū)域、細(xì)胞核,細(xì)胞質(zhì),中心體,運(yùn)動(dòng)性纖毛和頂體囊泡等相關(guān)。在分子功能(molecular function,MF)方面與蛋白質(zhì)的空間結(jié)構(gòu),微管運(yùn)動(dòng)活性,各種生物酶的活性組成相關(guān),此外NOA相關(guān)的DEGs主要參與糖代謝,脂肪酸代謝,炭代謝、氨基酸合成、細(xì)胞周期及肌肉萎縮相關(guān)通路。已有研究證實(shí)上述大多數(shù)KEGG通路參與精子發(fā)生,細(xì)胞周期通路及代謝調(diào)控通路,并常常對細(xì)胞分化與分裂起著至關(guān)重要的作用[8-10]。因此,這些常見的DEGS可能與無精子癥患者的生精障礙相關(guān)。
表3 cytoscape篩選的Hub基因列表
接下來我們篩選了30個(gè)與NOA相關(guān)的Hub基因(BUB1、BIRC5、TTK、HMMR、RACGAP1、NEK2、DYN LL2、PBK、KIF15、UBB、KIF18A、OIP5、PTTG1、SPAG5、CKS2、CEP55、CDKN3、HIST1H2BA、TYMS、KPNA2、SGOL2、KIF2B、H2AFJ、DNALI1、SYCP1、SMC1B、DNAI1、DYNLRB2、FKBP6、SYCP3)。通過檢索文獻(xiàn),我們發(fā)現(xiàn)SYCP3和SYCP1是一種蛋白質(zhì)編碼基因,兩者與男性不育和無精子癥相關(guān),其作用的相關(guān)途徑主要包括減數(shù)分裂,細(xì)胞周期和有絲分裂。它是突觸復(fù)合物的橫向絲的主要成分,形成于減數(shù)分裂前期的同源染色體之間。它是突觸復(fù)合物所必需的,同時(shí)也是減數(shù)分裂過程中正常著絲粒配對所必需,也是在卵母細(xì)胞和精母細(xì)胞發(fā)育過程中正常減數(shù)分裂染色體突觸以及正常的男性和女性生育力所必需的[11-13]。HMMR是一種透明質(zhì)酸運(yùn)動(dòng)受體,該基因編碼的蛋白質(zhì)參與細(xì)胞運(yùn)動(dòng)。有研究表明,它在乳腺組織中表達(dá)參與BRCA1和BRCA2復(fù)合物的形成。該基因編碼的蛋白質(zhì)參與細(xì)胞運(yùn)動(dòng)。它在乳腺組織中表達(dá),與BRCA1和BRCA2形成復(fù)合物[14]。一項(xiàng)研究表明,HMMR的下調(diào)與精子形態(tài)學(xué)、活力和數(shù)量等指標(biāo)下降有關(guān)[15]。NIMA相關(guān)激酶2(Nek2)是一種參與有絲分裂調(diào)控的絲氨酸/蘇氨酸激酶,它的功能可能與細(xì)胞周期的G2/M相變有關(guān)[16]。有研究表明,Nek2在雄性小鼠減數(shù)分裂過程中的染色質(zhì)濃縮起重要作用[17]。Structural Maintenance Of Chromosomes 1B(SMC1B),是屬于減數(shù)分裂和有絲分裂期間染色單體凝聚和DNA重組所需的蛋白質(zhì)家族,它主要與減數(shù)分裂和細(xì)胞周期,有絲分裂有關(guān)。有研究表明,SMC1B的自發(fā)性突變可導(dǎo)致小鼠黏著蛋白功能發(fā)生障礙從而導(dǎo)致小鼠不育[18]。TTK又被稱為TTK蛋白激酶,該基因可編碼一種雙特異性蛋白激酶,其產(chǎn)物參與酪氨酸、絲氨酸和蘇氨酸磷酸化的過程。TTK還與細(xì)胞增殖相關(guān),這種蛋白質(zhì)對于有絲分裂期間著絲粒的染色體對齊至關(guān)重要,并且是中心體復(fù)制所必需的,是在有絲分裂期間用于染色體的精確分離的關(guān)鍵有絲分裂檢查點(diǎn)蛋白[19]。有研究表明,在雄性斑馬魚的生殖組織中,TTK表達(dá)異常可能會(huì)導(dǎo)致雄性生殖細(xì)胞染色體異常[19]。PDZ Binding Kinase(PBK),又稱PDZ結(jié)合激酶,該基因編碼與雙特異性絲裂原激活的蛋白激酶激酶(MAPKK)家族有關(guān)的絲氨酸/蘇氨酸蛋白激酶。有證據(jù)表明,該激酶在精子形成過程中發(fā)揮重要作用,它主要參與催化有絲分裂的磷酸化酶的活性中心所必需的物質(zhì)。該激酶可能同樣也參與了淋巴樣細(xì)胞的活化并支持睪丸功能,從而影響精子的形成及分化。研究表明,PBK蛋白在成年小鼠的睪丸的生精細(xì)胞中,例如精原細(xì)胞,精細(xì)胞和圓形精子中表達(dá),它的表達(dá)異常可能會(huì)引起精子的形成異常[20]。Centrosomal Protein 55(CEP55)又稱為中心體蛋白55,在胞質(zhì)分裂過程中體細(xì)胞脫落需要中心體蛋白(CEP55)。在胞質(zhì)分裂過程中將PDCD6IP和TSG101募集到中體。研究表明,在生殖細(xì)胞中,CEP55在生殖細(xì)胞減數(shù)分裂中起重要的作用。CEP55過表達(dá)可能通過持續(xù)激活PI3K/Akt信號通路而抑制Foxo1的表達(dá),從而引起雄性小鼠的不育[21]。另一項(xiàng)研究表明,CEP55表達(dá)的降低會(huì)抑制小鼠精原細(xì)胞增生[22]。由此可見,CEP55的表達(dá)與精子的增殖緊密相關(guān)。此外,DYNLL2、PTTG1、CDKN3、TYMS、DYNLRB2等基因的表達(dá)可能與非梗阻無精子癥相關(guān)[23]。然而,BUB1及BIRC5在精子發(fā)生方面的文獻(xiàn)中還沒有報(bào)道。其他11個(gè) 與NOA相關(guān) 的Hub基 因,即UBB,KIF15、KIF18A、OIP5、SPAG5、CKS2、KPNA2、SGOL2、KIF2B、H2AFJ和DNALI1也沒有報(bào)道。這些基因可能是與無精子癥發(fā)生發(fā)展?jié)撛诿芮邢嚓P(guān)的新的標(biāo)志物,為無精子癥患者的臨床診治提供新的思路。
總之,本研究對NOA和NS病人睪丸組織之間的DEGs進(jìn)行了生物信息學(xué)整合分析,成功篩選到了13個(gè)與NOA相關(guān)的樞紐基因,即BUB1、BIRC5、UBB、KIF15、KIF18A、OIP5、SPAG5、CKS2、KPNA2、SGOL2、KIF2B、H2AFJ和DNALI1。我們還預(yù)測了與NOA相關(guān)的HUB基因的一些潛在的調(diào)控途徑,包括細(xì)胞發(fā)育,細(xì)胞分化,精子發(fā)育和精子活動(dòng)力的調(diào)控等在內(nèi)的精子發(fā)生和成熟過程。我們的結(jié)果有助于更詳細(xì)的理解NOA發(fā)生的分子機(jī)制,為其治療提供潛在的藥物靶點(diǎn)。