王馨雅,王華峰,2,邊煜青,楊魯紅*
(1山西師范大學(xué)生命科學(xué)學(xué)院遺傳學(xué)教研室,臨汾 041004;2阿拉巴馬大學(xué)伯明翰分校醫(yī)學(xué)院神經(jīng)系;*通訊作者,E-mail:ylh1010309@126.com)
自身免疫性疾病(autoimmune disease,AID)是指機(jī)體免疫系統(tǒng)中的免疫應(yīng)答反應(yīng)對自身抗原發(fā)生作用,造成組織細(xì)胞破壞或損害的一類疾病,其病因及其致病機(jī)制目前尚不完全清楚且仍未找到有效治療藥物[1,2]。通??煞譃閮纱箢?器官特異性自身免疫性疾病和全身性自身免疫性疾病,其主要區(qū)別在于前者引起的機(jī)體病變主要發(fā)生于某些特定器官,而后者則引起機(jī)體多系統(tǒng)、多器官的免疫反應(yīng)[3]。近幾年,自身免疫性疾病已經(jīng)引起人們的廣泛關(guān)注,其中多發(fā)性硬化癥(multiple sclerosis,MS)的特征是中樞神經(jīng)系統(tǒng)的病變,已有研究表明,該疾病是由免疫系統(tǒng)異常引起的一種自身免疫性疾病[4]。同時(shí),Witoelar等[5]的研究表明帕金森病(Parkinson’s disease,PD)可能是一種自身免疫性疾病,帕金森病和自身免疫性疾病的表型之間有著共同的遺傳途徑[5]。故本文就多發(fā)性硬化癥和帕金森病兩種自身免疫性疾病進(jìn)行研究,從基因表達(dá)方面探尋二者發(fā)病機(jī)制的相同點(diǎn)。
自Schena等[6]從事基因芯片的研究以后,基因芯片技術(shù)已經(jīng)廣泛應(yīng)用于生物科學(xué)的諸多領(lǐng)域,其發(fā)展和應(yīng)用為探究疾病的發(fā)病機(jī)制創(chuàng)造了條件[7]?;蛐酒夹g(shù)又稱微陣列(microarray)技術(shù),即在固相支持物上緊密放置諸多的DNA樣本或寡聚核苷酸,與模板進(jìn)行雜交并獲取圖像,用計(jì)算機(jī)處理后獲得樣本信息[8]。由于基因芯片所具有高效穩(wěn)定的特性,因此用多發(fā)性硬化癥和帕金森病相關(guān)的基因芯片探究自身免疫性疾病的致病機(jī)制具有十分重要的意義,為其后續(xù)的治療和藥物研發(fā)提供了理論基礎(chǔ)[9,10]。
本研究采用生物信息學(xué)的方法篩選多發(fā)性硬化癥和帕金森病患者和正常人的差異表達(dá)基因,對其中共有的差異基因進(jìn)行生物學(xué)功能(GO)和信號通路富集分析,從中找出多發(fā)性硬化癥和帕金森病共有的關(guān)鍵基因,為進(jìn)一步探索自身免疫性疾病發(fā)病的分子機(jī)制提供參考。
本實(shí)驗(yàn)采用的兩組基因芯片數(shù)據(jù)GSE83670和GSE22491均來源于美國國立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)的共享數(shù)據(jù)庫GEO(https://www.ncbi.nlm.nih.gov/geo/)。多發(fā)性硬化癥GSE83670的芯片數(shù)據(jù)由Paul Roy Heath上傳,登錄號GSM2212224-GSM2212227為4個(gè)多發(fā)性硬化癥患者的白質(zhì)星形膠質(zhì)細(xì)胞轉(zhuǎn)錄組的基因表達(dá)譜樣本數(shù)據(jù),登錄號GSM2212228-GSM2212230為3個(gè)神經(jīng)正常的人體白質(zhì)星形膠質(zhì)細(xì)胞轉(zhuǎn)錄組基因表達(dá)譜樣本數(shù)據(jù)。帕金森病GSE22491的芯片數(shù)據(jù)由frédéricleprêtre上傳,登錄號GSM558679-GSM558686為8個(gè)健康老年人(對照組)外周血單核細(xì)胞的基因表達(dá)模式數(shù)據(jù),登錄號GSM558687-GSM558696為10個(gè)帕金森病患者外周血單核細(xì)胞的基因表達(dá)模式數(shù)據(jù)。
下載多發(fā)性硬化癥組織芯片數(shù)據(jù)GSE83670的CEL數(shù)據(jù)壓縮包和探針文件后,通過RStudio軟件的affyPLM對芯片數(shù)據(jù)進(jìn)行質(zhì)量分析,以P<0.05和|logFC|>1為標(biāo)準(zhǔn)篩選多發(fā)性硬化癥患者和正常人的差異表達(dá)基因。打開帕金森病GSE22491的芯片數(shù)據(jù),將帕金森病患者樣本和正常老年人樣本分為兩組,通過GEO2R在線分析工具獲取帕金森病患者和正常老年人的差異表達(dá)基因。最后,通過Venny 2.1.0在線分析網(wǎng)站(http://bioinfogp.cnb.csic.es/tools/venny/index.html)找出二者共同的差異基因。
DAVID數(shù)據(jù)庫(https://david.ncifcrf.gov/)是一個(gè)在線生物信息學(xué)網(wǎng)站,用于分析基因組數(shù)據(jù)集并將收集到的數(shù)據(jù)賦予生物學(xué)意義。本文利用DAVID在線分析工具,對篩選出來的共有差異基因進(jìn)行GO分析和信號通路富集分析[11],利用Cytoscape軟件對GO功能富集的結(jié)果進(jìn)行可視化分析。
通過對多發(fā)性硬化癥組織芯片GSE83670和帕金森病組織芯片GSE22491數(shù)據(jù)分析,分別篩選出737個(gè)多發(fā)性硬化癥和1 081個(gè)帕金森病中表達(dá)差異明顯的基因(見圖1),有36個(gè)基因在這兩種病中均存在有明顯的差異(見表1,圖2),分別為:CTAGE5、C14orf79、ASB9、PROS1、CCDC186、PLAA、GP1BA、LIG4、C2orf88、GABRP、ZNF85、EPB42、GCM2、RAB13、CAAP1、DYNC2LI1、SGCE、PCOLCE2、CCPG1、TRMT61B、C1QC、NLK、GPR78、UHRF1、DCBLD1、C1QB、IRX3、GUCY1B3、DMXL2、THAP9-AS1、ANGPT2、FAM19A2、TMEM17、CA2、CAV1和PARM1。
將得到的36個(gè)差異基因輸入到DAVID在線分析網(wǎng)站,通過對差異基因的生物過程(biological process)、細(xì)胞成分(cellular component)和分子功能(molecular function)的分析,發(fā)現(xiàn)差異基因參與了白細(xì)胞移行、肽酶活性的正調(diào)控、凝血調(diào)節(jié)、纖維蛋白溶解等生物過程;細(xì)胞成分分析顯示差異基因主要參與了質(zhì)膜和血液微粒的組成;分子功能與肽酶的激活有關(guān)(見表2)。
利用Cytoscape軟件對差異基因GO功能富集進(jìn)行的可視化分析結(jié)果表明,顏色越深富集到該功能上的差異基因越多,主要與5個(gè)功能關(guān)系程度最大,即免疫球蛋白介導(dǎo)的免疫應(yīng)答、B細(xì)胞介導(dǎo)的免疫、淋巴細(xì)胞介導(dǎo)的免疫、基于免疫球蛋白超家族域構(gòu)建的免疫受體體細(xì)胞重組的適應(yīng)性免疫應(yīng)答和適應(yīng)性免疫反應(yīng)(見圖3)。
A.多發(fā)性硬化癥的差異基因火山圖 B.帕金森病的差異基因火山圖圖1 多發(fā)性硬化癥和帕金森病的差異基因火山圖Figure 1 Valcano plot of differentially expressed genes in mRNA expression profiling dataset of MS and PD
表1 帕金森病和多發(fā)性硬化癥共有的36個(gè)差異基因
Table 1 Results of 36 differentially expressed genes in Parkinson’s disease and multiple sclerosis
基因名稱帕金森病的logFC多發(fā)性硬化癥的logFC基因名稱帕金森病的logFC多發(fā)性硬化癥的logFCCTAGE5C14orf79ASB9PROS1CCDC186PLAAGP1BALIG4C2orf88GABRPZNF85EPB42GCM2RAB13CAAP1DYNC2LI1SGCEPCOLCE2-1.6620-1.0975-1.0520-2.0972-1.0324-1.1981-1.4053-1.0165-1.3828-1.5305-1.0004-4.9199-1.0029-1.3522-1.0020-1.0493-1.3849-2.2095-1.1971-1.3444-1.2108-1.0032-1.5436-1.0326-1.3625-1.19761.4022-1.2205-1.1588-1.1595-1.00872.2605-1.3333-1.5165-1.28671.5961CCPG1TRMT61BC1QCNLKGPR78UHRF1DCBLD1C1QBIRX3GUCY1B3DMXL2THAP9-AS1ANGPT2FAM19A2TMEM17CA2CAV1PARM1-1.0909-1.1925-1.0244-1.01621.58241.6100-1.2058-1.30641.9081-1.1108-1.2103-1.14673.1958-1.4754-1.4463-1.0640-1.0356-1.0929-1.5210-1.70691.4257-1.3652-1.00681.3508-1.30821.24791.8110-1.1308-1.0766-1.43361.0837-1.5238-1.31811.43031.0076-1.1128
圖2 兩類疾病共有基因分析的Venny圖Figure 2 Venny diagram of common gene analysis for both diseases
通過DAVID在線分析網(wǎng)站對36個(gè)差異基因進(jìn)行信號通路富集分析。結(jié)果顯示,符合P<0.05的信號通路只有一條,即補(bǔ)體和凝血級聯(lián)信號通路(has04610:補(bǔ)體和凝血級聯(lián))(P=0.007),富集在這條通路上的差異基因包括C1QB、PROS1和C1QC(見表3)。
表2 差異基因的富集分析
Table 2 Enrichment analysis of different genes
類型GO ID基因功能 數(shù)量P生物過程GO:0050900白細(xì)胞遷移(leukocyte migration)30.019生物過程GO:0010952肽酶活性的正調(diào)控(positive regulation of peptidase activity)20.022生物過程GO:0030193凝血調(diào)節(jié)(regulation of blood coagulation)20.029生物過程GO:0042730纖維蛋白溶解(fibrinolysis)20.036細(xì)胞成分GO:0005886質(zhì)膜(plasma membrane)140.013細(xì)胞成分GO:0072562血液微粒(blood microparticle)30.027分子功能GO:0016504肽酶激活(peptidase activator activity)20.016
圖3 GO功能富集的可視化分析Figure 3 Visual analysis of GO functional enrichment
表3 差異表達(dá)基因所涉及的信號通路
Table 3 Differentially expressed genes involved in the signaling pathway
序列號名稱數(shù)量P基因hsa04610補(bǔ)體和凝血級聯(lián)30.007C1QB,PROS1,C1QC
自身免疫性疾病的發(fā)病機(jī)制十分復(fù)雜,且發(fā)病人數(shù)呈逐年上升趨勢,之前已有對于遺傳、環(huán)境和免疫等方面的相關(guān)研究,但尚且沒有特異性的生物標(biāo)記和篩查診斷方法[12]。在本次研究中,我們借助了生物信息學(xué)的手段分析篩選出帕金森病和多發(fā)性硬化癥共有的差異表達(dá)基因,得到了36個(gè)差異表達(dá)顯著的基因。為了探討這些差異基因潛在的作用機(jī)制,我們通過DAVID在線生物學(xué)分析網(wǎng)站對這36個(gè)基因進(jìn)行了GO和Pathway功能富集分析。
GO富集分析和可視化結(jié)果顯示,這些差異基因主要參與了免疫球蛋白介導(dǎo)的體液免疫應(yīng)答過程。現(xiàn)有研究表明,免疫球蛋白、B細(xì)胞、淋巴細(xì)胞介導(dǎo)的免疫調(diào)節(jié)機(jī)制是自身反應(yīng)性細(xì)胞免疫的關(guān)鍵機(jī)制之一,與固有免疫應(yīng)答和適應(yīng)性免疫應(yīng)答的相互作用有關(guān),在炎癥反應(yīng)和自身免疫性疾病中發(fā)揮重要作用[13-16]。
Pathway信號通路富集結(jié)果為補(bǔ)體和凝血級聯(lián)信號通路(hsa04610:補(bǔ)體和凝血級聯(lián))。補(bǔ)體系統(tǒng)是先天免疫的主要系統(tǒng),凝血系統(tǒng)在止血功能中起到主要作用,補(bǔ)體和凝血級聯(lián)信號通路與血液介導(dǎo)的炎癥反應(yīng)具有一定的關(guān)系[17,18]。分析富集于該信號通路上的差異基因發(fā)現(xiàn),C1QB和C1QC基因編碼的蛋白質(zhì)均為補(bǔ)體C1q的亞成分,而補(bǔ)體C1q參與自身免疫和炎癥反應(yīng)等過程,補(bǔ)體級聯(lián)的第一步就是補(bǔ)體C1q與抗體的結(jié)合[19],C1q在自身免疫性疾病如紅斑狼瘡、類風(fēng)濕性關(guān)節(jié)炎等發(fā)病機(jī)制的研究上具有重要的臨床價(jià)值[20-24]。PROS1基因通過與酪氨酸激酶等受體相互作用共同調(diào)控TAM信號通路,在炎癥的消除過程中發(fā)揮著至關(guān)重要的作用[25];PROS1基因突變導(dǎo)致S蛋白缺乏[26],而S蛋白能夠激活凝血級聯(lián)通路[27],調(diào)節(jié)基因轉(zhuǎn)錄和炎癥細(xì)胞因子的表達(dá)[28],其抗凝功能能夠?qū)︻愶L(fēng)濕關(guān)節(jié)炎這種自身免疫性疾病的治療產(chǎn)生積極作用。同時(shí),PROS1基因還是與甲狀腺病變相關(guān)的7個(gè)關(guān)鍵基因之一[29]。
綜上所述,我們推測,自身免疫病的發(fā)病機(jī)制可能通過補(bǔ)體和凝血級聯(lián)反應(yīng)信號通路實(shí)現(xiàn),該信號通路上的差異基因:C1QB、C1QC和PROS1通過對補(bǔ)體和凝血級聯(lián)信號通路的影響,可能在帕金森病和多發(fā)性硬化癥等自身免疫性疾病中起到關(guān)鍵作用,有望成為自身免疫性疾病的潛在治療靶點(diǎn)。
山西醫(yī)科大學(xué)學(xué)報(bào)2019年9期