蘇思維 姜雯君 王曉穎 杜森 宋洪強
(山東第一醫(yī)科大學暨山東省醫(yī)學科學院,運動醫(yī)學研究所,泰安 271000)
類風濕關節(jié)炎(rheumatoid arthritis,RA)是一種嚴重的慢性自身免疫性疾病,特征是持續(xù)性滑膜炎和系統(tǒng)性炎癥。全球RA患者占成年人的0.5%~1.0%[1]。RA是導致嚴重肢體殘疾的重要因素之一,給患者帶來沉重的經(jīng)濟負擔。有報告指出,RA會顯著縮短患者的預期壽命[2]。目前,尚無治愈RA的方法,主要依賴于早期的發(fā)現(xiàn)和積極的治療。因此,研究RA的分子機制和分析相關的信號通路,有利于發(fā)現(xiàn)更加有效的治療靶點。
RA在性別上的差異是不容忽視的。有研究證實,女性患RA的概率是男性的3倍[3]。盡管性別的差異可能在導致自身免疫功能紊亂方面發(fā)揮復雜的作用,但迄今為止,性別因素與RA發(fā)病之間的聯(lián)系尚不清楚[4]。因此,本研究的目的是通過全面的生物信息學分析,探討RA發(fā)生發(fā)展在性別差異間的關鍵基因與途徑,將有助于進一步了解RA發(fā)病的性別特異性,為RA提供潛在的生物學標志物和治療靶點。
1.1 資料來源從GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)下 載 基 因 表 達 譜GSE55457、GSE55584和GSE12021。篩選條件為:①RA;②人類;③滑膜。本研究納入GSE12021數(shù)據(jù)集中7例正常男性滑膜樣本,2例正常女性滑膜樣本,3例男性RA滑膜樣本,9例女性RA滑膜樣本;GSE55457數(shù)據(jù)集中8例正常男性滑膜樣本,2例正常女性滑膜樣本,3例 男 性RA滑膜 樣 本,10例女 性RA樣本;GSE55584數(shù)據(jù)集中3例男性RA滑膜樣本,7例女性RA樣本。
1.2 數(shù)據(jù)整理及篩選差異表達基因(differentially expressed genes,DEGs)使用R軟件獲取原始數(shù)據(jù),采用log2變換進行歸一化處理。將篩選出的樣本合并后分為男性組:男性RA和男性健康對照;女性組:女性RA和女性健康對照進行兩兩比較。選擇P≤0.05和|log2FC|≥1作為標準篩選DEGs。利用R軟件中的ggplot2包制作DEGs火山圖。
1.3 功能富集分析DAVID數(shù)據(jù)庫(https://david.ncifcrf.gov/)是一個被廣泛使用的在線數(shù)據(jù)庫,DAVID數(shù)據(jù)庫通過GO分析和KEGG通路分析為DEGs進行功能和通路富集分析[5-7]。為了獲取DEGs的生物學功能和信號傳導通路,本研究通過DAVID對DEGs進行GO分析和KEGG通路分析。
1.4 蛋白-蛋白相互作用分析本研究將所有的DEGs上傳至STRING在線分析網(wǎng)站(https://stringdb.org/)。以“combined score>0.7”作為篩選條件。導出分析結果通過Cytoscape軟件3.60版本進行可視化處理[8],并采用cytoHubba插件根據(jù)“Degree”算法,篩選出PPI網(wǎng)絡中前5個關鍵基因。
1.5 模塊化分析Cytoscape軟件中的MCODE插件被用來篩選PPI網(wǎng)絡中的密集連結區(qū)域[9]。本研究使用MCODE從構建的PPI網(wǎng)絡中獲取核心模塊。參數(shù)設置標準為:node score cutoff=0.2,K-core=2,degree cutoff=2。此外,對模塊分析結果進行進一步通路富集分析,P≤0.05表示差異有統(tǒng)計學意義。
2.1 DEGs將GSE55457、GSE55584和GSE12021數(shù)據(jù)集篩選整理后進一步差異分析得到男性組:RA 9例,正常15例,女性組:RA 26例,正常4例。其中男性組中高表達基因416個,低表達基因336個,女性組中高表達基因744個,低表達基因309個?;鹕綀D如圖1所示,紅色代表高表達的基因,藍色代表低表達的基因。
圖1 GSE55457、GSE55584和GSE12021的DEGs火山圖Fig.1 Volcano plots of DEGs of GSE55457,GSE55584 and GSE12021
2.2 DEGs GO分析GO富集分析結果顯示,男性組DEGs主要參與的生物學過程包括免疫應答、細胞-細胞信號轉(zhuǎn)導、RNA聚合酶Ⅱ轉(zhuǎn)錄的正調(diào)控等;細胞組成包括胞外區(qū)、細胞膜外側(cè)、細胞膜的組成成分等;分子功能包括細胞因子活性、轉(zhuǎn)錄激活因子活性、serine-type肽鏈內(nèi)切酶活性等。女性組DEGs主要參與的生物學過程包括免疫反應、炎癥反應、趨化因子介導的信號通路等;細胞組成上包括細胞膜的組成成分、細胞膜、細胞外區(qū)等;分子功能包括趨化因子活性、C-C趨化因子受體活性、肝素結合等。見圖2和表1、表2。
表1 前5女性DEGs GO富集分析Tab.1 Top 5 GO enrichment analysis of DEGs in females
表2 前5男性DEGs GO富集分析Tab.2 Top 5 GO enrichment analysis of DEGs in males
圖2 不同性別DEGs的前5個GO富集分析Fig.2 Top 5 GO enrichment analysis of DEGs in females and males
2.3 KEGG信號通路分析采用KEGG途徑富集分析來了解DEGs信號通路的富集情況,以P≤0.05為臨界值。KEGG通路分析顯示,男性組DEGs主要富集于細胞因子-細胞因子受體相互作用、人類嗜T細胞病毒(human T cell leukemia virus type-Ⅰ,HTLV-Ⅰ)感染、造血細胞譜系等通路中。KEGG通路分析顯示,女性組DEGs主要富集于細胞因子-細胞因子受體相互作用、趨化因子信號通路、原發(fā)性免疫缺陷等通路中,見圖3和表3、表4。
表3 前5女性DEGs KEGG通路分析Tab.3 Top 5 KEGG pathway analysis of DEGs in females
表4 前5男性DEGs KEGG通路分析Tab.4 Top 5 KEGG pathway analysis of DEGs in males
圖3 不同性別DEGs的前5個KEGG通路分析Fig.3 Top 5 KEGG pathway analysis of DEGs in females and males
2.4 PPI網(wǎng)絡分析 本研究使用在線工具STRING數(shù)據(jù)庫構建PPI網(wǎng)絡分析DEGs之間的相互作用。將得到的PPI網(wǎng)絡導入Cytoscape 3.6.0工具,篩選出各組degree得分前5位基因,其中男性組前5位關鍵基因是IL-6、MYC、EGFR、FOS和JUN;女性組中前5位關鍵基因是IL-6、ALB、PTPRC、CXCL8和CCR5,見附圖1(www.immune99.com)。
2.5 模塊分析采用Cytoscape軟件構建DEGs的PPI后,用MCODE插件獲取各組核心模塊,并對該模塊中的基因進行KEGG分析。KEGG富集分析表明,男性組核心模塊的基因主要參與趨化因子信號通路、細胞因子-細胞因子受體相互作用和Toll樣受體信號通路相關;女性組核心模塊的基因主要與趨化因子信號通路、細胞因子-細胞因子受體相互作用和神經(jīng)活性配體-受體相互作用相關,見圖4。
圖4 PPI網(wǎng)絡的核心模塊及其KEGG通路分析Fig.4 Clusters of PPI networ and KEGG pathway analysis
本研究從GEO數(shù)據(jù)庫中下載GSE55457、GSE55584、GSE12021基因表達譜數(shù)據(jù),并進行數(shù)據(jù)篩選和整理得到男性組:RA 9例,正常15例,女性組:RA 26例,正常4例。其中男性組中高表達基因416個,低表達基因336個,女性組中高表達基因744個,低表達基因309個。在本研究中,DEGs的KEGG通路分析顯示,在男性中主要富集通路是細胞因子-細胞因子受體相互作用、HTLV-Ⅰ感染、造血細胞譜系、原發(fā)性免疫缺陷和癌癥通路。KEGG通路分析顯示,在女性中富集的通路主要有細胞因子-細胞因子受體相互作用、趨化因子信號通路、原發(fā)性免疫缺陷、造血細胞譜系。HTLV-Ⅰ感染和趨化因子信號通路已經(jīng)被證明參與了RA的發(fā)?。?0-12]。HTLV-Ⅰ是一種人類逆轉(zhuǎn)錄病毒,HTLV-ⅠTax可誘導NF-κB活化宿主細胞。此外,Tax介導的NF-κB活化涉及HTLV-Ⅰ感染細胞對凋亡刺激的抵抗。HTLV-ⅠTax的這些調(diào)節(jié)作用被認為具有促進HTLV-Ⅰ血清陽性受試者自身免疫性疾病,如RA的重要作用[13]。此外,尚未有研究探討性別在RA相關通路中的作用,本研究發(fā)現(xiàn),在RA男性和女性發(fā)病過程中有著相同的信號通路,如細胞因子-細胞因子受體相互作用、造血細胞譜系與原發(fā)性免疫缺陷等,但目前尚無文獻研究這些信號通路與RA發(fā)病之間的關系。
通過PPI網(wǎng)絡分析得到,男性組中關鍵基因為IL-6、MYC、EGFR、FOS和JUN,女性組中關鍵基因為IL-6、ALB、PTPRC、CXCL8和CCR5,其中IL-6在男性和女性組中均被鑒定為關鍵基因,而其他關鍵基因在男性組和女性組之間完全不同。EGFR在腫瘤生長過程中起著重要作用[14]。與腫瘤生長相似,RA中EGFR及其配體的上調(diào)將導致RA滑膜的增生和侵襲[15]。動物實驗表明,通過藥物調(diào)控EGFR或其配體可能是治療RA的有效方法[16]。由JUN蛋白和FOS蛋白組成的二聚體復合體AP-1是細胞核中重要的轉(zhuǎn)錄因子。c-Fos/AP-1可以控制炎癥因子IL-1β和基質(zhì)金屬蛋白酶的表達[17]。IL-1β是多種基質(zhì)金屬蛋白酶最重要的誘導劑,與軟骨破壞和破骨細胞生成密切相關[18]。此外,IL-1β和c-Fos/AP-1相互影響基因表達和活性,加重RA的進展。PTPRC,又稱CD45,是經(jīng)典的蛋白酪氨酸磷酸酶,在所有造血源有核細胞中表達[19]。蛋白酪氨酸蛋白磷酸酶是T細胞抗原受體激活T細胞所必需的,一些風險等位基因已經(jīng)被確認與RA發(fā)病的增加有關,而PT?PRC的上調(diào)可能有利于維持正?;すδ埽?0]。趨化因子是細胞黏附和細胞運輸?shù)闹饕{(diào)控因子,具有誘導附近應答細胞定向趨化的能力[21]。CXCL8作為炎癥介質(zhì),在成纖維細胞和單核細胞等細胞中表達,并作為中性粒細胞的趨化因子,導致中性粒細胞在炎癥部位(如RA患者的炎癥關節(jié))聚集[22]。CCR5是細胞內(nèi)β趨化因子的受體,調(diào)節(jié)T細胞和巨噬細胞的遷移、增殖和免疫,CCR5主要表達于單核細胞和未成熟樹突狀細胞的細胞膜上[23]。CCR5及其配體除了是早期HIV-1感染所必需的共受體外,還在RA和系統(tǒng)性紅斑狼瘡中發(fā)揮重要作用[24-26]。此外,對PPI網(wǎng)絡進行模塊化分析,發(fā)現(xiàn)男性組核心模塊KEGG分析主要與趨化因子信號通路、細胞因子-細胞因子受體相互作用和Toll樣受體信號通路有關;女性組核心模塊KEGG分析主要與趨化因子信號通路、細胞因子-細胞因子受體相互作用、神經(jīng)活性配體-受體相互作用有關。
綜上所述,本研究使用生物信息學技術整合3個RA表達譜芯片,分別對男性和女性RA患者的DEGs進行分析,得到了不同的關鍵基因,本研究發(fā)現(xiàn)了導致男性和女性RA發(fā)病機制差異的相關證據(jù),為RA的治療提供了更有前景的治療靶點。