薛 菁,馬 銀,韓玉梅,池淑紅
間質(zhì)性肺病(ILD) 是類風(fēng)濕性關(guān)節(jié)炎(RA) 患者比較常見的一種關(guān)節(jié)外病變[1]。目前,類風(fēng)濕性關(guān)節(jié)炎相關(guān)間質(zhì)性肺病(RA-ILD)臨床診療管理報(bào)道較多,而對(duì)于其發(fā)病機(jī)制的研究卻相對(duì)匱乏[2]。早期的芯片技術(shù)到現(xiàn)在的高通量測(cè)序技術(shù),都是以挖掘研究疾病相關(guān)靶標(biāo)分子及通路為核心,其應(yīng)用較為廣泛[3]。本研究利用NCBI GEO(GEO) 數(shù)據(jù)庫(kù)的RA-成纖維樣滑膜細(xì)胞(FLS)及ILD肺臟組織基因表達(dá)譜數(shù)據(jù)篩選共同表達(dá)的差異基因,并利用DAVID、KEGG以及STRING數(shù)據(jù)庫(kù)分析目的基因顯著富集的生物學(xué)過(guò)程,分子功能以及信號(hào)通路,為RA-ILD生物標(biāo)記物的鑒定及分子機(jī)制的研究提供思路。
1.1 原始表達(dá)譜矩陣文件的下載與處理:數(shù)據(jù)集GSE47460及GSE128813均來(lái)源于NCBI-GEO DataSets,其中GSE47460數(shù)據(jù)集包括582例肺臟組織樣本,選取符合標(biāo)準(zhǔn)的194例ILD樣本以及91例正常肺臟組織對(duì)照樣本(297例COPD樣本除外),GSE128813數(shù)據(jù)集包括3例RA-FLS樣本以及3例正常FLS對(duì)照樣本。
1.2 差異表達(dá)基因(DEGs) 及目的基因的獲取:利用R3.6.1軟件的limma包分別篩選兩個(gè)數(shù)據(jù)集顯著DEGs,以P<0.05并且 |log2FC|>0.5作為篩選差異基因的閾值。分別利用R3.6.1軟件中g(shù)gplot2和pheatmap包繪制DEGs火山圖及熱圖,并利用Venn將兩個(gè)數(shù)據(jù)集篩選得到的DEGs取交集,從而獲取目的基因進(jìn)行后續(xù)分析。
1.3 目的基因富集分析:利用富集分析工具DAVID分析目的基因參與的GO功能富集及KEGG通路富集。選取參與富集基因個(gè)數(shù)≥2,P<0.05作為富集顯著性的閾值。
1.4 TOP8核心(Hub)基因篩選:利用STRING(http:∥string-db.org/) 數(shù)據(jù)庫(kù)構(gòu)建目的基因蛋白質(zhì)互作調(diào)控網(wǎng)絡(luò)圖(Protein-protein interaction,PPI),構(gòu)建后的網(wǎng)絡(luò)圖利用Cytoscape3.6.0軟件及MCODE插件篩選TOP8 Hub基因。
1.5 目的基因蛋白質(zhì)與轉(zhuǎn)錄因子(TF) 網(wǎng)絡(luò)調(diào)控圖:利用DAVID軟件搜索與目的基因顯著相關(guān)的轉(zhuǎn)錄因子,聯(lián)合目的基因蛋白質(zhì)互作網(wǎng)路構(gòu)建和TF相關(guān)的調(diào)控關(guān)系網(wǎng)絡(luò)圖。
2.1 DEGs篩選結(jié)果:數(shù)據(jù)集GSE47460 (間質(zhì)性肺病實(shí)驗(yàn)組 vs.正常對(duì)照肺臟組織組)和數(shù)據(jù)集GSE128813 (類風(fēng)濕性關(guān)節(jié)炎成纖維樣滑膜細(xì)胞與正常對(duì)照成纖維樣滑膜細(xì)胞)分別篩選出1 173個(gè)和1 154個(gè)滿足閾值的DEGs(圖1A、1B,封三),2組DEGs中包含43個(gè)重疊DEGs(圖2,目錄后),其中表達(dá)上調(diào)基因24個(gè),表達(dá)下調(diào)基因19個(gè),重疊DEGs分別在2組數(shù)據(jù)集中表達(dá)熱圖(圖3,封三),見表1。
表1 DEGs的24個(gè)高表達(dá)基因和19個(gè)低表達(dá)基因
2.2 目的基因功能及通路富集分析:分析目的基因的功能及通路富集情況。在生物學(xué)過(guò)程組中,主要富集于膠原蛋白分解代謝的過(guò)程、蛋白寡聚化正向調(diào)控、間充質(zhì)細(xì)胞增殖、催化活性負(fù)向調(diào)控、軟骨形態(tài)發(fā)生及上皮細(xì)胞向間充質(zhì)細(xì)胞轉(zhuǎn)化涉及心內(nèi)膜的形成。在細(xì)胞成分組中,主要富集于細(xì)胞外基質(zhì)、中間體及胞外區(qū)。在分子功能組中,主要富集于肽鏈內(nèi)切酶活性、肽鏈內(nèi)切酶金屬活性、肝素結(jié)合及生長(zhǎng)因子(圖4,封三)。KEGG-通路分析發(fā)現(xiàn)顯著富集的通路包括類風(fēng)濕性關(guān)節(jié)炎、癌癥通路、細(xì)胞骨架調(diào)控、Rap1信號(hào)通路、Ras信號(hào)通路、MAPK信號(hào)通路及戊糖和葡醛酸鹽的相互轉(zhuǎn)化(圖5,封三),見表2。
表2 DEGs三個(gè)功能組的顯著富集分析
2.3 利用PPI對(duì)DEGs進(jìn)行關(guān)鍵候選基因的識(shí)別:運(yùn)用STRING網(wǎng)站和Cyto-scape軟件,經(jīng)分析發(fā)現(xiàn)43個(gè)共同差異表達(dá)基因中有18個(gè)DEGs被過(guò)濾到PPI網(wǎng)絡(luò)中,其中包含18個(gè)節(jié)點(diǎn)和25個(gè)相互作用關(guān)系(圖6,封三)。18個(gè)節(jié)點(diǎn)中,利用Cytohuabba篩選了8個(gè)Hub-基因,分別為基質(zhì)金屬酶1(MMP1),基質(zhì)金屬酶3(MMP3),Discs大同源相關(guān)蛋白(DLGAP5),拓?fù)洚悩?gòu)酶2A(TOP2A),著絲粒蛋白F(CENPF),驅(qū)動(dòng)蛋白超家族4A(KIF4A),SHC的SH22結(jié)構(gòu)域結(jié)合蛋白1(SHCBP1),去整合酶金屬蛋白酶3(ADAMTS3)(圖7,封三)。
2.4 目的基因與TF調(diào)控關(guān)系網(wǎng)絡(luò)圖:利用DAVID工具搜索共同差異表達(dá)基因顯著相關(guān)的轉(zhuǎn)錄因子,共篩選得到3個(gè)滿足閾值的TF,分別為SRY、STST5B、NKX3A。利用Cyto-scape軟件構(gòu)建DEGs與TF調(diào)控網(wǎng)絡(luò)圖,其中包括43個(gè)節(jié)點(diǎn)和112個(gè)相互作用關(guān)系(圖8,封三)。
RA是以滑膜慢性炎癥及骨破壞為特征的一種系統(tǒng)性疾病[4]?;ひr里層的FLS的異常增殖、侵襲是RA發(fā)病的主要原因之一[5]。研究統(tǒng)計(jì),RA患者一生發(fā)生ILD的風(fēng)險(xiǎn)約為60%,嚴(yán)重影響了患者的日常生活質(zhì)量,同時(shí)存在死亡風(fēng)險(xiǎn)[6-7]。研究表明,感染、吸煙、黏膜失調(diào)、宿主遺傳及過(guò)早衰老等都是RA患者肺部疾病發(fā)展的重要潛在因素[8]。RA-ILD(可先于關(guān)節(jié)發(fā)病) 可能起源于慢性氣道和肺泡上皮損傷,從而導(dǎo)致慢性炎癥以及氣道和肺實(shí)質(zhì)的纖維化改變[9]。然而,作為影響RA患者預(yù)后的ILD,一直以來(lái)研究方法、動(dòng)物模型以及治療手段均較匱乏,比如是否采用抗纖維化治療/非抗纖維化治療的方法存在爭(zhēng)議[10]。所以說(shuō),進(jìn)一步尋找RA-ILD潛在的診斷與治療靶基因和相關(guān)信號(hào)通路,對(duì)于臨床發(fā)掘有效的治療方法至關(guān)重要。本研究通過(guò)分別篩選RA-FLS及ILD肺臟組織芯片數(shù)據(jù)集的共同表達(dá)差異基因,同時(shí)根據(jù)目的基因的PPI網(wǎng)絡(luò),共篩選出8個(gè)Hub基因,包括MMP-1、MMP-3、DLGAP5、TOP2A、SHCBP1、CENPF、KIF4A、ADAMTS3。Hub基因功能主要富集于膠原蛋白分解代謝、上皮細(xì)胞向間充質(zhì)細(xì)胞分化及間充質(zhì)細(xì)胞增殖過(guò)程。
關(guān)節(jié)軟骨的細(xì)胞外基質(zhì)(ECM)和基底膜降解是RA患者關(guān)節(jié)軟骨損害的病理基礎(chǔ)?;|(zhì)金屬蛋白酶(MMPs) 對(duì)降解ECM起著重要作用[11]。在MMPs家族中,MMP1和MMP3屬于膠原酶和間質(zhì)溶解素酶,對(duì)ECM的降解發(fā)揮著關(guān)鍵作用。研究表明,利用ELISA及qRT-PCR方法檢測(cè)RA患者關(guān)節(jié)滑膜組織原代成纖維樣滑膜細(xì)胞中MMP1和MMP3的表達(dá),均高于阿巴西普細(xì)胞治療組,提示MMP1與MMP3的表達(dá)水平與RA疾病活動(dòng)度呈現(xiàn)正相關(guān)[12]。在檢測(cè)端粒酶介導(dǎo)的人骨關(guān)節(jié)炎FLS(hTERT-OA 13A FLS)和端粒酶介導(dǎo)的人類風(fēng)濕關(guān)節(jié)炎FLS(hTERT-RA 516 FLS)基因表達(dá)的差異時(shí),發(fā)現(xiàn)MMP1、MMP3及ADAMTS3基因在端粒酶介導(dǎo)的人類風(fēng)濕關(guān)節(jié)炎FLS中的表達(dá)是明顯上調(diào)的。而在博來(lái)霉素誘發(fā)的特發(fā)性肺纖維化小鼠模型中,MMP3具有促進(jìn)上皮細(xì)胞向間質(zhì)轉(zhuǎn)化、異常遷移和其他異常修復(fù)過(guò)程的功能,而MMP1具有減緩肺臟纖維化的潛在功能,這一結(jié)論與本文結(jié)論不符,可能與實(shí)驗(yàn)樣本量的大小以及物種的差異性有關(guān)。ADAMTS3是ADAMTS基因家族前膠原N-蛋白酶亞家族成員,其主要作用為合成骨和軟骨的組成成分II型膠原分子[13]。研究表明,在SiO2構(gòu)建的大鼠肺纖維化模型中,miR-144可通過(guò)調(diào)控靶基因ADAMTS3參與肺纖維化的發(fā)生。以上結(jié)果提示MMP1、MMP3及ADAMTS3基因可能參與RA-ILD的發(fā)生。
TOP2A是一種廣泛存在于原核生物和真核生物中的酶蛋白,與細(xì)胞增殖、細(xì)胞凋亡、細(xì)胞有絲分裂等密切相關(guān)。其表達(dá)的異常與腫瘤的發(fā)生發(fā)展、治療及其預(yù)后等方面相關(guān)[14]。研究表明,青少年類風(fēng)濕性關(guān)節(jié)炎患者血漿中TOP2A的水平與疾病的嚴(yán)重程度呈現(xiàn)正相關(guān),并且系統(tǒng)性硬化(SSc) 患者血漿中抗TOP2A抗體陽(yáng)性發(fā)生肺纖維化的概率明顯高于抗TOP2A抗體陰性患者,這一發(fā)現(xiàn)強(qiáng)調(diào)了TOP2A對(duì)于風(fēng)濕免疫疾病誘發(fā)的肺部疾病的研究是一個(gè)有價(jià)值的重要工具[15-16]。
綜上所述,通過(guò)對(duì)RA-FLS及ILD肺臟組織芯片數(shù)據(jù)集的共同表達(dá)差異基因的篩選、搜尋GEO Profiles數(shù)據(jù)庫(kù)及查閱相關(guān)文獻(xiàn),結(jié)果提示,MMP1、MMP3、ADAMTS3、TOP2A可能在RA-ILD中起一定作用。而DLGAP5、SHCBP1、CENPF、KIF4A,其主要富集功能與MMP1、MMP3、ADAMTS3、TOP2A類似,但相關(guān)文獻(xiàn)報(bào)道較少,尚需實(shí)驗(yàn)室和臨床證實(shí)。這也是本文的不足之處,需要進(jìn)一步開展的工作。