薛 娜 肖 瑩 董 晶 孫 偉 (吉林省白城醫(yī)學高等??茖W校,白城137000)
干燥綜合征(Sj?gren's syndrome,SS)是一種全身性自身免疫病,主要病理生理學改變是外泌腺淋巴細胞浸潤引起的與SS 相關的眼睛和口腔干燥。SS 是第二常見的慢性自身免疫性疾病,其發(fā)病具有性別傾向,主要集中于50歲左右的女性患者[1-2]。SS分為原發(fā)性和繼發(fā)性兩種類型,目前尚無單一的實驗室檢驗或檢查可確診此疾?。?]。2016年ACR/EU?LAR 指南主要通過結合唾液腺活檢的抗Ro/SSA 陽性及眼部和口腔干燥癥狀分類[4]。此外SS 還會導致患者出現(xiàn)腺外表現(xiàn),影響多種器官,包括肺、皮膚、關節(jié)、神經系統(tǒng)和腎臟,進而加重患者的生活負擔和病死率[5]。目前SS 病因不明,因此無特效治療藥物,臨床治療主要以緩解癥狀、延緩病情發(fā)展為主要目的。因此本研究從基因水平探究SS 的發(fā)病機制,應用多重生物信息分析方法試圖尋找到與SS發(fā)病過程最相關的核心基因及關鍵通路,為SS的快速診斷和治療提供理論依據。
1.1 基因數(shù)據來源 選取GEO數(shù)據庫中SS相關基因原始數(shù)據GSE97614,共包含9 例SS 患者及3 例體檢者的基因檢測結果,從GPL6244 平臺下載入組患者的基本狀況及微矩陣原始數(shù)據[6]。全部基因應用GraphPad Prism 7.0繪制火山圖進行可視化處理,應用基因熱圖在TBtools軟件上進行聚類分析。
1.2 數(shù)據校準及篩選 應用R 語言limma 數(shù)據包對基因微陣列原始數(shù)據進行均一化處理,篩除表達量過高或過低的原始數(shù)據。應用GEO2R 算法對全部基因進行處理,并依照P<0.05和差異表達倍數(shù)>2的標準進行篩選,從而獲得差異上調表達和差異下調表達的基因。
1.3 DAVID 數(shù)據富集分析 應用DAVID 在線分析軟件分別對差異上調和差異下調及全部差異表達基因(differentially expressed genes,DEGs)進行基因本體(GO)分析及KEGG 信號通路分析。其中GO 分析包括細胞組分、分子功能及生物過程。全部富集分析篩選標準為基因數(shù)≥2個及P<0.05。對DEGs富集結果進行R語言數(shù)據處理及氣泡圖可視化呈現(xiàn)。
1.4 蛋白互作(PPI)網絡分析 應用STRING 在線分析軟件進行PPI 網絡制作,全部DEGs輸入“Multi?ple proteins”對話框,物種選擇為“homo sapiens”,同時獲得可視化處理后的PPI網絡圖及基因間的具體聯(lián)系。
1.5 核心基因預測 將PPI 網絡圖提供的數(shù)據信息輸入Cytoscape 軟件進行可視化處理。通過Cyto?scape 內置插件cytohubba 對全部基因聯(lián)系進行分析和計算,選擇“Degree”評分準則對全部DEGs按照分數(shù)依次降序排列,最終篩選出與SS發(fā)病最為相關的核心基因。
1.6 統(tǒng)計學方法 所有原始數(shù)據采用R 語言軟件進行分析。DEGs 篩選標準為差異倍數(shù)≥2 及P<0.05。KEGG 信號通路富集基因最少為2 且P<0.05。PPI篩選標準為基因間聯(lián)系>0.4。
2.1 原始數(shù)據處理 GSE97614 共包含12 例患者樣本,全部患者均為女性,依照ACR/EULAR 指南診斷為原發(fā)性SS。其中9 例SS 患者平均年齡為58 歲(24~75 歲),對照組3 例患者平均年齡為52 歲(20~70 歲)。SS 患者具體服藥情況不詳。GSE97614 共包含49 395 個編碼基因的檢測結果,數(shù)據樣本的均值-方差趨勢(圖1A)、UMAP 圖(圖1B)、表達密度(圖1C)、矯正P值(圖1D)、t值(圖1E)顯示基因檢測結果具有可分析性。
圖1 GSE97614原始數(shù)據一般概況Fig.1 General overview of GSE97614
2.2 差異基因矯正 檢測12例樣本中每例樣本的49 395 個編碼基因數(shù)據,結果顯示原始數(shù)據結果均一性較差(圖2A);應用R 語言limma 包進行數(shù)據均一化處理,篩除離散度較大的數(shù)據(表達過高或表達過低),校準后的數(shù)據均一性較好(圖2B)。
圖2 差異基因矯正Fig.2 DEGs correction
2.3 差異基因篩選及可視化處理 共篩選出96個差異上調表達和65 個下調表達的基因。對全部DEGs 進行火山圖可視化處理結果見圖3A。對全部DEGs 進行聚類分析,應用基因熱圖進行可視化處理,結果顯示全部DEGs具有可聚類性(圖3B)。
圖3 差異基因可視化處理Fig.3 Visualization of DEGs
2.4 差異基因的GO 分析 對差異上調表達基因進行GO 分析顯示差異基因在細胞組成主要富集于細胞外間隙,生物過程主要富集于細胞外基質,分子功能主要富集于細胞因子活性。差異下調表達基因在細胞組成主要富集于質膜的組成成分,生物過程主要富集于細胞對激素刺激的反應,分子功能主要富集于整合素結合。全部DEGs 在細胞組成主要富集于細胞外間隙,生物過程主要富集于細胞外基質,分子功能主要富集于細胞因子活性,和差異上調表達基因的GO分析一致,說明差異上調表達基因可能在SS的發(fā)病過程中發(fā)揮更重要的作用(圖4)。
圖4 差異基因的GO分析Fig.4 GO analysis of DEGs
2.5 差異基因的KEGG 分析 對差異上調表達基因進行KEGG分析顯示差異基因主要富集于補體和凝血級聯(lián)通路、細胞外基質通路及黏著斑通路。對差異下調表達基因進行KEGG分析顯示差異基因主要富集于干細胞多能性信號通路、雌激素信號通路及MAPK信號通路(圖5)。
圖5 差異基因的KEGG分析Fig.5 KEGG analysis of DEGs
2.6 PPI網絡 STRING在線分析軟件對全部161個DEGs 進行PPI 網絡分析,結果顯示共有141 個基因之間存在相關性聯(lián)系,聯(lián)系線路為224條,每個基因間的連接程度評分為3.18,平均局部聚類系數(shù)為0.401,PPI富集P值<1.0e-16(圖6)。
圖6 差異基因PPI網絡Fig.6 PPI network of DEGs
2.7 SS發(fā)病核心基因預測 應用Cytoscape對蛋白網絡連接數(shù)據進行可視化處理,cytohubba 內置應用程序計算出FN1(32分)、IL1B(20分)、TIMP1(20分)、THBS1(16分)、PLAU(16分)、SERPINE1(16分)、FOS(14 分)、ITGB3(13 分)、VCAN(10 分)、ADAMTS1(10 分)為前10 位發(fā)病核心基因。對10 個核心基因進行聚類分析顯示基因間具有可聚類性(圖7)。
圖7 核心基因預測Fig.7 Prediction of hub genes
SS 是一種慢性自身免疫病,其典型的病理學改變是淚腺和唾液腺受累,導致眼睛和口干燥。SS 可累積到全身多個器官,包括肺、腎和中樞神經系統(tǒng),加重患者的生活負擔及病死率[7]。目前針對SS 的具體發(fā)病機制尚不明確,因此無特效治療藥物。西醫(yī)以激素及免疫抑制劑為主,并針對癥狀選擇人工淚液、人工唾液進行對癥支持治療。中醫(yī)多采用以補益脾胃、益氣養(yǎng)陰為主的辨證治療[8]。目前針對SS的診斷也是臨床的難點,由于SS患者早期缺乏特異性臨床表現(xiàn),臨床也缺乏特異性和敏感性高的血清診療標志物,常導致SS治療時機延誤。因此新的快速的血清學生物診療標志物可提供SS 的早期診斷,更有可能成為治療SS的生物靶點。本研究主要對既往SS疾病基因測序結果進行深入分析,試圖找到SS快速診療的標志物及潛在治療靶點。
纖維連接蛋白(fibronectin,F(xiàn)N)是脊椎動物的一種470~500 kD 的糖蛋白,對動物的發(fā)育、器官生長、細胞黏附、細胞遷移及止血等正常過程發(fā)揮重要作用[9]。FN分為3種亞型,包括FN1、FN2和FN3。FN 一般有兩種來源:血漿FN 由肝細胞合成并分泌到血液中;細胞FN 由細胞局部分泌。FN 需要被組裝成細胞外基質的原纖維發(fā)揮作用。目前關于FN的組裝機制主要在細胞層面進行研究,涉及FN 與細胞表面分子結合,招募額外的FN 分子形成不溶性原纖維。組裝開始于細胞黏附部位,生長的原纖維可向內部轉移[10]。FN1分子廣泛分布于健康的細胞膜、固有層、血管結構、神經和平滑肌細胞層[11]。其是細胞遷移和轉移的重要調節(jié)因子,據報道,F(xiàn)N1參與人類皮膚鱗狀細胞癌的發(fā)生[12]。FN1在甲狀腺癌中表達上調,下調其表達可抑制甲狀腺癌細胞的增殖、侵襲和遷移,提示FN1 可能參與甲狀腺癌的發(fā)生[13]。FN1 通過激活PI3K 促進細胞增殖,抑制細胞凋亡[14]。在肝細胞癌中發(fā)現(xiàn)FN 蛋白呈過表達趨勢[15]。胃腸道和頭頸部癌癥患者血漿FN1 水平明顯升高[16]。在非惡性疾病中,特別是在血栓形成、止血過程、血管疾病和血小板功能方面,F(xiàn)N 的確切作用仍不明確。
目前針對FN1 在SS 發(fā)病機制中的作用尚未得到廣泛關注,國內外僅有2 篇報道。JIANG 等[17]在2021 年的研究發(fā)現(xiàn)沙參麥冬湯可能對SS 的治療發(fā)揮積極作用,其通過生物信息學分析發(fā)現(xiàn),沙參麥冬湯可能通過靶向結合FN1 治療SS。其具體機制可能與沙參麥冬湯改善FN1 和MMP-9 對唾液腺泡和基底膜結構的破壞、降低FN1在SS中的促炎癥反應有關。MONA 等[18]2020 年的體內實驗發(fā)現(xiàn),具有潛在免疫調節(jié)及治療作用的骨髓間充質干細胞在與唾液腺細胞進行共培養(yǎng)時,可分化為唾液祖細胞,取代病變的唾液腺細胞從而起到治療SS 的作用。
本文通過生物信息分析方法,首先對GSE97614基因檢測結果進行了均一化處理,使得后續(xù)生物信息分析結果更加準確。然后利用GO分析、KEGG 信號通路分析,PPI 網絡分析及cytoHubba 核心發(fā)病基因計算最終發(fā)現(xiàn)FN1 是SS 發(fā)病的關鍵基因。本文并不是第一篇針對SS 發(fā)病核心基因預測的文章。目前有4 篇針對SS 發(fā)病基因的生物信息分析文獻。郭俊愷等[19]分析GSE23117 和GSE127952 的基因表達譜發(fā)現(xiàn)CXCL9 可能與SS 發(fā)病相關。蔡鑫等[20]分析GSE127952 的基因表達譜發(fā)現(xiàn)STAT1 可能與SS發(fā)病相關。徐華等[21]分析GSE7451、GSE127952 和GSE40611的基因表達譜發(fā)現(xiàn)STAT1可能與SS發(fā)病相關。梁江等[22]分析GSE23117、GSE07451、GSE40611、GSE84844 的基因表達譜發(fā)現(xiàn)BAFF 可能與SS 發(fā)病相關。目前尚無研究分析GSE97614 數(shù)據,而本文的分析結果也與既往研究發(fā)現(xiàn)的核心發(fā)病基因不完全相同,提示SS發(fā)病機制的復雜性及多樣性。
FN1 是上皮細胞-間質細胞轉化相關基因,在腫瘤相關研究中被關注較多。近年來,越來越多的研究表明FN1 也是參與免疫浸潤的免疫相關基因。FN1編碼FN并儲存于血漿和細胞外基質,在炎癥組織募集巨噬細胞過程中,F(xiàn)N1 呈現(xiàn)高度上調趨勢。與此同時,F(xiàn)N1在體外也可作為白細胞遷移的基質,促進組織中的T 細胞聚集,增強局部對感染或癌癥的免疫力[23]。免疫浸潤分析研究顯示免疫浸潤水平與FN1表達水平相關。FN1參與調控NKp46受體介導的天然殺傷細胞產生IFN-γ,進而影響細胞內免疫。FN1 參與許多與免疫相關的信號通路,如趨化因子信號通路、細胞因子受體相互作用、自然殺傷細胞介導的細胞毒性和T 細胞受體信號通路。FN1 表達水平的增加與M2 巨噬細胞和靜息CD4+T細胞的比例呈正相關,但與濾泡輔助性T 細胞和CD8+T細胞比例呈負相關[24]。SS是一種自身免疫性疾病,隨著FN1 參與體內免疫應答過程的深入研究,其在SS發(fā)病機制中的作用亦會被逐漸挖掘。
綜上,本研究通過對SS基因數(shù)據進行生物信息學分析發(fā)現(xiàn)免疫相關基因FN1 可能通過改善免疫調節(jié)誘發(fā)SS。FN1 可能作為SS 快速診斷的血清標志物及潛在的藥物干預靶點。未來有關FN1 介導免疫浸潤、免疫細胞的募集及其在SS發(fā)病機制中的作用可能成為重點研究方向。