曾小麗 李生嬌 單錚男 殷俊豪 姜吉蕊 鄭章龍 李家
1.上海牙組織修復(fù)與再生工程技術(shù)研究中心,同濟(jì)大學(xué)附屬口腔醫(yī)院·同濟(jì)大學(xué)口腔醫(yī)學(xué)院口腔頜面外科,上海200072;2.上海牙組織修復(fù)與再生工程技術(shù)研究中心,同濟(jì)大學(xué)附屬口腔醫(yī)院·同濟(jì)大學(xué)口腔醫(yī)學(xué)院修復(fù)科,上海200072
牙周炎是一種常見的口腔科疾病,慢性牙周炎的持續(xù)進(jìn)展將導(dǎo)致牙齒的松動、脫落乃至口腔咬合功能的完全喪失[1-3],作為被多種因素混雜影響的慢性炎癥性疾病,牙周炎的發(fā)生、發(fā)展過程中有大量基因及基因產(chǎn)物參與其中,因此,尋找牙周炎發(fā)病過程中的關(guān)鍵基因及相關(guān)因子是目前研究的一大熱點。
隨著高通量技術(shù)的發(fā)展,通過芯片或測序等技術(shù)研究疾病與對照組間的基因表達(dá)譜的差異成為篩選致病基因的有力工具?;虮磉_(dá)量的變化往往預(yù)示著生理過程的改變或病理過程的發(fā)生,與此同時,基因編碼的產(chǎn)物所涉及的分子功能、生物過程、信號通路則可能與疾病的發(fā)生發(fā)展相關(guān)。由于慢性牙周炎的發(fā)生發(fā)展是多種基因及其產(chǎn)物的共同作用效果,單個基因或蛋白的表達(dá)變化往往不足以完全反映疾病的發(fā)展過程。此外,由于樣本數(shù)目小以及芯片檢測平臺的差異,過去不同研究者獲得結(jié)果并不完全一致,甚至可能互相矛盾。因此,本實驗基于大樣本量、相同檢測平臺等檢索要求,從基因表達(dá)綜合(gene expression omnibus,GEO) 數(shù)據(jù)庫中篩選并獲得符合標(biāo)準(zhǔn)的兩個慢性牙周炎相關(guān)數(shù)據(jù)集GSE10334 和GSE16134 并深入分析其中差異表達(dá)基因的功能、相關(guān)通路以及核心模塊、基因,為未來的研究指明方向[4-5]。
在GEO 數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/) 中以 “牙周炎(periodontitis)” 為關(guān)鍵詞檢索相關(guān)芯片,并篩選基于同一檢測平臺且樣本量大于100 的基因表達(dá)數(shù)據(jù)集,獲取了2 組符合標(biāo)準(zhǔn)的數(shù)據(jù)集:GSE10334 和GSE16134。兩組數(shù)據(jù)集均采用美國Affymetrix 公司提供的Human Genome U133 Plus 2.0 Array 基因芯片進(jìn)行檢測,平臺號為GPL570。兩組芯片數(shù)據(jù)的樣本采集于中重度牙周炎患者炎性區(qū)域牙齦組織(試驗組) 和健康牙齦組織(對照組),兩組使用相同的采樣方法,并具有一致的樣本納入標(biāo)準(zhǔn)和臨床分型指標(biāo)[4-5]。其中,GSE10334 的芯片數(shù)據(jù)來源于90 位患者的247 例樣本(183例病變,64例健康);GSE16134的芯片數(shù)據(jù)來源于120 位患者的310 例樣本(241 例病變,69例健康)[4-5]。
使用GEO2R 在線分析工具(http://www.ncbi.nlm.nih.gov/geo/geo2r/) 進(jìn)行試驗組與對照組之間差異表達(dá)基因(differentially expressed gene,DEG)的篩選,篩選閾值設(shè)定為調(diào)整P值(adjustedPvalue,adj.P) <0.05,差異倍數(shù)(fold change,F(xiàn)C) >2。使用R 語言的ggplot2 軟件包繪制火山圖和熱圖。
對兩組數(shù)據(jù)集的差異基因取交集后進(jìn)行后續(xù)分析,以增加結(jié)果可信度。使用g: Profiler (https://biit.cs.ut.ee/gprofiler/gost) 分別對上、下調(diào)基因進(jìn)行功能富集分析,功能富集分析包括對基因的基因本體論(gene ontology,GO) 分析和通路分析。GO 分析涵蓋了分子功能、生物過程和細(xì)胞組分3個下級類目。通路分析中的生物通路信息來源于京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)、Reactome和WIKI共3個數(shù)據(jù)庫。adj.P<0.05 視為差異具有統(tǒng)計學(xué)意義。
為了探索差異表達(dá)基因之間的相互作用關(guān)系,筆者通過在線工具STRING 數(shù)據(jù)庫(https://stringdb.org/) 建立蛋白相互作用(protein-protein interaction,PPI) 網(wǎng)絡(luò),然后使用Cytoscape (www.cytoscape.org/) 軟件將該網(wǎng)絡(luò)進(jìn)行可視化。
使用Cytoscape 軟件中的MCODE 插件并基于默認(rèn)閾值(K-core=2,Node Score Cutoff=0.2,Degree Cutoff=2,Maximum Depth=100) 篩選PPI 網(wǎng)絡(luò)中的重要功能模塊。使用cytoHubba 插件進(jìn)行PPI 網(wǎng)絡(luò)中關(guān)鍵節(jié)點的篩選。cytoHubba 插件使用12 種拓?fù)浞治霾呗赃M(jìn)行重要節(jié)點的預(yù)測和評估,在6 種以上算法中得分均位于前10 的節(jié)點被視作核心基因。為進(jìn)一步了解PPI網(wǎng)絡(luò)中重要子網(wǎng)絡(luò)的功能,筆者對MCODE核心模塊中的基因進(jìn)行了功能富集分析,并繪制通絡(luò)分析氣泡圖。
使用Cytoscape 軟件中的iRegulon 插件進(jìn)行轉(zhuǎn)錄因子的預(yù)測。該插件使用標(biāo)準(zhǔn)化富集分?jǐn)?shù)(normalized enrichment score,NES) 來評估預(yù)測結(jié)果的可信度,NES 值越大,說明可信度越高,筆者將NES>4.5的轉(zhuǎn)錄因子將用于調(diào)控網(wǎng)絡(luò)的建立。
基于adj.P<0.05 且FC 絕對值>2 的篩選標(biāo)準(zhǔn),在GSE10334 中篩選出221 個DEG,其中150 個上調(diào),71 個下調(diào)(圖1A);在GSE16134 中篩選出297 個DEG,其中212 個上調(diào), 85 個下調(diào)(圖1C);兩組DEG 在試驗組與對照組的表達(dá)量變化及其基因、樣本聚類結(jié)果見圖1B、D。
圖1 試驗組與對照組間差異基因的篩選Fig 1 Identification of differentially expressed genes between test group and control group
在兩組數(shù)據(jù)集中,196 個DEG 表達(dá)趨勢一致,包括139 個上調(diào)基因和57 個下調(diào)基因(圖2A、D)。GO 分析結(jié)果顯示:上調(diào)基因共富集于10 項分子功能、99 項生物過程以及20 項細(xì)胞組分,下調(diào)基因共富集于1項分子功能、11項生物過程以及7項細(xì)胞組分。圖2B、E展示了上、下調(diào)DEG adj.P前10 的GO 條目。在分子功能方面,上調(diào)基因參與趨化因子受體結(jié)合、免疫球蛋白結(jié)合,而下調(diào)基因參與皮膚表皮結(jié)構(gòu)形成。在生物過程方面,上調(diào)基因涉及免疫應(yīng)答、刺激應(yīng)答、白細(xì)胞活化等,而下調(diào)基因涉及皮膚及表皮的發(fā)育和角化。在細(xì)胞組分方面,上調(diào)基因主要位于胞外間隙、細(xì)胞表面、胞外體、質(zhì)膜外側(cè),而下調(diào)基因主要位于超分子纖維、超分子聚合物、聚合細(xì)胞骨架纖維、透明角化顆粒等處。
通路分析結(jié)果顯示:上調(diào)基因富集于26 條信號通路,其中包括12 條KEGG 通路、12 條Reactome 通路和2 條WIKI 通路;而下調(diào)基因富集于2條Reactome 通路。圖2C、F 分別展示了上調(diào)基因adj.P前15 的通路條目和下調(diào)基因所富集的2 條通路條目。上調(diào)基因參與細(xì)胞因子-細(xì)胞因子受體相互作用、白細(xì)胞經(jīng)內(nèi)皮細(xì)胞遷移、趨化因子信號通路以及人補體系統(tǒng)、造血干細(xì)胞分化等免疫反應(yīng)相關(guān)通路,而下調(diào)基因涉及角質(zhì)化包膜形成、角化等2條通路。
圖2 差異基因功能富集分析結(jié)果Fig 2 Functional enrichment analysis of differentially expressed genes
由交集基因構(gòu)成的PPI 網(wǎng)絡(luò)包含132 個節(jié)點和519 個節(jié)點作用關(guān)系(圖3)。圖4A、B 顯示:PPI網(wǎng)絡(luò)的第一模塊涉及病毒蛋白與細(xì)胞因子及細(xì)胞因子受體的相互作用、細(xì)胞因子-細(xì)胞因子-受體相互作用和趨化因子信號通路等通路。圖4C、D 顯示:第二模塊參與B細(xì)胞受體信號通路。圖4E、F顯示:第三模塊與白細(xì)胞介素介導(dǎo)的信號通路、JAK-STAT信號通路等通路有關(guān)。
圖3 構(gòu)建PPI網(wǎng)絡(luò)并篩選核心基因Fig 3 Construction of PPI network and identification of hub genes
圖4 PPI網(wǎng)絡(luò)核心模塊篩選與通路分析結(jié)果Fig 4 Identification and pathway analysis of key modules in PPI network
cytoHubba 插件的分析結(jié)果顯示:滿足篩選標(biāo)準(zhǔn)的基因為CXC 基序趨化因子配體(C-X-C motif chemokine ligand,CXCL) 8、CXCL1、CXC 基序趨化因子受體(C-X-C motif chemokine receptor,CXCR) 4、選擇素(selectin,SEL) L, CD19 分子(CD19 molecule,CD19) 和IKAROS 家族鋅指(IKAROS family zinc finger,IKZF) 1。在PPI 網(wǎng)絡(luò)中,CXCL1、CXCL8、CXCR4 和SELL 位于第一模塊,IKZF1位于第三模塊。
依據(jù)iRegulon預(yù)測結(jié)果,NES>4.5的轉(zhuǎn)錄因子為干擾素調(diào)節(jié)因子(interferon regulatory factor,IRF) 4、組蛋白乙酰轉(zhuǎn)移酶(E1A binding protein,EP) P300、易洛魁同源盒蛋白(iroquois homeobox,IRX) 4 和TATA 序列結(jié)合蛋白(TATA-box binding protein,TBP),分別調(diào)控60、18、24 和36個DEG(圖5),其中IRF4屬于上調(diào)DEG且位于第二核心模塊,參與B細(xì)胞受體信號通路(圖4 C、D)。
圖5 轉(zhuǎn)錄因子及其調(diào)控網(wǎng)絡(luò)Fig 5 Transcription factors and their regulatory networks
牙周炎不僅是成年人失牙的主要原因,也是多種疾病如糖尿病、動脈粥樣硬化、慢性阻塞性肺疾病等系統(tǒng)性疾病的潛在風(fēng)險因素[3,6]。鑒定與牙周炎進(jìn)展相關(guān)的相關(guān)分子及信號通路,有利于了解牙周炎的發(fā)病機(jī)制,為牙周炎的早期診治及伴發(fā)疾病的預(yù)防提供理論基礎(chǔ)。本研究基于GEO數(shù)據(jù)庫公開的牙周炎基因表達(dá)譜,通過系統(tǒng)性生物信息學(xué)分析,為牙周炎的機(jī)制研究提供理論依據(jù)和研究方向。由于樣本量小會在一定程度上降低試驗結(jié)果的可信度,因此本研究篩取大樣本數(shù)據(jù)集GSE10334 和GSE16134 (分別含有247 例和310 例樣本) 進(jìn)行生物信息學(xué)分析。聯(lián)合分析兩組芯片數(shù)據(jù)集,在兩組中均差異表達(dá)的基因共196個,其中139 個為上調(diào)基因,57 個為下調(diào)基因。功能富集分析結(jié)果顯示,上調(diào)基因參與免疫系統(tǒng),病毒蛋白與細(xì)胞因子及細(xì)胞因子受體的相互作用,細(xì)胞因子-細(xì)胞因子受體相互作用,白細(xì)胞跨內(nèi)膜遷移和趨化因子受體結(jié)合趨化因子等免疫反應(yīng)相關(guān)途徑,由此可見免疫應(yīng)答相關(guān)途徑在牙周炎發(fā)病過程中發(fā)揮重要作用。而下調(diào)基因涉及角質(zhì)化包膜形成、角化等途徑,說明上皮屏障形成能力降低,提示牙周炎的發(fā)生與牙齦上皮完整性喪失相關(guān)。由差異基因構(gòu)建的PPI 網(wǎng)絡(luò)中,MCODE 得分前三的模塊被視作核心模塊,分別富集于趨化因子信號通路、B細(xì)胞受體信號通路以及白細(xì)胞介素介導(dǎo)的信號通路等途徑,由此推測,這些分子事件在牙周炎發(fā)病過程中活躍。CXCL8、CXCL1、CXCR4、SELL、CD19和IKZF1為核心基因,位于PPI網(wǎng)絡(luò)的中心位置,因此最有可能成為牙周炎的治療靶點。
CXCL8 和CXCL1 屬于趨化因子CXC 亞家族,通過募集白細(xì)胞來增強或延長炎癥反應(yīng)。多項研究[7-9]發(fā)現(xiàn),相較于健康牙齦,炎癥牙齦組織切片中CXCL8 和CXCL1 的mRNA 水平和蛋白水平均顯著升高。這些結(jié)果提示:炎性環(huán)境下牙周細(xì)胞可能通過分泌更多的趨化因子以對抗牙周病原體的感染,而這種過度的免疫應(yīng)答正是牙周組織破壞的主要原因。此外Souto 等[1]研究發(fā)現(xiàn),CXCL8水平與牙周炎患者的探診出血、探診深度和臨床附著喪失等臨床檢測指標(biāo)正相關(guān),其結(jié)果提示CXCL8 表達(dá)量與牙周炎嚴(yán)重程度相關(guān),有望成為牙周炎進(jìn)展標(biāo)志物。
CXCR4 是CXC 趨化因子受體家族成員,Hajishengallis 等[10]發(fā)現(xiàn),牙齦卟啉單胞菌可通過結(jié)合巨噬細(xì)胞表面CXCR4,逃避宿主的免疫清除??诜﨏XCR4 的拮抗劑AMD3100,可抑制牙齦卟啉單胞菌的定殖,進(jìn)而預(yù)防或減輕小鼠實驗性牙周炎及其引起的牙槽骨吸收[11]。因此推測,CXCR4是牙齦卟啉單胞菌在牙周炎致病作用的一個關(guān)鍵位點。
SELL 編碼淋巴細(xì)胞歸巢受體L-選擇素,該因子屬于細(xì)胞表面黏附分子,調(diào)控白細(xì)胞在血管內(nèi)的黏附與遷移。L-選擇素主要表達(dá)于中性粒細(xì)胞,在炎性疾病中,L-選擇素結(jié)合其相應(yīng)配體,調(diào)控中性粒細(xì)胞活化與聚集,并使其從血管中遷移至炎癥區(qū)域。中性粒細(xì)胞是固有免疫中的重要組成細(xì)胞,在免疫防御中起先驅(qū)作用,但近年來的研究[12]發(fā)現(xiàn),過度活化的中性粒細(xì)胞可通過產(chǎn)生大量活性氧和基質(zhì)降解酶造成牙周組織的破壞。因此,SELL 可能通過促進(jìn)中性粒細(xì)胞遷移和活化參與牙周炎病理發(fā)生。
CD19 是特異性表達(dá)于B 細(xì)胞表面的免疫球蛋白基因超家族成員[10-11,13-14],為B細(xì)胞抗原受體復(fù)合物的共受體,可降低激活下游信號通路和觸發(fā)B細(xì)胞對抗原的反應(yīng)的閾值[14]。因此,CD19 在試驗組的表達(dá)量升高,提示在炎性牙齦中B 細(xì)胞數(shù)目和免疫應(yīng)答活性增加。有研究[15]表明,B 細(xì)胞是牙周炎骨缺損區(qū)分泌RANKL的主要細(xì)胞之一。使用抗B 細(xì)胞藥物如利妥昔單抗則可以緩解牙周炎的多種癥狀[2]。因此,以CD19 為靶點拮抗B 細(xì)胞的藥物研發(fā),可能成為藥物治療牙周炎的一個研究方向。
IKZF1 編碼淋巴系特異性轉(zhuǎn)錄因子IKAROS,IKAROS 是造血細(xì)胞分化的關(guān)鍵調(diào)節(jié)因子,調(diào)控T淋巴細(xì)胞和B 淋巴細(xì)胞抗原受體介導(dǎo)的增殖反應(yīng)以及相關(guān)效應(yīng)細(xì)胞的功能[16],T 細(xì)胞與B 細(xì)胞參與牙周炎結(jié)締組織區(qū)域的炎癥浸潤及骨喪失[2,15]。
IRF4 為iRegulon 預(yù)測結(jié)果中可信度最高的轉(zhuǎn)錄因子, 調(diào)控包括核心基因CXCR4、 CD19 和IKZF1在內(nèi)的60個DEG的轉(zhuǎn)錄,IRF4 mRNA與蛋白質(zhì)在炎性牙齦中的表達(dá)已在過去的文獻(xiàn)[7]報道中得到支持。雖然IRF4 在牙周炎發(fā)病過程中的具體作用尚不明確,但I(xiàn)RF4 參與系統(tǒng)性紅斑狼瘡、類風(fēng)濕性關(guān)節(jié)炎等自身免疫性疾病的發(fā)生[17],提示其與機(jī)體免疫亢進(jìn)相關(guān)。
在本研究中,為在多樣本高通量數(shù)據(jù)中快速高效找到顯著上調(diào)或下調(diào)的基因,筆者使用了嚴(yán)格的閾值篩選方法,但值得注意的是,這種方法可能會遺漏部分具有重要生物學(xué)意義但表達(dá)量變化并不顯著的基因。例如,白細(xì)胞介素-1β 和腫瘤壞死因子-α 作為牙周炎疾病中重要的炎性因子和骨吸收介質(zhì),可激活下游核因子κB 信號通路參與牙周炎相關(guān)骨丟失[18]。然而由于不滿足FC>2 的閾值標(biāo)準(zhǔn),這些牙周炎相關(guān)基因在本實驗中不作為“差異表達(dá)基因” 納入后續(xù)分析,其在牙周炎發(fā)病過程中的作用也未得到體現(xiàn)。因此本研究尚存在一定局限性,相關(guān)分析結(jié)果需要通過后續(xù)的分子生物學(xué)實驗和動物實驗進(jìn)一步驗證。
綜上所述,本研究基于大樣本芯片數(shù)據(jù)集研究,通過生物信息學(xué)分析篩選、鑒定與牙周炎發(fā)病相關(guān)的易感基因、轉(zhuǎn)錄因子及相關(guān)信號通路。共發(fā)現(xiàn)196 個牙周炎相關(guān)差異基因,包括6 個核心基因(CXCL8、CXCL1、CXCR4、SELL、CD19和IKZF1) 和1 個關(guān)鍵轉(zhuǎn)錄因子(IRF4),這些分子通過細(xì)胞因子-細(xì)胞因子受體相互作用、趨化因子受體結(jié)合趨化因子等多條免疫相關(guān)途徑參與牙周炎的病理發(fā)生。本研究首次報道了IKZF1、IRF4與中重度牙周炎患者牙齦組織炎性病變相關(guān)的研究。病毒蛋白與細(xì)胞因子及細(xì)胞因子受體的相互作用、白細(xì)胞跨內(nèi)膜遷移、B細(xì)胞受體信號通路等途徑是本研究新發(fā)現(xiàn)的與牙周炎發(fā)病相關(guān)的信號通路。針對以上分子及通路展開深入研究,將有助于牙周炎發(fā)病機(jī)制的闡明和治療靶標(biāo)的確立。
利益沖突聲明:作者聲明本文無利益沖突。