何丹華,陳知英,陳國菊
(暨南大學附屬深圳市寶安區(qū)婦幼保健院皮膚美容科,廣東 深圳 518102)
嬰幼兒血管瘤(IH)是嬰幼兒最常見的良性腫瘤,發(fā)病率為3%~10%[1]。有研究發(fā)現(xiàn),女性、高加索人、低體重早產(chǎn)兒、多胞胎、大齡嬰兒更易患病[2]。約10%的IH患兒在1年內可自行緩解,而其余90%的IH患兒需3~10年或更長時間才能好轉[3],部分患兒會留下瘢痕而影響美觀[4],甚至造成永久性毀容。IH并發(fā)癥包括潰瘍、出血、視力障礙、氣道阻塞、充血性心力衰竭等,在某些情況下IH甚至可能導致死亡[5]。如能在IH早期積極干預、促進自發(fā)消退過程、減少血管瘤對周圍組織的侵襲則能改善患兒預后。因此,有必要深入探討IH的調控過程,以更好地理解IH的發(fā)病機制,對研發(fā)相關藥物具有重要意義。本研究采用生物信息學方法篩選IH的差異表達基因(DEGs)及其功能富集通路,篩選靶基因,旨在為后續(xù)研究提供新思路。
1.1研究對象 2022年2月通過公開的GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)檢索與IH相關文獻,獲取基因表達譜數(shù)據(jù)集(GSE127487)進行分析。該基因表達譜種屬為人類。樣本來源于皮膚組織。芯片平臺:GPL10558 Illumina HumanHT-12 V4.0 expression beadchip。選取該數(shù)據(jù)集中IH患兒18例,健康對照組研究對象5例。
1.2方法
1.2.1DEGs的識別 通過R 4.1.0的GEOquery包從GEO數(shù)據(jù)庫中下載 GSE127487,去除一個探針對應多個分子的探針,當遇到對應同一個分子的探針時僅保留信號值最大的探針。然后通過箱式圖查看樣本標準化的情況,利用R語言limma軟件包進行IH組和健康對照組DEGs分析。統(tǒng)計學上顯著的DEGs定義為|logFC|≥2,P<0.05。
1.2.2DEGs功能和通路富集分析 采用WebGestalt[6](http://www.webgestalt.org/)在線工具對DEGs進行功能富集分析,即生物過程、細胞成分、分子功能及京都基因與基因組百科全書(KEGG)富集分析。
1.2.3構建蛋白質互作網(wǎng)絡(PPI) 通過在線分析工具STRING構建PPI[7]。由Cytoscape軟件(3.8.1)對PPI進行可視化[8]。利用Cytohubba篩選構成PPI穩(wěn)定結構的hub基因,通過MCC、NNC、Degree、EPC、BottleNeck 5種算法,挑選出排名前10的hub基因,然后通過在線工具InteractiVenn[9]取交集后得到hub基因,并將其用于后續(xù)研究。
1.2.4hub基因表達量分析 通過Graphpad prism 9分析hub基因表達差異,以箱式圖顯示。
1.2.5hub基因的診斷效能評估 通過R 4.1.0進行診斷效能評估,pROC包用于統(tǒng)計分析,ggplot2 進行可視化分析。最終繪制5個hub基因的受試者工作特征(ROC)曲線。
2.1IH的DEGs GSE127487中有416個DEGs。其中350個基因表達上調,66個基因表達下調。見圖1。
注:A.火山圖;B.熱圖。
2.2基因本體(GO)和KEGG富集分析 416個DEGs均用WebGestalt在線工具進行分析。在生物過程中DEGs富集于血管發(fā)育、血管生成、心血管系統(tǒng)的發(fā)育、循環(huán)系統(tǒng)發(fā)育、參與形態(tài)發(fā)生的解剖結構形成等。在細胞外基質結構形成、分子功能調控、生長因子結合、具有抗拉強度的細胞外基質結構成分、蛋白二聚體活性等方面顯著富集。DEGs顯著富集于細胞的頂端部分、質膜的固有成分、頂端質膜、質膜的組成部分、細胞外基質。主要富集在白細胞跨內皮的遷移、細胞黏附分子、血管平滑肌收縮、細胞外基質受體相互作用等信號通路。見圖2。
2.3PPI構建和hub基因篩選 共得到5個hub基因,分別為PECAM1、CD34、CDH5、TEK、THY1。見圖3、4。
圖3 PPI
2.4hub基因表達量 與健康對照組比較,IH組PECAM1、CD34、CDH5、TEK、THY1 mRNA表達均明顯升高,差異均有統(tǒng)計學意義(P<0.05)。見圖5。
注:A.GO分析;B.KEGG分析。
圖4 Cytohubba篩選5個核心基因編碼蛋白質
注:A.PECAM1;B.CD34;C.CDH5;D.TEK;E.THY1。與健康對照組比較,aP<0.05。
2.5診斷效能 PECAM1、CD34、CDH5、TEK、THY1對IH均具有較好的診斷效能(ROC曲線下面積分別為1.000、0.991、1.000、0.965、0.965)。見圖6。
圖6 hub基因診斷IH的ROC曲線
IH是嬰幼兒最常見良性腫瘤之一,在正常情況下并不會出現(xiàn),多在3~12個月內快速生長,部分患兒在3~7年后自然消失。在新生兒中發(fā)病率為10%~12%,在早產(chǎn)兒中發(fā)病率為20%,以女嬰居多[10]。盡管對IH進行了大量的研究,但IH發(fā)生、發(fā)展機制尚不明確。目前,對IH的藥物及激光治療研究較多,但從分子水平研究血管瘤發(fā)生、發(fā)展的重要基因和途徑較少見。因此,IH的生物信息學研究對闡明其發(fā)病的分子機制具有重要參考意義。
本研究通過對IH的微陣列數(shù)據(jù)集進行差異表達分析,分別通過火山圖和熱圖展示了表達上調和下調的基因。對DEGs進行GO和KEGG分析發(fā)現(xiàn),主要富集于血管發(fā)育、血管生成、細胞外基質結構形成、分子功能調控、生長因子結合等,主要參與白細胞跨內皮的遷移、細胞黏附分子、血管平滑肌收縮、細胞外基質受體相互作用等KEGG信號通路,符合血管瘤生長、發(fā)育過程。生物信息學方法能夠將與每例患兒相關的結果和模式與所有其他患兒的結果和模式聯(lián)系起來。通過生物信息學工具整合了來自分子、基因組和生物鏈接研究的數(shù)據(jù)。揭示了生物過程的復雜性和細節(jié)。這些生物系統(tǒng)的新概念將有助于理解和發(fā)現(xiàn)疾病的發(fā)病機制,設計高度準確的診斷方法,并開發(fā)新的治療和預防策略[11]。
本研究通過STRING在線工具及Cytoscape對DEGs進行PPI構建及可視化,并且篩選了hub基因,結果顯示,THY1、TEK、CD34、CDH5、PECAM1在血管瘤患兒中其表達均明顯升高。由于是取多個結果交集找到的hub基因,因此,具有較高的準確性。本研究結果顯示,IH組hub基因表達明顯高于健康對照組,可作為IH的重要標志物。本研究判斷了hub基因的診斷效能,通過ROC曲線發(fā)現(xiàn),上述基因ROC曲線下面積均大于0.7,可見其具有較強的診斷效能。
PECAM1是一種跨膜糖蛋白,屬于免疫球蛋白家族,在血小板、單核細胞、中性粒細胞表面表達。PECAM1分子通過所謂的嗜酸性連接相互結合,導致內皮形成一種特定的保護屏障。PECAM1表達下調導致內皮屏障完整性破壞和通透性增加,從而導致動脈內膜炎癥過程的激活,影響血管粥樣硬化病變的形成和冠狀動脈疾病的發(fā)展。因此,PECAM1可能是IH的一種新的候選分子,為改善IH治療策略提供了新的視角。
CD34是一種高度糖基化的跨膜蛋白。首先在髓系白血病細胞系中被發(fā)現(xiàn),抗CD34抗體的免疫組織學反應性也在非血淋巴腫瘤中被發(fā)現(xiàn),包括血管肉瘤、孤立性纖維性腫瘤、上皮樣肉瘤、梭形細胞脂肪瘤、隆突皮膚纖維肉瘤、肌成纖維細胞瘤等。因此,CD34可能被認為是IH的一種新的生物標志物。
CDH5定位于內皮細胞的細胞間連接,在控制血管完整性和通透性方面發(fā)揮重要作用,并有助于內皮細胞在管狀結構中的整合[12-13]。CDH5是血管內皮生長因子在內皮細胞上的生存信號[14]。CDH5在腫瘤血管生成中也很重要,其在乳腺癌血管系統(tǒng)中表達上調,也被認為是乳腺癌的轉移標志物[15-16]。因此,CDH5可能是IH進展和靶向治療的重要分子。
TEK是酪氨酸激酶受體亞家族成員,主要表達于內皮細胞中,是血管生成素配體ANGPT1、ANGPT2、ANGPT4的酪氨酸激酶受體[17]。TEK在調節(jié)血管生成、血管重塑、成熟和完整性方面發(fā)揮重要作用[18]。提示TEK可能參與了IH的發(fā)病機制,對TEK的進一步研究可能為開發(fā)治療IH及相關疾病的藥物提供了新靶點。
THY1也稱為CD90,是一種以糖基磷脂酰肌醇為基礎的糖蛋白,主要表達于血干細胞、活化的微血管內皮細胞和成纖維細胞上,是胸腺細胞祖細胞的標志物。有研究發(fā)現(xiàn),THY1能促進肝纖維化發(fā)展,是肝纖維化驅動基因[19]。THY1可能與IH的發(fā)生、發(fā)展密切相關。
綜上所述,本研究通過對IH與正常樣本的DEGs進行一系列生物信息學分析,找出了一些與IH密切相關的候選基因和通路調控網(wǎng)絡。結果提示,PECAM1、CD34、CDH5、TEK、THY1參與了IH的發(fā)病過程,有望成為IH診治的靶點,為進一步診治IH提供了依據(jù)。然而,本研究的局限性是缺乏實驗驗證。這些通過生物信息學分析得到的預測結果還需要實時熒光定量-聚合酶鏈反應和免疫印跡試驗等實驗研究進一步證實。