楊若愚,李曉凡,李馨逸,朱利揚,王碧云
隨著我國人口老齡化的不斷加劇,老年人的健康狀況越來越受到重視。有相關研究表明,老年人肌肉衰減綜合癥的發(fā)病率呈上升趨勢,嚴重影響到了老年人群的生活質(zhì)量[1]。 肌肉衰減綜合癥是一種以肌肉質(zhì)量、力量、功能喪失為特征的老年綜合征,可能會導致老年人肌肉萎縮、 肌力下降、 行動能力受限、跌倒、骨折、喪失自主生活能力甚至死亡,嚴重影響患者的身心健康,并給家庭社會帶來沉重負擔[2]。
近年來的研究數(shù)據(jù)顯示,肌肉衰減綜合癥作為一種增齡性疾病,與多種發(fā)病因素相關,這些因素主要包括:個體運動量消減、神經(jīng)肌肉功能衰退、蛋白質(zhì)的攝取及合成降低、個體激素水平波動、細胞凋亡及微環(huán)境變化、骨骼肌線粒體功能異常、活性氧水平增高、 慢性炎癥反應、 骨骼肌自噬性程序性細胞死亡、鈣的穩(wěn)定狀態(tài)失衡、自由基氧化受損、缺乏熱量與蛋白質(zhì)的攝取、 骨骼肌修護功能損壞及基因與人種等[3-4]。 肌肉衰減綜合癥的高發(fā)人群為老年人,多伴有骨質(zhì)疏松癥[5],且與跌倒、活動障礙及代謝紊亂密切相關[6],并易造成慢性心肺疾病和吞咽功能障礙,是老年人生理功能逐漸減退的表現(xiàn)之一和重要原因。
肌肉衰減綜合癥的發(fā)病機制目前尚不完全明確,但其與年齡、激素水平、炎癥及促細胞分解因子、神經(jīng)肌肉調(diào)節(jié)失衡、營養(yǎng)等因素有關[7]。 隨著高通量測序技術的不斷發(fā)展,高通量測序技術在人類疾病診斷、文庫篩選、轉(zhuǎn)錄調(diào)控、植物反轉(zhuǎn)錄研究等方面得到了越來越普遍的應用,并取得了巨大的成功,使得通過高通量測序技術研究肌肉衰減綜合癥成為了一種可能。 通過篩選與肌肉衰減綜合癥可能相關的差異表達基因,為之后針對肌肉衰減綜合癥進行有效的靶基因治療,提供肌肉衰減綜合癥可靠的診斷和預后生物學標志物的研究及診斷模型的建立打下基礎。本研究利用生物信息學的方法,從美國國立生物 中 心 (National Center for Biotechnology Information,NCBI)的基因芯片公共數(shù)據(jù)庫(GEO)下載并整理股外側(cè)肌增齡性的轉(zhuǎn)錄組高通量數(shù)據(jù),篩選差異表達基因,尋找可能與骨骼肌增齡性因素相關的分子標記作為肌肉衰減綜合癥相關的診斷、治療、預后的生物學標志物。
GSE1428 數(shù)據(jù)集包含的10 名年輕 (19~25 歲)和12 名老年(70~80 歲)男性受試者,均為高加索人種。這些受試者健康狀況良好,體檢及臨床實驗室檢查正常。在采集樣本前的6 個月內(nèi),受試者沒有服用過處方藥,也沒有進行過阻抗或耐力訓練[8]。
1.2.1 數(shù)據(jù)獲取及標準化處理
利用GEO 下載與肌肉衰減綜合癥相關的基因表達數(shù)據(jù)集GSE1428,用于篩選差異表達基因,該組數(shù)據(jù)采用Affymetrix Human Genome U133A Array(GPL96)平臺進行檢測。利用R 語言平臺對GSE1428芯片數(shù)據(jù)集進行數(shù)據(jù)評估和標準化處理。
1.2.2 差異基因的篩選
利用R 語言平臺讀取探針平臺文件GPL96,安裝并加載limma 包進行差異基因的分析,安裝并加載BiomaRt 包對基因ID 進行轉(zhuǎn)換和注釋。 分析年輕男性股外側(cè)肌樣本和老年男性股外側(cè)肌樣本獲得差異基因,包括表達上調(diào)基因和表達下調(diào)基因,顯著差異基因的篩選條件設定為adj.P<0.05 且|log FC|>0.6(adj.P 為調(diào)整后的P,F(xiàn)C 為差異倍數(shù),指老年人基因表達與青年人基因表達的比值),并利用R 語言軟件包繪制相關圖表。
1.2.3 差異基因的富集分析
利用R 語言平臺和Cytoscape 軟件進行GO 和KEGG pathway 富集分析并繪制相關圖表。 其中,GO富集分析包括生物過程 (Biological Process,BP)、分子 功 能 (Molecularfunction,MF) 和 細 胞 組 分(Cell Components,CC),adj.P<0.05 為具有統(tǒng)計學意義。
1.2.4 蛋白互作網(wǎng)絡制作及核心基因的確定
利用STRING 在線工具和Cytoscape 軟件制作蛋白互作網(wǎng)絡,并篩選相關核心基因。
經(jīng)過對GSE1428 芯片數(shù)據(jù)進行基因表達差異分析及差異基因的篩選,共獲得差異表達基因2 028個,其中有2 020 個表達下調(diào)基因和8 個表達上調(diào)基因,根據(jù)adj.P 升序排序,將其中排序前25 個差異表達的基因列入表1。
表1 差異表達基因的篩選Table1 Screening of Differentially Expressed Genes
在篩選出差異基因后,對數(shù)據(jù)進行可視化分析。利用R 語言平臺制作差異表達基因的熱圖(圖1)和火山圖(圖2)。 如圖1 所示,熱圖中的每個小方格表示每個基因,其顏色表示該基因表達量大小,顏色越深,其表達量就越大(紅色為上調(diào),綠色為下調(diào))。 每行代表不同樣本中每個基因的表達量情況,每列表示每個樣品中所有基因的表達量情況。 可從圖2 直觀地看到上調(diào)基因和下調(diào)基因差異倍數(shù)與adj.P 的分布情況。
圖1 差異基因熱圖Figure1 Heat Map of Differential Genes
2.2.1 GO 富集分析
在進行差異基因的篩選之后,利用R 語言平臺和Cytoscape 以及Cytoscape 的插件BinGO 進行GO富集分析,GO 分析具體過程包括生物過程、分子功能和細胞組分。 圖3 為GO 功能富集分析的結(jié)果。
圖2 差異基因火山圖Figure2 Volcano Map of Differential Genes
如圖3 所示,差異表達基因主要參與信號轉(zhuǎn)導(signal transduction)、RNA 聚 合 酶Ⅱ啟 動 子 轉(zhuǎn) 錄 的正調(diào)控 (positive regulation of transcription from RNA polymerase II promoter)、炎 癥 反 應(inflammatory response)等生物過程。 差異表達基因主要參與的分子功能方面有轉(zhuǎn)錄激活子活性、RNA 聚合酶II 核心啟動子近端區(qū)序列特異性結(jié)合(transcriptional activator activity, RNA polymerase II core promoter proximal region sequence-specific binding)、蛋白質(zhì)異源二聚化活性(protein heterodimerization activity)、受 體 結(jié) 合(receptor binding)等。 而在細胞組分方面,差異基因主要與細胞質(zhì)膜(plasma membrane)、質(zhì)膜的組成成分(integral component of plasma membrane)、 細胞外基質(zhì)(extracellular exosome)等方面有關。
圖3 GO 功能富集分析氣泡圖Figure3 Bubble Diagram of GO Functional Enrichment Analysis
對其KEGG 通路富集分析,得到了KEGG 通路相關數(shù)據(jù)信息。 圖4 為KEGG 通路富集分析的氣泡圖。其中富集差異基因較多的通路有代謝信號轉(zhuǎn)導通路(metabolic pathways)、 神經(jīng)活性配體受體相互作用通路(neuroactive ligand-receptor interaction)、抗菌素生物合成通路(biosynthesis antibotics)和細胞因子-細胞因子受體相互作用通路(cytokine-cytokine receptor interaction)等。
圖4 KEGG 通路富集分析的氣泡圖Figure4 Bubble Diagram of KEGG Pathway Enrichment Analysis
2.2.2 蛋白互作網(wǎng)絡及核心基因的篩選
基于差異基因的篩選結(jié)果和KEGG 通路相關數(shù)據(jù)信息,使用STRING 在線數(shù)據(jù)庫將差異基因?qū)?,將最低互作分值(minimum required interaction score)設置成最高可信(highest confidence 0.9),刪除與其他蛋白質(zhì)無相互作用的節(jié)點后,完成肌肉衰減綜合癥的蛋白互作網(wǎng)絡,分析差異基因所編碼的蛋白質(zhì)之間的相互作用,得到蛋白互作網(wǎng)絡圖(圖5)。
圖5 差異基因的蛋白互作網(wǎng)絡圖Figure5 Map of Protein Interaction Networks of Differential Genes
將圖5 所顯示的蛋白互作網(wǎng)路的數(shù)據(jù)導入Cytoscape 軟件進行分析,計算節(jié)點的度(degree),利用蛋白互作網(wǎng)絡核心基因互相作用的具體算法得出基因在互作網(wǎng)絡中的權(quán)重值,數(shù)值越大說明該基因在網(wǎng)絡中的作用越大,并列出degree 排名前10 位的中心節(jié)點蛋白,然后與差異基因的KEGG 富集分析所得到的顯著性基因取交集,得到核心基因(hub genes)。圖6 為排名前10 的核心基因的相互作用關系。
圖6 排名前10 位的核心基因互作網(wǎng)絡關系圖Figure6 Top 10 Core Gene Interaction Networks
表2 顯示了圖6 中所涉及的核心基因的具體信息及其對應的degree。 這些基因?qū)τ诩∪馑p綜合癥都是下調(diào)基因,說明這10 個基因表達水平的下調(diào)可能與肌肉衰減綜合癥的發(fā)生和發(fā)展存在著一定的關系。
表2 核心基因的具體信息Table2 Basic Information of Hub Gene
肌肉衰減綜合癥作為一種增齡性的退行性疾病,其發(fā)生與發(fā)展有著循序漸進的過程,很多基因在肌肉衰減綜合癥的發(fā)生和進展過程中起到至關重要的作用[9]。 肌肉衰減綜合癥作為一種在老年人群中常見的疾病,對老年人的日常生活活動能力造成了嚴重的危害,但卻又往往被忽視,所以探究與肌肉衰減綜合癥有關的差異基因則具有重要的臨床意義與研究價值[10-11]。雖然有許多關于肌肉衰減綜合癥發(fā)生機制的研究,但其發(fā)生機制仍未完全明確,隨著新技術特別是高通量基因測序技術的不斷發(fā)展,通過從基因?qū)用鎸∪馑p綜合癥進行進一步的討論和研究,可對肌肉衰減綜合癥有更深層次的了解。本研究通過對基因芯片數(shù)據(jù)再挖掘分析,尋找與肌肉衰減綜合癥有關的差異表達基因,為之后研究肌肉衰減綜合癥的機制、診斷、治療和預后提供參考。
本研究首先通過對芯片數(shù)據(jù)集GSE1428 進行分析,最終發(fā)現(xiàn)有2 028 個差異表達基因,其中有2 020個下調(diào)基因和8 個上調(diào)基因,隨后對這些差異基因進行GO 功能富集分析,發(fā)現(xiàn)差異基因主要富集于信號轉(zhuǎn)導、RNA 聚合酶Ⅱ啟動子轉(zhuǎn)錄的正調(diào)控、 炎癥反應等生物過程。 在分子功能方面主要富集于轉(zhuǎn)錄激活子活性,RNA 聚合酶II 核心啟動子近端區(qū)序列特異性結(jié)合、蛋白質(zhì)異源二聚化活性、受體結(jié)合等。 而在細胞組分方面,差異基因富集于細胞質(zhì)膜、質(zhì)膜的組成成分、細胞外基質(zhì)等。 結(jié)果提示這些差異基因可能通過不同的信號通路、生物學過程產(chǎn)生了關鍵的作用,從而影響到肌肉衰減綜合癥的發(fā)生和發(fā)展。
在篩選所得到的差異基因KEGG 富集通路結(jié)果中,神經(jīng)活性配體-受體相互作用這一通路具有最高的顯著性,而鈣信號通路同時具有較高顯著性和較多的基因富集。 肌肉衰減綜合癥患者患病期間肌肉含量的減少和肌肉生理功能的衰退可能與多種神經(jīng)遞質(zhì)及其受體相關,而神經(jīng)活性配體受體相互作用信號通路是質(zhì)膜上所有與細胞內(nèi)外信號通路相關的受體和配體的集合[12]。
肌肉衰減綜合癥患者的部分臨床表現(xiàn)如肌肉肌力的減弱和引發(fā)肌肉收縮的刺激閾值增大都或許與鈣信號通路相關。Ca2+通道的化學本質(zhì)是載體蛋白,在達到刺激閾值之后,Ca2+可與此載體蛋白相結(jié)合從而被轉(zhuǎn)運,進而引發(fā)后續(xù)生理功能的實現(xiàn),這種Ca2+和載體蛋白的結(jié)合過程類似酶與底物的結(jié)合過程,具有一定的專一性。生物體中刺激以神經(jīng)沖動的形式通過運動神經(jīng)傳遞至效應器即可引起肌肉收縮,即沖動由神經(jīng)肌肉接頭傳達于肌纖維細胞膜,使肌纖維細胞膜產(chǎn)生一個可傳導的動作電位,即興奮-收縮偶聯(lián),從而引發(fā)橫橋運動,引起肌肉的收縮,收縮后的肌肉必須發(fā)生舒張后才具有下一次收縮的條件[13]。 在發(fā)生興奮-收縮偶聯(lián)過程中,由刺激產(chǎn)生的動作電位沿橫管系統(tǒng)進入三聯(lián)管,此時橫管膜去極化使終池大量釋放Ca2+,Ca2+通過鈣離子通道的轉(zhuǎn)運[14],才可以產(chǎn)生一系列的肌肉功能運動。除了肌細胞本身,衰老、缺氧、缺血所造成的損傷會引起機體過度釋放興奮性神經(jīng)遞質(zhì),從而使突觸后膜處于一種持續(xù)性去極化狀態(tài), 造成大量鈣離子內(nèi)流,引發(fā)細胞內(nèi)一系列鈣離子的生化反應,導致神經(jīng)細胞凋亡[15]。
本研究得到的可能與增齡性骨骼肌肌力和功能衰減相關的排名前10 的核心基因,可為后續(xù)尋找肌肉衰減綜合癥相關分子標記物提供線索,但因為是通過對組學數(shù)據(jù)進行的生物信息學分析,并沒有進行相關的功能驗證,所以如果直接進行應用還存在一定問題,如果能在模型動物上進行相關的基因功能驗證則較為穩(wěn)妥。
骨骼肌增齡性變化存在大量的基因表達的變化,其中絕大多數(shù)為基因表達的下調(diào);差異基因可能通過多條重要的分子通路影響老年人群骨骼肌功能的下降和衰退,調(diào)控肌肉衰減綜合癥的發(fā)生與發(fā)展;篩選出的核心基因可為后續(xù)肌肉衰減綜合癥分子標記的相關研究工作提供新的線索和思路。