楊若愚,李曉凡,李馨逸,朱利揚(yáng),王碧云
隨著我國(guó)人口老齡化的不斷加劇,老年人的健康狀況越來(lái)越受到重視。有相關(guān)研究表明,老年人肌肉衰減綜合癥的發(fā)病率呈上升趨勢(shì),嚴(yán)重影響到了老年人群的生活質(zhì)量[1]。 肌肉衰減綜合癥是一種以肌肉質(zhì)量、力量、功能喪失為特征的老年綜合征,可能會(huì)導(dǎo)致老年人肌肉萎縮、 肌力下降、 行動(dòng)能力受限、跌倒、骨折、喪失自主生活能力甚至死亡,嚴(yán)重影響患者的身心健康,并給家庭社會(huì)帶來(lái)沉重負(fù)擔(dān)[2]。
近年來(lái)的研究數(shù)據(jù)顯示,肌肉衰減綜合癥作為一種增齡性疾病,與多種發(fā)病因素相關(guān),這些因素主要包括:個(gè)體運(yùn)動(dòng)量消減、神經(jīng)肌肉功能衰退、蛋白質(zhì)的攝取及合成降低、個(gè)體激素水平波動(dòng)、細(xì)胞凋亡及微環(huán)境變化、骨骼肌線粒體功能異常、活性氧水平增高、 慢性炎癥反應(yīng)、 骨骼肌自噬性程序性細(xì)胞死亡、鈣的穩(wěn)定狀態(tài)失衡、自由基氧化受損、缺乏熱量與蛋白質(zhì)的攝取、 骨骼肌修護(hù)功能損壞及基因與人種等[3-4]。 肌肉衰減綜合癥的高發(fā)人群為老年人,多伴有骨質(zhì)疏松癥[5],且與跌倒、活動(dòng)障礙及代謝紊亂密切相關(guān)[6],并易造成慢性心肺疾病和吞咽功能障礙,是老年人生理功能逐漸減退的表現(xiàn)之一和重要原因。
肌肉衰減綜合癥的發(fā)病機(jī)制目前尚不完全明確,但其與年齡、激素水平、炎癥及促細(xì)胞分解因子、神經(jīng)肌肉調(diào)節(jié)失衡、營(yíng)養(yǎng)等因素有關(guān)[7]。 隨著高通量測(cè)序技術(shù)的不斷發(fā)展,高通量測(cè)序技術(shù)在人類疾病診斷、文庫(kù)篩選、轉(zhuǎn)錄調(diào)控、植物反轉(zhuǎn)錄研究等方面得到了越來(lái)越普遍的應(yīng)用,并取得了巨大的成功,使得通過(guò)高通量測(cè)序技術(shù)研究肌肉衰減綜合癥成為了一種可能。 通過(guò)篩選與肌肉衰減綜合癥可能相關(guān)的差異表達(dá)基因,為之后針對(duì)肌肉衰減綜合癥進(jìn)行有效的靶基因治療,提供肌肉衰減綜合癥可靠的診斷和預(yù)后生物學(xué)標(biāo)志物的研究及診斷模型的建立打下基礎(chǔ)。本研究利用生物信息學(xué)的方法,從美國(guó)國(guó)立生物 中 心 (National Center for Biotechnology Information,NCBI)的基因芯片公共數(shù)據(jù)庫(kù)(GEO)下載并整理股外側(cè)肌增齡性的轉(zhuǎn)錄組高通量數(shù)據(jù),篩選差異表達(dá)基因,尋找可能與骨骼肌增齡性因素相關(guān)的分子標(biāo)記作為肌肉衰減綜合癥相關(guān)的診斷、治療、預(yù)后的生物學(xué)標(biāo)志物。
GSE1428 數(shù)據(jù)集包含的10 名年輕 (19~25 歲)和12 名老年(70~80 歲)男性受試者,均為高加索人種。這些受試者健康狀況良好,體檢及臨床實(shí)驗(yàn)室檢查正常。在采集樣本前的6 個(gè)月內(nèi),受試者沒(méi)有服用過(guò)處方藥,也沒(méi)有進(jìn)行過(guò)阻抗或耐力訓(xùn)練[8]。
1.2.1 數(shù)據(jù)獲取及標(biāo)準(zhǔn)化處理
利用GEO 下載與肌肉衰減綜合癥相關(guān)的基因表達(dá)數(shù)據(jù)集GSE1428,用于篩選差異表達(dá)基因,該組數(shù)據(jù)采用Affymetrix Human Genome U133A Array(GPL96)平臺(tái)進(jìn)行檢測(cè)。利用R 語(yǔ)言平臺(tái)對(duì)GSE1428芯片數(shù)據(jù)集進(jìn)行數(shù)據(jù)評(píng)估和標(biāo)準(zhǔn)化處理。
1.2.2 差異基因的篩選
利用R 語(yǔ)言平臺(tái)讀取探針平臺(tái)文件GPL96,安裝并加載limma 包進(jìn)行差異基因的分析,安裝并加載BiomaRt 包對(duì)基因ID 進(jìn)行轉(zhuǎn)換和注釋。 分析年輕男性股外側(cè)肌樣本和老年男性股外側(cè)肌樣本獲得差異基因,包括表達(dá)上調(diào)基因和表達(dá)下調(diào)基因,顯著差異基因的篩選條件設(shè)定為adj.P<0.05 且|log FC|>0.6(adj.P 為調(diào)整后的P,F(xiàn)C 為差異倍數(shù),指老年人基因表達(dá)與青年人基因表達(dá)的比值),并利用R 語(yǔ)言軟件包繪制相關(guān)圖表。
1.2.3 差異基因的富集分析
利用R 語(yǔ)言平臺(tái)和Cytoscape 軟件進(jìn)行GO 和KEGG pathway 富集分析并繪制相關(guān)圖表。 其中,GO富集分析包括生物過(guò)程 (Biological Process,BP)、分子 功 能 (Molecularfunction,MF) 和 細(xì) 胞 組 分(Cell Components,CC),adj.P<0.05 為具有統(tǒng)計(jì)學(xué)意義。
1.2.4 蛋白互作網(wǎng)絡(luò)制作及核心基因的確定
利用STRING 在線工具和Cytoscape 軟件制作蛋白互作網(wǎng)絡(luò),并篩選相關(guān)核心基因。
經(jīng)過(guò)對(duì)GSE1428 芯片數(shù)據(jù)進(jìn)行基因表達(dá)差異分析及差異基因的篩選,共獲得差異表達(dá)基因2 028個(gè),其中有2 020 個(gè)表達(dá)下調(diào)基因和8 個(gè)表達(dá)上調(diào)基因,根據(jù)adj.P 升序排序,將其中排序前25 個(gè)差異表達(dá)的基因列入表1。
表1 差異表達(dá)基因的篩選Table1 Screening of Differentially Expressed Genes
在篩選出差異基因后,對(duì)數(shù)據(jù)進(jìn)行可視化分析。利用R 語(yǔ)言平臺(tái)制作差異表達(dá)基因的熱圖(圖1)和火山圖(圖2)。 如圖1 所示,熱圖中的每個(gè)小方格表示每個(gè)基因,其顏色表示該基因表達(dá)量大小,顏色越深,其表達(dá)量就越大(紅色為上調(diào),綠色為下調(diào))。 每行代表不同樣本中每個(gè)基因的表達(dá)量情況,每列表示每個(gè)樣品中所有基因的表達(dá)量情況。 可從圖2 直觀地看到上調(diào)基因和下調(diào)基因差異倍數(shù)與adj.P 的分布情況。
圖1 差異基因熱圖Figure1 Heat Map of Differential Genes
2.2.1 GO 富集分析
在進(jìn)行差異基因的篩選之后,利用R 語(yǔ)言平臺(tái)和Cytoscape 以及Cytoscape 的插件BinGO 進(jìn)行GO富集分析,GO 分析具體過(guò)程包括生物過(guò)程、分子功能和細(xì)胞組分。 圖3 為GO 功能富集分析的結(jié)果。
圖2 差異基因火山圖Figure2 Volcano Map of Differential Genes
如圖3 所示,差異表達(dá)基因主要參與信號(hào)轉(zhuǎn)導(dǎo)(signal transduction)、RNA 聚 合 酶Ⅱ啟 動(dòng) 子 轉(zhuǎn) 錄 的正調(diào)控 (positive regulation of transcription from RNA polymerase II promoter)、炎 癥 反 應(yīng)(inflammatory response)等生物過(guò)程。 差異表達(dá)基因主要參與的分子功能方面有轉(zhuǎn)錄激活子活性、RNA 聚合酶II 核心啟動(dòng)子近端區(qū)序列特異性結(jié)合(transcriptional activator activity, RNA polymerase II core promoter proximal region sequence-specific binding)、蛋白質(zhì)異源二聚化活性(protein heterodimerization activity)、受 體 結(jié) 合(receptor binding)等。 而在細(xì)胞組分方面,差異基因主要與細(xì)胞質(zhì)膜(plasma membrane)、質(zhì)膜的組成成分(integral component of plasma membrane)、 細(xì)胞外基質(zhì)(extracellular exosome)等方面有關(guān)。
圖3 GO 功能富集分析氣泡圖Figure3 Bubble Diagram of GO Functional Enrichment Analysis
對(duì)其KEGG 通路富集分析,得到了KEGG 通路相關(guān)數(shù)據(jù)信息。 圖4 為KEGG 通路富集分析的氣泡圖。其中富集差異基因較多的通路有代謝信號(hào)轉(zhuǎn)導(dǎo)通路(metabolic pathways)、 神經(jīng)活性配體受體相互作用通路(neuroactive ligand-receptor interaction)、抗菌素生物合成通路(biosynthesis antibotics)和細(xì)胞因子-細(xì)胞因子受體相互作用通路(cytokine-cytokine receptor interaction)等。
圖4 KEGG 通路富集分析的氣泡圖Figure4 Bubble Diagram of KEGG Pathway Enrichment Analysis
2.2.2 蛋白互作網(wǎng)絡(luò)及核心基因的篩選
基于差異基因的篩選結(jié)果和KEGG 通路相關(guān)數(shù)據(jù)信息,使用STRING 在線數(shù)據(jù)庫(kù)將差異基因?qū)耄瑢⒆畹突プ鞣种担╩inimum required interaction score)設(shè)置成最高可信(highest confidence 0.9),刪除與其他蛋白質(zhì)無(wú)相互作用的節(jié)點(diǎn)后,完成肌肉衰減綜合癥的蛋白互作網(wǎng)絡(luò),分析差異基因所編碼的蛋白質(zhì)之間的相互作用,得到蛋白互作網(wǎng)絡(luò)圖(圖5)。
圖5 差異基因的蛋白互作網(wǎng)絡(luò)圖Figure5 Map of Protein Interaction Networks of Differential Genes
將圖5 所顯示的蛋白互作網(wǎng)路的數(shù)據(jù)導(dǎo)入Cytoscape 軟件進(jìn)行分析,計(jì)算節(jié)點(diǎn)的度(degree),利用蛋白互作網(wǎng)絡(luò)核心基因互相作用的具體算法得出基因在互作網(wǎng)絡(luò)中的權(quán)重值,數(shù)值越大說(shuō)明該基因在網(wǎng)絡(luò)中的作用越大,并列出degree 排名前10 位的中心節(jié)點(diǎn)蛋白,然后與差異基因的KEGG 富集分析所得到的顯著性基因取交集,得到核心基因(hub genes)。圖6 為排名前10 的核心基因的相互作用關(guān)系。
圖6 排名前10 位的核心基因互作網(wǎng)絡(luò)關(guān)系圖Figure6 Top 10 Core Gene Interaction Networks
表2 顯示了圖6 中所涉及的核心基因的具體信息及其對(duì)應(yīng)的degree。 這些基因?qū)τ诩∪馑p綜合癥都是下調(diào)基因,說(shuō)明這10 個(gè)基因表達(dá)水平的下調(diào)可能與肌肉衰減綜合癥的發(fā)生和發(fā)展存在著一定的關(guān)系。
表2 核心基因的具體信息Table2 Basic Information of Hub Gene
肌肉衰減綜合癥作為一種增齡性的退行性疾病,其發(fā)生與發(fā)展有著循序漸進(jìn)的過(guò)程,很多基因在肌肉衰減綜合癥的發(fā)生和進(jìn)展過(guò)程中起到至關(guān)重要的作用[9]。 肌肉衰減綜合癥作為一種在老年人群中常見(jiàn)的疾病,對(duì)老年人的日常生活活動(dòng)能力造成了嚴(yán)重的危害,但卻又往往被忽視,所以探究與肌肉衰減綜合癥有關(guān)的差異基因則具有重要的臨床意義與研究?jī)r(jià)值[10-11]。雖然有許多關(guān)于肌肉衰減綜合癥發(fā)生機(jī)制的研究,但其發(fā)生機(jī)制仍未完全明確,隨著新技術(shù)特別是高通量基因測(cè)序技術(shù)的不斷發(fā)展,通過(guò)從基因?qū)用鎸?duì)肌肉衰減綜合癥進(jìn)行進(jìn)一步的討論和研究,可對(duì)肌肉衰減綜合癥有更深層次的了解。本研究通過(guò)對(duì)基因芯片數(shù)據(jù)再挖掘分析,尋找與肌肉衰減綜合癥有關(guān)的差異表達(dá)基因,為之后研究肌肉衰減綜合癥的機(jī)制、診斷、治療和預(yù)后提供參考。
本研究首先通過(guò)對(duì)芯片數(shù)據(jù)集GSE1428 進(jìn)行分析,最終發(fā)現(xiàn)有2 028 個(gè)差異表達(dá)基因,其中有2 020個(gè)下調(diào)基因和8 個(gè)上調(diào)基因,隨后對(duì)這些差異基因進(jìn)行GO 功能富集分析,發(fā)現(xiàn)差異基因主要富集于信號(hào)轉(zhuǎn)導(dǎo)、RNA 聚合酶Ⅱ啟動(dòng)子轉(zhuǎn)錄的正調(diào)控、 炎癥反應(yīng)等生物過(guò)程。 在分子功能方面主要富集于轉(zhuǎn)錄激活子活性,RNA 聚合酶II 核心啟動(dòng)子近端區(qū)序列特異性結(jié)合、蛋白質(zhì)異源二聚化活性、受體結(jié)合等。 而在細(xì)胞組分方面,差異基因富集于細(xì)胞質(zhì)膜、質(zhì)膜的組成成分、細(xì)胞外基質(zhì)等。 結(jié)果提示這些差異基因可能通過(guò)不同的信號(hào)通路、生物學(xué)過(guò)程產(chǎn)生了關(guān)鍵的作用,從而影響到肌肉衰減綜合癥的發(fā)生和發(fā)展。
在篩選所得到的差異基因KEGG 富集通路結(jié)果中,神經(jīng)活性配體-受體相互作用這一通路具有最高的顯著性,而鈣信號(hào)通路同時(shí)具有較高顯著性和較多的基因富集。 肌肉衰減綜合癥患者患病期間肌肉含量的減少和肌肉生理功能的衰退可能與多種神經(jīng)遞質(zhì)及其受體相關(guān),而神經(jīng)活性配體受體相互作用信號(hào)通路是質(zhì)膜上所有與細(xì)胞內(nèi)外信號(hào)通路相關(guān)的受體和配體的集合[12]。
肌肉衰減綜合癥患者的部分臨床表現(xiàn)如肌肉肌力的減弱和引發(fā)肌肉收縮的刺激閾值增大都或許與鈣信號(hào)通路相關(guān)。Ca2+通道的化學(xué)本質(zhì)是載體蛋白,在達(dá)到刺激閾值之后,Ca2+可與此載體蛋白相結(jié)合從而被轉(zhuǎn)運(yùn),進(jìn)而引發(fā)后續(xù)生理功能的實(shí)現(xiàn),這種Ca2+和載體蛋白的結(jié)合過(guò)程類似酶與底物的結(jié)合過(guò)程,具有一定的專一性。生物體中刺激以神經(jīng)沖動(dòng)的形式通過(guò)運(yùn)動(dòng)神經(jīng)傳遞至效應(yīng)器即可引起肌肉收縮,即沖動(dòng)由神經(jīng)肌肉接頭傳達(dá)于肌纖維細(xì)胞膜,使肌纖維細(xì)胞膜產(chǎn)生一個(gè)可傳導(dǎo)的動(dòng)作電位,即興奮-收縮偶聯(lián),從而引發(fā)橫橋運(yùn)動(dòng),引起肌肉的收縮,收縮后的肌肉必須發(fā)生舒張后才具有下一次收縮的條件[13]。 在發(fā)生興奮-收縮偶聯(lián)過(guò)程中,由刺激產(chǎn)生的動(dòng)作電位沿橫管系統(tǒng)進(jìn)入三聯(lián)管,此時(shí)橫管膜去極化使終池大量釋放Ca2+,Ca2+通過(guò)鈣離子通道的轉(zhuǎn)運(yùn)[14],才可以產(chǎn)生一系列的肌肉功能運(yùn)動(dòng)。除了肌細(xì)胞本身,衰老、缺氧、缺血所造成的損傷會(huì)引起機(jī)體過(guò)度釋放興奮性神經(jīng)遞質(zhì),從而使突觸后膜處于一種持續(xù)性去極化狀態(tài), 造成大量鈣離子內(nèi)流,引發(fā)細(xì)胞內(nèi)一系列鈣離子的生化反應(yīng),導(dǎo)致神經(jīng)細(xì)胞凋亡[15]。
本研究得到的可能與增齡性骨骼肌肌力和功能衰減相關(guān)的排名前10 的核心基因,可為后續(xù)尋找肌肉衰減綜合癥相關(guān)分子標(biāo)記物提供線索,但因?yàn)槭峭ㄟ^(guò)對(duì)組學(xué)數(shù)據(jù)進(jìn)行的生物信息學(xué)分析,并沒(méi)有進(jìn)行相關(guān)的功能驗(yàn)證,所以如果直接進(jìn)行應(yīng)用還存在一定問(wèn)題,如果能在模型動(dòng)物上進(jìn)行相關(guān)的基因功能驗(yàn)證則較為穩(wěn)妥。
骨骼肌增齡性變化存在大量的基因表達(dá)的變化,其中絕大多數(shù)為基因表達(dá)的下調(diào);差異基因可能通過(guò)多條重要的分子通路影響老年人群骨骼肌功能的下降和衰退,調(diào)控肌肉衰減綜合癥的發(fā)生與發(fā)展;篩選出的核心基因可為后續(xù)肌肉衰減綜合癥分子標(biāo)記的相關(guān)研究工作提供新的線索和思路。