魏冕,張亞恒,韓亞,齊俊麗
阿爾茨海默?。ˋlzheimer's disease,AD)是一種進(jìn)展隱匿且病程不可逆的神經(jīng)退行性疾病,至2019年全球AD患者人數(shù)已達(dá)5 000萬(wàn)[1-2],且其死亡率呈逐年升高趨勢(shì)[3]。AD可能是由多種因素導(dǎo)致的復(fù)雜病理過(guò)程,且其早期診斷和治療研究進(jìn)展緩慢。從基因?qū)用娣治觯珹D被認(rèn)為是由大量基因在整個(gè)基因組[4]或轉(zhuǎn)錄組水平[5]上調(diào)控異常所致。因此,未來(lái)有望通過(guò)對(duì)異常表達(dá)的基因進(jìn)行標(biāo)記和干預(yù)來(lái)達(dá)到早期診斷和治療AD的目的。加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene co-expression network analysis,WGCNA)已被證實(shí)可以有效檢測(cè)基因模塊與疾病特征之間的復(fù)雜關(guān)系[6]。WGCNA的獨(dú)特優(yōu)勢(shì)是可以根據(jù)基因之間的權(quán)重相關(guān)系數(shù)將基因聚類(lèi)到模型或網(wǎng)絡(luò)中,然后分析模塊與樣本特征(包括臨床特征、手術(shù)方法、治療方法等)之間的相關(guān)性。本研究通過(guò)對(duì)AD血液相關(guān)芯片數(shù)據(jù)進(jìn)行分析并通過(guò)WGCNA篩選與AD相關(guān)的血液關(guān)鍵基因,旨在從基因?qū)用鏋锳D的診斷和治療提供新思路。
1.1 數(shù)據(jù)收集 2021年5—7月,利用美國(guó)國(guó)家生物技術(shù)信息中心基因表達(dá)綜合數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)收集AD相關(guān)數(shù)據(jù)。所下載的數(shù)據(jù)集均以AD患者為實(shí)驗(yàn)組,以年齡匹配的健康老年人為對(duì)照組,使用的是血液樣本。
1.2 基因注釋和差異表達(dá)基因(differentially expressed genes,DEG)的鑒定 將所有數(shù)據(jù)集的基因名稱(chēng)進(jìn)行重新注釋?zhuān)瑒h除不能識(shí)別及重復(fù)識(shí)別的序列。在R 3.0.1軟件中,使用R-limma軟件包對(duì)兩組血液樣本中的mRNA進(jìn)行差異表達(dá)分析。利用Benjamini-Hochberg方法進(jìn)行多次測(cè)試校正。當(dāng)mRNA的P<0.05、錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)<0.05和|log2 FC|≥1時(shí)被認(rèn)為是DEG。
1.3 共表達(dá)網(wǎng)絡(luò)構(gòu)建和模塊識(shí)別 使用WGCNA R包構(gòu)建共表達(dá)網(wǎng)絡(luò)。首先,聚類(lèi)評(píng)估樣本是否存在明顯異常值;其次,使用自動(dòng)網(wǎng)絡(luò)構(gòu)建功能構(gòu)建共表達(dá)網(wǎng)絡(luò)。計(jì)算軟閾值β,根據(jù)β值獲得臨近矩陣和拓?fù)渚仃嚥⒂?jì)算基因之間的相異度。利用相異度對(duì)基因進(jìn)行聚類(lèi),形成不同特征的模塊基因。根據(jù)性狀與模塊特征向量基因的相關(guān)性及P值來(lái)挖掘與性狀相關(guān)的模塊,選擇相關(guān)系數(shù)最高和P值最小的模塊。提取相應(yīng)模塊的基因信息進(jìn)一步分析。
1.4 功能富集分析 利用注釋、可視化和集成發(fā)現(xiàn)的數(shù)據(jù)庫(kù)(the database for annotation,visualization and integrated discovery,DAVID)對(duì)相關(guān)性最強(qiáng)的網(wǎng)絡(luò)模塊中的基因進(jìn)行GO富集分析和KEGG通路富集分析,其中GO富集分析從生物學(xué)過(guò)程(biological process,BP)、細(xì)胞組成(cellular component,CC)和分子功能(molecular function,MF)3個(gè)方面進(jìn)行。
1.5 關(guān)鍵基因鑒定 計(jì)算臨床相關(guān)性較強(qiáng)的幾個(gè)基因模塊的基因顯著性(gene significance,GS)(基因與性狀的相關(guān)性)和模塊身份(module membership,MM)(基因與模塊的相關(guān)性),將各模塊網(wǎng)絡(luò)中GS>0.9和MM>0.9的基因定義為核心基因。將核心基因上傳至STRING數(shù)據(jù)庫(kù)進(jìn)行在線分析并建立蛋白-蛋白相互作用(protein protein interaction,PPI)網(wǎng)絡(luò)。在生物網(wǎng)絡(luò)中通過(guò)量化關(guān)鍵節(jié)點(diǎn)與非關(guān)鍵節(jié)點(diǎn)在拓?fù)湫再|(zhì)方面的差異,并以量化值的大小作為判別關(guān)鍵節(jié)點(diǎn)與否的標(biāo)準(zhǔn)。使用Cytoscape的cytoHubba插件可計(jì)算網(wǎng)絡(luò)中各節(jié)點(diǎn)的最大團(tuán)中心性(maximal clique centrality,MCC)、最大相鄰成分(maximum neighborhood component,MNC)、節(jié)點(diǎn)連接度(degree)、邊緣滲濾分量(edge percolated component,EPC)等拓?fù)涮卣?。為了篩選出在PPI網(wǎng)絡(luò)中起關(guān)鍵作用的基因,并盡可能使結(jié)果穩(wěn)健,利用該插件集成了多種網(wǎng)絡(luò)拓?fù)渌惴▉?lái)識(shí)別網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)優(yōu)點(diǎn),將多種算法篩選出的前10個(gè)關(guān)鍵節(jié)點(diǎn)進(jìn)行相交,最終獲得在多個(gè)算法中均處于關(guān)鍵節(jié)點(diǎn)的關(guān)鍵基因。
2.1 DEG的鑒定 本研究數(shù)據(jù)集為GSE97760隊(duì)列的19個(gè)血液樣本,其中實(shí)驗(yàn)組10個(gè)血液樣本、對(duì)照組9個(gè)血液樣本。使用FDR<0.05和|log2FC|≥1作為臨界點(diǎn)共鑒定出7 080個(gè)DEG,其中3 278個(gè)下調(diào)DEG和3 802個(gè)上調(diào)DEG,見(jiàn)圖1。
圖1 火山圖Figure 1 Volcano plot
2.2 共表達(dá)網(wǎng)絡(luò)構(gòu)建和模塊識(shí)別 當(dāng)β值為19時(shí),基因間的連通性開(kāi)始符合冪律分布(無(wú)尺度分布),因此可使用該閾值計(jì)算基因之間的相異度并構(gòu)建WGCNA共表達(dá)網(wǎng)絡(luò)。將最小模塊大小設(shè)置為5,最終拆分出4個(gè)基因共表達(dá)模塊。結(jié)果顯示,黑色模塊 與AD呈正相關(guān)(r=0.89),綠色模塊與AD呈負(fù)相關(guān)(r=-0.90),見(jiàn)圖2。
圖2 臨床特征相關(guān)性模塊圖Figure 2 Correlation module diagram of clinical features
2.3 關(guān)鍵模塊的功能富集分析 GO富集分析結(jié)果顯示,黑色模塊和綠色模塊基因的BP主要富集于轉(zhuǎn)錄、參與泛素依賴性蛋白質(zhì)分解代謝過(guò)程的蛋白質(zhì)泛素化,CC主要富集于核、核質(zhì),MF主要富集于蛋白質(zhì)結(jié)合、DNA結(jié)合、泛素蛋白轉(zhuǎn)移酶活性。KEGG通路富集分析結(jié)果顯示,黑色模塊和綠色模塊基因主要調(diào)節(jié)途徑包括PI3K-Akt、MAPK信號(hào)通路。
2.4 關(guān)鍵基因鑒定 黑色模塊包含1 723個(gè)基因,綠色模塊包含2 321個(gè)基因。以GS>0.9和MM>0.9為臨界標(biāo)準(zhǔn),在黑色模塊中鑒定出112個(gè)基因?yàn)楹诵幕颍?jiàn)圖3A;在綠色模塊中鑒定出42個(gè)基因?yàn)楹诵幕?,?jiàn)圖3B。將綠色模塊中的核心基因?qū)隨TRING數(shù)據(jù)庫(kù)后發(fā)現(xiàn)基因間交互關(guān)系稀少,基因間關(guān)系離散,故無(wú)法進(jìn)一步鎖定關(guān)鍵基因。在黑色模塊中共得到4個(gè)關(guān)鍵基因(CUL5、RBM25、SRSF10、SRSF2),其中CUL5的MCC、MNC、degree、EPC均最大,見(jiàn)表1。
表1 黑色模塊中關(guān)鍵基因的拓?fù)涮卣鱐able 1 Topological characteristics of key genes in black module
圖3 相關(guān)性最強(qiáng)的基因模塊的核心基因散點(diǎn)圖Figure 3 Scatter plot of the most correlated gene modules hub geens
雖然正電子發(fā)射計(jì)算機(jī)斷層顯像及腰椎穿刺腦脊液檢查對(duì)AD具有較好的診斷效能[7],但昂貴的價(jià)格和有創(chuàng)操作等問(wèn)題限制了其在AD早期診斷中的應(yīng)用。本研究旨在鑒定AD患者血液中異常表達(dá)的關(guān)鍵基因,以從基因?qū)用鎸ふ倚碌纳飿?biāo)志物。
本研究通過(guò)構(gòu)建共表達(dá)網(wǎng)絡(luò)從相關(guān)性最強(qiáng)的2個(gè)模塊中篩選出多個(gè)關(guān)鍵基因,其中在黑色模塊中通過(guò)多種算法篩選出的CUL5的中心特性最強(qiáng),故認(rèn)為其在模塊中的位置最為關(guān)鍵。既往研究發(fā)現(xiàn),CUL5可以通過(guò)不同途徑參與AD的發(fā)生和發(fā)展,如CUL5過(guò)表達(dá)可減少腺苷酸環(huán)化酶和環(huán)磷酸腺苷的產(chǎn)生,通過(guò)絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)磷酸化的機(jī)制,參與與細(xì)胞增殖有關(guān)的各種蛋白質(zhì)的降解過(guò)程,從而抑制細(xì)胞增殖[8-9];不僅如此,CUL5過(guò)表達(dá)還會(huì)導(dǎo)致DEPTOR水平明顯降低[10]。而高DEPTOR表達(dá)對(duì)于維持PI3K/Akt信號(hào)通路激活是必要的,此外其又是哺乳動(dòng)物雷帕霉素靶蛋白復(fù)合體1(mammalian target of rapamycin complex 1,mTORC1)的抑制劑,可以抑制mTORC1的功能并誘導(dǎo)自噬[11]。這些途徑已被證實(shí)在AD的發(fā)生和發(fā)展中發(fā)揮著關(guān)鍵作用[12]。此外,黑色模塊中的SRSF2基因是一個(gè)重要的調(diào)節(jié)剪接tau蛋白的前mRNA,其剪接失調(diào)經(jīng)常導(dǎo)致神經(jīng)變性疾?。?3-14]。而綠色模塊中的MIB1、USP9X已被證實(shí)可激活Wnt/β-catenin信號(hào)傳導(dǎo)通路[15-16],該信號(hào)通路的激活有助于AD的治療[17]。
近期一項(xiàng)基于基因表達(dá)綜合數(shù)據(jù)庫(kù)的網(wǎng)絡(luò)藥理學(xué)研究發(fā)現(xiàn),藥物可以通過(guò)調(diào)控CUL5等核心基因來(lái)干預(yù)PI3K-Akt、MAPK、泛素介導(dǎo)的蛋白水解等信號(hào)通路,進(jìn)而發(fā)揮治療AD的作用[18];此外,另一項(xiàng)網(wǎng)絡(luò)藥理學(xué)研究也發(fā)現(xiàn),通過(guò)干預(yù)PI3K-Akt、MAPK信號(hào)通路可達(dá)到治療AD的效果[19]。這些途徑早已被多數(shù)研究證實(shí)在AD的發(fā)生和發(fā)展中具有核心作用[20-21]。筆者認(rèn)為處于模塊最關(guān)鍵位置的CUL5可通過(guò)PI3K-Akt、MAPK信號(hào)通路在AD的發(fā)生和發(fā)展中發(fā)揮重要作用。
綜上所述,CUL5是AD的血液關(guān)鍵基因,其可調(diào)控PI3K-Akt、MAPK信號(hào)通路,并有望成為AD潛在的診斷和治療靶點(diǎn)。上述研究結(jié)果有助于揭示AD在基因?qū)用娴陌l(fā)生、發(fā)展機(jī)制。但本研究尚存在一定局限性:(1)本研究?jī)H納入單個(gè)芯片數(shù)據(jù),且數(shù)據(jù)中包含的病例較少,導(dǎo)致結(jié)果可能不穩(wěn)定;(2)嚴(yán)格的重注釋方法可能導(dǎo)致部分錯(cuò)配的探針序列不能被注釋?zhuān)鴣G失一些功能性mRNA;(3)部分關(guān)鍵基因與AD的關(guān)系尚不明確,需進(jìn)一步驗(yàn)證。
作者貢獻(xiàn):魏冕、張亞恒進(jìn)行文章的構(gòu)思與設(shè)計(jì),研究的實(shí)施與可行性分析;魏冕、韓亞、齊俊麗進(jìn)行數(shù)據(jù)收集、整理、分析;魏冕、韓亞進(jìn)行結(jié)果分析與解釋?zhuān)晃好嶝?fù)責(zé)撰寫(xiě)、修訂論文;張亞恒負(fù)責(zé)文章的質(zhì)量控制及審校,并對(duì)文章整體負(fù)責(zé)、監(jiān)督管理。
本文無(wú)利益沖突。