何海蘭,劉樂(lè)凱,張浩軍,柳銳蓮,李寶嘉,李治國(guó)
近年來(lái),糖尿病的患病率正在持續(xù)增加, 2017年全球糖尿病患者人數(shù)約有4.51億,預(yù)計(jì)到2045年還將增加2.42億[1-2]。糖尿病腎病(diabetic kidney disease,DKD)是糖尿病的微血管并發(fā)癥,是導(dǎo)致腎衰竭的首要原因,同時(shí)也是導(dǎo)致糖尿病患者死亡的主要原因之一[3]。目前認(rèn)為DKD與氧化應(yīng)激、炎癥、免疫、血流動(dòng)力學(xué)的改變密切相關(guān)。雖然對(duì)DKD的研究取得了一定的進(jìn)展,但DKD仍缺乏有效的治療手段,具體發(fā)病機(jī)制尚未明確。DKD動(dòng)物模型是研究DKD發(fā)病機(jī)制及藥物治療的一種重要手段。而各種動(dòng)物模型出現(xiàn)的病理變化,激活的信號(hào)通路不盡相同,提示一些通路變化是由于各種動(dòng)物模型的遺傳背景不同造成的,而未必與DKD相關(guān);在多種動(dòng)物模型上均出現(xiàn)改變的基因和通路改變,可能是DKD發(fā)病過(guò)程中關(guān)鍵基因和通路,在DKD發(fā)病中起著更加重要的作用[4-6]。
GEO數(shù)據(jù)庫(kù)中存貯著大量基因芯片數(shù)據(jù),而基因芯片技術(shù)可以一次性的檢測(cè)所有基因的變化。而生物信息學(xué)技術(shù)可以對(duì)數(shù)據(jù)庫(kù)中儲(chǔ)存的基因芯片等高通量數(shù)據(jù)進(jìn)行進(jìn)一步的加工和挖掘[7-8]。本研究對(duì)來(lái)自GEO數(shù)據(jù)庫(kù)GSE33744數(shù)據(jù)集中BKS db/db、BKS eNOS-/-db/db和DBA-STZ 3種DKD小鼠的數(shù)據(jù)集進(jìn)行深入生物信息學(xué)分析,發(fā)現(xiàn)3種小鼠共同變化的基因及通路,為發(fā)現(xiàn)DKD發(fā)病機(jī)制以及DKD的防治療提供新的思路。
1.1 數(shù)據(jù)來(lái)源從GEO數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/geo/)中下載GSE33744數(shù)據(jù)集,其檢測(cè)平臺(tái)為GPL1261 [Mouse430-2]Affymetrix Mouse Genome 430 2.0 Arry。其中涉及BKS db/db、BKS eNOS-/-db/db和DBA-STZ 3種DKD小鼠模型,3種DKD小鼠均出現(xiàn)明顯的蛋白尿、腎小球系膜擴(kuò)張和足細(xì)胞丟失等典型糖尿病腎病改變[4]。
1.2芯片數(shù)據(jù)預(yù)處理利用R語(yǔ)言Bioconductor 工具包 Affy包讀取芯片CEL數(shù)據(jù)文件,將雜交信號(hào)轉(zhuǎn)換成表達(dá)數(shù)據(jù)。對(duì)背景進(jìn)行校正,利用魯棒多芯片平均算法(Robust Multichip Average algorithm, RMA)對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化,利用Bioconductor 中的annotate包對(duì)數(shù)據(jù)進(jìn)行注釋。
1.3篩選共同差異表達(dá)基因利用Bioconductor中的limma包進(jìn)行差異表達(dá)基因的分析,篩選出每組DKD小鼠與對(duì)應(yīng)正常小鼠的腎小球的差異基因。篩選標(biāo)準(zhǔn)為P<0.05,F(xiàn)C>1.5,即|logFC|>0.585。對(duì)3種鼠模型取交集,找到共同差異表達(dá)基因。
1.4富集分析為了確定共同差異基因富集的生物過(guò)程、細(xì)胞組分、分子功能以及生物途徑,進(jìn)行基因本體論(Gene Ontology, GO)富集和京都基因和基因組百科全書(shū)(Kyoto Encyclopedia of Genes and Genomes , KEGG)途徑分析[9],使用生物學(xué)信息注釋數(shù)據(jù)庫(kù)(the database for annotation,visualization and integrated discovery,DAVID)對(duì)差異基因進(jìn)行GO功能和KEGG通路分析。篩選標(biāo)準(zhǔn)為P<0.05。
1.5蛋白質(zhì)相互作用(protein-protein interaction, PPI)網(wǎng)絡(luò)的構(gòu)建利用STING數(shù)據(jù)庫(kù)構(gòu)建這些差異基因的蛋白質(zhì)相互作用網(wǎng)絡(luò),篩選標(biāo)準(zhǔn)為綜合分?jǐn)?shù)為≥0.4,并應(yīng)用Cytoscape軟件可視化并篩選高度(degree)的關(guān)鍵基因。
2.1 芯片質(zhì)量控制及標(biāo)準(zhǔn)化基因芯片進(jìn)行質(zhì)量評(píng)估顯示所納入的芯片質(zhì)量合格。 通過(guò)RNA降解曲線發(fā)現(xiàn)所有芯片的降解曲線斜率幾乎一致,反應(yīng)納入的基因芯片合格。RMA標(biāo)準(zhǔn)化后基因均值處于同一水平,可以用于各組間比較。
2.2差異表達(dá)基因的篩選BKS db/db、BKS eNOS-/-db/db和DBA-STZ 3種糖尿病腎病小鼠分別有2632個(gè)、2466個(gè)和551個(gè)差異表達(dá)基因,三者取交集后有170個(gè)共同差異表達(dá)基因,其中72個(gè)共同上調(diào)基因,72個(gè)共同下調(diào)基因。
2.3差異表達(dá)基因的GO和KEGG分析應(yīng)用DAVID對(duì)3種DKD小鼠中共同差異基因中表達(dá)一致的144個(gè)差異表達(dá)基因進(jìn)行GO和KEGG分析,GO分析結(jié)果提示:差異基因主要富集在膜上(GO_CC:0016020,membrane),主要具有氧化還原活性(GO_MF:0016491,oxidoreductase activity),參與氧化還原過(guò)程(GO_BP:0055114,oxidation-reduction process)等。KEGG分析結(jié)果提示:差異基因主要參與PPAR信號(hào)通路(KEGG_PATHY:mmu03320, PPAR signaling pathway),花生四烯酸代謝(KEGG_PATHY:mmu00590, Arachidonic acid metabolism),丁酸代謝(KEGG_PATHY:mmu00650, Butanoate metabolism)和晝夜節(jié)律(KEGG_PATHY:mmu04710, Circadian rhythm)。
對(duì)上調(diào)差異基因和下調(diào)差異基因分別進(jìn)行GO和KEGG分析,結(jié)果提示:上調(diào)差異基因主要富集在細(xì)胞外區(qū)域(GO_CC:0005576, extracellular region),主要具有水解酶活性(GO_MF:0016787, hydrolase activity),參與先天免疫反應(yīng)(GO_BP:0045087, innate immune response)等,并且富集結(jié)核(KEGG_PATHY:mmu05152, Tuberculosis)通路途徑,見(jiàn)圖1。而下調(diào)差異基因主要富集在膜上(GO_CC:0016020, membrane),主要具有氧化還原酶活性(GO_MF:0016491, oxidoreductase activity),參與氧化還原過(guò)程(GO_BP:0055114, oxidation-reduction process)等,并且富集花生四烯酸代謝(KEGG_PATHY:mmu00590, Arachidonic acid metabolism),5-羥色胺能突觸(KEGG_PATHY: mmu04726, Serotonergic synapse),亞油酸代謝(KEGG_PATHY: mmu00591, Linoleic acid metabolism),PPAR信號(hào)通路(KEGG_PATHY: mmu03320, PPAR signaling pathway)和類固醇激素的合成(KEGG_PATHY: mmu00140, Steroid hormone biosynthesis),見(jiàn)圖2。
2.4差異表達(dá)基因的PPI網(wǎng)絡(luò)分析利用STRING數(shù)據(jù)庫(kù)對(duì)144個(gè)差異基因構(gòu)建PPI網(wǎng)絡(luò),PPI網(wǎng)絡(luò)由83個(gè)節(jié)點(diǎn)和198條邊緣組成,見(jiàn)圖3,每個(gè)節(jié)點(diǎn)代表一種蛋白質(zhì),邊緣代表蛋白質(zhì)之間的關(guān)系。根據(jù)中樞節(jié)點(diǎn)度選出最大的11個(gè)關(guān)鍵基因,分別為:Cd68(degree=17)、Ccl6(degree=17)、Fcer1g(degree=16)、Tyrobp(degree=16)、Clec4n(degree=15)、Lyz2(degree=14)、Ms4a6d(degree=13)、Ly86(degree=13)、Ctss(degree=13)、Cfp(degree=11)和Mpeg1(degree=11)。
圖 1 上調(diào)差異基因富集過(guò)程
Figure1Enrichmentanalysisofup-regulationDEGs
圖 2 下調(diào)差異基因富集過(guò)程
Figure2Enrichmentanalysisofdown-regulationDEGs
紅色是上調(diào)差異基因,綠色是下調(diào)差異基因
圖 3 PPI網(wǎng)絡(luò)特性
Figure3PPInetworkcharacteristics
DKD是終末期腎病的主要原因之一,在全球范圍內(nèi)造成沉重的醫(yī)療負(fù)擔(dān)[10-11]。目前雖然對(duì)DND的發(fā)病機(jī)制有一定認(rèn)識(shí),但其發(fā)病詳細(xì)機(jī)制上不明確。DKD小鼠模型在DKD發(fā)病機(jī)制及藥物治療中有重要作用。本研究中涉及3種DKD模型分別是STZ誘導(dǎo)的DBA2/J小鼠模型(1型DKD模型);純合瘦素受體突變的C57BLKS遺傳背景小鼠(BKS db/db小鼠,2型DKD模型)是一種肥胖2型糖尿病小鼠模型;靶向性刪除內(nèi)皮一氧化氮合酶的BKS db/db小鼠(BKS eNOS-/-db/db,2型DKD模型)。我們從GEO數(shù)據(jù)庫(kù)下載了GSE33744數(shù)據(jù)集的3種DKD小鼠腎小球數(shù)據(jù)進(jìn)行了重新分析,篩選出這3種鼠模型中共同差異基因及通路。
與各自正常對(duì)照相比,BKS db/db、BKS eNOS-/-db/db和DBA-STZ小鼠模型腎小球中差異基因數(shù)分別為2632、2466和551個(gè)。我們可以看到各種鼠模型中差異基因數(shù)目差別很大,提示在不同小鼠基因背景下,參與DKD發(fā)病的基因可能存在很大差異。當(dāng)然這種改變也有可能是由于每組動(dòng)物只數(shù)較少,基因芯片準(zhǔn)確性較低,抽樣誤差等因素引起。本研究進(jìn)一步將各組的差異基因取交集,共鑒定出144個(gè)共同差異基因,其中上調(diào)和下調(diào)差異基因各72個(gè)。GO分析發(fā)現(xiàn),這些差異基因細(xì)胞定位顯著富集在膜上,主要參與先天免疫反應(yīng)、氧化還原過(guò)程、免疫系統(tǒng)過(guò)程和炎癥反應(yīng)等,其分子功能主要富集在氧化還原酶活性。KEGG結(jié)果提示差異基因富集在PPAR信號(hào)通路、花生四烯酸代謝、丁酸代謝和晝夜節(jié)律。并且本研究將上調(diào)和下調(diào)的差異基因做富集分析,提示上調(diào)的差異基因主要富集在細(xì)胞外區(qū)域參與先天免疫反應(yīng),主要具有水解酶活性,富集肺結(jié)核通路途徑;而下調(diào)的差異基因主要富集在膜上,具有氧化還原酶活性,參與氧化還原過(guò)程,富集花生四烯酸代謝、PPAR信號(hào)途徑和甾體激素的生物合成通路途徑等。有趣的是,結(jié)果提示只有下調(diào)基因參與甾體激素的生物合成途徑,甾體激素又稱類固醇激素,其中腎上腺皮質(zhì)激素具有調(diào)控糖代謝,使血糖升高,促進(jìn)蛋白質(zhì)轉(zhuǎn)化成糖的作用。參與甾體激素的生物合成途徑的基因有AKR1C18、CYP2D12和SRD5A2,據(jù)報(bào)道SRD5A2在糖尿病中顯著下調(diào)[12],其具體影響糖尿病腎病的機(jī)制有待進(jìn)一步研究。以前的研究表明,過(guò)氧化物酶體增殖物激活受體在DKD的發(fā)展中起著重要作用[13],它屬于核受體家族成員,主要與炎癥、糖脂代謝、胰島素敏感性等密切相關(guān),許多新型PPARγ激動(dòng)劑有望成為下一代抗糖尿病藥物的候選藥物[14]。內(nèi)源性花生四烯酸能夠模擬血管緊張素II誘導(dǎo)纖連蛋白的表達(dá)[15],活性氧和TGF-β與糖尿病腎病的發(fā)病機(jī)制有關(guān),糖尿病腎病的早期階段也與腎鈉處理和高血壓的改變有關(guān),兩者都與花生四烯酸代謝過(guò)程相關(guān)[16]。最近研究發(fā)現(xiàn),晝夜節(jié)律可促進(jìn)糖尿病腎病的發(fā)展,許多晝夜節(jié)律靶基因是器官特異性的并且是與組織特異性功能有關(guān)?,F(xiàn)有證據(jù)表明葡萄糖穩(wěn)態(tài)、促纖維化機(jī)制和缺氧信號(hào)都受到晝夜節(jié)律的調(diào)節(jié)。很明顯,生物鐘是腎的關(guān)鍵調(diào)節(jié)器,但如何調(diào)控糖尿病腎病其機(jī)制有待進(jìn)一步研究[17]。目前,丁酸代謝和DKD之間的研究幾乎沒(méi)有,可能為糖尿病腎病的機(jī)制研究提供一個(gè)新的線索。
對(duì)144個(gè)差異基因進(jìn)行蛋白質(zhì)相互作用網(wǎng)絡(luò)分析,篩選出與DKD有關(guān)的關(guān)鍵基因,其中前11個(gè)為:Cd68、Ccl6、Fcer1g、Tyrobp、Clec4n、Lyz2、Ms4a6d、Ly86、Ctss、Cfp和Mpeg1。CD68是巨噬細(xì)胞標(biāo)記物,其與DKD的直接研究較少,但其與炎癥浸潤(rùn),炎性因子表達(dá)水平上調(diào)關(guān)系密切[18],這些中樞基因可能為DKD的防治和治療提供新的靶點(diǎn)。有趣的是,在PPI網(wǎng)絡(luò)中花生四烯酸代謝途徑過(guò)度出現(xiàn),其中Cyp4a14明顯上調(diào),而CYP2J13、ALOX15、CYP4A12A和CYP2J11下調(diào)。據(jù)報(bào)道Cyp4a14、CYP2J13、CYP4A12A和CYP2J11屬于細(xì)胞色素P450(CYP)家族的成員,細(xì)胞色素P450ω-羥化酶4A14(CYP4A14)是人類CYP4A羥化酶的同系物,其主要在小鼠的肝和腎中表達(dá)[19],可以催化小鼠中花生四烯酸的ω-羥化反應(yīng)[20],CYP4A14基因的干擾會(huì)導(dǎo)致20-HETE上調(diào);CYP4a12a過(guò)表達(dá)會(huì)導(dǎo)致20-HETE上調(diào)[21],而20-HETE是CYP代謝產(chǎn)物。另外,CYP2J13和CYP2J11在花生四烯酸代謝中也具有活性[22]。
綜上所述,本研究通過(guò)信息學(xué)手段篩選出了在3種DKD動(dòng)物模型共同差異基因及共同信號(hào)通路研究,提示這些差異基因和通路可能在DKD中扮演重要角色,對(duì)這些基因和通路的研究,可能使我們能夠更加深入地理解DKD的發(fā)病機(jī)制,為DKD的預(yù)防與診治提供新的靶點(diǎn)。