丁煒光,張瑤,李靜波,丁敏
(1天津市南開區(qū)三潭醫(yī)院,天津300193;2天津醫(yī)科大學(xué)代謝病醫(yī)院)
糖尿病是臨床上最常見的代謝系統(tǒng)疾病[1],其發(fā)病率逐年升高,占用了大量醫(yī)療資源和經(jīng)費(fèi)[2]。糖尿病腎病(DN)是糖尿病晚期重要的微循環(huán)并發(fā)癥,也是臨床上終末期腎病的主要原因之一[3]。晚期DN患者出現(xiàn)大量蛋白尿、腎功能衰竭,是糖尿病患者死亡的重要原因。DN的確切發(fā)病分子機(jī)制并未明確,目前認(rèn)為DN是涉及多基因、多步驟的異常代謝過程。近年來隨著表達(dá)譜芯片及二代測序技術(shù)的不斷發(fā)展,海量DN相關(guān)數(shù)據(jù)被上傳至多個(gè)基因表達(dá)數(shù)據(jù)庫,為從分子層面研究DN提供了基礎(chǔ)[4,5]。對相關(guān)基因表達(dá)譜芯片中的數(shù)據(jù)深入分析,探索DN相關(guān)基因的信號通路,有助于篩選DN高危人群。本研究采用生物信息技術(shù),分析基因公共表達(dá)數(shù)據(jù)庫(GEO)中關(guān)于DN的芯片數(shù)據(jù),篩選差異表達(dá)基因及其可能的功能和信號通路,以期為DN的早期診斷及靶向藥物研發(fā)提供生物信息學(xué)基礎(chǔ)。
1.1 數(shù)據(jù)庫及分析軟件 基因表達(dá)譜公共數(shù)據(jù)庫GEO(https://www.ncbi.nlm.nih.gov/geo/)用于篩選DN差異表達(dá)基因。本研究中涉及的基因芯片平臺(tái)為GPL8300,芯片數(shù)據(jù)集為GSE1009詳見網(wǎng)址https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi acc=GSE1009[6]。生物學(xué)信息注釋數(shù)據(jù)庫DAVID(https://david.ncifcrf.gov/)用于對差異表達(dá)基因進(jìn)行生物功能信息注釋。蛋白-蛋白相互作用數(shù)據(jù)庫STRING(http://string-db.org/cgi/input.pl)用于構(gòu)建差異表達(dá)基因編碼蛋白的相互作用網(wǎng)絡(luò)。
1.2 差異表達(dá)基因篩選 在GEO中篩選并下載DN相關(guān)基因芯片數(shù)據(jù),數(shù)據(jù)搜索條件為“diabetic nephropathy”,物種選擇“human”。利用GEO數(shù)據(jù)庫提供的在線分析方法篩選出DN患者腎組織與正常人群腎組織中差異表達(dá)最為明顯的基因。篩選條件為差異表達(dá)上調(diào)或下調(diào)2倍以上(logFC>2或<-2)、P<0.01。
1.3 差異表達(dá)基因功能及信號通路分析 對篩選出的差異表達(dá)基因的靶基因進(jìn)行基因本體論(GO)和京都基因與基因組百科全書(KEEG)分析,預(yù)測其可能功能及信號通路。
1.4 差異表達(dá)基因編碼蛋白的相互作用分析 用STRING數(shù)據(jù)庫分析差異表達(dá)基因編碼蛋白間的相互作用關(guān)系。分析差異表達(dá)基因編碼蛋白與其他常見DN致病基因編碼蛋白之間的相互作用關(guān)系。篩選條件為蛋白與蛋白相互作用關(guān)系置信指數(shù)>0.4。
2.1 差異表達(dá)基因篩選結(jié)果 篩選出9個(gè)差異表達(dá)最為顯著的基因,分別為PLCE1、CLIC5、PTPRO、熱休克蛋白A12A(HSPA12A)、AIF1、GMDS、SEMA5A、CEP152、FOXC1。除CEP152表達(dá)下調(diào)外,余8個(gè)基因在DN組表達(dá)上調(diào)。見表1。
表1 GEO數(shù)據(jù)庫篩選DN差異表達(dá)的基因
2.2 差異表達(dá)基因功能與相關(guān)通路 層次聚類分析顯示,DN組與對照組呈現(xiàn)出明顯的聚類表達(dá),其中有191個(gè)基因呈現(xiàn)明顯的差異表達(dá)。GO分析顯示,上述差異表達(dá)基因的蛋白產(chǎn)物主要位于細(xì)胞膜、細(xì)胞器等細(xì)胞組成成分,主要的分子功能涉及蛋白結(jié)合、對細(xì)胞刺激反應(yīng)和細(xì)胞信號轉(zhuǎn)導(dǎo),主要調(diào)控細(xì)胞代謝等生物學(xué)過程。KEGG通路分析顯示,差異表達(dá)基因主要參與細(xì)胞代謝途徑、甲狀腺激素信號通路、Rap1信號通路、磷脂酰肌醇信號系統(tǒng)及肌醇磷酸代謝等。見表2、3。
表2 DN差異表達(dá)基因的GO分析結(jié)果
表3 KEEG基信號通路分析
2.3 差異表達(dá)基因編碼蛋白的相互作用網(wǎng)絡(luò)分析結(jié)果 在STRING數(shù)據(jù)庫中分析9個(gè)差異表達(dá)基因編碼蛋白間的相互作用關(guān)系,蛋白網(wǎng)絡(luò)分析提示HSPA12A、GMDS、CEP152基因編碼蛋白與其他蛋白作用關(guān)聯(lián)最緊密(節(jié)點(diǎn)度≥5)。
DN是臨床上較常見的一類糖尿病微血管并發(fā)癥,其病理改變主要為腎小球肥大,腎小管、腎小球基底膜厚度增加,細(xì)胞外基質(zhì)積聚[7~9];病情進(jìn)展逐漸出現(xiàn)蛋白尿、血肌酐和尿素氮增高,最終發(fā)展為尿毒癥、腎功能衰竭[10]。近年來我國2型糖尿病發(fā)病率逐漸增高,DN的患病人數(shù)也相應(yīng)增加[11]。
DN的發(fā)病機(jī)制復(fù)雜,目前仍未完全清楚,現(xiàn)有研究認(rèn)為DN的發(fā)生主要與遺傳背景、腎臟血流動(dòng)力學(xué)異常、血糖升高造成的代謝功能紊亂有關(guān)[10~14]。DN相關(guān)流行病學(xué)研究認(rèn)為,糖尿病患者一級親屬罹患糖尿病的概率明顯高于非糖尿病人群,且有糖尿病家族史的人群罹患DN的風(fēng)險(xiǎn)也明顯高于無家族史的糖尿病患者。同時(shí),移居非洲的高加索人種DN的發(fā)病率高于當(dāng)?shù)鼐用?,而與移居前所在地的人種發(fā)病率相當(dāng)。上述研究均提示DN的發(fā)病存在遺傳因素。
近年來,隨著基因芯片及二代次序技術(shù)的不斷進(jìn)展,積累了大量關(guān)于DN的數(shù)據(jù),為在分子水平上研究DN的發(fā)病、危險(xiǎn)因素及靶向治療提供了基礎(chǔ)[9,16,17]。本研究中,筆者借助GEO數(shù)據(jù)庫篩選了9個(gè)在DN患者腎組織與正常人群腎組織中差異表達(dá)的基因,進(jìn)行了功能富集、信號通路和共表達(dá)網(wǎng)絡(luò)分析。共篩選出9個(gè)差異表達(dá)最為顯著的基因,分別為PLCE1、CLIC5、PTPRO、HSPA12A、AIF1、GMDS、SEMA5A、CEP152、FOXC1。除CEP152表達(dá)下調(diào)外,余8個(gè)基因在DN組表達(dá)上調(diào)。這些差異表達(dá)的基因蛋白產(chǎn)物主要位于細(xì)胞膜、細(xì)胞器等細(xì)胞組成成分,主要的分子功能涉及蛋白結(jié)合、對細(xì)胞刺激反應(yīng)和細(xì)胞信號轉(zhuǎn)導(dǎo),主要調(diào)控細(xì)胞代謝等生物學(xué)過程。蛋白網(wǎng)絡(luò)分析提示HSPA12A、GMDS、CEP152基因編碼蛋白與其他蛋白作用關(guān)聯(lián)最緊密,提示它們在DN的發(fā)病機(jī)制中可能發(fā)揮重要作用。
HSPA12A、HSPA12B都屬于HSP70超家族。不同于與該家族其他成員,HSPA12B有自己特異的結(jié)構(gòu)和功能。HSPA12B主要表達(dá)于血管內(nèi)皮細(xì)胞中,隨著內(nèi)皮細(xì)胞功能障礙及凋亡,外周血中HSPA12B可能升高[18]。DN組中HSPA12B表達(dá)水平是對照組的4.19倍,表達(dá)水平明顯上調(diào)。同時(shí),在DN相關(guān)差異表達(dá)基因編碼蛋白的相互作用網(wǎng)絡(luò)中,HSPA12B基因編碼蛋白為關(guān)鍵單蛋白,在整個(gè)網(wǎng)絡(luò)中與其他蛋白相互作用較為緊密,因此HSPA12B在DN的發(fā)生發(fā)展中可能發(fā)揮重要作用。而關(guān)于HSPA12A的研究較少,其確切生物學(xué)功能并不清楚。本研究發(fā)現(xiàn)HSPA12A為DN的關(guān)鍵基因,在DN發(fā)生發(fā)展中可能發(fā)揮重要作用,豐富了HSPA12A的生物學(xué)功能,下一步也將就此進(jìn)行深入探索。
甘露糖-4,6-脫水酶(GDP)由GMDS基因編碼。近年來研究顯示,GDP參與體內(nèi)的糖代謝過程,其表達(dá)水平增高大多與血糖水平升高或異常波動(dòng)有關(guān)[19]。長期較高的血糖水平是DN的發(fā)病基礎(chǔ)。本研究中GMDS表達(dá)水平在DN組中明顯增高,推測抑制GMDS表達(dá)有望成為DN治療的新方向。
目前關(guān)于CEP152基因及其編碼蛋白的研究報(bào)道較少,且主要為其基因序列報(bào)道,具體功能并不清楚[20]。本研究結(jié)果顯示CEP152在DN患者中表達(dá)水平明顯下調(diào),提示其拷貝數(shù)降低或編碼蛋白表達(dá)水平下降可能是DN的危險(xiǎn)因素。
總之,本研究借助生物信息學(xué)方法,篩選出了9個(gè)在DN腎組織與正常腎組織中差異表達(dá)最顯著的基因,這些基因的主要分子功能涉及蛋白結(jié)合、對細(xì)胞刺激反應(yīng)和細(xì)胞信號轉(zhuǎn)導(dǎo),主要調(diào)控細(xì)胞代謝等生物學(xué)過程。其中,HSPA12、GMDS、CEP152基因編碼蛋白為蛋白-蛋白相互作用網(wǎng)絡(luò)的中心節(jié)點(diǎn),提示三者可能是DN相關(guān)的關(guān)鍵基因,其異常表達(dá)可能參與了DN的發(fā)病。上述研究結(jié)果為DN的早期診斷及靶向藥物研發(fā)提供了生物信息學(xué)基礎(chǔ)。