喬子君,馬文麗,鄭文嶺
(南方醫(yī)科大學(xué) 基因工程研究所,廣東 廣州510515)
長(zhǎng)期的能量攝入與消耗不平衡,使人體內(nèi)的脂肪組織大量增加,即被定義為肥胖[1]。世界衛(wèi)生組織在2008年的普查數(shù)據(jù)中顯示,全球有超過(guò)14 億的成人體質(zhì)量超重,其中超過(guò)2 000萬(wàn)男性與超過(guò)3 000萬(wàn)的女性屬于肥胖患者。在已知研究中,肥胖被發(fā)現(xiàn)與多種疾病的發(fā)生發(fā)展相關(guān),其中以Ⅱ型糖尿病、心腦血管疾病、肝臟疾病及某些特定癌癥為代表[2]。在肥胖人群中女性患Ⅱ型糖尿病的風(fēng)險(xiǎn)要大于男性[3]。本研究采用來(lái)自基因芯片檢測(cè)獲得的數(shù)據(jù),通過(guò)進(jìn)一步數(shù)據(jù)挖掘,探討肥胖發(fā)病機(jī)制和性別的關(guān)系。
生物信息學(xué)理論和分析軟件的發(fā)展,使得將基因組與網(wǎng)絡(luò)分析相結(jié)合的研究越來(lái)越多。特別是針對(duì)慢性疾病及其并發(fā)癥的生物網(wǎng)絡(luò)研究,例如蛋白質(zhì)相互作用(protein-protein interaction)網(wǎng)絡(luò)[4]、系統(tǒng)生物學(xué)分析工具DAVID 等,可用于了解疾病間的聯(lián)系以及疾病發(fā)生的復(fù)雜分子機(jī)制。
從基因表達(dá)數(shù)據(jù)庫(kù)(gene expression omnibus,GEO)中下載(http://www.ncbi.nlm.nih.gov/geo/)基因表達(dá)數(shù)據(jù)集GDS3602,該數(shù)據(jù)集由美國(guó)AL 州伯明翰大學(xué)臨床營(yíng)養(yǎng)研究中心Y.H.Lee 等人提交。該數(shù)據(jù)集包括了非糖尿病肥胖患者10例(男性、女性分別5例),正常對(duì)照組10例(男性、女性分別5例)。
1.2.1 差異基因分析:使用qlucore omics explorer 3.0(http://www.qlucore.com/),對(duì)數(shù)據(jù)集GDS3602進(jìn)行差異基因分析,將數(shù)據(jù)集中樣本按肥胖女性O(shè)F組(obese female)、肥胖男性O(shè)M組(obese male)、正常女性LF組(lean female)、正常男性LM組(lean male)進(jìn)行分組,以性別分類對(duì)其進(jìn)行兩組比較(two group comparison),方差過(guò)濾取值0.001,P值取0.001。對(duì)獲得的差異基因進(jìn)行聚類。將所獲得的差異表達(dá)基因列表分別命名為肥胖男性組及正常男性組(obese male to lean male)和肥胖女性組及正常女性組(obese female to lean female)。
1.2.2 DAVID 在線分析:在本研究中,主要利用其的基因本體(gene ontology,GO)和京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG),該數(shù)據(jù)庫(kù)是一種系統(tǒng)分析基因功能、基因組信息數(shù)據(jù)庫(kù),有助于研究者把基因及表達(dá)信息作為一個(gè)整體網(wǎng)絡(luò)進(jìn)行研究)分析工具,進(jìn)一步挖掘已從高通量數(shù)據(jù)中提取出的差異表達(dá)基因。
分別將變量列表導(dǎo)入DAVID,可以得出每個(gè)差異基因列表的GO 和KEGG分析結(jié)果。
1.2.3 蛋白質(zhì)作用網(wǎng)絡(luò)分析:從數(shù)據(jù)庫(kù)MINT(molecular INTeraction database)(http://mint.bio.uniroma2.it/mint/)中獲得男性、女性組差異基因所涉及的蛋白質(zhì)相互作用靶對(duì)(protein-protein interaction pairs,PPI pairs),使用cytoscape3.0.2(http://cytoscapeweb.cytoscape.org/)分別對(duì)獲得的PPI 數(shù)據(jù),構(gòu)建出蛋白質(zhì)相互作用分析網(wǎng)絡(luò),采用Cluster ONE 插件對(duì)作用網(wǎng)絡(luò)進(jìn)行聚類分析,篩選P值小于0.001的節(jié)點(diǎn)度(degree)不小于6的作用簇,保留核心節(jié)點(diǎn)為差異基因編碼蛋白的作用簇。
OM組共篩選出62個(gè)差異表達(dá)基因,其中39個(gè)基因在肥胖男性中高表達(dá),23個(gè)為低表達(dá)(圖1A);OF組共篩選出178個(gè)差異表達(dá)基因,其中高表達(dá)99個(gè),低表達(dá)79個(gè)(圖1B)。
OM組中共涉及GO 分類33個(gè),其中生物過(guò)程(biological process,BP)13個(gè)分類,分子功能(molecular function,MF)13個(gè)分類,細(xì)胞組分(cellular component,CC)7個(gè)分類。
OF組中共涉及GO 分類144個(gè),其中生物過(guò)程(biological process,BP)92個(gè)分類,分子功能(molecular function,MF)27個(gè)分類,細(xì)胞組分(cellular component,CC)25個(gè)分類。
對(duì)以上GO 分類取P值0.05 過(guò)濾,OM組中BP、MF、CC 分別有4、5、6個(gè)分類被保留;OF組中BP、MF、CC 分別有66、17、12個(gè)分類被保留。進(jìn)一步用FDR值對(duì)P值進(jìn)行校正,保留FDR 小于5%,且每個(gè)分類中包含基因數(shù)多于5的GO類別,OM組中BP、MF、CC 沒有類別符合條件,OF組中BP、MF、CC 分別有11、4、3個(gè)類別被保留。其中OF組過(guò)濾后的GO 分類(表1)。
在OM組中,差異基因所涉及的KEGG 通路有4條,其中P值小于0.05的通路有2條,經(jīng)過(guò)FDR校正后還有0條;在OF組中,差異基因所涉及的KEGG 通路有18條,P值小于0.05的通路有5條,經(jīng)過(guò)FDR 校正后還有2條(表2)。
圖1 各組差異基因分析及聚類結(jié)果Fig1 The results of different expression genes and clustering
表1 OF組過(guò)濾后GO 分類Table1 GO terms of group OF after filtering
表2 OF組差異基因涉及KEGG 通路Table2 KEGG pathway of differentially expressed genes for group OF
對(duì)OM組與OF組差異基因分別構(gòu)建蛋白質(zhì)作用網(wǎng)絡(luò)(圖2)。
使用Cluster ONE 插件對(duì)網(wǎng)絡(luò)做聚類分析,得到OM組蛋白質(zhì)作用網(wǎng)絡(luò)中核心節(jié)點(diǎn)12個(gè),其中10個(gè)為差異基因,分別為FYN、MDFI、SORBS3、FN1、FEZ1、CTNNA1、HSPA8、RAD21、TUBB2B 和CTNNA1(圖3)。
OF組蛋白質(zhì)作用網(wǎng)絡(luò)核心節(jié)點(diǎn)10個(gè),其中8個(gè)為表達(dá)差異基因,分別為PDIA3、YWHAH、OGT、BORBS3、HSPA5、PDHB、MYD88 和FLNC(圖4)。
圖3 OM組處于核心節(jié)點(diǎn)位置的差異基因Fig3 The hub nodes of group OM,which belong to the different express genes
圖4 OF組處于核心節(jié)點(diǎn)位置上的差異基因Fig4 The hub nodes of group OF,which belong to the different express genes
在本研究中,通過(guò)肥胖患者同正常組的比較,分別篩選出不同性別組內(nèi)的差異表達(dá)基因,以用于研究性不同性別組之間肥胖相關(guān)基因的差異。相比而言,男性患者組內(nèi)表達(dá)差異基因數(shù)少于女性組,提示性別因素對(duì)肥胖的產(chǎn)生機(jī)制存在一定的影響。
GO分析結(jié)果顯示,女性涉及的GO 分類數(shù)目要多于男性,也說(shuō)明女性肥胖的發(fā)病機(jī)制可能更為復(fù)雜,涉及面要更廣。
在這些被保留的分類中涉及胰島素相關(guān)GO類別的差異基因在女性實(shí)驗(yàn)組中全部高表達(dá),分別為IGFBP2(insulin-like growth factor binding protein 2)、IGFBP4(insulin-like growth factor binding protein 4)、CTGF(connective tissue growth factor)和 WISP2(WNT1 inducible signaling pathway 2),編碼胰島素樣生長(zhǎng)因子結(jié)合蛋白-2、胰島素樣生長(zhǎng)因子結(jié)合蛋白-4、結(jié)締組織生長(zhǎng)因子和WNT1 誘導(dǎo)信號(hào)通路。胰島素樣生長(zhǎng)因子(insulin-like growth factor,IGF)體組織的生長(zhǎng)和發(fā)育中起著重要的作用,是人體最重要的生長(zhǎng)因子之一,包括IGF1 和IGF2 兩種,研究顯示IGF1 在免疫系統(tǒng)中和多種免疫細(xì)胞有正向調(diào)節(jié)作用,如促進(jìn)淋巴細(xì)胞和粒細(xì)胞增生[5],調(diào)節(jié)前B淋巴細(xì)胞的分化和促進(jìn)B 細(xì)胞的抗體生成[6]。
在蛋白質(zhì)作用網(wǎng)絡(luò)核心節(jié)點(diǎn)中,兩組都有SORBS3(sorbin and SH3 domain containing 3),其編碼基因SORBS3 編碼一個(gè)具有SH3 結(jié)構(gòu)域的銜接蛋白。SH3 結(jié)構(gòu)域主要在細(xì)胞骨架組裝以及細(xì)胞黏附和遷移中發(fā)揮著重要作用[7],已經(jīng)有研究顯示同DLG5、MAPK1 存在相互作用關(guān)系[8-9]。
在蛋白質(zhì)作用網(wǎng)絡(luò)中,節(jié)點(diǎn)度(k)是網(wǎng)絡(luò)節(jié)點(diǎn)最基本的特征參數(shù),用以表示在一個(gè)網(wǎng)絡(luò)中一個(gè)節(jié)點(diǎn)與其他節(jié)點(diǎn)的連接數(shù)[10],而節(jié)點(diǎn)度可以作為判斷一個(gè)節(jié)點(diǎn)重要程度的重要標(biāo)準(zhǔn)[11],分析發(fā)現(xiàn),F(xiàn)YN與PDIA3的節(jié)點(diǎn)度分別是男性女性肥胖蛋白質(zhì)網(wǎng)絡(luò)中的重要節(jié)點(diǎn)。FYN是酪氨酸激酶家族(src-family kinases)中的一員[12],并且被證明其高表達(dá)與前列腺癌有著重要關(guān)系[13],這提示著男性肥胖與前列腺癌發(fā)病機(jī)制間的某種聯(lián)系。PDIA3 也被稱為ERP57,是一種典型的蛋白質(zhì)二硫鍵異構(gòu)酶,催化蛋白質(zhì)二硫鍵的形成、分解及異構(gòu),并已被證實(shí)與多種癌癥的發(fā)生相關(guān)[14]。PDIA3的低表達(dá)預(yù)示著宮頸癌的較差預(yù)后[15],提示著女性肥胖與宮頸癌預(yù)后有著密切關(guān)系。以上分析結(jié)果仍需進(jìn)一步實(shí)驗(yàn)驗(yàn)證。
綜上所述,相比男性肥胖患者,女性肥胖中的差異基因表達(dá)數(shù)量較多,涉及的GO 分類數(shù)目也多于男性,提示女性肥胖發(fā)病的分子機(jī)制與男性肥胖明顯不同。女性肥胖發(fā)病的分子機(jī)理可能更為復(fù)雜。
[1]Y H.Lee S.Nair,E.Rousseau,et al,Microarray profiling of isolated abdominal subcutaneous adipocytes from obese vs non-obese Pima Indians:increased expression of inflammation-related genes [J].Diabetologia,2005,48:1776-1783.
[2]Iskander K,F(xiàn)arhour R,F(xiàn)icek M,et al,Obesity-related complications:few biochemical phenomena with reference to tumorigenesis[J].Malays J Pathol,2013,35:1-15.
[3]Ding EL,Song Y,Malik VS,et al,Sex differences of endogenous sex hormones and risk of type 2 diabetes:a systematic review and meta-analysis[J].JAMA,2006,295:1288-1299.
[4]Paik H,Heo HS,Ban HJ,et al,Unraveling human protein interaction networks underlying co-occurrences of diseases and pathological conditions[J].J Transl Med,2014,12:99.doi:10.1186/1479-5876-12-99.
[5]Clark R,Strasser J,McCabe S,et al,Insulin-like growth factor-1 stimulation of lymphopoiesis [J].J Clin Invest,1993,92:540-548.
[6]Kimata,H.and A.Yoshida,Effect of growth hormone and insulin-like growth factor-I on immunoglobulin production by and growth of human B cells [J].J Clin Endocrinol Metab,1994,78:635-641.
[7]Kioka N,Sakata S,Kawauchi T,et al,Vinexin:a novel vinculin-binding protein with multiple SH3 domains enhances actin cytoskeletal organization [J].J Cell Biol,1999,144:59-69.
[8]Wakabayashi M1,Ito T,Mitsushima M,et al,Interaction of lp-dlg/KIAA0583,a membrane-associated guanylate kinase family protein,with vinexin and beta-catenin at sites of cell-cell contact [J].J Biol Chem, 2003, 278:21709-21714.
[9]Wakabayashi M,Ito T,Mitsushima M,et al,Extracellular signal-regulated kinase activated by epidermal growth factor and cell adhesion interacts with and phosphorylates vinexin[J].J Biol Chem,2004,279:34570-34577.
[10]Raman K,Construction and analysis of protein-protein interaction networks[J].Autom Exp,2010,2:2.
[11]Callaway DS,Newman ME,Strogatz SH,et al,Network robustness and fragility:percolation on random graphs[J].Phys Rev Lett,2000,85:5468-5471
[12]Jensen AR,David SY,Liao C,et al,F(xiàn)yn Is downstream of the HGF/MET signaling axis and affects cellular shape and tropism in PC3 cells [J].Clin Cancer Res,2011,17:3112-3122.
[13]Posadas EM,Al-Ahmadie H,Robinson VL,et al,F(xiàn)YN is overexpressed in human prostate cancer[J].Bju International,2009,103:171-177.
[14]Shishkin SS,Eremina LS,Kovalev LI,et al,AGR2,ERp57/GRP58,and some other human protein disulfide isomerases [J].Biochemistry-Moscow, 2013, 78:1415-1430.
[15]Chung H,Cho H,Perry C,et al,Downregulation of ERp57 expression is associated with poor prognosis in early-stage cervical cancer [J].Biomarkers,2013,18:573-579.