陳 慧 陳光輝 梁映亮 王萬黨 尹志軍
(南方醫(yī)科大學(xué)附屬小欖醫(yī)院,廣東 中山 528415)
妊娠糖尿?。╣estational diabetes mellitus,GDM)是常見的妊娠期代謝紊亂綜合征,發(fā)病率約為18%,近年來呈持續(xù)增高趨勢[1]。GDM不僅可導(dǎo)致妊娠高血壓、孕期感染、巨大胎兒、羊水過多、難產(chǎn)、新生兒肺透明膜病等母嬰不良圍生期結(jié)局,還可增加孕婦產(chǎn)后和嬰兒肥胖、血脂異常、2型糖尿病等代謝異常風(fēng)險(xiǎn)[2]。除改變生活方式、服用降糖藥和監(jiān)測血糖外,目前尚無治愈GDM的方法和更有效的預(yù)防策略[3]。因此,探究GMD發(fā)病機(jī)制,開發(fā)新的治療策略尤為重要?;虮磉_(dá)數(shù)據(jù)庫(gene expression omnibus,GEO)是一個(gè)儲存芯片、二代測序和其他高通量測序數(shù)據(jù)的數(shù)據(jù)庫[4]。本研究利用GEO數(shù)據(jù)庫整合GDM相關(guān)實(shí)驗(yàn)測序數(shù)據(jù),進(jìn)行生物信息學(xué)分析,確定關(guān)鍵基因,并評價(jià)其診斷效能,為GDM早期診斷和個(gè)體化預(yù)防、治療提供更準(zhǔn)確和可靠的生物標(biāo)志物。
從GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)下載與GMD相關(guān)的微陣列數(shù)據(jù)。入選標(biāo)準(zhǔn):1)同時(shí)具有對照者和GMD患者樣本;2)樣本總數(shù)≥20例。最終選取GSE103552數(shù)據(jù)集用于本研究,芯片平臺為GPL6244,樣本類型為胎兒胎盤內(nèi)皮細(xì)胞,共37例,其中對照組17例[年齡(28.6±7.1)歲,身高(1.68±0.07)m,體重(81.9±3.6)kg,孕周(40.0±1.6)周]、GDM組20例[年齡(30.0±6.8)歲,身高(1.62±0.07)m,體重(83.4±3.3)kg,孕周(40.0±1.6)周]。2個(gè)組之間年齡、身高、體重、孕周差異均無統(tǒng)計(jì)學(xué)意義(P>0.05)。根據(jù)芯片對應(yīng)的平臺信息對芯片數(shù)據(jù)進(jìn)行ID轉(zhuǎn)換,采用R軟件中的“l(fā)imma”程序包進(jìn)行校正。
采用R軟件中的“l(fā)imma”程序包分析GDM組和對照組差異表達(dá)基因,篩選標(biāo)準(zhǔn)為|log2FC|>1且P<0.05;采用R軟件中的“Clusterprofiler”程序包對差異表達(dá)基因進(jìn)行基因本體(Gene Ontology,GO)和京都基因與基因組數(shù)據(jù)庫(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析。篩選標(biāo)準(zhǔn)設(shè)置為P<0.05,富集分析結(jié)果圖由R軟件中的“ggplot2” 程序包呈現(xiàn)。
使用R軟件WGCNA數(shù)據(jù)包確定模塊基因。使用網(wǎng)絡(luò)拓?fù)浞治龃_定軟閥值,進(jìn)一步構(gòu)建共表達(dá)網(wǎng)絡(luò),確定模塊和樣本特征關(guān)系,找到所需的模塊,輸出模塊基因。
取模塊基因與差異表達(dá)基因的交集,并使用STRING數(shù)據(jù)庫(https://string-db.org/)構(gòu)建蛋白互作網(wǎng)絡(luò),使用Cytoscape v3.8.2軟件進(jìn)行可視化處理,并使用Cytohubba插件的Degree方法篩選關(guān)鍵基因。
采用R軟件分析關(guān)鍵基因表達(dá)水平,采用受試者工作特征(receiver operating characteristic,ROC)曲線評價(jià)關(guān)鍵基因診斷GDM的效能。
從GSE103552數(shù)據(jù)集中共獲得GDM組與對照組差異表達(dá)的基因118個(gè),其中表達(dá)上調(diào)65個(gè)、表達(dá)下調(diào)53個(gè)。見圖1。
圖1 GDM組和對照組差異表達(dá)基因的篩選
差異表達(dá)基因GO富集分析和KEGG通路富集分析結(jié)果顯示,差異表達(dá)基因涉及細(xì)胞外基質(zhì)組織、細(xì)胞外結(jié)構(gòu)組織和DNA構(gòu)象變化等多個(gè)反應(yīng),主要調(diào)控RNA轉(zhuǎn)運(yùn)和味覺轉(zhuǎn)導(dǎo)等多個(gè)通路。見圖2。
圖2 GDM差異表達(dá)基因涉及的生物學(xué)功能
R軟件WGCNA程序包分析結(jié)果顯示,本研究無離群樣本,樣本的聚類特征熱圖見圖3(a)、(b)。
圖3 GDM組和對照組WGCNA分析
使用網(wǎng)絡(luò)拓?fù)浞治龃_定13個(gè)模塊的軟閥值為8(r2=0.9)。根據(jù)軟閾值構(gòu)建共表達(dá)網(wǎng)絡(luò),分析樣本特征與13個(gè)模塊之間的關(guān)系,選擇與GDM最顯著相關(guān)的模塊,確定為包含122個(gè)基因的模塊(cor=0.52,P<0.001)。見圖3(c)~(f)。
取模塊基因與差異表達(dá)基因的交集,得到33個(gè)特征差異表達(dá)基因。采用Cytohubba插件的Degree方法篩選關(guān)鍵基因,選擇節(jié)點(diǎn)度最高的5個(gè)基因(ANKRD36C、CLK1、LUC7L3、NKTR和RSRP1)作為GDM關(guān)鍵基因。見圖4。
圖4 關(guān)鍵基因篩選
GDM組5個(gè)關(guān)鍵基因(ANKRD36C、CLK1、LUC7L3、NKTR和RSRP1)相對表達(dá)量均高于對照組(P<0.05)。見圖5(a)。
圖5 對照組和GDM組關(guān)鍵基因相對表達(dá)量比較及其診斷GDM的ROC曲線
ROC曲線分析結(jié)果顯示,ANKRD36C、CLK1、LUC7L3、NKTR和RSRP1診斷GDM的曲線下面積分別為0.891、0.818、0.909、0.891和0.885。見圖5(b)。
GDM是一種以胰島素抵抗、胰島β細(xì)胞代償不足為主要特征的妊娠并發(fā)癥,目前尚無有效的診療方法[5]。ZHAO等[6]通過WGCNA分析篩選出10個(gè)與GDM病理進(jìn)程相關(guān)的候選基因。CHEN等[7]通過WGCNA分析篩選出5個(gè)與GDM病理進(jìn)程相關(guān)甲基化程度高的低表達(dá)基因(ABLIM1、GRHL1、HLA-F、NDRG1和SASH1)和1個(gè)甲基化程度低的高表達(dá)基因(EIF3F)。尹志芳等[8]通過分析GDM相關(guān)基因表達(dá)數(shù)據(jù)集GSE51546和GSE87295發(fā)現(xiàn)7個(gè)差異表達(dá)基因,分別為CD34、TACSTD2、LDB2、CLDN5、NTN4、COLEC12和IGFBP6。本研究通過分析GSE103552數(shù)據(jù)集獲得5個(gè)在GDM中呈高表達(dá)的關(guān)鍵基因(ANKRD36C、CLK1、LUC7L3、NKTR和RSRP1),均具有較高的診斷價(jià)值。但應(yīng)注意的是,因不同研究的樣本信息來源和數(shù)據(jù)不同,所以可能導(dǎo)致得出的差異表達(dá)基因完全不同。
在妊娠末期,胎盤內(nèi)皮細(xì)胞對胎盤功能的調(diào)節(jié)有重要意義,GDM患者胎盤內(nèi)皮細(xì)胞功能受損,且有408個(gè)基因發(fā)生改變[9]。ZHU等[10]的研究結(jié)果顯示,GDM患者胎盤內(nèi)皮細(xì)胞中有2 095個(gè)基因表達(dá)上調(diào),3 117個(gè)基因表達(dá)下調(diào)。本研究結(jié)果顯示,GSE103552數(shù)據(jù)集中有65個(gè)基因表達(dá)上調(diào),53個(gè)基因表達(dá)下調(diào)。由此可見,胎盤內(nèi)皮細(xì)胞基因水平異常可能會(huì)導(dǎo)致其功能受損,這些差異基因或可作為GDM潛在的診斷標(biāo)志物。
本研究通過生物信息學(xué)分析獲得5個(gè)GDM的關(guān)鍵基因,分別為ANKRD36C、CLK1、LUC7L3、NKTR、RSRP1。這5個(gè)關(guān)鍵基因在GDM中的表達(dá)水平和調(diào)控機(jī)制還需進(jìn)一步研究。在血栓性血小板減少性紫癜患者體內(nèi)存在ANKRD36C變異,與炎癥相關(guān);GDM常常伴隨過度的炎癥反應(yīng),抑制炎癥反應(yīng)可以緩解GDM病情,提示GDM中高表達(dá)的ANKRD36C可能與GDM過度炎癥有關(guān)[11]。過度的胰島素抵抗和胰島素分泌不足均與GDM發(fā)生密切相關(guān),胰島素可促進(jìn)絲氨酸/蘇氨酸激酶2磷酸化,敲低AKT2會(huì)促進(jìn)CLK1表達(dá),提示胰島素分泌不足會(huì)導(dǎo)致GDM患者CLK1水平上調(diào),但CLK1在GDM疾病進(jìn)程中的調(diào)控機(jī)制還需進(jìn)一步研究[12]。同樣,LUC7L3作為致癌基因參與了調(diào)控胰島素抵抗[13],但其在GDM中的作用尚未見報(bào)道。本研究發(fā)現(xiàn),LUC7L3與GDM病理變化有關(guān)。有研究通過WGCNA分析發(fā)現(xiàn)NKTR基因參與了疾病病理進(jìn)程[14],但其在GDM中的作用亦未見報(bào)道。RSRP1位于1號染色體,目前對其功能的研究較少[15]。
綜上所述,本研究采用生物信息學(xué)分析方法,在GSE103552數(shù)據(jù)集中獲得5個(gè)GDM關(guān)鍵基因(ANKRD36C、CLK1、LUC7L3、NKTR和RSRP1)。5個(gè)關(guān)鍵基因在GDM中表達(dá)均上調(diào),診斷GDM的AUC均>0.8。但本研究尚有一定的局限性:本研究利用生物信息學(xué)技術(shù)篩選GDM關(guān)鍵基因,并分析其診斷價(jià)值,但未進(jìn)行臨床樣本驗(yàn)證,胎盤內(nèi)皮細(xì)胞差異基因分析還處于臨床前研究,目前尚不能用于常規(guī)臨床診斷;本研究所有分析均基于GSE103552數(shù)據(jù)集,目前GEO數(shù)據(jù)庫中尚無中國漢族人群GDM微陣列數(shù)據(jù)。因此,這5個(gè)關(guān)鍵基因在GDM中的表達(dá)水平和調(diào)控機(jī)制還需進(jìn)一步研究。