王 治,洪 莉,李素廷,曾婉玲
(武漢大學人民醫(yī)院婦產科,湖北 武漢 430060)
子宮內膜癌(endometrial carcinoma ,EC)是婦科常見的生殖系統(tǒng)惡性腫瘤之一[1],占女性生殖系統(tǒng)惡性腫瘤20%~30%,好發(fā)于圍絕經期及絕經后女性。研究[2]顯示:EC每年發(fā)病率約為0.2/10 000~1/10 000,且近年來其發(fā)病率逐漸升高,并呈現年輕化趨勢。EC發(fā)病原因和機制尚不明確,其早期診斷及治療方面盡管已有較大進展,但仍有相當一部分的病例發(fā)展至晚期才被確診。因此,研究EC發(fā)病原因和疾病發(fā)展相關機制及干預靶標,有助于進一步改善EC的診斷、治療和預后。 隨著基因芯片技術的發(fā)展以及生物信息學相關工具的完善,目前基因表達匯編(Gene Expression Omnibus, GEO)數據庫[3]提供了大量的基因表達譜相關數據,對其進行數據分析可以快速發(fā)現腫瘤組織中的差異表達基因,并可通過進一步分析尋找到影響疾病發(fā)生發(fā)展的分子靶標。在肺癌[4]、胃癌[5]、乳腺癌[6]、神經母細胞瘤[7]、腸癌[8]和卵巢癌[9]等多種腫瘤中,對GEO數據庫進行分析已經在多種腫瘤機制研究中得到了廣泛應用,該分析方法已經被證實切實有效。通過生物信息學技術篩選EC患者組織的差異表達基因(differentially expressed genes, DEGs)來發(fā)現潛在標志物,對EC的診斷和治療方案的確定具有重要意義。本研究通過對GEO數據庫中EC組織的基因表達數據集GSE3678和GSE17025進行聯合分析,篩選出具有高可信度的DEGs和重要的相關信號通路,構建了DEGs的蛋白質-蛋白質互作網絡(protein-protein interaction network,PPI),并篩選出了關鍵基因作為分子靶標,以期通過DEGs和PPI的分析結果為EC的研究提供新思路。
1.1 基因芯片數據集信息通過GEO數據庫(http://www.ncbi.nlm.nih.gov/geo/)下載高通量測序數據集GSE63678和GSE17025, 2組基因芯片數據類型均為Expression profiling by array,種屬均為Homo sapiens;GSE63678數據集注釋平臺為GPL571,包括5例正常組織樣本(GSM1555092~GSM1555096)和7例EC樣本(GSM1555085~GSM1555091);GSE17025數據集注釋平臺為GPL570,包括12例正常組織樣本(GSM425927~GSM425938)和79例EC樣本(GSM425837~GSM425915)。
1.2 DEGs的提取和分析GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r/)可用于分析GEO數據集中不同數據組的差異表達水平。在基因表達數據集中,以正常組織樣本為對照組,以EC組織為實驗組,使用GEO2R在線分析工具分別分析并篩選出GSE63678和GSE17025的DEGs,篩選標準為P<0.05并且|log(FC)|>2,使用R軟件ggplot2和pheatmap程序包分析DEGs并進行可視化,分別生成火山圖與熱圖。最后用FunRich軟件生成venn圖篩選出在GSE63678和GSE17025中同時上調或下調的DEGs用于進一步分析。
由于石墨烯材料的邊緣具有化學活性,Tan等[17]采用電子束光刻法和氧等離子體法將石墨烯圖形化成四列納米帶(GNRs)來改善羥基組的數量,每條納米帶的寬度為 (99.1±1.5) nm,長度為 5.5 μm。石墨烯圖形化前的光學圖像如圖3(a)所示;圖形化后的光學圖像如圖3(b)左圖所示,對應的AFM圖像如圖3(b)右圖所示。研究表明,圖形化后的石墨烯器件對pH的靈敏度(pH 6~8)由 6.5 mV/pH提升至 23.6 mV/pH。
1.3 基因本體論(gene ontology,GO)富集分析和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路分析對大規(guī)?;蜻M行GO分析已經成為生物信息學分析的常用手段,可從細胞組分、生物過程和分子功能等多方面對DEGs進行全面注釋。KEGG數據庫已被廣泛用于通路富集分析,可得到EC發(fā)展過程中的關鍵通路。使用R語言clusterProfiler包對DEGs分別進行GO富集分析和KEGG信號通路分析,并對結果進行可視化。
2.4 PPI網絡關鍵模塊分析使用MCODE插件對PPI進行關鍵模塊的篩選,共篩選出3個重要的子模塊,篩選標準為K-core=2,Node Score Cutoff=0.2,Degree Cutoff=2,Maximum Depth=100。A模塊MCODE得分為42.048,由43個節(jié)點和883個相互作用關系構成(圖4A);B模塊MCODE得分為4.25,由9個節(jié)點和17個相互作用關系構成(圖4B);C模塊MCODE得分為4.0,由4個節(jié)點和6個相互作用關系構成(圖4C)。
EC是臨床常見的婦科腫瘤之一,在全球婦科腫瘤中發(fā)病率位列第4位,在過去數十年間其發(fā)病率和死亡率逐年升高。EC典型的臨床表現為陰道出血,肥胖、高血壓和糖尿病是EC的“三聯征”。目前EC治療以手術為主,同時給予化療或內分泌治療,但其治療效果卻不甚理想,存在手術不徹底、化療藥物毒性大和易產生耐藥性等問題[10-11]。發(fā)現較早的Ⅰ期EC患者綜合治療后5年生存率可達85%以上,中晚期患者生存率則明顯降低,Ⅱ期EC患 者5年生存率約為70%,Ⅲ期患者則僅為50%[12]。早期發(fā)現和治療是提高EC患者生存率的最佳途徑。隨著對EC發(fā)生發(fā)展機制的不斷探索,已有多項研究[13-15]證實:多基因組學改變和信號轉導通路的異常在EC發(fā)病中起重要的調控作用,多基因多通路的復雜連鎖反應過程也是腫瘤發(fā)生機制研究的難點和重點。
2.3 DEGs的PPI網絡構建基于String數據庫在線分析DEGs的PPI關系,納入PPI標準為綜合得分>0.4,共得到165個PPI節(jié)點和1 131個蛋白互作關系,在所有DEGs中占比80.1%。使用Cytoscape軟件對PPI網絡進行可視化及分析(圖3A)。使用CentiScape插件對PPI節(jié)點進行評估,選擇具有最高度連通性的10個節(jié)點DEG作為EC的關鍵基因(圖3B),可能在EC發(fā)生發(fā)展中起到關鍵作用的基因有細胞分裂周期基因20(cell division cycle gene 20,CDC20)、極光激酶A(aurora kinase A,AURKA)、細胞周期蛋白B1(Cyclin B1,CCNB1)、泛素E3連接酶(denticleless E3 ubiquitin protein ligase,DTL)、中心體相關蛋白55(centrosomal protein 55,CEP55)、細胞周期蛋白依賴性激酶1(Cyclin-dependent kinase 1,CDK1)、驅動蛋白家族成員11(kinesin family member 11,KIF11)、母系胚胎亮氨酸拉鏈激酶(maternal embryonic leucine zipper kinase,MELK)、細胞周期蛋白B2(Cyclin B2,CCNB2)和苯并咪唑出芽抑制解除同源物蛋白1 (budding uninhibited by benzimidazoles 1, BUB1)。見表1。
2.2 對選用的復合(混)肥或作物專用肥,不含有機質或含量在15%以下的肥料,要增加充分腐熟的畜禽純干糞不少于20公斤/畝,可有效的杜絕或緩解玉米苗期肥害。
2.1 DEGs的提取對GSE63678數據集進行處理分析后,共鑒定出459個DEGs,其中包括242個上調基因(52.7%)和217個下調基因(47.3%)(圖1A,見插頁七);GSE17025數據集分析,與對照組比較,EC組共有1 508個DEGs,有797個基因發(fā)生了上調(52.9%),711個基因發(fā)生了下調(47.1%)(圖1B,見插頁七)。2組芯片數據集的差異基因表達熱圖分別見圖1C和1D(插頁七)。將篩選出來的差異表達基因進行Venny分析,結果顯示:在數據集GSE3678和GSE17025中同時發(fā)生上調的基因有100個,同時發(fā)生下調的基因有106個(圖1E,見插頁七)。
表1 關鍵基因的計算結果
1.4 PPI網絡構建和分析String在線數據庫(http://string.embl.de/)可用于檢索分子間相互作用以及預測蛋白質互作關系。使用String數據庫對上述所得的206個DEGs進行分析,構建PPI網絡并使用Cytoscape軟件進行可視化,使用Cytohubba插件對PPI網絡上所有DEGs進行評分,以其中最高相關度的前10個DEGs作為EC發(fā)病相關的關鍵基因,即hub基因。最后使用Cytoscape軟件MCODE插件對DEGs進行聚類功能模塊構建,關鍵模塊篩選標準為MCODE評分>4,并對關鍵模塊所包含基因進行GO富集分析和KEGG通路富集分析。模塊篩選標準:Degree Cutoff = 2, K-core = 2, Maximum Depth=100,Node Score Cutoff = 0.2。
A:Interaction of submodule A; B:Interaction of submodule B; C:Interaction of submodule C.
2.5 重要模塊基因的富集分析對PPI中3個重要子模塊所包含的56個DEGs進行GO富集分析和KEGG信號通路分析。GO富集分析結果顯示:DEGs主要在細胞核分裂和細胞周期調節(jié)等生物過程中發(fā)揮重要作用。KEGG信號通路分析結果顯示:DEGs主要與細胞周期、卵母細胞分裂、p53、細胞衰老、2型糖尿病和叉頭轉錄因子O(FoxO)等信號通路有密切關聯。見圖5(插頁七)。
從圖4中可以明顯看出,隨著毛雞只重的不斷增加,肉雞主產品出成在不斷增加。毛雞重量自4.31×500g增加到5.91×500g的過程中,主產品出成增加了0.09%,即:一只4.31×500g的毛雞要比一只5.91×500g的毛雞少出0.61kg主產品。
2.2 DEGs的GO富集分析和KEGG信號通路分析對共同上調或下調的DEGs進行GO富集分析,GO注釋主要分為細胞組成、生物過程和分子功能3個部分。DEGs主要富集在有絲分裂染色體分離、核分裂和細胞器分裂等生物學過程。KEGG信號通路分析結果顯示:差異基因主要富集于細胞周期、miRNA、p53信號通路和2型糖尿病等信號通路過程。見圖2(插頁七)。
隨著生物信息學技術及二代測序技術的飛速發(fā)展,通過基因芯片數據研究EC發(fā)病機制成為了可能,也是研究EC的重要方向。本研究通過生物信息學技術對GEO數據庫中2個EC相關數據集GSE63678和GSE17025進行聯合分析,共鑒定出了共同發(fā)生上調的差異基因100個,同時發(fā)生下調的差異基因106個;GO富集分析表明:差異基因主要富集于有絲分裂染色體分離、核分裂、細胞器分裂等生物學過程;KEGG信號通路分析表明:差異基因主要富集于細胞周期、miRNA、p53信號通路和2型糖尿病等信號通路過程。對差異基因構建的PPI網絡進行進一步分析后,CDC20、AURKA、CCNB1、DTL、CEP55、CDK1、KIF11、MELK、CCNB2和BUB1被篩選為關鍵基因,其在EC發(fā)生發(fā)展過程中可能發(fā)揮重要作用。本文作者在PPI網絡中提取出了3個重要的子模塊,其所包含基因依然富集于細胞核分裂和細胞周期調節(jié)等生物過程,KEGG通路富集分析則表示這些基因主要與細胞周期、卵母細胞分裂、p53信號通路、細胞衰老、Ⅱ型糖尿病和FoxO信號通路等有關聯。
CDC20在許多種腫瘤中具有高表達,對腫瘤的發(fā)生起促進作用,抑制CDC20活性可加速細胞凋亡、調節(jié)細胞分裂周期[16-17],因此CDC20可作為抗腫瘤治療的有效靶點。AURKA是一個周期性蛋白,通過參與中心體的復制分離和成熟在細胞周期中起著重要作用,其高表達可使多種抑癌蛋白失活同時激活多種致癌基因的表達[18]。CCNB1和CCNB2均屬于細胞周期蛋白(Cyclin)家族成員,研究[3,19-23]表明:CCNB1基因在乳腺癌、卵巢癌和直腸癌等多種腫瘤組織中同樣高表達,在結直腸癌和肺癌組織中CCNB2高表達能加快細胞周期進程、促進細胞異常增殖。未來有望通過靶向CCNB1和CCNB2基因的治療方法來抑制腫瘤細胞增殖。DTL介導細胞泛素化修飾及降解,與多種腫瘤的發(fā)生發(fā)展有密切關聯,研究[24]表明:DTL通過介導雌激素促進EC細胞侵襲遷移和上皮-間質轉換,其機制可能為EC診斷及治療提供新思路。CEP55是中心體相關蛋白家族成員,在中心體依賴相關的細胞功能如細胞周期進展、胞質分裂中心體復制等過程中發(fā)揮重要作用[25]。CDK1可與細胞周期蛋白B(Cyclin B,CCNB)組成復合物即有絲分裂促進因子(mitosis-promoting factor,MPF),促使細胞周期從G2期進入M期,是哺乳動物細胞增殖所必需的基因,CDK1活性失調會導致染色體破裂和細胞死亡[26]。KIF11是一種經典的分子馬達,在染色體的分離和雙極紡錘體的組裝過程中發(fā)揮重要作用,與細胞增殖有密切關聯[27]。MELK是一種周期依賴性激酶,研究[28-29]顯示:MELK在多種腫瘤細胞中高表達,并與腫瘤侵襲和轉移有密切關聯。BUB1是紡錘體的重要組成部分,其主要功能是監(jiān)控并保證有絲分裂過程的進行[30]。
式中,dij 是i和j之間的距離,Rj是i搜索區(qū)(dij
高度有序的細胞周期活動是細胞維持正常代謝與增殖過程的保證,當細胞周期[31]調控發(fā)生異常,例如周期相關蛋白、復合蛋白或細胞周期監(jiān)測點等細胞周期調控網絡發(fā)生異常時,會導致細胞增殖失控,含有異常受損DNA的細胞無法凋亡,最終導致細胞無限增殖和腫瘤形成[32]。本研究基于微陣列數據集,通過生物信息學技術分析了EC發(fā)生發(fā)展相關的易感基因和調控網絡,富集分析和PPI網絡分析表明:細胞周期相關的基因和通路在EC發(fā)生發(fā)展過程中起重要作用,PPI網絡中篩選出的關鍵基因絕大多數與細胞周期調控有關聯,由此可見,細胞周期失調是EC發(fā)病的主要機制。本研究結果為EC相關的發(fā)病機制、診斷、治療和預后判斷等研究提供了重要依據。結合進一步實驗驗證,以上參與EC發(fā)病的關鍵分子有望成為具有臨床價值的EC生物標志物和治療靶標。