王海清,左 文,陳睦虎,胡迎春,楊蕊萍,鐘 武
膿毒癥是指機體對感染的反應失調而導致危及生命的器官功能障礙[1]。病情危重時可導致多器官功能障礙綜合征(MODS)和(或)循環(huán)衰竭,是臨床上常見的一種急危重癥[2~5]。每年全球有超過180萬重癥膿毒癥的病例,其發(fā)病速度快,臨床病死率高,若合并感染性休克,病死率約80%[6]。目前認為,微循環(huán)障礙是發(fā)生MODS甚至死亡的主要因素,其中內皮細胞以及相關促凝效應等起決定性作用,但其具體分子機制仍不明確。因膿毒癥是機體應對感染所發(fā)生的一系列復雜的免疫反應,早期主要表現(xiàn)為強力抗感染,晚期主要表現(xiàn)為劇烈而持久的免疫抑制反應,這表明多種生物標記物或許可以用來早期識別膿毒癥[7]。而膿毒癥治療效果差的根本原因在于目前膿毒癥發(fā)病機制尚不清楚,用于膿毒癥臨床診斷及判斷療效的指標欠缺,尤其需要獲取其早期診斷指標和治療作用的關鍵靶點。隨著基因芯片技術的發(fā)展及應用,找出的差異基因成千上萬,如何在眾多差異基因中篩選出對疾病起關鍵作用的基因已成為技術瓶頸,生物信息學技術在此基礎上應運而生,可以幫助研究者快速找到核心基因群。
本文擬基于GEO基因表達數據,全面分析膿毒癥疾病狀態(tài),從而構建基因網絡,并篩選潛在的關鍵分子靶點,這些分子靶點可能為我們尋找膿毒癥發(fā)病機理提供新的見解,或許可以用于早期診斷膿毒癥并為臨床治療膿毒癥提供新思路。
GEO數據庫隸屬于美國國立衛(wèi)生研究院的美國國立生物技術信息中心(NCBI),是目前全球最大、最完整的公共基因表達數據資源[8]。基因表達譜GSE28750下載于GEO數據庫,種屬為人類,芯片平臺GPL570[HG-U133_Plus_2]Affymetrix Human Ge?nome U133 Plus 2.0 Array。該芯片數據包括10例膿毒癥患者及19例健康人的基因表達陣列數據[9]。
GCBI(Gene-Cloud of Biotechnology Information,網址:https://www.gcbi.com.cn)是我國研發(fā)的基于R語言的在線分析軟件,能便捷的對芯片數據進行相關處理。通過GCBI軟件,對基因芯片數據先進行對數化標準處理以利于分析,再篩選差異表達基因,篩選條件為:①P<0.01;②差異倍數≥2。
基因本體論(GO)數據庫從功能、參與的生物途徑及細胞中的定位三個方面對基因產物進行了標準化描述(即對基因產物進行了簡單注釋)。通過GO富集分析可以大致明了差異表達基因在哪些生物學功能、途徑或者細胞定位方面進行富集[10]。通過GC?BI平臺對上傳的差異表達基因進行GO分析,選擇差異最顯著的10個功能進行排序并分析。
KEGG(京都基因與基因組百科全書,網址:http://www.genome.jp/kegg/)是日本京都大學生物信息學中心的Kanehisa實驗室建立的以基因組、化學和系統(tǒng)功能信息為基礎、全面展示生物及細胞所包括的生物學信息的數據庫,它可以預測蛋白質在各種細胞活動中所起作用并將其繪制成網絡。通過對差異表達基因進行信號通路分析,可以了解疾病狀態(tài)下顯著改變的代謝通路,這對于實驗機制的探索意義重大?;贙EGG數據庫對差異表達基因進行基因信號通路富集分析,選擇差異最顯著的10個功能進行排序并分析。
基因信號網絡分析是基于KEGG數據庫中蛋白和蛋白之間的相互作用關系而構建的基因間相互作用的網絡圖。它解構了KEGG數據庫,克服了KEGG-Pathway數據庫中基因間相互作用關系受限于某一Pathway的局限,因而,基因信號網絡是在整個KEGG-Pathway數據庫中篩選某個蛋白的上游及下游蛋白。對差異表達基因使用基于KEGG的GC?BI平臺進行基因信號網絡分析,并繪制成網絡,以便了解差異基因之間的相互調控關系。
共表達網絡分析通過基因表達的相似性簡單直觀的分析基因產物可能存在的相互作用關系,從而更深入的發(fā)現(xiàn)關鍵調控基因及其相互作用脈絡。對差異表達基因使用GCBI平臺進行共表達分析,并繪制成網絡,推測其潛在的關鍵靶點。
對數化標準處理前后的膿毒癥組和健康對照組基因芯片數據結果(見圖1~2),可知本研究標本經對數化處理后數據均一性較好,兩組之間具有可比性。
圖1 樣本芯片數據對數化標準處理前
通過對兩組數據的差異表達基因進行篩選,共獲得2 457個差異表達基因,與對照組相比,膿毒癥組上調基因1 282個、下調基因1 175個(見圖3)。由圖可知,我們篩選的差異基因能較好的區(qū)分出2個組。
圖3 差異表達基因聚類圖
采用GCBI平臺對差異表達基因進行GO功能富集分析,其中最顯著的10功能依次為:T細胞共刺激、T細胞受體信號通路、細胞表面受體信號通路、免疫反應、翻譯、固有免疫反應、血液凝固、基因表達、小分子物質代謝過程、信號轉導(見圖4)。
圖2 樣本芯片數據對數化標準處理后
圖4 差異表達基因G0分析結果圖
表1列出了15個差異最顯著的富集通路,其主要涉及凋亡、細胞周期、免疫反應、信號轉導等。
圖5顯示了前20個網絡的中心節(jié)點基因。由圖可知,GNAI3、PIK3CB、MAPK14、IL8為其關鍵基因。
使用GCBI對差異表達基因進行共表達分析,其中前216個節(jié)點共表達圖見圖6,由圖可發(fā)現(xiàn),上調和下調基因分別呈聚集性分部,符合共表達理論。其中前15個節(jié)點名稱、功能見表2。
膿毒癥是臨床常見且死亡率極高的急危重癥,是一個復雜的病理過程,在此過程中,病原微生物作為始發(fā)因素,其后多種促炎細胞因子、抗炎細胞因子、炎性細胞、信號通路等共同參與其中[9]。已有研究者報道膿毒癥的發(fā)生機制,但很少涉及其分子標記物,事實上,分子生物標記物對于膿毒癥的診斷、監(jiān)測及預后具有很大的潛力[11]。
表1 差異表達基因pathway分析
圖5 差異表達基因信號網絡分析
圖6 差異表達基因前216個節(jié)點共表達圖
表2 差異表達基因共表達顯著差異前15個節(jié)點
本研究中通過使用微陣列的方法對膿毒癥組及健康對照組基因芯片進行分析比較,共篩選出2 457個差異表達基因,其中上調基因1 282個,主要涉及細胞膜穩(wěn)定性、基因轉錄及翻譯過程、物質代謝的調節(jié)、免疫反應等方面;下調基因1 175個,主要涉及免疫反應、信號轉導、細胞增殖、細胞凋亡等過程。通過對差異表達基因進行GO分析發(fā)現(xiàn),二者差異最顯著的功能主要涉及固有免疫反應、信號轉導、物質代謝、基因的轉錄及翻譯等方面。通過對二者進行pathway分析發(fā)現(xiàn),其差異最顯著富集通路仍主要涉及物質代謝、基因表達、免疫反應等方面。將基因間相互作用形成網絡后可見膿毒癥組及健康對照組之間差異也主要集中在信號轉導、物質代謝、免疫反應、基因表達等方面,其中MAPK signaling pathway在網絡圖中有38個上游信號通路、5個下游信號通路,Apoptosis有27個上游信號通路、3個下游信號通路,以此推測膿毒癥患者死亡率高可能和免疫細胞凋亡調節(jié)異常有關。
其次,通過対差異表達基因進行了基因信號間相互作用分析,分析發(fā)現(xiàn):GNAI3上游有11個基因與其聯(lián)系,下游有9個基因與其聯(lián)系,GNAI3功能主要涉及細胞周期、血液凝固、突觸傳遞、細胞分裂等[12],推測其為膿毒癥發(fā)病過程中的關鍵基因;PIK3CB上游有24個基因與其聯(lián)系,下游有6個基因與其聯(lián)系,其功能主要涉及內皮細胞增殖、自噬的正調節(jié)、血液凝固、適應性免疫應答等[13-15],推測PIK3CB為膿毒癥發(fā)病過程中的關鍵基因;MAPK14上游有15個基因與其聯(lián)系,下游有8個基因與其聯(lián)系,主要對炎癥反應中細胞因子產生的調節(jié)、在DNA損傷反應中的信號轉導、RNA聚合酶Ⅱ啟動子轉錄的正調控等[16],也可能為膿毒癥發(fā)病過程中的關鍵基因;IL8上下游分別有4個及5個基因與其聯(lián)系,其功能主要參與信號轉導、抗感染、中性粒細胞的活化等[17],推測此基因也可能為膿毒癥發(fā)病過程中的關鍵基因。
對差異表達基因的共表達分析發(fā)現(xiàn)GYG1、SERPINB1、SAMSN1、ATP11B 這四個基因分別有39、39、33、33個基因與其他基因表達呈相同趨勢,這些基因的作用主要體現(xiàn)在物質代謝、免疫反應、細胞周期、信號轉導等方面[18-20],或許為膿毒癥的關鍵基因。
目前,生物信息學已被廣泛應用于建立各種生物數據庫并對其進行管理、研發(fā)數據庫接口及檢索工具、從海量數據中提取新知識等方面,更重要的是,生物信息學還可以研究基因表達過程中的聚群關系,并從中提取其調控網絡以及代謝途徑方面的信息,進而從整體水平模擬細胞內的全部相關的生化反應,從而在亞細胞水平闡釋生命活動。GCBI是我國研發(fā)的一款發(fā)掘生物信息學信息的軟件。
本研究通過GCBI使用基因信號間相互作用網絡分析聯(lián)合共表達網絡分析的方法篩選膿毒癥關鍵基因,既克服了基因信號間相互作用分析缺乏創(chuàng)新性和共表達網絡分析可靠性欠佳的缺點,又保留了基因信號間相互作用分析結果真實可靠和共表達網絡分析創(chuàng)新性強的優(yōu)點,二者相互結合能夠更好的篩選出受實驗因素影響較大的核心基因。但生物信息學仍然需要分子生物學實驗以驗證其準確性以及后續(xù)基因、蛋白功能,生物信息學分析加進一步實驗驗證必將成為以后科研流行趨勢。
1. Singer M,Deutschman CS,Seymour CW,et al.The third international consensus definitions for sepsis and septic shock(sepsis-3)[J].JAMA,2016,315(8):801-810.
2. Ince C.The microcirculation is the motor of sepsis[J].Crit Care,2005,9(4):13-19.
3. M,C,Bellamy.Wet,dry or something else[J].Br J An?aesth,2006,97(6):755-757.
4. 王靜,李熙鴻.膿毒癥發(fā)病機制的研究進展[J].實用兒科臨床雜志,2012,27(10):786-789.
5. 胡迎春,張千,鐘武,等.大鼠膿毒血癥相關基因篩選與生物信息學分析[J].瀘州醫(yī)學院學報,2013,36(1):80-82.
6. Galley HF.Oxidative stress and mitochondrial dysfunction in sepsis[J].Br J Anaesth,2011,107(1):57-64.
7. Sutherland A,Thomas M,Brandon RA,et al.Develop?ment and validation of a novel molecular biomarker diag?nostic test for the early detection of sepsis[J].Crit Care,2011,15(3):R149.
8. 端木欣欣.基于GEO數據庫篩選鎘致前列腺癌主要環(huán)境應答基因的研究[D].北京:中央民族大學,2014:4-8.
9. 欒德琴,白云峰,包文斌,等.基因本體論研究進展及在生物信息數據庫中的應用[J].江蘇農業(yè)科學,2009,(4):14-16.
10. Roos DS.Computational biology.Bioinformatics--try?ing to swim in a sea of data[J].Science,2001,291(557):1 260-1 261.
11. Gohla A,Klement K,Piekorz RP,et al.An obligatory requirement for the heterotrimeric G protein Gi3 in the antiautophagic action of insulin in the liver[J].PNAS,2007,104(8):3 004-3 008.
12. Lin ZQ,Zhou PZ,Von Gise A,et al.Pi3kcb links Hip?po-YAP and PI3K-AKT signaling pathways to promote cardiomyocyte proliferation and survival[J].Circ Res,2015,116(1):35-U98.
13. Chen HB,Mei L,Zhou LZ,et al.PTEN restoration and PIK3CB knockdown synergistically suppress glioblas?toma growth in vitro and in xenografts[J].J Neurooncol,2011,104(1):155-167.
14. Yan F,Tan XX,Wan WF,et al.ErbB4 protects against neuronal apoptosis via activation of YAP/PIK3CB signal?ing pathway in a rat model of subarachnoid hemorrhage[J].Exp Neurol,2017,297(297):92-100.
15. Meng W,Veluchamy A.A genome-wide association study suggested that the mitogen-activated protein kinase 14 gene(MAPK14)is associated with diabetic foot ulcer[J].The British journal of dermatology,2017,10(2):157-158.
16. Dakal TC,Kala D,Dhiman G,et al.Predicting the func?tional consequences of non-synonymous single nucleotide polymorphisms in IL8 gene[J].Sci Rep,2017,7(1):145-149.
17. Fanin M,Torella,Savarese M,et al.A GYG1 gene mu?tations in a family with polyglucosan body myopathy[J].Neurol Genet,2015,1(3):211-216.
18. Glicksman M,Asthana A,Bethesda,et al.Plasma ser?pinB1 is related to insulin sensitivity but not pancreatic β-cell function in non-diabetic adults[J].Physiol Rep,2017,5(5):201-210.
19. Yan Y,Zhang L,Xu T,et al.SAMSN1 is highly ex?pressed and associated with a poor survival in glioblastoma multiforme[J].PLoS One,2013,8(11):57-63.
20.H MS,S RA,W PA,et al.Reanalysis of ATP11B,a type IV P-type ATPase[J].J Biol Chem,2002,277(12):9 736-9 740.