張強 王悅 李美秋 鄭健
組學是基于高通量分析的集合生物學系統(tǒng),根據(jù)分析目標的不同可分為基因組、轉錄組、蛋白組、代謝組和RNA組等,以整體角度去研究生物體內DNA轉錄、RNA翻譯、蛋白質修飾和代謝產物的功能等情況。目前多組學的發(fā)展也實現(xiàn)了各個數(shù)據(jù)的互補,解決了人類利用單一組學無法解決的問題,使人類對生物體的表達信息研究更透徹。
基因組學是由美國科學家Thomas Roderick于1986年提出的,指對所有基因進行基因組作圖(包括遺傳圖譜、物理圖譜、轉錄本圖譜)、核昔酸序列分析、基因定位和基因功能分析的一門科學[1]。自21世紀以來,作為世界上最有影響力的學科,并不只限于生物學的范疇,而是與其他學科相互融合,不斷發(fā)展新技術、新領域。通過基因組測序和DNA微陣列技術可以更深地了解一個物種的分子進化、系統(tǒng)發(fā)育和基因調控等特點。其中基因組測序的核心:第二代測序技術(NGS),它能夠捕捉新合成的末端的標記來確定DNA的序列,可以快速高效的鑒別單核苷酸多態(tài)性(SNPs)標記、插入和缺失(InDel)標記等[2]。Peterson等[3]利用雙酶切系統(tǒng)的基因組測序技術在鹿鼠的2個姐妹物種的雜交群體中共獲得了1 000多個SNPs,且具有固定差異,并利用1 000多個SNPs構建了遺傳圖譜。DNA微陣列則可以高通量檢測分析DNA結合蛋白與大量DNA分子相互作用,用以確定轉錄因子的DNA結合親和性、特異性及序列偏好性[4]。Wong等[5]將DNA微陣列技術與最新的一種轉錄因子DNA結合特異性高通量表征技術-SELEX-Seq相結合,表征了轉錄因子NF-κB的9種二聚體與各種11-mer序列的結合親和性,進一步鑒定基因調控區(qū)中與性狀、疾病相關的重要SNP。
20世紀90年代初,以美國為主導的人類基因組計劃開始興起;1998年,中國在上海和北京相繼成立了人類基因組南方研究中心,1999年,中國參加人類基因組計劃(HGP),成為繼美、英、日、德、法之后第六個國際HGP參與國,近年來,水稻基因組、人類基因組等兩個重大科技項目以及由此在中國逐步實施的一系列基因組和功能基因組測序與研究工作都實現(xiàn)了跨越式的發(fā)展[6]。在未來10~20年間里,人類對基因組學的研究進入后基因組研究階段,并嘗試解讀所有模式生物、模式基因組和代表生物的遺傳密碼,也將更容易、更完全地理解基因對人類生、老、病、死的影響,根據(jù)相關致病基因的定位、排序等信息,就能夠找到包括腫瘤以及非腫瘤疾病的許多頑癥病因,有針對的設計和篩選新藥,或者改變基因在染色體上的線性排列,糾正基因組中可能出現(xiàn)的遺傳缺陷,研制出相應的藥物,治療相關疾病。
轉錄組學是功能基因組學研究的重要組成部分,是一門在整體水平上研究細胞中所有基因轉錄及轉錄調控規(guī)律的學科[7]。作為率先開展起來的一門技術已經在生物學研究中得到了廣泛的應用,包括動植物和微生物基礎研究、臨床診斷和藥物研發(fā)等領域。由于基因調控復雜、測序成本高,對轉錄組學的分析只能局限在極少數(shù)基因的研究,但近幾年來隨著分子生物學的快速發(fā)展,使轉錄組學技術得到了巨大的進步,主要有基于雜交的基因芯片技術和基于測序的基因表達系列分析技術(SAGE)、大規(guī)模的平行測序技術(MPSS)、RNA測序技術(RNA-sep)?;蛐酒抢眉t、綠熒光染料分別標記實驗樣本和對照樣本cDNA,將樣本混合后與基因芯片雜交,可顯示實驗樣本和對照樣本基因的表達強度,主要應用于基因表達檢測、尋找新基因和基因突變以及基因文庫作圖等方面研究;SAGE技術是一種可以定量并同時分析大量轉錄本的方法,而MPSS是在SAGE的基礎上進行改進,在cDNA上添加了接頭,是新一代測序發(fā)展的先驅;RNA-sep技術則是先將細胞中的所有轉錄產物作為cDNA 文庫,然后將cDNA文庫中的DNA隨機剪切為小片段,再在cDNA兩端加上接頭,并利用新一代高通量測序儀測序,直到獲得足夠的序列,最后將所得序列通過比對或從頭組裝形成全基因組范圍的轉錄譜[8]。
最初Lockhart等[9]在研究酵母基因表達時提出了轉錄組的概念,近幾年研究范疇進一步擴大,將組學概念廣泛應用于腫瘤、代謝工程領域和藥用植物研究中,如利用RNA測序分析技術研究抽煙對肺癌的影響、發(fā)現(xiàn)蔬菜作物轉錄組的重要基因以及用蛋白質藥物等產品生成大量動物細胞系等。轉錄組學也將為疾病控制和新藥開發(fā)、作物和畜禽品種的改良提供新思路,為人類解決健康問題、食物問題、能源問題和環(huán)境問題提供新方法。隨著各種轉錄組學研究技術的進步,特別是測序技術的應用,轉錄組學的探索已經進入了全新的階段。
蛋白質組學是以蛋白質組為研究對象,從整體、動態(tài)和定量的角度去研究基因的功能,是后基因組計劃的一個重要組成部分[10]。與基因組學和轉錄組學相比,蛋白組學的組成更加龐大和復雜,能幫助人類從更多的角度去探究生命的本質,因此受到國內外高度重視。蛋白組學的發(fā)展離不開相關實驗技術的進步,不僅可以分離、鑒定和篩選相關蛋白質,還可以對制得的蛋白樣品進行分析,主要核心技術包括雙向電泳、酵母雙雜交、蛋白質芯片及質譜分析。雙向電泳是蛋白質組學研究中的重要分離手段,能夠提高細胞內蛋白質分離的分辨率,并反映機體的蛋白質表達水平及轉譯后的修飾狀況,具有簡便、快速、高分辨率等優(yōu)點,但同時也有自動化程度低,重復性差,以及對過大和過小分子量的蛋白質、低豐度蛋白質、極酸或極堿和難溶的蛋白質如膜蛋白等分離困難的缺點[11,12]。酵母雙雜交技術是鑒定蛋白互作最有效和最廣泛的分子生物學技術,該技術能直接作用于活細胞,檢測細胞內蛋白質互作,具有成本低、易操作、可達到全基因組水平、能進行品種間的互作鑒定等諸多優(yōu)點[13]。蛋白質芯片是一種高通量的蛋白功能分析技術,用于蛋白質表達譜的分析,研究蛋白質與蛋白質的相互作用,篩選藥物作用的蛋白靶點,具有高通量、功能廣、特異性和靈敏度高等特點[14]。質譜分析是唯一可以確定分子質量的方法。在高分辨率質譜儀中,能夠準確測定質量,而且可以確定化合物的化學結構式,也可以測定正確蛋白質分子的質量,進行蛋白質分子鑒定、修飾和相互作用的研究[15]。
Wilkins等首次提出了蛋白質組的概念,2001年,蛋白質組學成為僅次于干細胞研究的六大熱點之一[16,17]。近幾年國內外許多學者利用蛋白組學技術廣泛應用于植物學、食品科學以及疾病研究等。Jiao等[18]對陸地棉幼苗根系在響應鹽脅迫過程的分析中,闡明抗壞血酸氧化酶、谷胱甘肽轉移酶的同源蛋白表達顯著上調。Mao等[19]對不同脂肪含量的牛肉進行蛋白質組學分析,結果表明,HSPB1蛋白(一種熱休克蛋白)的表達具有差異。SPRAGGINS團隊利用MALDI MSI進行腎細胞癌組織成像,得到高分辨率的蛋白質成像圖,結果顯示腫瘤和正常區(qū)域不同的分子分布,表明MSI可以分析組織特異性分子的能力[20]。因此,蛋白質組的研究已開辟了一個廣大的生命科學的全新領域,使人類對生命的本質和發(fā)展過程的認知達到一個新的高度。
代謝組學是全面系統(tǒng)地研究生物樣本或器官小分子代謝產物的科學,可利用現(xiàn)代的分析技術針對在特定時間內對生物體某一特定細胞、血液等代謝產物進行定性、定量的多元化檢測分析,從而達到對植物、動物等組織進行無損傷的動態(tài)研究[21]。近年,代謝組學研究分析方法愈加先進,包括磁共振技術(NMR)、質譜、氣相色譜-質譜聯(lián)用(GC-MS)和液相色譜-質譜聯(lián)用(LC-MS)等。NMR是當前代謝組學研究中的主要分析技術,能完成代謝產物中大多數(shù)化合物的檢測,所產生的波譜可檢測血漿、尿液等生物基質中一些特殊物質的微妙變化;質譜技術則具有較高的靈敏度和專屬性,能夠高效的分析和鑒定多種化合物;GC-MS可以同時分析幾百個化學性質不同的化合物,具有較高的靈敏度和分辨率,可定性定量分析代謝產物;LC-MS相對于GC-MS能夠精密地分析高極性和高相對分子質量的化合物,從而檢測和鑒定一些復雜的代謝產物[22,23]。
代謝組學是是于基因組學、轉錄組學和蛋白組學后的一門新的組學研究技術,最早是由英國理工大學Jeremy Nicholson提出,2000年由德國Fiehn對這一概念進行完善[24],目前廣泛應用于動物、植物、微生物、醫(yī)學等領域。Rohart等[25]利用NMR對大白豬、長白豬和皮特蘭豬的血漿進行代謝物檢測,結果顯示肌酸酐、纈氨酸、檸檬酸、β-丙氨酸、乳酸、丙氨酸和異亮氨酸等代謝物與豬的瘦肉率性狀相關,可以用于豬瘦肉率預測;Francini等[26]利用NMR技術分析不同品種的蘋果干中的多酚類物質,發(fā)現(xiàn)了蘋果干中兒茶素、綠原酸等活性物質和其抗氧化能力是區(qū)別其品種的判斷依據(jù);Orikiiriza[27]等利用NMR技術對惡性瘧原蟲患者血漿進行檢測,發(fā)現(xiàn)其宿主脂代謝發(fā)生紊亂;熱比姑麗等[28]采用1H-NMR技術研究發(fā)現(xiàn)銀屑病患者血清低密度脂蛋白、糖蛋白及酪氨酸含量較健康志愿者顯著降低,乳酸、肌酸及苯丙氨酸水平顯著升高,提示銀屑病發(fā)病存在氨基酸、脂類及其一些小分子化合代謝紊亂。綜上所述,隨著代謝組學技術快速發(fā)展,應用范圍會更加廣泛,人們將會在臨床疾病診斷、藥學及營養(yǎng)學中大大受益,進而造福人類。
RNA組學是以基因組學研究技術為基礎,探索生命個體的細胞中非編碼RNA的結構和功能,并通過RNA的轉錄以及翻譯成蛋白質等過程去揭示生命個體的遺傳信息,進一步解析人類基因組的結構和功能[29]。近年來,人們從參與蛋白質編碼的RNA逐漸深入到基因組中的非編碼RNA的研究,非編碼RNA主要包括參與蛋白質翻譯的tRNA和rRNA、染色體復制中的端粒RNA以及在轉錄水平前后起重要作用的miRNAs等。目前,RNA組學主要核心技術有miRNA治療干預技術和RNA干擾等。miRNA是一段進化上保守的、長度為19~25個核苷酸的非編碼單鏈RNA,它在人類腫瘤疾病中異常表達,阻礙了對許多疾病的治療,所以對miRNA的表達調控進行一定程度的干預已成為RNA組學研究的熱點[30]。RNA干擾技術則是以雙鏈RNA為基礎,降解外源性和內源性的mRNA,從而使機體外源基因和病毒基因等沉默,達到機體的特定核苷酸序列不受侵害[31]。
近年來,隨著國內外的RNA組學技術逐步發(fā)展和進步,對非編碼RNA研究也在腫瘤診斷和治療、農業(yè)和疾病預防等領域廣泛應用。姜妍等[32]使用兩種模式的干預miRNA對結直腸癌手術患者進行觀察和對比中發(fā)現(xiàn),使用常規(guī)模式和FTS-CIS模式對miRNA進行干預后可使結直腸癌患者病情恢復,并且能夠降低并發(fā)癥發(fā)生率。Guo等[33]以小菜蛾為模型,利用RNA干擾技術研究昆蟲的耐藥性,發(fā)現(xiàn)當沉默ABC轉運蛋白基因時,可降低小菜蛾幼蟲對殺蟲劑的毒素敏感性,從而降低小菜蛾的抗藥性。Linke等[34]引入了治療禽流感病毒的新方法,利用小干擾RNA的細菌載體靶向禽類黏膜上皮細胞,并使用小干擾RNA來對抗禽流感中的核蛋白及聚合酶酸性蛋白,發(fā)現(xiàn)這些抗病毒載體使病毒滴度降低了10 000倍。綜上所述,RNA組學作為基因組學之后的新興科學,在生命個體中細胞的分化和發(fā)育、表觀遺傳中RNA的調控以及人類疾病發(fā)生的診斷和治療等具有重大的意義。
微生物組學是以特定生物樣品中微生物群體為研究對象,以功能基因篩選和測序分析為研究手段,對微生物多樣性、種群結構、進化關系、基因功能等及其與環(huán)境之間的相互關系進行研究的微生物研究方法,揭示了微生物多樣性與人和生態(tài)穩(wěn)定性之間關系[35],近十幾年里,微生物組學多利用擴增子測序技術檢測樣本中微生物的種類及構成、微生物群落的多樣性及不同微生物的組成差異等。擴增子測序是利用PCR反應的引物來擴增基因組的特定區(qū)域,靶向地捕獲目標區(qū)域的DNA,達到目的DNA片段的富集目標,最后針對擴增產物(也被稱為擴增子)進行高通量測序,分析序列中的遺傳變異等信息,主要包括16SrRNA標記和轉錄間隔區(qū)(ITS)等方法[36]。16sRNA為核糖體RNA中的一部分,它具有種內基因序列相對一致而種間差異較為明顯的特征,在全部細菌染色體基因組中表達,并且能夠調控生物蛋白質的合成,是研究細菌系統(tǒng)分類中有效的分子標記[37];ITS鑒定是指對ITS序列進行更準確的DNA測序,然后將ITS序列與已知真菌ITS序列比對,從而分析種屬間和菌株間的差異的一種方法,目前廣泛應用于真菌不同種屬的系統(tǒng)發(fā)育分析[36]。
早在19世紀巴斯德創(chuàng)立了細菌學,逐漸有了滅菌的意識和主動利用單一微生物的方法[38]。20世紀以來人們對微生物的形態(tài)結構、生化和遺傳特性、基因調控等有了更深的了解,研究以微生物發(fā)酵為主的生物技術,近年來隨著微生物測序的方法不斷進步,使得微生物組學廣泛應用于醫(yī)學、農業(yè)、工業(yè)及生態(tài)環(huán)境等方面。Brown等[39]應用16SrRNA分析發(fā)現(xiàn),正常健康個體腸道中富含產乳酸和丁酸的細菌群,這些細菌可合成大量黏蛋白以維持腸道健康;張紀紅[40]發(fā)現(xiàn)微生物肥料可以釋放養(yǎng)分供給植物營養(yǎng)以刺激植物的生長,同時還具有抑制病菌和改良土壤等功能;Moita等[41]表明通過微生物合成的一種細胞內聚酯-PHA可以克服純培養(yǎng)技術的一些缺點,從而顯著地降低了生產成本,增加了經濟上的競爭力。因此,微生物組學的快速發(fā)展將在疾病控制、農作物生長及工業(yè)生物技術方面發(fā)揮重要作用,未來也會與基因組學、代謝組學等共同推動組學的發(fā)展與進步。
糖組學被定義為單一生物體中全部聚糖的總稱,是研究糖組結構與功能的科學,主要研究聚糖組的分離與純化、糖鏈組的分離、糖鏈的結構解析及糖鏈性質和功能。聚糖組的分離與純化主要分為:(1)糖蛋白組的親和層析法、透析法、濾膜超濾法化;(2)蛋白聚糖組的凝膠過濾層析法、凝集素親和色譜;(3)糖脂組的柱層析色譜法、薄層層析印跡法等;糖鏈組的分離則是將糖鏈從糖蛋白、蛋白聚糖或糖脂上有效分離下來并進行高效富集,然后對糖鏈結構進行定量分析,其主要包括親水色譜法和固相萃取技術等;糖鏈的結構解析和定量是糖組學的核心內容,主要是利用生物質譜分析、凝集素芯片技術等去獲取某一特定類型糖鏈組中所含有的所有糖鏈的結構和含量信息[42]。目前,糖組學技術可應用于乳腺癌和腸癌等一些常見癌癥的分析,但由于糖鏈結構的復雜性,糖組學技術始終沒有進展性的突破,與基因組和蛋白組相比仍停留在起始階段,相信隨著研究的深入,糖組學的發(fā)展會隨其他組學達到新的高度。
影像組學是通過計算機軟件,從醫(yī)學影像中得到大量有代表的影像,使用統(tǒng)計學的方法,選擇出最有價值的影像組學圖像,用來分析臨床信息、疾病的定性、腫瘤分期、療效評價和預后預測等[43]。這一概念誕生不足八年,是基于常規(guī)影像學的基礎上,通過對影像學數(shù)據(jù)進行標準化獲取,然后進行分割和重建圖像,再進一步篩選有特征有代表的圖像,最后應用臨床并且共享數(shù)據(jù)庫。2012年,荷蘭學者Lambin首次提出影像組學概念;2014年,Gillies[44]在北美放射學會提出影像組學可以預測腫瘤遺傳異質性的程度。因此近年影像組學主要應用于腫瘤診斷、治療和預后等方面,包括肺癌、乳腺癌、頭頸癌、直腸癌、腦腫瘤、前列腺癌、食管癌、肝癌等多種腫瘤疾病。影像組學在MRI、CT等一些超聲技術中也有初步研究,如Zhang等[45]在超聲彈性圖像中提取364個高通量特征用于乳腺腫瘤鑒別診斷,準確率為88%,靈敏度為86%,特異度為89%。因此,影像組學通過醫(yī)學成像和超聲技術對目前癌癥診斷和治療等起重要作用,未來也將會對臨床醫(yī)學產生深遠的影響和巨大的變革。
脂質組學是對脂質分子種屬及其生物功能的全面描述,主要研究與蛋白質表達有關的脂質代謝及其功能,它是代謝組學的一個重要分支,并且屬于生命科學的范疇[46]。由于脂類化合物種類繁多,生物樣品基質復雜,因此首先要使用固相萃取、超臨界萃取等技術提取樣品,然后利用MS、LC-MS等儀器對其全脂分析、目標分析以及成像分析,最后使用SECD等軟件對獲得的生物標志物進行信息處理[47]。近年由于脂質組學的研究方法取得了突破性進展,廣泛應用于疾病診斷和食品科學領域等。如于莉[48,49]通過脂質組學技術對小細胞肺癌患者進行研究,發(fā)現(xiàn)與對照組相比早期診斷指標中磷脂酸在小細胞肺癌的男女患者中都顯著增加,而在非小細胞肺癌患者中含量沒有明顯的變化,推測出磷脂酸的增加可能是小細胞肺癌的特異性標志物;以及借助HPLC與MALDI-TOF-MS聯(lián)用技術,定量分析了魚肉中PC的總量,證明PC可以用作指示水體中的鎘對于鯽魚 毒害作用的生物標志物??傊?,通過脂質組學儀器分析方法能夠推動脂質組學研究的深入研究,為生命科學領域的進步和促進人類健康提供有力的科學支撐。
近年來,以基因組學、轉錄組學、蛋白組學和代謝組學等為基礎、以糖組學、影像組學和脂質組學等為新興發(fā)展的科學的組學技術,明確了由DNA轉錄為RNA,再翻譯為蛋白質形成代謝物的系統(tǒng)網絡,并且也廣泛應用于各個領域,解決了人類以往無法解決的問題,然而,組學研究雖然能得到更詳細的數(shù)據(jù),但是通過多組學聯(lián)用得到更加充分的核心數(shù)據(jù)并且加以驗證等都是人類后續(xù)要解決的問題。