全基因組測序技術的出現(xiàn)對醫(yī)學所有領域來說都是一次革命性的進步。對于每個生物個體來說,基因組包涵了其整個的遺傳信息。全基因組測序技術能夠全面、精確地分析基因組的堿基序列,從而破解其所包含的信息,揭示基因組的復雜性、多樣性。通過對不同個體或群體的比對,可以發(fā)現(xiàn)其中的遺傳特性或突變,進而加深對各種疾病發(fā)生、發(fā)展的了解,進而制定相應的應對方法。全基因組測序技術將會使人類對自然界生物及自身的了解更加深入并給人類的健康帶來實際利益。
1 全基因組測序技術的歷史和發(fā)展
在DNA測序技術出現(xiàn)之前,蛋白質與RNA的測序就已見報道。Sanger[1]于1949年測定了胰島素的兩條肽鏈氨基末端序列。Edman[2]同年報道了蛋白質的氨基端測序技術。Sanger[3]1965年完成了大腸桿菌120個核苷酸的測定。對DNA測序最早出現(xiàn)在1954年,Whitfeld等提出了降解法[4],由于操作復雜,該方法并沒有被廣泛應用。成熟的DNA測序技術出現(xiàn)于上世紀70年代中期, Maxam和Gibert[5]報道了通過化學降解法測定DNA序列。同年Sanger和Nicklen[6]報道了雙脫氧鏈終止序列測定法。上世紀80年代后期以來陸續(xù)出現(xiàn)了其他的一些測序方法:Hyma的焦磷酸測序法 [7]、Pfeifer的連接酶測序法[8]等。
DNA測序經歷了三代的技術發(fā)展。以Sanger的雙脫氧鏈終止法和Maxam化學降解法為基礎發(fā)展而來的各種DNA測序技術被稱為第一代測序技術。特點是易掌握、精確度高,缺點是操作過程復雜,耗時長,費用高昂。進入21世紀后,隨著現(xiàn)代生物技術及計算機技術的發(fā)展,在第一代測序技術的基礎上不斷改進,逐漸形成了以高通量測序為特點的第二代技術,一次能對幾十萬到幾百萬條 DNA 分子進行序列測序,使得對一個物種的基因組或轉錄組測序變得方便易行。第二代測序技術保持了高準確度,大大降低了測序成本并極大地提高了測序速度。以單分子測序技術為基礎的新一代測序方式被稱為第三代測序技術。其技術缺陷是標記核苷酸的成本高,且測序錯誤率高。Adam Phillippy團隊2012年將第二代和第三代測序技術結合到一起開發(fā)了近乎完全準確的長讀取技術。2012年,Peters等[9]利用長片段讀取技術(LFR)中“條形碼”DNA拼接完整的基因組序列,在完整的人類基因組中僅有600個錯誤堿基。此技術極大地提高了全基因組測序的精度,顯著降低在測試中所需的DNA量。
2 人類全基因組測序技術的應用
2.1疾病的診斷
2.1.1罕見病例的病因學診斷:Samra [10]通過對1例肢體末端黑素瘤病例的瘤變組織提取DNA后進行全基因組測序后分析其突變序列及其頻率、范圍,及選擇性的DNA修復,并與普通的黑素瘤病例序列進行比對得出結論:此類疾病是黑素瘤的一種亞型并具有遺傳特性,與COLO829細胞低相關性,其內在的不均一性使靶向治療成為潛在的治療方式。Eqan [11]對1例多發(fā)性骨髓瘤病例的4份腫瘤樣本及其復發(fā)為漿細胞白血病后的血液樣本進行了全基因組測序并進行了縱向的對比,發(fā)現(xiàn)高危的骨髓瘤患者瘤細胞基因序列的不均一性,其潛在的基因變異促進了骨髓瘤向漿細胞白血病的轉化。Herdewyn [12]對側索硬化癥家系5個成員的血液樣本進行全基因組測序發(fā)現(xiàn)側索硬化癥的致病原因是非致病基因C9orf72變異后的復制表達所導致。對罕見病例的診斷,以往臨床醫(yī)師僅僅停留在對癥狀的判斷上。全基因組測序技術可以將其定位到基因序列的突變位點,進而制作相應的診斷工具,為臨床治療提供了新的思路和方法。
2.1.2流行病和常見病的預測、治療:在流行病學領域,全基因組測序可以對病原體進行測序分析判斷其來源及可能發(fā)生變異的頻率及方向。Croville[13]在對家禽和遷徙水鳥的禽流感病毒進行全基因組測序分析發(fā)現(xiàn),病毒基因潛在的多樣性引起突變導致了疾病的變異,家禽自身的基因突變風險要小于遷徙水鳥帶來突變基因的風險。Mary[14]對不同時期的腦膜炎雙球菌的全基因組測序揭示了美國周期性爆發(fā)的血清Y型腦膜炎與變異抗原因子蛋白的基因變異有密切關聯(lián)。Tram[15]針對越南肺結核桿菌的全基因組測序預示結核桿菌的耐藥性變異將可能造成多重耐藥結核桿菌在越南流行,需要采取相應的治療預防措施。Gardy [16]對32株爆發(fā)期和4株爆發(fā)前期的結核分枝桿菌進行全基因組序列測序對比,得出這兩組結核桿菌同源,結核爆發(fā)與基因變異無關。這些結論為臨床分析及處理提供了一定的幫助。
通過對個人全基因組測序預測常見病,如:心血管病、糖尿病的發(fā)病風險似乎是可行的。但SusanMayor[17]并不同意這種說法,每個人有數(shù)百萬基因序列,這些序列的變異可能導致的疾病目前還是未知的?,F(xiàn)有條件下,利用全基因組測序并不能明確預測單個個體的發(fā)病風險。Cirulli[18]認為隨著技術的發(fā)展,通過對普通疾病的致病原進行全基因組測序研究,能發(fā)現(xiàn)其中的罕見變異,并預測其發(fā)病風險,做出相應應對,降低其對危害人類健康的風險。
2.2癌癥研究中的應用:第二代全基因組測序技術較早被應用到癌癥的研究中[19]。Brose [20]首先將其應用于肺癌,發(fā)現(xiàn)BRAF (42)和EGFR (37)位點的突變。Campbell[21]2008年首次將大規(guī)模平行測序技術應用于肺癌研究,通過對兩組肺癌細胞進行平行測序發(fā)現(xiàn)數(shù)百個與肺癌相關的基因突變及4種蛋白表達相關的突變序列。2010年,Lee[22]報道了對一個肺癌腺癌患者癌變組織平行測序獲得的變異基因譜。2012年,Ju[23]通過對1例無吸煙史的肺腺癌患者癌組織和正常組織的平行測序發(fā)現(xiàn)肺腺癌相關新的融合基因KIF5B-RET。Sung[24] 針對肝癌展開了大規(guī)模的全基因組測序研究,對81例HBV陽性和7例HBV陰性的肝細胞癌和鄰近正常組織進行了大規(guī)模平行測序,結果發(fā)現(xiàn)HBV整合在肝癌中是一種普遍現(xiàn)象。相比于正常組織,在腫瘤中,TERT、 MLL4 和 CCNE1基因的表達上調,表明這些基因可能在癌癥的發(fā)生過程中起著重要作用。Fujimoto[25] 測序和分析了27個肝細胞癌的全基因組,其中25個與乙型或丙型肝炎病毒感染相關,多個染色質調控因子包括ARID1A, ARID1B, ARID2, MLL和MLL3在約50%的腫瘤中發(fā)生了突變,確定了病因學背景對于體細胞突變和隨后癌變以及對HCCs中染色質調控因子復發(fā)性突變的影響。
2.3遺傳學中的應用:Roach[26]對1個家庭中2個子女及其父母進行了全基因組測序,清楚有效地找到編碼孟德爾遺傳特征的基因,并精確定位了遺傳信息的染色體重組位點。隨著對功能基因的認識加深,將能通過家族測序迅速找到相應的致病基因位點。血緣鑒定在基因研究中日漸重要,2個個體是否來源于同一個祖先,個體間的基因表達之間的關聯(lián),對繪制基因疾病圖也有重要作用。Su[27]通過對54個不相關的個體的全基因組數(shù)據(jù)進行統(tǒng)計分析,可以得出其間是否具有同源性,這將對人類的基因研究提供基礎。
全基因組測序在胎兒的遺傳疾病診斷和治療中也得到應用。小于3個月胎兒疾病的檢測以往只能通過有創(chuàng)的檢測,可能增加流產的幾率。在孕期母體的血液包含有胎兒小于十分之一的DNA片段 [28]。Chu[29]通過對一對母子的血液DNA樣本的測序分析指出:在滿足DNA序列標簽計數(shù)比例可以在指定染色體中準確測定,孕有非正常胎兒孕婦的比例高于孕有正常胎兒的孕婦這兩個條件的基礎上,無創(chuàng)檢測胎兒的DNA樣本是可行的。Kitzman[30]通過對兩組3個月孕期母親血液、脫細胞DNA及父親的血液樣本進行全基因組測序,試圖找出其中屬于胎兒的遺傳信息,并進行重建胎兒DNA,從中獲取胎兒遺傳疾病相關的信息。全基因組測序技術的發(fā)展將為系統(tǒng)遺傳學及產前胎兒遺傳疾病診斷帶來極大的發(fā)展。將為系統(tǒng)遺傳學研究范圍大大的拓展,更深入一些的研究以往無法繼續(xù)研究的內容,如不顯型的遺傳突變等。
2.4個性化治療中的應用:隨著基因組測序的費用不斷下降,將之用于臨床病例,并為個人提供個性化的醫(yī)療服務可能成為現(xiàn)實。2012年1月,美國Life Technologies公司推出一款基因測序儀Ion Proton,僅需1天1000美元就可以對個人的基因組進行完全測序?;驕y序技術應用于個體疾病的診斷中,Boris Pasche[31] 對此充滿信心,在腫瘤學領域,基因組測序技術已經首先應用于個性化的診斷中,測序的結果可以立即了解基因突變的位置和內容。明確診斷本身對治療就是一個極大的促進。對基因的激活或抑制技術的發(fā)展會對患者的治療起到巨大的影響,改變癌細胞分子特性的基因技術將會給癌癥患者提供一個新的個性化治療選擇。
2.5測序技術在瘢痕研究中的應用:病理性瘢痕包括增生性瘢痕和瘢痕疙瘩,是伴隨創(chuàng)傷愈合而產生。其發(fā)病機制模糊,有遺傳背景、種族傾向、易感個體[32]。病理性瘢痕的產生與成纖維細胞的過度增殖相關。這些增殖與一些蛋白的異常表達有關,P53蛋白、轉化生長因子β及其亞型、胸腺素β4、livin、smac蛋白[33-35]等。這些蛋白的表達受上游基因調控,近來通過基因芯片技術已經篩選出大量與瘢痕相關的基因,HLA class I、HLA class II、HLA-DQA1、HLA-DQB1、COL1A1、COL11A1、Fas基因[36]等。對其中部分基因位點進行了測序研究,發(fā)現(xiàn)部分基因序列發(fā)生插入或缺失變異。基因芯片技術大大提高了瘢痕研究的深度和廣度,但也有其明顯的缺陷。如:不能對人體基因組進行全面的分析,僅能對已知基因進行表達檢測;不能消除個體之間的差異因素;芯片雜交反應的敏感性、特異性不高、信號檢測的靈敏度有待提高等[37]。全基因組測序技術的推廣和應用或許會為病理性瘢痕研究帶來新的思路和方法。通過對族系或散在的病理性瘢痕病例進行取樣并測序,通過與正常人類基因組序列庫比對分析,可以發(fā)現(xiàn)新的突變基因位點及致病因素,為瘢痕的防治提供新的方法和希望。
3 全基因組測序技術臨床應用的倫理限制[38]
隨著費用的下降,全基因組測序在醫(yī)學臨床中的應用會快速增長。全基因組測序技術能獲得更多的基因疾病相關的信息。根本性的提高了疾病信息及其特征的檢測率,這些為臨床帶來了很大的機遇和挑戰(zhàn)。測序前的知情同意要求讓患者獲得充分的信息,包括測序的好處、風險及局限性。加強了對疾病風險及疾病提前處理的信息及能力,并能獲得更有針對性的治療。患者應該被告知大部分的測序信息是沒有意義和不重要的,只有少量的數(shù)據(jù)與特定的疾病相關?;颊邞摫桓嬷麄兛赡軡撛诘挠懈嗟钠渌膊〉娘L險,有可能因此受驚嚇。頻繁的不顯的突變會讓每位患者都可能是某一個嚴重疾病的攜帶者。這種情況會讓患者及他的親人感到恐慌。由于一些潛在的疾病會有遺傳特性,他們的子女會產生一些負面的社會影響,如:保險、就業(yè)、恥辱感等。應該讓患者自己決定是否接受測序,與患者談話并簽署同意書。
總之,隨著全基因組測序技術的進步,測序所需的時間和費用不斷在降低,測序技術在臨床醫(yī)學的應用將獲得飛速提升?;驕y序技術初期應用于噬菌體、細菌、病毒到逐漸應用于動物、植物后應用于人體,都取得了豐碩的成果,加深了對各種生物各項領域的理解,并逐步改造,創(chuàng)造了巨大的科研和社會效益。對人類自身的基因組測序加速了對人類遺傳特性、遺傳疾病、罕見及常見疾病的發(fā)生、發(fā)展的理解,并為提高人類的健康事業(yè)開辟了一條新的道路。
[參考文獻]
[1]Sanger F.The terminal peptides of insulin[J].Biochem J,1949,45(5):563-574.
[2]Edman P.A method for determination of the amino acid sequence in peptides[J].Arch Biochem,1949,22(3):475.
[3]Sanger F,Brownlee GG,Barrell BG.A two-dimensional fractionation procedure for radioactive nucleotides. [J].J Mol Biol,1965,13(2):373-398.
[4]Whitfeld PR. A method for the determination of nucleotide sequence in polyribonucleotides[J].Biochem J,1954,58(3):390-396.
[5]Maxam AM,Gilbert W.A new method for sequencing DNA[J].ProcNatl Acad Sci USA,1977,74(2):560-564.
[6]Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain terminating inhibitors[J].ProcNatl Acad Sci USA,1977,74(12):5463-5467.
[7]Hyman ED.A new method of sequencing DNA[J].Anal Biochem,1988,174(2): 423-436.
[8]Pfeifer GP,Steigerwald SD,Mueller PR,et al.Genomic sequencing and methylation analysis by ligation mediated PCR[J].Science,1989,246(4931):810-813.
[9]Peters BA,Kermani BG,Sparks AB,et al. Accurate whole-genome sequencing and haplotyping from 10 to 20 human cells[J].Nature,2012,487(7406):190-195.
[10]Samra Turajlic,Simon J,Maryou B,et al. Whole genome sequencing of matched primary and metastatic acral melanomas[J].Genome Research,2012,22(2):196-207.
[11]Egan JB,Shi CX,Tembe W,et al.Whole genome sequencing of multiple myeloma from diagnosis to plasma cell leukemia reveals genomic initiating events, evolution and clonal tides[J].Blood,2012,120(5):1060-1066.
[12]Herdewyn S,Zhao H,Moisse M,et al.Whole-genome sequencing reveals a coding non-pathogenic variant tagging a non-coding pathogenic hexanucleotide repeat expansion in C9orf72 as cause of amyotrophic lateral sclerosis[J].Hum Mol Genet,2012,21(11):2412-2419.
[13]Croville G,Soubies SM,Barbieri J,et al.Field Monitoring of Avian Influenza Viruses: Whole Genome Sequencing and Tracking of Neuraminidase Evolution Using 454 Pyrosequencing[J].Clin Microbiol,2012,50(9):2881-2887.
[14]Krauland MG,Dunning Hotopp JC,Riley DR,et al.Whole genome sequencing to investigate the emergence of clonal complex 23 Neisseria meningitidis serogroup Y disease in the United States[J].PLoS One,2012,7(4):e35699.
[15]Tram NV,Bach NT,Duong HH,et al.Preliminary remarks on assembly whole genome sequencing of MDR M.tuberculosis isolated in Vietnam[J].Jnfect Dev Ctries,2012,6(1):95-96.
[16]Gardy JL,Johnston JC,Ho Sui SJ,et al.Whole-genome sequencing and social-network analysis of a tuberculosis outbreak[J].N Engl J Med ,2011,364(8):730-739.
[17]Mayo S.Whole genome sequencing fails to predict risk of most common diseases[J].BMJ,2012,344:e2535.
[18]Cirulli ET,Goldstein DB.Uncovering the roles of rare variants in common disease through whole-genome sequencing[J].Nat Rev Genet,2010,11(6):415-425.
[19]Daniels M,Goh F,Wright CM,et al. Whole genome sequencing for lung cancer[J].J Thorac Dis,2012,4(2):155-163.
[20]Brose MS,Volpe P,F(xiàn)eldman M,et al. BRAF and RAS mutations in human lung cancer and melanoma[J].Cancer Res,2002,62(23):6997-7000.
[21]Campbell PJ, Stephens PJ, Pleasance ED, et al. Identification of somatically acquired rearrangements in cancer using genome-wide massively parallel paired-end sequencing[J]. Nat Genet,2008,40(6):722-729.
[22]William Lee, Zhaoshi Jiang, Jinfeng Liu,et al. The mutation spectrum revealed by paired genome sequences from a lung cancer patient[J]. Nature, 2010,465(7297):473-477.
[23]Ju YS, Lee WC, Shin JY, et al. A transforming KIF5B and RET gene fusion in lung adenocarcinoma revealed from whole-genome and transcriptome sequencing[J]. Genome Res 2012,Genome Res, 2012,22(3):436-445.
[24]Sung WK, Zheng H, Li S,et al. Genome-wide survey of recurrent HBV integration in hepatocellular carcinoma[J]. Nat Genet,2012,44(7):765-769.
[25]Fujimoto A, Totoki Y, Abe T, et al. Whole-genome sequencing of liver cancers identifies etiological influences on mutation patterns and recurrent mutations in chromatin regulators[J]. Nat Genet, 2012,44(7): 760-764.
[26]Roach JC, Glusman G, Smit AF, et al. Analysis of genetic inheritance in a family quartet by whole-genome sequencing[J]. Science, 2010,328(5978):636-639.
[27] Su SY, Kasberger J, Baranzini S, et al. Detection of identity by descent using next-generation whole genome sequencing data[J]. BMC Bioinformatics, 2012,13:121-129.
[28]Bauer M,Hutterer G,Eder M,et al. A prospective analysis of cell-free fetal DNA concentration in maternal plasma as an indicator for adverse pregnancy outcome [J]. Prenat. Diagn,2006,26(9):831-836.
[29]Chu T,Bunce K, Hogge WA, et al. Statistical model for whole genome sequencing and its application to minimally invasive diagnosis of fetal genetic disease[J]. Bioinformatics ,2009,25(10):1244-1250.
[30]Kitzman JO,Snyder MW,Ventura M,et al. Noninvasive whole-genome sequencing of a human fetus[J].Sci Transl Med,2012,4(137):137-176.
[31]Boris Pasche,Devin Absher.Whole-Genome Sequencing: A Step Closer to Personalized Medicine[J].JAMA,2011, 305(15):1596-1597.
[32]Shih B,Bayat A.Genetics of keloid scarring[J]. Arch Dermatol Res,2010,302(5):319-339.
[33]Saed GM,Ladin D,Olson J,et al.Analysis of p53 gene mutations in keloids using polymerase chain reaction-based single-strand conformational polymorphism and DNA sequencing[J].Arch Dermatol,1998,134(8):963-967.
[34]陳偉,付小兵,葛世麗,等. 胎兒和出生后機體皮膚內轉化生長因子β1基因表達的變化[J].中國危重病急救醫(yī)學, 2004,16(4):206-209.
[35]聶芳菲,吳江群,秦澤蓮. 瘢痕疙瘩和增生性瘢痕中胸腺素β4基因表達變化及其意義[J].中國危重病急救醫(yī)學, 2005,17(2):80-83.
[36]Ashcroft KJ,Syed F,Arscott G,et al.Assessment of the influence of HLA class I and class II loci on the prevalence of keloid disease in Jamaican Afro-Caribbeans[J].Tissue Antigens ,2011,78(5):390-396.
[37]馬兵,吳軍,易紹萱,等. 表達基因譜基因芯片篩選燒傷后增生性瘢痕相關基因的研究[J].中華創(chuàng)傷雜志,2001,17(6): 334-337.
[38]Ormond KE,Wheeler MT,Hudgins L,et al.Challenges in the clinical application of whole-genome sequencing [J].Lancet,2010,375(9727):1749-1751.
[收稿日期]2012-12-17 [修回日期]2013-02-21
編輯/李陽利