陳 賓,馬建婷,陳利玲,洪旭濤,唐曉婧,陳樞青
(1.華中科技大學同濟醫(yī)學院,湖北武漢 430030;2.余姚人民醫(yī)院,浙江余姚 315400;3.浙江大學浙江加州國際納米技術研究院,浙江杭州 310058;4.浙江大學藥學院,浙江 杭州 310058)
由于第二代全基因組測序技術的發(fā)展,測序成本迅速下降,全基因組測序分析成為常用的研究手段。2010年,《Nature》發(fā)表了2個重要研究成果[1-2],一個是對屬于同一個體的肺癌細胞和皮膚細胞進行了全基因組序列測定,發(fā)現(xiàn)肺癌細胞存在22910個體細胞突變;另一個發(fā)現(xiàn)黑色素瘤細胞與來自同一個體的淋巴細胞存在33345個體細胞突變。之后,腦瘤、白血病、卵巢癌、嗜鉻細胞瘤和副神經(jīng)節(jié)瘤、肝癌、腎癌、肺癌[3-9]等都進行了類似研究。由于體細胞突變是造成腫瘤、糖尿病、高血壓等許多難治性疾病的主要因素,準確測定體細胞突變有重要的理論和實際意義。那么,目前的檢測方法是否可以準確判定體細胞突變呢?本研究選取了1例手術切除的間皮瘤和癌旁組織,分別進行了全基因組測序,將測序結(jié)果與人類基因組數(shù)據(jù)庫的參考序列進行比較,對腫瘤細胞的體細胞突變進行分析鑒定,結(jié)果發(fā)現(xiàn)正常細胞存在的體細胞突變會干擾腫瘤體細胞突變的鑒定,因此建議,盡早為個體進行全基因組測序或者保存一份人生早期的DNA樣本以便對照。
1.1 材料 臨床標本來源于1例68歲確診為高度分化的乳頭狀腹膜間皮瘤的女性患者,其臨床指標為:CK5/6(+++),CK7(+++),鈣結(jié)合蛋白(++),D2-40(+),vim(++),CK(++),ER(-),PR(-),CEA(-),Ki67(<10%+)。樣本為腫瘤手術切除的腫瘤組織及其癌旁組織,本研究經(jīng)過浙江大學醫(yī)學院倫理委員會的批準及患者的知情同意。
1.2 DNA提取、文庫構建及測序 臨床標本迅速放入液氮中凍存?zhèn)溆?。DNA提取前,切除含血管的腫瘤組織。腫瘤組織及癌旁組織的基因組DNA用QIAGEN DNeasy血液組織試劑盒提取。根據(jù)Illumina TruSeq DNA SamplePrep v2說明書,用3μg提取的基因組DNA建立測序用DNA文庫,再用DNA LabChip 1000試劑盒和Agilent bioanalyzer芯片分析系統(tǒng)進行質(zhì)量檢測。測序由Illumina Hiseq2000完成,堿基識別由 CASAVA 1.8.2 完成。
1.3 生物信息學分析 利用Burrows-Wheeler Aligner(BWA,http://bio-bwa.sourceforge.net/bwa.shtml),將過濾后的數(shù)據(jù)定位到參考基因組 hg18、hg19(http://hgdownload.cse.ucsc.edu/downloads. html#human),用 Samtools(http://samtools.sourceforge.net/)去除由 PCR反應產(chǎn)生的冗余讀數(shù),用GATK(http://www.broadinstitute.org/gatk/)檢測 SNV。之后利用dbSNP135(http://www.ncbi.nlm.nih.gov/projects/SNP/)和 refGene(http://refgene.com)的基因組信息,用軟件 ANNOVAR(http://www.openbioinformatics.org/annovar/)對 SNV進行注釋和歸類。
2.1 DNA文庫的質(zhì)量 圖1顯示DNA文庫的平均插入片段長度為350 bp。
2.2 測序數(shù)據(jù)概況 應用雙末端測序技術分別從腫瘤組織和癌旁正常組織獲得了149 M和150 M的測序數(shù)據(jù)(表1)。去除污染數(shù)據(jù)后,分別從腫瘤組織和癌旁組織獲得了12.5 Gbp和12.6 Gbp的純凈數(shù)據(jù)。
圖1 腫瘤組織和癌旁組織樣本建立的DNA測序文庫中插入片段的長度分布Fig.1 Distrabution of fragment sizes of DNA library built by tumor and paraneoplastic tissues
表1 腫瘤組織和癌旁組織分別測序獲得的數(shù)據(jù)量對照Table 1 Sequencing data from tumor and paraneoplastic tissues
2.3 生物信息學分析獲得的SNV 根據(jù)上述方法獲得的數(shù)據(jù),本研究比較了2個樣本間高可信度的 SNV、位于外顯子的高可信度的SNV、包含非同義突變的基因、包含插入/缺失的基因。所得數(shù)據(jù)如表2。
表2 腫瘤組織、癌旁組織及人類基因組參考序列相互比對結(jié)果Table 2 Variation numbers of nucleotides among tumor,paraneoplastic tissues and human genome reference sequence
體細胞突變是區(qū)別于生殖細胞突變的一種突變類型,生殖細胞突變會將突變的后果傳遞到下一代個體,并對下一代的表型產(chǎn)生影響,對自身是幾乎沒有影響的。而體細胞突變只在同一個體隨細胞分裂傳遞突變的后果,影響的是其本人。人一生長期與環(huán)境互相作用,有些DNA首先發(fā)生體細胞突變,這個突變位點會在其分裂生成的子代細胞中得到遺傳,稱為體細胞遺傳。在遺傳信息傳遞過程中,體細胞突變會逐步積累。環(huán)境越惡劣,接觸時間越長,積累的體細胞突變越多。2011年,Gaisa等[10]對膀胱上皮細胞進行了研究,發(fā)現(xiàn)其擁有多個單克隆族群。每一個族群內(nèi)部擁有相同的基因序列,而族群之間在某些基因上可發(fā)現(xiàn)獨特的體細胞突變特征。肇事突變(driver mutation)或肇事突變組合(driver mutation pattern)的形成是細胞生長過程中的一個偶然事件。一旦發(fā)生就會讓細胞發(fā)生異化,異化了的細胞如果能夠遵循體內(nèi)“細胞社會”的規(guī)則,一般會選擇凋亡以保證個體組織正常發(fā)展。但有時異化的細胞沒有選擇凋亡并逃脫體內(nèi)免疫監(jiān)視,則形成異常細胞群,進而影響組織、器官,發(fā)生疾病。很多疾病如腫瘤、糖尿病、高血壓和阿爾茨海默病等都有這樣的一個發(fā)生發(fā)展的過程。由于體細胞突變是一件隨機事件,其發(fā)生的位點是極其個性化的,導致腫瘤、高血壓、糖尿病等疾病發(fā)生的個性化特點,因此造成一種藥物不能治療所有患者的苦惱。個性化醫(yī)療不僅要關注患者的個性化,如年齡、性別、有否吸煙等外在因素,以及靶標基因多態(tài)性和代謝分布基因多態(tài)性等內(nèi)在因素,還要同時關注疾病的個性化,如體細胞突變的個性化等。目前已經(jīng)有許多研究闡述了體細胞突變在診斷和治療難治性疾病中的重要作用[11-16]。
本研究對一例腹膜間皮瘤進行了腫瘤組織及癌旁組織的全基因組測序,試圖研究第二代測序技術在檢測體細胞突變中的臨床適應性。圖1顯示兩個樣本的測序DNA文庫建立是符合要求的,兩者基本一致。表1的結(jié)果顯示測得的數(shù)據(jù)量也基本符合要求。表2的結(jié)果是最值得深入分析的。首先假設N不存在任何體細胞突變,那么,無論N=R或者N≠R,只要是N≠T都是腫瘤存在的體細胞突變,本研究中就是 R=N≠T、R=T≠N、R≠T≠N 之和 22710個體細胞突變。但是實際上N要么是癌旁組織,要么是血液中白細胞或者是來源便利的其他組織樣本。根據(jù)廣泛接受的理論,在人與環(huán)境長期接觸過程中,環(huán)境物質(zhì)對DNA攻擊造成體細胞突變,對于同一個體中的不同組織來說概率幾乎相等,除非有特殊的職業(yè)接觸或者非正常事故。對于普通個體,一般體細胞的存在數(shù)量與年齡大小和環(huán)境的惡劣程度成正相關。因此,可以粗略認為正常細胞和腫瘤細胞存在幾乎數(shù)量相等的體細胞突變,只是腫瘤細胞中的體細胞突變發(fā)生在關鍵位點,而正常細胞中的體細胞突變不是在關鍵位點。以此推理,我們可以粗略判斷腫瘤存在的體細胞突變應該是22710的一半??墒?,從診斷和治療的角度來說,數(shù)量不是最重要的,具體的腫瘤體細胞突變位點才是最重要的。那么,哪些位點是只屬于腫瘤細胞的體細胞突變呢?R=N≠T是腫瘤體細胞突變的概率較大,但也存在R的那個位點就是一個體細胞突變的可能性,因為R也是來源于某一個DNA的測序結(jié)果。R=T≠N看似最大概率是N的體細胞突變,但是,也不排除N是一個SNP,而T突變后正好與R一樣。R≠T≠N是突變發(fā)生的熱點(hotspots),根本無法推測到底是哪一個細胞發(fā)生了突變,這種位點數(shù)量雖少,卻往往起很重要的作用。
臨床研究選擇對照是一個非常重要的問題,由于這類疾病都是長期與環(huán)境接觸造成的,現(xiàn)實中這樣的對照組織是不存在的。唯一的辦法是利用多種組織樣本,進行反復測序,再用計算機推導演算,才可能獲得那些可用于診斷和治療的體細胞突變位點。這樣就會給將來基因科技的應用帶來很多問題,如驅(qū)動突變和腫瘤發(fā)生發(fā)展的理論性問題,以及靶向治療、免疫治療和基因治療的個體化診療手段中的具體位點選擇的實際性問題。如果能夠為每一個新生嬰兒進行全基因組測序或者保存一份當時的DNA,對于將來利用基因科技發(fā)展帶來的個體化診療技術的應用,將是一個卓有遠見的考慮。楊煥明等[17-18]曾經(jīng)提出為新生兒進行全基因組測序,由于測序成本與近期獲益不成比例,響應者寥寥無幾。測序方法仍然是目前研究的熱點,可以預見基因測序成本將繼續(xù)下降,但是,我們認為更明智的方法是保存一份可以為每個個體一生作對照的DNA。
[1]PLEASANCE E D,STEPHENS P J,O'MEARA S,et al.A small-cell lung cancer genome with complex signatures of tobacco exposure[J].Nature,2010,463(7278):184-190.
[2]PLEASANCE E D,CHEETHAM R K,STEPHENS P J,et al.A comprehensive catalogue of somatic mutations from a human cancer genome [J].Nature,2010,463(7278):191-196.
[3]CLARK M J,HOMER N,O'CONNOR B D,et al.U87MG decoded:the genomic sequence of a cytogenetically aberrant human cancer cell line[J].PLoS Genet,2010,6(1):e1000832.
[4]LINK D C,SCHUETTPELZ L G,SHEN D,et al.Identification of a novel TP53 cancer susceptibility mutation through whole-genome sequencing of a patient with therapy-related AML [J].JAMA,2011,305(15):1568-1576.
[5]BELL D,BERCHUCK A,BIRRER M,Integrated genomic analyses of ovarian carcinoma [J].Nature,2011,474(7353):609-615.
[6]BURNICHON N,VESCOVO L,AMAR L,et al.Integrative genomic analysis reveals somatic mutations in pheochromocytoma and paraganglioma[J].Hum Mol Genet,2011,20(20):3974-3985.
[7]TAO Y,RUAN J,YEH S H,et al.Rapid growth of a hepatocellular carcinoma and the driving mutations revealed by cell-population genetic analysis of whole-genome data[J].Proc Natl Acad Sci USA,2011,108(29):12042-12047.
[8]DALGLIESH G L,F(xiàn)URGE K,GREENMAN C,et al.Systematic sequencing of renal carcinoma reveals inactivation of histone modifying genes [J].Nature,2010,463(7279):360-363.
[9]GREULICH H. The genomics of lungadenocarcinoma:opportunities for targeted therapies[J].Genes Cancer,2010,1(12):1200-1210.
[10]GAISA N T,GRAHAM T A,MCDONALD S A,et al.The human urothelium consists of multiple clonal units,each maintained by a stem cell[J].J Pathol,2011,225(2):163-171.
[11]OCANA A,PANDIELLA A.Personalized therapies in the cancer"omics"era [J].Mol Cancer,2010,9:202.
[12]PICKER A,JACKSON D B.Genetic determinants of anticancer drug activity:towards a global approach to personalized cancer medicine [J].Expert Rev Mol Diagn,2011,11(6):567-577.
[13]SWORDS R T,DEZUBE B J,MEDEIROS B C.Personalized medicine for acute myelogenous leukemia--at the entrance gate [J].Am J Hematol,2011,86(8):631-632.
[14]DIENSTMANN R,MARTINEZ P,F(xiàn)ELIP E.Personalizing therapy with targeted agents in nonsmall cell lung cancer[J].Oncotarget,2011,2(3):165-177.
[15]MULLER F L,COLLA S,AQUILANTI E,et al.Passenger deletions generate therapeutic vulnerabilities in cancer[J].Nature,2012,488(7411):337-342.
[16]IYER G,HANRAHAN A J,MILOWSKY M I,et al.Genome sequencing identifies a basis for everolimus sensitivity [J].Science,2012,338(6104):221.
[17]YANG Huanming(楊煥明).Personal Genomics-New Challenge of Life Ethics in New Era of Biomedicine [J].Medicine and Philosophy:Humanistic& Social Medicine Edition(醫(yī)學與哲學:人文社會醫(yī)學版),2009,30(10):1-4.(in Chinese)
[18]CAPLAN J,DELL K,DORFMAN A,et al.TIME's Best Inventions of 2008.Time Magazine.2008-10-29. http://www. time. com/time/specials/packages/0,28757,1852747,00.html