南娟 翻譯 曹志成 校對
1天津醫(yī)科大學總醫(yī)院,天津市肺癌研究所,天津市肺癌轉移與腫瘤微環(huán)境重點實驗室;2香港特別行政區(qū) 伊利沙伯醫(yī)院 臨床腫瘤科
肺癌在生物學上具有侵襲性,并且是癌癥相關死亡的主要原因。全球每年有160萬人診斷為肺癌,并有130萬人死亡[1]。肺癌主要分為兩種類型:非小細胞肺癌(non-small-cell lung cancer, NSCLC)(占85%)和小細胞肺癌(約占15%)[2]。NSCLC可進一步分為鱗狀細胞癌(squamous cell carcinoma, SCC)、腺癌(adenocarcinoma, ADC)和大細胞肺癌。小細胞肺癌的5年生存率僅為6%,遠低于NSCLC的生存率(17%)。伴隨手術方法的完善和化放療的聯(lián)合應用,肺癌的1年相對生存率從35%(1975年-1979年)升至43%(2003年-2006年)。但是,綜合所有分期,生存期超過5年的患者僅有16%。如果肺癌在局限期時即被發(fā)現(xiàn),則5年生存率可達53%。然而,僅15%的肺癌患者在局限期被診斷出來[101]。
鑒于肺癌的嚴重后果及眾多治療失效的經(jīng)驗,研究者將更多的精力投入到認識該病病因學的潛在機制,以期鑒定新型藥物靶標。人們很早就認識到,肺癌是一種異質性疾病,而且基因組改變在該病的發(fā)生中起至關重要的作用。在過去的幾年中,基因組測序技術取得飛速進展。傳統(tǒng)上基于毛細管的單基因測序的第一代技術(如Sanger測序法)已被新一代測序技術(next-generation sequencing, NGS)所替代,因為NGS允許大量平行測序,而且具有成本更低和通量更高的特點。與傳統(tǒng)方法相比,NGS技術取得顯著進步,包括對完整基因組、外顯子組和轉錄組的全面測序。較傳統(tǒng)方法,其還具有發(fā)現(xiàn)新型染色體重排和拷貝數(shù)目改變的優(yōu)勢[3]。這些技術進展可革新我們對癌癥(如肺癌)的認識。
在本綜述中,我們對各種NGS技術做了簡要的說明和總結。我們探討了至今為止NGS在肺癌中的應用及重要發(fā)現(xiàn)。但是,NGS在肺癌診斷中的應用不在本綜述范圍內(nèi)。
NGS通常是指第二代和第三代測序技術。這兩者的平臺比第一代Sanger測序技術均具有更好的能效比和更高的通量。根據(jù)目標樣本資源和覆蓋范圍,NGS包括,但不局限于,全基因組測序(whole-genome sequencing,WGS)(針對DNA)、全外顯子組測序(whole-exome sequencing, WES)(針對DNA)、全轉錄組測序(針對RNA的RNA-seq)和靶向靶標測序(DNA和RNA),詳細內(nèi)容如下所述。所有測序的材料預備起始于已剪切的DNA或RNA樣本,隨后為資料構建。
WGS可以對整個基因組進行測序,提供最全面的基因組特征和最高水平的基因組測序。許多長度為5個-200個核苷酸的隨機短DNA片段可以采用此方法同時進行測序[3]。人類基因組計劃的完成會產(chǎn)生人類基因組序列的總參照,在人類基因組計劃完成之前很難解釋這些短序列。在所有NGS方法中,WGS花費最高。但是,隨著技術的完善,WGS日漸便宜[3]。WGS成為一種既可獲取全面基因編碼序列又有助于明確影響疾病發(fā)生和進展因素的有效工具[4]。WGS可以檢測所有基因組變異,產(chǎn)生了龐大的數(shù)據(jù)集。數(shù)據(jù)挖掘仍然是面臨的主要挑戰(zhàn)之一,必須加以解決,以實現(xiàn)個體化醫(yī)療的需求[4]。WGS雖費錢費時,但與傳統(tǒng)測序方法(Sanger測序)相比,WGS可以識別平衡染色體易位和倒位的斷點,從而有了獨特的應用[5]。此外,WGS可檢測基因編碼區(qū)外發(fā)生的基因組變異。這些區(qū)域包括非編碼的體細胞突變,如啟動子、增強子、內(nèi)含子、非編碼RNAs(例如,miRNAs)和未注釋的區(qū)域[6,7]。激活的遺傳變異也可以通過WGS進行鑒定,有助于我們理解遺傳性疾病和遺傳危險因素引發(fā)癌癥的本質。WGS可進一步促進疾病的篩查和診斷及個體化治療的制定[5]。
WGS是用于癌癥基因組深度測序的主要技術,因為它提供了點突變、融合基因、插入缺失和拷貝數(shù)目變異的廣泛信息。它還提供了染色體的復雜重排、核苷酸置換突變和重復序列,以及腫瘤的整個基因組的結構重排,包括倒位、易位和復雜重排的信息[5]。目前,WGS在癌癥基因組研究中最顯著的貢獻是發(fā)現(xiàn)了點突變。在一項WGS研究中,一組配對的正常和腫瘤樣本對于區(qū)分真正的體細胞突變和遺傳性改變的結構重排是必不可少的[5]。研究證實全基因組擴增的DNA配對測序對數(shù)量有限的細胞是有效的[8]。通過這種新穎方法預測的基因組的覆蓋范圍和深度的測序數(shù)據(jù)與從未擴增的基因組DNA的預測結果類似。
WES可用于基因組編碼外顯子的測序,為發(fā)現(xiàn)活化的體細胞突變提供了一種有效方法。傳統(tǒng)的基于毛細管的外顯子組測序已導致許多疾病中靶向體細胞突變的重要發(fā)現(xiàn)。就肺癌而言,部分突變發(fā)生于EGFR和ALK受體酪氨酸激酶[3]。盡管WES局限于有注釋基因的變異的編碼和拼接位點,但是它還可以檢測整個基因組中已知編碼基因的突變,具有較高的覆蓋性。WES不能檢測啟動子或調節(jié)區(qū)的改變[9]。起初,WES只用于外顯子組。目前它已擴展至基因組的多個區(qū)段,包括外顯子側翼區(qū)、啟動子、非翻譯區(qū)和miRNA基因的非編碼DNA。單個樣本的WES檢測發(fā)現(xiàn)了多達25,000個變異,導致鑒定活化突變的挑戰(zhàn)。WES和WGS的最大區(qū)別是產(chǎn)生數(shù)據(jù)的數(shù)量和內(nèi)容的不同。一般而言,如果旨在發(fā)現(xiàn)目標突變,WES更合適。WES用戶可受益于每個樣本的花費和分析時間的減少,感興趣區(qū)域的覆蓋范圍的增加以及突變信息的準確性的提高[10]。事實上,干擾蛋白功能的基因編碼區(qū)域的突變或變異可被WES識別,而結構和非編碼變異僅能被WGS檢測。請注意,許多用于WGS的平臺還適用于WES。一項重要挑戰(zhàn)是從伴隨變異中識別致病突變,而伴隨變體與疾病病因無關[11]。WGS和WES在檢測插入缺失、三核苷酸重復和拷貝數(shù)目的變異中均有困難[9]。
WES為罕見的孟德爾遺傳疾病的致病基因組變異的發(fā)現(xiàn)提供了難得機會[12-15]。WES主要應用于表征單基因疾?。系聽栠z傳疾?。┑娜毕?,這些缺陷可引起罕見的家族性疾病。從小型家族收集的個別罕見基因變體突變可被WES識別。這種方法亦可用于發(fā)現(xiàn)活化的突變。外顯子突變或拼接位點突變是多數(shù)孟德爾遺傳疾病的主要原因[12]。此外,外顯子組測序可能在非遺傳性或新生突變相關疾病中也具有較大潛能[15]。比如,它可能促進腫瘤樣本中已知突變的診斷和新型突變的鑒定。
對從細胞中提取的RNA的測序(sequencing of RNA extracted from cells, RNA-seq)通過讀取短cDNA序列片段和基于參照基因組進行繪制,產(chǎn)生了完整的轉錄組的全部序列。RNA-seq使得繪制外顯子和內(nèi)含子的邊界、以及基因的5′和3′末端成為可能,并導致人們對轉錄組的復雜性有了更全面的了解[16]。傳統(tǒng)意義上,RNA-seq要求在資料構建前通過雜交對poly(A)進行選擇,以便富集RNA聚合酶II轉錄物和/或減少核糖體RNA的含量,該領域的進展使得我們直接可以在總RNA量為皮克時進行工作,無需分餾步驟,分餾步驟會限制轉錄組的完整測序。RNA-seq在檢測框內(nèi)融合[3]、體細胞突變[3]和基因表達序列分析[5]時具有敏感性和有效性。在量化豐富的轉錄物,尤其是當這些轉錄物表達較低時,RNA-seq較微陣技術具有更高的敏感性[17]。RNA-seq技術不僅可用于分析既往已知基因,而且可檢測當前未知轉錄物、選擇性剪接物和非人類轉錄物[5]。RNA-seq面臨三大挑戰(zhàn):資料構建、數(shù)據(jù)挖掘和覆蓋范圍與花費的比較[18]。
靶向測序通過只對靶區(qū)域測序而僅用于感興趣的基因組區(qū)域,以期達到節(jié)約時間和成本效益的分析。靶基因通常限定于既往已知癌癥相關的變異。與WGS相比,靶向測序產(chǎn)生了更小的數(shù)據(jù)庫,因此需要更簡便的數(shù)據(jù)分析。該方法可能漏掉既往未知的突變。
自2008年NGS在肺癌中首次應用發(fā)表后,多項研究采用不同的NGS方法研究除肺癌外的不同疾病。表1總結了這些研究的疾病類型、臨床樣本、所采用的NGS方法、范圍、所用平臺和主要發(fā)現(xiàn)。其它細節(jié)如下所述。
在癌癥,尤其是NSCLC中,EGFR通過對可調節(jié)增殖和凋亡的信號轉導通路進行調控,在腫瘤發(fā)生中起關鍵作用。EGFR的突變頻率見表2[20-26]。EGFR為NSCLC的重要基因變異,靶向EGFR的酪氨酸激酶抑制劑(tyrosine kinase inhibitors,TKIs;如吉非替尼和厄洛替尼)的出現(xiàn)為改善NSCLC的治療點燃希望。但是,由于其在一般NSCLC患者群中缺乏療效,最初的熱情受到挫傷。隨后,研究顯示EGFR突變對EGFR TKIs的療效至關重要[20]。2011年,美國臨床腫瘤學會發(fā)布了一項初步臨床意見指出,采用EGFR抑制劑進行一線治療需基于陽性突變[27]。在過去的十年中,對可預測肺癌患者對EGFR TKIs的療效的生物標記物的進一步研究是一個活躍的研究領域。NGS技術在與EGFR TKI敏感性相關的其它基因標記物的發(fā)現(xiàn)中起重要作用。
主要的EGFR突變?yōu)橥怙@子19的框內(nèi)缺失,這是采用EGFR抑制劑進行個體化治療的有效標記物。Marchetti等對116個NSCLC的DNA樣本通過傳統(tǒng)Sanger和NGS的測序結果進行了比較[28]。其中,有106個樣本采用Sanger測序顯示外顯子19缺失,采用NGS分析也可見此突變。但是,僅88%(93個)的樣本通過NGS方法驗證與Sanger測序具有相同的缺失。有13個(12%)病例的缺失通過兩種方法測序的特征不同。在這些缺失中,有6個樣本的缺失起點/終點未被Sanger測序檢測出且無法合理解讀。其它7個病例的缺失起點/終點明確,雖然缺失基質的恰當序列未被Sanger測序定義(如c.2240_2254del和c.2239_2262del),但可被NGS定義。通過NGS測序,在21個樣本(20%)中發(fā)現(xiàn)雙倍或多倍框移缺失相關的框內(nèi)改變。通過Sanger測序,16個病例的缺失為長的和短的非框內(nèi)缺失(17 bp_del和1 bp_del),被認定為缺失和插入。其它5個樣本被發(fā)現(xiàn)攜帶復雜缺失,這些缺失有可能是新的突變。這些突變包括:c.2239_2248del c.2253_2260del、c.2230_2237del c.2245_2251del、c.2239_2262del c.2263_2274dup(插入)、c.2236_ 2252del c.2258del和c.2234_ 2236del c.2241_2252del。除了主要缺失,還有攜帶不同缺失的DNA分子亞群,它們在結構上與主要缺失有關。NGS檢測46個(43%)樣本發(fā)現(xiàn),每一亞群占有腫瘤基因組的0.1%-17%。外顯子19的復雜突變和缺失亞群的發(fā)現(xiàn)有可能解釋攜帶外顯子19突變的NSCLC患者的不同反應[例如,反應率:53.3%-75%;無進展生存期(progression-free survival, PFS):7.1個月-398天][20]。這項研究還說明,外顯子19的某一區(qū)域也是高度變化的,這可能影響EGFR TKIs的個體化治療和肺癌的發(fā)病機理[28]。NGS有可能更全面地繪制EGFR外顯子19的缺失序列,由于該缺失的不同形式可能導致不同EGFR TKI反應、疾病進展,并可影響攜帶外顯子19缺失蛋白的抗原性[28]。
除了外顯子19的缺失,外顯子20的T790M也顯著影響著患者對EGFR TKI治療的反應。該點突變主要與EGFR TKI治療的獲得性耐藥相關。比如,在肺ADC中,T790M突變導致50%以上的獲得性耐藥[25]。研究顯示,在TKI治療后可獲得EGFR T790M突變[29]。此外,EGFR T790M突變預處理在預測EGFR TKIs療效中的作用被研究。Su等采用直接測序、基質輔助激光解吸電離飛行時間(Matrix-assisted laser desorption/ionization-time of flight,MALDI-TOF)質譜分析和NGS方法分析了EGFR TKIs治療前后的NSCLC患者的DNA樣本[30]。這些患者混雜著吸煙者(23.4%)和非吸煙者(76.6%),ADC(94.3%)或SCC(5.7%)。研究發(fā)現(xiàn)預處理和未處理T790M的患者的PFS間有統(tǒng)計學差異(P=0.0298),而不同基因型的組別間對EGFR TKIs的反應率和總生存期無明顯差異。仍有57%的攜帶T790M突變的患者對治療是有反應的,該現(xiàn)象尚不能解釋。EGFR TKIs治療使T790M突變從治療前的31.5%升至治療后的83.3%。
最近,作為新興生物標記物和治療靶標的ALK酪氨酸激酶受體受到了廣泛關注。EML4-ALK易位是最常見的ALK基因重排。大約2%-11%的肺癌患者的EML4-ALK為陽性[20]。采用基因組DNA測序發(fā)現(xiàn)1例43歲非吸煙男性NSCLC患者含有復雜的ALK重排,但根據(jù)Vysis ALK Break Apart FISH分析(Abbott Molecular Inc., IL, USA)其未攜帶突變的EGFR和EML4-ALK重排。連同其它的cDNA測序,研究顯示復雜重排包括至少5個不同的基因座內(nèi)有斷點。其中之一為ALK內(nèi)含子19和典型的EML4-ALK融合(EML4外顯子1-13,ALK外顯子20-29)。與外顯子1-19相比,外顯子20-29的表達高至39倍。此類患者在服用克唑替尼后疾病有改善。由于NGS可以檢測復雜的ML4-ALK重排,而傳統(tǒng)的FISH分析不能檢測這些重排,所以可以考慮采用NGS來為NSCLC患者制定治療方案。
Jung和同事們對NSCLC組成的cDNA樣本進行轉錄組測序。通過NGS發(fā)現(xiàn)了228個融合轉錄物候選因子[31]。排除可能的假陽性后降至16個。大多數(shù)融合基因里均有一個單序列。通過逆轉錄-PCR進一步證實了候選融合基因,而且僅從H2228細胞中產(chǎn)生了一個成功擴增的融合基因(PTPN3-ALK)。5'-RACE產(chǎn)物分析顯示,ALK 5'的第11個內(nèi)含子至第8個內(nèi)含子片段轉位至PTPN3 5'端的第2個外顯子和第1個外顯子。此融合基因導致PTPN3一個等位基因的失活,PTPN3具有腫瘤抑制活性,并且是非受體型蛋白酪氨酸磷酸酶的成員。這些發(fā)現(xiàn)有助于肺癌的診斷和治療。
眾所周知,攜帶KRAS突變的NSCLC具有侵襲性,并且對EGFR TKIs耐藥。研發(fā)靶向突變KRAS的治療方法較為困難。通過Agilent Bioanalyzer(Agilent Technologies Inc., CA, USA)對15個原發(fā)肺癌腫瘤樣本進行雙端RNA測序來識別攜帶KRAS突變的患者中明確改變的通路。人類基因組和基因組圖譜被描述。網(wǎng)絡分析顯示在KRAS突變的腫瘤中存在差異表達(374個基因)、選擇性剪接(259個基因)和單核苷酸變異(single-nucleotide variant,SNV)相關的改變(65個基因)。在該項研究中,NF-kB、ERK1/2和AKT通路被證實可以激活,還發(fā)現(xiàn)了突變KRAS、TNFR和PPARγ信號通路的關系。這些發(fā)現(xiàn)對相應的靶向治療更為敏感,這將為EGFR TKI-耐藥的NSCLC患者提供替代的治療選擇[32]。
最近有3項研究報道了肺ADC患者中存在KIF5B和RET基因融合的新轉化[33-35]。在日本和美國的肺ADC患者中,該新型融合的發(fā)生率為1%-2%[34]。KIF5B和RET融合基因僅見于肺ADC患者,而不是肺癌的其它類型(SCC、大細胞或小細胞肺癌)或ADC的其它類型(卵巢和結腸)[33-35]。在許多腫瘤中RET是已知的致癌基因,如胰腺癌和前列腺癌。融合伙伴KIF5B有一個可激活致癌基因的卷曲螺旋域。該融合基因可以引起RET激酶的異?;罨?,并同時誘導細胞轉化[33,34]。它是一個額外的新型驅動突變,因為它是在3項獨立的研究中被發(fā)現(xiàn)的,且與既往已知的肺ADC突變或融合基因(如EGFR、KRAS和EML4-ALK)互相排斥[33-35]。KIF5B-RET融合基因是個體化靶向治療的潛在靶標,而且可以通過多種靶向激酶抑制劑來成藥,如舒尼替尼、索拉菲尼以及剛被批準的凡德他尼[34,35]。Ju等通過抑制RET的磷酸化,報道了對1例肺ADC患者的癌組織和配對正常組織的大規(guī)模并行全基因組和轉錄組測序的整合分析[33]。此患者為33歲男性、非吸煙且無家族癌癥史。他未攜帶突變的EGFR、KRAS或EML4-ALK。血液DNA的WGS分析顯示,他的癌癥并非種系突變所驅動,因為他不含有任何SNPedia[單核苷酸多態(tài)性(single-nucleotide polymorphism, SNP)數(shù)據(jù)庫]中已歸檔的明顯與癌癥相關的SNVs。通過比較肝臟中的轉移癌和正常組織,識別了10個非同義體細胞突變(8個SNVs和2個插入缺失)。這10個突變并不位于已知的靶基因(EGFR、KRAS和BRAF)上,其并非驅動突變,甚至在原發(fā)肺轉移癌中也不是。通過轉錄組測序對融合基因的進一步分析發(fā)現(xiàn)了52個融合基因。其中,49個(94.2%)為相鄰基因的染色體內(nèi)融合,1個由于觸珠蛋白而產(chǎn)生。這503個基因在腫瘤發(fā)生中不起功能性作用。其它2個融合基因為KIF5B-RET和KIAA1462-KIF5B。它們?yōu)槿旧w內(nèi)疏遠基因(超過~2 Mb)的融合。鑒于KIAA1462-KIF5B表達較低,且KIAA1462為分子功能未知的假定蛋白,故不對其進行進一步地分析。所有52個融合基因中,在肝轉移性肺組織中通過WGS僅在KIF5B-RET中檢測到染色體重排(如大的缺失、倒位或易位)。RNA-seq發(fā)現(xiàn)此融合基因高表達34個不一致的雙端序列和60個跨越融合交界的生長序列。分析還發(fā)現(xiàn),KIF5B的第16個外顯子末端與RET原癌基因的第12個外顯子的起始端整合。10p11.22-q11.21的臂間倒位導致融合基因KIF5BRET。這些外顯子的RNA表達水平顯示,大部分RET表達來自融合基因,而不是野生型RET基因。隨后的重復研究在20個原發(fā)肺ADC的2個病例中證實了KIF5B-RET融合基因的出現(xiàn)。KIF5B中DNA雙鏈斷裂似乎是可變,3個患者中RET的第12個外顯子與KIF5B在不同位點結合(所檢測的患者為外顯子16,2個驗證的患者為外顯子15和23)。研究顯示,KIF5B-RET融合基因為NSCLCs的一個子集,還指出嵌合癌基因是采用相應抑制劑進行未來個體化治療的潛在分子靶標。
最近,有2項研究還發(fā)現(xiàn)肺癌中存在KIF5B-RET融合[34,35]。Kohno等采用逆轉錄PCR和Sanger測序分析了319個日本ADC患者的樣本[34]。其中,30個采用RNA-seq進行分析。研究發(fā)現(xiàn)6個非吸煙患者攜帶KIF5B和RET融合基因。資料顯示,染色體10p11.2上的KIF5B內(nèi)含子15、16、23或24與染色體10q11.2上的RET內(nèi)含子7或11融合。FISH驗證了染色體10的著絲粒區(qū)域的長臂和斷臂間存在重排。KIF5B-RET融合陽性患者的RET表達比其他人高30倍,與Ju等的結論一致,其結論認為大部分RET癌基因來自融合基因[33]。在另一項81例美國患者和34例挪威患者的研究中,1例曾吸煙的美國患者存在KIF5B-RET融合陽性。KIF5B-RET融合和吸煙狀態(tài)的關系未明。在融合陽性的患者中發(fā)現(xiàn)KIF5B-RET蛋白Tyr905的磷酸化,提示RET融合是既往未知的突變。在另一項Lipson及其同事的研究中,研究者分析了24個福爾馬林固定石蠟包埋的NSCLC組織樣本[35]。發(fā)現(xiàn)1例44歲男性非吸煙者存在KIF5B-RET融合陽性。進一步的篩查發(fā)現(xiàn),11例患者(561例肺ADC患者中)存在KIF5B-RET融合。
“癌癥標志”是指一組對腫瘤發(fā)生至關重要的細胞特性。Imielinski等通過對183例肺ADC腫瘤和正常DNA配對的全外顯子組或全基因組進行大規(guī)模并行測序繪制了癌癥標志[36]。這183個病例的外顯子區(qū)域存在77,736個體細胞變異,平均為11.9個突變/Mb。與非吸煙患者相比,吸煙患者的外顯子突變率明顯升高(P=1.9×10-9)。CpG二核苷酸的C→T轉換(CpG→T)和C→A顛換是最常見的突變特征。A→C最少見。5個突變譜聚類與患者的臨床特征相關。聚類1(富集CpG→T突變,且總突變率較低)多見于非吸煙或輕度吸煙的患者(P=3.0×10-9)。聚類4(除了CpG結構和TpC突變?yōu)門或G外,還有C→T)與晚期明顯相關(IIIb期或IV期;P=0.006,3)。4個高突變率的分析發(fā)現(xiàn)了共計25個明顯的突變基因,部分基因之前已知,為TP53(頻率與既往報道一致,為50%)、KRAS(27%)、EGFR(17%)、STK11(15%)、KEAP1(12%)、ATM、NF1(11%)、BRAF(8%)和SMAD4(3%)。其余未見報道,為SMARCA4、ARID1A、RBM10、SETD2、PICK3CA、CBL、FBXW7、PPP2R1A、RB1、CTNNB1、U2AF1、KIAA0427、PTEN、BRD3、FGFR3和GOPC。對這25個基因的進一步相關分析顯示,EGFR突變與KRAS突變明顯相斥(P=3.3×10-4);EGFR突變與非/輕度吸煙(P=2.0×10-6)及突變譜聚類1相關(P=0.001,5),KRAS、STK11、SMARCA4和KEAP1與突變譜聚類1和非/輕度吸煙狀態(tài)負相關(P<0.005);突變譜聚類3除了CpG外還有C→A顛換,富含KRAS變異(P=0.000,71);STK11與突變譜聚類2(CpG→T轉換和CpG→A顛換;P=0.002,6)相關;NF1與U2AF1可同時發(fā)生。PFS的相關分析顯示,U2AF1和TP53突變導致生存期縮短(分別為P=0.000,11和0.001,4)。U2AF1為最明顯的突變基因之一,在患者中的發(fā)生率為3%。5個病例中有4個發(fā)現(xiàn)相同的c.101C>T、p.S34F突變。在這4個病例中,1例為KRAS突變陽性,提示U2AF1具有獨立地致癌作用。RBM10占突變的7%(12/183)。RBM10高表達,為RNA結合蛋白。RBM10與KRAS、EGFR或PIK3CA可同時發(fā)生。ARID1A在患者中的陽性率為8%,在SWI-SNF染色質重塑復合物中編碼重要的蛋白質。WGS揭示了范圍廣泛的總重排、基因重排和基因組的復雜性。通過檢測肺癌中新的激酶基因的潛在活化框內(nèi)重排發(fā)現(xiàn)了EGFR的兩個外顯子缺失。這一重排發(fā)生在EGFR的C末端(由外顯子25和26編碼),且可見另一變異(p.G719S突變)。在NIH 3T3細胞中進一步研究了該突變,發(fā)現(xiàn)EGFR和AKT磷酸化增多,EGF磷酸化未見增加。在Ba/F3細胞中,致癌EGFR缺失突變導致增殖,該增殖可被厄洛替尼(一種EGFR TKI)阻止。WGS分析還發(fā)現(xiàn)SIK2和ROCK1的框內(nèi)重排。該研究有助于肺ADC基因組變異的完成和表征。
表 3 癌癥基因組圖譜項目公布的肺癌的下一代基因測序
Ding等報道了一項在188例肺ADC中進行的合作研究,發(fā)現(xiàn)了26個與癌變相關的高變頻基因,包括EGFR同類物ERBB4、ERBB3和ERBB2[37]。在這26個基因中,Greulich等選擇了6個受體酪氨酸激酶基因(EPHA3、ERBB4、FGFR4、NTRK3、NTRK2和ERBB2)來研究肺ADC中基因突變的功能意義[38]。他們發(fā)現(xiàn)ERBB2的致癌胞外區(qū)突變,該突變可使NIH 3T3細胞具有錨著獨立性。ERBB2的活化通過增加羧基端尾部的磷酸化或共價二聚化來啟動。胞外區(qū)突變的ERBB2的抑制劑為治療選擇提供了希望,促使了一項臨床試驗來研究肺癌中ERBB2的抑制劑。他們的結果與癌癥基因組圖譜(The Cancer Genome Atlas, TCGA)的結論一致,TCGA結論認為ERBBs可能是以下討論的一種分子靶標[39]。
國際癌癥基因組協(xié)會(International Cancer Genome Consortium, ICGC)舉國際之力調查癌癥的全球圖譜并全面鑒定與腫瘤相關的基因組、轉錄組和表觀基因改變,包括50種癌癥類型的基因組缺失或擴增、體細胞突變、基因重排、表觀遺傳修飾和基因的異常表達[10,102]。目前,15個行政轄區(qū)的51個組已加入ICGC,包括亞洲、澳洲、歐洲和北美洲,共研究超過24,000個腫瘤基因組[102]。TCGA計劃于2005年由國家癌癥研究院和國家人類基因組研究院啟動,有助于ICGC。TCGA通過NGS技術為癌癥分子特征提供了更全面的認識。TCGA納入了超過20種癌癥常見類型(包括肺癌),每種癌癥類型有500個樣本。致力于不同但相關項目的研究和技術團隊的國家網(wǎng)絡表現(xiàn)出了極大的進展,總結見表3[40,103]。
作為TCGA項目的一部分,一項旨在全面表征SCC基因組和表觀基因組圖譜、發(fā)現(xiàn)SCC潛在治療方法的大型隊列研究于近年公布[39]。在該研究納入的178例患者中,96%有吸煙史。研究發(fā)現(xiàn)了復雜的基因組變異,每一腫瘤平均含有360個外顯子突變、165個基因組重排和323個拷貝數(shù)目變異的片段。染色體3q的選擇性擴增是SCC與肺ADC的最大區(qū)別。研究發(fā)現(xiàn)有50個峰存在明顯的擴增或缺失。在這些變異中,有一些體細胞拷貝數(shù)目變異曾被報道,包括SOX2、PDGFRA和/或KIT、EGFR、FGFR1和/或WHSC1L1、CCND1和CDKN2A。對SCC患者而言,最常見的突變?yōu)镃pG的轉換和顛換。該研究識別出10個復發(fā)突變基因(TP53、CDKN2A、PTEN、PIK3CA、KEAP1、MLL2、HLA-A、NFE2L2、NOTCH1和RB1)。TP53突變最為頻繁(81%)。有研究識別出4條明顯變異的通路,為NFE2L2和KEAP1和/或CUL3缺失或突變(34%),鱗狀細胞分化(44%),磷脂酰肌醇-3-OH激酶通路(47%)以及CDKN2A和RB1(72%)。KEAP1和CUL3突變與功能喪失相關。鱗狀細胞分化基因包括SOX2和TP63的過表達和擴增,NOTCH1、NOTCH2、ASCL4的功能喪失突變和FOXP1的局部缺失。CDKN2A是編碼p16INK4A和p14ART蛋白的腫瘤抑制基因。
伴隨潛在靶標基因的篩查及藥物研發(fā)的需要,研究者建議了3個分子靶向策略:ERBBs、FGFRs和JAKs,這三者均被發(fā)現(xiàn)有突變和/或擴增。ERBB2的結果與Greulich等的結論(ERBB2可能是靶向治療的獨特機會)[38]相符。此外,Govindan等在2012年的美國臨床腫瘤學會會議上呈現(xiàn)了178例SCC患者的全部基因組特征[41]。他們發(fā)現(xiàn)了30個明顯體細胞拷貝數(shù)目變異的位點和13個明顯突變的基因(包括TP53、CDKN2A、PTEN、KEAP1和NFE2L2),識別出4個不同的表達:NFE2L2和KEAP1突變、FGFR激酶變異、總體甲基化增加和煙草使用率最高。72%的病例存在CDKN2A缺失。對于現(xiàn)有可用藥物,75%的患者含有潛在的分子靶標。
TCGA整合了研究機構間大量系統(tǒng)網(wǎng)絡的測序數(shù)據(jù)。事實上整個研究機構可以訪問所有的數(shù)據(jù)資料,從而加速從研究發(fā)現(xiàn)到臨床的轉化工作。TCGA組的進展顯示許多基因組信息穿插在不同的腫瘤類型間[42-44],包括肺癌。此外,源自TCGA的數(shù)據(jù)也可能用于驗證原創(chuàng)研究的結果[45],或作為質量控制[46]。
2003年人類基因組計劃完成后,NGS技術改進明顯增加了基因組數(shù)據(jù)量,這些數(shù)據(jù)由檢測罕見結構變異中基因組覆蓋范圍和細微差別增多的研究產(chǎn)生。隨著技術改進,這些技術在研究中的實用性及其潛在臨床應用也有所增加。NGS方法允許我們深入挖掘遺傳密碼,以識別大量潛在的基因和基因組差異(如結構異常、拷貝數(shù)目增加和體細胞SNVs)。他們?yōu)槲覀兲峁┝私饷馨┌Y基因組中復雜基因改變的工具。通過提供既往已知疾病/治療相關基因靶標的全面基因組圖譜,NGS可能提高我們選擇恰當?shù)闹委熕幬锏哪芰?。而且,NGS發(fā)現(xiàn)了許多其它的基因組標記物,它們對致病/治療很重要。通過該方法產(chǎn)生的數(shù)據(jù)使研究者可以實施旨在提高我們對生物學和患者治療的認識的系統(tǒng)生物學研究,最終實現(xiàn)真正地個體化用藥。如本綜述所總結,NGS為探索更多的基因變異提供了機會,這些基因變異可能導致有前景的治療靶標。此外,國際間合作網(wǎng)絡通過研究機構分享數(shù)據(jù)庫和技術,如ICGC,會加快每一個體患者突變圖譜發(fā)現(xiàn)的步伐。NGS相關的臨床挑戰(zhàn)是,所述病癥并不總是與臨床實踐中所觀察到的疾病相關[15]。通過使用有效的靶向治療,大多數(shù)現(xiàn)已識別的突變并未轉化至臨床實踐。點突變的有效使用仍為實現(xiàn)癌癥個體化用藥的一項挑戰(zhàn)。
即使有了這些進展,挖掘NGS分析產(chǎn)生的龐大數(shù)據(jù)集進行分析并將其轉化為醫(yī)療保健仍具有挑戰(zhàn)性。疾病的異質性以及患者伴有其它環(huán)境影響,增加了解釋NGS結果的難度。為了將NGS結果真正地轉化為臨床癌癥治療,需要進一步采用先進的軟件程序進行生物信息學分析、對NGS結果進行功能驗證和臨床試驗確認。
有證據(jù)表明,攜帶既往已知靶標如EGFR和ALK重排的患者可獲益于相應的抑制劑治療[20]。傳統(tǒng)方法無法解釋一些患者可獲益于臨床上地初始治療,但會發(fā)展為耐藥并對該治療產(chǎn)生不同反應。NGS可能通過采用更多的全面測序來明確病因。比如,Marchetti等發(fā)現(xiàn)了外顯子19的復雜突變和缺失亞群[28]。NGS有助于為患者尋找恰當?shù)陌邢蛑委?。而且,現(xiàn)有可用的分子靶向藥物在肺ADC中普遍使用。NGS還有望發(fā)現(xiàn)其它肺癌類型的藥物靶標。此外,NGS無疑會改善癌癥診斷,這些不在本綜述范圍之內(nèi)。預計將有更有效的靶標和生物標記物被發(fā)現(xiàn)和驗證,就像采用NGS分析所產(chǎn)生的癌癥領域的發(fā)現(xiàn)會有持續(xù)進展一樣。NGS技術還有助于提高我們對癌癥致病基因突變/變異的認識,期待有更多生物標記物和潛在藥物靶標通過NGS被發(fā)現(xiàn)。
Financial & competing interests disclosure
The authors have no relevant affliations or financial involvement with any organization or entity with a financial interest in or financial conflict with the subject matter or materials discussed in the manuscript. This includes employment, consultancies,honoraria, stock ownership or options, expert testimony, grants or patents received or pending, or royalties.
No writing assistance was utilized in the production of this manuscript.
注:本表得到版權所有者 ? 2013 Future Medicine Ltd復制許可。