盛杰,王玉欣,齊江發(fā),杜慶,徐瑤
·綜 述·
單分子測序技術(shù)在腫瘤診斷中的應(yīng)用研究進(jìn)展
盛杰,王玉欣,齊江發(fā),杜慶,徐瑤
武漢科技大學(xué) 生命科學(xué)與健康學(xué)院 生物醫(yī)學(xué)研究院,湖北 武漢 430081
腫瘤的發(fā)生發(fā)展通常與多個基因的遺傳突變、表達(dá)異常有關(guān),全面深入地分析腫瘤基因組、轉(zhuǎn)錄組及表觀遺傳組學(xué)對于快速剖析疾病特定基因簇及修飾位點(diǎn)至關(guān)重要。之前,研究者們主要采用第二代測序技術(shù)進(jìn)行有效信息的挖掘,然而隨著研究的不斷深入,第二代測序技術(shù)表現(xiàn)出諸如序列拼接困難、低豐度難以檢出等缺點(diǎn)。因此,單分子測序技術(shù)以其獨(dú)特的優(yōu)勢應(yīng)運(yùn)而生,文中主要對單分子測序技術(shù)在幾種常見腫瘤中的研究現(xiàn)狀進(jìn)行了綜述,并展望了其在臨床診斷中的應(yīng)用前景。
單分子測序技術(shù),單分子實(shí)時測序,腫瘤,臨床診斷
DNA測序技術(shù)能夠快速、準(zhǔn)確地檢測基因遺傳突變及疾病相關(guān)基因的異常表達(dá),因而在腫瘤臨床診斷中具有潛在的應(yīng)用價值?;驕y序技術(shù)經(jīng)歷了幾個重要的發(fā)展階段,第一代測序技術(shù)主要包括Sanger測序法(雙脫氧鏈終止法)[1]和化學(xué)降解法[2],但其測序費(fèi)用昂貴、耗時長,因此難以普及。隨著技術(shù)的不斷發(fā)展與改進(jìn),第二代測序技術(shù)應(yīng)運(yùn)而生,主要包括Roche公司的454技術(shù)、Illumina公司的Solexa技術(shù)和ABI公司的SOLID技術(shù),第二代測序技術(shù)顯著提高了測序通量,并且能夠通過結(jié)合PCR擴(kuò)增和熒光標(biāo)記成像技術(shù)獲取全部的遺傳信息[3]。與第一代相比,第二代測序技術(shù)大幅度地降低測序成本、節(jié)約測序時間,但其讀長較短,給基因組重復(fù)區(qū)域的序列組裝、序列匹配等下游分析造成了諸多困難。前期在腫瘤中的測序結(jié)果顯示,短的讀取長度會引起基因組高復(fù)雜度的區(qū)域組裝錯誤,此外,還存在測序間隙(Gap) 區(qū)增多、低豐度難以檢出等缺點(diǎn)[4]。針對以上問題,第三代測序技術(shù),即單分子測序逐漸發(fā)展起來,彌補(bǔ)了第二代測序讀長較短的劣勢,可以對基因組的某些區(qū)域直接測序。在腫瘤檢測方面,單分子測序技術(shù)具有其獨(dú)特的優(yōu)勢,不僅可以檢測基因遺傳突變,還可以通過檢測表觀遺傳修飾位點(diǎn)[5]、長鏈非編碼RNA (Long non-coding RNA,lncRNA) 豐度[6]等對腫瘤進(jìn)行分級和分型。本文將重點(diǎn)闡述單分子測序技術(shù)在乳腺癌、非小細(xì)胞肺癌、卵巢癌、前列腺癌中的研究現(xiàn)狀,探討其臨床應(yīng)用前景。
單分子實(shí)時測序技術(shù)(Single molecule real-time,SMRT) 是指在使用4種不同熒光標(biāo)記的脫氧核糖核苷酸(dNTPs) 進(jìn)行連續(xù)的模板合成過程中,從DNA聚合酶中獲取單分子實(shí)時測序數(shù)據(jù)的一項(xiàng)技術(shù)[7]。實(shí)驗(yàn)原理是將待測DNA模板結(jié)合的DNA聚合酶分子固定在一個納米級檢測室(Zero- mode waveguides,ZMWs) 的底部,然后加入4種不同的熒光標(biāo)記的dNTPs,使用激光照射ZMW的底部。由于ZMW是一種簡單的納米孔結(jié)構(gòu),且該孔比單個激光波長還要短以至于激光在孔的附近發(fā)生光的衍射,只能激發(fā)ZMW檢測室[3]。因此,在ZMW區(qū)域內(nèi)的堿基攜帶的熒光基團(tuán)能夠被直接檢測到(圖1)。SMRT技術(shù)可以在高濃度下分離單個分子進(jìn)行光學(xué)分析,從而確定單分子水平上的熒光變化[8]。
SMRT技術(shù)采用的熒光標(biāo)記方法也是其一大特色。雖然之前有其他的測序方法使用了熒光標(biāo)記,但是其熒光基團(tuán)被標(biāo)記在甲基上,在DNA鏈延伸的過程中不會被去掉,造成空間位阻,引起序列錯讀[9]。SMRT技術(shù)是在核苷酸的磷酸基團(tuán)上進(jìn)行熒光標(biāo)記,隨著DNA鏈的延伸,磷酸鍵斷開,熒光標(biāo)記被去掉,不會造成空間位阻[10],因此,SMRT技術(shù)可以讀取更長的DNA序列。此外,由于檢測室底部的DNA聚合酶活性會受到激光照射的影響,限制了DNA序列的連續(xù)合成[3],但該技術(shù)已經(jīng)是DNA測序史上的一個里程碑。
與第二代測序相比,單分子測序技術(shù)具有其獨(dú)特的優(yōu)勢(表1)。本課題組早期利用第二代測序平臺檢測的腫瘤轉(zhuǎn)錄組數(shù)據(jù)顯示,有許多關(guān)鍵基因序列被漏檢,尤其是具有特殊結(jié)構(gòu)的區(qū)域。主要是由于第二代測序技術(shù)需進(jìn)行PCR擴(kuò)增,而高GC或AT含量都不易進(jìn)行PCR擴(kuò)增,進(jìn)而影響基因組測序的完整性。此外,高GC含量的序列難以被打斷成小片段,因而無法讀取。高AT含量的序列只能通過降低引物延伸溫度等方法得到輕微的改善,最終導(dǎo)致PCR擴(kuò)增片段庫中缺乏富含AT的片段[11]??偠灾诙鷾y序技術(shù)在建庫過程中需要擴(kuò)增和分段環(huán)節(jié),二者都可能在讀取和序列組裝中引入大量偏差和錯誤[12-14]。然而,單分子測序技術(shù)無需進(jìn)行PCR擴(kuò)增,可 以完全避免產(chǎn)生上述影響,還能最大限度地節(jié)約成本。
圖1 單分子實(shí)時測序的原理示意圖
單分子測序技術(shù)的建庫和測序步驟比第二代測序更為簡便,能夠快速地對全基因組序列進(jìn)行測序拼接,極大地縮短測序時間。針對三代測序產(chǎn)生較高隨機(jī)測序錯誤的特點(diǎn),SMRT技術(shù)可通過置換聚合酶對模板進(jìn)行多次測序,使模板中每個堿基被多次讀取,從而提高測序的準(zhǔn)確性[15]。
與第二代測序技術(shù)不同的是,單分子測序可以更加精確地檢測基因組單核苷酸多態(tài)性(Single nucleotide polymorphisms,SNPs)、基因重排和大的結(jié)構(gòu)變異,如拷貝數(shù)變異,發(fā)現(xiàn)更多新的突變,并對變異位點(diǎn)進(jìn)行準(zhǔn)確定位[16-17]。此外,單分子測序還可以直接檢測表觀遺傳信息,當(dāng)堿基存在修飾時,DNA聚合酶的合成速度會減慢,不同的修飾類型會引起聚合酶合成過程的“停頓模式”產(chǎn)生微小差異,這些差異將反映在熒光脈沖信號的間隔上,最終通過對應(yīng)的軟件分析即可確定堿基修飾類型[18]。目前,單分子測序技術(shù)可以檢測5-hC、5-hmU、5-hU、1-mA、6-mA、8-oxoA、BPDE、6-mT、6-mG等堿基修飾,甚至可以鑒別傳統(tǒng)亞硫酸氫鹽測序法無法區(qū)分的甲基化修飾和羥甲基化修飾??傊摷夹g(shù)使得從DNA上同時獲得基因組序列信息和單核苷酸水平的表觀遺傳信息成為可能,為深入解析生物體不同代謝過程的表觀調(diào)控機(jī)制提供重要的技術(shù)支撐[19]。目前,第二代測序技術(shù)已經(jīng)發(fā)展成熟且在各個研究領(lǐng)域廣泛應(yīng)用,第三代測序技術(shù)還處于快速發(fā)展期,不過憑借著其強(qiáng)大的技術(shù)優(yōu)勢,未來將在基因測序這個大舞臺上大放異彩[20-23]。
腫瘤的發(fā)生與功能基因突變、缺失、異位、重復(fù)、修飾等密切相關(guān)[24]。因此,研究腫瘤基因組學(xué)、轉(zhuǎn)錄組學(xué)、表觀遺傳組學(xué)特征對于探究腫瘤的發(fā)生發(fā)展、轉(zhuǎn)移、復(fù)發(fā)的分子機(jī)制具有重要的指導(dǎo)作用。單分子測序技術(shù)的發(fā)展實(shí)現(xiàn)了對個體染色體的直接測序,有助于建立每個人完善的基因組信息檔案,從分子水平闡明腫瘤的病理生理特征,實(shí)現(xiàn)個性化醫(yī)療。在腫瘤診斷方面,根據(jù)單分子測序的研究結(jié)果,可以鑒定出與腫瘤發(fā)生發(fā)展密切相關(guān)的標(biāo)志分子,并將其應(yīng)用于腫瘤的早期診斷,對于提高腫瘤患者的生存率具有重要的實(shí)際意義[25]。
表1 單分子測序技術(shù)與第二代測序技術(shù)的各項(xiàng)參數(shù)比較
乳腺癌是一種常見的惡性腫瘤,在女性群體中的發(fā)病率遠(yuǎn)遠(yuǎn)高于男性,是導(dǎo)致全球范圍內(nèi)女性患癌死亡的主要原因[26]。早診斷、早治療是提高乳腺癌患者生存率的關(guān)鍵。目前,臨床上主要通過檢測血液中CA153的含量來評價乳腺癌的疾病進(jìn)程,被認(rèn)為是乳腺癌患者診斷和監(jiān)測術(shù)后復(fù)發(fā)、觀察療效較為靈敏的腫瘤標(biāo)志物之一[27]。然而,CA153的單項(xiàng)檢查存在一定的局限性,在乳腺癌的早期診斷過程中,其敏感性和特異性表現(xiàn)不佳。為了開發(fā)理想的臨床診斷模式,提高乳腺癌早期診斷的靈敏度和特異性,科學(xué)家們逐步開展了全基因組范圍內(nèi)的位點(diǎn)篩查工作。
基因突變在人類基因組中廣泛存在,不僅發(fā)生于正常個體的基因組中,與個體發(fā)育、組織器官特征密切相關(guān);而且還在疾病個體的基因組 中頻繁發(fā)生,與疾病的發(fā)生發(fā)展、病理學(xué)變化有關(guān)[28-30]。Garieli 等采用單分子測序技術(shù)對乳腺癌患者基因組進(jìn)行測序,結(jié)果顯示,在乳腺癌相關(guān)基因BRCA1上共檢測到177個SNPs,其中有40個SNPs位點(diǎn)是之前用第二代測序技術(shù)未檢測到的,有24 (60%) 個是新檢測到的Reads。此外,短的插入/缺失突變(1–2 bp) 也較先前的二代測序結(jié)果更為豐富[31]。由此可見,BRCA1基因的遺傳變異可能是乳腺癌的易感因素,將其與現(xiàn)有的檢測手段相結(jié)合,為乳腺癌的風(fēng)險(xiǎn)分析提供遺傳學(xué)基礎(chǔ)。針對基因組中的罕見變異,單分子測序技術(shù)還設(shè)計(jì)了SMRTbellTM模塊,將其放入單分子測序反應(yīng)中,能通過對單個分子的多次傳遞進(jìn)行重復(fù)讀取,從而提高檢出率[32]。在前期乳腺癌單分子測序結(jié)果的基礎(chǔ)上,本課題組在乳腺癌患者和健康個體中驗(yàn)證了VEGF基因的變異情況,結(jié)果發(fā)現(xiàn)與對照組相比,大部分乳腺癌患者VEGF基因的啟動子區(qū)存在18 bp序列的缺失,該突變 能夠直接影響VEGF的啟動子活性及其表達(dá),促進(jìn)了乳腺癌細(xì)胞的遷移和血管形成,提示該突變可能作為乳腺癌的診斷標(biāo)志(Guo等未發(fā)表數(shù)據(jù))。
非編碼RNA參與細(xì)胞的生長、增殖、分裂和分化過程,在重要功能基因表達(dá)調(diào)控方面發(fā)揮著不可或缺的作用,其表達(dá)變化可導(dǎo)致腫瘤的發(fā)展和轉(zhuǎn)移[33-34]。越來越多的證據(jù)表明,lncRNA在乳腺癌的發(fā)生發(fā)展中具有重要的調(diào)控作用[35-36]。Jonsson 等利用單分子測序技術(shù)對雌激素誘導(dǎo)的管腔A型乳腺癌細(xì)胞系(MCF7和T47D) 進(jìn)行轉(zhuǎn)錄組測序,共檢測到2 000個功能基因及1 000個lncRNA受到ERα的調(diào)控,進(jìn)一步研究證實(shí),長鏈非編碼RNA分子LINC01016和LINC00160是ERα的直接靶基因,敲低LINC00160能夠顯著抑制乳腺癌細(xì)胞增殖[37]。由此可見,這些長鏈非編碼RNA可以作為乳腺癌的診斷標(biāo)志,在乳腺癌的臨床檢測中具有潛在的應(yīng)用價值。研究者們之所以選擇單分子測序技術(shù),是因?yàn)閱畏肿訙y序會以一種無偏倚的方式精確檢測到低豐度的轉(zhuǎn)錄本,對所有l(wèi)ncRNA進(jìn)行全面分析。對這些lncRNA基因的特性及其作用模式的解析,有助于改進(jìn)現(xiàn)有的癌癥診斷、監(jiān)測和靶向治療方法。綜上,通過單分子測序技術(shù)已經(jīng)篩選了多個與乳腺癌相關(guān)的靶標(biāo),但要將其應(yīng)用于臨床診斷,還需針對靈敏度、特異性問題等展開深入的研究和評價。
肺癌在全球范圍內(nèi)的發(fā)病率、死亡率逐年上升,嚴(yán)重危害人類健康。有80%的肺癌屬于非小細(xì)胞肺癌(Non-small cell lung cancer,NSCLC),組織類型以腺癌和鱗狀細(xì)胞癌最為常見[38]。小細(xì)胞癌通常對化療和放射治療反應(yīng)敏感,而NSCLC往往需要采用手術(shù)治療。目前,在臨床個體化診療過程中,由于大部分腫瘤患者無法進(jìn)行組織活檢,進(jìn)行初診的非小細(xì)胞肺癌病人往往已到了患病晚期,錯失了手術(shù)治療的最佳時機(jī)[39]。因此,尋找一種全新的、便捷的、準(zhǔn)確診斷非小細(xì)胞肺癌的方法迫在眉睫,尤其是患病早期的診斷對于提高患者生存率至關(guān)重要。
早在1948年,研究人員便在外周血中發(fā)現(xiàn)了游離DNA,且腫瘤患者外周血中DNA含量顯著高于正常人,隨后在這些DNA中檢測到了突變的原癌基因,并且與原發(fā)腫瘤一致,證實(shí)了循環(huán)腫瘤DNA (Circulating tumor DNA,ctDNA) 的存在。ctDNA是一種液體活檢分子,具有分離簡單、易于監(jiān)測等優(yōu)點(diǎn),并且ctDNA的水平隨腫瘤負(fù)荷程度的變化而變化。對ctDNA進(jìn)行測序分析能夠直接反映腫瘤的進(jìn)展情況,有望成為跟蹤腫瘤進(jìn)化的有效工具[40]。由于腫瘤患者外周血中大多數(shù)的游離DNA來自于正常細(xì)胞,ctDNA只占外周血游離DNA的一小部分。因此,對ctDNA含量進(jìn)行檢測的技術(shù),必須能夠?qū)ξ⒘康腸tDNA進(jìn)行準(zhǔn)確檢測與定量。第二代測序技術(shù)在檢測ctDNA過程中存在速度慢、檢出率低等問題[41-42],而單分子測序不僅提高了通量,能夠?qū)ξ⒘縞tDNA進(jìn)行檢測,還大大提高了檢測速率,降低測序成本,因而具有良好的前景。研究者們通過對非小細(xì)胞肺癌患者外周血中的ctDNA進(jìn)行測序分析,發(fā)現(xiàn)EGFR基因中62.5%的突變在ctDNA中被檢測到(包含耐藥突變p.T790M),進(jìn)一步證實(shí)了ctDNA可以作為潛在的腫瘤標(biāo)志物進(jìn)行臨床檢測[43]。此外,非小細(xì)胞肺癌的發(fā)生被發(fā)現(xiàn)與功能基因的序列突變有關(guān),DiBardino等采用第二代測序技術(shù)對22份非小細(xì)胞肺癌的標(biāo)本中467個基因進(jìn)行測序分析,共檢測到204個基因變異位點(diǎn),并且大部分突變都是位于TP53、EGFR、EPHB1、MLL3、APC等非小細(xì)胞肺癌相關(guān)基因上[44]。鑒于與NSCLC腫瘤相關(guān)臨床致癌突變的多樣性,急需一種更全面的方法,能夠提高致癌位點(diǎn)的檢出率,以評估患者的腫瘤突變情況。Shi等通過單分子測序技術(shù)評估了154例非小細(xì)胞肺癌標(biāo)本中上皮生長因子受體EGFR、KRAS、BRAF和ALK突變的類型、頻率和豐度,結(jié)果發(fā)現(xiàn)有44.2%的突變位于EGFR基因上,且突變多為雜合型,說明EGFR突變是非小細(xì)胞肺癌的易感因素[17]。目前,在非小細(xì)胞肺癌基因組測序的文獻(xiàn)中大多采用了第二代測序技術(shù),相信隨著單分子測序的不斷發(fā)展和應(yīng)用,會有越來越多的疾病敏感位點(diǎn)被檢測出來。
卵巢癌是最致命的婦科惡性腫瘤之一,其明顯特征是發(fā)病隱匿,病程進(jìn)展迅速,在患病早期即可發(fā)生轉(zhuǎn)移、擴(kuò)散[45]。據(jù)統(tǒng)計(jì),70%–80%的卵巢癌患者在進(jìn)行入院初診時已處于疾病晚期,5年生存率僅20%–30%,而早期的卵巢癌患者生存率可達(dá)90%。因此,提高卵巢癌的早期臨床診斷水平,對于爭取最佳的治療時機(jī)和改善預(yù)后都具有重要意義。
研究發(fā)現(xiàn),在卵巢癌患者的基因組中存在大規(guī)模的拷貝數(shù)變異,導(dǎo)致轉(zhuǎn)錄元件的異常結(jié)合和轉(zhuǎn)錄錯誤。Ayhan 等研究發(fā)現(xiàn),CCNE1基因拷貝數(shù)的增加與卵巢癌相關(guān)基因ARID1A、PIK3CA和ZNF217等的異常轉(zhuǎn)錄和表達(dá)有關(guān),并且攜帶該結(jié)構(gòu)變異的患者預(yù)后較差[46]。因此,對卵巢癌患者基因組和轉(zhuǎn)錄本的全面解析有助于開發(fā)新的治療策略和靶向藥物。近年來,第二代高通量測序技術(shù)的發(fā)展加速了人們對遺傳基礎(chǔ)的認(rèn)識,在一定程度上解釋了卵巢癌的遺傳發(fā)病機(jī)理[47-48]。然而,第二代測序平臺有多種限制因素,在序列裝配過程中容易引入錯誤[12]。通常情況下,腫瘤組織中的轉(zhuǎn)錄本具有豐富的多樣性,目前的工作流程無法準(zhǔn)確地解析轉(zhuǎn)錄起始位點(diǎn)、剪切連接、聚腺苷酸化的位置和基因融合事件[14]。第三代測序技術(shù),如SMRT,可以產(chǎn)生較長的讀取序列(>10 kb),有時可以跨越整個轉(zhuǎn)錄單元,避免了對異構(gòu)體進(jìn)行后續(xù)組裝[49]。單分子測序技術(shù)還使用了一系列的方法來糾正錯誤,包括多次讀取循環(huán)模板,以及結(jié)合第二代高保真度短片段的混合測序方法,最終提高測序的準(zhǔn)確性[32]。Jing 等整合了第二代測序平臺和單分子測序平臺,對卵巢癌患者的完整基因組和轉(zhuǎn)錄組進(jìn)行測序分析,獲得了受轉(zhuǎn)移性上皮性卵巢癌影響的患者基因組多維數(shù)據(jù)集,特別是通過單分子測序鑒定了大量未注釋的新的轉(zhuǎn)錄本、新的長鏈非編碼RNA和基因嵌合體,并對基因轉(zhuǎn)錄起始、剪接、多聚腺苷酸和融合位點(diǎn)進(jìn)行準(zhǔn)確定位,該研究發(fā)現(xiàn)了多個與卵巢癌相關(guān)的功能基因轉(zhuǎn)錄本和非編碼RNA[50]。Winterhoff 等通過測序比較了卵巢癌上皮細(xì)胞和基質(zhì)細(xì)胞中的轉(zhuǎn)錄組數(shù)據(jù),結(jié)果顯示,調(diào)節(jié)細(xì)胞外基質(zhì)和上皮間質(zhì)轉(zhuǎn)化的基因在基質(zhì)細(xì)胞中高表達(dá)[51]。然而,這些基因能否用于卵巢癌的臨床診斷及監(jiān)測,還需在體內(nèi)外對其分子調(diào)控機(jī)制展開深入研究。
前列腺癌是一種男性常見的惡性腫瘤,在歐美發(fā)達(dá)國家發(fā)病率很高,是男性癌癥并引起死亡的第二大原因,僅在美國每年就有約3萬人因此而死亡[52]。我國前列腺癌的發(fā)病率也呈逐年增高的趨勢,在男性泌尿系統(tǒng)腫瘤中占居第三位。研究表明,前列腺癌的腫瘤異質(zhì)性特征使其在進(jìn)展速度上產(chǎn)生顯著差異,目前,臨床上尚無有效的方法能夠在治療前準(zhǔn)確區(qū)分惰性腫瘤和侵襲性腫瘤。因此,開發(fā)精準(zhǔn)的診斷和預(yù)后工具,給患者提供個性化的治療和監(jiān)測平臺,對于識別易發(fā)生前列腺癌的種系突變、評估特定的體細(xì)胞遺傳事件與臨床病理信息的相關(guān)性至關(guān)重要。
前列腺特異抗原(Prostate specific antigen, PSA)是目前被廣泛應(yīng)用于臨床診斷前列腺癌的關(guān)鍵指標(biāo),但是PSA存在靈敏度和特異性較低的缺點(diǎn),不能準(zhǔn)確鑒別前列腺良性增生和前列腺癌,在早期診斷方面表現(xiàn)不佳[53]。隨著分子檢測技術(shù)的不斷發(fā)展,越來越多的與前列腺癌發(fā)生發(fā)展相關(guān)的基因、變異位點(diǎn)、非編碼RNA等特異性標(biāo)志物被鑒定出來?;虮磉_(dá)差異數(shù)據(jù)顯示,前列腺癌基因3(PCA3)在癌組織中的表達(dá)水平是正常組織的6–34倍,進(jìn)一步臨床檢測結(jié)果證明PCA3的敏感性和特異性均高于PSA[54]。Zhang 等采用第二代測序和全基因組關(guān)聯(lián)分析方法篩選了與前列腺癌相關(guān)的SNP位點(diǎn),共鑒定出位于11個數(shù)量性狀基因的56個SNPs位點(diǎn),其基因型頻率在前列腺癌患者與正常人之間存在顯著差異,其中,和兩個位點(diǎn)可能是前列腺癌的主要風(fēng)險(xiǎn)因素[55]。針對前列腺癌的空間異質(zhì)性、瘤內(nèi)異質(zhì)性和瘤間異質(zhì)性,單分子測序技術(shù)能夠檢測來自前列腺不同側(cè)腫瘤細(xì)胞的完整的基因組信息,并對差異位點(diǎn)進(jìn)行準(zhǔn)確定位,有助于了解前列腺癌的進(jìn)展和克隆進(jìn)化。Su 等對不同部位的前列腺癌組織進(jìn)行單分子測序,結(jié)果發(fā)現(xiàn)TP53突變存在顯著差異,這對于制定前列腺癌的診斷和治療方案具有重要的指導(dǎo)意義[56]。此外,Tevz等采用單分子測序技術(shù)PacBio SMRT,對前列腺癌患者RLN1和RLN2兩個轉(zhuǎn)錄本進(jìn)行檢測,發(fā)現(xiàn)融合的RLN1-RLN2在前列腺癌細(xì)胞中高表達(dá),預(yù)示其可能參與前列腺癌的發(fā)病過程[57]。然而,這些因子參與前列腺癌發(fā)生發(fā)展的分子調(diào)控機(jī)制還有待進(jìn)一步闡明。總之,通過對高通量測序數(shù)據(jù)的有機(jī)整合,篩選出具有高靈敏度和高特異性的聯(lián)合檢測體系,將成為未來前列腺癌臨床診斷的新標(biāo)準(zhǔn)。
單分子測序技術(shù)不僅能夠從基因遺傳突變方面和表觀遺傳修飾方面解析人類基因組多樣性,還可以對人類重大疾病如腫瘤進(jìn)行分級、分型。在遺傳多態(tài)性檢測方面,單分子測序技術(shù)能夠?qū)γ恳粭lDNA鏈進(jìn)行單獨(dú)測序,利用了聚合酶自身的反應(yīng)速度,大大減少了測序時間,不需要進(jìn)行聚合酶鏈?zhǔn)椒磻?yīng),讀長較長,能夠?qū)?fù)雜基因組進(jìn)行測序。在表觀遺傳學(xué)方面,單分子測序技術(shù)能夠直接檢測DNA的堿基修飾位點(diǎn),而這些修飾又常常與癌癥相關(guān),彌補(bǔ)了之前測序技術(shù)不能涉及的領(lǐng)域。雖然單分子測序具有明顯的技術(shù)優(yōu)勢,但該技術(shù)的測序錯誤率較高,極大限制了其應(yīng)用和普及。因此,研發(fā)更高效的糾錯算法或提高測序準(zhǔn)確率才能推動單分子測序技術(shù)的發(fā)展,有助于解析個體化遺傳圖譜及疾病相關(guān)的敏感位點(diǎn)。
由于單分子測序摒棄了二代測序中大量使用的PCR技術(shù),能夠?qū)崿F(xiàn)最自然條件下DNA原始序列的測序,因此,在腫瘤診斷方面具有廣闊的應(yīng)用前景。目前,已經(jīng)有多個潛在的腫瘤標(biāo)志物被鑒定出來。然而,這些標(biāo)志因子所參與的信號通路、分子調(diào)節(jié)機(jī)制,及其能否組合使用進(jìn)行臨床診斷等問題還有待進(jìn)一步研究。相信在不久的將來,隨著技術(shù)的不斷改進(jìn)和完善,單分子測序必然會進(jìn)一步推動基因組學(xué)、轉(zhuǎn)錄組學(xué)和表觀遺傳組學(xué)深度覆蓋鑒定和定量技術(shù)的進(jìn)步,為開發(fā)更加有效的腫瘤臨床診斷策略提供堅(jiān)實(shí)的技術(shù)支撐。
[1] Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci USA, 1977, 74(12): 5463–6467.
[2] Berenbaum MR.-its evolution and adaptation.Proc Natl Acad Sci USA, 2019, 116(3): 704–706.
[3] Ortiz-Cuaran S, Scheffler M, Plenker D, et al. Heterogeneous mechanisms of primary and acquired resistance to third-generation EGFR inhibitors.Clin Cancer Res, 2016, 22(19): 4837–4847.
[4] Buermans HPJ, den Dunnen JT. Next generation sequencing technology: advances and applications.Biochim Biophys Acta, 2014, 1842(10): 1932–1941.
[5] Ameur A, Kloosterman WP, Hestand MS. Single-molecule sequencing: towards clinical applications.Trends Biotechnol, 2019, 37(1): 72–85.
[6] Jenjaroenpun P, Wongsurawat T, Pereira R, et al. Complete genomic and transcriptional landscape analysis using third-generation sequencing: a case study of Saccharomyces cerevisiae CEN.PK113–7D.Nucleic Acids Res, 2018, 46(7): e38.
[7] Ardui S, Ameur A, Vermeesch JR, et al. Single molecule real-time (SMRT) sequencing comes of age: applications and utilities for medical diagnostics.Nucleic Acids Res, 2018, 46(5): 2159–2168.
[8] Zhu P, Craighead HG. Zero-mode waveguides for single-molecule analysis.Annu Rev Biophys, 2012, 41: 269–293.
[9] Braslavsky I, Hebert B, Kartalov E, et al. Sequence information can be obtained from single DNA molecules.Proc Natl Acad Sci USA, 2003, 100(7): 3960–3964.
[10] Korlach J, Bjornson KP, Chaudhuri BP, et al. Real-time DNA sequencing from single polymerase molecules.Methods Enzymol, 2010, 472: 431–455.
[11] Aird D, Ross MG, Chen WS, et al. Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries.Genome Biol, 2011, 12(2): R18.
[12] Alkan C, Sajjadian S, Eichler EE. Limitations of next-generation genome sequence assembly.Nat Methods, 2011, 8(1): 61–65.
[13] Steijger T, Abril JF, Engstr?m PG, et al. Assessment of transcript reconstruction methods for RNA-seq.Nat Methods, 2013, 10(12): 1177–1184.
[14] Niu BF, Fu LM, Sun SL, et al. Artificial and natural duplicates in pyrosequencing reads of metagenomic data.BMC Bioinformatics, 2010, 11: 187.
[15] Lou DI, Hussmann JA, McBee RM, et al. High-throughput DNA sequencing errors are reduced by orders of magnitude using circle sequencing.Proc Natl Acad Sci USA, 2013, 110(49): 19872–19877.
[16] Gao Y, Deng LW, Yan Q, et al. Single molecule targeted sequencing for cancer gene mutation detection.Sci Rep, 2016, 6: 26110.
[17] Shi J, Yuan M, Wang ZD, et al. Comprehensive profiling and quantitation of oncogenic mutations in non-small cell lung carcinoma using single-molecule amplification and re-sequencing technology.Tumour Biol, 2017, 39(2): 1–6.
[18] Flusberg BA, Webster DR, Lee JH, et al. Direct detection of DNA methylation during single-molecule, real-time sequencing.Nat Methods, 2010, 7(6): 461–465.
[19] Tommas S, Danza K, Pilato B, et al. Innovative technology for cancer risk analysis.Ann Oncol, 2011, 22 Suppl 1: i37–i43.
[20] Rhoads A, Au KF. PacBio sequencing and its applications.Genomics Proteomics Bioinformatics, 2015, 13(5): 278–289.
[21] Quail MA, Smith M, Coupland P, et al. A tale of three next generation sequencing platforms: comparison of ion torrent, pacific biosciences and illumina MiSeq sequencers.BMC Genomics, 2012, 13: 341.
[22] Levy SE, Myers RM. Advancements in next-generation sequencing.Annu Rev Genomics Hum Genet, 2016, 17: 95–115.
[23] Nakamura K, Oshima T, Morimoto T, et al. Sequence-specific error profile of Illumina sequencers.Nucleic Acids Res, 2011, 39(13): e90.
[24] De S, Ganesan S. Looking beyond drivers and passengers in cancer genome sequencing data.Ann Oncol, 2017, 28(5): 938–945.
[25] Milos PM. Emergence of single-molecule sequencing and potential for molecular diagnostic applications.Expert Rev Mol Diagn, 2009, 9(7): 659–666.
[26] Harbeck N, Gnant M. Breast cancer.Lancet, 2017, 389(10074): 1134–1150.
[27] Li X, Dai DN, Chen B, et al. Clinicopathological and prognostic significance of cancer antigen 15–3 and carcinoembryonic antigen in breast cancer: a meta-analysis including 12, 993 patients.Dis Markers, 2018, 2018: 9863092.
[28] Hiremath PJ, Kumar A, Penmetsa RV, et al. Large-scale development of cost-effective SNP marker assays for diversity assessment and genetic mapping in chickpea and comparative mapping in legumes.Plant Biotechnol J, 2012, 10(6): 716–732.
[29] Barbosa C, Peixeiro I, Rom?o L. Gene expression regulation by upstream open reading frames and human disease.PLoS Genet, 2013, 9(8): e1003529.
[30] Fuxman Bass JI, Sahni N, Shrestha S, et al. Human gene-centered transcription factor networks for enhancers and disease variants.Cell, 2015, 161(3): 661–673.
[31] Gabrieli T, Sharim H, Fridman D, et al. Selective nanopore sequencing of human BRCA1 by Cas9-assisted targeting of chromosome segments (CATCH).Nucleic Acids Res, 2018, 46(14): e87.
[32] Travers KJ, Chin CS, Rank DR, et al. A flexible and efficient template format for circular consensus sequencing and SNP detection.Nucleic Acids Res, 2010, 38(15): e159.
[33] Romano G, Veneziano D, Acunzo M, et al. Small non-coding RNA and cancer.Carcinogenesis, 2017, 38(5): 485–491.
[34] Slaby O, Laga R, Sedlacek O. Therapeutic targeting of non-coding RNAs in cancer.Biochem J, 2017, 474(24): 4219–4251.
[35] Soudyab M, Iranpour M, Ghafouri-Fard S. The role of long non-coding RNAs in breast cancer.Arch Iran Med, 2016, 19(7): 508–517.
[36] Klinge CM. Non-coding RNAs in breast cancer: intracellular and intercellular communication.Non-Coding RNA, 2018, 4(4): 40.
[37] Jonsson P, Coarfa C, Mesmar F, et al. Single-molecule sequencing reveals estrogen-regulated clinically relevant lncrnas in breast cancer.Mol Endocrinol, 2015, 29(11): 1634–1645.
[38] Shi C, Zheng Y, Li Y, et al. Association between clinical characteristics and the diagnostic accuracy of circulating single-molecule amplification and resequencing technology on detection epidermal growth factor receptor mutation status in plasma of lung adenocarcinoma.J Clin Lab Anal, 2018, 32(2): e22271.
[39] Calabrese F, Lunardi F, Pezzuto F, et al. Are there new biomarkers in tissue and liquid biopsies for the early detection of non-small cell lung cancer? J Clin Med, 2019, 8(3): 414.
[40] Yi X, Ma JH, Guan YF, et al. The feasibility of using mutation detection in ctDNA to assess tumor dynamics.Int J Cancer, 2017, 140(12): 2642–2647.
[41] Lin Y, Wu Z, Guo W, et al. Gene mutations in gastric cancer: a review of recent next-generation sequencing studies.Tumour Biol, 2015, 36(10): 7385–7394.
[42] Ma QC, Ennis CA, Aparicio S. Opening Pandora's box--the new biology of driver mutations and clonal evolution in cancer as revealed by next generation sequencing.Curr Opin Genet Dev, 2012, 22(1): 3–9.
[43] Bartels S, Persing S, Hasemeier B, et al. Molecular analysis of circulating cell-free DNA from lung cancer patients in routine laboratory practice: a cross-platform comparison of three different molecular methods for mutation detection.J Mol Diagn, 2017, 19(5): 722–732.
[44] DiBardino DM, Rawson DW, Saqi A, et al. Next-generation sequencing of non-small cell lung cancer using a customized, targeted sequencing panel: emphasis on small biopsy and cytology.Cytojournal, 2017, 14: 7.
[45] Mills K, Fuh K. Recent advances in understanding, diagnosing, and treating ovarian cancer.F1000Res, 2017, 6: 84.
[46] Ayhan A, Kuhn E, Wu RC, et al.copy-number gain and overexpression identify ovarian clear cell carcinoma with a poor prognosis.Mod Pathol, 2017, 30(2): 297–303.
[47] The Cancer Genome Atlas Research Network. Integrated genomic analyses of ovarian carcinoma.Nature, 2011, 474(7353): 609–615.
[48] Patch AM, Christie EL, Etemadmoghadam D, et al. Whole-genome characterization of chemoresistant ovarian cancer.Nature, 2015, 521(7553): 489–494.
[49] Roberts RJ, Carneiro MO, Schatz MC. The advantages of SMRT sequencing.Genome Biol, 2013, 14(7): 405.
[50] Jing Y, Zhang Y, Zhu H, et al. Hybrid sequencing-based personal full-length transcriptomic analysis implicates proteostatic stress in metastatic ovarian cancer.Oncogene, 2019, 38(16): 3047–3060.
[51] Winterhoff BJ, Maile M, Mitra AK, et al. Single cell sequencing reveals heterogeneity within ovarian cancer epithelium and cancer associated stromal cells.Gynecol Oncol, 2017, 144(3): 598–606.
[52] Miyahira AK, Soule HR. The 23rd annual prostate cancer foundation scientific retreat report.Prostate, 2017, 77(10): 1093–1106.
[53] Caram MEV, Skolarus TA, Cooney KA. Limitations of prostate-specific antigen testing after a prostate cancer diagnosis.Eur Urol, 2016, 70(2): 209–210.
[54] de Kok JB, Verhaegh GW, Roelofs RW, et al.DD3, a very sensitive and specific marker to detect prostate tumors.Cancer Res, 2002, 62(9): 2695–2698.
[55] Zhang P, Xia JH, Zhu J, et al. High-throughput screening of prostate cancer risk loci by single nucleotide polymorphisms sequencing.Nat Commun, 2018, 9(1): 2022.
[56] Su F, Zhang W, Zhang DL, et al. Spatial intratumor genomic heterogeneity within localized prostate cancer revealed by single-nucleus sequencing.Eur Urol, 2018, 74(5): 551–559.
[57] Tevz G, McGrath S, Demeter R, et al. Identification of a novel fusion transcript between human relaxin-1 () and human relaxin-2 () in prostate cancer.Mol Cell Endocrinol, 2016, 420: 159–168.
Progress in the application of single molecular sequencing in tumor diagnosis
Jie Sheng,Yuxin Wang, Jiangfa Qi, Qing Du, and Yao Xu
Institute of Biology and Medicine, College of Life Science and Health, Wuhan University of Science and Technology, Wuhan 430081, Hubei, China
Tumor development is usually related to the genetic mutation and abnormal expression of multiple genes. Comprehensive analysis of tumor genome, transcriptome and epigenetics is very important for the rapid identification of disease-specific gene clusters and modification sites. Previously, the next-generation sequencing technology was mainly used to explore the information of genomes, however, it cannot meet the requirement of mechanical researches due to several problems such as difficult sequence assembly and leak detection of the low abundance factors. Therefore, single molecule sequencing technology gradually emerged with its unique superiority. This paper reviews the research processes of single molecule sequencing technology in several human tumors, and prospecs its application in clinical diagnosis.
single molecular sequencing technology, single molecule real-time, tumor, clinical diagnosis
盛杰, 王玉欣, 齊江發(fā), 等. 單分子測序技術(shù)在腫瘤診斷中的應(yīng)用研究進(jìn)展. 生物工程學(xué)報(bào), 2020, 36(2): 180–188.
Sheng J,Wang YX, Qi JF, et al. Progress in the application of single molecular sequencing in tumor diagnosis. Chin J Biotech, 2020, 36(2): 180–188.
May 21, 2019;
September 5, 2019
Supported by: National Natural Science Foundation of China (Nos. 31600617, 81802008), Scientific Research Program of Hubei Provincial Education Department (No. Q20181102).
Yao Xu. Tel/Fax: +86-27-68893368; E-mail: xuyao0307@wust.edu.cn
10.13345/j.cjb.190208
國家自然科學(xué)基金 (Nos. 31600617,81802008),湖北省教育廳科學(xué)研究計(jì)劃 (No. Q20181102) 資助。
2019-09-19
http://kns.cnki.net/kcms/detail/11.1998.Q.20190918.1016.002.html
(本文責(zé)編 郝麗芳)