宋正陽 蔣春明
遺傳病是指遺傳物質(zhì)改變所致基因功能異常而導(dǎo)致的一類疾病,按遺傳方式可分為單基因遺傳病、多基因遺傳病、線粒體遺傳病和染色體病。單基因遺傳病,即孟德爾遺傳病,是指由一對等位基因控制的疾病。遺傳學(xué)分子診斷是指應(yīng)用分子遺傳學(xué)技術(shù)對染色體、基因組、DNA序列等進(jìn)行檢測,判斷患者是否存在遺傳物質(zhì)突變。其中,DNA測序技術(shù)是最重要的分子診斷手段之一。迄今為止,仍有很大一部分遺傳病仍不能被明確遺傳病因,因此,越來越多的新技術(shù)被應(yīng)用于遺傳病診斷領(lǐng)域。
組學(xué)是指對生物系統(tǒng)中的基因、蛋白質(zhì)或代謝物進(jìn)行高通量整體分析的技術(shù),其中基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等已在臨床和基礎(chǔ)領(lǐng)域發(fā)揮了重要的作用,并被逐漸引入遺傳病領(lǐng)域,多組學(xué)技術(shù)也日漸被重視。本文就多組學(xué)技術(shù)在單基因遺傳病領(lǐng)域的應(yīng)用現(xiàn)狀和進(jìn)展作一綜述。
隨著現(xiàn)代醫(yī)學(xué)不斷發(fā)展、組學(xué)技術(shù)不斷進(jìn)步,如何突破單一組學(xué)研究的局限性成為了目前的研究熱點。將不同組學(xué)聯(lián)合應(yīng)用于遺傳病的診斷,即將基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等多種組學(xué)數(shù)據(jù)相結(jié)合的多組學(xué)綜合分析方法,在理解復(fù)雜疾病的病理生理方面引起了人們的重視。
1.1 基因組學(xué)
1.1.1 靶向捕獲基因測序 靶向捕獲基因測序也稱基因panel,臨床上將多個基因或多個位點按照一定標(biāo)準(zhǔn)進(jìn)行選擇和組合,從而檢測出對遺傳病有診治意義的基因。其原理是將若干靶基因?qū)?yīng)的探針設(shè)計到同一張芯片上以捕獲目標(biāo)DNA并用于后續(xù)檢測。對于遺傳特征明確的可疑疾病,基因panel檢測通常比全外顯子測序(whole exome sequencing,WES)、全基因組測序(whole genome sequencing,WGS)有更高的診斷率,因為其測序深度更高,靈敏度和特異度更好[1]。不同基因panel的診斷率各不相同,容易受到panel設(shè)計方案和遺傳表型及遺傳特征識別的影響。因此,在診斷不確定的情況下,選擇其他測序方法可能更合適。
基因panel是目前臨床上診斷各種明確表型或疾病的常規(guī)選擇,廣泛應(yīng)用于先天性肌無力綜合征等神經(jīng)肌肉疾病,遺傳性眼病、遺傳性運動障礙等遺傳性疾病的病因診斷。
1.1.2 WES 目前認(rèn)為,僅占人類全基因組1%左右的外顯子區(qū)域,包含了85%的致病性變異,可以通過外顯子組測序直接識別孟德爾遺傳病的致病基因,其中WES對遺傳病診斷和新致病基因的發(fā)現(xiàn)具有重要價值。WES是一種靶向候選基因外顯子區(qū)域序列的測序方法,需要通過分子雜交和PCR擴增技術(shù)來富集目標(biāo)序列。WES主要靶向蛋白質(zhì)編碼區(qū)序列,也可能包含一些重要的基因調(diào)控區(qū),如啟動子、5'-UTR等側(cè)翼區(qū)域,使得遺傳信息更全面,從而更有效地鑒定致病性變異。Platt等[2]在原發(fā)性免疫缺陷疾病的臨床診治中發(fā)現(xiàn),與基因panel相比,WES可簡化工作流程,降低成本,并提高發(fā)現(xiàn)新的遺傳性疾病的能力。
Salfati等[3]研究報道,在12個月后對未確診的患者進(jìn)行重分析可使診斷率提高11%,這使得WES與傳統(tǒng)基因panel相比性價比更高。隨著變異分類工具改進(jìn)、基因數(shù)據(jù)庫和臨床表型識別的完善,WES數(shù)據(jù)重分析可能是提高孟德爾遺傳病的診斷效能的重要手段。
盡管WES對孟德爾遺傳病的分子遺傳學(xué)診斷具有劃時代意義,但是臨床上仍有50%~75%的孟德爾遺傳病無法通過WES得到基因診斷[4]。推測可能是因為WES僅覆蓋了基因組約2%的區(qū)域,無法檢測非編碼區(qū)所含有的對細(xì)胞發(fā)育和生物學(xué)至關(guān)重要的調(diào)控區(qū)域。非編碼區(qū)中存在影響RNA轉(zhuǎn)錄豐度的序列,其調(diào)控蛋白質(zhì)表達(dá)在很多復(fù)雜的性狀和疾病中發(fā)揮了關(guān)鍵性作用。
當(dāng)前,WES已是孟德爾遺傳病診斷中最常用的二代測序技術(shù),診斷率可達(dá)到25%~52%,采用家系檢測可再提高16%的診斷率[5]。WES在神經(jīng)系統(tǒng)疾病的診斷陽性率可高達(dá)30.6%,遠(yuǎn)高于非神經(jīng)系統(tǒng)遺傳病的陽性率(如皮膚系統(tǒng)17.2%、血液系統(tǒng)疾病17.1%);對于癲癇或共濟失調(diào)的表型,WES檢測的總體診斷率達(dá)36.1%[6]。在明確家系遺傳傾向的情況下,WES的診斷率明顯超過了其他遺傳診斷方法,如染色體微陣列分析或基因panel檢測。隨著技術(shù)的成熟,WES已廣泛應(yīng)用于癲癇、阿爾茨海默病、腦性癱瘓等神經(jīng)系統(tǒng)疾病的臨床診斷。
1.1.3 WGS WGS是一種不受捕獲步驟和擴增反應(yīng)限制的技術(shù),對包括非編碼區(qū)在內(nèi)的整個基因組進(jìn)行測序和數(shù)據(jù)分析,能夠更好地覆蓋單核苷酸變異、插入和缺失和結(jié)構(gòu)變異(structure variantions,SVs),包括較短和較大的拷貝數(shù)變異[7]。雖然目前提供的覆蓋深度低于WES,但WGS不需要外顯子捕獲或其他富集策略,在檢測內(nèi)含子區(qū)域的致病變異方面有較高的效能。但當(dāng)前對全基因組尤其是非編碼序列的致病性認(rèn)識尚不充分,缺乏足夠的分析數(shù)據(jù)庫,且WGS對海量測序數(shù)據(jù)的處理(包括生物信息過濾、數(shù)據(jù)存儲、數(shù)據(jù)分析和解釋)需要耗費生信學(xué)家、遺傳學(xué)家和臨床醫(yī)生大量的時間,WGS測序成本也較WES高,使得WGS的臨床應(yīng)用受到顯著限制[8]。
目前研究認(rèn)為WGS具有廣泛的適用性,可顯著提高臨床診斷率。大量薈萃分析發(fā)現(xiàn)WGS診斷率幾乎是WES的兩倍,早期找到病因可有效改善患者的診治和預(yù)后,降低家庭復(fù)發(fā)風(fēng)險,因此認(rèn)為WGS比WES具有更高的性價比[7]。有研究發(fā)現(xiàn)WGS可用于識別阿爾茨海默病相關(guān)的罕見基因變異,特別是外顯子組之外的變異[9],在脊髓小腦共濟失調(diào)等神經(jīng)系統(tǒng)疾病中應(yīng)用WGS的可行性和效能也得到了肯定[10]。盡管現(xiàn)在WGS尚未在遺傳性疾病的臨床診治上得到廣泛應(yīng)用,但這該方法為更全面揭示遺傳性疾病的病因和發(fā)病機制提供了技術(shù)保障。
1.1.4 第三代測序技術(shù)(third-generation sequencing,TGS) TGS即長讀長測序/單分子測序技術(shù),其特點是實時單分子測序,包括單分子實時測序和納米孔測序兩類技術(shù)。TGS是遺傳學(xué)領(lǐng)域的里程碑式的技術(shù)革新,實現(xiàn)了對每一條DNA分子單獨測序,測序過程無需進(jìn)行PCR擴增,保留了二代測序的速度和通量優(yōu)勢,且彌補了二代測序讀數(shù)相對較短、難以檢測到較大的SVS等不足。相比于第二代測序(next-generation sequencing,NGS),長讀長是 TGS的關(guān)鍵優(yōu)勢,而通量低、錯誤率高和成本高是TGS的顯著缺陷[11]。臨床上,可以通過短讀長的NGS來修正TGS的長讀長片段測序的局限性[12]。目前TGS主要用于全基因組denovo測序、甲基化研究、點突變檢測、特殊基因區(qū)域等檢測[13],例如癲癇、X連鎖性肌張力障礙-帕金森病等神經(jīng)系統(tǒng)遺傳疾病。
TGS可能在不久的將來成為一種標(biāo)準(zhǔn)的罕見病診斷工具。最近研究顯示,TGS有助于明確其他基因檢測方法均無法檢測到的SVs,可協(xié)助驗證生殖細(xì)胞基因組的結(jié)構(gòu)變異和分類,這對遺傳病篩查和干預(yù)具有重要意義[14]。
1.2 蛋白質(zhì)組學(xué) 單基因遺傳疾病通常是由于特定基因中的位點變異所導(dǎo)致的蛋白質(zhì)質(zhì)量異常所致。蛋白質(zhì)組學(xué)是鑒定和定量細(xì)胞、組織或有機體中全部蛋白質(zhì)的一種技術(shù),包括對蛋白質(zhì)的結(jié)構(gòu)和功能、表達(dá)和翻譯后修飾、蛋白質(zhì)之間的相互作用等的研究[15]。蛋白質(zhì)組學(xué)對疾病的早期診斷、動態(tài)監(jiān)測和預(yù)后評估至關(guān)重要。隨著人類蛋白質(zhì)組計劃的開展和臨床蛋白質(zhì)組學(xué)技術(shù)的推進(jìn),當(dāng)前只需要微量的體液(血漿或尿液等)或組織樣本就能夠可靠地檢測到>90%的人類蛋白質(zhì),促進(jìn)了臨床應(yīng)用。然而,要提高蛋白質(zhì)組學(xué)技術(shù)的可重復(fù)性和性能,還需要進(jìn)一步的努力。多年來,蛋白質(zhì)組學(xué)技術(shù)的應(yīng)用一直面臨嚴(yán)峻挑戰(zhàn)和技術(shù)難題,結(jié)果受到蛋白質(zhì)譜動態(tài)濃度范圍較大、剪接變體和翻譯后修飾等復(fù)雜因素的影響。近年來,蛋白質(zhì)組學(xué)技術(shù)的靈敏度得到了極大的提高,也具有更大的覆蓋范圍。將蛋白質(zhì)組學(xué)和遺傳學(xué)、細(xì)胞生物學(xué)方法相結(jié)合來研究疾病相關(guān)變異的細(xì)胞生物學(xué)功能,有助于識別與疾病相關(guān)的蛋白分子,并可為遺傳性疾病的發(fā)病機制研究、臨床診斷和治療提供新思路。在亨廷頓病[16]、遺傳性中性粒細(xì)胞減少癥[17]、線粒體疾病[18]等疾病領(lǐng)域的研究結(jié)果顯示,蛋白質(zhì)組學(xué)在遺傳病診斷中具有較高的應(yīng)用價值。
因此,不斷發(fā)展的蛋白質(zhì)組學(xué)技術(shù)將加深人們對遺傳疾病的理解、診斷和管理,有利于對疾病診療實施精準(zhǔn)的指導(dǎo)。
1.3 代謝組學(xué) 基因組學(xué)或蛋白質(zhì)組學(xué)分析僅反映了部分生命活動,尚不足以解釋人類遺傳代謝性疾病的復(fù)雜性。代謝組學(xué)是20世紀(jì)90年代中期發(fā)展起來的一門新興學(xué)科,多用于研究相對分子質(zhì)量1 000內(nèi)的小分子代謝物,是遺傳代謝性疾病臨床診斷的重要依據(jù)。代謝組學(xué)分析能描述某種組織細(xì)胞的特定病理生理狀態(tài),并對其進(jìn)行定性和定量分析,其基本的研究方法分為靶向和非靶向兩種。這兩種方法可聯(lián)合用于對代謝產(chǎn)物的鑒定和定量,以及代謝相關(guān)分子標(biāo)志物的分析研究。由于樣本收集和儲存的條件會影響代謝物的豐度[19],因此,標(biāo)本穩(wěn)定性是代謝組學(xué)技術(shù)發(fā)展必須要克服的問題之一。
隨著WES的應(yīng)用逐漸廣泛,發(fā)現(xiàn)了很多與臨床表型相關(guān)但致病性不確定的變異,結(jié)合代謝組學(xué)技術(shù)可為其得到更準(zhǔn)確的基因診斷提供實驗室證據(jù)。臨床上,代謝組學(xué)技術(shù)多用于檢測和監(jiān)測先天性代謝異常[20],已有多個研究報道了代謝組學(xué)技術(shù)成功應(yīng)用于先天性銅代謝障礙等疾病[21-22],代謝組學(xué)技術(shù)是下一代遺傳代謝病的重要篩查技術(shù)。
1.4 轉(zhuǎn)錄組學(xué) 轉(zhuǎn)錄組是特定組織或細(xì)胞在某一發(fā)育階段或功能狀態(tài)下轉(zhuǎn)錄出來的所有RNA的總和,主要包括mRNA和非編碼RNA。由于受到當(dāng)前測序技術(shù)和基因功能認(rèn)識的限制,學(xué)者推測很多遺傳性疾病可能是由于轉(zhuǎn)錄水平發(fā)生各種異常而導(dǎo)致的,因此不可能僅依靠基因組測序來解決。轉(zhuǎn)錄組測序(RNA-sequence,RNA-Seq)是一種可以對特定時空狀態(tài)下的器官組織進(jìn)行轉(zhuǎn)錄組分析的高通量測序技術(shù),可以直接檢測RNA豐度和RNA序列的變異,彌補了DNA遺傳信息的局限性[4],具有高精度、高靈敏度和高穩(wěn)定性的特點,可提高遺傳性疾病的臨床診斷率[23]。這為RNASeq作為一種DNA測序的補充手段的臨床應(yīng)用提供了重要依據(jù)。但由于轉(zhuǎn)錄組存在高度的時間、空間特異性,如何選擇最佳的組織進(jìn)行檢測是臨床面臨的重要挑戰(zhàn)[24]。此外,RNA-Seq對數(shù)據(jù)存儲要求較高,其數(shù)據(jù)的生物信息學(xué)解讀難度大,都限制了臨床應(yīng)用。雖然現(xiàn)已有表達(dá)變異分析技術(shù)等輔助工具來幫助分析轉(zhuǎn)錄組測序數(shù)據(jù)[25],但臨床解讀仍是巨大挑戰(zhàn)。
近年來,已有較多研究將其成功應(yīng)用于線粒體疾病和神經(jīng)肌肉疾病等先天性代謝性疾病的臨床。研究證實,RNA-Seq有助于甲基丙二酸尿癥[26]、線狀體肌病[27]、罕見遺傳性皮膚病[28]等疾病的臨床診斷;尤其適用于WES陰性的累及皮膚肌肉相關(guān)遺傳性疾病的患者,因為肌肉、成纖維細(xì)胞等組織容易獲取且適于RNA-Seq 檢測[29]。
綜上所述,雖然目前RNA-Seq不是診斷孟德爾遺傳病的常規(guī)診斷技術(shù),但確是提高罕見遺傳病分子診斷的重要補充診斷技術(shù)。
隨著現(xiàn)代醫(yī)學(xué)和組學(xué)技術(shù)的不斷進(jìn)步,如何突破單一組學(xué)研究的局限性已成為當(dāng)前該領(lǐng)域的研究熱點。將不同組學(xué)技術(shù)聯(lián)合應(yīng)用于遺傳性疾病的診斷,即將基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等多種組學(xué)數(shù)據(jù)相結(jié)合的多組學(xué)綜合分析方法,在理解復(fù)雜疾病的病因機制方面日益受到人們的重視。
聯(lián)合應(yīng)用NGS和代謝組學(xué)篩查可以發(fā)現(xiàn)新的致病基因和生物標(biāo)志物[30],可提高遺傳性代謝缺陷病的診斷效能,進(jìn)一步提高診斷率和縮短診斷時間[31]。研究發(fā)現(xiàn),基因組學(xué)與其他多組學(xué)數(shù)據(jù)的整合分析,可有效提高單基因遺傳病的診斷效能和明確潛在的治療靶點,從而實現(xiàn)早診早治和改善預(yù)后,例如將基因組和轉(zhuǎn)錄組聯(lián)合應(yīng)用可提高阿爾茨海默病[32]、特異性皮炎[33]等疾病的精準(zhǔn)診治。迄今為止,臨床上已經(jīng)開發(fā)了大量針對單基因遺傳病診斷的多組學(xué)聯(lián)合檢測技術(shù)和多組學(xué)數(shù)據(jù)整合分析工具,來提高遺傳罕見病的分子診斷效能,但該領(lǐng)域仍進(jìn)展緩慢。
隨著多組學(xué)技術(shù)的突破,基因組、轉(zhuǎn)錄組、蛋白質(zhì)組和代謝組等生命信息將對單基因遺傳病的診斷和治療發(fā)揮越來越重要的作用。今后的研究應(yīng)該使用系統(tǒng)生物學(xué)方法整合多組學(xué)數(shù)據(jù),并積極運用于遺傳性疾病的診斷和治療領(lǐng)域。在將多組學(xué)技術(shù)引入臨床實踐的過程中,存在一些問題尚待解決[34]。首先,要克服不同組學(xué)技術(shù)的臨床局限性,深入理解多組學(xué)數(shù)據(jù)的潛在生命疾病信息;其次,要開發(fā)多組學(xué)數(shù)據(jù)之間的整合分析技術(shù)和平臺,揭示數(shù)據(jù)的互補性和整體性,以推動高特異度和靈敏度的生物標(biāo)志物的發(fā)現(xiàn);再次,要解決由于樣本收集、處理、儲存和運輸?shù)犬a(chǎn)生的影響,以及不同制造商生產(chǎn)的組學(xué)圖譜平臺的技術(shù)差異;最后,多組學(xué)數(shù)據(jù)安全和患者隱私等倫理問題尚待深入研究解決。此外,要建設(shè)規(guī)范的多組學(xué)醫(yī)學(xué)遺傳診斷模式,組建臨床醫(yī)生、實驗室專業(yè)人員、生物學(xué)家、甚至律師和倫理專家等多個領(lǐng)域?qū)<业亩鄬W(xué)科遺傳病診斷團隊,以開啟基于多組學(xué)數(shù)據(jù)整體解讀的未來單基因遺傳病診斷時代。