易翠莉(綜述),余自華※(審校)
(1南京軍區(qū)福州總醫(yī)院兒科,福州 350025; 2福建醫(yī)科大學(xué)??偱R床醫(yī)學(xué)院兒科,福州 350025)
遺傳性腎病綜合征候選致病基因篩選策略
易翠莉1,2(綜述),余自華1,2※(審校)
(1南京軍區(qū)福州總醫(yī)院兒科,福州 350025; 2福建醫(yī)科大學(xué)福總臨床醫(yī)學(xué)院兒科,福州 350025)
摘要:部分遺傳性腎病綜合征(NS)與編碼足細(xì)胞蛋白的單基因突變有關(guān),目前,仍有80%的遺傳性NS致病基因不明。大家系單基因遺傳病篩選候選致病基因首選定位克隆,而小家系候選致病基因篩選優(yōu)先選擇外顯子組測序。對致病基因不明的遺傳性NS小家系核心成員進(jìn)行外顯子組測序,挑選出非同義、罕見、位于保守區(qū)域、軟件預(yù)測有致病性、基因型與表型共分離的變異,攜帶該變異的基因即為候選致病基因。
關(guān)鍵詞:腎病綜合征;外顯子組測序;遺傳性;候選致病基因
原發(fā)性腎病綜合征(nephrotic syndrome,NS)是兒童常見的腎小球疾病,10%~20%的患兒對激素耐藥,即激素耐藥型NS(steroid-resistant NS,SRNS);SRNS預(yù)后差,50%的患兒可在5年內(nèi)進(jìn)展至終末期腎臟疾病,腎臟替代療法為其最終治療手段[1]。部分SRNS因編碼足細(xì)胞蛋白的單基因突變所致,即遺傳性NS。目前已經(jīng)發(fā)現(xiàn)20余個(gè)導(dǎo)致遺傳性NS的單基因,如NPHS1基因、NPHS2基因、α輔肌動蛋白4基因、CD2相關(guān)蛋白(CD2associated protein,CD2AP)基因、肌球蛋白1E基因等[2]。明確遺傳性NS的基因診斷對治療方案的選擇、腎移植的預(yù)后評估、遺傳咨詢和產(chǎn)前診斷具有重要意義。但是,約80%遺傳性NS致病基因仍未確定[3-4]。定位克隆、全基因組測序和外顯子組測序均可應(yīng)用于候選致病基因篩選,其中外顯子組測序?yàn)楫?dāng)今尋找單基因遺傳病致病基因的重要方法。現(xiàn)就遺傳性NS候選致病基因篩選策略進(jìn)行簡要介紹。
1定位克隆篩選候選致病基因
定位克隆是篩選候選致病基因的傳統(tǒng)方法,它是應(yīng)用連鎖分析的方法將候選致病基因定位于某一條染色體的特定候選位置或區(qū)域內(nèi),然后對該位置或區(qū)域內(nèi)所有候選基因一一進(jìn)行篩選、鑒定。此方法可靠性強(qiáng),已經(jīng)準(zhǔn)確地篩選出許多經(jīng)鑒定可導(dǎo)致遺傳性NS的單基因,如NPHS1基因[5]、NPHS2基因[6]等。然而,通過定位克隆法篩選候選致病基因在整個(gè)研究過程中不僅耗費(fèi)多、時(shí)間長,而且連鎖分析往往需要基于一個(gè)甚至多個(gè)大家系才能得到有統(tǒng)計(jì)學(xué)意義的候選區(qū)間。常染色體顯性遺傳病往往需要在有6~12例患者的大家系基礎(chǔ)上進(jìn)行研究;對于常染色體隱性遺傳病的研究,近親結(jié)婚的小家系可與純合區(qū)間結(jié)合完成定位,但非近親結(jié)婚,且懷疑為復(fù)合雜合變異致病仍然需要大家系[7]。我國實(shí)行計(jì)劃生育,患者人數(shù)少,家系少或小,加上外顯不全和擬表型的存在均增加了連鎖分析定位的難度。另外,疾病的基因異質(zhì)性也使得基于表型相同多個(gè)小家系的連鎖分析或純合區(qū)間定位可能提示多個(gè)定位區(qū)間,亦顯著增加了發(fā)現(xiàn)致病基因的難度[7]。
2全基因組測序篩選候選致病基因
全基因組測序是對生物基因組中的全部基因進(jìn)行測序,覆蓋面廣,能檢測個(gè)體基因組中的全部遺傳信息。新一代測序技術(shù)已經(jīng)能夠快速、低成本地進(jìn)行全基因組測序。但由于全基因組信息龐大,后期數(shù)據(jù)分析、原始數(shù)據(jù)轉(zhuǎn)換的花費(fèi)遠(yuǎn)遠(yuǎn)超過測序所需,巨大的費(fèi)用和工作量使它的應(yīng)用受到很大限制;另外,如何對大量變異尤其是內(nèi)含子區(qū)域的變異做出正確分析和解釋也是一個(gè)難題[8]。目前,尚無應(yīng)用全基因組測序篩選遺傳性NS候選致病基因的報(bào)道。
3外顯子組測序篩選候選致病基因
外顯子組測序是指利用目標(biāo)序列捕獲技術(shù)將基因組的全部外顯子區(qū)域DNA捕獲后進(jìn)行高通量測序的技術(shù)。2009年美國國家心肺血液研究所對國際人類基因組單體型圖計(jì)劃中的8個(gè)個(gè)體進(jìn)行全外顯子組測序,證實(shí)了這項(xiàng)技術(shù)在發(fā)現(xiàn)全外顯子組中常見變異及罕見變異的敏感性及特異性;他們同時(shí)對4個(gè)已明確致病突變的弗里曼謝爾登綜合征患者進(jìn)行全外顯子組測序,并準(zhǔn)確地篩選出致病突變基因[9]。雖然找出的是已知致病基因,但他們的研究表明應(yīng)用全外顯子組測序可準(zhǔn)確地找到一些單基因遺傳病的致病基因。近年來,外顯子組測序憑借自身優(yōu)勢得到廣泛應(yīng)用。新一代測序技術(shù)可對連鎖分析獲得的候選區(qū)間內(nèi)所有候選基因同時(shí)進(jìn)行測序,因此,如果有足夠大的合適家系,定位克隆仍是篩選單基因遺傳病候選致病基因的首選方法[7]。但目前的問題是很難獲得足夠大的合適家系,且還有很多單基因遺傳病以散發(fā)的形式存在,無法進(jìn)行有效的連鎖分析。因此,與定位克隆相比,外顯子組測序應(yīng)用范圍更廣。外顯子組測序可應(yīng)用于因家系小而無法通過連鎖分析進(jìn)行定位克隆或一些散發(fā)的單基因遺傳病候選致病基因的篩選[7]。2009年,Ng等[10]對3個(gè)米勒綜合征家系中僅有的4例患者進(jìn)行外顯子組測序,篩選出新致病基因雙氫乳清酸酯脫氫酶基因。2010年,Ng等[11]對10個(gè)散發(fā)的歌舞伎化妝綜合征患者進(jìn)行外顯子組測序,篩選出了新致病基因組蛋白賴氨酸N-甲基轉(zhuǎn)移酶基因。
除外顯子組測序外,全基因組測序也可應(yīng)用于散發(fā)性單基因遺傳病及小家系候選致病基因的篩選。但是相對全基因組測序,應(yīng)用外顯子組測序進(jìn)行人類單基因遺傳病候選致病基因的篩選性價(jià)比更高。人類基因組大約包含180 000個(gè)外顯子(約30 Mb),即全外顯子組,僅占整個(gè)基因組序列的1%;人類大約85%的致病突變位于基因組的外顯子蛋白編碼區(qū),大部分單基因遺傳病的致病突變也位于外顯子區(qū)域[12]。位于人類外顯子蛋白編碼區(qū)中許多罕見的非同義變異具有致病性,而位于非編碼區(qū)即使是保守非編碼區(qū)的變異大多為良性變異[10]。因此,外顯子組測序能夠在縮短實(shí)驗(yàn)周期、減少數(shù)據(jù)分析量及實(shí)驗(yàn)投入的基礎(chǔ)上有針對性地得到大部分全基因組測序所能得到的信息。
4外顯子組測序篩選遺傳性NS候選致病基因的應(yīng)用策略
外顯子組測序比定位克隆法應(yīng)用更廣、更便捷,比全基因組測序性價(jià)比更高,因此,選擇外顯子組測序進(jìn)行遺傳性NS候選致病基因的篩選。2011年,Sanna-Cherchi等[4]在1個(gè)含有3個(gè)SRNS患兒的近親結(jié)婚家系中對先證者進(jìn)行外顯子組測序結(jié)合純合區(qū)間定位,篩選出了致病基因肌球蛋白1E基因。2013年,Esposito等[13]對1個(gè)局灶性節(jié)段性腎小球硬化合并心肌梗死家系中的2例患者進(jìn)行外顯子組測序,篩選出新致病基因核RNA轉(zhuǎn)出因子5基因;同年,Gupta等[14]通過對1個(gè)家系內(nèi)2例患先天性NS的姐妹進(jìn)行外顯子組測序,亦篩選出了新致病基因Rho二磷酸鳥苷解離抑制因子α基因。目前報(bào)道的遺傳性NS致病基因的篩選多基于小家系進(jìn)行,且相對于對單個(gè)個(gè)體或散發(fā)的數(shù)個(gè)個(gè)體進(jìn)行外顯子組測序,若能對1個(gè)家系內(nèi)2個(gè)子代患者及其無患病雙親進(jìn)行外顯子組測序,能更好地進(jìn)行遺傳分析,明確發(fā)生重組事件的精確位置,確定雙親來源的染色體在子代中的情況,發(fā)現(xiàn)常見及罕見的單個(gè)核苷酸變異,明顯縮小單基因遺傳病候選致病基因的范圍[15-16]。因此,盡管外顯子組測序可應(yīng)用于小家系及一些散發(fā)性單基因遺傳病候選致病基因的篩選,但更適用于有2例或2例以上患者的小家系。
4.1外顯子組測序技術(shù)路線應(yīng)用外顯子組測序篩選候選致病基因的過程大致分為3個(gè)步驟[17](圖1[18])。首先,對基因組中所有已知編碼蛋白質(zhì)的外顯子進(jìn)行富集,新富集技術(shù)(如NimbleGen公司的基因捕獲芯片及安捷倫SureSelect靶向序列捕獲系統(tǒng))可針對全外顯子組進(jìn)行捕獲,這種富集方法較傳統(tǒng)聚合酶鏈反應(yīng)富集方法具有高特異性和高覆蓋度,節(jié)省了大量時(shí)間、人力、物力和財(cái)力;然后,應(yīng)用新一代測序技術(shù)對富集的全外顯子組DNA序列進(jìn)行高覆蓋深度測序,目前已經(jīng)有很多成熟的新一代測序產(chǎn)品(如Illumina測序儀、454基因組測序儀和SOLiD測序儀等),與傳統(tǒng)Sanger測序相比,應(yīng)用新一代測序技術(shù)大大縮短了測序的時(shí)間及費(fèi)用;最后通過比對、注釋、篩選條件設(shè)置和生物信息學(xué)分析,篩選出候選致病基因[17]。
Het:雜合子;Hom:純合子;del:缺失;Codon:密碼子;Exon:外顯子;Human:人類;Rat:大鼠;Mouse:小鼠;Frog:蛙;Gly:甘氨酸;Arg:精氨酸
圖1外顯子組測序篩選候選致病基因流程圖[18]
4.2外顯子組測序基本思路
4.2.1家系評估根據(jù)遺傳性NS表型對家系成員進(jìn)行嚴(yán)格篩查,明確家系成員的患病情況及家系特點(diǎn),對患者進(jìn)行已知的遺傳性NS致病基因的檢測和初篩,確認(rèn)所研究的患者均無已知致病基因的變異[12-13,19]。
4.2.2外顯子組測序根據(jù)所收集的家系特點(diǎn),挑選遺傳性NS家系內(nèi)的核心成員進(jìn)行外顯子組測序。選擇1個(gè)家系內(nèi)的二子代患者結(jié)合或不結(jié)合其健康父母進(jìn)行外顯子組測序[14,16];若家系內(nèi)存活病患少,也有報(bào)道僅對1個(gè)家系內(nèi)的1例患者進(jìn)行外顯子組測序[20]。
4.2.3測序結(jié)果分析外顯子組測序后每個(gè)個(gè)體產(chǎn)生大量的數(shù)據(jù),去除重復(fù)區(qū)域內(nèi)的序列[9-10,16,21],應(yīng)用軟件將經(jīng)外顯子組測序得到的序列與人類的基因組參考序列(如hg18、hg19等)進(jìn)行比對[12,16,18-19,21-23],經(jīng)注釋后每個(gè)個(gè)體將產(chǎn)生20 000~25 000個(gè)與參考序列不同的變異[12,18]。如何分析以縮小候選變異范圍,并從中篩選出具有疾病風(fēng)險(xiǎn)預(yù)測價(jià)值甚至診斷價(jià)值的變異是最為重要的。
4.2.3.1非同義變異經(jīng)比對產(chǎn)生的20 000~25 000變異中,有10 000~11 000會改變氨基酸序列[18],即引起非同義變異,考慮同義變異致病的可能性非常小,因此選擇非同義變異、編碼區(qū)小片段插入或缺失變異及能引起剪切位點(diǎn)改變的變異[9-10,13,16,18-19,21-23]。
4.2.3.2罕見變異90%以上非同義變異為存在人群中的常見變異[18],對于遺傳性NS等大多數(shù)單基因遺傳病而言,致病變異應(yīng)為一些罕見變異,不存在于一些公共數(shù)據(jù)庫或等位基因頻率低的變異,因此予去除基因多態(tài)性數(shù)據(jù)庫、單體型圖數(shù)據(jù)庫及千人基因數(shù)據(jù)庫等公共數(shù)據(jù)庫中已報(bào)道或等位基因頻率>1%的變異[2,4,9-10,13,18-19,21-23]。
4.2.3.3保守區(qū)域內(nèi)變異從無脊椎動物到人類均保守區(qū)域內(nèi)的遺傳物質(zhì)可能是維持物種生存所必需的,若發(fā)生變異的位點(diǎn)處于高度保守區(qū)域內(nèi),說明該變異可能是致病甚至是致命的,因此選擇的候選致病基因的變異應(yīng)位于物種間保守區(qū)域內(nèi)[10,12,22-23]。
4.2.3.4軟件預(yù)測具有致病性的變異許多功能預(yù)測軟件(如SIFT、Polyphen等)能夠預(yù)測錯(cuò)義變異中氨基酸替換對蛋白質(zhì)功能的影響,預(yù)測結(jié)果顯示變異為致病性或非致病性,選取預(yù)測結(jié)果為有致病性的變異[10,16,18,22-23]。
4.2.3.5候選區(qū)間內(nèi)變異若已結(jié)合連鎖分析或家系內(nèi)純合區(qū)間定位獲得一個(gè)候選區(qū)間,篩選出的變異應(yīng)位于這些區(qū)間內(nèi),這些區(qū)間不僅進(jìn)一步縮小了候選致病基因的范圍,也提高了篩選出候選致病基因的準(zhǔn)確率[22-23]。
4.2.3.6基因型與表型共分離變異經(jīng)上述個(gè)體內(nèi)數(shù)據(jù)的篩選后,接下去根據(jù)疾病模型進(jìn)行遺傳性NS家系內(nèi)候選致病基因的篩選。若為常染色體隱性遺傳性疾病,致病變異為純合變異或復(fù)合雜合變異,家系內(nèi)所有患病者含有相同變異,無患病的父母均為攜帶者,其余未患病者不攜帶相應(yīng)變異或僅為攜帶者[14,16];若為常染色體顯性遺傳性疾病,所有患者均攜帶相同變異,其他未患病者不攜帶相應(yīng)變異[21,23]。應(yīng)用上述條件經(jīng)層層篩選,選擇家系內(nèi)表現(xiàn)為表型與基因型共分離的變異,攜帶該變異的基因即為候選致病基因。
4.3外顯子組測序的不足外顯子組測序技術(shù)在篩選遺傳性NS等單基因遺傳病方面存在眾多優(yōu)勢,但它同樣存在著一定的局限性。外顯子組測序技術(shù)對全外顯子組的捕獲率不能達(dá)到100%,可能遺漏一些目標(biāo)基因;外顯子組測序技術(shù)對基因拷貝數(shù)變異檢測效率較低;外顯子組測序技術(shù)不能檢測內(nèi)含子區(qū)域的變異;外顯子組測序技術(shù)檢測結(jié)果存在假陽性可能[24]。但是,通過與其他技術(shù)結(jié)合可彌補(bǔ)外顯子組測序技術(shù)的部分不足,如聯(lián)合CONTRA軟件可提高基因拷貝數(shù)變異的檢出率,應(yīng)用聚合酶鏈反應(yīng)和Sanger測序?qū)Y選出的候選變異一一驗(yàn)證排除假陽性等[25]。
5小結(jié)
定位克隆仍是大家系單基因遺傳病篩選候選致病基因的首選方法,而小家系單基因遺傳病篩選候選致病基因可選擇全基因組測序或外顯子組測序。因?yàn)橥怙@子組測序較全基因組測序性價(jià)比更高,所以對小家系遺傳性NS篩選候選致病基因優(yōu)先選擇外顯子組測序。它能在短時(shí)間內(nèi)用最少的病例數(shù)篩選出小家系遺傳性NS候選致病基因。外顯子組測序?yàn)檫z傳性NS候選致病基因篩選開辟了一條新路。
參考文獻(xiàn)
[1]Lombel RM,Hodson EM,Gipson DS,etal.Treatment of steroid-resistant nephrotic syndrome in children:new guidelines from KDIGO[J].Pediatr Nephrol,2013,28(3):409-414.
[2]McCarthy HJ,Bierzynska A,Wherlock M,etal.Simultaneous sequencing of 24 genes associated with steroid-resistant nephrotic syndrome[J].Clin J Am Soc Nephrol,2013,8(4):637-648.
[3]Heeringa SF,Chernin G,Chaki M,etal.COQ6 mutations in human patients produce nephritic syndrome with sensorineural deafness[J].J Clin Invest,2011,121(5):2013-2024.
[4]Sanna-Cherchi S,Burgess KE,Nees SN,etal.Exome sequencing identified MYO1E and NEIL1 as candidate genes for human autosomal recessive steroid-resistant nephritic syndrome[J].Kidney Int,2011,80(4):389-396.
[5]Kestila M,Lenkkeri U,Mannikko M,etal.Positionally cloned gene for a novel glomerular protein--nephrin--is mutated in congenital nephrotic syndrome[J].Mol Cell,1998,1(4):575-582.
[6]Boute N,Gribouval O,Roselli S,etal.NPHS2,encoding the glomerular protein podocin,is mutated in autosomal recessive steroid-resistant nephrotic syndrome[J].Nat Genet,2000,24(4):349-354.
[7]Kuhlenbaumer G,Hullmann J,Appenzeller S.Novel genomic techniques open new avenues in the analysis of monogenic disorders[J].Hum Mutat,2011,32(2):144-151.
[8]Chrystoja CC,Diamandis EP.Whole genome sequencing as a diagnostic test:challenges and opportunities[J].Clin Chem,2014,60(5):724-733.
[9]Ng SB,Turner EH,Robertson PD,etal.Targeted capture and massively parallel sequencing of 12 human exomes[J].Nature,2009,461(7261):272-276.
[10]Ng SB,Buckingham KJ,Lee C,etal.Exome sequencing identifies the cause of a mendelian disorder[J].Nat Genet,2010,42(1):30-35.
[11]Ng SB,Bigham AW,Buckingham KJ,etal.Exome sequencing identifies MLL2 mutations as a cause of Kabuki syndrome[J].Nat Genet,2010,42(9):790-793.
[12]Choi M,Scholl UI,Ji W,etal.Genetic diagnosis by whole exome capture and massively parallel DNA sequencing[J].Proc Natl Acad Sci U S A,2009,106(45):19096-19101.
[13]Esposito T,Lea RA,Maher BH,etal.Unique X-linked familial FSGS with co-segregating heart block disorder is associated with a mutation in the NXF5 gene[J].Hum Mol Genet,2013,22(18):3654-3666.
[14]Gupta IR,Baldwin C,Auguste D,etal.ARHGDIA:a novel gene implicated in nephrotic syndrome[J].J Med Genet,2013,50(5):330-338.
[15]Roach JC,Glusman G,Smit AF,etal.Analysis of genetic inheritance in a family quartet by whole-genome sequencing[J].Science,2010,328(5978):636-639.
[16]Katagiri S,Yoshitake K,Akahori M,etal.Whole-exome sequencing identifies a novel ALMS1 mutation (p.Q2051X) in two Japanese brothers with Alstr?m syndrome[J].Mol Vis,2013,19:2393-2406.
[17]羅東鳳,王少元.全基因組外顯子測序及其在遺傳病研究中的應(yīng)用[J].國際遺傳學(xué)雜志,2012,35(3):173-177.
[18]Foo JN,Liu JJ,Tan EK.Whole-genome and whole-exome sequencing in neurological diseases[J].Nat Rev Neurol,2012,8(9):508-517.
[19]Becker J,Semler O,Gilissen C,etal.Exome sequencing identifies truncating mutations in human SERPINF1 in autosomal-recessive osteogenesis imperfecta[J].Am J Hum Genet,2011,88(3):362-371.
[20]Byun M,Abhyankar A,Lelarge V,etal.Exome sequencing-based discovery of STIM1 deficiency in a child with fatal classic Kaposi sarcoma[J].J Exp Med,2010,207(11):2307-2312.
[21]Liu Y,Gao M,Lv YM,etal.Confirmation by exome sequencing of the pathogenic role of NCSTN mutations in acne inversa (hidradenitis suppurativa)[J].J Invest Dermatol,2011,131(7):1570-
1572.
[22]Wang JL,Yang X,Xia K,etal.TGM6 identified as a novel causative gene of spinocerebellar ataxias using exome sequencing[J].Brain,2010,133(Pt 12):3510-3518.
[23]Chen YZ,Matsushita MM,Robertson P,etal.Autosomal dominant familial dyskinesia and facial myokymia:single exome sequencing identifies a mutation in adenylyl cyclase 5[J].Arch Neurol,2012,69(5):630-635.
[24]Singleton AB.Exome sequencing:a transformative technology[J].Lancet Neurol,2011,10(10):942-946.
[25]Li J,Lupat R,Amarasinghe KC,etal.CONTRA:copy number analysis for targeted resequencing[J].Bioinformatics,2012,28(10):1307-1313.
The Strategy of Discovering Candidate Causative Genes for Hereditary Nephrotic Syndrome
YICui-li1,2,YUZi-hua1,2.
(1.DepartmentofPediatrics,FuzhouGeneralHospitalofNanjingMilitaryCommand,F(xiàn)uzhou350025,China; 2.DepartmentofPediatrics,FuzongClinicalMedicalCollege,FujianMedicalUniversity,Fuzhou350025,China)
Abstract:Mutations in more than 20 different genes which are highly expressed in glomerular podocytes have been identified to lead to hereditary nephrotic syndrome(NS) in a subset of patients.However,the genetic cause of the majority(>80%) of hereditary NS remains unknown.Positional linkage based disease gene identification is a proven reliable strategy and will remain the gold-standard if suitable families are available.However,exome sequencing opens up a new road in the elucidation of genetic defects causing monogenic disorders of small families.Exome sequencing is performed on several core members of a family with hereditary NS to discover candidate causative genes.Non-synonymous and rare variants which affect highly conserved sequences and are predicted to have functional impacts and are completely co-segregated with the phenotypes are chosen,and the genes carrying the variants are identified as candidate causative genes.
Key words:Nephrotic syndrome; Exome sequencing; Hereditary; Candidate causative gene
收稿日期:2015-02-15修回日期:2015-04-21編輯:鄭雪
基金項(xiàng)目:國家自然科學(xué)基金(81270766);福建省科技計(jì)劃項(xiàng)目(2013Y0072)
doi:10.3969/j.issn.1006-2084.2015.23.035
中圖分類號:R725
文獻(xiàn)標(biāo)識碼:A
文章編號:1006-2084(2015)23-4320-03