宋燚, 賈思雨, 武麗娜, 張偉, 歐曉娟, 黃堅(jiān)*
1.首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院臨床醫(yī)學(xué)研究所,北京 100050;
2.北京大學(xué)人民醫(yī)院麻醉科,北京 100044;
3.首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院肝病中心,北京 100050
先天性膽紅素代謝障礙性肝病是指膽紅素生成過多,或肝細(xì)胞對膽紅素?cái)z取、運(yùn)輸、酯化及排泄等環(huán)節(jié)發(fā)生障礙[1],導(dǎo)致血中膽紅素濃度增高,擴(kuò)散進(jìn)入組織、大部分內(nèi)臟器官和某些體液使其黃染而表現(xiàn)為黃疸,主要包括Dubin-Johnson綜合征(DJS)、Rotor綜合征、Gilbert綜合征和Crigler-Najjar綜合征[2-4]。由于發(fā)病率較低或診斷不明確,常見個(gè)案報(bào)道。遺傳性肝內(nèi)膽汁淤積癥是兒童期肝病的重要病因,表現(xiàn)為皮膚黃染、尿色加深、便色淺等,逐漸發(fā)展為高膽紅素血癥,如診治不及時(shí)會(huì)嚴(yán)重影響患兒生長發(fā)育,甚至導(dǎo)致死亡[5-6]。膽汁淤積癥包括家族性肝內(nèi)膽汁淤積癥Ⅰ~Ⅲ型(BRIC/PFICⅠ、BRIC/PFICⅡ、BRIC/PFICⅢ)、Alagille綜合征、缺陷病以及各種膽汁酸合成缺陷等[7-9]。由于發(fā)病率低、臨床表現(xiàn)不典型,且常規(guī)檢查無特異性等導(dǎo)致臨床診斷困難。
上述幾種病癥就單一病種而言,發(fā)病率并不高,但總體發(fā)病率卻不容忽視。同時(shí)上述代謝性肝病的臨床表現(xiàn)缺乏特異性,可與獲得性肝損傷重疊,如病毒性肝炎、酒精性肝損傷等,使臨床診斷較為困難,容易造成漏診和誤診[10]。因此建立快速準(zhǔn)確的檢測技術(shù)對我國先天性膽汁淤積與膽紅素代謝障礙的識(shí)別診斷具有重要意義[11-12]?;驒z測是目前診斷代謝性肝病的“金標(biāo)準(zhǔn)”,但是人群遺傳異質(zhì)性和個(gè)體差異導(dǎo)致基因檢測需要覆蓋致病基因的所有外顯子及內(nèi)含子剪接區(qū),才能準(zhǔn)確無遺漏的識(shí)別其致病突變,眾多的基因和復(fù)雜的致病機(jī)制使分子生物學(xué)檢測診斷具有較高挑戰(zhàn)性[13-14]。目前最常采用的Sanger測序技術(shù)只能用于單個(gè)遺傳代謝肝病的檢測,同時(shí)只能檢測某幾個(gè)熱點(diǎn)突變,并可能出現(xiàn)假陰性,而且需要逐個(gè)基因逐個(gè)位點(diǎn)的檢測,操作耗時(shí)耗力,較為繁瑣。而全外顯子測序價(jià)格昂貴,對于少數(shù)單基因病的檢測較為浪費(fèi)。
因此,本研究基于高通量測序技術(shù)建立并驗(yàn)證了針對我國人群常見的遺傳性膽紅素代謝障礙及膽汁淤積綜合征目標(biāo)基因的探針捕獲檢測技術(shù)平臺(tái),既覆蓋了所選基因的所有靶區(qū)域,又避免了應(yīng)用全外顯子測序?qū)е碌母甙嘿M(fèi)用[14]。利用該技術(shù)對北京友誼醫(yī)院膽紅素代謝障礙和膽汁淤積癥患者進(jìn)行了基因檢測,以期為患者及家庭提供基因診斷的依據(jù),并為該類疾病的早期診斷提供經(jīng)驗(yàn)和方法。
收集2016年8月至2020年12月在首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院肝病中心診斷為膽汁淤積和先天性膽紅素代謝障礙患者樣本39例,其中Gilbert綜合癥患者13例、Dubin-Johnson綜合征患者13例、BRIC患者7例、Alagille患者3例、Rotor綜合征患者3例,無α1抗胰蛋白酶缺乏癥和Citrin患者,取患者外周血2~3 mL。本研究已通過醫(yī)院醫(yī)學(xué)倫理委員會(huì)批準(zhǔn)(審批號(hào):2019-P2-217-02),患者均簽署書面知情同意書。
1.2.1 探針的設(shè)計(jì) 選擇膽汁淤積BRIC/PFIC常見3個(gè)基因ATP8B1、ABCB11和ABCB4,Alagille致病基因JAG1,Citrin致病基因SLC25A13,膽紅素代謝障礙Dubin-Johnson致病基因ABCC2,Rotor綜合癥致病基因SLCO1B1和SLCO1B3,Gilbert及Crigler致病基因UGT1A1,α1抗胰蛋白酶缺乏癥致病基因SERPINA1,共10個(gè)基因覆蓋117個(gè)外顯子,如表1所示。提取患者外周血樣基因組DNA,進(jìn)行10個(gè)基因的試劑盒檢測。利用安捷倫的eArray免費(fèi)在線設(shè)計(jì)平臺(tái)(http://earray.chem.agilent.com/eArray),設(shè)計(jì)了1 084個(gè)平均長度為120 bp捕獲探針(bait),委托北京艾吉泰康生物科技北京有限公司合成。
表1 檢測的基因及區(qū)域Table 1 The target genes and their regions
1.2.2 樣本文庫的制備 選擇6例已經(jīng)過Sanger測序、有明確變異位點(diǎn)的DJS患者樣本,其基因組DNA用Bioruptor Pico超聲儀進(jìn)行DNA片段化。采用Bioruptor Pico超聲儀設(shè)定程序:開啟冷循環(huán)使水溫降至4℃,設(shè)置參數(shù)ON 30 s,OFF 30 s為1個(gè)循環(huán),每10個(gè)循環(huán)為一輪,共進(jìn)行3輪。超聲完成后取DNA 1 μL,使用Agilent 2100(DNA 1000 Assay)進(jìn)行檢測,DNA主峰約為150~200 bp。然后進(jìn)行末端修復(fù),體系為:35μL片段化后的DNA,5 μL dNTPs,10 μL 5×ERA-Tailing Enzyme。Mix PCR程序:熱蓋溫度85℃;20℃ 30 min;65℃30 min。反應(yīng)結(jié)束后連接P1和P2接頭,體系為:15 μmol·L-1接頭 5 μL,DNA連接酶10 μL,5×Ligation Buffer 20μL,加水至總體積100μL。吹打混勻后運(yùn)行PCR程序20℃15 min。然后在不同樣本的P1或P2端連接不同的index序列,體系為:PCR Master Mix 25μL,P1端index引物2.5μL,P2端index引物2.5μL。吹打混勻后進(jìn)行PCR,程序?yàn)椋?8 ℃ 2 min;98 ℃ 20 s,60 ℃ 30 s,72℃,30 s共7個(gè)循環(huán);72℃1 min。純化完成后取1μL樣品分別使用 Qubit? 3.0 Fluorometer(Qubit dsDNA HS Assay Kit)進(jìn)行文庫濃度測定和Agilent 2100 Bio-analyzer system(Agilent DNA 1000 Kit)進(jìn)行片段長度測定。
1.2.3 樣本富集雜交 取上述文庫750 ng進(jìn)行靶序列探針捕獲,將文庫濃縮后加入雜交反應(yīng)體系,體系為:雜交緩沖液13μL,接頭5μL,接頭通用封阻序列2μL,RNAse Block 5μL,無菌水3μL,捕獲探針2μL,運(yùn)行PCR程序:熱蓋溫度85℃,80℃5 min,50 ℃ 過夜16~24 h。利用Dynabeads MyOne Streptavidin T1磁珠(Invitrogen公司)進(jìn)行靶序列富集并配制體系:產(chǎn)物24μL,接頭引物50μmol·L-11μL,緩沖液25μL。運(yùn)行PCR程序:95℃預(yù)變性1 min;98℃變性20 s,60℃復(fù)性30 s,70℃延伸30 s,12個(gè)循環(huán);70℃再延伸5 min,反應(yīng)結(jié)束后使用Agencourt AMPure XP磁珠純化產(chǎn)物。
1.2.4 測序上樣前質(zhì)量控制及測序后數(shù)據(jù)分析上樣前對文庫使用Qubit dsDNA HS Assay Kit進(jìn)行定量,濃度約在 1~10 ng·μL-1;并使用 Agilent DNA 1000 Kit進(jìn)行片段長度測定,文庫長度約在270~320 bp之間。利用NextSeq 500測序平臺(tái)測序。測序完成后對獲得的數(shù)據(jù)Raw data進(jìn)行初步過濾,得到Clean data。采用BWA軟件將Clean data與參考基因組hg19做比對,得到bam結(jié)果文件。基于與基因組參考序列比對的bam結(jié)果,采用GATK軟件尋找SNP和InDel,然后運(yùn)用ANNOVAR軟件對SNP、InDel位點(diǎn)進(jìn)行注釋,確定突變位點(diǎn)對應(yīng)的基因信息、功能信息和有害性等。與Sanger測序結(jié)果相比,評(píng)價(jià)本方法的準(zhǔn)確性。
1.2.5 統(tǒng)計(jì)學(xué)處理 將39例樣本的測序結(jié)果按照1.2.4進(jìn)行注釋,注釋后的臨床樣本測序數(shù)據(jù)通過HGMD、ClinVar和OMIM數(shù)據(jù)庫對致病突變進(jìn)行篩選,未報(bào)道的新致病突變通過與千人基因組10 450個(gè)樣本的數(shù)據(jù)集進(jìn)行比較,進(jìn)行哈代-溫伯格(在理想狀態(tài)下,各等位基因的頻率和基因型頻率在遺傳中穩(wěn)定不變)檢驗(yàn),算出哈溫平衡P值(HWE_P值),HWE_P>0.05的突變列為哈溫平衡可信位點(diǎn)。再對兩組數(shù)據(jù)進(jìn)行χ2檢驗(yàn),計(jì)算P值,P<0.05為組內(nèi)差異有統(tǒng)計(jì)學(xué)意義。
將6例已測序DJS患者的基因組DNA斷裂片段集中于250 bp(圖1A)。完成切口平移和純化后的DNA片段與合成的探針液相孵育雜交24 h,經(jīng)捕獲磁柱富集靶標(biāo)片段后進(jìn)行PCR擴(kuò)增建立文庫,使用Agilent DNA 1000試劑盒進(jìn)行片段長度測定,約在270~320 bp間(圖1B)。即基因組DNA均勻打斷后,通過設(shè)計(jì)的探針將靶標(biāo)序列精準(zhǔn)捕獲并富集,構(gòu)建的文庫符合測序上樣的濃度和片段長度。
圖1 6例DJS樣本片段化基因組DNA安捷倫2100檢測圖Fig.1 Fragment genomic DNA of six DJS samples using Agilent 2100
測序數(shù)據(jù)的質(zhì)量主要分布在Q30≥80%以上,保證后續(xù)分析的正常進(jìn)行。根據(jù)測序技術(shù)的特點(diǎn),測序片段末端的堿基質(zhì)量一般會(huì)比前端的低。本方法的平均Q30達(dá)到96.07%(圖2),完全符合分析要求。測序深度均一化處理后均一性更高,在平均深度周圍成泊松分布。本方法均一化程度高,測序偏好性低且測序深度高(圖3)。高通量測序質(zhì)控?cái)?shù)據(jù)見表2,完全符合結(jié)果分析和判定要求。與6個(gè)已Sanger測序、有明確變異位點(diǎn)的樣本比較,本檢測方法檢出變異位點(diǎn)的位置和基因型的符合率和準(zhǔn)確性為100%。
表2 高通量測序質(zhì)控?cái)?shù)據(jù)統(tǒng)計(jì)Table 2 Statistics of quality control data of next-generation sequencing
圖2 樣本D1堿基質(zhì)量值分布圖Fig.2 Distribution of base mass values of sample D1
圖3 樣本D1測序深度分布圖Fig.3 Distribution map of sequencing depth of sample D1
入組的膽紅素代謝障礙和膽汁淤積患者39例中發(fā)現(xiàn)的已報(bào)道突變位點(diǎn)39個(gè)(表3),新型突變19個(gè),在千人基因組對照數(shù)據(jù)庫(n=14 050)中均未出現(xiàn)(表4):其中BRIC和PFIC I對應(yīng)基因ATP8B1中已報(bào)道突變位點(diǎn)4個(gè),新型突變1個(gè);PFICⅢⅡ?qū)?yīng)基因ABCB11中已報(bào)道突變5個(gè),新突變2個(gè);PFICⅢ對應(yīng)基因ABCB4中已報(bào)道突變3個(gè),新突變2個(gè);Gilbert和Crigler-Najjar綜合癥對應(yīng)基因UGT1A1中已報(bào)道突變5個(gè),新突變3個(gè);Alagille綜合征對應(yīng)基因JAG1中已報(bào)道突變2個(gè);Dubin-Johnson綜合征對應(yīng)基因ABCC2中已報(bào)道突變4個(gè),新突變7個(gè);Rotor綜合征對應(yīng)基因SLCO1B1和SLCO1B3中已報(bào)道突變分別為5個(gè)和6個(gè),新突變均為1個(gè);α1-抗胰蛋白酶缺乏癥對應(yīng)基因SERPINA1已報(bào)道突變4個(gè);Citrin缺乏癥對應(yīng)基因SLC25A13已報(bào)道突變1個(gè),新突變2個(gè)。新型突變19個(gè)在39個(gè)樣本中均只出現(xiàn)1次,其哈溫平衡檢驗(yàn)結(jié)果均為P=0.768>0.05,符合哈文平衡可信位點(diǎn),χ2檢驗(yàn),組內(nèi)差異有統(tǒng)計(jì)學(xué)意義(P=0.042 7<0.05)。
表3 39例遺傳性膽紅素代謝障礙及膽汁淤積綜合征患者已報(bào)道突變Table 3 Mutations have been reported in 39 patients with abnormal bilirubin metabolism and cholestasis
表4 39例遺傳性膽紅素代謝障礙及膽汁淤積綜合征患者新突變Table 4 The new mutations in 39 patients with abnormal bilirubin metabolism and cholestasis
遺傳性膽紅素代謝異常及肝內(nèi)膽汁淤積癥是指因基因突變引起的肝臟代謝障礙性疾病,具有先天性、終身性和家族性的特征。膽紅素代謝是指肝細(xì)胞將非結(jié)合膽紅素轉(zhuǎn)變?yōu)榻Y(jié)合膽紅素,以維持血中膽紅素的正常濃度,肝臟對膽紅素的處理包括攝取、結(jié)合和排泄3個(gè)步驟。膽汁淤積的病因復(fù)雜,主要包括代謝或內(nèi)分泌疾病、肝外膽道疾病、肝內(nèi)疾病、解剖異常、感染、中毒、遺傳等[15]。由于遺傳性膽紅素代謝異常及肝內(nèi)膽汁淤積綜合征發(fā)病率低,發(fā)病后呈現(xiàn)進(jìn)行性加重,如未能早識(shí)別、早干預(yù)、早治療,可能會(huì)導(dǎo)致殘疾或死亡。但其早期臨床癥狀及實(shí)驗(yàn)室檢查常無特異性指征,病因往往無法確認(rèn),常會(huì)出現(xiàn)漏診或誤診,極大阻礙了鑒別診斷[16]。目前,遺傳性膽紅素代謝異常及膽汁淤積綜合征的診斷方法主要有針對酶活性或代謝物的生化測定、氣相色譜-質(zhì)譜聯(lián)用技術(shù)、串聯(lián)質(zhì)譜聯(lián)用技術(shù),以及針對基因的檢測方法如定量PCR、一代測序等[17]。這些技術(shù)和方法最大的局限性在于普遍通量低,一般一次只能檢測一種疾病,無法滿足遺傳代謝性肝病可檢出病種逐年增多的現(xiàn)狀;同時(shí)酶活性或代謝物的檢測結(jié)果存在結(jié)果不易判讀、重復(fù)性差、假陽性和假陰性多等問題。因此,開展遺傳性膽紅素代謝異常及肝內(nèi)膽汁淤綜合征的早期高通量篩查檢測是防治的關(guān)鍵。本研究建立了基于高通量測序的用于檢測遺傳性膽紅素代謝異常及膽汁淤積綜合征相關(guān)基因變異的探針組、方法和試劑盒,并進(jìn)行了臨床樣本的驗(yàn)證和應(yīng)用。該方法覆蓋了10個(gè)基因的117個(gè)外顯子區(qū)及剪切區(qū),可同時(shí)檢測11種遺傳代謝性肝病易感基因的全部外顯子及內(nèi)含子剪切區(qū)的單核苷酸多態(tài)性和/或拷貝數(shù)變異,該方法檢測通量高、耗時(shí)短、結(jié)果準(zhǔn)確可靠,與Sanger測序法逐個(gè)基因逐個(gè)片段檢測相比,大大節(jié)約了所用的時(shí)間成本和人力成本[14,18]。
利用本方法對首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院肝病中心收集的膽紅素代謝異常及膽汁淤積綜合征39例患者進(jìn)行檢測,平均測序深度為548×,雜合突變頻率落在34.3%~61.2%之間,純合突變頻率落在99.6%~100%之間,完全符合結(jié)果判定要求。測序后的結(jié)果進(jìn)行生物信息學(xué)分析,通過HGMD、ClinVar和OMIM突變數(shù)據(jù)庫對新發(fā)突變進(jìn)行篩選,未報(bào)道的新突變通過與千人基因組數(shù)據(jù)集對比,在患者組中發(fā)現(xiàn)了現(xiàn)有數(shù)據(jù)庫沒有收錄的新型突變,包括移碼突變、錯(cuò)義突變、剪接突變、翻譯提前終止和非移碼插入,展示了高通量靶向捕獲測序在遺傳性膽紅素代謝異常及膽汁淤積綜合征研究中的重要作用。所有新型突變都經(jīng)過哈溫平衡檢驗(yàn)和χ2檢驗(yàn),符合哈溫平衡的可信位點(diǎn),且組內(nèi)差異有統(tǒng)計(jì)學(xué)意義[19-20]。
由本研究結(jié)果可以看出,39例患者樣本共檢測到58種突變,新型突變19種。先天性膽紅素代謝異常患者29例。其中Gilbert綜合癥患者13例,Gilbert是由于尿苷二磷酸葡萄糖醛酸轉(zhuǎn)移酶(UDP-glucuronosyltransferase,UGT)活力明顯下降,引起血清非結(jié)合型膽紅素水平升高,UGT1A1基因啟動(dòng)子的突變是Gilbert綜合征的主要分子遺傳學(xué)基礎(chǔ)。Crigler-Najjar綜合征為先天性肝細(xì)胞對膽紅素結(jié)合功能障礙性疾病,患者的先天性非溶血性黃疽是由于UGT1A1活性嚴(yán)重或部分缺乏所致,本次共檢測出8種UGT1A1基因突變。Dubin-Johnson綜合征患者13例,患者由于肝細(xì)胞排泌結(jié)合膽紅素先天性障礙出現(xiàn)結(jié)合高膽紅素血癥,其致病基因ABCC2本次共檢測出11種突變。Rotor綜合征患者3例,患者由于肝細(xì)胞攝取非結(jié)合膽紅素和排泌結(jié)合膽紅素障礙導(dǎo)致遺傳性高膽紅素血癥,基因SLCO1B1和SLCO1B3同時(shí)致病突變才有可能發(fā)病,共檢測突變位點(diǎn)13個(gè)。膽汁淤積癥患者10例,其中家族性肝內(nèi)膽汁淤積癥1~3型(BRIC/PFICⅠ、Ⅱ、Ⅲ)7例,共檢出17種突變;Alagille患者3例,共檢出2種突變。綜上所述,本研究建立的高通量靶向測序方法檢測到了不同類型的突變,有效地揭示了包含致病性突變和遺傳易感性突變在內(nèi)的遺傳多樣性。我們在后期研究中將通過增加探針數(shù)和擴(kuò)大檢測范圍為遺傳代謝性肝病患者及家庭提供早期精準(zhǔn)的基因診斷。