趙一賀 (譯),Chengyu Wu,Qiang Shi(石強(qiáng)),Dinh Pham,Afzal Nikaein(著)
(1.天津市第一中心醫(yī)院,天津 300192;2.德克薩斯醫(yī)學(xué)公司,美國(guó) 德克薩斯 達(dá)拉斯 75230;3.貝勒斯科特和懷特醫(yī)療中心,美國(guó) 德克薩斯 天普 76508;4.希威斯康星大學(xué),麥迪遜分校,醫(yī)學(xué)與公共衛(wèi)生學(xué)院外科學(xué)系移植科,美國(guó) 威斯康星州 麥迪遜 91010)
下一代測(cè)序(next-generation sequencing,NGS)已經(jīng)被證明可有效減少人類(lèi)白細(xì)胞抗原(human leukocyte antigen,HLA)分型的不準(zhǔn)確性和檢測(cè)成本,同時(shí)還可以檢測(cè)出之前未測(cè)序的HLA基因的詳細(xì)信息。本研究介紹了在Illumina公司的MiSeq平臺(tái)上使用NGS開(kāi)發(fā)的HLA分型測(cè)定的性能要求。共納入288個(gè)樣品,其之前以HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQA / B和HLA-DPA / B為特征,其使用Sanger測(cè)序、序列特異性引物和序列特異性寡核苷酸技術(shù)進(jìn)行高分辨率的分型。評(píng)估等位基因平衡、敏感性、特異性、精確性、準(zhǔn)確性和不準(zhǔn)確性。這些結(jié)果證明了NGS對(duì)HLA分型的可行性和獲益處,因?yàn)檫@項(xiàng)技術(shù)非常準(zhǔn)確,幾乎排除了所有的不確定性,為HLA基因長(zhǎng)度提供了完整的測(cè)序信息,并形成了利用單一方法進(jìn)行HLA分型的基礎(chǔ)免疫遺傳學(xué)實(shí)驗(yàn)室。
人類(lèi)白細(xì)胞抗原基因是最復(fù)雜的遺傳區(qū)域之一, 同時(shí)也是已知基因組中最具多態(tài)性的基因[1-2]。HLA基因位于人類(lèi)基因組中基因最多的區(qū)域之一,受控于主要組織相容性復(fù)合體(major histocompatibility complex,MHC),位于 6號(hào)染色體短臂(6p21.3)。MHC的許多基因,包括HLA,編碼免疫應(yīng)答中具有關(guān)鍵作用的蛋白質(zhì),其分為HLA-Ⅰ,HLA-Ⅱ,HLA-Ⅲ,HLA基因位于Ⅰ類(lèi)和Ⅱ類(lèi)區(qū)域。
臨床中氨基酸水平的四位HLA分型是非常有必要的,因?yàn)榫哂邢嗤▋晌粩?shù))抗原肽的HLA蛋白之間的氨基酸差異可導(dǎo)致同種異體反應(yīng)。目前HLA分型方法的檢測(cè)包括序列特異性寡核苷酸(sequence specific oligonucleotide,SSO)PCR或聚合酶鏈反應(yīng)直接測(cè)序法(PCR-SBT)[3-4]。
在過(guò)去的10年中,下一代測(cè)序?yàn)槿蚪M分析奠定了基礎(chǔ)。NGS技術(shù)的原理類(lèi)似于毛細(xì)管電泳測(cè)序,兩者關(guān)鍵的區(qū)別在于NGS以大規(guī)模平行方式覆蓋數(shù)百萬(wàn)個(gè)片段進(jìn)行測(cè)序[5]。全世界超過(guò)90%的測(cè)序數(shù)據(jù)來(lái)自基于Illumina測(cè)序的化學(xué)法(SBS),其具有準(zhǔn)確度高、錯(cuò)誤率低和堿基識(shí)別率高的優(yōu)點(diǎn),準(zhǔn)確率為99.9%。
NGS已迅速取代Sanger測(cè)序作為基因組診斷的首選方法。對(duì)于遺傳性癌癥檢測(cè),該技術(shù)的靈敏度和特異性至關(guān)重要,因?yàn)榕R床醫(yī)生需要根據(jù)結(jié)果制定臨床管理和治療方案[6]。
NGS技術(shù)使HLA廣泛用于免疫分子的研究。到目前為止,已經(jīng)開(kāi)發(fā)了幾種基于NGS的高通量HLA分型方法,可實(shí)現(xiàn)HLA四位高分辨率分型深化我們對(duì)HLA基因調(diào)節(jié)機(jī)制的研究,包括轉(zhuǎn)錄、基因表達(dá)調(diào)控和表觀遺傳學(xué)。
1.1 NGS工作流程:標(biāo)準(zhǔn)的Illumina NGS工作流程包括4個(gè)基本步驟:文庫(kù)制備,簇生成,測(cè)序和數(shù)據(jù)分析。
1.1.1 文庫(kù)制備:通過(guò)DNA樣品的隨機(jī)片段化制備測(cè)序文庫(kù),并通過(guò)PCR擴(kuò)增加入連接接頭片段,最后利用凝膠電泳純化產(chǎn)物。
1.1.2 簇生成:將已構(gòu)建好的文庫(kù)加到測(cè)序芯片中,使DNA片段被捕獲到文庫(kù)接頭片段互補(bǔ)的寡核苷酸平面上。然后通過(guò)橋式擴(kuò)增將每個(gè)片段擴(kuò)增成不同的克隆簇。群簇?cái)U(kuò)增完成后,模板就可以進(jìn)行測(cè)序了。
1.1.3 測(cè)序:Illumina SBS技術(shù)采用一種專(zhuān)有的基于可逆終止子的方法,可檢測(cè)被整合到DNA模板鏈中的單個(gè)堿基。由于在每個(gè)測(cè)序循環(huán)期間都存在所有4種可逆終止子可結(jié)合的dNTP,因此與其他技術(shù)相比,Illumina SBS技術(shù)將自然競(jìng)爭(zhēng)最小化,并大大降低原始錯(cuò)誤率。
1.1.4 數(shù)據(jù)分析:新鑒定的序列結(jié)果與參考基因組比對(duì)。通過(guò)序列對(duì)比,可以找到很多突變。
1.2 樣本選擇:選取2016年12月— 2017年10月期間288個(gè)。此前通過(guò)AlleleSEQR試劑(Abbott Laboratories,Des Plaines,IL,USA)或 LABType?SSO探 針(One Lambda,Thermo Fisher Scientific,Los Angeles,CA,USA)進(jìn)行HLA分型的樣品進(jìn)行評(píng)估。通過(guò)使用序列特異性引物(SSP)試劑盒(Olerup-SSP,Stockholm,Sweden和 SSP UniTrayTM,Invitrogen,Thermo Fisher Scientific,Waltham,MA,USA)和等位基因特異性測(cè)序引物(AlleleSEQR HARPs,Abbott Laboratories)最大程度地解決了SBT產(chǎn)生的基因型模棱兩可的情況。所有288個(gè)樣品測(cè)定11個(gè)HLA基因座:HLA-A、HLA-B、HLA-C、HLA-DRB1、HLADRB3 / 4 / 5、HLA-DQA1、HLA-DQB1、HLA-DPA1和HLA-DPB1。
1.3 運(yùn)行通量:測(cè)序通量為每次運(yùn)行8 ~ 24個(gè)樣品。所有運(yùn)行均使用標(biāo)準(zhǔn)或微型測(cè)序芯片進(jìn)行。
1.4 DNA制 備:使 用 Promega Maxwell?RSC和Maxwell?RSC Buffy Coat DNA 試 劑 盒(Promega,Madison,WI,USA)提取基因組DNA。用Promega Quantus和QuantiFluor ONE dsDNA系統(tǒng)定量DNA,并將其濃度調(diào)節(jié)至30 ng /μl。Qiagen公司稱(chēng),其制備的DNA片段大小顯著大于1 000個(gè)堿基,適用于長(zhǎng)片段PCR。
1.5 模板準(zhǔn)備:使用Omixon設(shè)計(jì)的引物通過(guò)長(zhǎng)片段PCR擴(kuò)增樣品的11個(gè)基因座(HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DRB3/4/5、HLA-DQA1、HLA-DQB1、HLA-DPA1和 HLADPB1),上述引物擴(kuò)增了除DRB1之外的全長(zhǎng)HLA基因5'UTR至3'UTR),其中擴(kuò)增子跨越內(nèi)含子1~ 4。 PCR反 應(yīng) 后, 用 Exo-SAP(Affymetrix,Santa Clara,CA,USA)純化擴(kuò)增產(chǎn)物,最后用QuantiFluor ONE dsDNA系統(tǒng)定量,并將濃度標(biāo)準(zhǔn)化為 50 ng /μl左右。
1.6 文庫(kù)制備和測(cè)序:HLA的文庫(kù)構(gòu)建是通過(guò)酶切成小片段、末端修復(fù)、添加indexed接頭完成。測(cè)序試劑在近期獲得FDA認(rèn)證, HoloType HLATM試 劑 盒(Omixon,Inc.,Budapest,Hungary)。 將已加好接頭的文庫(kù)進(jìn)行混池,文庫(kù)采用Ampure XP珠子(Beckman Coulter,Brea,CA,USA)濃縮,然后用 PippinPrepTM(Sage Science,Beverly,MA,USA) 選擇650 bp和1350 bp之間片段。定量 聚 合 酶 鏈 反 應(yīng)(qPCR)(Kapa Biosystems,Wilmington,MA,USA)對(duì)文庫(kù)定量,并調(diào)整到2 nmol / L。然后將文庫(kù)用NaOH變性并稀釋至最終濃度為8 pmol / L以獲得最佳簇密度,并將600 μl加載到MiSeq試劑盒v2(300個(gè)循環(huán))柱(Illumina,San Diego,CA,USA)中。將試劑盒和流動(dòng)池置于Illumina MiSeq上用于簇生成和2×250 bp配對(duì)末端測(cè)序。使用具有全尺寸或微尺寸流通池的MiSeq試劑盒v2進(jìn)行測(cè)序。
1.7 數(shù)據(jù)分析工具和程序:由MiSeq產(chǎn)生的序列數(shù)據(jù)存儲(chǔ)為FASTQ文件。FASTQ格式在單個(gè)文件中包括序列和相應(yīng)的Phred質(zhì)量分?jǐn)?shù)。每個(gè)索引庫(kù)的序列被解析為兩個(gè)唯一的FASTQ文件(一對(duì)用于對(duì)端序列的每一端)。每個(gè)樣品的每個(gè)基因座都用獨(dú)特的識(shí)別9個(gè)堿基序列的索引。用HLA TwinTM(Omixon,Inc.)和 NGSengineTMversion 1.0.0.762(GenDx, Utrecht, the Netherlands)分析 FASTQ 文件。HLA TwinTM使用以下參數(shù)運(yùn)行:分析至少20 000對(duì)讀數(shù); 僅檢查外顯子; 忽略交叉映射的讀取; 最大插入大小為1 600 bp。在每次分析結(jié)束時(shí),比較輸出以產(chǎn)生最終的基因型分配。如表1所示可以計(jì)算基因分型的靈敏度、特異性、精確度和準(zhǔn)確度。
2.1 樣品選擇、制備和測(cè)序:288個(gè)樣品的測(cè)序分布在21次測(cè)序中完成。為每個(gè)基因座單獨(dú)制備文庫(kù),并且測(cè)序運(yùn)行在所有9個(gè)基因座的范圍內(nèi)為8~24個(gè)樣品。樣品在標(biāo)準(zhǔn)或微流動(dòng)池上運(yùn)行,其具有14倍于納米流動(dòng)池的容量,定量文庫(kù)的平均濃度為2 nmol / L。測(cè)序運(yùn)行的平均序列輸出顯示在表1中,滿足Illumina針對(duì)MiSeq定義的每個(gè)流動(dòng)池類(lèi)型的預(yù)期輸出。標(biāo)準(zhǔn)和微流動(dòng)池的Closter密度范圍為601~1 730 k/mm。通過(guò)過(guò)濾器的簇的百分比(代表測(cè)序結(jié)束時(shí)的可用讀數(shù))的范圍從最小值93.2%~98.96%(平均96.45%)。最后,該分析實(shí)現(xiàn)了平均97.68%的基質(zhì),每次運(yùn)行的Phred評(píng)分≥30。
2.2 質(zhì)量控制和基因分型分析:首先將序列讀數(shù)與整個(gè)IMGT / HLA數(shù)據(jù)庫(kù)(所有已知的HLA等位基因)對(duì)齊。然后,基于各種比對(duì)統(tǒng)計(jì)選擇最佳匹配等位基因,例如覆蓋外顯子的讀數(shù)和覆蓋的外顯子的程度。僅保留與IMGT / HLA數(shù)據(jù)庫(kù)中具有少量錯(cuò)配的等位基因同源的可讀取的讀數(shù)。然而,對(duì)于每個(gè)基因區(qū)域,序列讀數(shù)不是均勻分布的,并且平均深度表明覆蓋范圍中可能存在誤差。
測(cè)序后,使用Omixon的基因分型軟件程序HLA TwinTM進(jìn)行分析。對(duì)軟件準(zhǔn)確分析HLA基因型的能力部分取決于每個(gè)基因座的測(cè)序深度(如表2所示)。在得到結(jié)果之前,我們使用讀取數(shù)量、噪聲、標(biāo)志、關(guān)鍵外顯子點(diǎn)噪聲比、一致覆蓋關(guān)鍵外顯子最小深度和關(guān)鍵外顯子等位基因不平衡作為衡量標(biāo)準(zhǔn)。
覆蓋分布在所測(cè)試的樣品中高度是可重復(fù)的,如每個(gè)擴(kuò)增子中每個(gè)位置從最小覆蓋深度到最大覆蓋深度的偏差。對(duì)于所有基因,擴(kuò)增子的開(kāi)始和結(jié)束時(shí)覆蓋深度變化最大,因?yàn)檫@些區(qū)域具有片段化酶的性質(zhì)和所選擇的大片段可引起讀數(shù)堆積。
精確度是一個(gè)需要考慮的重要因素。由于等位基因存在,NGS基因分型軟件分析數(shù)據(jù)后可以產(chǎn)生等位基因類(lèi)型,該分析軟件準(zhǔn)確率為99.3%。
表 1 實(shí)驗(yàn)測(cè)序運(yùn)行指標(biāo)
表2 質(zhì)量控制標(biāo)準(zhǔn)
2.3 Omixon 質(zhì)量控制:表3 ~ 6列出了基于Illumina數(shù)據(jù)分析的相關(guān)質(zhì)量控制數(shù)據(jù):普通的操作參數(shù)、短序列的使用、等位基因不平衡、樣本的可映射性。表3和表4總結(jié)了我們?cè)谶\(yùn)行期間的數(shù)據(jù)分析。
2.4 注意事項(xiàng)
2.4.1 等位基因不平衡:當(dāng)樣品是雜合子時(shí),準(zhǔn)確檢測(cè)兩個(gè)等位基因?qū)τ贖LA基因分型方法是必要的。在開(kāi)始做PCR實(shí)驗(yàn),等位基因彼此獨(dú)立地?cái)U(kuò)增,并且如果一個(gè)等位基因比另一個(gè)放大更多,這可能由于各種原因而產(chǎn)生,所得到的測(cè)序數(shù)據(jù)將顯示其中一個(gè)等位基因的讀段的數(shù)量增多。如果大多數(shù)數(shù)據(jù)顯著高于其他等位基因>70%的總數(shù)據(jù),就認(rèn)為等位基因不平衡,如圖1所示。
2.4.2 NGS軟件錯(cuò)誤:NGS與之前的檢測(cè)方法存在矛盾結(jié)果,其原因與分析軟件相關(guān)。每個(gè)軟件程序在確定適當(dāng)?shù)牡任换驒z測(cè)方面都有其自身的一系列界限。這些界限取決于每種算法的設(shè)計(jì)和實(shí)現(xiàn)方式。HLA TwinTM產(chǎn)生許多不正確的等位基因分型結(jié)果是由于該算法優(yōu)先分析具有更多外顯子特征的等位基因。
圖1 本研究中的等位基因失衡的比例。注意區(qū)分具有小污染的純合樣品和具有高度不平衡的雜合樣品并不總是可行的。
2.5 歧義性:在NGS分型完成后,超過(guò)99%的等位基因分型被劃歸為第三個(gè)區(qū)域。引起歧義的主要原因是由于沒(méi)有檢查基因的所有外顯子以及不能在這些外顯子內(nèi)或外之間進(jìn)行多態(tài)性分析。第三個(gè)區(qū)域未解決的唯一模糊性在DQA和DPB1基因座中發(fā)現(xiàn)了73個(gè)樣品 (表5和6)。存在第四個(gè)區(qū)域歧義,其不會(huì)影響第三區(qū)域的等位基因分型,因此我們?cè)谟?jì)算模糊等位基因時(shí)不包括這一點(diǎn)。如果多態(tài)位置在長(zhǎng)距離 (>1 000 bp) 發(fā)生,MiSeq系統(tǒng)無(wú)法在配對(duì)末端配置中排序,則仍存在模糊的可能性。
表3 總體操作參數(shù)
表 4 總體操作參數(shù)
表5 Omixon程序分析樣品數(shù)據(jù)
表 6 本研究中涉及的樣品的可映射性
2.6 準(zhǔn)確性、對(duì)應(yīng)性、敏感性和特異性結(jié)果:通過(guò)使用Illumina MiSeq Dx的NGS和使用Genetic Analyzer 3500 xL Dx的SBT,我們使用73個(gè)患者樣本運(yùn)行完整基因座分型。對(duì)于93個(gè)患者標(biāo)本,來(lái)自NGS的所有11個(gè)可檢測(cè)的HLA基因座分型結(jié)果與SBT測(cè)序分型結(jié)果完全匹配。20 / 93標(biāo)本由另一個(gè)實(shí)驗(yàn)室進(jìn)行盲測(cè)??偨Y(jié)結(jié)果顯示在表7和8中。
使用用于NGS的Omixon HLA試劑盒以及SBT或SSO方法處理73個(gè)樣品用于比較和驗(yàn)證。除了檢測(cè)DQA1和DPA1之外,SBT是我們實(shí)驗(yàn)室中目前用于高分辨率分型的方法。在一些情況下,特定位點(diǎn)的數(shù)據(jù)不足以確定NGS的分型 (見(jiàn)表7和表8)。
表2描述了所有基因座的NGS和SBT或SSO之間的一致性。NGS與SBT或SSO之間的總體一致性為97.6%。進(jìn)一步評(píng)估了≤95%一致性的基因座?;蜃鵄具有99.9%的一致性?;蜃?B具有100%的一致性?;蜃鵆的一致性為99.9%?;蜃?DR的一致性為98.5%?;蜃?DR345具有97.2%的一致性。基因座DQA的一致性為92.4%。基因座 DQB的一致性為99.2%。基因座DPA具有100%的一致性?;蜃?DPB的一致性為94.5%。
進(jìn)一步評(píng)估DQA和DPB以解決差異。DQA的10個(gè)不一致樣本中有8個(gè)采用SSP進(jìn)行檢測(cè)。SSP在測(cè)試的10個(gè)樣品中的8個(gè)中證實(shí)了NGS結(jié)果。SSP的證實(shí)將DQA的一致性提高到97.9%(143 / 146)。SSP還對(duì)7個(gè)不一致的DPB樣本中的6個(gè)進(jìn)行了測(cè)試,以解決這些差異。兩者都與NGS結(jié)果一致,因此DPB的一致性增加到98.6%(144 /146)。在對(duì)不一致樣品進(jìn)行進(jìn)一步評(píng)估后,確定所有基因座與SBT或SSO結(jié)果的一致性≥95%。SSP證實(shí)了其他不一致的等位基因,結(jié)果與NGS相符。
2.7 檢測(cè)極限:從患者的全血中分離的DNA用于確定該測(cè)定的HLA等位基因檢測(cè)(分析靈敏度)的極限。使用Qiagen EZ-1自動(dòng)提取儀進(jìn)行核酸提取。DNA 的濃度為 10 ng /μl、5 ng /μl、1 μg /μl、1 ng /ml也分別使用3個(gè)更多的擴(kuò)增循環(huán)進(jìn)行。說(shuō)明書(shū)推薦每個(gè)反應(yīng)可以使用1 ~ 20 ng /μl。我們的結(jié)果顯示10 ng /μl和1 ng /μl沒(méi)有基因座丟失,結(jié)果相同。7個(gè)口腔拭子樣本沒(méi)有結(jié)果。其中一個(gè)原因是DNA樣品的濃度不準(zhǔn)確,也可能是已經(jīng)降解。
2.8 盲測(cè)重復(fù)性:使用用于NGS的Omixon HLA試劑盒和Immucor試劑盒檢測(cè)24個(gè)樣品。用樣本盲測(cè)作為測(cè)試,在我們自己的結(jié)果被復(fù)核之后,在另一個(gè)實(shí)驗(yàn)室檢測(cè)也得到結(jié)果,比較結(jié)果(表9和表10)。Omixon和Immucor之間的總體一致性為99.3%。進(jìn)一步評(píng)估了≤95%一致性的基因座。基因座A具有100%的一致性?;蜃?B具有100%的一致性?;蜃鵆具有100%的一致性?;蜃?DR具有100%的一致性?;蜃?DR345的一致性為97.9%?;蜃鵇QA具有100%的一致性。DQB具有97.9%的一致性(在第一次DQB測(cè)試中,Omixon未在4個(gè)樣本中顯示DQB等位基因,但重復(fù)測(cè)試,3 / 4顯示等位基因)。基因座 DPA具有100%的一致性。基因座 DPB的一致性為97.9%。
表7 NGS法基因組原始數(shù)據(jù)
表8 NGS法數(shù)據(jù)分析結(jié)果總結(jié)
表 10 NGS法盲測(cè)分析結(jié)果總結(jié)
用于HLA分型的NGS在臨床實(shí)驗(yàn)室中面臨許多難題。這些難題存在于分析前、分析中和分析后。
3.1 分析前:分析前最大的問(wèn)題是從低濃度口腔拭子樣本進(jìn)行HLA分型,并將已知的HLA類(lèi)型樣品轉(zhuǎn)向質(zhì)控所有用于文庫(kù)制備的指數(shù)。通常從口腔樣本獲得的較短DNA片段阻礙LR-PCR擴(kuò)增并且可導(dǎo)致等位基因丟失。碎片DNA與不正確的磁珠處理、技術(shù)錯(cuò)誤或低DNA濃度相比更能導(dǎo)致等位基因丟失。用于NGS的DNA應(yīng)使用熒光dsDNA測(cè)定法(Qubit,PicoGreen等)進(jìn)行定量。在LRPCR之前UNC使用QuBit(ThermoFisher Scientific)進(jìn)行DNA定量。我們成功地將HLA分型樣品濃縮為2 ng / L,并將根據(jù)具體情況嘗試使用低濃度樣品進(jìn)行NGS。然而,低濃度(低于10 ng / L)的DNA樣本可導(dǎo)致等位基因丟失。
對(duì)于Illumina測(cè)序儀,有一種對(duì)照控制材料PhiX,測(cè)序儀將根據(jù)參考基因組自動(dòng)確定錯(cuò)誤率。PhiX是一種具有已知基因組的小型噬菌體,其作為MiSeq測(cè)序的對(duì)照,獨(dú)立于NGS應(yīng)用[7]。
我們通常的MiSeq平均錯(cuò)誤率為0%~0.39%,它代表監(jiān)測(cè)儀器QA系統(tǒng)的錯(cuò)誤率與正在生成的數(shù)據(jù)的質(zhì)量有關(guān),但與HLA基因型沒(méi)有特別的關(guān)系。如表1所示,監(jiān)控參數(shù)(如錯(cuò)誤率和簇密度)可以提供有效的QA和QC。但是,當(dāng)發(fā)生過(guò)度聚集時(shí),通過(guò)過(guò)濾器的簇?cái)?shù)量減少。過(guò)度聚集使單個(gè)分子簇重疊,妨礙了單個(gè)堿基對(duì)的準(zhǔn)確測(cè)定。這種情況阻礙了Illumina測(cè)序儀準(zhǔn)確識(shí)別哪個(gè)堿基對(duì)被合并。無(wú)論應(yīng)用程序如何,過(guò)度集群的影響都會(huì)降低整體數(shù)據(jù)質(zhì)量。如果發(fā)生過(guò)度聚集,這就需要足夠的高質(zhì)量數(shù)據(jù)來(lái)提供準(zhǔn)確的HLA基因分型。
3.2 分析中:分析中的問(wèn)題包括確定易受等位基因丟失影響的HLA等位基因(在我們的測(cè)試中主要是HLA-DQA1和DPB1)、稀有等位基因、新等位基因和純合樣本。當(dāng)NGS檢測(cè)低含量DNA樣本時(shí),純合子的鑒定則變得困難,這是由NGS靈敏度造成的。
3.3 分析后:在MiSeq平臺(tái)上運(yùn)行的典型NGS產(chǎn)生大約18 GB的總數(shù)據(jù)。大多數(shù)據(jù)是在每個(gè)循環(huán)期間由定序器生成的原始bcl文件的形式和解復(fù)用的FASTQ文件。臨床實(shí)驗(yàn)室必須保存FASTQ文件、InterOp文件夾、運(yùn)行信息、運(yùn)行參數(shù)和分析數(shù)據(jù)。在標(biāo)準(zhǔn)的MiSeq平臺(tái)上,這些文件大約占據(jù)7 GB的數(shù)據(jù),并且數(shù)據(jù)需要長(zhǎng)期保存。不同NGS平臺(tái)產(chǎn)生不同數(shù)量的數(shù)據(jù)。但是,對(duì)長(zhǎng)期存儲(chǔ)解決方案的需求是統(tǒng)一的。為了解決數(shù)據(jù)存儲(chǔ)方面的問(wèn)題,實(shí)驗(yàn)室應(yīng)與其信息技術(shù)部門(mén)合作,以獲得一個(gè)安全的、醫(yī)院控制的存儲(chǔ)(4 TB)用于長(zhǎng)期存儲(chǔ),每天備份。所需的存儲(chǔ)量取決于預(yù)期的NGS運(yùn)行次數(shù)和原始數(shù)據(jù)的存儲(chǔ)時(shí)間長(zhǎng)度(ASHI標(biāo)準(zhǔn)為至少2年)。一個(gè)可供選擇的替代方案是基于云的數(shù)據(jù)存儲(chǔ),根據(jù)選擇供應(yīng)商和所需的存儲(chǔ)量,而具有不同的價(jià)格。NGS用于HLA分型的臨床應(yīng)用不僅會(huì)產(chǎn)生數(shù)據(jù)存儲(chǔ)為題,還會(huì)帶來(lái)周轉(zhuǎn)時(shí)間的問(wèn)題。
NGS可以提高HLA分型的分辨率并且能降低成本。與其他任何新技術(shù)的應(yīng)用一樣,基于NGS的HLA分型的最佳方案和實(shí)踐也在不斷發(fā)展[8,9]。NGS的HLA分型允許MHC和免疫遺傳學(xué)領(lǐng)域提出關(guān)于HLA基因表達(dá)、調(diào)節(jié)及其對(duì)患者結(jié)果的影響的新的和重要的問(wèn)題。這些不但將推動(dòng)HLA領(lǐng)域進(jìn)行深入研究,也將推動(dòng)HLA配型方法的不斷改進(jìn)。