韋曄,李科,盧大儒,朱化星
技術(shù)與方法
CUT&Tag產(chǎn)物回收和建庫(kù)方法的優(yōu)化
韋曄1,2,李科2,盧大儒1,朱化星2
1. 復(fù)旦大學(xué)生命科學(xué)學(xué)院遺傳工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海 1200438 2. 吳江近岸蛋白質(zhì)科技有限公司,上海 215200
新興的染色質(zhì)靶向切割和標(biāo)簽化(clevage under target and tagment, CUT&Tag)技術(shù)利用轉(zhuǎn)座酶在目標(biāo)蛋白結(jié)合的DNA附近進(jìn)行切割并對(duì)切割下的DNA片段進(jìn)行標(biāo)簽化,通過(guò)后續(xù)的二代測(cè)序可以快速鑒定蛋白質(zhì)- DNA相互作用,極大的簡(jiǎn)化了染色質(zhì)免疫共沉淀測(cè)序(chromatin immunoprecipitation sequencing, ChIP-seq)的實(shí)驗(yàn)過(guò)程。CUT&Tag中轉(zhuǎn)座酶完成標(biāo)簽化后需要DNA回收或其他后處理才能進(jìn)行建庫(kù)PCR,不同的回收方法對(duì)CUT&Tag結(jié)果有著顯著的影響。通過(guò)建立生物素化轉(zhuǎn)座體-鏈霉親和素磁珠體系(streptavidin beads recovery CUT&Tag, srCUT&Tag),可以快速便捷地完成CUT&Tag的產(chǎn)物回收。本文在K562細(xì)胞中展開(kāi)H3K4me3、RNA聚合酶II (RNA polymerase II, RNAPII)、轉(zhuǎn)錄因子CTCF和HMGA1的CUT&Tag實(shí)驗(yàn),并利用現(xiàn)有的乙醇沉淀、片段分選(solid-phase reversible immobilization, SPRI)磁珠回收和直接PCR法,以及本研究建立的srCUT&Tag方法對(duì)產(chǎn)物進(jìn)行回收。結(jié)果表明,從整體上看,SPRI磁珠回收和srCUT&Tag方法著較高的回收效率,而乙醇沉淀法則回收效率低下。在全部4種CUT&Tag產(chǎn)物回收過(guò)程中,SPRI磁珠回收均會(huì)損失大部分小于150 bp的產(chǎn)物片段。在CTCF和HMGA1 CUT&Tag產(chǎn)物的回收中,直接PCR法則損失了大部分大于300 bp的片段并與其他回收方法的結(jié)果有較大的差別。因此,srCUT&Tag能夠比其他三種回收方法提供更多更完整的測(cè)序信息。綜上所述,新建立srCUT&Tag回收方法相比現(xiàn)有的CUT&Tag產(chǎn)物回收方法能提高建庫(kù)效率并得到更好的數(shù)據(jù)質(zhì)量,為表觀遺傳學(xué)研究提供了更好的技術(shù)選擇。
CUT&Tag;DNA回收方法;H3K4me3;RNAPII;CTCF;HMGA1
染色質(zhì)免疫共沉淀測(cè)序(chromatin immunopre-cipitation sequencing, ChIP-seq)是經(jīng)典的蛋白質(zhì)–染色質(zhì)相互作用研究方法[1,2]。傳統(tǒng)的染色質(zhì)免疫共沉淀操作繁瑣,背景較高,需要很大的測(cè)序量,實(shí)驗(yàn)可控性差。這些限制了其在低起始細(xì)胞量上的使用[3]。CUT&Tag是近年興起的一種新型蛋白質(zhì)–染色質(zhì)相互作用研究方法[4~6],該方法利用Protein A/Protein G融合的Tn5轉(zhuǎn)座子,通過(guò)Protein A/G-抗體相互作用將轉(zhuǎn)座體栓系在靶抗體周圍的區(qū)域,從而實(shí)現(xiàn)目標(biāo)特異性的片段化反應(yīng)。相比于傳統(tǒng)的ChIP-seq,CUT&Tag操作相對(duì)簡(jiǎn)單,無(wú)需甲醛交聯(lián),信噪比較高,所需測(cè)序量少,且適用于極低起始量和單細(xì)胞的應(yīng)用場(chǎng)景[7,8]。CUT&Tag的主要流程包括:(1)將細(xì)胞固定在ConA磁珠上;(2)利用表面活性劑digitonin透化細(xì)胞,先后加入一抗和二抗進(jìn)行孵育;(3)洗去多余的抗體后,加入融合ProteinA/G的轉(zhuǎn)座體使其與靶位點(diǎn)附近的抗體結(jié)合;(4)洗去多余的轉(zhuǎn)座體,加入鎂離子,在37℃的條件下進(jìn)行片段化反應(yīng);(5)加入SDS終止反應(yīng),通過(guò)乙醇沉淀或其他方法將酶切產(chǎn)生的DNA片段;(6) PCR建庫(kù)及二代測(cè)序[9]。在CUT&Tag實(shí)驗(yàn)中,高效的CUT&Tag產(chǎn)物DNA回收對(duì)獲取良好的CUT&Tag結(jié)果至關(guān)重要,本文主要針對(duì)CUT&Tag產(chǎn)物DNA提取方法進(jìn)行討論。
由于CUT&Tag所使用的轉(zhuǎn)座體需要用SDS失活,體系中存在的SDS則會(huì)干擾后續(xù)的PCR反應(yīng),因此必須進(jìn)行DNA的提取或利用其他方法消除SDS的干擾。早期的CUT&Tag實(shí)驗(yàn)方法中,CUT&Tag產(chǎn)物DNA提取方法主要包括酚氯仿抽提–乙醇沉淀(后文簡(jiǎn)稱乙醇沉淀)或片段分選磁珠(固相可逆固定磁珠,即solid-phase reversible immobilization, SPRI,后文簡(jiǎn)稱SPRI磁珠)磁珠回收。酚氯仿抽提-乙醇沉淀是DNA回收的傳統(tǒng)方法,其優(yōu)點(diǎn)是原理簡(jiǎn)單,且沒(méi)有明顯的偏好性。缺陷則是操作相對(duì)繁瑣,給回收操作帶來(lái)了顯著困難。特別是在低細(xì)胞起始量的CUT&Tag實(shí)驗(yàn)中,很容易造成產(chǎn)物DNA損失,增加了CUT&Tag實(shí)驗(yàn)的難度。SPRI磁珠回收相對(duì)于乙醇沉淀耗時(shí)較短,回收效率高,操作難度低。但是目前市售的SPRI磁珠是為進(jìn)行二代測(cè)序文庫(kù)構(gòu)建的片段分選而設(shè)計(jì),不適用于回收150 bp以下的小片段。因此,SPRI磁珠回收所得到的文庫(kù)可能具有偏好性,有損失相應(yīng)信息的風(fēng)險(xiǎn)。離心柱回收是另一種常見(jiàn)的DNA回收方法并且被廣泛用于CUT&Tag的前身CUT&RUN[10]的產(chǎn)物回收中。雖然高質(zhì)量的離心柱往往成本較高,但是離心柱法可以高效回收微量核酸片段且不具有明顯的選擇偏好。除此之外,CUT&Tag技術(shù)的提出者Henikoff在近期也開(kāi)發(fā)了一種不需要回收直接進(jìn)行一管式建庫(kù)的流程:控制SDS終止液的體積,并利用Triton X-100中和SDS后進(jìn)行直接PCR。這種方法特別適用于以細(xì)胞核為底物的CUT&Tag,并且已經(jīng)被報(bào)道其回收效率較傳統(tǒng)的提取法更高[11,12]。
為改善CUT&Tag實(shí)驗(yàn)中DNA回收效率,本研究建立了一種新的CUT&Tag實(shí)驗(yàn)流程(圖1),通過(guò)生物素化CUT&Tag中所用的pAG-Tn5轉(zhuǎn)座體接頭末端,使產(chǎn)生的生物素化的CUT&Tag產(chǎn)物DNA能夠被鏈霉親和素磁珠所結(jié)合并回收。鏈霉親和素磁珠僅需要20 min的室溫孵育時(shí)間就能完成和生物素化CUT&Tag產(chǎn)物的結(jié)合,洗滌后可直接PCR制備NGS文庫(kù)。為比較現(xiàn)有不同CUT&Tag產(chǎn)物回收方法的優(yōu)劣,本研究選取了甲基化組蛋白H3K4me3,RNAPII,常見(jiàn)轉(zhuǎn)錄因子CTCF和HMGA1。用102~105K562細(xì)胞進(jìn)行CUT&Tag實(shí)驗(yàn)。使用相同的起始細(xì)胞量,不同的回收方法,比較其回收效率,片段選擇性和整體的CUT&Tag數(shù)據(jù)結(jié)果,尋找能夠獲得最優(yōu)的CUT&Tag的數(shù)據(jù)信息的實(shí)驗(yàn)流程。
胎牛血清FBS、RPMI 1640培養(yǎng)基、磷酸鹽緩沖液(PBS)購(gòu)自Gibco公司;NovoNGS? CUT&Tag 2.0 High-Sensitivity Kit (for Illumina?) (N259)由近岸蛋白質(zhì)科技有限公司保存;抗體Histone H3K4me3 antibody (pAb) (AB_2615077)購(gòu)自Active Motif公司;抗體Anti-RNA polymerase II[CTD 4H8] (Ab00832-1.1)購(gòu)自Absolute Antibody公司;抗體CTCF(D31H2) XP?Rabbit mAb(#3418)購(gòu)自CST公司;抗體Anti- HMGA1 [EPR7839](ab129153)購(gòu)自Abcam公司;抗體Rabbit Anti-Mouse IgG H&L (ab6709)購(gòu)自Abcam公司;酚∶氯仿∶異戊醇=25∶24∶1(PCI)(P1011)購(gòu)自北京索萊寶科技有限公司;Sreptavidin magnetic beads(S1420S)購(gòu)自NEB公司;鏈霉親和素磁珠購(gòu)自上海英萊盾生物技術(shù)有限公司。
圖1 srCUT&Tag系統(tǒng)示意圖
細(xì)胞超凈臺(tái)、細(xì)胞培養(yǎng)箱、臺(tái)式低溫離心機(jī)購(gòu)自、PCR儀(Veriti 96)、紫外分光光度計(jì)(Nanodrop)為T(mén)hermo Fisher公司產(chǎn)品;渦旋振蕩儀(Vertex-5)、旋轉(zhuǎn)混合儀(QB-228)購(gòu)自海門(mén)其林貝爾儀器制造有限公司;金屬浴加熱器(TU-100)及電熱恒溫培養(yǎng)箱(DHP-9052)購(gòu)自上海一恒科學(xué)儀器公司。
K562細(xì)胞復(fù)蘇后于10 mL含有10% FBS的RPMI 1640培養(yǎng)基中,放入37℃、5%CO2濃度的細(xì)胞培養(yǎng)箱中。隔天按照1∶2進(jìn)行傳代培養(yǎng),細(xì)胞濃度穩(wěn)定在0.5×106~1.0×106/mL。以保持實(shí)驗(yàn)細(xì)胞狀態(tài)的穩(wěn)定。室溫下600×離心收集新鮮細(xì)胞并計(jì)數(shù),取所需數(shù)量的細(xì)胞于新的1.5 mL EP管中,室溫下600×離心5 min,小心吸去上清;加入等體積Wash Buffer (Novoprotein, N259)清洗一遍后重懸,根據(jù)需要使得每個(gè)反應(yīng)的細(xì)胞濃度為102~105/100 μL。
CUT&Tag實(shí)驗(yàn)按照NovoNGS?CUT&Tag 2.0 High-Sensitivity Kit (for Illumina?)(N259)說(shuō)明書(shū)上的標(biāo)準(zhǔn)流程進(jìn)行。孵育一抗時(shí)一抗稀釋比為1∶100,孵育二抗時(shí)二抗稀釋比為1∶200,每個(gè)反應(yīng)轉(zhuǎn)座體用量為1 μL最終的標(biāo)簽化步驟反應(yīng)體積為100 μL。
(a)對(duì)于乙醇沉淀回收的樣品,向每份CUT&Tag產(chǎn)物中加入3 μL 10% SDS,10 μL 0.5 mol/L EDTA,和2.5 μL 20 mg/mL Proteinase K,渦旋振蕩混勻后,50℃消化1 h;每管樣品中加入300 μL酚氯仿混合物,渦旋振蕩充分混勻后移至鎖相管中,16000×室溫離心5 min。向每管樣品中加入100 μL氯仿,渦旋振蕩充分混勻后,16000×室溫離心5 min,吸取水相至新的1.5 mL EP管,加入1 mL 100%乙醇,用移液器吹打混勻;將樣品管置于?20℃靜置1 h, 4℃離心20 min,離心產(chǎn)物小心地倒出液體并在紙巾上瀝干,向每管樣品中分別加入1 mL 80%乙醇漂洗,4℃下16000×離心1 min,小心地倒出液體并在紙巾上瀝去水珠后自然干燥。干燥后,向每管樣品中加入35 μL TE-RA-Buffer,吹打重懸溶解DNA沉淀。
(b)對(duì)于SPRI磁珠回收的樣品,向每份CUT&Tag產(chǎn)物中加入2 μL 10% SDS,55℃加熱10 min,然后向每管中加入200 μL在室溫平衡后的磁珠,吹打混勻,室溫靜置5 min,磁珠結(jié)合后置于磁力架上靜置5 min,移去上清,80%乙醇洗滌2遍,室溫晾干。35 μL TE buffer洗脫,回收后的CUT&Tag產(chǎn)物在?20℃下儲(chǔ)存或直接進(jìn)行下一步PCR擴(kuò)增。
(c)對(duì)于srCUT&Tag回收的樣品,向每份CUT&Tag產(chǎn)物中加入2 μL 10% SDS,55℃加熱10 min,然后向每管中加入1 μL洗滌后按照1∶1比例復(fù)溶的的鏈霉親和素磁珠,吹打混勻,室溫靜置20 min,磁珠結(jié)合后置于磁力架上靜置2 min,移去上清,1×Wash buffer洗2遍,室溫晾干。35 μL TE buffer復(fù)溶,回收后的CUT&Tag產(chǎn)物在?20℃下儲(chǔ)存或直接進(jìn)行下一步PCR擴(kuò)增。
(d)對(duì)于直接PCR的樣品,在CUT&Tag實(shí)驗(yàn)結(jié)束后移去片段化溶液上清,利用100 μL TAPs Wash buffer (10 mmol/L TAPs, 0.2 mmol/L EDTA)清洗樣品,加入5 μL 0.2%SDS,70℃加熱1 h。失活后的體系加入15 μL 0.67% Triton X-100中和SDS。直接進(jìn)行下一步PCR擴(kuò)增。
每組回收后的CUT&Tag產(chǎn)物按照NovoNGS?CUT&Tag 2.0 High-Sensitivity Kit (for Illumina?)的流程建庫(kù)并進(jìn)行二代測(cè)序。
用FastQC和MulitiQC檢查文庫(kù)的質(zhì)量;用Cutadaptor進(jìn)行接頭序列的去除和數(shù)據(jù)清洗;用Bowtie2進(jìn)行比對(duì)。用Samtools進(jìn)行過(guò)濾和去重;用Macs2進(jìn)行識(shí)別峰;用IGV進(jìn)行數(shù)據(jù)可視化。用Deeptoools繪制插入片段大小圖,不同實(shí)驗(yàn)組數(shù)據(jù)相關(guān)性圖。
為了確定回收使用鏈霉親和素磁珠的用量和回收后直接PCR的可行性,使用細(xì)胞數(shù)為1×104的K562細(xì)胞進(jìn)行H3K4me3的CUT&Tag實(shí)驗(yàn)。不同的平行實(shí)驗(yàn)組分別用0.2 μL,0.5 μL,1 μL,2 μL,3 μL,4 μL洗滌后的NEB streptavidin magnetic beads和英萊頓的鏈霉親和素磁珠進(jìn)行回收。產(chǎn)物按照NovoNGS?CUT&Tag 2.0 High-Sensitivity Kit (for Illumina?)建庫(kù)的流程進(jìn)行14個(gè)循環(huán)的PCR,利用瓊脂糖凝膠電泳檢驗(yàn)回收的片段分布(圖2)。對(duì)于NEB的磁珠,0.2~4.0 μL均可得到預(yù)期結(jié)果類似的PCR條帶。而對(duì)于濃度稍高的英萊盾的磁珠,當(dāng)鏈霉親和素磁珠用量為0.1~2.0 μL時(shí),所得到的的PCR產(chǎn)物大小分布與預(yù)期結(jié)果類似。當(dāng)磁珠用量大于2 μL時(shí),PCR條帶的擴(kuò)增水平降低;4 μL磁珠的回收產(chǎn)物則無(wú)法擴(kuò)增出PCR條帶。實(shí)驗(yàn)結(jié)果說(shuō)明當(dāng)鏈霉親和素磁珠濃度較大時(shí),有可能會(huì)抑制后續(xù)的PCR擴(kuò)增,從而對(duì)建庫(kù)過(guò)程造成干擾。在本文后續(xù)的研究中,選擇1 μL的英萊盾鏈霉親和素磁珠作為srCUT&Tag所使用的鏈霉親和素磁珠用量。
利用生物素化的pAG-Tn5,對(duì)于104K562細(xì)胞分別進(jìn)行H3K4me3、RNAPII、CTCF和HGAM1的CUT&Tag實(shí)驗(yàn)。所得到的產(chǎn)物分別用鏈霉親和素磁珠(srCUT&Tag)、SPRI磁珠、乙醇沉淀和直接PCR法進(jìn)行回收或后處理后建庫(kù),文庫(kù)以等體積混勻以后在同一塊芯片上進(jìn)行二代測(cè)序,其中H3K4me3和RNAPII進(jìn)行了三重復(fù)平行實(shí)驗(yàn),而CTCF和HMGA1則進(jìn)行了雙重復(fù)實(shí)驗(yàn)。得到的數(shù)據(jù)在清洗后進(jìn)行回貼比對(duì)。統(tǒng)計(jì)所有實(shí)驗(yàn)組產(chǎn)出的unique reads和total mapping reads數(shù)量,結(jié)果顯示,在H3K4me3和RNAPII的CUT&Tag實(shí)驗(yàn)結(jié)果中,srCUT&Tag在回收unique reads產(chǎn)量和去除重復(fù)后的total mapping reads數(shù)上僅僅略低于最高的SPRI磁珠回收(圖3)。而在CTCF和HGAM1的CUT&Tag結(jié)果中,srCUT&Tag回收則產(chǎn)生最多的unique reads和total mapping reads數(shù)。直接PCR法和乙醇沉淀法貢獻(xiàn)的數(shù)據(jù)量都相對(duì)較低,在4種不同的CUT&Tag結(jié)果中直接法PCR得到的total mapping read數(shù)相當(dāng)于產(chǎn)出數(shù)據(jù)量最高方法的43%~60%,而乙醇沉淀法產(chǎn)出的數(shù)據(jù)量則相當(dāng)于產(chǎn)出數(shù)據(jù)量最高方法的24%~30%。整體而言,srCUT&Tag在4種回收方法中都保持著穩(wěn)定的高回收效率。而若采用回收效率較低的乙醇沉淀法,則有損失超過(guò)2/3原始產(chǎn)物信息的風(fēng)險(xiǎn)。
利用deeptool中的collectinsertsizemetrics統(tǒng)計(jì)不同實(shí)驗(yàn)組插入片段大小分布。比較使用不同回收方法所產(chǎn)生的文庫(kù)中插入片段的大小分布(圖4A),可以發(fā)現(xiàn)不同回收方法所保留的底物樣本的片段大小分布并不相同。在4種不同的回收方法中,srCUT&Tag和乙醇沉淀法產(chǎn)出的文庫(kù)片段大小分布相似。對(duì)于小于150 bp的片段,SPRI磁珠法的回收率均低于其他幾種回收方法。對(duì)H3K4me3的CUT&Tag結(jié)果進(jìn)行比較,使用srCUT&Tag、乙醇沉淀和直接PCR法產(chǎn)出的文庫(kù)中小于150 bp的片段在整體文庫(kù)中的平均占比分別為23.07%、15.81%和22.16%,而SPRI磁珠所產(chǎn)出的文庫(kù)中小于150 bp片段的占比僅為10.80%。對(duì)轉(zhuǎn)錄因子CTCF的CUT&Tag結(jié)果進(jìn)行比較,srCUT&Tag、乙醇沉淀和直接PCR法所產(chǎn)出的文庫(kù)中小于150 bp的片段在整體文庫(kù)中的平均占比分別為39.98%,32.40%和62.03%,而SPRI磁珠回收文庫(kù)中小于150 bp片段的占比則僅為20.43% (圖4B)。結(jié)合2.2中所展示的不同回收方法的文庫(kù)產(chǎn)量,在H3K4me3的CUT&Tag結(jié)果中,srCUT&Tag產(chǎn)出的小于150 bp片段的reads數(shù)為SPRI磁珠回收法的1.75倍;而在CTCF的CUT&Tag結(jié)果中,srCUT&Tag產(chǎn)出的小于150 bp片段的reads數(shù)則達(dá)到SPRI磁珠回收法的2.4倍。由于CTCF和HMGA1文庫(kù)中含有更多的小于150 bp的片段,一定程度上解釋了SPRI磁珠在CTCF和HMGA1樣品的回收效率現(xiàn)象。此外,在CTCF和HMGA1的CUT&Tag結(jié)果中,直接PCR法產(chǎn)生的大片段含量明顯低于使用其他回收方法所產(chǎn)出的文庫(kù)。其文庫(kù)中幾乎不含有大于300 bp的大片段,且直接PCR法也影響了CTCF和HMGA1文庫(kù)的數(shù)據(jù)產(chǎn)量,低于鏈霉親和素磁珠回收法產(chǎn)出的文庫(kù)數(shù)據(jù)產(chǎn)量。
圖2 不同鏈霉親和素磁珠及不同用量回收效果測(cè)試
M:DNA ladder 2000 plus;1:4 μL NEB磁珠;2:2 μL NEB磁珠;3:1 μL NEB磁珠;4:0.5 μL NEB磁珠;5:0.2 μL NEB磁珠;6:4 μL 英萊盾磁珠;7:2 μL 英萊盾磁珠;8:1 μL英萊盾磁珠;9:0.5 μL英萊盾磁珠;10:0.2 μL英萊盾磁珠;
圖3 不同回收方法文庫(kù)產(chǎn)出規(guī)模比較
為了探究不同回收方法產(chǎn)生文庫(kù)的差異,對(duì)H3K4me3,RANPII部分平行組數(shù)據(jù)和CTCF和HMGA1全部的平行組的數(shù)據(jù)結(jié)果進(jìn)行關(guān)聯(lián)性分析(圖5A)。在H3K4me3,RNAPII和CTCF的CUT&Tag實(shí)驗(yàn)中,srCUT&Tag,SPRI磁珠和乙醇沉淀法均有較好的相關(guān)性(>0.9),而在HMGA1的CUT&Tag結(jié)果中,所有回收方法平行組和相互間的相關(guān)性都較低,但是srCUT&Tag方法平行組間仍然有0.7的相關(guān)性系數(shù),僅次于乙醇沉淀法平行組間的0.71。這證明了srCUT&Tag具有和傳統(tǒng)SPRI磁珠和乙醇沉淀回收相當(dāng)?shù)目芍貜?fù)性。直接PCR法在H3K4me3實(shí)驗(yàn)中具有較高的可重復(fù)性,并且不同回收方法的信號(hào)和信噪比相仿。但是在其余的3組條件CUT&Tag中均展現(xiàn)出較低的平行組內(nèi)相關(guān)性。同時(shí),在H3K4me3以外的其他3類CUT&Tag結(jié)果中,直接PCR法與其他3種方法間的相關(guān)性系數(shù)均較低,這意味著直接PCR法與srCUT&Tag及傳統(tǒng)回收方法所得到的的結(jié)果均存在明顯差異。在相關(guān)性系數(shù)較低的CTCF的CUT&Tag結(jié)果中,可以明顯看到直接PCR法產(chǎn)出的信號(hào)分布與其他回收方法的結(jié)果不同,包括在多個(gè)位置的信號(hào)強(qiáng)度較弱或完全缺失(圖5B)。通過(guò)將srCUT&Tag的測(cè)序結(jié)果拆分為大于300 bp和小于300 bp的部分,可以看到,這些峰高的差異并非是簡(jiǎn)單的由上文所提到的直接PCR法中大于300 bp片段損失所帶來(lái),這暗示了在直接PCR法中TritonX-100對(duì)擴(kuò)增酶的抑制可能了造成更復(fù)雜的帶有偏好性的擴(kuò)增,并對(duì)CUT&Tag的結(jié)果造成了顯著的影響。
A:4種不同回收方法文庫(kù)片段的大小分布;B:不同回收方法中小于150 bp片段的占比
圖5 不同回收方法文庫(kù)的相關(guān)性
A:4種不同CUT&Tag產(chǎn)物中不同回收方法產(chǎn)生結(jié)果之間的相關(guān)性;B:CTCF CUT&Tag結(jié)果中,直接PCR法和其他三種方法的結(jié)果存在明顯的差異。
相關(guān)性分析顯示,SPRI磁珠與srCUT&Tag和乙醇沉淀的結(jié)果差別并不大。為了進(jìn)一步研究小片段損失對(duì)CUT&Tag結(jié)果可能的影響,選取RNAPII R1實(shí)驗(yàn)組的CUT&Tag結(jié)果,將srCUT&Tag的測(cè)序結(jié)果拆分為插入片段小于150 bp和大于150 bp兩部分,比較不同大小的插入片段產(chǎn)生的峰的差異(圖6)。在次黃嘌呤腺苷酸轉(zhuǎn)移酶基因位點(diǎn)上,小于150 bp的插入片段貢獻(xiàn)了啟動(dòng)子峰的主要部分。控制不同回收方法投入的起始unique reads數(shù)為5 M,在位點(diǎn)上,對(duì)小于150 bp的片段保留效果較好的鏈霉親和素磁珠回收法、乙醇沉淀法產(chǎn)生結(jié)果一致的峰圖,而對(duì)小于150 bp的片段保留效果較差的SPRI磁珠回收法則沒(méi)有信號(hào)(圖6A)。同樣的現(xiàn)象也可以在基因位點(diǎn)上觀察到。當(dāng)投入數(shù)據(jù)量從10 M下降到2 M時(shí),SPRI磁珠文庫(kù)在基因啟動(dòng)子上的信號(hào)急速衰減,但是鏈霉親和素磁珠回收法產(chǎn)生的文庫(kù)受投入數(shù)據(jù)量下降的影響較小,在2 M數(shù)據(jù)量投入時(shí)仍有與SPRI磁珠8~10 M回收結(jié)果類似的效果。顯示了在起始數(shù)據(jù)量較低的情況下,小于150 bp的片段回收率差距帶來(lái)的信號(hào)差異尤其明顯(圖6B)。
圖6 片段選擇性對(duì)CUT&Tag結(jié)果的影響
A:小于150bp的片段貢獻(xiàn)了RNAPII CUT&Tag中啟動(dòng)子位點(diǎn)上的主要部分;B:小于150bp的片段貢獻(xiàn)了RNAPII CUT&Tag中啟動(dòng)子位點(diǎn)上的主要部分,srCUT&Tag和SPRI磁珠的差異在數(shù)據(jù)量較小時(shí)尤其明顯。
綜上所述,比較使用4種不同的回收方法產(chǎn)出的CUT&Tag結(jié)果,基于srCUT&Tag的鏈霉親和素磁珠回收法對(duì)于不同抗體都有較高的數(shù)據(jù)產(chǎn)量,而SPRI磁珠法均會(huì)損失一部分小于150 bp的小片段,直接PCR法則在轉(zhuǎn)錄因子CTCF和HMGA1的回收中損失了大部分大于300 bp的片段,從而導(dǎo)致一部分結(jié)合位點(diǎn)信息的損失,乙醇沉淀法的回收效率相對(duì)較低。因此,總體上而言,基于srCUT&Tag的鏈霉親和素磁珠法是對(duì)CUT&Tag結(jié)果信息保留效率最高的回收方法。
考慮到片段選擇性在低數(shù)據(jù)量水平上差異更加顯著,推測(cè)對(duì)于極低的起始細(xì)胞量,且當(dāng)目的位為豐度相對(duì)較低的轉(zhuǎn)錄因子時(shí),不同回收方法貢獻(xiàn)的數(shù)據(jù)質(zhì)量可能有更大的差異。利用生物素化的pAG-Tn5,分別在200、500、1000個(gè)K562細(xì)胞水平上進(jìn)行CTCF的CUT&Tag實(shí)驗(yàn),產(chǎn)物利用srCUT&Tag、SPRI磁珠、乙醇沉淀酚氯仿抽提和直接PCR回收后建庫(kù)測(cè)序。與104細(xì)胞的回收結(jié)果類似,在200~1000細(xì)胞水平上,產(chǎn)生的文庫(kù)從大到小排列為:srCUT&Tag>SPRI磁珠法>直接PCR法>乙醇沉淀法(表1)。其中鏈霉親和素磁珠回收文庫(kù)在去除重復(fù)后的mapping reads數(shù)比SPI磁珠文庫(kù)高15%~23%,比乙醇沉淀文庫(kù)高108%~211%,比直接PCR文庫(kù)高118%~128%。在鏈霉親和素磁珠法產(chǎn)出的CUT&Tag結(jié)果中,macs2軟件在200,500,1000細(xì)胞水平上分別識(shí)別到8301、13389和16269個(gè)峰,多于在相同的細(xì)胞數(shù)量上,SPRI磁珠法產(chǎn)出的峰值數(shù)(7630、11875和14145),乙醇沉淀法產(chǎn)出的峰值數(shù)(2949、5749和9752)和直接PCR產(chǎn)出的峰值數(shù)(5992、9780和11028)。
在基因組上選取一段具有代表性的區(qū)域,通過(guò)IGV的可視化獲取不同回收方法得到的覆蓋度圖(圖7A)。在500細(xì)胞和1000細(xì)胞水平上,srCUT&Tag和SPRI磁珠法均能產(chǎn)生與105細(xì)胞水平相類似的CUT&Tag產(chǎn)物峰圖。而直接PCR法和乙醇沉淀法在500細(xì)胞產(chǎn)生的覆蓋圖譜峰高則遠(yuǎn)低于105細(xì)胞的結(jié)果,1000細(xì)胞的覆蓋圖譜整體上同樣弱于105細(xì)胞產(chǎn)生的圖譜結(jié)果。另一方面,與前文所述的結(jié)果類似,在基因主峰側(cè)翼的較弱信號(hào)位點(diǎn)上,低細(xì)胞起始量狀態(tài)下的SPRI磁珠回收幾乎損失了全部的信號(hào)。與104細(xì)胞的SPRI磁珠回收結(jié)果相比,可以看出SPRI磁珠法損失小于150 bp片段的問(wèn)題在細(xì)胞數(shù)量更少的情況下更加顯著,從而相比于srCUT&Tag提供的結(jié)果顯現(xiàn)出明顯的劣勢(shì)(圖7B)。總體來(lái)看srCUT&Tag在起始細(xì)胞量較少的情況下可以產(chǎn)出更完整和豐富的CUT&Tag文庫(kù)信息,適用于極低起始細(xì)胞量的CTCF CUT&Tag實(shí)驗(yàn)。
表1 低細(xì)胞數(shù)量時(shí)不同回收方法的回收效率比較
圖7 不同回收方法在少量細(xì)胞上的對(duì)比
A:200~1000細(xì)胞水平上的不同CTCF回收結(jié)果;B:在基因側(cè)翼的弱結(jié)合位點(diǎn),SRPI磁珠回收相比于srCUT&Tag出現(xiàn)了明顯的信號(hào)缺失。
表2 srCUT&Tag與其他CUT&Tag產(chǎn)物回收方法的比較
Henikoff在其早期關(guān)于CUT&Tag方法的文獻(xiàn)報(bào)道中主要使用2×SPRI磁珠回收,隨后將酚氯仿抽提乙醇沉淀作為CUT&Tag產(chǎn)物的標(biāo)準(zhǔn)回收方法加以推廣,而在近期的文獻(xiàn)中,則主要推薦其基于Triton中和的PCR直接擴(kuò)增法[9]。針對(duì)現(xiàn)有的CUT&Tag回收方法各自存在的缺陷,本研究提出了一種新的srCUT&Tag體系:利用含有生物素化接頭的pAG-Tn5轉(zhuǎn)座酶進(jìn)行DNA片段化和生物素化,產(chǎn)物DNA通過(guò)鏈霉親和素磁珠回收。在K562細(xì)胞中使用4種不同抗體開(kāi)展CUT&Tag實(shí)驗(yàn),srCUT&Tag的鏈霉親和素回收法僅對(duì)H3K4me3和RNAPII的回收效率略低于傳統(tǒng)的SPRI磁珠回收效率,對(duì)CTCF和HMGA1的回收效率則高于SPRI磁珠回收法,對(duì)于4種抗體其回收效率都遠(yuǎn)高于乙醇沉淀回收法和直接PCR法。并且srCUT&Tag回收的DNA片段大小分布中與乙醇沉淀回收法相似,不存在2XSPRI磁珠丟失小片段或者直接PCR擴(kuò)增法丟失部分大片段的問(wèn)題,更有利于CUT&Tag產(chǎn)物完整信息的保留(表2)。
本研究發(fā)現(xiàn),使用不同的抗體所產(chǎn)生的CUT&Tag文庫(kù)有著不同的DNA片段大小分布,因此可能導(dǎo)致不同回收方法搭配不同抗體產(chǎn)出的CUT&Tag文庫(kù)有不同的表現(xiàn)。以鏈霉親和素磁珠回收法產(chǎn)出的文庫(kù)作為標(biāo)準(zhǔn),H3K4me3和RNAPII的CUT&Tag文庫(kù)中,小片段含量本身并不高,特別是在H3K4me3的文庫(kù)中,不同建庫(kù)方法產(chǎn)生的片段差異并不大。150 bp左右的長(zhǎng)度是單個(gè)核小體DNA的大小,而在CTCF和HMGA1文庫(kù)中,由于轉(zhuǎn)錄因子結(jié)合區(qū)域本身有著比組蛋白周圍更廣闊的核小體耗盡區(qū)域,因此轉(zhuǎn)錄因子的CUT&Tag文庫(kù)中,含有更多小于單個(gè)核小體大小的150 bp以下片段。更多小片段的產(chǎn)出不僅凸顯了SPRI磁珠在片段選擇性上的差異,也造成直接PCR法的擴(kuò)增偏好。在加入了Triton X-100后,擴(kuò)增酶的活性在一定程度上受到了影響,從而使得PCR擴(kuò)增大片段能力下降,使得整體的文庫(kù)大小向小片段的方向偏移。而在CTCF文庫(kù)中,直接PCR法與srCUT&Tag回收法的差異不僅僅來(lái)源于300 bp以上大片段回收效率的低下;將文庫(kù)中小于300 bp的片段分離后,在相同文庫(kù)投入數(shù)據(jù)量的情況下,直接PCR法仍然存在許多不同大小片段的缺失。
綜上所述,與傳統(tǒng)建庫(kù)方法相比較,srCUT&Tag回收法兼顧了現(xiàn)有回收方法中酚氯仿抽提乙醇沉淀回收法沒(méi)有回收偏好性,SPRI磁珠回收效率高和直接PCR法一管式操作便捷的優(yōu)勢(shì),提高了實(shí)驗(yàn)的便捷性,避免了更繁瑣的實(shí)驗(yàn)流程?;趕rCUT&Tag系統(tǒng)的鏈霉親和素磁珠在104~200細(xì)胞水平上都有較高的回收效率,并且在細(xì)胞量較低的情況下仍能夠提供較好的回收效果,其CUT&Tag文庫(kù)產(chǎn)量和數(shù)據(jù)信息優(yōu)于現(xiàn)有的酚氯仿抽提乙醇沉淀回收、SPRI磁珠回收和直接PCR法。本研究建立了基于srCUT&Tag的鏈霉親和素磁珠回收系統(tǒng),并比較了該回收方法與現(xiàn)有的主流回收方法,對(duì)各自的優(yōu)缺點(diǎn)進(jìn)行了系統(tǒng)的分析,在保證數(shù)據(jù)完整性的基礎(chǔ)上進(jìn)一步優(yōu)化了CUT&Tag的易用性。
[1] Kidder BL, Hu GQ, Zhao KJ. ChIP-Seq: technical considerations for obtaining high-quality data., 2011, 12(10): 918–922.
[2] Policastro RA, Zentner GE. Enzymatic methods for genome-wide profiling of protein binding sites., 2018, 17(2): 138–145.
[3] Ludwig CH, Bintu L. Mapping chromatin modifications at the single cell level., 2019, 146(12): dev170217.
[4] Kaya-Okur HS, Wu SJ, Codomo CA, Pledger ES, Bryson TD, Henikoff JG, Ahmad K, Henikoff S. CUT&Tag for efficient epigenomic profiling of small samples and single cells., 2019, 10(1): 1930.
[5] Douse CH, Tchasovnikarova IA, Timms RT, Protasio AV, Seczynska M, Prigozhin DM, Albecka A, Wagstaff J, Williamson JC, Freund SMV, Lehner PJ, Modis Y. TASOR is a pseudo-PARP that directs HUSH complex assembly and epigenetic transposon control., 2020, 11(1): 4940.
[6] Ye BY, Yang GG, Li YM, Zhang CY, Wang QW, Yu GY. ZNF143 in chromatin looping and gene regulation., 2020, 11: 338.
[7] Janssens DH, Meers MP, Wu SJ, Babaeva E, Meshinchi S, Sarthy JF, Ahmad K, Henikoff S. Automated CUT&Tag profiling of chromatin heterogeneity in mixed-lineage leukemia., 2020.
[8] Henikoff S, Henikoff JG, Kaya-Okur HS, Ahmad K. Efficient chromatin accessibility mapping in situ by nucleosome-tethered tagmentation., 2020, 9: e63274.
[9] Kaya-Okur HS, Janssens DH, Henikoff JG, Ahmad K, Henikoff S. Efficient low-cost chromatin profiling with CUT&Tag., 2020,15(10): 3264–3283.
[10] Skene PJ, Henikoff JG, Henikoff S. Targeted in situ genome-wide profiling with high efficiency for low cell numbers., 2018, 13(5): 1006–1019.
[11] Yu FL, Sankaran VG, Yuan GC. CUT&RUNTools 2.0: A pipeline for single-cell and bulk-level CUT&RUN and CUT&Tag data analysis. bioRxiv, 2021.
[12] Tao XY, Feng SL, Zhao T, Guan XY. Efficient chromatin profiling of H3K4me3 modification in cotton using CUT&Tag. Plant Methods, 2020, 16: 120.
Optimization of CUT&Tag product recovery and library construction method
Ye Wei1,2, Ke Li2, Daru Lu1, Huaxing Zhu2
The emerging cleavage under target and tagment (CUT&Tag) technology uses Tn5 transposase to cleavage near the DNA binding site of target protein and study the generated DNA fragments by the next-generation sequencing. It can quickly identify protein-DNA interactions, which greatly simplifies the experimental process of ChIP-Seq. After CUT&Tag tagment reaction, DNA recovery or other post-processing is required to perform library construction PCR. Different recovery methods have significant impact respectively. By establishing Streptavidin beads recovery CUT&Tag(srCUT&Tag), we can quickly and conveniently complete the product recovery of CUT&Tag. We carried out CUT&Tag assay of H3K4me3, RNA Polymerase II (RNA polymerase II, RNAPII), transcription factor CTCF and HMGA1 in K562 cells with different recovery methods, including ethanol precipitation, fragment separation magnetic beads (SPRI) Magnetic bead recovery, direct PCR method, as well as our srCUT&Tag recovery method. The results show that among the CUT&Tag results of four different targets, the SPRI magnetic bead recovery and our srCUT&Tag methods have higher recovery efficiency than the direct PCR method and ethanol precipitation method. All CUT&Tag results showed that the recovery of SPRI magnetic beads would lose most of the product fragments less than 150 bp. In the recovery of CTCF and HMGA1, direct PCR lost most of the fragments larger than 300 bp and has significant difference from result of other recovery method. This enables srCUT&Tag to provide more real and higher-resolution information than other recovery method. In summary, the newly established srCUT&Tag recovery method can improve the efficiency of CUT&Tag library construction and obtain better data quality compared with the existing CUT&Tag product recovery method, providing a better technical choice for epigenetics research.
CUT&Tag; DNA recovery method; H3K4me3; RNAPII; CTCF; HMGA1
2021-01-15;
2021-03-04
國(guó)家自然科學(xué)基金面上項(xiàng)目(編號(hào):81372706)和上海市科技創(chuàng)新行動(dòng)計(jì)劃項(xiàng)目(編號(hào):17JC1400902)資助[Supported by the National Natural Science Foundation of China (No. 81372706), and Shanghai Science and Technology Innovation Action Plan (No. 17JC1400902)]
韋曄,在讀碩士研究生;專業(yè)方向:生物工程。E-mail: 17210700130@fudan.edu.cn
盧大儒,博士,教授,研究方向:遺傳學(xué)。E-mail: drlu@fudan.edu.cn
朱化星,博士,高級(jí)工程師,研究方向:遺傳學(xué)。E-mail: zhuhuaxing@novoprotein.com.cn
10.16288/j.yczz.21-016
2021/3/15 15:30:30
URI: https://kns.cnki.net/kcms/detail/11.1913.r.20210311.1727.002.html
(責(zé)任編委: 孟卓賢)