楊根生,焦芳芳,呂瑞途,郭睿,2
·生物技術(shù)與方法·
超聲處理對(duì)PRC2相關(guān)蛋白染色質(zhì)免疫共沉淀測(cè)序結(jié)果的影響
楊根生1,焦芳芳1,呂瑞途1,郭睿1,2
1 復(fù)旦大學(xué) 生物醫(yī)學(xué)研究院,上海 200031 2 復(fù)旦大學(xué) 附屬浦東醫(yī)院腫瘤科,上海 201399
超聲處理是染色質(zhì)免疫共沉淀(Chromatin immunoprecipitation,ChIP) 實(shí)驗(yàn)過(guò)程中染色質(zhì)片段化的重要手段之一。選用多梳抑制復(fù)合物2 (Polycomb repressive complex 2,PRC2) 相關(guān)蛋白組蛋白甲基轉(zhuǎn)移酶EZH2及其催化產(chǎn)物H3K27me3為代表,研究不同分子量大小的蛋白在不同超聲處理時(shí)間下對(duì)染色質(zhì)免疫共沉淀測(cè)序(Chromatin immunoprecipitation sequencing,ChIP-seq)實(shí)驗(yàn)的影響,結(jié)果表明在啟動(dòng)子區(qū)或非啟動(dòng)子區(qū),不同超聲時(shí)間下小分子量組蛋白H3K27me3結(jié)合位點(diǎn)的注釋基因均無(wú)明顯差異,說(shuō)明超聲時(shí)間對(duì)組蛋白ChIP-seq數(shù)據(jù)影響不大。與組蛋白不同,超聲時(shí)間從10 min延長(zhǎng)至20 min后啟動(dòng)子區(qū)EZH2新增結(jié)合位點(diǎn)的注釋基因能夠顯著聚類(lèi)在與肌動(dòng)蛋白絲組裝等相關(guān)通路上。超聲20 min相比10 min,非啟動(dòng)子區(qū)EZH2新增基因的GO (Gene ontology) 聚類(lèi)通路要遠(yuǎn)多于丟失基因,且超聲30 min相比20 min,非啟動(dòng)子區(qū)丟失基因的GO聚類(lèi)通路要遠(yuǎn)多于新增基因,這些通路大多與RNA聚合酶Ⅱ (RNA polymerase Ⅱ,RNAPII)、器官發(fā)育、細(xì)胞形態(tài)發(fā)生相關(guān)。這表明超聲時(shí)間不足或過(guò)長(zhǎng)均會(huì)導(dǎo)致EZH2的基因組定位信息的不全。另外,超聲主要影響啟動(dòng)子區(qū)中的PRC2非結(jié)合區(qū)域及二價(jià)啟動(dòng)子區(qū)域的EZH2結(jié)合位點(diǎn),還影響非啟動(dòng)子區(qū)中PRC2結(jié)合區(qū)域、PRC2不結(jié)合區(qū)域以及活化態(tài)增強(qiáng)子區(qū)域的EZH2結(jié)合位點(diǎn)。綜上,建議對(duì)大分子量的染色質(zhì)修飾相關(guān)蛋白優(yōu)化超聲處理時(shí)間,使形成的染色質(zhì)片段聚集在100–500 bp可獲得比較全面的基因組信息。對(duì)小分子量的組蛋白來(lái)說(shuō),超聲時(shí)間對(duì)ChIP-seq結(jié)果影響不大。
超聲時(shí)間,染色質(zhì)片段化,EZH2,PRC2,啟動(dòng)子,增強(qiáng)子
染色質(zhì)免疫共沉淀是目前表觀遺傳學(xué)及分子生物學(xué)的研究手段之一,可以分析蛋白質(zhì)和DNA在天然染色質(zhì)環(huán)境中的相互作用[1]。將ChIP實(shí)驗(yàn)與二代高通量測(cè)序結(jié)合,探究目的蛋白在基因組上分布情況的技術(shù)稱(chēng)為染色質(zhì)免疫共沉淀測(cè)序(Chromatin immunoprecipitation sequencing,ChIP-seq)[2]。ChIP-seq技術(shù)主要用于研究目的蛋白(例如表觀遺傳修飾的組蛋白、染色質(zhì)修飾蛋白、轉(zhuǎn)錄因子、輔因子及其他染色質(zhì)相關(guān)蛋白) 在基因組上的定位及富集分析。ChIP-seq實(shí)驗(yàn)的主要流程包括:1) 交聯(lián),通過(guò)甲醛處理等方法將染色質(zhì)上的DNA與目的蛋白交聯(lián);2) 染色質(zhì)片段化,運(yùn)用超聲或酶解的方法將染色質(zhì)片段化;3) 蛋白質(zhì)免疫沉淀,將結(jié)合了目的蛋白的染色質(zhì)片段通過(guò)抗體進(jìn)行富集純化;4) 解交聯(lián),通過(guò)加熱等方式解除DNA與目的蛋白的交聯(lián);5) DNA純化,添加蛋白酶(Protease) 和核糖核酸酶(RNase) 酶解消化去除解交聯(lián)產(chǎn)生的蛋白和RNA,用PCR回收試劑盒純化與目的蛋白結(jié)合的DNA[3];6) 建庫(kù)并進(jìn)行二代測(cè)序。對(duì)ChIP-seq影響最大的環(huán)節(jié)為染色質(zhì)片段化和蛋白質(zhì)免疫沉淀,這兩步都需要根據(jù)具體研究的蛋白去調(diào)整實(shí)驗(yàn)條件,本文就針對(duì)染色質(zhì)片段化環(huán)節(jié)進(jìn)行討論。
染色質(zhì)片段化主要有超聲和酶解兩種方式。對(duì)于酶解法來(lái)說(shuō),目前主要采用微球菌核酸酶(Micrococcal nuclease,MNase) 或商業(yè)試劑盒中的混合酶。酶解法的優(yōu)點(diǎn)在于比超聲更加溫和,對(duì)蛋白與DNA以及蛋白與蛋白之間的相互作用影響更小,但仍存在很多問(wèn)題,例如酶解主要消化核小體之間的連接DNA,所以只能形成整數(shù)倍核小體長(zhǎng)度的染色質(zhì)片段,且大多數(shù)為一個(gè)核小體長(zhǎng)度,這樣不僅會(huì)丟失一些結(jié)合在連接DNA區(qū)域的轉(zhuǎn)錄因子的信息,而且還會(huì)降低一些橫跨多個(gè)核小體長(zhǎng)度的染色質(zhì)結(jié)合蛋白的富集度。另外較小的消化片段會(huì)使qPCR驗(yàn)證更加困難,酶切溫度37 ℃會(huì)影響蛋白表位,從而降低免疫沉淀效率等[4]。因此,目前ChIP實(shí)驗(yàn)采用的最主流的染色質(zhì)片段化方式仍然為超聲破碎。超聲主要受到細(xì)胞類(lèi)型、細(xì)胞密度、ChIP裂解緩沖液、超聲時(shí)間以及目的蛋白種類(lèi)5個(gè)因素影響。一般使細(xì)胞密度低于107個(gè)/mL進(jìn)行超聲,對(duì)于第一次進(jìn)行ChIP實(shí)驗(yàn)的蛋白,一般會(huì)使用較溫和的裂解緩沖液(含0.1% SDS),實(shí)驗(yàn)過(guò)程中控制染色質(zhì)片段化程度最常用方法是調(diào)節(jié)超聲時(shí)間的長(zhǎng)短。超聲時(shí)間越長(zhǎng),染色質(zhì)片段化程度越高,但時(shí)間過(guò)長(zhǎng)超聲波可能會(huì)破壞目的蛋白- DNA之間的相互作用以及蛋白的穩(wěn)定性,反之超聲時(shí)間越短,染色質(zhì)片段化會(huì)不徹底,染色質(zhì)中不易打開(kāi)的部分會(huì)形成較長(zhǎng)的染色質(zhì)片段,這會(huì)導(dǎo)致距離目的蛋白實(shí)際基因組定位很遠(yuǎn)的位點(diǎn)也被認(rèn)為有目的蛋白的富集,從而導(dǎo)致ChIP-seq的分辨率大大降低。目前一般認(rèn)為超聲片段分布在100?1 000 bp范圍內(nèi)為宜,最好集中分布在500 bp以?xún)?nèi),即大約3個(gè)核小體長(zhǎng)度以?xún)?nèi)[2,4-5]。過(guò)長(zhǎng)的染色質(zhì)片段會(huì)在建庫(kù)的過(guò)程中通過(guò)切膠回收的方式去除。
為了研究不同分子量蛋白在不同超聲時(shí)間對(duì)ChIP-seq數(shù)據(jù)的影響,選取表觀遺傳領(lǐng)域已研究較多的PRC2相關(guān)蛋白EZH2 (分子量為85 kDa) 和其催化生成的K27位具有三甲基化修飾的組蛋白H3K27me3 (分子量為17 kDa) 為例進(jìn)行探討。EZH2作為PRC2的催化亞基,是一個(gè)含有SET結(jié)構(gòu)域的組蛋白甲基轉(zhuǎn)移酶(Histone methyltransferase),能夠甲基化組蛋白H3K27[6-8]。PRC2能夠與組蛋白去乙?;窰DACs互作將乙?;D(zhuǎn)變?yōu)榧谆瘡亩种苹虮磉_(dá)[9],PRC2在一些發(fā)育調(diào)節(jié)基因的啟動(dòng)子上形成H3K27me3起到轉(zhuǎn)錄抑制作用[10-14]。PRC2催化生成H3K27me3后還可招募多梳抑制復(fù)合物1 (Polycomb repressive complex 1, PRC1) 泛素化H2AK119從而保持基因的抑制[15]。EZH2參與胚胎發(fā)育、干細(xì)胞干性維持以及造血細(xì)胞增殖并起到抑制或沉默基因表達(dá)的作用。在慢性淋巴細(xì)胞性白血病、前列腺癌、胃癌、膠質(zhì)瘤、乳腺癌等多種癌癥中EZH2呈現(xiàn)高表達(dá),而且EZH2的高表達(dá)對(duì)腫瘤的發(fā)生、增殖、侵襲和轉(zhuǎn)移均有促進(jìn)作用[16-17]。有研究表明EZH2可不依賴(lài)于PRC2獨(dú)立行使轉(zhuǎn)錄激活因子的功能,例如在乳腺癌中EZH2不依賴(lài)于PRC2作為轉(zhuǎn)錄激活因子激活NF-κB靶基因從而促進(jìn)乳腺癌的發(fā)展[9,18]。由此可見(jiàn),目前對(duì)EZH2和H3K27me3染色質(zhì)調(diào)節(jié)機(jī)制研究比較廣泛,可供參考的ChIP-seq數(shù)據(jù)和信息較多,因此可選擇這兩個(gè)蛋白為代表來(lái)量化不同程度的染色質(zhì)片段化對(duì)目的蛋白ChIP-seq數(shù)據(jù)的影響。使用相同的細(xì)胞數(shù)、不同的超聲時(shí)間對(duì)以H3K27me3為代表的組蛋白和以EZH2為代表的染色質(zhì)修飾蛋白進(jìn)行ChIP-seq實(shí)驗(yàn),在相同的測(cè)序深度下進(jìn)行數(shù)據(jù)分析,探究能夠產(chǎn)生最全面ChIP-seq數(shù)據(jù)信息的超聲條件。
1.1.1 耗材及試劑
胎牛血清FBS、MEM非必需氨基酸NEAA、β-巰基乙醇購(gòu)自Gibco公司;DMEM高糖培養(yǎng)基、雙抗(氨芐青霉素和鏈霉素)、磷酸鹽緩沖液(PBS)、0.25%胰酶為Hyclone公司產(chǎn)品;明膠(Gelatin)、脫氧膽酸鈉 (Na-deoxylcholate)、二硫蘇糖醇 (DTT)、苯甲基磺酰氟 (PMSF)、多聚甲醛、乙基苯基聚乙二醇 (NP-40)、乙二胺四乙酸(EDTA)、無(wú)EDTA的蛋白酶抑制劑混合物(EDTA-free protease inhibitor cocktail) 為Sigma公司產(chǎn)品;LIF購(gòu)自Millipore公司;Hepes、Tris、Triton X-100、SDS購(gòu)自Amresco公司;PCR產(chǎn)物回收試劑盒購(gòu)自Qiagen公司;NaCl、LiCl購(gòu)自國(guó)藥集團(tuán);RNase A購(gòu)自Thermo公司;Proteinase K為T(mén)aKaRa公司產(chǎn)品;免疫磁珠Dynabeads protein A/G購(gòu)自Invitrogen公司;KAPA Hyper文庫(kù)構(gòu)建試劑盒購(gòu)自羅氏公司;H3K27me3兔源單抗、Tri-Methyl-Histone H3 (Lys27) (C36B11) Rabbit mAb購(gòu)自CST公司;EZH2兔源單抗、Ezh2 (D2C9) Rabbit mAb購(gòu)自CST公司。
1.1.2 儀器設(shè)備
細(xì)胞超凈臺(tái)、細(xì)胞培養(yǎng)箱購(gòu)自Thermo公司;QSONICA超聲波破碎儀為Misonix公司產(chǎn)品;脫色搖床購(gòu)自其林貝爾儀器制造有限公司;恒溫振蕩儀ThermoMixer為Eppendorf公司產(chǎn)品;DynaMag-2磁力架購(gòu)自L(fǎng)ife Technologies公司。
1.2.1 小鼠胚胎干細(xì)胞培養(yǎng)
用適量含0.1%明膠(Gelatin) 的滅菌水溶液鋪滿(mǎn)細(xì)胞培養(yǎng)皿,室溫放置30 min以上。吸除盛有細(xì)胞的培養(yǎng)基,PBS清洗。0.05%胰酶消化約 3 min后加入3 mL新鮮的小鼠胚胎干細(xì)胞培養(yǎng)基(DMEM高糖培養(yǎng)基,10% FBS,1%雙抗,1% NEAA,0.1% β-ME,1 000 U/mL LIF) 重懸,離心去上清。吸除Gelatin,按需要的細(xì)胞量加入胰酶消化后重選的細(xì)胞懸液及新鮮培養(yǎng)基,輕輕搖勻,放入37 ℃、5% CO2濃度的細(xì)胞培養(yǎng)箱中。小鼠胚胎干細(xì)胞生長(zhǎng)速度很快,一天傳兩代,故一般按照1﹕10隔天進(jìn)行傳代培養(yǎng)。
1.2.2 交聯(lián)
向盛有約6×106細(xì)胞數(shù)量的6 cm細(xì)胞培養(yǎng)皿中加入終濃度為1%的多聚甲醛(4 mL培養(yǎng)基加入37%多聚甲醛108 μL),在室溫脫色搖床上緩慢轉(zhuǎn)動(dòng)進(jìn)行蛋白質(zhì)與DNA的固定,10 min后加入2.5 mol/L的甘氨酸溶液200 μL終止交聯(lián),反應(yīng) 5 min后吸除上清并用預(yù)冷的PBS清洗2次,加入PBS刮下細(xì)胞。
1.2.3 超聲
用1 mL ChIP裂解緩沖液(ChIP lysis buffer:50 mmol/L Hepes (pH 7.5),500 mmol/L NaCl, 1 mmol/L EDTA (pH 8.0),1% Triton X-100,0.1% Na-deoxylcholate,0.1% SDS,0.1% DTT,1 mmol/L PMSF,2% EDTA-free Protease Inhibitor Cocktail)重懸細(xì)胞放入QSONICA超聲儀中進(jìn)行超聲處理。將細(xì)胞超聲破碎液13 000 r/min離心10 min,取2%體積(20 μL) 上清作為Input檢查超聲情況,剩下的上清凍于?80 ℃或放置冰上待超聲情況檢測(cè)結(jié)束之后使用。
1.2.4 解交聯(lián)
向Input中加入5倍體積(100 μL) 的ChIP洗脫緩沖液(ChIP Wash Buffer:50 mmol/L Hepes (pH 7.5),500 mmol/L NaCl,1 mmol/L EDTA (pH 8.0),1% Triton X-100,0.1% Na-deoxylcholate),放入65 ℃的恒溫振蕩儀 (ThermoMixer) 4 h以上解交聯(lián)。
1.2.5 消化RNA和蛋白質(zhì)
加入等體積(120 μL) 無(wú)NaCl的ChIP TE緩沖液(ChIP TE Buffer without NaCl:50 mmol/L Tris-HCl (pH 8.0),10 mmol/L EDTA (pH8.0)) 以及4 μL RNase A,4 μL ChIP蛋白酶K消化緩沖液(ChIP proteinase K digest buffer:300 mmol/L CaCl2,100 mmol/L Tris-HCl (pH 8.0)) 以及4 μL Proteinase K放入50 ℃的恒溫振蕩儀上消化1 h。
1.2.6 DNA純化與超聲檢測(cè)
用Qiagen PCR產(chǎn)物回收試劑盒純化Input中的DNA,取1% Input跑膠(2%的瓊脂糖凝膠) 檢測(cè)超聲情況,剩下1% Input作為ChIP的陰性對(duì)照。
1.2.7 免疫沉淀
檢測(cè)超聲片段處于預(yù)期范圍內(nèi)后,向剩余的超聲破碎液中加入等體積的ChIP稀釋緩沖液(ChIP Dilution Buffer:50 mmol/L Hepes (pH 7.5),500 mmol/L NaCl,1 mmol/L EDTA (pH 8.0)),目的是將SDS等去垢劑濃度降低1倍以創(chuàng)造溫和的結(jié)合條件,再加入目的蛋白的抗體進(jìn)行蛋白質(zhì)免疫沉淀,放入4 ℃旋轉(zhuǎn)培養(yǎng)器中孵育4 h以上或過(guò)夜。再加入免疫磁珠Dynabeads protein A/G各30 μL繼續(xù)4 ℃孵育2 h。在DynaMag-2磁力架上用預(yù)冷的ChIP洗滌緩沖液(ChIP Wash Buffer:50 mmol/L Hepes (pH 7.5),500 mmol/L NaCl,1 mmol/L EDTA (pH 8.0),1% Triton X-100,0.1% Na-deoxylcholate),ChIP RIPA緩沖液(ChIP RIPA buffer:50 mmol/L Hepes (pH 7.5),300 mmol/L LiCl,1 mmol/L EDTA,0.5% NP-40,0.7% Na-deoxylcholate),以及ChIP TE緩沖液(ChIP TE buffer:50 mmol/L Tris-HCl (pH 8.0),10 mmol/L EDTA (pH8.0),50 mmol/L NaCl) 洗磁珠 (Beads),次數(shù)分別為3,3,1。加入100 μL ChIP Elution Buffer,后續(xù)解交聯(lián)、消化RNA和蛋白、DNA純化步驟參考前面對(duì)Input操作的流程。
1.2.8 qPCR驗(yàn)證并進(jìn)行建庫(kù)
檢測(cè)ChIP的成功主要手段并非測(cè)量ChIP得到的DNA總量的大小,而是需要經(jīng)過(guò)qPCR計(jì)算目的蛋白在基因組陽(yáng)性區(qū)域相對(duì)陰性區(qū)域的富集度來(lái)衡量。ChIP得到的DNA總量中有很多屬于背景DNA故不應(yīng)作為判斷ChIP好壞的標(biāo)準(zhǔn),一般目的蛋白陽(yáng)性區(qū)域相比陰性區(qū)域的富集度低于4倍認(rèn)為ChIP沒(méi)有成功。將純化得到的DNA按照KAPA Hyper文庫(kù)構(gòu)建試劑盒建庫(kù)并進(jìn)行二代測(cè)序。
1.2.9 ChIP-seq生物信息學(xué)分析
用Trim galore (version 0.5.0) 進(jìn)行數(shù)據(jù)清洗;用Bowtie2 (version 2.4.3.3) 進(jìn)行比對(duì);用Samtools (version 1.6) 進(jìn)行排序和去重;用macs2 (version 2.1.1) 識(shí)別峰 (callpeak);用Deeptools (version 3.2.0) 繪制目的蛋白基因組平均密度分布圖以及相關(guān)性散點(diǎn)圖;用R包ChIPseeker (version 1.16.1)對(duì)peaks注釋和可視化[19];用R包Eulerr (version 5.1.0) 進(jìn)行venn圖繪制;用R包ClusterProfiler (version 3.8.1) 進(jìn)行GO富集分析[20]。
使用細(xì)胞數(shù)為6×106的小鼠胚胎干細(xì)胞進(jìn)行甲醛交聯(lián)并裂解,分別超聲10 min、20 min、30 min處理。超聲后純化染色質(zhì)得到DNA片段大小隨超聲時(shí)間延長(zhǎng)而變化(圖1)。超聲10 min所得DNA在100–2 000 bp之間均勻分布;超聲20 min所得DNA在100–2 000 bp之間分布,但在100–500 bp富集較多;30 min超聲所得DNA主要富集在100–300 bp之間??梢钥闯龀晻r(shí)間對(duì)染色質(zhì)片段化后的DNA大小影響較大。
圖1 不同超聲時(shí)間下染色質(zhì)片段凝膠電泳圖
對(duì)2×106個(gè)小鼠胚胎干細(xì)胞在超聲10 min、20 min和30 min時(shí)分別進(jìn)行H3K27me3的ChIP-seq實(shí)驗(yàn),得到H3K27me3基因組結(jié)合位點(diǎn)分別為16 348、16 837、19 443個(gè),結(jié)合位點(diǎn)隨超聲時(shí)間增加而增加。對(duì)H3K27me3結(jié)合位點(diǎn)在基因組各類(lèi)區(qū)域分布情況進(jìn)行分析,結(jié)果(圖2A) 顯示3種超聲時(shí)間條件得到的基因組結(jié)合位點(diǎn)在基因組各區(qū)域的分布相差不大,超聲30 min相比20 min在啟動(dòng)子區(qū)H3K27me3的結(jié)合位點(diǎn)分布占比略有降低,基因間隔區(qū)略有升高。H3K27me3結(jié)合位點(diǎn)在全基因組上的平均密度分布分析顯示,超聲時(shí)間對(duì)H3K27me3平均密度分布無(wú)顯著影響(圖2B),且可看出H3K27me3主要富集在啟動(dòng)子區(qū)域,這提示H3K27me3在啟動(dòng)子區(qū)和非啟動(dòng)子區(qū)的功能具有差異,故后續(xù)對(duì)啟動(dòng)子區(qū)和非啟動(dòng)子區(qū)分別進(jìn)行分析。
圖2 超聲對(duì)H3K27me3 ChIP-seq的影響
由于不重疊但位置相近的基因組結(jié)合位點(diǎn)的注釋基因可能相同,所以結(jié)合位點(diǎn)之間的重疊情況不能準(zhǔn)確反映不同超聲時(shí)間下的真實(shí)差異。因此將H3K27me3基因組結(jié)合位點(diǎn)注釋到最鄰近基因上,得到啟動(dòng)子區(qū)不同超聲時(shí)間下H3K27me3結(jié)合位點(diǎn)注釋基因數(shù)為4 060、4 075、4 294個(gè) (圖2C),非啟動(dòng)子區(qū)基因數(shù)為4 751、4 690、5 247個(gè)(圖2D)。由不同超聲時(shí)間下注釋基因的韋恩重疊分析可發(fā)現(xiàn)啟動(dòng)子區(qū)基因重疊比例高于非啟動(dòng)子區(qū),這提示超聲對(duì)啟動(dòng)子區(qū)域的影響相比非啟動(dòng)子區(qū)要小(圖2C–D)。將不同超聲時(shí)間下H3K27me3的基因組結(jié)合位點(diǎn)注釋基因進(jìn)行GO聚類(lèi)分析,結(jié)果顯示超聲時(shí)間10 min、20 min、30 min得到的GO通路數(shù)量分別為1 479、1 539、1 506 (<0.01),且最顯著富集的前10條通路與已報(bào)道文獻(xiàn)一致能夠顯著富集在軸突發(fā)育 (Axon development)、細(xì)胞命運(yùn)決定(Cell fate commitment)、胚胎器官發(fā)育(Embryonic organ development) 等H3K27me3主要相關(guān)功能的通路上(圖2E)[21-23]。隨著超聲時(shí)間延長(zhǎng),除了非啟動(dòng)子區(qū)域20 min相比10 min的新增基因有一條顯著富集的通路外,其他區(qū)域均未顯著富集。圖2F表示不同超聲時(shí)間得到的H3K27me3基因組結(jié)合位點(diǎn)的染色質(zhì)開(kāi)放程度的比較,由小提琴箱式圖可看出啟動(dòng)子區(qū)與非啟動(dòng)子區(qū)中不同超聲時(shí)間對(duì)H3K27me3基因組結(jié)合位點(diǎn)的染色質(zhì)開(kāi)放程度幾乎沒(méi)有影響,同時(shí)可看到啟動(dòng)子區(qū)的H3K27me3的開(kāi)放程度大于非啟動(dòng)子區(qū)。圖2G可直觀地看到不同超聲時(shí)間下H3K27me3的基因組結(jié)合位點(diǎn)幾乎沒(méi)有差異。
綜上所述,在啟動(dòng)子區(qū)或非啟動(dòng)子區(qū),不同時(shí)間超聲處理得到組蛋白H3K27me3結(jié)合位點(diǎn)的注釋基因及染色質(zhì)開(kāi)放程度均無(wú)明顯差異,且超聲時(shí)間對(duì)H3K27me3在基因組各區(qū)域分布情況以及平均分布密度影響不大。
為了研究超聲時(shí)間對(duì)不同分子量蛋白的影響,使用不同超聲時(shí)間處理的6×106個(gè)小鼠胚胎干細(xì)胞對(duì)較大分子量的非組蛋白EZH2進(jìn)行ChIP-seq實(shí)驗(yàn),與較小分子量的組蛋白H3K27me3進(jìn)行對(duì)比分析。EZH2作為PRC2的組分,是H3K27的甲基轉(zhuǎn)移酶,分子量約85 kDa。ChIP-seq分析結(jié)果顯示超聲10 min、20 min和30 min分別得到EZH2基因組結(jié)合位點(diǎn)數(shù)為7 334、7 890、 7 789。隨著超聲時(shí)間延長(zhǎng),分布在基因組各區(qū)域的EZH2結(jié)合位點(diǎn)的比例波動(dòng)不大(圖3A)。EZH2結(jié)合位點(diǎn)在全基因組上的平均密度分布分析顯示,超聲時(shí)間對(duì)平均密度分布無(wú)明顯影響(圖3B)。
啟動(dòng)子區(qū)不同超聲時(shí)間下EZH2結(jié)合位點(diǎn)的注釋基因數(shù)為4 320、4 624、4 545個(gè)(圖3C),非啟動(dòng)子區(qū)注釋基因數(shù)為2 127、2 255、2 207個(gè)(圖3D)。由韋恩重疊分析可發(fā)現(xiàn)啟動(dòng)子區(qū)基因重疊比例高于非啟動(dòng)子區(qū),這提示與H3K27me3類(lèi)似,超聲對(duì)EZH2啟動(dòng)子區(qū)域的影響相比非啟動(dòng)子區(qū)也小(圖3C–D)。將不同超聲時(shí)間條件下EZH2基因組結(jié)合位點(diǎn)注釋基因進(jìn)行GO聚類(lèi)分析,結(jié)果表明超聲時(shí)間10 min、20 min、30 min得到的GO通路數(shù)分別為2 604、2 727、2 672 (<0.01),且最顯著富集的前10條通路與已報(bào)道文獻(xiàn)一致,能夠顯著富集在分化發(fā)育等EZH2主要相關(guān)功能的通路上,例如軸突發(fā)育(Axon development)、胚胎器官發(fā)育(Embryonic organ development)、細(xì)胞命運(yùn)決定(Cell fate commitment)[24-25]。在啟動(dòng)子區(qū)超聲20 min相比10 min新增的EZH2結(jié)合位點(diǎn)注釋基因富集在4條GO通路上,例如肌動(dòng)蛋白絲成束(Actin filament bundle)、應(yīng)力纖維(Stress fiber) 等通路上,啟動(dòng)子區(qū)其他部分均無(wú)顯著富集。
對(duì)于非啟動(dòng)子區(qū),超聲20 min相比10 min新增基因的富集通路(113條) 遠(yuǎn)多于丟失基因富集的通路(8條),30 min比20 min丟失基因富集的通路(149條) 也遠(yuǎn)多于新增基因富集的通路(17條),在前20條最顯著富集的通路中仍然是非啟動(dòng)子區(qū)20 min相比10 min新增的通路多于丟失,非啟動(dòng)子區(qū)30 min丟失的通路多于新增,且這些通路主要與RNAPII、器官發(fā)育、細(xì)胞形態(tài)發(fā)生和細(xì)胞分化相關(guān)(圖3E)。這表明超聲時(shí)間不足(10 min) 或超聲時(shí)間過(guò)長(zhǎng)(30 min) 均會(huì)造成得到的EZH2基因組結(jié)合信息不全。圖3F表示不同超聲時(shí)間得到的EZH2基因組結(jié)合位點(diǎn)的染色質(zhì)開(kāi)放程度的比較,由小提琴箱式圖可看出啟動(dòng)子區(qū)不同超聲時(shí)間對(duì)EZH2基因組結(jié)合位點(diǎn)的染色質(zhì)開(kāi)放程度幾乎沒(méi)有影響,但超聲20 min和 30 min相比10 min,EZH2基因組結(jié)合位點(diǎn)的染色質(zhì)開(kāi)放程度均發(fā)生下降,這提示超聲時(shí)間延長(zhǎng)可能打開(kāi)了更多的染色質(zhì)開(kāi)放程度低的區(qū)域,即染色質(zhì)致密不易被超聲破碎的部分。圖3G可直觀地看到不同超聲時(shí)間下EZH2的基因組結(jié)合位點(diǎn)存在差異。
圖3 超聲對(duì)EZH2 ChIP-seq的影響
綜上,雖然超聲時(shí)間對(duì)非組蛋白EZH2在基因組各區(qū)域分布情況以及平均分布密度影響不大,但相比H3K27me3,EZH2 ChIP-seq數(shù)據(jù)受超聲時(shí)間影響較大。而且超聲對(duì)非啟動(dòng)子區(qū)的影響大于啟動(dòng)子區(qū)。相比10 min和30 min,超聲20 min即超聲片段集中分布在100–500 bp時(shí),能夠拿到更全面的EZH2基因組結(jié)合信息。
由上一節(jié)的分析結(jié)果可知20 min為最優(yōu)的超聲條件,選取超聲20 min相比10 min啟動(dòng)子區(qū)新增的EZH2基因組結(jié)合位點(diǎn)、超聲20 min相比 10 min非啟動(dòng)子區(qū)新增的EZH2基因組結(jié)合位點(diǎn)以及30 min相比20 min非啟動(dòng)子區(qū)丟失的EZH2基因組結(jié)合位點(diǎn)這3部分為代表探究超聲時(shí)間具體影響了基因組的哪些區(qū)域。
SUZ12和EED是EZH2行使催化功能所必需的兩個(gè)非催化亞基[9],EZH2和SUZ12及EED三者共定位的基因組結(jié)合位點(diǎn)可認(rèn)為是PRC2的結(jié)合區(qū)域。EZH2除了作為表觀遺傳書(shū)寫(xiě)器(Writer),依賴(lài)PRC2起到轉(zhuǎn)錄抑制的作用外,還被報(bào)道在多種癌癥中能夠不依賴(lài)于PRC2作為轉(zhuǎn)錄激活因子獨(dú)立行使轉(zhuǎn)錄激活功能[9,18]。故可分析超聲時(shí)間影響了基因組上PRC2結(jié)合區(qū)域還是PRC2不結(jié)合區(qū)域的EZH2結(jié)合位點(diǎn)。另外對(duì)于啟動(dòng)子區(qū)和非啟動(dòng)子區(qū)還可進(jìn)一步細(xì)分,啟動(dòng)子區(qū)依據(jù)組蛋白修飾可劃分為H3K4me3和H3K27me3共定位的二價(jià)啟動(dòng)子(Bivalent promoter)、只有H3K4me3而沒(méi)有H3K27me3的活躍啟動(dòng)子(Active promoter)、只有H3K27me3而沒(méi)有H3K4me3的抑制啟動(dòng)子區(qū)(Repressed promoter)[26],非啟動(dòng)子區(qū)最主要的特征就是散布著增強(qiáng)子,根據(jù)組蛋白修飾可分為具有H3K4me1和H3K27ac的活化態(tài)增強(qiáng)子(Active enhancer)、只有H3K4me1的待發(fā)態(tài)增強(qiáng)子(Primed enhancer)以及具有H3K4me1和H3K27me3的準(zhǔn)備態(tài)增強(qiáng)子(Poised enhancer),也可稱(chēng)為靜態(tài)增強(qiáng)子[27]。故還可以分析不同超聲時(shí)間影響了哪一類(lèi)啟動(dòng)子或增強(qiáng)子區(qū)域的EZH2結(jié)合位點(diǎn)。
對(duì)啟動(dòng)子區(qū)中的PRC2結(jié)合區(qū)域、PRC2不結(jié)合區(qū)域、二價(jià)啟動(dòng)子區(qū)、活躍啟動(dòng)子區(qū)、抑制啟動(dòng)子區(qū)的20 min新增EZH2結(jié)合位點(diǎn)進(jìn)行spearman相關(guān)分析和GO聚類(lèi)比較分析(<0.05),發(fā)現(xiàn)啟動(dòng)子區(qū)20 min新增的EZH2基因組結(jié)合位點(diǎn)主要分布在PRC2不結(jié)合區(qū)域及二價(jià)啟動(dòng)子區(qū)域(圖4A–B)。對(duì)非啟動(dòng)子區(qū)中PRC2結(jié)合區(qū)域、PRC2不結(jié)合區(qū)域、活化態(tài)增強(qiáng)子、待發(fā)態(tài)增強(qiáng)子、準(zhǔn)備態(tài)增強(qiáng)子區(qū)的20 min新增EZH2結(jié)合位點(diǎn)和30 min丟失EZH2結(jié)合位點(diǎn)的進(jìn)行spearman相關(guān)分析和GO聚類(lèi)比較分析(<0.05) 發(fā)現(xiàn),非啟動(dòng)子區(qū)隨超聲時(shí)間延長(zhǎng)丟失和新增的EZH2基因組結(jié)合位點(diǎn)主要不僅分布在PRC2結(jié)合區(qū)域、而且也分布在PRC2不結(jié)合區(qū)域以及活化態(tài)增強(qiáng)子上(圖4C–E)。
圖4 EZH2隨超聲時(shí)間延長(zhǎng)丟失和新增基因組結(jié)合位點(diǎn)的具體定位區(qū)域
ChIP-seq實(shí)驗(yàn)中超聲時(shí)間延長(zhǎng)會(huì)得到更多小分子量的染色質(zhì)DNA片段,但是也會(huì)伴隨產(chǎn)熱,對(duì)蛋白質(zhì)穩(wěn)定性有影響。本研究以組蛋白H3K27me3和其甲基化轉(zhuǎn)移酶EZH2為例,研究不同超聲時(shí)間對(duì)不同分子量大小蛋白ChIP-seq的影響。對(duì)小分子量組蛋白H3K27me3,在啟動(dòng)子區(qū)或非啟動(dòng)子區(qū)不同超聲時(shí)間得到的基因組結(jié)合位點(diǎn)的注釋基因無(wú)明顯差異。較短超聲時(shí)間雖然產(chǎn)生100–500 bp DNA片段比例較少,但是對(duì)于小分子量組蛋白,足夠得到比較全面的基因組結(jié)合位點(diǎn)信息,延長(zhǎng)時(shí)間超聲并不能顯著增加基因組結(jié)合位點(diǎn)信息。
與組蛋白不同,將超聲時(shí)間從10 min延長(zhǎng)至20 min后,啟動(dòng)子區(qū)新增EZH2的基因組結(jié)合位點(diǎn)注釋基因能夠顯著(<0.01) 聚類(lèi)在與肌動(dòng)蛋白絲組裝的相關(guān)通路上(圖3E),而且新增的EZH2基因組結(jié)合位點(diǎn)主要分布在PRC2不結(jié)合區(qū)域及二價(jià)啟動(dòng)子區(qū)域,因?yàn)檫@兩個(gè)區(qū)域的EZH2結(jié)合位點(diǎn)注釋基因也顯著(<0.05) 聚類(lèi)在肌動(dòng)蛋白絲組裝等相關(guān)通路上(圖4E)。有研究表明在T細(xì)胞和纖維母細(xì)胞中敲除EZH2會(huì)導(dǎo)致聚合的F-actin降低,提示EZH2可以促進(jìn)G-actin組裝聚合為F-actin,即EZH2對(duì)肌動(dòng)蛋白絲的組裝起到促進(jìn)作用[28-29]。而基因組上PRC2不結(jié)合區(qū)域的EZH2可能具有轉(zhuǎn)錄激活作用,這提示EZH2可能以不依賴(lài)PRC2的方式作為轉(zhuǎn)錄激活因子促進(jìn)胚胎干細(xì)胞中肌動(dòng)蛋白絲的組裝。若超聲時(shí)間不足,則會(huì)丟失EZH2調(diào)節(jié)肌動(dòng)蛋白絲這部分信息。另外非啟動(dòng)子區(qū)20 min新增基因的聚類(lèi)(113條) 要遠(yuǎn)多于丟失基因(8條),非啟動(dòng)子區(qū)30 min丟失基因的聚類(lèi)(149條) 要遠(yuǎn)多于新增基因(17條),且這些區(qū)域大多顯著(<0.01) 聚類(lèi)在RNAPII、器官發(fā)育、細(xì)胞形態(tài)發(fā)生相關(guān)通路上(圖3E)。這表明超聲時(shí)間不足或過(guò)長(zhǎng)均會(huì)丟失EZH2的基因組定位信息且超聲對(duì)非啟動(dòng)子區(qū)的影響要大于啟動(dòng)子區(qū)。進(jìn)一步分析還發(fā)現(xiàn)超聲主要影響非啟動(dòng)子區(qū)中PRC2結(jié)合區(qū)域、PRC2不結(jié)合區(qū)域以及活化態(tài)增強(qiáng)子區(qū)域的EZH2結(jié)合位點(diǎn),因?yàn)檫@些區(qū)域的EZH2結(jié)合位點(diǎn)注釋基因也能顯著(<0.05) 富集在RNAPII、器官發(fā)育、細(xì)胞形態(tài)發(fā)生等相關(guān)通路上(圖4E)。
綜上所述,超聲步驟對(duì)于染色質(zhì)免疫沉淀測(cè)序?qū)嶒?yàn)非常重要,建議對(duì)大分子量的染色質(zhì)修飾相關(guān)蛋白優(yōu)化超聲處理時(shí)間,使形成的染色質(zhì)片段聚集在100–500 bp可獲得比較全面的基因組信息。對(duì)小分子量的組蛋白來(lái)說(shuō),超聲時(shí)間對(duì)其影響不大。
[1] Kuo MH, Allis CD.cross-linking and immunoprecipitation for studying dynamic protein: DNA associations in a chromatin environment. Methods, 1999, 19(3): 425–433.
[2] Mardis ER. ChIP-seq: welcome to the new frontier. Nat Methods, 2007, 4(8): 613–614.
[3] Das PM, Ramachandran K, Vanwert J, et al. Chromatin immunoprecipitation assay. Biotechniques, 2004, 37(6): 961–969.
[4] Skene PJ, Henikoff S. A simple method for generating high-resolution maps of genome-wide protein binding. eLife, 2015, 4: e09225.
[5] Schmid CD, Bucher P. ChIP-seq data reveal nucleosome architecture of human promoters. Cell, 2007, 131(5): 831–832.
[6] Nekrasov M, Wild B, Müller J. Nucleosome binding and histone methyltransferase activity of Drosophila PRC2. Embo Rep, 2005, 6(4): 348–353.
[7] Tie F, Stratton CA, Kurzhals RL, et al. The N terminus of Drosophila ESC binds directly to histone H3 and is required for E(Z)-dependent trimethylation of H3 lysine 27. Mol Cell Biol, 2007, 27(6): 2014–2026.
[8] H?jfeldt JW, Laugesen A, Willumsen BM, et al. Accurate H3K27 methylation can be established de novo by SUZ12-directed PRC2. Nat Struct Mol Biol, 2018, 25(3): 225–232.
[9] Tan JZ, Yan Y, Wang XX, et al. EZH2: biology, disease, and structure-based drug discovery. Acta Pharmacol Sin, 2014, 35(2): 161–174.
[10] Margueron R, Reinberg D. The polycomb complex PRC2 and its mark in life. Nature, 2011, 469(7330): 343–349.
[11] Simon JA, Kingston RE. Occupying chromatin: Polycomb mechanisms for getting to genomic targets, stopping transcriptional traffic, and staying put. Mol Cell, 2013, 49(5): 808–824.
[12] Chamberlain SJ, Yee D, Magnuson T. Polycomb repressive complex 2 is dispensable for maintenance of embryonic stem cell pluripotency. Stem Cells, 2008, 26(6): 1496–1505.
[13] Leeb M, Pasini D, Novatchkova M, et al. Polycomb complexes act redundantly to repress genomic repeats and genes. Gene Dev, 2010, 24(3): 265–276.
[14] Riising EM, Comet I, Leblanc B, et al. Gene silencing triggers polycomb repressive complex 2 recruitment to CpG islands genome wide. Mol Cell, 2014, 55(3): 347–360.
[15] Kahn TG, Dorafshan E, Schultheis D, et al. Interdependence of PRC1 and PRC2 for recruitment to Polycomb Response Elements. Nucleic Acids Res, 2016, 44(21): 10132–10149.
[16] Burdach S, Plehm S, Unland R, et al. Epigenetic maintenance of stemness and malignancy in peripheral neuroectodermal tumors by EZH2. Cell Cycle, 2009, 8(13): 1991–1996.
[17] Jiang HM, Gupta R, Somma J. EZH2, a unique marker of malignancy in effusion cytology. Diagn Cytopathol, 2014, 42(2): 111–116.
[18] Lee ST, Li ZM, Wu ZL, et al. Context-specific regulation of NF-κB target gene expression by EZH2 in breast cancers. Mol Cell, 2011, 43(5): 798–810.
[19] Yu GC, Wang LG, He QY. ChIPseeker: an R/Bioconductor package for ChIP peak annotation, comparison and visualization. Bioinformatics, 2015, 31(14): 2382–2383.
[20] Yu GC, Wang LG, Han YY, et al. Clusterprofiler: an R package for comparing biological themes among gene clusters. OMICS, 2012, 16(5): 284–287.
[21] Juan AH, Wang S, Ko KD, et al. Roles of H3K27me2 and H3K27me3 examined during fate specification of embryonic stem cells. Cell Rep, 2016, 17(5): 1369–1382.
[22] Liu JC, Wu XW, Zhang HY, et al. Dynamics of RNA polymerase II pausing and bivalent histone H3 methylation during neuronal differentiation in brain development. Cell Rep, 2017, 20(6): 1307–1318.
[23] Khan AA, Ham SJ, Yen LN, et al. A novel role of metal response element binding transcription factor 2 at the hox gene cluster in the regulation of H3K27me3 by polycomb repressive complex 2. Oncotarget, 2018, 9(41): 26572–26585.
[24] Collinson A, Collier AJ, Morgan NP, et al. Deletion of the polycomb-group protein EZH2 leads to compromised self-renewal and differentiation defects in human embryonic stem cells. Cell Rep, 2016, 17(10): 2700–2714.
[25] Thornton SR, Butty VL, Levine SS, et al. Polycomb repressive complex 2 regulates lineage fidelity during embryonic stem cell differentiation. PLoS ONE, 2014, 9(10): e110498.
[26] Du Z, Li H, Wei Q, et al. Genome-wide analysis of histone modifications: H3K4me2, H3K4me3, H3K9ac, and H3K27ac in Oryza sativaL. Japonica. Mol Plant, 2013, 6(5): 1463–1472.
[27] Calo E, Wysocka J. Modification of enhancer chromatin: what, how, and why? Mol Cell, 2013, 49(5): 825–837.
[28] Bryant RJ, Winder SJ, Cross SS, et al. The polycomb group protein EZH2 regulates actin polymerization in human prostate cancer cells. Prostate, 2008, 68(3): 255–263.
[29] Su IH, Dobenecker MW, Dickinson E, et al. Polycomb group protein Ezh2 controls actin polymerization and cell signaling. Cell, 2005, 121(3): 425–436.
Effect of sonication on results of ChIP-seq experiments involving PRC2 related proteins
Gensheng Yang1, Fangfang Jiao1, Ruitu Lü1, and Rui Guo1,2
1 Institutes of Biomedical Sciences, Fudan University, Shanghai 200031, China 2 Department of Oncology, Pudong Medical Center, Fudan University, Shanghai 201399, China
Sonication is one of the essential strategies of chromatin fragmentation in Chromatin immunoprecipitation (ChIP) assay. The impact of proteins with different molecular weights generated under different duration of sonication on the results of Chromatin immunoprecipitation sequencing (ChIP-seq) experiments involving the Polycomb Repressive Complex 2 (PRC2) related protein EZH2, which is a histone methyltransferase, and its product H3K27me3 was investigated. The results indicate that in the promoter region or nonpromoter region, there were hardly any differences among the H3K27me3 peaks annotated genes from different duration of sonication, which suggesting that the duration of sonication had little effect on histone ChIP-seq results. In contrast, in the promoter region newly gained EZH2 peaks annonated genes at 20 min sonication time were significantly clustered in the gene ontology (GO) pathways related to actin filament bundle compared with 10 min. In the nonpromoter region, compared with 10 min, the GO pathways of newly gained EZH2 peaks annonated genes at 20 min sonication time is much more than that of lost EZH2 peaks annonated genes. And in the nonpromoter region,compared with 20 min, the GO pathways of lost EZH2 peaks annonated genes at 30 min sonication time is much more than that of newly gained EZH2 peaks annonated genes. Most of these pathways are associated with RNA polymerase II (RNAPII), organ development and cell morphogenesis. These suggest that the genomic information of EZH2 will be lost if the duration of sonication is not enough or too long. Different duration of sonication mainly affect the EZH2 peaks in PRC2 unoccupied region and the bivalent promoter in the promoter region, as well as the PRC2 occupied region, PRC2 unoccupied region and the activated enhancer in the nonpromoter region. Therefore, the sonication for the chromatin related proteins with high molecular weights need to be optimized to make chromatin fragments size vary from 100 bp to 500 bp, which will yield relatively comprehensive genomic information of the target protein. For histones, which are of small molecular weights, duration of sonication has little effect on them.
duration of sonication, fragmentation of chromatin, EZH2, PRC2, promoter, enhancer
楊根生, 焦芳芳, 呂瑞途, 等. 超聲處理對(duì)PRC2相關(guān)蛋白染色質(zhì)免疫共沉淀測(cè)序結(jié)果的影響. 生物工程學(xué)報(bào), 2020, 36(2): 341–352.
Yang GS, Jiao FF, Lü RT, et al. Effect of sonication on results of ChIP-seq experiments involving PRC2 related proteins. Chin J Biotech, 2019, 36(2): 341–352.
June 11, 2019;
August 30, 2019
Supported by: National Natural Science Foundation of China (No. 31771450).
Rui Guo. Tel: +86-21-54237598; E-mail: guorui@fudan.edu.cn
10.13345/j.cjb.190245
國(guó)家自然科學(xué)基金 (No. 31771450)資助。
2019-09-05
http://kns.cnki.net/kcms/detail/11.1998.Q.20190904.1746.002.html
(本文責(zé)編 陳宏宇)