周 項(xiàng), 朱海霞, 黃 強(qiáng)
復(fù)旦大學(xué) 生命科學(xué)學(xué)院, 上海 200438
單堿基編輯是一種由Cas蛋白主導(dǎo)的基因編輯技術(shù)[1],具有不依賴于DNA鏈的DSB(Double strand break)的特點(diǎn),可以對(duì)靶位點(diǎn)上的單堿基進(jìn)行替換[2-3]。近年來,該技術(shù)已廣泛應(yīng)用于動(dòng)植物模型的建立、疾病發(fā)病機(jī)制以及微生物的研究等領(lǐng)域[4-7]。在應(yīng)用過程中,單堿基編輯技術(shù)展現(xiàn)出了高效、高靶向性等特點(diǎn),因此該技術(shù)備受研究人員的關(guān)注,有望在基因治療中大放異彩。根據(jù)堿基的轉(zhuǎn)換類型,單堿基編輯技術(shù)可以分為兩大類,分別是胞嘧啶堿基編輯器(Cytosine base editors, CBE)和腺嘌呤堿基編輯器(Adenine base editors, ABE)。在一些動(dòng)植物的基因編輯實(shí)驗(yàn)中,ABE比CBE表現(xiàn)出了更好的特異性、有效性和安全性[5, 8],因此,ABE具有廣闊的應(yīng)用前景。通過多代定向進(jìn)化優(yōu)化,人們獲得了迄今最為優(yōu)秀的一個(gè)腺嘌呤堿基編輯器:ABE8e[2]。
目前,ABE8e的結(jié)構(gòu)已被解析,結(jié)構(gòu)顯示其天然形態(tài)為二聚體結(jié)構(gòu)[9]。但是,我們?cè)贏BE8e的體外純化制備過程中卻發(fā)現(xiàn)其多聚體比例較高。在其它相關(guān)文獻(xiàn)中,ABE8e的制備緩沖體系中含有一定量的還原劑[10]。當(dāng)?shù)鞍踪|(zhì)混合液中含有大量多聚體時(shí),會(huì)導(dǎo)致蛋白質(zhì)性質(zhì)不穩(wěn)定,進(jìn)而使結(jié)構(gòu)發(fā)生改變[11]。因此,在蛋白質(zhì)的體外制備過程中需要盡可能地控制多聚體的比例,以保持樣品的穩(wěn)定性[12]。
在本文中,為了降低ABE8e多聚體的比例,我們首先分析了ABE8e的三維結(jié)構(gòu),了解其多聚體形成的分子根源。然后,在結(jié)構(gòu)信息的指導(dǎo)下推測(cè)分子間的聚集源于ABE8e二聚化界面中疏水區(qū)域的曝露。為驗(yàn)證理論推測(cè)的正確性,我們構(gòu)建了相應(yīng)的ABE8e突變體(ABE8e-T),對(duì)其進(jìn)行表達(dá)和純化。ABE8e-T的純化結(jié)果證實(shí)了多聚體成因的理論推測(cè)。在此基礎(chǔ)上,我們有針對(duì)性地優(yōu)化了緩沖體系,從而降低了ABE8e多聚體的比例,有效地提高了純化制備的效率。
1.1.1質(zhì)粒與菌株
本研究使用的ABE8e及ABE8e-T質(zhì)粒由課題組保存。DH5α、Rosetta (DE3)大腸桿菌感受態(tài)細(xì)胞購(gòu)自天根生化科技(北京)有限公司。
1.1.2主要試劑
表達(dá):氨芐青霉素、IPTG、氯霉素及LB Broth購(gòu)自生工生物工程(上海)股份有限公司。純化:咪唑、Tris、KCl、精氨酸及鹽酸購(gòu)自生工生物工程(上海)股份有限公司。醋酸、SDS、考馬斯亮藍(lán)、甲醇購(gòu)自滬試實(shí)驗(yàn)室器材(上海)股份有限公司。電泳膠配制緩沖液購(gòu)自天根生化科技(北京)有限公司。突變體構(gòu)建:質(zhì)粒小提試劑盒、點(diǎn)突變?cè)噭┖屑案惺軕B(tài)細(xì)胞購(gòu)自天根生化科技(北京)有限公司。
1.1.3主要設(shè)備
表達(dá):恒溫?fù)u床購(gòu)自上海天呈實(shí)驗(yàn)儀器制造有限公司。純化:AKTA Avant 25購(gòu)自格來賽生命科技(上海)有限公司。電泳儀購(gòu)自北京六一生物科技有限公司。凝膠成像系統(tǒng)購(gòu)自上海勤翔科學(xué)儀器有限公司。
1.1.4主要耗材
純化:Ni-NTA Agarose購(gòu)自凱杰生物工程(深圳)有限公司。凝膠層析柱為Superdex 200 Increase 10/300及HiLoad Superdex 200 16/600,均購(gòu)自格來賽生命科技(上海)有限公司。
1.2.1表達(dá)步驟
將復(fù)蘇好的菌液添加至含有氨芐及氯霉素的LB培養(yǎng)基中,進(jìn)行擴(kuò)大培養(yǎng)。擴(kuò)大培養(yǎng)的溫度設(shè)為37 ℃,轉(zhuǎn)速設(shè)為200 r/min,培養(yǎng)4 h~5 h后檢測(cè)OD值。當(dāng)OD值為0.8~1.2 時(shí),進(jìn)行表達(dá)培養(yǎng)。表達(dá)培養(yǎng)的溫度設(shè)置為20 ℃,轉(zhuǎn)速設(shè)置為200 r/min,培養(yǎng)12 h~14 h后停止培養(yǎng)。將菌液進(jìn)行離心,收集菌體,保存至-80 ℃,以備后用。
1.2.2純化步驟
Ni柱親和層析的實(shí)驗(yàn)步驟依次為:平衡1、平衡2、上樣、淋洗及洗脫。其中,平衡1及洗脫步驟的緩沖體系為:20 mmol/L Tris,500 mmol/L KCl,300 mmol/L咪唑pH 8.0;平衡2與淋洗步驟的緩沖體系為:20 mmol/L Tris,500 mmol/L KCl,10~20 mmol/L咪唑pH 8.0。平衡1沖洗體積大于5個(gè)柱體積,平衡2的沖洗體積大于5個(gè)柱體積;淋洗體積大于5個(gè)柱體積;洗脫體積大于3個(gè)柱體積,在洗脫的過程中可以分管收集洗脫液,根據(jù)SDS-PAGE電泳結(jié)果分析各泳道蛋白的分子量、濃度以及純度,并進(jìn)行下一步驟。
凝膠層析的實(shí)驗(yàn)步驟依次為:平衡、上樣、再平衡。其中,優(yōu)化前的緩沖體系為:20 mmol/L Tris,500 mm/L KCl pH 8.0,優(yōu)化后的緩沖體系為:20 mmol/L Tris,0.5 mol/L精氨酸鹽酸,0.5 mol/L KCl pH 8.0。此外,還設(shè)置了對(duì)照緩沖體系:20 mmol/L Tris,0.5 mol/L 精氨酸鹽酸 pH 8.0。流速設(shè)置為0.5 mL/min~1.0 mL/min,平衡與再平衡的體積為1個(gè)柱體積。
1.2.3突變體突變流程
采用點(diǎn)突變的方式進(jìn)行質(zhì)粒構(gòu)建。實(shí)驗(yàn)流程為首先提取ABE8e的質(zhì)粒,其次對(duì)進(jìn)行點(diǎn)突變。突變完成后,轉(zhuǎn)化入細(xì)胞內(nèi)并挑選單克隆,最后對(duì)其進(jìn)行測(cè)序確認(rèn)序列的正確性。
1.2.4PyMOL及Rosetta軟件的應(yīng)用
運(yùn)用PyMOL軟件觀察ABE8e的三維結(jié)構(gòu),觀察的主要內(nèi)容是:疏水性氨基酸在三維結(jié)構(gòu)中所處的位置,分子之間的靜電勢(shì)等信息。從觀察結(jié)果中更深入地分析分子之間的相互作用,從而了解多聚化的原因及確認(rèn)可能的氨基酸突變位點(diǎn)。
用Rosetta軟件中的fixbb模塊對(duì)需要突變的氨基酸位點(diǎn)進(jìn)行隨機(jī)氨基酸突變,經(jīng)排列組合后,得到多種突變體。根據(jù)fixbb輸出的5 000個(gè)突變體結(jié)果,通過Python編程剔除序列完全相同的重復(fù)突變體,最后根據(jù)Rosetta能量由低到高排序,從而選出能量最低的突變?cè)O(shè)計(jì)結(jié)構(gòu)。
核酸酶大多為堿性蛋白質(zhì),在中性pH條件下,表面氨基酸帶有大量正電荷,與帶有負(fù)電荷的靶標(biāo)DNA相互吸引并結(jié)合,捕獲靶標(biāo)DNA。但是,在體外制備核酸酶的過程中,一般不直接添加靶標(biāo)DNA。因此,在緩沖體系中缺乏負(fù)電荷的情況下,核酸酶的結(jié)構(gòu)有可能會(huì)不穩(wěn)定。所以,在核酸酶制備緩沖體系中,通常使用高鹽緩沖體系提供一定的負(fù)離子環(huán)境。以SpCas9為例,在高鹽緩沖體系中,該蛋白質(zhì)以單體為主;而在相同的緩沖體系中,ABE8e則是含有34.2%的多聚體。
為了抑制多聚體的形成并降低其比例,首先分析了ABE8e的結(jié)構(gòu),了解多聚體的成因。蛋白質(zhì)分子結(jié)構(gòu)的形成與分子間的相互作用取決于靜電作用力、疏水作用力、氫鍵與范德華力的共同影響,其中靜電作用力和疏水作用力起到了非常關(guān)鍵性的作用。多聚體的產(chǎn)生往往因?yàn)榈鞍踪|(zhì)自身之間發(fā)生了非正常的結(jié)合,通常與靜電作用力和疏水作用力相關(guān)[13-15]。因此,我們?cè)敿?xì)分析了ABE8e的三維結(jié)構(gòu)、TadA-8e的氨基酸序列、疏水性氨基酸分布、電荷分布等性質(zhì),以了解多聚體的成因。具體如下:
(1) TadA-8e氨基酸序列分析。ABE8e主要由兩部分組成,分別是nCas9和TadA-8e。其中nCas9僅在野生型SpCas9上突變了一個(gè)氨基酸(D10A)。我們和其他人的研究表明,野生型SpCas9的純化結(jié)果顯示其僅含有少量的多聚體(結(jié)果未顯示)。因此,首先考慮分析TadA-8e的氨基酸序列。
TadA-8e是從TadA野生型(wtTadA)定向進(jìn)化而來。從圖1可知,進(jìn)化后所得的TadA-8e一共突變了19個(gè)氨基酸,其中三個(gè)疏水性氨基酸突變?yōu)橛H水性氨基酸(W23R、A109S、F149Y),5個(gè)為親水性氨基酸突變?yōu)槭杷园被?H36L、P48A、R51L、E155 V、T166I)。相較于野生型TadA,TadA-8e新增了兩個(gè)疏水性氨基酸。所以,由表1可知,TadA-8e共有166個(gè)氨基酸,其中70個(gè)氨基酸為疏水性氨基酸,疏水性氨基酸占比42%。
表1 TadA-8e疏水性氨基酸分布概況表
(a) wtTadA 和 TadA-8e 序列對(duì)比圖
當(dāng)疏水性氨基酸含量較高時(shí),分子形態(tài)的改變可能會(huì)造成更多的疏水區(qū)域曝露,從而造成分子間聚集,產(chǎn)生大量的多聚體??紤]到ABE8e疏水性氨基酸占比較高,推斷其存在易于聚集的風(fēng)險(xiǎn)。但是,當(dāng)疏水性氨基酸位于分子內(nèi)部時(shí),將有助于分子結(jié)構(gòu)的穩(wěn)固,并不會(huì)引起分子間聚集。因此,需要進(jìn)一步觀察TadA-8e的疏水性氨基酸在結(jié)構(gòu)中的分布。
(2) TadA-8e疏水性氨基酸分布分析。TadA-8e序列如下:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHA
EIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNSKRGAAGS
LMNVLNYPGMNHRVEITEGILADECAALLCDFYRMPRQVFNAQKKAQSSI
圖2(a)展示了TadA-8e的疏水性氨基酸分布,從圖中可以觀察到,其疏水性氨基酸主要分布于分子內(nèi)部、柔性部位及分子表面,其中柔性部位也大多位于分子表面。疏水性氨基酸密集地位于蛋白質(zhì)分子表面時(shí),易造成分子間的聚集。圖2(c)展示了TadA-8e疏水性氨基酸分布較密集的區(qū)域。由圖可知,柔性部位的疏水性氨基酸雖分布在分子表面,但分布較松散。分子表面的疏水性氨基酸主要密集地分布在兩個(gè)α螺旋的外表面,占比約17.1%(表2)。然而,這部分的區(qū)域?yàn)門adA-8e的二聚化界面,當(dāng)TadA-8e呈二聚體形態(tài)時(shí),二聚化界面內(nèi)的疏水性氨基酸聚攏在分子間,有助于穩(wěn)固二聚體的構(gòu)象。圖2(b)展示了TadA8e的電勢(shì)分布,可以看到:在二聚化界面中,除了疏水作用力,界面中的靜電勢(shì)相互吸引,界面三維結(jié)構(gòu)呈互補(bǔ)形態(tài),二聚化界面結(jié)合的非常緊密。綜上,我們推斷:當(dāng)帶有TadA-8e的ABE8e分子以二聚體形態(tài)存在時(shí),分子表面密集的疏水性區(qū)域較少,不易造成聚集。
表2 TadA-8e二聚化界面疏水性氨基酸概況表
(a) TadA-8e 疏水性氨基酸分布圖
(3) ABE8e三維結(jié)構(gòu)分析。根據(jù)上述理論分析結(jié)果可知,ABE8e以二聚體為主要結(jié)構(gòu)形態(tài)時(shí),多聚體較少。但是,ABE8e的體外純化結(jié)果顯示:蛋白混合液中約含有34.2%的多聚體。因此,我們進(jìn)一步考察ABE8e的三維結(jié)構(gòu)。
由圖2(d) ABE8e的三維結(jié)構(gòu)可以發(fā)現(xiàn):nCas9的分子較大,當(dāng)TadA-8e通過linker連接上nCas9后,增加了蛋白質(zhì)的剛性。分子剛性的增加限制了TadA-8e的移動(dòng),減少了TadA-8e二聚化界面碰撞結(jié)合的機(jī)會(huì)。當(dāng)二聚化界面沒有相結(jié)合時(shí),相關(guān)界面中的疏水性區(qū)域可能會(huì)和蛋白質(zhì)其他區(qū)域的疏水性氨基酸相互結(jié)合,特別是分子表面及柔性部位。這種結(jié)合將會(huì)造成多聚體的形成。
綜上,本研究提出關(guān)于多聚體形成的假說:由于TadA-8e二聚化界面中疏水性區(qū)域的曝露,造成了分子間的聚集,從而產(chǎn)生大量的多聚體。當(dāng)ABE8e無法形成二聚體結(jié)構(gòu)時(shí),其更傾向形成多聚體,而非單體。
為了驗(yàn)證多聚體的形成是否與二聚化界面的打開有關(guān),我們突變了TadA-8e二聚化界面的關(guān)鍵氨基酸,以阻礙其二聚化。觀察二聚化界面進(jìn)一步打開后,多聚體的比例是否會(huì)發(fā)生改變。若多聚體的比例增加,則可證明以上假說的正確性。
(1) 突變體的構(gòu)建。為了尋找二聚化界面的關(guān)鍵氨基酸,運(yùn)用PyMOL軟件分析了該界面中特異性較高的部分。從圖3(a) ABE8e二聚化界面的三維結(jié)構(gòu)細(xì)節(jié)圖可以發(fā)現(xiàn):64位和74位的精氨酸位于此部位,且精氨酸帶有正電荷,與對(duì)面的負(fù)電荷相互吸引。可以推斷:這兩個(gè)位點(diǎn)的氨基酸是二聚化界面中影響二聚化的核心氨基酸。
在確定需要突變的氨基酸后,使用Rosetta軟件中的Fixbb模塊對(duì)ABE8e的64及74位氨基酸進(jìn)行突變優(yōu)化。Fixbb模塊共輸出5000個(gè)結(jié)果,先通過Python程序剔除重復(fù)結(jié)果,再以蛋白質(zhì)的能量值由低到高進(jìn)行排序,然后選出能量最低的突變體。這樣,最終確定的突變體中R64突變?yōu)長(zhǎng);R74突變?yōu)镋。我們將此突變體命名為ABE8e-T。從圖3(b)突變體的測(cè)序圖中可以看出,64位的核酸序列為CTG;74位的核酸序列為GAA,說明突變體ABE8e-T的表達(dá)質(zhì)粒構(gòu)建成功。
(a) ABE8e突變位點(diǎn)圖
(2) 突變體的純化。 為了觀察ABE8e-T的結(jié)構(gòu)形態(tài),采用平臺(tái)工藝條件對(duì)ABE8e-T進(jìn)行表達(dá)純化。先進(jìn)行Ni柱純化,再取其Ni柱層析收獲的洗脫液進(jìn)行凝膠層析純化,分離多聚體和二聚體。ABE8e-T的Ni柱親和層析純化結(jié)果見圖4(b)。由圖可知,ABE8e-T經(jīng)Ni柱純化后純度較高。ABE8e-T的凝膠層析純化結(jié)果如圖4(c)所示。從分子篩的實(shí)驗(yàn)結(jié)果見圖4(c)中可知,在20 mmol/L Tris 0.5 mol/L KCL 緩沖體系中,F(xiàn)1的出峰位置約在7.2 mL,F(xiàn)2的出峰位置約為9.3 mL。根據(jù)Superdex的說明書可知,660 kDa的標(biāo)準(zhǔn)蛋白出峰位置約在8.0 mL,440 kDa的標(biāo)準(zhǔn)蛋白出峰位置約在8.8mL,66 kDa的標(biāo)準(zhǔn)蛋白的出峰位置約在12.5 mL。ABE8e的單體理論分子量為182 kDa,二聚體理論分子量為364 kDa。因此,我們判斷,F(xiàn)1為多聚體,占比為34.2%,F(xiàn)2為二聚體,占比為43.8%。凝膠層析實(shí)驗(yàn)結(jié)果顯示ABE8e-T的多聚體占比為71.6%,比例遠(yuǎn)高于二聚體的占比27.1%。對(duì)比ABE8e-T與ABE8e的凝膠層析圖譜見圖4(d)后發(fā)現(xiàn):ABE8e-T的多聚體比例大幅度上升,二聚體比例大幅度下降。由此說明,在二聚化界面打開后,ABE8e-T沒有傾向變成單體,而是傾向于多聚體。
綜上,ABE8e-T的體外純化實(shí)驗(yàn)結(jié)果驗(yàn)證了2.1中對(duì)ABE8e多聚體形成的理論分析假說。
(3) 緩沖液優(yōu)化。在蛋白質(zhì)制備的過程中,通過優(yōu)化緩沖溶液的組分,可以有效地防止及抑制蛋白質(zhì)聚集傾向[12]。在確認(rèn)了ABE8e聚集體的成因后,本研究擬通過此方法來抑制多聚體的比例,從而幫助ABE8e恢復(fù)其二聚體結(jié)構(gòu)。精氨酸因其對(duì)蛋白質(zhì)分子有良好的保護(hù)作用,已經(jīng)廣泛地應(yīng)用于制劑及下游純化工藝中[16-18],其中精氨酸鹽酸體系抑制分子間聚集的效果最佳[19, 20]。探究其機(jī)理,有兩方面可能的影響因素:其一,精氨酸側(cè)鏈能夠與某些氨基酸側(cè)鏈產(chǎn)生有利的相互作用,特別是對(duì)疏水性氨基酸上的芳香烴類的側(cè)鏈[17]。其二,精氨酸側(cè)鏈中的胍基能以游離基團(tuán)的形式存在于緩沖體系中,并與蛋白質(zhì)分子表面產(chǎn)生相互作用[21],減弱分子間的作用力。因此,精氨酸可以在不影響蛋白質(zhì)二級(jí)及三級(jí)結(jié)構(gòu)折疊的情況下,減少蛋白質(zhì)與蛋白質(zhì)之間的疏水作用力,從而有效地抑制蛋白質(zhì)之間的聚集[19, 21]。所以,本研究在原緩沖體系中添加了0.5 mol/L 精氨酸,將緩沖體系優(yōu)化為:20 mmol/L Tris,0.5 mol/L KCl,0.5 mol/L 精氨酸鹽酸 pH 8.0,以抑制ABE8e多聚體的形成。
從圖4(c)和圖4(d)的凝膠層析實(shí)驗(yàn)結(jié)果可知,優(yōu)化了緩沖體系后,ABE8e的二聚體比例上升到52.8%,多聚體比例降至18.2%。對(duì)比兩種緩沖體系下凝膠層析譜發(fā)現(xiàn):在保持其它條件不變的情況下,僅在原緩沖體系中添加0.5 mol/L 精氨酸鹽酸后,ABE8e的二聚體比例上升了8.8%,多聚體比例下降了16.0%??梢?,精氨酸能有效地抑制多聚體的形成。
圖4 ABE8e-T及ABE8e緩沖體系優(yōu)化純化實(shí)驗(yàn)結(jié)果
此外,我們還嘗試了僅含有20 mmol/L Tris 0.5 mol/L精氨酸pH 8.0的緩沖體系。在這個(gè)緩沖體系下,負(fù)電荷相對(duì)減少了一定數(shù)目,因而ABE8e的多聚體比例也提升到40.6%,二聚體占比為35.4%。這再次表明,在缺少負(fù)電荷的環(huán)境下,ABE8e不穩(wěn)定,容易形成多聚體。
前期研究表明,ABE8e在提純的過程中發(fā)現(xiàn)了出現(xiàn)多聚體比例偏高的現(xiàn)象。為降低多聚體的比例,提高二聚體的含量,本研究首先探究了多聚體產(chǎn)生的原因。通過研究與分析TadA-8e疏水性氨基酸分布、電荷分布及ABE8e的三維結(jié)構(gòu),推測(cè)ABE8e分子在未形成二聚體的情況下,曝露了二聚化界面中疏水性區(qū)域,這些區(qū)域傾向與分子表面的其它疏水性氨基酸結(jié)合。這種傾向加劇了分子之間的結(jié)合力,從而導(dǎo)致了多聚體的形成。
為了驗(yàn)證理論推測(cè)的正確性,本研究構(gòu)建了可進(jìn)一步阻礙二聚體形成的相應(yīng)突變體ABE8e-T。ABE8e-T的純化結(jié)果證實(shí)了ABE8e多聚體形成的理論推測(cè)。在找到多聚體的成因后,本研究通過優(yōu)化緩沖體系,在緩沖液中添加0.5 mol/L 精氨酸鹽酸后,有效地降低了多聚體的比例。優(yōu)化后的緩沖體系可以為其它堿基編輯器的制備提供了一種新的技術(shù)方案。
在常規(guī)緩沖體系優(yōu)化的過程中,一般通過試錯(cuò)的方式來摸索工藝條件。這樣的方式費(fèi)時(shí)費(fèi)力,效率低下。在本研究中,使用PyMOL建模軟件分析了蛋白質(zhì)的結(jié)構(gòu)信息,可以快速精準(zhǔn)地尋找引起聚集的關(guān)鍵氨基酸。這樣,在確認(rèn)具體原因后再尋找解決方案可以有效地提高了緩沖體系的優(yōu)化效率。不難預(yù)見,當(dāng)其它堿基編輯器遇到類似聚集問題時(shí),也可考慮應(yīng)用相同的方式解決,這為純化制備工藝的開發(fā)提供了有用的思路。
還有,現(xiàn)有的ABE定向進(jìn)化優(yōu)化主要方向是通過增強(qiáng)其與底物DNA 的結(jié)合力來實(shí)現(xiàn)提高編輯活性及降低脫靶效應(yīng)。本文的結(jié)果提示,當(dāng)?shù)鞍踪|(zhì)不易發(fā)生聚集時(shí),將有助于提高蛋白質(zhì)的穩(wěn)定性,增加其編輯活性。所以,本研究的結(jié)果也可以為ABE的定向進(jìn)化優(yōu)化提供了新的方向。