李樹磊,徐妙云,鄭紅艷,王磊
中國農(nóng)業(yè)科學(xué)院生物技術(shù)研究所,北京100081
傳統(tǒng)育種中利用的遺傳變異主要來自于自然突變、物理或化學(xué)誘變,存在變異發(fā)生率低、周期長、位點不可控等缺點。成簇規(guī)律間隔短回文重復(fù)序列(clustered regularly interspaced short palindromic repeats/CRISPR-associated proteins,CRISPR/Cas)系統(tǒng)作為第三代基因編輯技術(shù),由單鏈引導(dǎo)RNA(single-guide RNA,sgRNA)與切割靶序列的Cas內(nèi)切核酸酶組成,其主要依賴sgRNA引導(dǎo)核酸內(nèi)切酶在目標基因組位置產(chǎn)生雙鏈斷裂(double-strand break,DSB)[1],而DSB可通過非同源末端連接(non-homologous end joining,NHEJ)或同源重組(homology recombination,HR)2種方式進行修復(fù),修復(fù)過程中會引起靶標位置核苷酸序列的缺失、插入或替換,從而實現(xiàn)基因編輯。
為滿足不同的編輯目的,研究人員以CRISPR/Cas系統(tǒng)為基礎(chǔ),通過融合表達Cas9突變蛋白、胞嘧啶脫氨酶或人工進化的腺嘌呤脫氨酶,開發(fā)出能夠?qū)Π形稽c進行精準單堿基編輯的系統(tǒng)。該系統(tǒng)在不引起DNA雙鏈斷裂的情況下,實現(xiàn)胞嘧啶(cytosine,C)轉(zhuǎn)化胸腺嘧啶(thymine,T)/鳥嘌呤(guanine,G)轉(zhuǎn)化腺嘌呤(adenine,A)的替換,且通過不斷改進可明顯提高單堿基編輯效率,減少插入、刪除(insertion and deletion,indel)和非預(yù)期突變[2?3]。該系統(tǒng)已成功在小麥(Triticum aesti?vum)[4]、水稻(Oryza sativa)[5]、棉花(Gossypium)[6]、玉米(Zea mays)[7]等物種上實現(xiàn)安全高效的單堿基替換編輯。但目前該系統(tǒng)僅利用nCas9蛋白突變體(Cas9 nicknase,nCas9)或dCas9蛋白突變體(deactivated Cas9,dCas9)作為效應(yīng)蛋白,所識別的PAM序列為鳥嘌呤/胞嘧啶富集區(qū)。因此,利用現(xiàn)有的堿基編輯系統(tǒng)無法在腺嘌呤胸腺嘧啶富集區(qū)域進行高效的編輯操作。
Cpf1(CRISPR from prevotella and francisella 1)也被稱為Cas12a,其與Cas9同屬于Class2蛋白家族,雖然特征相似但仍存在差異:①Cas9需要CRISPR衍生的RNA(CRISPR derived RNA,crRNA)與反式激活RNA(trans-activating RNA,tracrRNA)靶向DNA,而Cpf1僅需crRNA作為向?qū)?,且Cpf1具有加工crRNA的能力[8];②Cas9及其直系同源蛋白在靶位點3′端識別富含G的PAM(5′-NGG-3′),而Cpf1以及其直系同源蛋白在靶位點的5′端識別富含T的PAM[5′-(T)TTN-3′];③Cpf1僅具有保守的RuvC核酸酶結(jié)構(gòu)域,而Cas9具有HNH結(jié)構(gòu)域與RuvC結(jié)構(gòu)域[9];④Cpf1在目標DNA中產(chǎn)生交錯的末端斷裂[10],而Cas9介導(dǎo)的雙鏈斷裂切口為平末端[11];⑤CRISPR/Cpf1系統(tǒng)的脫靶效率低于CRISPR/Cas9系統(tǒng)[12?13]。其中來自弗朗西斯菌屬的Francisella novicida的FnCpf1最早用于研究Cpf1蛋白的作用機理,其識別的PAM位點為5′-TTN-3′,在哺乳動物中編輯效率低于來自毛螺科菌(Lachnospiraceae bacterium)的LbCpf1與來自氨基酸球菌屬(Acidaminococcussp.)的AsCpf1[10],但在植物中的應(yīng)用鮮有報道。
為拓展單堿基編輯的識別范圍以及FnCpf1的應(yīng)用,本研究對比LbCpf1與AsCpf1的突變體氨基酸序列確定突變位點,以單子葉植物為參考進行密碼子優(yōu)化創(chuàng)制dFnCpf1突變體,構(gòu)建基于CRISPR/dFnCpf1的新型單堿基編輯器(pB-dFnCpf1-CBE)。通過玉米原生質(zhì)體轉(zhuǎn)化手段導(dǎo)入植物細胞內(nèi)部,并檢測其編輯效率,以期為單堿基編輯技術(shù)在植物中的應(yīng)用提供一定參考。
1.1.1 植物材料玉米自交系B73由本研究所提供,參考基因組序列來自Zm-B73-REFERENCEGRAMENE-4.0數(shù)據(jù)庫。
1.1.2 菌株與載體Top10大腸桿菌感受態(tài)(Escherichia coli)、PB-nCas9-PBE載體由中國科學(xué)院高彩霞研究員實驗室饋贈(Addgene plasmid #98160)[7];pRTL2-GFP載體為本實驗室保存;pUC57-dFnCpf1及pUC57-OsU6-crRNA-polyT載體由深圳華大基因股份有限公司合成。
1.1.3 實驗試劑離析酶(R-10)、纖維素酶(RS,YAKULT,Japan);AflⅡ、MluⅠ、HindⅢ和BglⅡ(NEB,America);無縫克隆試劑盒One Step Cloning Kit、高保真DNA聚合酶2×Phanta Max Master Mix(諾唯贊,中國);氯化鈣(CaCl2)、氯化鎂(MgCl2)、氯化鈉(NaCl)、MES、甘露醇、牛血清蛋白(bovine serum albumin,BSA)、氯化鉀(KCl)、氫氧化鉀(KOH)和PEG4000(Sigma-aldrich,America);T4連接酶(Promega,美國);無內(nèi)毒素質(zhì)粒小提中量試劑盒[天根生化(北京)科技有限公司];膠回收試劑盒Gel Extraction Kit(Omega,美國);平末端克隆載體試劑盒pEASY?-Blunt Cloning Kit(北京全式金生物技術(shù)有限公司);Sanger測序(北京擎科生物科技有限公司);引物或片段合成(深圳華大基因股份有限公司)。
1.1.4 實驗儀器全自動熒光倒置顯微鏡(EVOS FL Auto,美國賽默飛世爾科技公司);臺式低溫離心機(Biofuge Stratos,美國賽默飛世爾科技公司);PCR擴增儀(K960,上海楚柏實驗室設(shè)備有限公司);電泳儀(BG-power300,北京永恒生物器材公司)。
1.2.1 dFnCpf1-CBE-BT2載體構(gòu)建以PB-nCas9-PBE載體為骨架,利用限制性內(nèi)切酶AflⅡ和MluⅠ切除nCas9,以pUC57-dFnCpf1載體為模板PCR擴增已合成的dFnCpf1序列,回收酶切載體以及PCR產(chǎn)物,通過同源重組酶連入線性化的PB-nCas9-PBE載體,構(gòu)建dFnCpf1-PBE載體,并用HindⅢ酶切掉其OsU3-sgRNA-scaffold表達框。選擇OsU6啟動子,mature-crRNA序列,合成OsU6-crRNA-polyT表達框并放入pUC57-simple載體,設(shè)計包含BT2基因靶序列及同源臂的引物,以O(shè)sU6-crRNA-polyT載體為模板進行擴增,通過同源重組酶連入經(jīng)限制性內(nèi)切酶HindⅢ線性化的dFnCpf1-PBE載體,構(gòu)建為Ubi-rAPOBEC1-dFncpf1-OsU6-crRNA-bt2載體,并命名為dFnCpf1-CBE-BT2。特異性引物詳見表1。
PCR體系(50 μL):2×Phanta Master Mix 25 μL,模板1 μL,正、反向引物(10 μmol·L?1)各2 μL,Nuclease-free H2O 20 μL。反應(yīng)程序:95℃預(yù)變性5 min;95℃變性15 s,60℃退火15 s,72℃延伸(dFnCpf1 4 min;OsU6-crRNA表達框20 s),擴增35個循環(huán);72℃終延伸5 min。
酶切體系(50 μL):限制性內(nèi)切酶2 μL,模板5 μg,CutSmart Buffer 5 μL,Nuclease-free H2O補至體系為50 μL。37℃孵育2.5 h至酶解完全。
1.2.2 玉米原生質(zhì)體制備及轉(zhuǎn)化準備30株避光土培13 d的玉米黃花苗,取第二葉中間較嫩部分并切至1~2 mm絲狀。將其浸泡于20 mL酶解液(1%纖維素酶R-10,0.2 %離析酶R-10,0.4 mol·L?1D-甘露醇,20 mmol·L?1KCl,20 mmol·L?1MES,10 mmol·L?1CaCl2,0.1% BSA)中,黑暗中室溫震蕩(40 r·min?1)酶解4~6 h。使用350目尼龍膜過濾酶解產(chǎn)物并置于50 mL離心管,4℃,100 g·min?1離心3 min后棄上清。使用預(yù)冷W5 Buffer[2 mmol·L?1MES(pH 5.7),154 mmol·L?1NaCl,125 mmol·L?1CaCl2,5 mmol·L?1KCl]重懸沉淀,洗滌沉淀1次。離心后棄上清,再次加入W5溶液,冰上靜置30 min。棄上清,加入適量MMG buffer[4 mmol·L?1MES(pH 5.7),0.4 mmol·L?1D-甘露醇,15 mmol·L?1MgCl2]使原生質(zhì)體濃度達到2×107個·mL?1。
將100 μg目的載體與5 μg對照載體加入1 mL原生質(zhì)體MMG懸浮液中,混勻后冰置10 min。加入1 mL預(yù)制PEG-Ca2+溶液(40% PEG-4000,200 mmol·L?1D-甘露醇,100 mmol·L?1CaCl2)混勻,室溫避光放置15 min。加入2倍體積W5 buffer,清洗2次后加入20 mL W5 Buffer。最后將原生質(zhì)體培養(yǎng)液置入細胞培養(yǎng)皿(1% BSA孵育0.5 h),避光28℃培養(yǎng)12~16 h。
1.2.3 靶基因編輯結(jié)果初篩在470 nm激發(fā)光、
525 nm發(fā)射光條件下,使用全自動熒光倒置顯微鏡,觀察原生質(zhì)體中綠色熒光信號的表達情況,初步判定轉(zhuǎn)化效率。采用CTAB法提取轉(zhuǎn)化原生質(zhì)體基因組DNA,使用2×Phanta Max Master Mix高保真DNA聚合酶,通過兩種改良的聚合酶鏈式反應(yīng)-限制性核酸內(nèi)切酶(polymerase chain reaction/restriction endonuclease,PCR/RE)方法對編輯位點進行檢測:①擴增靶位點序列后,使用BglⅡ內(nèi)切酶酶切擴增產(chǎn)物,判斷編輯情況;②BglⅡ內(nèi)切酶酶切基因組DNA富集已編輯序列。以酶切產(chǎn)物為模板,巢式PCR特異擴增目的序列并進行Sanger測序檢測編輯情況。其中巢式PCR反應(yīng)體系及反應(yīng)程序、基因組DNA酶切體系均與1.2.1中一致,第二輪擴增的反應(yīng)體系中模板為1 μL第一輪PCR產(chǎn)物。
經(jīng)上述步驟①或步驟②檢測,發(fā)現(xiàn)編輯現(xiàn)象后,以②中巢式PCR產(chǎn)物為模板進行TA克隆檢測。按照pEASY?-Blunt Cloning Kit(北京全式金生物)實驗步驟轉(zhuǎn)化載體至大腸桿菌感受態(tài)細胞中。挑選20個白色單克隆,進行Sanger測序,分析編輯情況。
1.2.4 靶基因編輯結(jié)果二代測序檢測經(jīng)過初步鑒定后,以原生質(zhì)體基因組DNA為模板,巢式PCR特異擴增靶位點序列,巢式PCR反應(yīng)體系及反應(yīng)程序與1.2.3中一致。將擴增產(chǎn)物送深圳華大基因股份有限公司構(gòu)建測序文庫,文庫質(zhì)控合格后由該公司BGI基于自主平臺DNBSEQTM測序技術(shù)進行文庫測序,并采用Soapnuke軟件過濾數(shù)據(jù),去除接頭污染和低質(zhì)量reads。將高質(zhì)量clean data根據(jù)以下標準使用Python語言進行數(shù)據(jù)可視化分析:①reads數(shù)超過1 000且質(zhì)量≥5;②相同變化的reads超過1 000條則判定為一種突變類型;③位點編輯效率=(編輯位點reads數(shù)/總reads數(shù))×100%;④基因插入缺失頻率=(該片段發(fā)生indel的reads數(shù)/該片段樣品中找到完整編輯區(qū)域的reads數(shù))×100%。
1.2.5 脫靶效率分析根據(jù)已設(shè)計靶位點序列,使 用CRISPR RGEN Tools網(wǎng)站(http://www.rgenome.net/cas-designer/)進行脫靶位點預(yù)測,設(shè)置Mismatch number為5,并選擇打分較高的3個靶位點。根據(jù)篩選結(jié)果從Zm-B73-REFERENCEGRAMENE-4.0數(shù)據(jù)庫查詢基因序列,設(shè)計特異引物并以原生質(zhì)體瞬時轉(zhuǎn)化基因組DNA為模板擴增,Sanger測序鑒定編輯情況,其中PCR反應(yīng)體系及反應(yīng)程序與1.2.1中一致。
表1 引物名稱及序列Table 1 Primers name and sequence
FnCpf1、LbCpf1與AsCpf1為來自不同菌株的Cpf1效應(yīng)蛋白,根據(jù)文獻[14]創(chuàng)建dFnCpf1蛋白突變體,獲 得AsCpf1、dAsCpf1、LbCpf1、dLbCpf1及FnCpf1氨基酸序列,通過序列比對確定dFnCpf1的突變位點,即D917A、E1006A、D1227A(圖1)。根據(jù)單子葉植物基因組密碼子特點,對其進行優(yōu)化,創(chuàng)制可在玉米中外源表達的dFnCpf1序列,并放入pUC57中間載體。
為獲得靶位點信息,通過CRISPR RGEN Tools網(wǎng)站(http://www.rgenome.net/cas-designer/)進行靶位點分析,在BT2基因序列的第二外顯子區(qū)域上挑選打分相對較高、且富含C·G堿基的序列作為CRISPR的靶點。如圖2所示,以相關(guān)文獻[7]中PB-nCas9-PBE為載體骨架,替換nCas9序列為dFnCpf1序 列,替換OsU3-sgRNA-scaffold表 達 框為OsU6-crRNA表達框(圖2A),并連入靶序列,最終得到靶向玉米內(nèi)源基因BT2的胞嘧啶單堿基編輯雙元載體,命名為dFnCpf1-CBE-BT2(圖2B)。
圖2 靶位點表達元件以及dFnCpf1-CBE-BT2載體結(jié)構(gòu)Fig.2 Target site expression elements and dFnCpf1-CBE-BT2 vector structure
為初步鑒定dFnCpf1-CBE-BT2載體的編輯能力,將dFnCpf1-CBE-BT2載體轉(zhuǎn)化至玉米葉片原生質(zhì)體中,轉(zhuǎn)染14 h后收集原生質(zhì)體,提取基因組DNA,并通過PCR/RE手段對編輯情況進行初步鑒定。使用限制性內(nèi)切酶BglⅡ消解未發(fā)生編輯的靶位點序列,對已編輯的片段進行富集,然后對基因組DNA的靶位點區(qū)域進行特異PCR擴增并將其連接至pEASY?-Blunt Cloning Vector,將重組子轉(zhuǎn)化至大腸桿菌感受態(tài)細胞中進行藍白斑篩選。隨機挑選20個陽性單克隆并測序,結(jié)果發(fā)現(xiàn)靶位點序列存在3種不同突變類型,主要發(fā)生于靶位點5′端8~12 bp的編輯框內(nèi),其中單菌落堿基變化類型5個為G→T,5個為C→A,2個為C→A與G→T,剩余8個未發(fā)生編輯(圖3),說明該載體對靶位點具有一定編輯能力。
圖3 藍白斑篩選鑒定結(jié)果Fig.3 The results of blue-white screening
為進一步分析編輯類型及編輯效率,使用靶序列特異PCR擴增產(chǎn)物進行建庫測序,共拼接出6 903 954條質(zhì)量合格的reads,其中6 469 637條reads定位于靶序列。超過1 000條reads發(fā)生相同變化,則被判定為1種突變類型,以此標準將數(shù)據(jù)分類匯總后制成熱圖(圖4A),其中占比最多的突變類型為胞嘧啶堿基顛換為腺嘌呤堿基(C→A),共151 594條reads,位于靶位點5′端第11個堿基。根據(jù)位點編輯效率=(編輯位點reads數(shù)/總reads數(shù))×100%,顯示該位點的編輯效率為2.5%。為分析dFnCpf1介導(dǎo)單堿基編輯系統(tǒng)的編輯偏好位點,將各堿基的變化情況及對應(yīng)編輯效率匯總(圖4B),發(fā)現(xiàn)除了C→A外,位點編輯效率相對較高的為G→T(0.9%)、G→C(0.3%)以及C→G(0.2%),分別發(fā)生于靶位點5′端第8、23、24個堿基。本研究中所用單堿基編輯載體主要作用為產(chǎn)生胞嘧啶到胸腺嘧啶的改變,因此對靶序列中胞嘧啶變化的種類進行了統(tǒng)計(圖4C)。結(jié)果發(fā)現(xiàn)靶位點5′末端出現(xiàn)胞嘧啶轉(zhuǎn)換為胸腺嘧啶(C→T),位點的編輯效率為0.1%(圖4B),位于靶序列5′端第11個堿基也出現(xiàn)C→T現(xiàn)象,但該點發(fā)生變化的reads數(shù)僅為1 073個,位點編輯效率<0.02%,說明dFnCpf1-CBE-BT2單堿基編輯載體盡管對胞嘧啶具有一定的編輯作用,但編輯效率較低。
圖4 擴增片段二代測序分析結(jié)果Fig.4 Second-generation sequencing analysis results of amplified fragments
為分析dFnCpf1-CBE-BT2編輯載體是否存在脫靶情況,根據(jù)靶位點序列,通過CRISPR RGEN Tools進行脫靶預(yù)測,錯配堿基上限設(shè)置為5個堿基,選擇3個排名靠前的靶序列(表2),分別命名為R2-OT-A、R2-OT-B、R2-OT-C。根據(jù)脫靶序列設(shè)計特異引物并PCR擴增pH-dFnCpf1-CBE-R2轉(zhuǎn)化原生質(zhì)體基因組DNA,Sanger測序結(jié)果顯示未發(fā)現(xiàn)堿基突變(圖5),說明dFnCpf1-CBE-BT2編輯載體不存在脫靶情況。
很多優(yōu)異的農(nóng)藝性狀改良均源于少量堿基或單個堿基的突變[15?16],而作物中常規(guī)堿基突變的修復(fù)手段主要依靠CRISPR/Cas介導(dǎo)的HDR修復(fù)[17?18],但其設(shè)計復(fù)雜且重組效率較低。以CRISPR/Cas系統(tǒng)為基礎(chǔ)衍生出來的單堿基編輯技術(shù)解決了這一問題,該技術(shù)在不切斷DNA雙鏈的情況下可實現(xiàn)單核苷酸的定向突變,且該技術(shù)不破壞基因組或產(chǎn)生大量的indel變異[19]。目前單堿基編輯系統(tǒng)多以Cas9作為效應(yīng)蛋白行使功能,其僅能識別富含鳥嘌呤/胞嘧啶的靶序列。Cpf1與Cas9同屬于Class2蛋白家族,識別位點為富含腺嘌呤/胸腺嘧啶富集區(qū)。Li等[14]利用dAsCpf1與dLbCpf1突變蛋白構(gòu)建胞嘧啶單堿基編輯器(cytosine base editors,CBE),在哺乳動物細胞中實現(xiàn)了高效單堿基編輯。本研究采用識別PAM位點為“TTN”的FnCpf1突變蛋白及胞嘧啶脫氨酶構(gòu)建單堿基編輯器,可在玉米原生質(zhì)體中實現(xiàn)單堿基編輯,但主要編輯類型為C→A,預(yù)期變化類型C→T的位點編輯效率僅為0.1%。胞嘧啶單堿基編輯器的功能是將靶位點編輯窗口中的胞嘧啶脫氨轉(zhuǎn)化為尿嘧啶,而尿嘧啶與胸腺嘧啶的堿基配對方法一致,因此在DNA修復(fù)和復(fù)制的過程中,產(chǎn)生C?G到T?A的堿基轉(zhuǎn)變[2]。有研究表明,細胞內(nèi)部的尿嘧啶糖基化酶(uracil-DNA glycosylase,UNG)會切除U變成無嘌呤無嘧啶狀態(tài)(apurinic/apyrimidinic,AP),隨后被未知修復(fù)機制修復(fù)產(chǎn)生A[20]。本研究中非預(yù)期突變出現(xiàn)的原因可能是因為dFnCpf1蛋白融合表達后影響了UGI的正常功能,使其無法抑制UNG的活性,但該推測需要進一步試驗驗證。
表2 R2脫靶位點預(yù)測Table 2 R2 off-target site prediction
圖5 脫靶位點測序結(jié)果比對Fig.5 Sequencing results comparison of off-target sites
相較于AsCpf1與LbCpf1,F(xiàn)nCpf1在哺乳動物[9]與植物[21-22]中敲除能力較弱,與以往研究相符,本研究中dFnCpf1介導(dǎo)的單堿基編輯系統(tǒng)編輯效率也較低,這可能與FnCpf1蛋白特性相關(guān)。此外,有研究表明,AsCpf1與LbCpf1的編輯窗口主要為靶序列5′端8~13個堿基,該區(qū)間發(fā)生編輯的效率為10%~30%[14],在本研究中,主要突變類型C→A(效率為2.5%)發(fā)生在靶位點5′端第11個堿基,與前人報道的編輯窗口相符,其余突變類型均發(fā)生于該窗口外。因FnCpf1在植物中的應(yīng)用報道較少,僅在煙草[23]、水稻[24]與玉米[21]中驗證FnCpf1對植物內(nèi)源基因的敲除能力,因此,對于dFnCpf1在植物中的編輯能力及編輯特性還需進一步研究。
本研究僅選擇BT2基因作為靶基因,而不同的sgRNA會影響編輯結(jié)果,且本研究僅使用原生質(zhì)體作為受體進行轉(zhuǎn)化。因此,為探究dFnCpf1介導(dǎo)的CBE系統(tǒng)在植物中的編輯能力以及編輯效率,在后續(xù)研究中還需要選擇多種作物的多個基因作為靶基因設(shè)計靶序列,通過穩(wěn)定轉(zhuǎn)化方式創(chuàng)制基因編輯材料并進行突變位點檢測。
綜上所述,本研究構(gòu)建了基于dFnCpf1的新型胞嘧啶堿基編輯系統(tǒng),可為后續(xù)單堿基編輯在作物上的研究提供思路,具有一定的理論和應(yīng)用價值。