陳 凱 孫國梁 宋高原 李愛麗 謝傳曉 毛 龍 耿帥鋒
中國農(nóng)業(yè)科學院作物科學研究所, 北京 100081
作為新一代基因組編輯技術, 與 ZFN (Zinc Finger Nucleases)、TALEN (Transcriptional Action Like Effector Nucleases)技術相比, 具有操作簡便、切割效率高、靶位點多等優(yōu)點, 在模式植物和作物中得到廣泛的應用[1]。CRISPR/Cas9系統(tǒng)在 gRNA的引導之下, 將Cas9帶到目的基因上, 利用RuvC和HNH切割DNA雙鏈, 形成雙鏈斷裂結構(Double Strand Break), 然后生物體內(nèi)會在修復DSB過程中引起一些堿基的隨機插入或缺失, 從而產(chǎn)生移碼突變[2-3]。雖然CRISPR/Cas9相對于其他基因編輯技術具有較高的編輯效率, 但對不同物種或同一物種中不同基因的編輯效率卻不相同[4-5]。在擬南芥中, 研究人員以AtFT、AtSPL4、AtBRI1、AtJAZ1、AtADH1、AtFLS2和AtPDS3等為目的基因驗證 CRISPR/Cas9的功能,其切割效率為1.10%~84.78%[6-10]。在煙草、水稻、大豆、西紅柿、高粱、玉米、棉花、小麥和藥用植物丹參中的切割效率分別為 1.8%~87.5%[6,11-13]、2.1%~100.0%[8,14-21]、14.7%~20.2%[22]、83.56%[23]、33.33%[24]、13.1%[25]、47.6%~81.8%[26]、5.6%[27]和 42.3%[28]。
根據(jù)現(xiàn)有文獻報道, 影響 CRISPR/Cas9系統(tǒng)編輯效率的因素, 主要包括Cas9基因密碼子的優(yōu)化、Cas9基因啟動子的替換、gRNA啟動子的替換和gRNA的靶標數(shù)目[29-32]。在擬南芥、煙草、番茄、大豆、水稻和玉米中, 都有優(yōu)化Cas9基因密碼子的報道, 但只有單子葉植物中的優(yōu)化能夠提高編輯效率[29,31]。利用植物內(nèi)源組成型啟動子, 如 ZmUbi、OsUBQ和OsActin1, 啟動Cas9基因, 也能獲得較高的編輯效率[15,30,33]。在單子葉植物中, 利用植物內(nèi)源的U6或者U3啟動子啟動gRNA更有利于基因編輯[31,34]。在擬南芥和玉米中, 串聯(lián) 2個gRNA比單個 gRNA的編輯效率高[31-32]。在水稻中, 分別設計 1、2、3個 gRNA靶向一個基因, 結果表明靶向同一個基因的多個位點時編輯效率提高[35]。另外,CRISPR/Cas9的PAM位點NGG, 也在一定程度上限制了其使用范圍。雖然在哺乳動物細胞中 CRISPR/StCas9可識別NNAGAA PAM位點, CRISPR/SaCas9可識別 NNGGGT、NNGAAT和 NNGAGT PAM 位點[36-37], 但這些CRISPR系統(tǒng)在植物中報道較少。在水稻中, 通過將 SpCas9突變, 可以識別 NGA、NGAG和 NGNG PAM 位點, 但是 CRISPR/Cas9-VQR識別 NGA PAM 位點的切割效率僅為 2.1%~23.4%, 低于原有 CRISPR/Cas9系統(tǒng)[38]。通過優(yōu)化gRNA結構和使用水稻內(nèi)源強啟動子啟動gRNA可以提高CRISPR/Cas9-VQR的切割效率, 但對影響編輯效率的其他因素的改造還未見報道[39]。
本研究通過突變SpCas9編碼氨基酸、使用玉米Ubi啟動子啟動Cas9-VQR蛋白、優(yōu)化SpCas9蛋白、加入核定位信號序列、增加單子葉中保守的 3′ UTR序列、使用水稻U6 啟動子啟動gRNA, 構建了一個能夠識別 NGA PAM 位點, 并進行有效切割的CRISPR/Cas9-VQR基因編輯系統(tǒng), 擴大了CRISPR/Cas9的使用范圍。
水稻(Oryza sativa)材料日本晴(Nipponbare) 由中國農(nóng)業(yè)科學院作物科學研究所吳傳銀老師提供。
DNA 限制性內(nèi)切酶、PCR擴增酶、T4-DNA連接酶、qRT-PCR熒光酶均購自TaKaRa公司; 反轉錄試劑盒 SuperScript III Reverse Transcriptase、RNA 提取試劑TRIzol Reagent均購自Invitrogen公司; 卡那霉素、X-gal、IPTG等購自Simga公司。其他化學試劑如氯仿、異丙醇等購自北京化工公司。實驗中所用到引物均由生工生物工程(上海)股份有限公司合成。
CRISPR/Cas9-VQR質粒由實驗室和北京唯尚立德生物科技有限公司合作構建, 主要利用PCR定點突變技術, 將SpCas9序列進行突變, 進而改變編碼氨基酸, 從而改變CRISPR/Cas9載體識別的PAM位點。同時通過基因合成將哺乳動物里應用的CRISPR/Cas9載體進行植物密碼子優(yōu)化, 并加入核定位序列、增加單子葉中 3′ UTR序列、使用玉米Ubi啟動Cas9-VQR轉錄、水稻U6啟動gRNA轉錄,構建雙元表達載體系統(tǒng)。
以水稻 (Oryza sativa)八氫番茄紅素脫氫酶基因(phytoene desaturase, PDS)為靶基因[27], 根據(jù)靶位點設計的原則, 在OsPDS基因不同外顯子上篩選并設計了4個長度為 23 bp的靶位點序列, 分別命名為 gRNA1、gRNA2、gRNA3 和 gRNA4 (表 1)。
利用 Cas9/VQR-gRNA靶點效率檢測試劑盒(北京唯尚立德生物科技有限公司)檢測 4個 gRNA對靶位點的切割效率。首先, 參考試劑盒分別合成gRNA1、gRNA2、gRNA3 和 gRNA4 引物(表 2); 然后以標準 gRNA模板為模板, 分別通過 PCR擴增gRNA1、gRNA2、gRNA3和gRNA4及試劑盒提供的標準gRNA (S1和S2), 回收純化PCR產(chǎn)物作為DNA模板分別進行體外轉錄, 回收并定量轉錄 gRNA;其次, 通過搭橋PCR的方式, 將gRNA靶位點(包括PAM 序列) 構建到 PCR產(chǎn)物中, 獲得用于酶切的DNA; 最后, 參照試劑盒提供的 Cas9/VQR 酶切體系, 加入 2 μL 10 × Cas9 buffer、1 μL Cas9/VQR 酶、50 ng體外轉錄的 gRNA、50 ng酶切的 DNA、補DEPC H2O至20 μL, 充分混合后, 37℃反應 30 min,然后加入3 μL DNA Loading buffer, 混合后65℃ 5 min, 2%瓊脂糖凝膠電泳檢測分析酶切結果。此外,每次酶切實驗的同時做標準靶位點的gRNA酶切實驗, 以標準靶位點酶切實驗結果作為陽性對照比較活性。通過與2個陽性參照標準S1和S2估算gRNA的活性。根據(jù)SSA活性, 標準S1=3, 標準S2=10, 通過酶切條帶的灰度與標準S1和標準 S2對比, 換算出 gRNA1 (g1)、gRNA2 (g2)、gRNA3 (g3)、gRNA4(g4)的活性(若檢測gRNA酶切條帶的灰度小于標準S1的灰度, 則活性估值小于 3; 若檢測 gRNA酶切條帶的灰度大于標準S1的灰度, 且小于標準S2的灰度則活性估值大于3小于10; 若檢測gRNA酶切條帶的灰度大于標準 S2的灰度, 則活性估值大于 10)。
表1 OsPDS-gRNAs序列Table 1 Sequence of OsPDS-gRNAs
表2 本研究所用引物Table 2 Primers used in this research
依據(jù)4對gRNA體外酶切活性檢測結果, 選取3對分別設計 oligo引物(表 2), 通過正義鏈和反義鏈gRNA的oligo引物的退火反應, 形成oligo二聚體,并插入CRISPR/Cas9-VQR載體, 轉化大腸桿菌, 進而挑選陽性克隆測序, 獲得構建好的 CRISPR/Cas9-VQR-gRNA載體, 參照Hiei等的方法[40], 通過液氮凍融法將 CRISPR/Cas9-VQR-gRNA載體轉入農(nóng)桿菌菌株 EHA105感受態(tài)細胞中, 涂板挑取單克隆并進行鑒定, 將陽性克隆用于水稻轉化。選用日本晴作為轉化受體, 將預培養(yǎng)的水稻愈傷組織與農(nóng)桿菌共培養(yǎng), 并將共培養(yǎng)后的愈傷組織轉移至NB1S1篩選培養(yǎng)基上繼續(xù)培養(yǎng), 獲得轉基因植株。
采用 CTAB 法提取轉化水稻葉片全基因組DNA。通過特異性引物 PCR, 以提取的轉基因材料DNA為模板, 鑒定陽性轉基因植株。引物見表2。
植物體內(nèi)翻譯中對G和C有一定的偏好性, 以水稻為模型, 對野生型SpCas9基因進行密碼子優(yōu)化,優(yōu)化后Cas9中堿基G含量由原來的733個增加到1094個, 堿基C由原來的566個增加到931個, GC總含量由31.56%增長到49.20%, 提高了SpCas9 GC堿基的含量(表3)。
表3 Cas9密碼子優(yōu)化結果Table 3 Result of Cas9 codon optimized
利用生物信息學技術, 通過對水稻和小麥的CDS區(qū)域NGG、NGA、NGC和NGT PAM位點的統(tǒng)計分析, 發(fā)現(xiàn)水稻和小麥中 NGA PAM 位點數(shù)量均多于傳統(tǒng)NGG PAM位點。水稻中NGA PAM位點比NGG位點多出大約330,000個, 約占NGG位點的12.34%。小麥中NGA PAM位點比NGG多出大約1,300,000個位點, 約占NGG位點的24.78%。因此通過改造SpCas9, 使其能夠識別NGA PAM位點, 可以有效增加該基因編輯技術的使用范圍, 尤其是在水稻和小麥中(圖1)。
利用PCR定點突變技術, 將傳統(tǒng)的SpCas9基因序列進行突變, 改變編碼氨基酸: 由 1135位的天冬氨酸(D)突變?yōu)槔i氨酸(V), 由1335位的精氨酸(R)突變?yōu)楣入装彼?Q), 由 1337位的蘇氨酸(T)突變?yōu)榫彼?R), 命名為Cas9-VQR (圖2)。從而使CRISPR/Cas9-VQR的PAM識別位點變?yōu)镹GA。
圖1 水稻和小麥全基因組CDS中PAM位點的數(shù)量Fig. 1 Number of PAM loci in whole genome CDS of rice and wheat
圖2 CRISPR/Cas9-VQR載體Fig. 2 Construction of CRISPR/Cas9-VQR vector
同時, 根據(jù)影響基因編輯效率的因素, 對載體進行修飾, 在 Cas9-VQR序列兩端加上保守的核定位序列, 增加單子葉中保守的 3′UTR序列, 使用玉米 Ubi啟動子啟動 Cas9-VQR蛋白, 優(yōu)化的Cas9-VQR蛋白和使用水稻 U6啟動子表達 gRNA(圖 2)。
為驗證Cas9-VQR的蛋白活性, 我們通過Cas9-VQR蛋白切割標準樣(S1, S2)檢測, 發(fā)現(xiàn)該 Cas9-VQR具有酶切活性, 可以有效地切割標準樣(S1,S2)(圖3), CK1和CK2為未加gRNA的對照。經(jīng)過SSA luciferase檢測活性, 發(fā)現(xiàn)S1和S2的SSA活性分別為3和10。
在水稻PDS基因第3、第6、第8和第13外顯子上, 分別設計gRNA (表1), 然后分別進行體外酶切活性檢測。與對照S1和S2相比, g1、g2、g3、g4靶位點均有活性, 但活性強度有所不同, g1和g2靶位點最好, 基本和陽性對照一致, 而g4靶位點較弱,g3靶位點最差(圖3)。根據(jù)酶切條帶灰度換算gRNA的活性, g1和g2體外酶切活性約為70%, g3體外酶切活性約為5%, g4體外酶切活性約為30% (圖4)。
圖3 體外酶切檢測活性結果Fig. 3 Cas9-VQR enzyme digestion activity in vitro
圖4 OsPDS-gRNA體外活性檢測結果Fig. 4 OsPDS-gRNAs activity in vitro
根據(jù) 4個 gRNA的體外酶切活性, 挑選其中 3個(gRNA1、gRNA2和 gRNA4)插入 CRISPR/Cas9-VQR載體, 轉化水稻。獲得OsPDS-gRNA1表達載體轉化再生植株 24個, 其中 17株陽性植株, 約占70.8%; 獲得 OsPDS-gRNA2表達載體再生植株 45個, 其中陽性植株為 40株, 約占 88.89%; 獲得 53株 OsPDS-gRNA4水稻再生植株, 其中陽性植株為49株, 約占92.45%。
由于OsPDS基因為劑量基因, 所以突變植株因突變發(fā)生時期不同而表現(xiàn)不同的表型。若Cas9-VQR切割OsPDS基因是在早期第一個胚胎細胞發(fā)育還沒分化之前, 就會產(chǎn)生純合白化苗(圖 5-A)。若Cas9-VQR切割OsPDS基因是在分化后的細胞中,則會產(chǎn)生綠色和白色相間表型, 該表型在葉片、葉鞘和穗部都會出現(xiàn)(圖5-B, C)。
通過對不同的靶位點區(qū)域片段的測序, 發(fā)現(xiàn)OsPDS-gRNA1產(chǎn)生缺失-28 bp到插入+19 bp等不同類型的突變, 共檢測到 12株突變植株, 突變效率為 70.59%, 其中 4株為純合突變, 約占 33.33%;OsPDS-gRNA2產(chǎn)生缺失-11 bp到插入+10 bp等不同類型的突變, 共檢測到11株突變植株, 突變效率為27.5%, 其中純合突變植株為5株, 約占45.45%;OsPDS-gRNA4產(chǎn)生缺失-13 bp到插入+9 bp等多種類型的突變, 共檢測到 20株突變植株, 突變效率為40.8%, 其中7株為純合植株, 約占35% (圖6和表5)。
傳統(tǒng)的 CRISPR/Cas9系統(tǒng)雖然應用廣泛, 但受NGG PAM位點的限制。CRISPR/Cas9-VQR能夠識別NGA PAM位點, 并進行有效切割, 極大地擴大了CRISPR/Cas9系統(tǒng)的使用范圍。本研究通過突變Cas9序列和修飾基因編輯載體, 獲得了一個能夠識別 NGA PAM 位點, 并有效切割靶基因的基因編輯系統(tǒng), 為該編輯系統(tǒng)在 NGA PAM 位點較多作物中的應用提供了借鑒。
圖5 表型觀察Fig. 5 Phenotype observation
圖6 靶位點突變類型Fig. 6 Target site mutation
表5 轉基因植株突變體數(shù)量統(tǒng)計Table 5 Number of mutants among transgenic plants
在哺乳動物細胞中, 雖然有 CRISPR/StCas9識別NNAGAA PAM位點及CRISPR/SaCas9識別NNGGGT、NNGAAT和NNGAGT PAM位點的報道[36-37], 但在植物中卻較少。在水稻中, 通過突變SpCas9改造的CRISPR/Cas9-VQR, 其切割效率約為2.1%~23.4%, 相對較低[38]。通過優(yōu)化CRISPR/Cas9-VQR的gRNA結構和使用內(nèi)源強啟動子啟動gRNA,提高了 CRISPR/Cas9-VQR的切割效率[39], 但并未考慮影響編輯效率的其他影響因素。本研究除了對Cas9蛋白進行改造, 還對影響編輯效率的因素進行修飾, 獲得了一個能夠識別NGA PAM位點, 并進行有效切割的基因編輯系統(tǒng)。
傳統(tǒng)的CRISPR/Cas9系統(tǒng)在水稻的切割突變效率為2.1%~100.0%[8,14-21], 突變效率變化較大。其中使用玉米Ubi作為SpCas9的啟動子, 其突變效率為4%~100%[19,21], 而使用 35S作為啟動子, 目的基因的突變效率為2.1%~75.0%[8,14-18,20], 相對較低。針對相同基因, 例如OsSWEET11/14, 使用玉米Ubi作為啟動子, 突變效率為 87%~100%, 平均突變效率為93.5%[19], 而使用 35S啟動子, 突變效率為66.67%[24]。這可能是由于35S啟動子在單子葉植物中容易被甲基化修飾[41], 從而影響SpCas9的轉錄水平。本實驗中使用玉米Ubi作為SpCas9-VQR的啟動子, 雖然獲得46.23%的平均突變效率, 但玉米Ubi啟動子的作用還需設置相應的對照進行深入研究。
另外, 我們在載體構建中的修飾, 如對 Cas9-VQR進行密碼子優(yōu)化、增加單子葉植物中保守的 3′UTR 序列和使用 OsU6 啟動子啟動 gRNA轉錄,都會對系統(tǒng)的編輯效率產(chǎn)生影響, 我們將進一步研究這些修飾對編輯效率的影響。
建立了有效識別 NGA PAM 位點的 CRISPR/Cas9-VQR編輯系統(tǒng), 并擴大了其使用范圍, 為后期在水稻等高NGA PAM位點作物中的應用提供了參考。