雷建峰,尤揚子,張錦恩,代培紅,于莉,杜正陽,李月,劉曉東?
1 新疆農業(yè)大學農學院/棉花教育部工程研究中心,烏魯木齊 830052;2 新疆農業(yè)大學生命科學學院,烏魯木齊 830052
【研究意義】棉花是我國重要的經濟作物,在生長發(fā)育過程中會受到各種非生物脅迫的影響,其中,干旱和土壤鹽漬化是影響棉花產量和品質下降的重要因素。超表達抗旱耐鹽正調控基因,培育棉花新種質是當前普遍采用的思路和方法[1-3],但是,在棉花體內還存在一些抗旱耐鹽的負調控基因[4-6],獲得這些基因的相應突變體材料是進一步明確基因功能、解析棉花重要農藝性狀形成分子機制的關鍵步驟。CRISPR/Cas基因編輯技術的出現(xiàn)解決了隨機突變盲目性的缺點,為創(chuàng)制棉花突變體、實現(xiàn)棉花的精準遺傳改良提供了重要的技術手段。然而,sgRNA 作為CRISPR 系統(tǒng)關鍵元件之一,在基因組的很多位點上是低效或者無效的[7]。在利用CRISPR 系統(tǒng)獲得棉花突變體之前,必須要對能夠高效敲除靶基因的sgRNA 進行篩選。因此,利用簡單、快捷的技術手段篩選出能高效敲除棉花靶基因的sgRNA,對縮短獲得棉花突變體的周期具有重要意義?!厩叭搜芯窟M展】MADS-box 基因是植物體內一類重要的轉錄調控因子,幾乎參與了植物整個生長發(fā)育的過程。大量研究表明,MADS-box 基因家族眾多成員在植物胚胎細胞分化、配子體和營養(yǎng)組織發(fā)育及果實成熟等過程中起著核心而保守的作用[8]。例如,AGL12調控擬南芥根分生組織的增殖和開花轉化[9]。AGL21在多種環(huán)境和生理信號誘導下調控擬南芥?zhèn)雀陌l(fā)育,并且可以通過響應ABA信號來調控種子萌發(fā)[10-11]。在番茄中,超表達SlMBP9降低了生長素的生物合成和極性運輸,并且負調控番茄側根的形成[12]。馬鈴薯StPOTM1在腋窩分生組織中大量積累,參與調控腋芽的形成[13]。此外,還有研究報道,在擬南芥中,異源超表達柑橘CiMADS43能夠促進轉基因擬南芥早花和卷葉[14]。然而,目前大部分研究都集中在MADS-box 轉錄因子調控植物生長發(fā)育的研究,對于其參與植物逆境脅迫應答反應的研究還相對匱乏。近期,研究發(fā)現(xiàn)Ⅱ型MADS-box 家族成員AGL16(AGAMOUS-LIKE16)轉錄因子與抗旱反應存在非常緊密的關系。AGL16通過調控擬南芥氣孔密度和ABA 含量在響應干旱脅迫的過程中發(fā)揮負調控的作用[15]。此外,AGL16還可以與HsfA6a和MYB102啟動子中的CArG 基序結合,抑制二者的表達,擬南芥agl16突變體表現(xiàn)出良好的耐鹽性[16]。最重要的是AGL16發(fā)生移碼突變后,其突變體在生長發(fā)育上與野生型相比并沒有明顯差異[15],暗示著AGL16突變后并不影響植株的正常生長發(fā)育,可作為作物抗旱耐鹽育種的理想候選基因?!颈狙芯壳腥朦c】目前,關于棉花GhAGL16轉錄因子參與調控干旱和鹽脅迫應答反應的研究還未見報道。在前期工作中,雷建峰課題組利用病毒誘導的基因沉默技術(virus-induced gene silencing,VIGS)在陸地棉中沉默了GhAGL16,沉默植株表現(xiàn)出良好的抗旱性。獲得棉花agl16突變體是進一步明確GhAGL16功能的關鍵步驟,因此,迫切需要利用基因編輯技術創(chuàng)制棉花agl16突變體?!緮M解決的關鍵問題】本研究根據實際克隆的GhAGL16序列,設計了3 個能同時靶向敲除GhAGL16-A 亞組和GhAGL16-D 亞組序列的sgRNAs。利用CLCrV 介導的 VIGE 系統(tǒng)[17]篩選能靶向敲除GhAGL16的sgRNAs,并驗證這些sgRNAs 的特異性,為定向創(chuàng)制棉花agl16突變體奠定堅實的基礎。
試驗于2022—2023 年在新疆農業(yè)大學農業(yè)生物技術重點實驗室進行。所用AtU6-26::sgRNA 載體、棉花葉皺縮病毒載體 CLCrV-A 和 CLCrV-B 及Cas9-OE 棉花材料YZ-1 均由棉花教育部工程研究中心保存。引物合成及測序由上海生工生物科技有限公司完成。
基于在棉花YZ-1 中A 亞組和D 亞組上實際克隆的GhAGL16基因組序列,利用CRISPR-GE[18]在線工具(http://skl.scau.edu.cn/targetdesign/)設計了3 個能同時靶向敲除GhAGL16-A 亞組和D 亞組序列的sgRNAs(表1)。每個sgRNA 在PAM 位點上游都包含了一個酶切位點,便于突變檢測。使用截短的擬南芥AtU6-26 啟動子(330 bp)驅動sgRNA 表達,sgRNA 合成方法及操作流程參照雷建峰等[19]方法,測序驗證3 個AtU6-26::GhAGL16-sgRNAs 表達載體的正確性。將測序正確的AtU6-26::GhAGL16-sgRNAs質粒用SpeⅠ和PacⅠ酶切,回收核心片段與CLCrV-A載體重組。候選的重組質粒經SpeⅠ和PacⅠ酶切鑒定正確后命名為:CLCrV-AtU6-26::GhAGL16-sgRNA1、CLCrV-AtU6-26::GhAGL16-sgRNA2 和CLCrV-AtU6-26::GhAGL16-sgRNA3。最后,將不同靶向敲除棉花GhAGL16的CLCrV-GhAGL16-sgRNAs 終載體轉入農桿菌感受態(tài)GV3101,用于下一步接種轉化試驗。
表1 本研究中使用的引物序列Table 1 Primer sequences used in this study
選取種質飽滿的YZ-1 野生型和Cas9-OE 棉種放入水中,28 ℃浸泡24 h,使其萌發(fā)露白。待發(fā)芽后將其移栽至營養(yǎng)土中(蛭石∶黑土=3∶1),放置培養(yǎng)室(28 ℃,16 h 光/8 h 暗)培養(yǎng)。選取生長14 d 左右的棉花子葉,參照植物多糖多酚RNA 提取試劑盒說明分別提取野生型和Cas9-OE 棉花子葉總RNA,并使用反轉錄試劑盒合成cDNA。以上述cDNA 為模板,棉花GhUBQ7作為內參基因,qPCR 擴增Cas9,引物設計見表1。每個樣品設置3 組技術重復,并根據2-ΔΔCt公式[20]計算Cas9表達量。
將凍存的不同CLCrV-AtU6-26::GhAGL16-sgRNAs和CLCrV-B 農桿菌菌液劃線培養(yǎng),挑取單克隆接種于2 mL LB 培養(yǎng)基(含50 μg·mL-1Kan 和50 μg·mL-1Rif)中活化,28 ℃,200 r/min 培養(yǎng)過夜。分別吸取50—100μL 不同活化菌液接種到10 mL LB(含50 μg·mL-1Kan和50 μg·mL-1Rif)培養(yǎng)基中,28 ℃,200 r/min 大搖,培養(yǎng)菌液濃度OD600至1.6—1.8 左右,4 000 r/min 離心10 min 收集農桿菌培養(yǎng)物。徹底去除液體培養(yǎng)基后,將不同農桿菌培養(yǎng)物重懸于轉化液(10 mmol·L-1MgCl2、10 mmol·L-1MES 和200 μmol·L-1乙酰丁香酮)中,并調整OD600終濃度為1.0 左右。最后,將CLCrV-B與不同的CLCrV-AtU6-26::GhAGL16-sgRNAs 重懸液等比例混合,室溫下靜止3 h 后進行接種轉化試驗。
接種7—10 d 后,分別從接種不同CLCrV-AtU6-26::GhAGL16-sgRNAs 棉花子葉中提取基因組DNA。取接種相同sgRNAs 株系DNA 各1 μL 進行混樣,以野生型棉花和混樣DNA 為模板,使用突變檢測引物(表1)對GhAGL16進行覆蓋靶位點的PCR 擴增。PCR 反應程序為98 ℃ 30 s;98 ℃ 10 s,60 ℃ 30 s,72 ℃ 24 s,35 個循環(huán);72 ℃ 7 min。反應結束后,對覆蓋GhAGL16-sgRNA1、GhAGL16-sgRNA2和GhAGL16-sgRNA3 靶點的PCR 產物回收、純化,用相應的限制性內切酶FspBⅠ、DdeⅠ和XapⅠ進行酶切消化處理。未被消化的PCR 產物進一步回收、純化,與Blunt Zero 平端克隆載體連接、轉化。挑取單克隆進行測序,驗證3 個不同靶點的GhAGL16是否發(fā)生突變,篩選出可有效敲除GhAGL16的sgRNAs。
利用RNAfold WebServer 在線工具對GhAGL16-sgRNAs 的二級結構進行分析。
為了明確GhAGL16編輯效率,對每一個單株進行PCR/RE[21]突變檢測。同時,設計高通量測序檢測引物(表1),利用Hi-TOM 高通量測序檢測GhAGL16突變單株的真實編輯效率。另外,根據設計的GhAGL16-sgRNA2 序列,利用CRISPR-GE 在線工具確定潛在的脫靶位點。每個潛在脫靶序列都包含了3—4 個錯配堿基,利用這些潛在脫靶序列在陸地棉數據庫中(https://www.cottongen.org/)檢索對應基因的基因組序列。設計脫靶率檢測引物(表1),采用Hi-TOM高通量測序檢測脫靶率。
對3 個重組質粒進行酶切鑒定,結果顯示,CLCrV-AtU6-26::GhAGL16-sgRNA1、CLCrV-AtU6-26::GhAGL16-sgRNA2 和CLCrV-AtU6-26::GhAGL16-sgRNA3 經SpeⅠ和PacⅠ酶切消化后,都產生了516 bp(AtU6-26::GhAGL16-sgRNAs 片段)和1 1282 bp(CLCrV-A 片段)2 條帶,酶切結果與預期酶切片段大小相符(圖1),表明不同靶向敲除棉花GhAGL16的CLCrV-AtU6-26::GhAGL16-sgRNAs 均已構建成功。
圖1 CLCrV-AtU6-26::GhAGL16-sgRNAs 表達載體的酶切鑒定Fig. 1 Identification of CLCrV-AtU6-26::GhAGL16-sgRNAs expression vector by enzyme digestion
為驗證Cas9-OE 植株中Cas9的表達水平,以野生型和一些Cas9-OE 植株的cDNA 為模板,qPCR 擴增188 bpCas9片段。結果表明,Cas9在不同Cas9-OE棉株中穩(wěn)定表達(圖2)。選擇所有Cas9穩(wěn)定表達的轉基因株系用于后續(xù)研究。
圖2 qPCR 檢測Cas9 表達量Fig.2 Detection of Cas9 expressions by qPCR
通過PCR/RE方法檢測接種不同CLCrV-AtU6-26::GhAGL16-sgRNAs 的植株GhAGL16在靶位點的突變情況。對于接種CLCrV-AtU6-26::GhAGL16-sgRNA2的植株,PCR 擴增GhAGL16(797 bp),用引導序列上的限制性內切酶DdeⅠ消化PCR 產物。結果顯示,在野生型棉花中,該靶點GhAGL16的PCR 產物被DdeⅠ完全消化,未見擴增產物殘留。而在Cas9-OE 植株中,卻保留了大量原始的PCR 擴增產物(圖3-A)。對未消化的PCR 產物克隆測序,結果顯示,在棉花A亞組和D 亞組上的GhAGL16均出現(xiàn)了不同堿基缺失的突變類型(圖3-B—C)。對于接種CLCrV-AtU6-26::GhAGL16-sgRNA1 和CLCrV-AtU6-26::GhAGL16-sgRNA3 的Cas9-OE 植株,PCR 分別擴增509 和628 bp的GhAGL16片段。PCR 產物用靶位點相應的限制性內切酶FspBⅠ(GhAGL16-sgRNA1)和XapⅠ(GhAGL16-sgRNA3)酶切,沒有條帶殘留(圖略)。以上結果表明,GhAGL16-sgRNA1 和GhAGL16-sgRNA3 是2 個無效sgRNA,而GhAGL16-sgRNA2 可有效用于棉花GhAGL16的靶向敲除。
圖3 CLCrV 介導靶向敲除棉花GhAGL16Fig. 3 CLCrV-mediated targeted knockout of cotton GhAGL16 gene
進一步探究GhAGL16-sgRNA1和GhAGL16-sgRNA3不能實現(xiàn)編輯原因,比較3 個GhAGL16-sgRNAs 的二級結構。結果顯示,3 個sgRNA 除缺失非必須頸環(huán)1外,均具有頸環(huán)2、頸環(huán)3 和頸環(huán)RAR 必須環(huán)狀結構(圖4),并且引導序列與gRNA 序列之間的總堿基對(total base pairs,TBPs)均未大于12 個。其中,GhAGL16-sgRNA1 10 個,GhAGL16-sgRNA2 12 個,GhAGL16-sgRNA3 11 個。3 個sgRNA 連續(xù)堿基對(consecutive base pairs,CBPs)均不超過7 個,無引導序列內部堿基對(internal base pairs,IBPs)。雖然GhAGL16-sgRNA1 和GhAGL16-sgRNA3 的CBPs 數量均未超過上限(7 個),但參考堿基對概率發(fā)現(xiàn)GhAGL16-sgRNA1 和GhAGL16-sgRNA3 可能存在引導序列易與其他位點發(fā)生配對并且不易解鏈的現(xiàn)象,從而干擾了引導序列對目標位點的識別,導致sgRNA無效。
圖4 GhAGL16-sgRNAs 的二級結構分析Fig. 4 Analysis of secondary structure of GhAGL16-sgRNAs
為進一步量化GhAGL16-sgRNA2 對GhAGL16的編輯效率,對每一株接種CLCrV-AtU6-26::GhAGL16-sgRNA2 的Cas9-OE 植株進行突變檢測。PCR/RE 突變檢測結果顯示,在接種的9 株植株中有6 株(#2、#4、#6、#7、#8 和#9)發(fā)生了突變(圖5),編輯效率為66.67%。同時,Hi-TOM 高通量測序分析突變單株中GhAGL16編輯效率,結果顯示,在發(fā)生編輯的6株植株中,有3 株只實現(xiàn)了棉花A 亞組或D 亞組上GhAGL16的靶向編輯。其中,在植株#2 和#7 中僅檢測到A 亞組上的缺失突變,編輯效率分別為12.71%和9.39%;在植株#4 中僅檢測到D 亞組上的缺失突變,編輯效率為3.29%。此外,有3 株(#6、#8 和#9)同時實現(xiàn)了棉花A 亞組或D 亞組上GhAGL16的靶向編輯。其中,植株#6 的編輯效率最高,在A 亞組上編輯效率為20.40%,D 亞組上為34.02%;植株#8 和#9的編輯效率相對較低,在A 亞組上的編輯效率分別為15.21%和8.24%,D 亞組上為13.01%和5.45%(表2)。去除僅在單個亞組實現(xiàn)編輯的植株,經統(tǒng)計,GhAGL16-sgRNA2 對GhAGL16的編輯效率為13.69%—54.42%。
表2 GhAGL16 突變效率分析Table 2 Analysis of mutation efficiency of GhAGL16 gene
雖然GhAGL16-sgRNA2 可實現(xiàn)棉花GhAGL16的定向編輯,但該位點是否存在潛在的脫靶效應需要進一步驗證。通過CRISPR-GE 檢索到4 個在CDS 區(qū)存在潛在脫靶的位點,off-score 值分別為0.583、0.212、0.006 和0(圖6)。Hi-TOM 高通量測序結果顯示,在預測的4個潛在脫靶位點中都沒有出現(xiàn)脫靶現(xiàn)象(表3),說明GhAGL16-sgRNA2 靶向敲除GhAGL16不僅具有高效的基因編輯效率,而且具有專一的基因編輯特異性。
圖6 4 個潛在脫靶位點序列比對分析Fig. 6 Sequence alignment analysis of four potential offtarget sites
表3 潛在脫靶點的檢測與分析Table 3 Detection and analysis of potential off-target sites
利用RNAi(RNA interference)技術[22]可以實現(xiàn)GhAGL16轉錄水平上的RNA 干擾,但可能存在對GhAGL16表達抑制不徹底的現(xiàn)象。因此,利用CRISPR/Cas 基因編輯技術創(chuàng)制棉花agl16突變體是明確GhAGL16功能最有效的途徑。盡管CRISPR 系統(tǒng)的簡易性使其迅速成為首選的基因組編輯工具,但要在棉花中實現(xiàn)靶基因的定向編輯是困難的。植物病毒載體是投送sgRNA 的理想工具,即便大多數植物病毒載體不能承載巨大的Cas9 蛋白,但足以表達短小的sgRNA[23-24]。研究表明,植物病毒介導的基因編輯(VIGE)體系可用于農作物基因的靶向編輯[25-27]。因此,本研究利用前期已建立的CLCrV 介導的VIGE 體系[17,24]篩選能高效敲除GhAGL16的sgRNA。根據在棉花YZ-1 中實際克隆的GhAGL16組序列,確定了3個能同時靶向敲除GhAGL16-A 亞組和GhAGL16-D 亞組序列的 sgRNAs,盡可能地消除不同棉種間GhAGL16靶位點存在SNP 位點,導致sgRNA 不能與靶位點有效結合的可能性。接種相應病毒載體的棉花子葉是sgRNA 表達的起點,因此,本研究提取接種不同GhAGL16-sgRNAs 植株子葉基因組DNA 進行突變檢測。PCR/RE 突變檢測結果顯示,GhAGL16-sgRNA2能夠同時敲除GhAGL16-A 亞組和GhAGL16-D 亞組序列,突變類型主要以堿基缺失為主(圖3)。另外,高通量測序結果顯示,去除僅在單個亞組實現(xiàn)編輯的植株,GhAGL16-sgRNA2 對GhAGL16的編輯效率為13.69%—54.42%,突變類型與PCR/RE 突變檢測結果基本一致(表2),說明GhAGL16-sgRNA2 可有效用于GhAGL16的靶向敲除。研究發(fā)現(xiàn)sgRNA 的二級結構可能會影響sgRNA 與靶位點的結合效率[28]。在本研究中,接種GhAGL16-sgRNA1 和GhAGL16-sgRNA3的植株并未檢測到突變,推測未檢測到編輯事件的原因可能與sgRNA 的二級結構有關。盡管GhAGL16-sgRNA1 和GhAGL16-sgRNA3 的設計符合CBPs和GC含量要求[29],但存在引導序列易與其他序列發(fā)生配對并且不易解鏈的可能,從而干擾了引導序列對靶位點的識別,最終導致sgRNA 無效。
CRISPR/Cas9 系統(tǒng)由20 bp 的sgRNA 通過堿基互補配對來識別靶位點序列,從而介導Cas9 蛋白對DNA 序列的切割,但是20 bp 的sgRNA 與目的基因靶位點結合配對的同時也有可能與基因組其他位點結合,造成脫靶現(xiàn)象[30-31]。已有研究表明,Cas9 蛋白具有一定的容錯性,即便引導序列中存在4—5 個錯配堿基,仍然可以切割與靶位點高度同源的非目標序列[32],這種潛在脫靶問題可能會限制有效sgRNA 在創(chuàng)制各類突變體中的應用。一個高效sgRNA 的標準不僅要有較高的基因編輯效率,而且具有專一的靶基因編輯特異性。因此,本研究繼續(xù)探究了GhAGL16-sgRNA2 對GhAGL16編輯的特異性。結果表明,在預測的4 個潛在脫靶位點上均未檢測到脫靶現(xiàn)象(表3),說明GhAGL16-sgRNA2符合高效sgRNA 的篩選標準,這為進一步精確創(chuàng)制棉花agl16突變體提供了良好的開端。此外,隨著各類測序技術(GUIDE-seq[33]、CIRCLE-seq[34]和CHANGE-seq[35])的發(fā)展,可以高靈敏、高特異、無偏好性地檢測基因編輯的特異性。
本研究雖然利用CLCrV 介導的VIGE 系統(tǒng)篩選獲得一個可高效敲除GhAGL16的sgRNA,但目前無法實現(xiàn)將GhAGL16的突變穩(wěn)定遺傳給下一代。研究報道,成花素FT(flowering locus T)可以將sgRNA 長距離運輸至植物頂端分生組織(shoot apical meristem,SAM)中,實現(xiàn)生殖細胞的編輯,從而獲得可遺傳的基因編輯[36-37]。此外,還有研究表明,大麥條紋花葉病毒(barley stripe mosaic virus,BSMV)是一種可以定植在SAM 組織的植物病毒,未經修飾的sgRNA 接種Cas9-OE小麥后,也能夠實現(xiàn)可遺傳的基因編輯[26]。這些研究為難以遺傳轉化的植物不經過組織培養(yǎng)過程,定向創(chuàng)制突變體提供了新的策略。因此,要想利用VIGE 系統(tǒng)獲得可遺傳的棉花agl16突變體后代,需要對可系統(tǒng)侵染棉花的各類植物病毒進行改造,測試這些病毒是否可以實現(xiàn)SAM 組織中靶基因的編輯。如果該思路可行,可以極大地促進棉花基礎生物學和棉花分子設計育種的研究。
利用CLCrV 介導的VIGE 系統(tǒng)成功篩選獲得1 個能高效敲除GhAGL16的sgRNA。