吳志勝 傅高惠 羅文駿 劉俊杰 陳慧芳 白銀山
(佛山科學技術學院 生命科學與工程學院,佛山 528231)
精準高效整合技術是將外源DNA插入到目的細胞基因組特定位置的一種轉基因技術。為了實現(xiàn)精準高效外源DNA整合,基因編輯技術不斷發(fā)展[1]。從第一代組裝復雜的鋅指核酸酶(Zinc finger nuclease,ZFN)技術[2]到第二代脫靶嚴重的轉錄激活因子樣效應物核酸酶(Transcription activatorlike effector nuclease,TALEN) 技 術[3], 再 到 第三代操作簡單的CRISPR/Cas9(Clustered regularly interspaced short palindromic repeats-CRISPR associated system)技術[4],基因編輯技術的效率和精準程度都有了很大的提高[5]。但CRISPR/Cas9的脫靶效應仍是困擾基因編輯安全應用的瓶頸,更精準可靠的靶向整合技術仍是這些技術應用到人醫(yī)臨床和轉基因動物生產(chǎn)的前提[6]。如今通過改造Cas9氨基酸殘基序列(優(yōu)化后的spCas9)[7]、修飾sgRNA五碳糖[8]和sgRNA結構改造(改造后catRNA)等均提高了系統(tǒng)穩(wěn)定性[9];基于CRISPR/Cas9衍生的先導編輯器(Primer Editor,PE)[10]與CRISPR-轉 座 酶 CRISPR-associated Transposase,CAST) 技術[11]及CRISPR家族發(fā)現(xiàn)的新成員Cas12a(Cpf1)蛋白[12],極大提升了該系統(tǒng)的精準靶向和整合效率[7]。此外,雙鏈DNA斷裂修復方式與基因靶向整合效率息息相關[13]。其中同源重組(Homologous recombination,HR)修復只發(fā)生在細胞周期的G2/S期[14],而非同源末端連接(Non-homologous end joining,NHEJ)的修復方式,發(fā)生在整個細胞周期,效率更高[15]。其中基于NHEJ的微同源介導的末端連 接(Microhomology-mediated end joining,MMEJ)、同源非依賴性靶向整合(Homology-independent targeted integration,HITI)和HR介導的末端連接(Homology-mediated end joining,HMEJ)等修復方式在外源DNA整合效率上各有不同,通過干預細胞DNA斷裂的修復方式可以顯著提高外源DNA整合效率[16]。本文將圍繞基因編輯研究進展、引導RNA修飾技術、單堿基整合技術、轉座子技術和外源DNA整合效率等方面對精準靶向和高效整合技術進行綜述,以期促進外源DNA精準整合技術的利用和推廣。
1974年,Jaenisch等[17]把猿猴病毒(SV40)注入小鼠囊胚腔中,得到部分組織含有SV40 DNA的嵌合體小鼠,開啟了外源DNA整合研究的大門(圖1);1984年,Kucherlapati等[18]利用HR技術將外源質粒DNA插入到人的基因組內(nèi),基因敲入的技術問世;2002年,利用FokI Ⅱ型限制性核酸內(nèi)切酶與鋅指蛋白結合,對目的基因組DNA進行識別和切割,開發(fā)出了一種ZFN技術[4],但是ZFN的設計和構建程序太復雜,極大地限制了其應用[19];2011年,在植物病原體黃單胞菌屬中發(fā)現(xiàn)了可以特異性識別核苷酸序列的轉錄因子樣效應蛋白,開發(fā)出TALEN技術[19],由特異性較強的TALE蛋白代替鋅指蛋白,具有相對準確的基因組識別和切割作用,但其存在較高的脫靶效應,難以廣泛應用[20];2012年,Jinek等[21]證實Cas9核酸酶能在小的引導RNA(Small guide RNA,sgRNA)指引下,靶向切割基因組DNA,拉開了CRISPR/Cas9基因編輯技術的序幕。利用該技術使同源染色體DNA雙鏈斷裂(Double strand break,DSB),通過DNA損傷修復機制,實現(xiàn)了特定位點的外源DNA整合和基因敲除[22]。與ZFN和TALEN相比,CRISPR/Cas9系統(tǒng)是通過RNA與DNA的堿基互補配對作用靶向識別的技術,設計簡單、操作容易,并且具有效率高和特異性強的特點[23]。隨后又發(fā)現(xiàn)具有切割黏性末端的CRISPR/Cpf1系統(tǒng)[9],但隨著研究深入發(fā)現(xiàn)這些系統(tǒng)也存在嚴重脫靶效應[24]。為了解決這個問題,CRISPR系統(tǒng)不斷被優(yōu)化和更新,如catRNA技術[9]、PE 技術[10]和 CAST技術[11]的開發(fā)和應用(圖 1),這些技術均促進了外源DNA整合技術的發(fā)展。
圖1 基因編輯技術的發(fā)展歷程
CRISPR家族問世以來,家族成員不斷地被發(fā)現(xiàn),具有RNA切割能力的Ⅱ類VI型核酸酶Cas13[25]和DNA 切割作用Ⅱ類 V 型的 Cas12(Cpf1)[12]廣泛被關注。其中Cpf1蛋白(包括FnCpf1,LbCpf1和AsCpf1)[26],在單鏈向導 RNA(crRNA)引導下與靶DNA特定位點結合并切割,簡化了實驗的設計方案,廣泛應用到動物基因編輯中。Cpf1相比Cas9蛋白要小,更容易操作,能識別5'-TTTN-3'(AsCpf1和 LbCpf1) 和 5'-TTTN-3'(FnCpf1) 兩 種 PAM 序列,切割DNA形成一個有5個核苷酸突出的黏性末端[27],極大地擴充了基因組編輯的范圍,增加HR修復DSB的比例[28]。此外,通過溫度控制還有效地實現(xiàn)了LbCpf1和AsCpf1對斑馬魚胚胎基因組編輯[29]。
張鋒課題組[7](2015)根據(jù)Cas9蛋白與基因結合的結構域特點,將Cas9蛋白的第848(賴氨酸)、1003(賴氨酸)、1060(精氨酸)位替換成非極性的丙氨基酸,增強了蛋白與核酸之間的連接強度,大大減少Cas9的“脫靶”效應,命名為spCas9。
最近研究顯示,對sgRNA組成中的五碳糖修飾[8]或sgRNA結構進行改造[7],也可以增加基因編輯的效率和降低脫靶效應。在sgRNA五碳糖的2號位點引入其它的原子或某種化學基團如戊糖分子[8],可以提高sgRNA穩(wěn)定性,促進基因編輯進行(圖2-A);根據(jù)細胞內(nèi)大量穩(wěn)定存在tRNA現(xiàn)象,開發(fā)出了一種耐RNase的籠狀tRNA樣crRNA(catRNA,圖 2-B)[9],與傳統(tǒng) crRNA 相比,catRNA非常穩(wěn)定,介導外源DNA整合研究中發(fā)現(xiàn)整合效率增加了
圖2 化學修飾RNA和catRNA結構
單堿基編輯技術是基因編輯技術發(fā)展和應用的一項目標,體現(xiàn)了基因編輯的精準性。最早是哈佛大學Broad 研究所科研人員利用CRISPR/Cas9和胞嘧啶脫氨酶(APOBEC)聯(lián)合建立胞嘧啶堿基編輯器(CBE),可實現(xiàn)胞嘧啶向胸腺嘧啶的轉換[30-31]。在此基礎上開發(fā)出Cas9堿基編輯器(hA3A-BE)和Cpf1堿基編輯器(dCpf1-BE),分別在G/C富集區(qū)域、高甲基化區(qū)域和A/T富集區(qū)域內(nèi)開展堿基替換。該研究所于2017年又開發(fā)出腺嘌呤堿基器(ABE),能將A-T堿基對轉換為G-C堿基對,且在人類細胞中的編輯效率高達50%,脫靶效率低,擴展了單堿基編輯的范圍[32]。迄今為止,優(yōu)化的堿基編輯器(包括BE4-G、xCas9、NG-Cas9、A3A-Cas9和AIDCas9等)[33]顯著提高了點突變效率及靶向突變的精確性[34]。
2019年開發(fā)了一種無需雙鏈斷裂或供體DNA,直接搜索和替換基因組堿基的新編輯方法,即PE技術[10],其幾乎可以編輯核酸序列的任何位點,且不需要DSB和供體模板,對于小片段DNA序列插入或單堿基突變,具有明顯的優(yōu)勢,安全性更強。該技術以CRISPR/Cas9系統(tǒng)為基礎,首先在sgRNA的3'末端增加了一段RNA序列,起到模板的作用,可以加入要突變的堿基,這種新的向導RNA(Prime editing extended guide RNA,pegRNA)既能引導Cas9到目標位點進行切割,又含有修復模板序列;其次,Cas9蛋白發(fā)生H840A突變,只能切斷含PAM的靶點DNA鏈,并且與逆轉錄酶M-MLV融合獲得新的PE蛋白。
以插入3個堿基為例(圖3),在pegRNA的引導下,Cas9 H840切口酶切斷含PAM的靶點DNA單鏈,斷裂的靶DNA鏈與pegRNA的3'末端序列互補并結合,在逆轉錄酶作用下開始逆轉錄,pegRNA另一段則是逆轉錄的模板,其上攜帶有目標插入、突變或缺失堿基以實現(xiàn)基因編輯。隨后3' flap結構的DNA鏈攜帶有目標突變,而5' flap結構的DNA鏈則無任何突變。細胞內(nèi)5' flap結構易被結構特異性內(nèi)切酶識別并切除,之后經(jīng)DNA連接酶連接后便實現(xiàn)了精準的小片段DNA整合。
圖3 PE整合技術原理
轉座子是可以在原核和真核生物基因組上進行位置轉換的DNA片段,最初由美國生物學家在玉米中發(fā)現(xiàn)[35]。通過在原始位置上進行剪切或復制,在轉座酶輔助下插入到宿主基因組的其他位置,轉座子發(fā)生位置轉移的過程即為轉座[36]。根據(jù)轉座機制的不同,可以分為逆轉錄轉座子和DNA轉座子[37]。現(xiàn)在應用最廣泛的是PB轉座子,PB轉座子系統(tǒng)顯示在小鼠和人細胞中,能夠高效轉入并穩(wěn)定表達外源基因,具有高效、安全、負載容量大和插入位點為TTAA的特異性特點,但仍然存在整合錯誤和基因毒性的缺點,限制了其廣泛應用[37]。
轉座子與基因編輯技術的結合可以提高外源DNA靶向整合效率,PB轉座子結合ZFN和TELEN技術,實現(xiàn)了外源DNA特定位點的高效整合[37]。目前,PB轉座子和CRISPR/Cas9相結合使用,實現(xiàn)了對人誘導多能干細胞的靶向整合[37]。
2019年,在藍細菌中發(fā)現(xiàn)了一種新型的轉座酶(Tn-7),它的3個亞基(TnsB、TnsC和TniQ),可以和CRISPR效應物(Cas12K)相關聯(lián),形成CRISPR相關轉座酶(CAST)技術[11]。同時,哥倫比亞大學研究團隊在霍亂弧菌中也發(fā)現(xiàn)了Tn7-like轉座子(Tn-6677),由4個亞基(TnsA、TnsB、TnsC和TniQ)組成,聯(lián)合Cas家族蛋白(Cas6、Cas7和Cas8),可以在其基因組識別目標DNA后,TniQ蛋白引導轉座子插入到基因組中的特定位置[38]。目前,已開發(fā)出藍藻菌CAST技術(ShCAST)和魚腥藍菌(AcCAST)兩套系統(tǒng),該技術利用轉座子將目的基因片段高效精準整合到基因組DNA特定位點,而且不依賴DNA斷裂,安全性很高[11]。在大腸桿菌靶位點插入2.5 kb長度的DNA片段,成功率高達80%[11],遠超于以往任何外源DNA整合方法(圖4)。研究還發(fā)現(xiàn)兩臂長度影響外源DNA整合效率:左臂約250 bp,右臂200 bp時,其整合效率較高。這些新技術顯示出了在精準靶向和高效整合上的極大優(yōu)勢,在哺乳動物細胞精準高效外源DNA整合應用中具有巨大潛力。
圖4 CAST轉座子介導的外源DNA整合
HR技術需要在外源DNA兩側各引入一段與整合位點序列相同的類似手臂一樣的結構,稱同源臂,然后與細胞基因組DNA發(fā)生HR,實現(xiàn)外源DNA靶向定點整合。HR發(fā)生效率極低,極大限制了外源DNA整合的研究和應用[19]。結合基因編輯技術,人工地在靶位點附近造成DSB,通過引入人工合成的同源DNA供體模板,可顯著提高重組效率[39-40]。
外源DNA整合效率和DNA斷裂修復方式有[16],DNA斷裂修復方式主要包括HR和NHEJ修復方式[41]。HR需要利用一個完整姐妹染色單體或供體DNA(>400 bp)作為修復模板[16],因此僅發(fā)生在S和G2期。主要通過兩條同源染色體DNA發(fā)生聯(lián)會,其中一條DNA分子發(fā)生雙鏈斷裂,形成的3'端入侵雙鏈DNA并在同源區(qū)配對結合,斷裂缺口封閉后形成中間體,然后完成HR途徑修復[42]。研究顯示CRISPR/Cas9聯(lián)合HR的修復方式,重組率僅有10-5[43],而NHEJ修復途徑可發(fā)生在整個細胞周期,擁有較高的基因修復效率[15,44],相當于HR途徑的1 000倍[45]。但NHEJ修復途徑具有隨機性,使DSB修復時引入了各種類型的插入或缺失,難以達到精確整合目的[46-47]。在DNA修復過程中,NHEJ修復途徑會對HR途徑產(chǎn)生競爭性抑制,使HR效率降低。通過減少NHEJ途徑發(fā)生可以提高HR效率[48]。Gutschner等[49]將 Cas9 蛋白修飾為細胞周期依賴性表達,使Cas9僅在G2/S期表達,HR效率顯著提高。還有學者過表達細胞周期素D1和使用一種微管解聚劑(Nocodazole),使細胞周期處于G2、S和M期的細胞比例增高,HR修復效率提高了近1倍[50],但效率仍然很低,遠不能滿足靶向整合的要求。此外,通過改變同源臂長度也能提高外源DNA整合的效率[51]。
同源臂長度對HR修復效率有顯著的影響,早期使用一系列50-1 049 bp同源臂長度的供體,應用ZFN技術在CHO細胞的目標位點進行切割,發(fā)現(xiàn)同源臂長度為50 bp時,HR效率為0.8%;當同源臂長度增加到1 000 bp以上時,HR效率可達23.15%[51]。研究顯示一系列供體DNA的同源臂長度為150-2 000 bp,利用CRISPR/Cas9技術對靶向位點進行切割,同源臂長度在150 bp時,在人誘導多能干細胞中重組效率僅有0.7%,同源臂長度在300 bp時,重組效率僅有0.22%,同源臂長2 000 bp的時可達到10.4%[50],說明應用較長同源臂能夠提高HR效率。但是在一些物種中,sgRNA的靶向效率很低(如猴胚胎中),導致HR效率仍然很低[44],基于HR途徑的靶向整合依然有很大局限性。相比之下,NHEJ途徑的靶向整合更有應用潛力[52]。
NHEJ途徑在修復DSB中效率高,具有隨機性[53]。根據(jù)NHEJ修復途徑分為兩種,一種為依賴于Ku蛋白的經(jīng)典NHEJ途徑(Canonical-NHEJ,c-NHEJ),另一種為不依賴Ku蛋白的替代NHEJ途徑(Alternative-NHEJ,a-NHEJ)[54]。c-NHEJ的發(fā)生是由異源二聚體Ku70/80分別結合到兩個斷裂的DNA末端,在斷裂處形成套環(huán)結構向內(nèi)移動[55],然后招募DNA依賴蛋白激酶催化亞基與DNA末端結合,最后在聚合酶、核酸酶和DNA連接酶IV的作用下,完成DSB修復[52]。一定程度上NHEJ途徑難以做到精確外源DNA整合。但根據(jù)NHEJ的特點,利用同源重組介導的末端連接(Microhomologymediated end joining,MMEJ)和同源非依賴性靶向 整 合(Homology-independent targeted integration,HITI)修復方式也可以實現(xiàn)外源DNA序列的精準靶向整合,目前已成功將外源DNA序列插入到斑馬魚[56]、鼠[47]和人胚胎干細胞(Human embryonic stem cell,hESC)[57]等。
6.2.1 同源非依賴性靶向整合(HITI)在外源DNA整合中的應用 HITI依賴于c-NHEJ修復途徑[47]。將環(huán)狀DNA供體加入單個sgRNA靶向序列(表1),利用Cas9蛋白同步切割環(huán)狀供體DNA和宿主基因組DNA,將HITI-DNA片段高效插入到DSB的位置,從而成功地將外源DNA整合到細胞中基因組的精確位點上,這個方法可以發(fā)生在非分裂細胞,并且表現(xiàn)出了高效的整合效率。在分裂細胞中的效率比其它方法高10倍以上;體內(nèi)無分裂的神經(jīng)元(眼睛和大腦)靶向外源DNA整合能力是前所未有的[58]。
表1 DNA損傷修復途徑比較
6.2.2 微同源介導的末端連接(MMEJ)介導外源DNA整合 c-NHEJ途徑的核心蛋白因子(如Ku70/80)發(fā)生突變時,細胞不能利用c-NHEJ途徑進行DSB修復,將通過a-NHEJ途徑進行修復。MMEJ是a-NHEJ的一種亞型[59],通過微同源序列(3-30 bp)[16]介導外源DNA 整合(表 1)。此修復方式可以有效地靶向整合大片段外源DNA[60],但只發(fā)生在細胞周期的G1和S期早期[61]。與c-NHEJ途徑相比,其發(fā)生頻率較低,外源DNA整合的效率依然很低。
6.2.3 同源重組介導的末端連接(HMEJ)外源DNA整合 使用800 bp長度的同源臂,并在同源臂兩端加入sgRNA靶向序列,建立了HMEJ系統(tǒng)(表1)[44]。研究將 HR(只有同源臂)、MMEJ(兩端加入sgRNA靶向序列)、NHEJ(兩端加入sgRNA靶向序列)和HMEJ 4種供體DNA片段轉染到ESC、N2a細胞、293T細胞、星形膠質細胞、成體小鼠肝細胞和胚胎(小鼠和猴),結果顯示在ESC和N2a細胞內(nèi),HMEJ供體的HR率遠大于NHEJ和MMEJ供體效率,但與HR途徑相比,未見顯著提高[44];在293T細胞、原代星形膠質細胞、成體肝細胞以及神經(jīng)元中,HMEJ供體比HR、MMEJ和NHEJ供體的同源重組率顯著提高[44]。HMEJ修復機制可能在不同細胞周期同時利用兩種路徑進行修復DSB,在S/G2期,HR路徑介導DSB修復;在G1/S早期,可能是利用MMEJ路徑進行DSB修復。
精準靶向和高效整合技術一直是基因編輯技術的難點,盡管基因編輯技術在基因治療和許多研究領域已取得了不少突破性的進展,但是在臨床應用方面仍然存在很多困難與挑戰(zhàn)。在近期的研究中,我們看到了新型基因編輯技術正在逐漸走向成熟,如基于轉座子的基因編輯技術和單堿基編輯的PE新工具的開發(fā)和應用,在不產(chǎn)生DSB和不需要供體修復模板的條件下,達到高效的外源DNA整合,對于許多點突變造成的遺傳疾病具有很大的應用潛能,同時對人類的疾病治療和轉基因育種呈現(xiàn)了更光明的前景,基因編輯技術一直在不斷創(chuàng)造著不可估量的社會經(jīng)濟價值。