趙靖悅,龔林,雷娜娜,陳由強,何文錦
(福建師范大學生命科學學院海洋生物醫(yī)藥與制品產(chǎn)業(yè)化開發(fā)技術公共服務平臺;福建師范大學南方海洋研究院福建省微藻種質改良工程技術研究中心,福建 福州 350117)
光對于絕大多數(shù)生物體來說都是一個很重要的環(huán)境因素。一方面,光能驅動植物和藻類的光合作用,另一方面生物體的光形態(tài)建成過程中,通過光受體感知光,誘發(fā)下游信號轉導級聯(lián)反應。隱花色素(Cryptochrome)是目前已經(jīng)明確的藍光受體之一[1]。
隱花色素是第一個在擬南芥(Arabidopsis thaliana )中被鑒別出的黃素蛋白藍光受體,在生長和發(fā)育中起著重要作用[2-4]。隱花色素/光裂解酶家族一般具有2個功能區(qū),即氨基端高度保守的光裂解酶同源區(qū)域(PHR)和長度、序列各異的羧基端(CCT)[5,6]。隱花色素在植物中主要作為藍光和近紫外光的受體,參與光形態(tài)的建成、抑制下胚軸的伸長,促進子葉擴張,調節(jié)開花時間,調節(jié)氣孔開放,參與生物鐘的調控,感知磁場,甚至是細胞凋亡,等等[7]。
三角褐指藻是一類廣溫廣鹽性的浮游硅藻,作為羽紋綱硅藻的代表物種,是一種重要的餌料藻。三角褐指藻的全基因組測序已經(jīng)完成[8]。目前三角褐指藻隱花色素光解酶家族中僅對CPF1和CryP有所研究。三角褐指藻CPF1表現(xiàn)出6-4光產(chǎn)物修復活性,并且在異源哺乳動物細胞中可作為生物鐘的轉錄抑制因子,且在藍光調節(jié)中起著重要作用[9]。在三角褐指藻基因組分析中,植物隱花色素的典型序列并未被發(fā)現(xiàn),但發(fā)現(xiàn)了一種與高等植物和綠藻隱花色素在進化上成群的蛋白,這種蛋白被稱為PtCryP,三角褐指藻PtCryP蛋白具有隱花色素的典型特征,即具有結合FAD和5,10-MTHF的特性[10],通過反義RNA技術而構成的PtCryPknockdown敲除突變體的轉錄組分析,發(fā)現(xiàn)在三角褐指藻中存在CryP與其他光感受器的調控信號網(wǎng)絡[11]。
基因敲除是基因功能研究和基因調控最重要的手段之一。CRISPR-Cas9作為一種新型的基因編輯技術,能對基因組進行準確的定點修飾,該方法容易操作,且成本低[12]。CRISPR-Cas9技術目前已經(jīng)廣泛應用于各種生物的基因編輯,在其它微藻中也有成功案例[13]。迄今為止,還沒有利用CRISPRCas9技術對三角褐指藻 PtCryP基因進行敲除及更深入的研究。
本研究從三角褐指藻中克隆得到PtCryP基因,并對PtCryP基因的序列進行生物信息學分析,且構建 PtCryP 的CRISPR-Cas9敲除質粒,為研究三角褐指藻的感光過程和光信號轉導途徑奠定分子生物學基礎。
三角褐指藻(Phaeodactylum tricornutum)購于中國科學院藻種庫;敲除載體pKS diaCas9-sgRNA購于Addgene;克隆載體pMD-19T、T4 DNA連接酶、DNA Marker購于Takara公司;限制性內切酶BsaI購于NEB公司;TransTaq DNA Polymerase High Fidelity聚合酶、TransZol Up Plus RNA Kit、TransScript One-Step gDNA Removal and cDNA synthesis SuperMix反轉錄試劑盒購于北京全式金生物技術有限公司;質粒DNA小量提取試劑盒、Universal DNA純化回收試劑盒購于北京天根生化科技有限公司;菌液PCR所用2×T5 Super PCR Mix (Colony)購于北京擎科新業(yè)生物技術有限公司;其他常規(guī)試劑均為國產(chǎn)分析純。
采用f/2培養(yǎng)基培養(yǎng)三角褐指藻。本研究中所使用的引物均由上海生工生物工程股份有限公司合成。
1.2.1 三角褐指藻總RNA的提取
三角褐指藻在滅菌后的含有f/2培養(yǎng)基的天然海水中,溫度為20 ℃,光照為4000 lx,光暗周期為12∶12h條件中培養(yǎng)。三角褐指藻培養(yǎng)至對數(shù)生長期時,取40 mL三角褐指藻細胞,4 ℃、8000 g離心4 min,根據(jù)TransZol Up Plus RNA Kit的方法提取三角褐指藻細胞的總RNA,并經(jīng)2%瓊脂糖凝膠電泳及NanoDrop-2000分光光度儀檢測RNA的濃度及質量后,儲存于-80 ℃待用。
1.2.2 三角褐指藻PtCryP基因的擴增
根據(jù)GenBank數(shù)據(jù)庫中三角褐指藻 PtCryP 的基因序列(XM_002184521.2),利用Primer Premier 5軟件設計一對引物(PF和PR)。以總RNA反轉錄獲得的cDNA為模板,以設計的PF和PR為引物(表1),在94 ℃預變性5 min;94 ℃變性30 s,55 ℃退火30 s,72 ℃延伸90 s,30個循環(huán);72 ℃延伸10 min條件下進行PCR擴增。擴增產(chǎn)物經(jīng)1%瓊脂糖凝膠電泳分離后,用DNA純化回收試劑盒回收目的片段。將目的片段連接于pMD 19T載體上,轉化至大腸桿菌DH5α中,并用氨芐青霉素抗性平板篩選得到陽性單克隆,然后經(jīng)質粒PCR和酶切鑒定得到重組克隆。所得重組克隆由生工生物工程(上海)股份有限公司進行測序。
1.2.3 三角褐指藻PtCryP基因的生物信息學分析
運用BioEdit軟件對三角褐指藻 PtCryP基因的核苷酸序列進行分析。
利用在線工具和相關軟件對蛋白質序列進行理化性質分析(https://web.expasy.org/protparam/);
利用NCBI保守結構域數(shù)據(jù)庫(CDD)的CD-search進行蛋白質的保守結構域分析(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi);
蛋白的疏水性分析(https://web.expasy.org/protscale/);
跨膜區(qū)結構預測(http://www.cbs.dtu.dk/services/TMHMM/);
信號肽預測(http://www.cbs.dtu.dk/services/SignalP-4.0/);
亞細胞定位預測(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/);
磷酸化位點預測(http://www.dabi.temple.edu/disphos/);
糖基化位點預測(http://www.cbs.dtu.dk/services/YinOYang/);
蛋白質的二級結構預測(https://www.predictprotein.org/);
利用SWISS-MODEL程序構建預測蛋白質三維空間結構(https://www.swissmodel.expasy.org/);
利用MEGA7.0軟件中的ML(Maximum likelihood)法構建系統(tǒng)進化樹,進化樹中使用蛋白質序列號及所屬物種名稱見表2。
1.2.4 三角褐指藻PtCryP Cas9敲除質粒的構建
在CRISPR結構設計網(wǎng)站(http://crispr.dbcls.jp/)選擇 Phaeodactylum tricornutum genome ,ASM15095v2(Feb,2010)數(shù)據(jù)庫,針對三角褐指藻 PtCryP 基因的DNA序列(XM-002184521.2),結合基因測序結果及GenBank數(shù)據(jù)庫上的基因序列,考慮單核苷酸多態(tài)性問題,尋找包含Cas9識別位點PAM序列的片段,對CRISPR/Cas9靶點進行預測。
根據(jù)sgRNA序列必須位于基因外顯子區(qū)域的原則,以PAM序列之前20nt的序列作為敲除靶位點序列,在預測結果中篩選出特異性高的、合適的sgRNA序列,根據(jù)需要得到含有5’ TCGA和AAAC突出端作為銜接子的寡核苷酸鏈的原則[14],設計引物sgRNA1/2/3/4-F/R(表1),引物由上海生工生物工程股份有限公司合成。
將每對寡聚核苷酸序列,以100 μmol/L的濃度等比例混合,37 ℃連接30 min,95 ℃加熱5 min,然后緩慢降溫,得到雙鏈形態(tài)的DNA。取5 μL退火形成的雙鏈DNA,100 ng經(jīng)BsaI酶處理后的線性化pKS diaCas9-sgRNA質粒,2 μL T4連接酶,1×T4 DNA連接酶緩沖液,用水補足20 μL,16 ℃連接過夜,得到完整閉合的重組質粒,分別命名為pKS diaCas9-sgRNA1,pKS diaCas9-sgRNA2,pKS diaCas9-sgRNA3,pKS diaCas9-sgRNA4。將上述連接產(chǎn)物轉化大腸桿菌感受態(tài)細胞 DH5α,涂布于含1 mg/mL氨芐青霉素的固體LB平板上,37 ℃培養(yǎng)過夜。挑取單克隆菌落分別接種于含1 mg/mL氨芐青霉素的LB液體培養(yǎng)基中,37 ℃恒溫振蕩培養(yǎng),使用質粒小提試劑盒提取質粒后,使用引物sgRNA1/2/3/4-F和引物M13R進行菌液PCR驗證(表1),驗證sgRNA片段是否成功插入pKS diaCas9-sgRNA載體。菌液PCR驗證成功后,使用引物為sg片段插入檢測-F和sg片段插入檢測-R進行PCR(表1),PCR產(chǎn)物送上海生工生物工程股份有限公司測序。
表1 引物序列
表2 進化樹所用物種名稱及蛋白序列號
通過PCR擴增,獲得一條接近2000 bp的DNA片段(圖1),與目標DNA的大小相近。將該DNA片段送上海生工有限公司測序,測序的結果為1575 bp,進行比對后,發(fā)現(xiàn)該核苷酸鏈的序列與目標DNA的序列一致。
圖1 PtCryP基因的PCR產(chǎn)物凝膠電泳圖
2.2.1 三角褐指藻PtCryP蛋白的理化性質分析
經(jīng)Bioedit軟件分析,三角褐指藻PtCryP基因的cDNA序列全長為1575 bp,編碼524個氨基酸(圖2)。使用Protparam程序在線分析,該蛋白的等電點為8.30,分子式推測為C2606H4084N766O770S16,蛋白質分子量為58.98 kDa。不穩(wěn)定指數(shù)為50.12,推測該蛋白為不穩(wěn)定蛋白。預測在酵母中表達的半衰期大于20 h,在大腸桿菌中表達的半衰期大于l0 h,而在哺乳動物網(wǎng)狀細胞中體外培養(yǎng)表達的半衰期為30 h。該蛋白由20種基本氨基酸組成,含量較高的氨基酸殘基是丙氨酸(Ala,9.4%),精氨酸(Arg,9.4%)和亮氨酸(Leu,9.9%),含量較低的氨基酸殘基是半胱氨酸(Cys,1.7%)和苯丙氨酸(Met,1.8%)。其帶正電荷氨基酸有65個(Arg+Lys),帶負電荷的氨基酸有62個(Asp+Glu)。經(jīng)過protscale程序在線分析,氨基酸序列疏水性/親水性預測結果表明,平均疏水系數(shù)為-0.393,小于0,推測其為親水性蛋白,其脂肪系數(shù)為83.44。
圖2 PtCryP基因的核苷酸序列和推測的氨基酸序列
2.2.2 三角褐指藻PtCryP蛋白的保守結構域、信號肽、磷酸化位點和糖基化位點分析
NCBI保守結構域數(shù)據(jù)庫(CDD)分析表明,該蛋白屬于FAD_binding_7 super family,與預測該蛋白的功能相一致(圖3)。TMHMM預測該蛋白處于膜外該蛋白不存在跨膜結構域(圖略)。利用Cell-PLoc 2.0進行亞細胞定位預測,PtCryP定位于線粒體中(圖略)。經(jīng)過SignalP4.0在線預測,蛋白不存在信號肽序列(圖略)。經(jīng)軟件DISPHOS預測PtCryP蛋白上有19個磷酸化位點,其中10個絲氨酸磷酸化位點、8個蘇氨酸磷酸化位點、1個酪氨酸磷酸化位點(圖4A)。經(jīng)軟件YinOYang1.2預測PtCryP蛋白中存在OGlcNAc糖基化位點,位置在第2、3、64、70、155、211、240、341、345、416、507、514個氨基酸殘基處(圖4B)。
圖3 PtCryP蛋白保守結構域分析
圖4 三角褐指藻PtCryP蛋白的(A)磷酸化和(B)糖基化位點預測
圖5 三角褐指藻PtCryP蛋白二級結構
2.2.3 三角褐指藻PtCryP蛋白的二級結構與三級結構分析
通過PredictProtein分析蛋白質的二級結構的結果顯示該基因編碼蛋白序列α-螺旋(Helix)所占比例為35.1%,無規(guī)則卷曲(Loop)所占比例為58.2%,延伸鏈區(qū)(Strand)所占比例為6.7%(圖5)。由此可知,α-螺旋和無規(guī)則卷曲是三角褐指藻PtCryP蛋白二級結構的主要組成,屬于混合型蛋白。
在二級結構分析結果的基礎上,進一步采用SWISS-MODEL進行蛋白質的三級結構同源建模,PtCryP蛋白三級結構預測結果如圖6。
圖6 SWISS-MODEL對三角褐指藻PtCryP蛋白三級結構的預測
2.2.4 三角褐指藻PtCryP蛋白的系統(tǒng)進化分析
通過構建不同物種來源隱花色素的進化樹(圖7),發(fā)現(xiàn)三角褐指藻來源的PtCryP蛋白與其他真核單細胞藻類(萊茵衣藻和金牛駝球藻)序列比較相似,形成姐妹群,且發(fā)現(xiàn)三角褐指藻PtCryP蛋白序列更接近于DASH類隱花色素。
圖7 PtCryP蛋白的同源進化樹分析(最大似然法)
根據(jù)以上PtCryP基因及PtCryP蛋白生物信息學分析結果,為了進一步驗證其生物學功能,我們構建PtCryP基因的敲除載體。將退火后形成的雙鏈DNA中,插入Bsal酶線性化后的質粒pKS diaCas9-sgRNA,使用引物sgRNA1/2/3/4-F和引物M13R進行菌液PCR驗證,驗證結果如圖8A,挑取的菌落均檢測到約550 bp的目的條帶,證明sgRNA片段均成功插入pKS diaCas9-sgRNA載體中。使用sg片段插入檢測-F和sg片段插入檢測-R進行PCR,送測序,測序結果如圖所示,說明靶位點DNA片段成功地插入了pKS diaCas9-sgRNA載體中,且插入的片段序列正確。將得到的陽性克隆命名為pKS diaCas9-sgRNA1,pKS diaCas9-sgRNA2,pKS diaCas9-sgRNA3,pKS diaCas9-sgRNA4。
圖8 pKS diaCas9-sgRNA1/2/3/4重組質粒的驗證
本實驗從三角褐指藻中克隆得到了PtCryP基因的cDNA序列,并通過多種生物信息學手段對其進行了理化性質分析、二級結構預測、三級結構建模、磷酸化位點預測、序列比對、系統(tǒng)進化樹的構建等,得知該基因cDNA全長為1575 bp,編碼524個氨基酸,預測蛋白質的等電點為8.30,預測的蛋白質分子量為58.97872 kDa,且為不穩(wěn)定蛋白。
三角褐指藻PtCryP蛋白通過保守結構域分析,具有DNA光裂解酶FAD結合的結構域,該結構域存在于所有隱花色素/光裂解酶家族蛋白。擬南芥隱花色素PHR結構域一般約由500個氨基酸殘基組成,且擬南芥CRY-DASH蛋白缺失CCT結構域[15],而三角褐指藻PtCryP蛋白由524個氨基酸組成,且缺失CCT結構域,與擬南芥CRY-DASH蛋白在結構上非常相似。
在擬南芥中,隱花色素的調控機制研究得較為深入,未激活的隱花色素在接受藍光信號之后激活FAD發(fā)色團,PHR結構域發(fā)生同源二聚化,PHR和CCT結構域解離,引發(fā)隱花色素蛋白構象變化,變成光激活狀態(tài)的隱花色素,而CCT結構域發(fā)生光依賴的磷酸化反應[16,17]。由此可知,無論是PHR結構域的二聚化或者CCT結構域的磷酸化反應都需要有磷酸化的發(fā)生。蛋白質磷酸化是一種常見的翻譯后修飾方式,可通過磷酸化與去磷酸化影響蛋白質的活性與功能,因此磷酸化分析對研究蛋白質的功能研究具有重要意義[18]。本研究通過磷酸化位點預測,在三角褐指藻的PtCryP蛋白中發(fā)現(xiàn)了19個可能的磷酸化位點,為后續(xù)磷酸化機制的功能研究提供了重要線索。
基因的功能與其亞細胞定位密切相關。擬南芥隱花色素CRY1和CRY2基因在被檢測過的所有細胞類型和所有細胞器中都有表達[19]。而擬南芥隱花色素CRY3則表達于葉綠體和線粒體中[16],細胞定位不同的隱花色素表現(xiàn)出不一樣的功能[20]。利用熒光蛋白標記方法進行亞細胞定位,發(fā)現(xiàn)短凱倫藻(Karenia brevis)的cry-DASH表達于葉綠體中[15],而克氏錐蟲(Trypanoma cruzi)的cry-DASH表達于線粒體中[22]。通過亞細胞定位軟件分析,預測三角褐指藻PtCryP蛋白定位于線粒體中,根據(jù)其定位,與在線粒體內表達的擬南芥隱花色素可能有功能上的相似,為我們研究功能及分類提供了線索。
為了進一步研究三角褐指藻 PtCryP基因的功能,目前已有研究對三角褐指藻PtCryP基因利用反義RNA方式沉默其表達[10,11],而未使用CRISPR-Cas9的方法對PtCryP基因進行敲除,從而從DNA水平上徹底阻斷PtCryP基因的表達,本文成功構建了三角褐指藻PtCryP基因的CRISPR-Cas9敲除載體pKS diaCas9-sgRNA1/2/3/4,為三角褐指藻 PtCryP基因的功能及其基因家族的信號傳導的研究提供了基礎。
三角褐指藻PtCryP蛋白顯示的光譜特征、結合的發(fā)色團且參與光捕獲蛋白的調控,這些特征與DASH型隱花色素更為相似[10]。有研究對野生株和PtCryP敲除株在黑暗及藍光下進行轉錄組分析,發(fā)現(xiàn)PtCryP蛋白對其他光感受器的表達會造成影響,這就意味著三角褐指藻中存在調節(jié)信號傳導網(wǎng)絡,而PtCryP蛋白在其中起著一定作用,且在硅藻基因組中沒有找到植物隱花色素相互作用的基因COP1和SPA的同源基因,所以PtCryP蛋白的下游信號傳導完全不同于植物隱花色素[11]。因此,我們需要進一步研究,三角褐指藻PtCryP蛋白的具體作用及它是如何傳導信號等問題。
隱花色素是一類重要的藍光受體,它參與光形態(tài)建成的調控,也能調控高等植物光周期的開花過程。在擬南芥中隱花色素已經(jīng)有了較深入的研究,但在單細胞藻類中,其研究才剛剛開始。隱花色素家族基因是如何通過隱花色素感應藍光從而調控藻類的生命活動?隱花色素通過與什么互作蛋白結合從而引發(fā)下游信號轉導?在單細胞藻類中,隱花色素是否參與生物鐘節(jié)律的調控過程?這些都是等待解決的重要科學問題。