黃 敏,謝曉剛,2,何琪富,曹旭陽,董翔宸,康 健,劉 軍*,權富生*
(1.西北農林科技大學動物醫(yī)學院,楊凌 712100;2.楊凌職業(yè)技術學院動物工程分院,楊凌 712100)
薩能奶山羊是世界著名的乳用山羊品種,對世界乳用山羊品種的改良和羊乳生產具有重要影響[1]。薩能奶山羊性情溫順,環(huán)境適應能力強,產奶量高達600~1 200 kg,乳脂率為3.8%~4.2%,現已遍布世界各國[2]。羊奶不僅營養(yǎng)豐富且酪蛋白結構與人奶相似,脂肪球小使其更易被人體吸收,被歐美國家視為營養(yǎng)精品[3-4]。經過對該品種的不斷改良我國已培育出高產品系的西農薩能奶山羊[5-6]。從生產角度考慮,繁殖更多的母羊對需要羊奶的飼養(yǎng)者有利,所以進行奶山羊性別控制的研究可以提高奶山羊的飼養(yǎng)效益,促進奶山羊母羊群體的快速增長,也可以促進奶山羊產業(yè)的快速發(fā)展。
哺乳動物中第一個發(fā)現的促雄性發(fā)育基因是位于Y染色體短臂上的鋅指蛋白Zfy基因,也被認為是最重要的性別決定基因之一[7-8]。Zfy基因高度保守,是鋅指同系物基因。Zfy基因包含11個外顯子和一個隨機重復區(qū)域的13個鋅指結構,分別由2個半胱氨酸和組氨酸殘基絡合1個Zn2+而形成穩(wěn)定存在的手指狀結構[9-11]。該鋅指結構域是酸性活化結構域且具有修飾的反式激活潛力,能與靶DNA特異性結合,并通過其核定位信號引導靶基因穿過核膜,精準定位于精子細胞核內DNA上,從而調控其他基因表達,在精子早期發(fā)育過程中發(fā)揮重要作用[12-13]。隨著對性別決定機制的深入研究,2013年Yamauchi等[14]通過敲除小鼠Y染色體上的全部性別決定基因,發(fā)現僅需要Y染色體上的睪丸決定因子Sry和精原細胞增殖因子Eif2 s3y即可建立轉基因雄性小鼠。研究最初發(fā)現,當只有Sry基因時可見胚胎發(fā)育睪丸但不能產生生精細胞,加入Eif2 s3y基因后的雄性小鼠雖可產生圓形精子但不能繼續(xù)發(fā)育為成熟精子而導致無法受精[15],研究者推測,Y染色體上負責將精細胞轉化為精子的關鍵基因或許是Zfy2,隨后通過轉基因技術導入Zfy2后結果表明,僅攜帶Y染色體上的這3個基因就可使轉基因小鼠睪丸產生成熟精子,雖無法正常排精但從睪丸收集精子也可成功體外受精,且胚胎移植后雄性幼鼠攜帶正常的Y染色體[16]。Nakasuji等[17]利用Cas9技術敲除小鼠Zfy1/2基因導致其精子內的PRSS21、PLCZ1、HTT、PLCD4蛋白表達下調,進而導致精子形態(tài)嚴重異常。此外,Peng等[18]使用RNAi技術沉默Zfy基因,從而獲得了顯著高于對照組的雌鼠比例(72.3%>50.6%)。由此可見,Zfy基因是與性別控制有關的一個重要基因。
目前,NCBI網站上已有預測的山羊Zfy基因序列,但是山羊的Zfy基因全長克隆未見報道。為探究山羊Zfy基因在性別控制中的作用,本研究克隆了西農薩能奶山羊Zfy基因CDS區(qū)全長序列,并對其進行生物信息學分析和同源性比對,同時利用CRISPR/Cas9系統(tǒng)構建穩(wěn)定的Zfy基因敲除的GFFs細胞株,為山羊Zfy基因的功能、對后代性別比例的影響以及控制性別比例的研究提供理論支撐。
本研究所用實驗動物來自楊凌科元克隆股份有限公司薩能奶山羊種羊場;睪丸采自3只3月齡健康公山羊;3只山羊胎兒分別采自3只成年妊娠45 d的母山羊,胎齡為45 d左右,胎兒組織經特異性性別基因PCR鑒定為兩只雄性,一只雌性;胎兒成纖維細胞經采集的山羊胎兒組織塊貼壁法分離培養(yǎng)而獲得。所有采樣過程均遵守實驗動物管理條例以及倫理要求,得到本學院實驗動物倫理委員會的批準。
PX459/Cas9載體為Addgene公司產品;pMD 19T Simple載體、PrimeSTAR?HS DNA Polymerase、反轉錄試劑盒和Solution I DNA Ligation試劑盒為TaKaRa公司產品;T4 DNA連接酶為NEB公司產品;BbsI酶為Thermo公司產品;T7E1酶為Biolabs公司產品;質粒小提試劑盒及膠回收試劑盒為AXYGEN公司產品;DNA提取試劑盒和DH5α感受態(tài)由北京天根生化科技有限公司提供;胎牛血清為Gibco公司產品;DF12、Opti-MEM培養(yǎng)液及Lipofectamine 3000為Invitrogen公司產品。
參照NCBI數據庫中預測的山羊Zfy基因mRNA序列信息(登錄號:XM_018044893),設計3對特異性引物(表1)。提取山羊睪丸組織的總RNA,反轉錄合成cDNA,用表1中的引物分段擴增Zfy基因的CDS區(qū)全序列。PCR反應體系:5×PrimeSTAR Buffer 5 μL,dNTP Mixture 4 μL,cDNA模板1 μL,上、下游引物各0.5 μL,PrimeSTAR?HS DNA Polymerase 0.5 μL,ddH2O補足至25 μL。PCR反應程序為:98 ℃預變性2 min;98 ℃變性10 s,59 ℃退火10 s,72 ℃延伸1 min,35個循環(huán);72 ℃ 10 min,4 ℃保存。將擴增產物連接到pMD 19T Simple載體上,隨機挑選6個陽性菌液PCR鑒定后送至楊凌奧科生物科技有限公司完成測序,并利用DNAMAN軟件進行序列拼接。
表1 山羊Zfy基因CDS區(qū)的擴增引物
本研究根據測序軟件DNAMAN拼接得到的山羊Zfy基因CDS區(qū)序列進行同源性比對并構建系統(tǒng)進化樹,對其蛋白質理化性質、二級結構、三級結構、磷酸化位點以及信號肽等進行生物信息學分析,以便預測山羊Zfy基因的結構和功能。本試驗中用到的主要生物信息學工具如表2所示。
表2 生物信息學軟件及網站
本研究利用打靶網站https://chopchop.cbu.uib.no/針對山羊Zfy基因的CDS區(qū)設計sgRNA序列,其中sgRNA序列設計以NGG的PAM原則為基準(NGG為Cas9基因定位的PAM序列),并利用網絡工具(http://www.rgenome.net/cas-offinder/)進行脫靶位點分析,優(yōu)選4個sgRNA靶位點(表3),并在sgRNA正義鏈5′端加上序列CACCG接頭,反義鏈5′端加上序列AAAC接頭,可與BbsI酶切后形成的黏性末端互補。將上述引物退火后連接到經BbsI酶切過的PX459/Cas9載體上,挑選陽性菌液提取質粒,用60 mm皿培養(yǎng)GFFs(山羊胎兒成纖維細胞),當細胞匯合度達到80%時用Lipofectamine? 3000試劑轉染陽性重組載體,12 h后加1 μg·mL-1的嘌呤霉素篩選,48 h后將含嘌呤霉素的培養(yǎng)液換掉,繼續(xù)培養(yǎng)至GFFs細胞長滿時提取細胞基因組。設計針對靶序列的特異性擴增引物(表4),以篩選到的細胞基因組為模板,對4個打靶載體對應的4個靶位點進行特異性擴增。將PCR產物重新變性、退火,加入T7E1酶進行酶切試驗,應用Image軟件對切割條帶進行灰度分析,計算打靶位點的切割效率。
表3 sgRNA克隆引物序列
表4 擴增sgRNA靶點的引物序列
選擇sgRNA切割效率最高的重組打靶載體轉染GFFs細胞,轉染12 h后加入1 μg·mL-1嘌呤霉素篩選,在藥物篩選48 h后,將未轉染成功的成纖維細胞去除。每天在顯微鏡下觀察細胞長勢,待單克隆細胞長出時將其挑取到48孔板傳代培養(yǎng)并保存。提取單克隆細胞基因組,對靶序列進行PCR擴增,連接T載體送測序,根據質粒檢測結果分析鑒定Zfy基因是否成功敲除。
總RNA經凝膠電泳檢測可以清晰地看到28S、18S、5S三條帶,證明本試驗提取的山羊睪丸組織總RNA完整性良好。利用以總RNA反轉錄的cDNA第一鏈為模板對山羊Zfy基因CDS區(qū)全長序列進行分段克隆,結果得到了3條特異性且與預期結果一致的條帶(圖1)。PCR擴增產物經TA克隆測序拼接比對,成功得到了2 406 bp的西農薩能奶山羊Zfy基因的CDS區(qū)全長序列,與NCBI上預測的山羊Zfy基因序列一致(覆蓋率100%)。
A.Zfy-CDS1 PCR產物;B.Zfy-CDS2 PCR產物;C.Zfy-CDS3 PCR產物;D.睪丸總RNA瓊脂糖凝膠電泳圖。M.DNA相對分子質量標準(DL8000);1、2.兩個重復樣本
根據NCBI上公布的其他物種的Zfy基因信息,應用MegAlign軟件對山羊、綿羊、牛、馬鹿、驢、家貓、家犬、人、黑猩猩、小鼠10個物種的Zfy基因進行核苷酸序列及氨基酸序列同源性比對。結果如圖2A和2B所示,山羊與綿羊、牛、馬鹿、驢、家貓、家犬、人、黑猩猩、小鼠的Zfy基因CDS區(qū)核苷酸序列相似性分別為94.7%、94.3%、97.2%、93.6%、92.7%、92.6%、91.8%、91.4%、83.0%;編碼的氨基酸序列相似性分別為98.1%、98.5%、98.9%、97.0%、97.0%、97.3%、95.1%、94.7%、80.7%。應用Mega7.0軟件構建Zfy基因系統(tǒng)進化樹(圖2C),生物進化樹的結果與同源性序列比對結果基本相符,可以發(fā)現不同物種之間Zfy基因均比較保守,山羊與馬鹿、牛、綿羊親緣關系較近,與家貓、家犬、驢親緣關系稍遠,與人、黑猩猩、小鼠親緣關系最遠,其中小鼠與其他物種的親緣性均較低。
A.山羊Zfy基因CDS區(qū)序列與9個物種的同源性比對;B.山羊Zfy氨基酸序列與9個物種的同源性比對;C.Zfy基因的系統(tǒng)進化樹
通過ProtParam tool在線軟件對山羊Zfy氨基酸序列及蛋白的理化性質進行分析。結果顯示,山羊Zfy基因CDS區(qū)共編碼801個氨基酸,由20種氨基酸組成(各種氨基酸占比如圖3A所示),其中天門冬氨酸(Asp)和谷氨酸(Glu)占比最多;預測其蛋白分子式為C3890H6140N1118O1250S56,原子總數為12 454,分子質量為90.37 ku;理論等電點(pI)為5.66,說明該蛋白是酸性蛋白質;帶負電的殘基總數(Asp+Glu)為139,帶正電荷的殘基總數(Arg+Lys)為97;脂溶指數為71.15,蛋白親水性系數為-0.633,屬于親水性蛋白;不穩(wěn)定系數為49.52,說明該蛋白不穩(wěn)定,在哺乳動物網織紅細胞內的預計半衰期為30 h;消光系數(M-1 cm-1γ=280 nm)為35 935。
本研究應用軟件Net Phos 3.1對山羊Zfy蛋白的磷酸化位點進行預測。預測結果如圖3B所示,山羊Zfy蛋白可能的磷酸化位點有66個,其中Ser(絲氨酸)37個、Thr(蘇氨酸)22個、Tyr(酪氨酸)9個。應用軟件SignalP 4.1對山羊Zfy蛋白的信號肽進行預測,如圖3C所示。氨基酸殘基C-score為0.108,S-score為0.110,Y-score為0.104,3個分值均小于0.5,據計算結果可以預測山羊Zfy蛋白不存在信號肽,說明該蛋白是非分泌蛋白。
利用SOPMA軟件預測Zfy蛋白的二級結構,如圖3D所示,在山羊Zfy蛋白的二級結構中,α螺旋占31.21%,且分布比較均勻,β折疊占16.73%,β轉角較少,占4.74%,無規(guī)則卷曲(random coil部分)占47.32%。山羊Zfy蛋白的二級結構比較復雜,尤其是前端和中間部分。應用在線軟件SWISS-MODEL對山羊Zfy基因編碼的氨基酸序列進行同源性建模,得到了與二級結構預測結果基本一致的山羊Zfy蛋白三級結構空間模型,如圖3E所示。
A.山羊Zfy蛋白氨基酸比例;B.山羊Zfy蛋白預測磷酸化位點圖;C.山羊Zfy蛋白信號肽預測結果;D.山羊Zfy蛋白二級結構;E.山羊Zfy蛋白三級結構模型
應用在線軟件針對山羊Zfy基因的CDS區(qū)預測到8個評分較高的潛在sgRNA靶位點,對其進行脫靶分析,排除可能與Zfx基因結合且堿基錯配數≥1的靶位點,最終篩選出4個理想的靶位點。為了獲得對Zfy基因打靶效率較高的sgRNA,首先將表3中合成的4對引物退火形成雙鏈后分別連接到經BbsⅠ酶切后的PX459/cas9載體上構建重組質粒并送測序正確,再將構建好的PX459/cas9-sgRNA1、PX459/cas9-sgRNA2、PX459/cas9-sgRNA3、PX459/cas9-sgRNA4表達載體分別轉染GFFs,經嘌呤霉素篩選48 h后提取細胞基因組,用表4中的引物對4個靶位點進行特異性擴增,均跑出特異性擴增條帶。最后將回收的PCR產物通過T7E1酶切后用瓊脂糖凝膠電泳檢測,發(fā)現4個sgRNA均有效剪切了相應的靶序列(圖4)。經Image J灰度分析,計算得出其切割效率大小依次為sgRNA2(40.86%)>sgRNA3(31.52%)>sgRNA4(26.37%)>sgRNA1(12.31%),其中sgRNA2的切割效率最高達到40.86%。
A.sgRNA1切割效率;B.sgRNA2切割效率;C.sgRNA3切割效率;D.sgRNA4切割效率。M.DNA相對分子質量標準(DL8000);1.野生型;2.未加T7E1酶;3.加T7E1酶
選擇sgRNA切割效率最高的PX459/cas9-sgRNA2重組打靶載體轉染GFFs細胞,轉染12 h后經過嘌呤霉素篩選,并對篩選到的46株單克隆細胞株進行PCR擴增,得到537 bp的特異性條帶(圖5A)。將PCR產物膠回收純化后,連接T載體,通過測序鑒定細胞株中Zfy基因是否發(fā)生突變,結果顯示在轉染PX459/cas9-sgRNA2載體的46株單克隆細胞中,發(fā)生Zfy基因突變的有11株,突變率為23.91%,如圖5B所示。
A.sgRNA2部分單克隆鑒定;B.PX459/cas9-sgRNA2在目標位點產生indels的DNA測序結果,右側為對應的插入或缺失比率
1983年Mani等[19]首次在非洲爪蟾卵母細胞的轉錄因子ⅢA中發(fā)現了與各種DNA特異性結合的鋅指蛋白(ZFP),絕大多數鋅指蛋白與基因表達和轉錄因子有關[20-23]。Page等[24]1987年在基因型為XY的女性Y染色體上檢測到唯一丟失的基因片段Zfy編碼與DNA結合的鋅指蛋白,并認為Zfy基因是睪丸決定因子(TDF),掀起了研究胚胎中Zfy基因表達的熱潮,直到1990年Berta等[25]證實SRY才是TDF,之后對Zfy基因的研究極少且僅限于性別鑒定[26-29]。2012年,Decarpentrie等[30]的研究表明,小鼠Zfy1和Zfy2基因在第一次減數分裂粗線期之前高表達后沉默,在圓形精子細胞中Zfy2再次被強烈激活。隨后,Vernet等[13,31]進一步研究發(fā)現,Zfy2基因是小鼠次級精母細胞有效完成第二次減數分裂(產生單倍體圓形精子)的必要條件,對于精子頭部重組及尾部發(fā)育具有重要的作用[32]。這些研究成果為Zfy基因在精子發(fā)生過程中的關鍵作用提供了有力依據,但目前國內外主要以小鼠為模型來研究Zfy基因在早期精子發(fā)育中的功能。小鼠具有Zfy1和Zfy2兩種Y連鎖基因,雖然其高度同源,但在減數分裂期間兩種基因的功能仍然不同,而人類、牛、羊等哺乳動物的Y染色體上只有一種Zfy基因,那么其在哺乳動物精子生成及性別控制中究竟起什么作用值得深入探究。
最近的研究報道也有克隆驢、馬鹿、豬、牛、犬、綿羊、牦牛[33-37]等動物的Zfy基因,并對Zfy基因功能及進化關系進行簡單的預測分析,而關于奶山羊Zfy基因的研究鮮有報道。本研究克隆了全長為2 406 bp的西農薩能奶山羊Zfy基因的CDS區(qū)序列,編碼801個氨基酸,與GenBank上傳的預測序列比對結果一致,說明在克隆目的基因時采用分段擴增的方法能夠有效避免產生堿基缺失和突變。山羊Zfy基因堿基序列與除小鼠外的其余8個物種相似性在91.4%~97.2%之間,氨基酸相似性在94.7%~98.9%之間,遺傳進化分析結果顯示,山羊與馬鹿親緣關系最近,其次是牛和綿羊,這與魏麗敏等[33]分析的馬鹿與家牛、野牛、綿羊親緣關系最近相一致,說明Zfy基因氨基酸同源性高于堿基,總體可信度較高,是較保守的基因序列。而山羊與小鼠Zfy基因堿基和氨基酸相似性分別為83.0%和80.7%,且進化樹分析顯示兩者親緣關系最遠,表明在遺傳進化過程中兩者的基因組成可能存在差異。生物信息學分析Zfy基因編碼的蛋白,結果顯示蛋白分子質量為90.37 ku,理論等電點(pI)為5.66,說明該蛋白是酸性蛋白質,推測與其酸性結構域有關。山羊Zfy蛋白不存在信號肽,表明不是分泌蛋白,可能的磷酸化位點有66個,推測其可能通過磷酸化調控與其互作的蛋白從而發(fā)揮生理生化功能。二級結構主要由31.21%的α螺旋,16.73%的β折疊和47.32%的無規(guī)則卷曲組成,Zfy蛋白中大約占一半的無規(guī)則卷曲氨基酸是造成該蛋白不穩(wěn)定的重要原因,這與理化性質分析其不穩(wěn)定系數高達49.52相一致,但也有研究者認為半衰期越長的蛋白質穩(wěn)定性越高[38],而山羊Zfy蛋白的半衰期較長但卻是不穩(wěn)定蛋白,本研究與營瑞文等[35]分析驢Zfy為不穩(wěn)定蛋白一致,該蛋白的這種特性是否與其在減數分裂時間歇性表達有關值得進一步研究。
性別決定和分化是由眾多基因共同調控的復雜過程,其中任何一個基因功能喪失或表達失控都有可能導致相應的性別發(fā)育異常。隨著Zfy基因在早期Y精子發(fā)育中的功能被逐漸闡明,目前最主流的方法是利用RNAi技術沉默Zfy基因mRNA的表達來破壞單倍體Y精子的發(fā)育從而達到性別控制,且已經在多種動物上陸續(xù)實現[18, 39-41]。但Zhang等[27]研究報道,在綿羊上使用RNAi技術沉默Zfy基因,其后代雌雄比例與對照組無顯著差異,分析原因可能是設計RNAi序列時參照了小鼠Zfy基因,干擾Zfy基因的同時也干擾了Zfx基因的表達。本研究在篩選sgRNA時完全避開了與Zfx匹配的靶位點且以山羊Zfy基因設計sgRNA。相比于RNAi技術,基因編輯技術更有利于詳細研究Zfy基因的功能,因為其可以實現對整個基因或某個功能域甚至是定點刪除或缺失,而RNAi技術是干擾整條mRNA的表達,這種方式有時難以滿足對基因功能深入研究的需要。
本研究通過分段克隆及測序獲得了長為2 406 bp的西農薩能奶山羊Zfy基因CDS區(qū)全序列,共編碼801個氨基酸。Zfy蛋白親水性較高,是酸性蛋白,無信號肽,且結構不穩(wěn)定。同時利用CRISPR/Cas9技術構建了4個敲除奶山羊Zfy基因的打靶載體,通過轉染切割效率最高的打靶載體篩選到了能穩(wěn)定敲除Zfy基因的GFFs細胞株,可為奶山羊Zfy基因的功能研究以及性別控制技術的研發(fā)奠定基礎。