宋興超,徐超,劉琳玲,叢波,楊福合,彭英華
(中國農(nóng)業(yè)科學院特產(chǎn)研究所特種經(jīng)濟動物分子生物學重點實驗室,長春 130112)
肌細胞生成素(Myogenin,MyoG)基因是成肌調(diào)節(jié)因子(Myogenic regulatory factors,MRFs)基因家族中唯一在畜禽骨骼肌細胞系中均可表達的基因。從胚胎肌纖維的形成、前體肌細胞的增殖及定型,到個體出生之后功能的完善及成熟,MyoG 基因均參與表達調(diào)控,它可以激活肌肉基因轉(zhuǎn)錄,提高細胞分化,是調(diào)控骨骼肌生長發(fā)育的關(guān)鍵因子[1]。MyoG 基因編碼的堿性螺旋-環(huán)-螺旋蛋白(Basic helix-loop-helix protein,bHLH)參與肌細胞的形成與分化[2]??寺yoG 基因,解析該基因的結(jié)構(gòu)特性,對提高畜禽的生產(chǎn)性能具有重要的理論意義與實踐價值。
梅花鹿(Cervus nipon)屬偶蹄目(Artiodactyla)、鹿科(Cervidae)、鹿屬(Cervus),是一種珍貴的藥用經(jīng)濟動物[3]。吉林梅花鹿(Jilin sika deer)屬于茸用為主的地方梅花鹿品種,具有遺傳性能穩(wěn)定、高產(chǎn)、優(yōu)質(zhì)、抗病力強及耐粗飼的優(yōu)良特性,其副產(chǎn)品鹿肉因高蛋白、低脂肪、低膽固醇的優(yōu)異特性,對人體的血液循環(huán)與神經(jīng)系統(tǒng)具有良好的調(diào)節(jié)作用[4]。隨著人們生活水平的改善及對鹿肉營養(yǎng)價值認識的提高,鹿肉的消費需求日益增加,梅花鹿育種亦向肉用型或肉、茸兼用型方向發(fā)展,肉質(zhì)性狀將成為肉鹿育種工作中的研究熱點。從分子水平解析梅花鹿肌肉發(fā)育及肉質(zhì)性狀關(guān)聯(lián)候選基因和相關(guān)分子標記的調(diào)控機理,并以此為基礎(chǔ)進行標記輔助選擇,將成為提高梅花鹿產(chǎn)肉性能及改善肉品質(zhì)的有效手段之一,同時,也將成為改良我國梅花鹿品種或者培育新型肉用品種的良好途徑。研究表明,MyoG基因的遺傳變異與畜禽肌纖維數(shù)量及其生長速度相關(guān),是影響肌纖維特性、胴體品質(zhì)及生長性狀的關(guān)鍵候選基因[5-7],最終可能會導致畜禽產(chǎn)肉量與肉質(zhì)的變異。近年來,人們對MyoG 基因的研究主要集中于豬[8-9]、牛[10-12]、山羊[13-14]和雞[15-17]等物種,有關(guān)鹿科動物 MyoG 基因完整編碼區(qū)序列結(jié)構(gòu)特征及其在鹿骨骼肌發(fā)育過程中調(diào)控作用的研究相對薄弱,僅見甘肅馬鹿該基因啟動子區(qū)序列克隆分析、部分編碼區(qū)SNPs 檢測及全序列結(jié)構(gòu)特性預測的相關(guān)報道[18-20]。本研究選取MyoG 基因作為肌肉發(fā)育性狀關(guān)聯(lián)基因,以吉林梅花鹿為研究對象,克隆MyoG 基因,并對其序列結(jié)構(gòu)進行生物信息學預測及分析,為進一步充分利用 MyoG 基因選育優(yōu)良肉用梅花鹿新品種以及開展梅花鹿分子標記輔助選擇的研究奠定理論基礎(chǔ);同時,也為我國地方梅花鹿品種和培育品種MyoG 基因遺傳多樣性和群體遺傳結(jié)構(gòu)研究以及吉林梅花鹿品種遺傳資源的合理保護與利用提供科學依據(jù)。
1.1.1 血樣 隨機選擇中國農(nóng)業(yè)農(nóng)村部長白山野生生物資源重點野外科學觀測試驗站茸鹿試驗基地的健康成年雄性吉林梅花鹿5 頭,麻醉后頸靜脈采血5.0 mL,置于-20 ℃冰箱保存。
1.1.2 主要試劑 血液基因組DNA 提取試劑盒(溶液型)(北京百泰克生物技術(shù)有限公司);DL 2 000、DL 1 000 DNA 分子量標準、Ex Taq DNA 聚合酶、PCR 產(chǎn)物純化試劑盒(TaKaRa 公司);瓊脂糖(Promega 公司)。
1.2.1 DNA 提取 利用試劑盒提取梅花鹿血液基因組DNA,通過紫外分光光度計及0.7%瓊脂糖凝膠電泳檢測其濃度及純度,稀釋為80 ngL,20 ℃保存。
1.2.2 引物設(shè)計 參照NCBI 中馬鹿(FJ746497)、山羊(FJ607135)、牛(HM452338)與豬(U14331)MyoG基因序列,利用Primer Premier 5.0 軟件在基因保守區(qū)設(shè)計6 對特異性引物(表1),由上海生工生物工程有限公司合成。6 對引物的擴增產(chǎn)物之間均有200 bp 左右的重疊區(qū)域,利于序列拼接。
1.2.3 PCR擴增及克隆測序 反應(yīng)體系25μL:Ex Taq DNA 聚合酶(5 UL)0.25L,10 PCR Buffe(rMg2+Plus)2.5L,dNTPs 2.0L,模板 DNA 1.0L(80 ng/L),上、下游引物(10pmol/L)各1.0L,滅菌超純水17.25L。反應(yīng)循環(huán)參數(shù):94 ℃預變性5min;94℃變性30 s,各引物退火溫度見表1,退火30 s,72 ℃延伸43~60 s,35 個循環(huán);72 ℃延伸 10 min;4 ℃保存。6 個 PCR 產(chǎn)物經(jīng)1.2%瓊脂糖凝膠電泳檢測,將目的片段經(jīng)過切膠、回收純化后送上海生工生物工程有限公司進行克隆測序。
1.2.4 序列編輯、拼接及生物信息學分析 通過Chromas 2.6 軟件對測序峰圖進行校對;采用序列在線軟件CAP3(http://doua.prabi.fr/software/cap3)拼接為一條完整序列,利用NCBI 數(shù)據(jù)庫的BLAST 工具進行比對,GENSCAN(http://genes.mit.edu/GENSCAN.html)在線軟件預測獲得序列結(jié)構(gòu),參考NCBI 中登載的馬鹿、山羊、牛和豬MyoG 基因序列注釋信息明確梅花鹿該基因5 UTR、外顯子、內(nèi)含子及3 UTR 的長度。BioEdit 7.0 軟件統(tǒng)計MyoG 基因編碼序列堿基含量,利用 DNAMAN 5.2.2.0 軟件的 Translate 程序翻譯出氨基酸序列,分析編碼氨基酸序列組成與結(jié)構(gòu)特性。利用在線工具Conserved Domains 預測MyoG 蛋白保守結(jié)構(gòu)功能域(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi);在線軟件Motif Scan(http://myhits.isbsib.ch/cgi-bin/motif_scan)預測編碼蛋白潛在功能基序;NetPhos 2.0 工具(http://www.cbs.dtu.dk/services/)預測廣泛磷酸化位點。
表1 擴增梅花鹿MyoG 基因序列引物信息Table 1 Information of primer sequences for amplifying sika deer MyoG gene
1.2.5 序列相似性比對及基于氨基酸序列聚類分析將獲得的吉林梅花鹿MyoG 基因序列在GenBank 數(shù)據(jù)庫中進行BlastN 比對,下載甘肅馬鹿(FJ746497)、印度水牛(KC107779)、普通牛(AB257560)、牦牛(KC184120)、山羊(KX056119)、綿羊(NM_001174109)、豬(NM_001012406)、家馬(NM_001317250)、人(NM_002479)、家 兔(NM_001177749)、小 家 鼠(NM_031189)、褐 家 鼠(NM_017115)、原 雞(FJ882411)、火雞(NM_001303170)和鵝(KP893286)的 MyoG 基因編碼核苷酸及氨基酸序列,利用DNAMAN 5.2.2.0 軟件的多重序列比對程序分別進行MyoG 基因編碼區(qū)核苷酸及氨基酸序列相似性分析,并基于該基因編碼氨基酸序列的比對結(jié)果選擇MEGA軟件的Phylogenetic Tree 構(gòu)建分子系統(tǒng)進化樹,分析物種間的親緣進化關(guān)系。
以吉林梅花鹿血液基因組DNA為模板,利用表1中引物,采用PCR技術(shù)擴增出6 對特異性產(chǎn)物(圖1)。6 對片段大小與預期設(shè)計擴增長度一致、條帶單一、清晰,無拖尾,表明擴增效果較好,可用于后續(xù)克隆測序。
圖1 梅花鹿MyoG 基因6 對引物PCR 產(chǎn)物電泳結(jié)果Fig.1 Electrophoresis result of the products of MyoG gene in sika deer from 6 pairs primers
將目的基因純化后送上海生工生物工程有限公司進行克隆測序,對測序結(jié)果進行人工校對、拼接,所得序列長度為3 162 bp,與NCBI 中甘肅馬鹿、印度水牛和山羊MyoG 基因序列的相似性分別達99%、94%和92%(圖2)。結(jié)果初步表明,本研究獲得的序列即為吉林梅花鹿MyoG 基因序列。通過GENSCAN 在線軟件分析可知,梅花鹿MyoG基因包括3 個外顯子、2 個內(nèi)含子及部分 5 UTR(381 bp)、3 UTR(690 bp),3 個外顯子核苷酸長度分別為480、82 和122 bp,2 個內(nèi)含子為799、608 bp,該序列已提交GenBank,登載號為HZ56689。
圖2 梅花鹿MyoG 基因核苷酸序列BLAST 部分結(jié)果Fig.2 Partial results of BLAST for nucleotide sequence of sika deer MyoG gene
梅花鹿MyoG 基因的CDS 序列和推導的氨基酸序列如圖3 所示,應(yīng)用NCBI 的ORF Finder 程序分析梅花鹿MyoG 基因序列,并參照Kozak 法則[21],獲得ORF,起始密碼子ATG 位于382 bp 處,終止密碼子為TGA,由此得出,梅花鹿MyoG 基因CDS 區(qū)核苷酸序列全長684 bp,共編碼227 個氨基酸,其中酸性氨基酸31 個(D 和E,13.66%)、堿性氨基酸 33 個(K、R 和 H,14.54%)、極性氨基酸58 個(N、C、Q、S、T、Y,25.55%)、疏水性氨基酸 105 個(M、A、I、L、F、W、V、P和G,46.26%)。進一步分析發(fā)現(xiàn),編碼序列中堿基A、C、G、T的平均含量分別為20.61%、32.46%、30.12%和16.81%,G+C 含量較高(62.58%),A+T 含量為37.42%。
圖3 梅花鹿MyoG 基因編碼氨基酸序列分析Fig.3 Analysis of amino acid sequence coded by sika deer MyoG gene
將推導的吉林梅花鹿MyoG蛋白通過NCBI網(wǎng)站的保守結(jié)構(gòu)功能域進行預測(圖4)可知,1~89 位氨基酸為MYOD 家族特有的堿性結(jié)構(gòu)域(Basic domain),85~136 位氨基酸為螺旋-環(huán)-螺旋 DNA 結(jié)合結(jié)構(gòu)域(Helix-loop-helix DNA binding domain)。通過在線軟件NetPhos 3.1 Server 中對MyoG 基因編碼氨基酸序列進行磷酸化位點預測(圖3),吉林梅花鹿MyoG 基因編碼氨基酸序列含有21 個激酶磷酸化位點,其中3個 Tyr 位點、2 個 Thr 位點和 16 個 Ser 位點,主要能夠被unsp、PKA、CKI、PKC、PKG、cdc2、cdk5 等蛋白激酶磷酸化;而Motif Scan 軟件分別預測到1 個核定位信號蛋白(85~99:RRRAATLREKRRLKK)、4 個酪蛋白激酶磷酸化位點(90~93:TLRE,178~181:SALE,206~209:SIVD,212~215:TVED)、1 個蛋白激酶 C 磷酸化位點(90~92:TLR)和2 個單環(huán)磷酸腺苷磷酸化位點(77~80:KRKS,108~111:KRST)。
編碼核苷酸序列比對表明,梅花鹿與NCBI 中公布的馬鹿MyoG基因CDS區(qū)存在6 個變異位點:219、243、646、647、648 和 653 bp,其中,243 bp 處為同義突變,其他為錯義突變,分別引起第73 位半胱氨酸(Cys,C)變?yōu)榫彼幔ˋrg,R),第 216 位絲氨酸(Ser,S)變?yōu)槔i氨酸(Val,V),第 218 位丙氨酸(Ala,A)變?yōu)槔i氨酸(Val,V)(圖5)。
圖4 梅花鹿MyoG 基因編碼氨基酸序列保守結(jié)構(gòu)功能域Fig.4 Conserved domain of the protein encoded by sika deer MyoG gene
圖5 梅花鹿與馬鹿MyoG 基因氨基酸序列比對結(jié)果Fig.5 Sequence comparison result of MyoG gene amino acid between sika deer and wapiti
利用DNAMAN 5.2.2.0 軟件的多重序列比對程序?qū)⒚坊古c其他物種 MyoG 基因編碼區(qū)核苷酸及推導氨基酸序列進行同源性比對,結(jié)果表明,吉林梅花鹿與甘肅馬鹿、印度水牛、牦牛、普通牛、山羊、綿羊、家馬、豬、家兔、小家鼠、褐家鼠、人、原雞、火雞、鵝的MyoG基因編碼區(qū)核苷酸序列相似性分別為99.12%、96.64%、95.91%、95.32%、96.64%、96.49%、89.77%、90.79%、87.48%、87.43%、87.13%、89.47%、70.27%、68.11%和 71.43%,推導氨基酸序列相似性分別為98.68%、97.36%、96.92、96.48%、96.92%、96.92%、92.07%、95.15%、91.67%、92.51%、91.63%、92.51%、68.83%、67.97%和69.70%。系統(tǒng)進化樹表明(圖6),梅花鹿MyoG 氨基酸序列與馬鹿、印度水牛、牦牛、普通牛、山羊及綿羊相似性較高,在系統(tǒng)進化樹中距離較近,聚為一支。MyoG 的系統(tǒng)進化樹與其生物進化的物種樹保持基本一致,符合物種的進化規(guī)律,表明MyoG 基因的編碼區(qū)在物種間相對保守。
圖6 16 個物種MyoG 氨基酸序列系統(tǒng)進化樹Fig.6 Aminoacidsequence phylogenetic tree of 16species MyoG
目前,國內(nèi)、外對肌細胞生成素基因功能的研究相對較少,在特種經(jīng)濟動物梅花鹿MyoG 基因中的研究尚屬空白。本試驗根據(jù)已知哺乳動物基因序列信息,利用與梅花鹿親緣關(guān)系最近的馬鹿 MyoG 基因序列設(shè)計引物,采用PCR、基因分段克隆及Sanger 測序技術(shù),成功獲取了吉林梅花鹿MyoG 基因全長核苷酸序列,進一步利用生物信息學方法對MyoG 基因編碼蛋白的結(jié)構(gòu)特性進行了預測與分析,為深入解析梅花鹿MyoG基因調(diào)控肌肉生長發(fā)育機理提供了分子生物學基礎(chǔ)信息和理論依據(jù)。
MyoG 是生肌調(diào)節(jié)因子家族的重要成員之一,屬于堿性-螺旋-環(huán)-螺旋轉(zhuǎn)錄因子,并且MyoG 是成肌調(diào)節(jié)因子MRFs家族中唯一可在所有骨骼肌細胞系中均可表達的基因,屬于肌肉特異性啟動子,其在調(diào)控成肌細胞分化為成熟肌肉細胞的過程中具有十分重要的作用[22]。另外,bHLH 結(jié)構(gòu)是MRFs 家族的保守區(qū),與DNA結(jié)合以及激活轉(zhuǎn)錄有關(guān),也是和其他基因相互作用的位點[23],因此bHLH 結(jié)構(gòu)是鑒定該家族基因的重要依據(jù)之一。本研究獲得的梅花鹿 MyoG 基因編碼的氨基酸序列經(jīng)NCBI網(wǎng)站的保守結(jié)構(gòu)功能域在線軟件分析表明,含有該類基因典型的bHLH 結(jié)構(gòu)域位于梅花鹿MyoG 推導氨基酸肽鏈的1~136 位,在該基因外顯子 1 內(nèi)。Soumillion 等[24]研究發(fā)現(xiàn),豬 MyoG 基因外顯子1 也編碼bHLH結(jié)構(gòu)域,且豬、小鼠與人該基因bHLH 結(jié)構(gòu)域氨基酸序列完全一致。劉錚鑄等[25]和趙子貴等[26]在山羊MyoG 基因中也獲得了類似的結(jié)果,本研究結(jié)果與之一致。因此,從推導氨基酸序列保守結(jié)構(gòu)域角度也證明了本研究獲得的梅花鹿核苷酸序列即為其MyoG 基因。
本研究通過分段克隆吉林梅花鹿 MyoG 基因完整外顯子及內(nèi)含子區(qū),將拼接獲得的編碼區(qū)核苷酸序列與GenBank 中甘肅馬鹿MyoG 基因的同源序列進行比對,發(fā)現(xiàn)共有6 處發(fā)生堿基變異。對比梅花鹿與馬鹿MyoG氨基酸序列,相似性為98.68%,僅第73 位由半胱氨酸(Cys)變?yōu)榫彼幔ˋrg),第 216 位由絲氨酸(Ser)變?yōu)槔i氨酸(Val),第 218 位由丙氨酸(Ala)變?yōu)槔i氨酸(Val)。梅花鹿與水牛、牦牛、普通牛、山羊、綿羊、家馬、豬、家兔、小家鼠、褐家鼠、人等物種MyoG基因氨基酸相似性均大于91%,但與原雞、火雞、鵝的相似性較低。從本研究比較的16 個物種中核苷酸和氨基酸水平的變異來看,各物種間核苷酸水平的變異程度要明顯高于氨基酸水平的變異,這可能是由于梅花鹿與各物種在核苷酸水平上的多數(shù)堿基替代或轉(zhuǎn)換并沒有引起編碼氨基酸的改變,屬于同義突變,也初步表明 MyoG 基因的編碼區(qū)在長期的生物進化過程中保守性較強。同時,基于該基因編碼的氨基酸序列構(gòu)建的系統(tǒng)進化樹也顯示,梅花鹿與同為反芻亞目的馬鹿、牛及羊的親緣關(guān)系較近,聚為一支,該結(jié)果與梁春年等[27]、占思遠等[28]及王強輝等[29]分別利用牦牛胰島素樣生長因子1 受體(IGF1-R)基因、南江黃羊胰島素樣生長因子結(jié)合蛋白2(IGFBP-2)基因及馴鹿表皮生長因子受體(EGFR)基因構(gòu)建反芻亞目分子系統(tǒng)進化樹得到的結(jié)果趨于一致。