楊文志,張明月,王冠楠,趙宇鵬,張巍巍,李世杰*
(1.河北農(nóng)業(yè)大學生命科學學院,保定 071001;2.河北北方學院,張家口 075000)
?
2個印記的基因間lncRNAs位于牛Dlk1-Dio3印記區(qū)域
楊文志1,張明月1,王冠楠1,趙宇鵬2,張巍巍1,李世杰1*
(1.河北農(nóng)業(yè)大學生命科學學院,保定 071001;2.河北北方學院,張家口 075000)
旨在鑒別牛Dlk1-Dio3印記區(qū)域內(nèi)的新印記lncRNAs。本研究選取位于Meg8與Meg9基因間的2組表達序列標簽(EST),通過RT-PCR克隆序列并進行分析,結(jié)果發(fā)現(xiàn)其具有l(wèi)ncRNA的特征,命名為Linc24062和Linc24063。分析Linc24062和Linc24063在牛8個組織(心、肝、脾、肺、腎、骨骼肌、皮下脂肪和大腦)中的表達,發(fā)現(xiàn)2個lncRNAs在被檢測的組織中均表達。利用基于單核苷酸多態(tài)性(SNP)位點的直接測序法,通過比較雜合子牛中SNP位點處基因組PCR擴增產(chǎn)物與RT-PCR擴增產(chǎn)物的測序峰圖分析Linc24062和Linc24063的印記狀態(tài),發(fā)現(xiàn)Linc24062和Linc24063在牛被檢測組織中均為單等位基因表達,說明Linc24062和Linc24063在牛中是印記的。
基因組印記;基因間長非編碼RNA;Dlk1-Dio3印記域;單核苷酸多態(tài)性;牛
基因組印記(Genomic imprinting)是一種表觀遺傳(Epigenetic)現(xiàn)象,是指在哺乳動物早期配子發(fā)生過程中接近1%的蛋白編碼基因經(jīng)過表觀遺傳標記,從而使基因的表達具有親本特異性[1]。絕大多數(shù)哺乳動物的基因組都可以轉(zhuǎn)錄成長非編碼RNA[2-4]。LncRNAs作為長度大于200 bp的一類非編碼蛋白的RNA,通過與靶基因或其啟動子重疊[5]或通過對染色質(zhì)表觀遺傳標記進行修飾[6]建立靶基因的印記而發(fā)揮重要的生物功能。印記基因通常成簇存在,位于印記基因簇里的lncRNAs,通常具有親本等位基因特異性表達的特點。Dlk1-Dio3印記區(qū)域由于在胚胎發(fā)育和細胞分化過程中的重要作用而備受關注,是目前研究比較充分的印記區(qū)域之一。其中位于Dlk1-Dio3印記域內(nèi)母源等位基因特異性表達的非編碼RNA被鑒定與誘導全能干細胞發(fā)育的全能性有關[7-8]。一些位于兩個基因間的長非編碼RNA,被稱為基因間長非編碼RNA(Intergenetic long noncodng RNA,lincRNA)。近來在鼠Dlk1-Dio3印記域的印記基因Meg8與Meg9及Meg9與Dio3之間分別發(fā)現(xiàn)了1個新的長非編碼RNAB830012L14Rik和AK044800[9-10]。在鼠中,基因間長非編碼RNAB830012L14Rik被鑒定為母源特異性表達印記基因,且主要在大腦、心、肺和肝組織中表達[9]。而AK044800主要在小鼠胚胎發(fā)育時期前腦組織中表達,在腦中AK044800為雙等位基因表達[10]。對牛的Meg8與Meg9基因的可變剪切體,印記狀態(tài)及表達模式進行分析[11-12]。隨著轉(zhuǎn)錄組測序的進行,一些未知功能的EST序列定位在牛Dlk1-Dio3印記區(qū)域。本研究旨在牛Dlk1-Dio3印記域Meg8與Meg9基因間區(qū)域鑒別新的lincRNAs,并對其印記狀態(tài)及表達模式進行分析。
1.1試驗材料
試驗用動物樣品取自當?shù)赝涝讏觯?2頭成年的荷斯坦奶牛(Holstein)屠宰后,立即采取每個個體的組織樣品,包括心、肝、脾、肺、腎、骨骼肌、皮下脂肪、大腦等組織,裝入編號的采樣袋中,立即投入液氮,-70 ℃保存,以備后續(xù)試驗使用。
1.2RNA的提取及反轉(zhuǎn)錄
利用Trizol RNA提取試劑盒(Invitrogen,美國)提取總RNA,用無RNA酶的DNaseⅠ去除可能的DNA污染。利用TransGen反轉(zhuǎn)錄試劑盒(全式金,中國)進行cDNA的合成。20 μL反應體系中含有大約1 μg的RNA,1 μL的Oligo(dT)引物,10 μL 2×ES Reaction Mix,1 μL RT Enzyme Mix,用無RNA酶的水補齊。反轉(zhuǎn)錄反應程序按廠家提供的產(chǎn)品說明書進行,總RNA、Oligo(dT)引物、無RNA酶水加好后輕輕混勻,65 ℃變性10 min,打開RNA二級結(jié)構,然后在每個反應體系中加入2×ES Reaction Mix 和RT Enzyme Mix,42 ℃孵育30 min,85 ℃保溫5 min,終止反應,-20 ℃保存待用。
1.3RT-PCR 及Linc24062和Linc24063的克隆
在牛的Dlk1-Dio3印記域內(nèi),為發(fā)現(xiàn)新的印記基因,用UCSC Genome Browser (http://genome.ucsc.edu/) Blat對Meg8與Meg9基因間的表達序列進行了仔細的搜索分析,鑒別出6個EST序列。一些EST序列與其他EST部分重疊,而一些EST沒有重疊但所處位置很近,所以推測它們可能是同一基因的一部分。為證明此猜想,根據(jù)EST序列用Primer5設計對應的引物,用F1 (5′-CAGCTCCGATGGGGAT-3′) 和R1 (5′-GTTAGTCTTTTTGTTAGGCAG-3′),F(xiàn)2(5′-CTTCAGATTGCTGTGGGA-3′)和R2 (5′-GGAGTTGGTGATGGGC-3′) 擴增來源于試驗動物各組織的cDNA,分別克隆Linc24062和Linc24063。利用1對跨內(nèi)含子的引物Gap-F (5′-GCACAGTCAAGGCAGAGAAC-3′)和Gap-R (5′-GTGGCAGTGATGGTGGA-3′) 擴增一段375 bp大小的GAPDH(Accession No.:BTU85042)片段作內(nèi)參。反應體系(25 μL):上下游引物(10 μmol·L-1)各0.5 μL,1 μL cDNA模板,2 μL dNTP(2.5 mmol·L-1),2.5 μL 10×LA Taq Buffer,0.2 μL LA Taq DNA polymerase(寶生物,中國),18.3 μL雙蒸水。RT-PCR反應條件:94 ℃預變性5 min;94 ℃變性30 s,54 ℃退火30 s,72 ℃延伸30 s,35個循環(huán);72 ℃延伸10 min。擴增產(chǎn)物用1.5%瓊脂糖凝膠電泳進行檢測,并用E.Z.N.A.Gel-膠回收試劑盒(Omega,美國)純化回收,克隆到PMD18-T載體(寶生物,中國)上,送華大基因公司測序。
1.4DNA的提取及SNP的鑒定
利用DNA提取試劑盒(生工,中國)提取32頭荷斯坦奶牛的肝組織DNA。引物F1和R1,F(xiàn)2和R2分別用于擴增Linc24062和Linc24063基因844和754 bp大小的DNA片段,PCR反應體系(25 μL):上下游引物(10 μmol ·L-1)各1 μL,1 μL DNA模板,9.5 μL雙蒸水和12.5 μL ES Tap Master Mix (康為,中國)。PCR反應條件與RT-PCR相同,擴增產(chǎn)物進行膠回收并直接送測序驗證。利用Chromas軟件查看測序圖譜,若存在有效重疊峰則確定該個體為雜合子。
1.5Linc24062和Linc24063的印記狀態(tài)分析
從32頭牛中鑒定的雜合子被用于等位基因特異的表達狀態(tài)分析。將雜合子牛的RNA 反轉(zhuǎn)錄成cDNA,以cDNA為模板,用F1和R1、F2和R2分別為引物擴增Linc24062和Linc24063的目的片段。PCR反應體系和反應條件與SNP鑒定過程相同,擴增產(chǎn)物進行膠回收并直接送測序。
2.1Linc24062和Linc24063是位于Meg8與Meg9基因間非編碼RNA
通過對Meg8與Meg9基因間的表達序列進行搜索,發(fā)現(xiàn)4個序列重疊的ESTs(DY146989、CB436087、CB426809和BP100865)及2個不重疊但位置很近的ESTs(AV603291和AV603290)分別成簇存在(圖1)。以試驗動物的各組織cDNA為模板,兩對引物F1和R1,F(xiàn)2和R2分別用來擴增這兩個EST簇,分別得到844和754 bp大小的產(chǎn)物。為了驗證這些ESTs是否屬于同一個基因,設計了跨越這兩個EST簇的引物,但是沒有檢測到任何RT-PCR產(chǎn)物(結(jié)果未顯示),因此推測這2個序列是兩個不同的基因。用NCBI(www.ncbi.nlm.nih.gov/gorf/gorf.html)中的Open Read in Frame Finder對這2個擴增產(chǎn)物的序列進行預測,均未發(fā)現(xiàn)長的開放閱讀框,推測它們可能都是長的非編碼RNA,此外,沒有檢測到不同的可變剪切體。將得到的兩個長非編碼RNA序列與人、小鼠和羊的EST數(shù)據(jù)庫進行比對(www.ncbi.nlm.nih.gov/BLAST),未發(fā)現(xiàn)相似的EST序列。根據(jù)長非編碼RNA命名規(guī)則將這兩個基因命名為Linc24062和Linc24063,并將序列提交到GenBank(Accession No.:KU955999和KU956000)。
Dlk1~Dio3印記域包括3個父源表達蛋白編碼基因Dlk1、Rtl1 和 Dio3,和幾個母源表達非編碼RNA Gtl2、anti-Rtl1、Meg8和 Meg9。IG-DMR是該印記域的印記調(diào)控中心。父源和母源印記基因分別用灰色和黑色表示,轉(zhuǎn)錄方向如箭頭所示,黑點表示Dlk1-Dio3差異甲基化區(qū)域The Dlk1-Dio3 domain contains three paternally expressed protein-coding genes,Dlk1,Rtl1 and Dio3,and several maternally expressed noncoding RNA genes,Gtl2,anti-Rtl1,Meg8,and Meg9.IG-DMR is the imprinting control region in this domain.Maternally expressed genes are shown in gray and paternally expressed genes in black;the direction of their transcription is indicated.Black lollipops indicate the positions of differentially methylated region of Dlk1-Dio3 domain圖1 Dlk1-Dio3印記區(qū)域Fig.1 Dlk1-Dio3 imprinted domain
2.2Linc24062和Linc24063 在不同組織的表達狀態(tài)
提取3頭牛各組織的RNA,用分光光度計對其進行定量并調(diào)至濃度相同。以RNA反轉(zhuǎn)錄后的cDNA為模板經(jīng)RT-PCR擴增,并以跨內(nèi)含子的引物擴增GAPGH進行對照。Linc24062和Linc24063 在被測的8個組織中分別擴增得到844和754 bp大小的片段(圖 2a),測序驗證為目的產(chǎn)物,表明該基因在被檢測組織中均表達。
2.3Linc24062和Linc24063 中SNP鑒定
用Linc24062的引物F1和R1,Linc24063的引物F2和R2分別擴增來自32頭牛肝組織的DNA,分別得到844和754 bp大小的DNA片段,PCR產(chǎn)物回收后直接測序。在Linc24062中檢測到1個c.559 C>A SNP,在Linc24063中檢測到1個c.215 C>T SNP(圖 2b),鑒定的雜合子牛用于印記狀態(tài)分析。
2.4Linc24062和Linc24063的印記狀態(tài)分析
通過比較雜合子動物中SNP位點在DNA PCR和RT-PCR產(chǎn)物直接測序的峰圖,來確定基因、等位基因的表達狀態(tài)。測序結(jié)果顯示,在檢測的8個組織中,Linc24062(C等位基因)和Linc24063(T等位基因)均為單等位基因表達(圖2c),表明Linc24062 和Linc24063 在牛中是印記基因。
基因組印記是指來自雙親的等位基因依賴親本特異性而導致單等位基因表達的一種非孟德爾遺傳現(xiàn)象[13],第一個lncRNA是在印記區(qū)域里被鑒別出來的[14]。根據(jù)lncRNA所在的位置關系,可以將lncRNA劃分為反義lncRNA,內(nèi)元lncRNA,增強子lncRNA 和基因間lncRNA。除了內(nèi)元lncRNA,絕大多數(shù)lncRNA在基因組印記中發(fā)揮著重要作用[15]。Dlk1-Dio3印記域作為哺乳動物基因組中最大的印記域之一,位于鼠的12號染色體末端,人14號染色體和牛的21號染色體[16-17],該印記域內(nèi)的印記基因在胚胎和胚外組織中均表達并參與胚胎及胎盤的生長發(fā)育調(diào)控,出生后主要參與神經(jīng)和代謝調(diào)控[18-19]。
A. Linc24062和Linc24063在牛不同組織中的表達水平。 1~8.心、肝、脾、肺、腎、骨骼肌、皮下脂肪、大腦;M.DNA marker DL2000(1 000、750、500、250 bp);RT-.陰性對照;B.?;蚪M中Linc24062和Linc24063 基因SNPs的鑒定,箭頭所指SNP位置。C.雜合子牛中心、肝、脾、肺、腎、骨骼肌、皮下脂肪、大腦8個組織的RT-PCR產(chǎn)物測序峰圖,箭頭所指SNP位置A.The expression level of Linc24062 and Linc24063 at different tissues in cattle.1-8.RT-PCR products obtained from heart,liver,spleen,lung,kidney,muscle,subcutaneous fat and brain;M.DNA marker DL2000(1 000,750,500,250 bp);RT-.Negative control;B.Identification of SNPs in cattle Linc24062 and Linc24063 genes,the arrows point the position of SNP;C.Sequence chromatograms of RT-PCR products obtained from eight tissues of hybrid cattle,including heart,liver,spleen,lung,kidney,muscle,subcutaneous fat and brain,the arrows point the position of SNP圖2 Linc24062和Linc24063的表達及印記狀態(tài)分析Fig.2 Expression and imprinting status of Linc24062 and Linc24063
通過對公布的來自不同發(fā)育時期,不同組織牛EST序列進行分析,23 060個牛非編碼RNA被預測到,其中絕大部分(57%)的非編碼RNA是基因間轉(zhuǎn)錄產(chǎn)物[20]。目前Dlk1-Dio3印記域鑒別出來的非編碼RNA均表現(xiàn)母系表達印記,包括Gtl2、Meg8、Meg9等[21-22]。先前本實驗室獲得牛Dlk1-Dio3印記域內(nèi)3個長非編碼RNA的不同可變剪切體,包括Gtl2的6個可變剪切體[23],Meg8的12個可變剪切體[11],和Meg9的3個可變剪切體[12]。本研究對Meg8與Meg9之間的表達序列進行分析,通過RT-PCR 和克隆測序的方法鑒別出兩個新的非編碼RNALinc24062 和Linc24063,未檢測到其他的可變剪切體形式,并發(fā)現(xiàn)這2個LincRNAs在成年荷斯坦奶牛被檢測的8個組織(心、肝、脾、肺、腎、骨骼肌、皮下脂肪、大腦)中均表達,表達模式與Meg8和Meg9的表達模式相似[11-12]。通過PCR產(chǎn)物直接測序的方法,在Linc24062 和Linc24063中分別鑒別到1個SNP(c.559 C>A 和c.215 C>T)。對雜合子牛中這兩個非編碼RNA的印記狀態(tài)進行分析,發(fā)現(xiàn)Linc24062和Linc24063在被檢測的所有組織中均為單等位基因特異性表達,說明Linc24062和Linc24063在牛中為印記的長非編碼RNA。本研究豐富了牛Dlk1-Dio3印記域內(nèi)已知的印記長非編碼RNA的數(shù)量,為進一步研究該區(qū)域的調(diào)控機制及功能奠定基礎。
[1]BARTOLOMEI M S,F(xiàn)ERGUSON-SMITH A C.Mammalian genomic imprinting[J].ColdSpringHarbPerspectBiol,2011,3(7):a002592.
[2]CARNINCI P,KASUKAWA T,KATAYAMA S,et al.The transcriptional landscape of the mammalian genome[J].Science,2005,309(5740):1559-1563.
[3]KATAYAMA S,TOMARU Y,KASUKAWA T,et al.Antisense transcription in the mammalian genome[J].Science,2005,309(5740):1564-1566.
[4]HUANG R,JARITZ M,GUENZL P,VLATKOVIC I,et al.An RNA-seq strategy to detect the complete coding and non-coding transcriptome including full-length imprinted macro ncRNAs[J].PLoSOne,2011,6(11):e27288.
[5]AMARAL P P,MATTICK J S.Noncoding RNA in development[J].MammGenome,2005, 19(7-8):454-492.
[6]HAGAN J P,O’NEILL B L,STEWART C L,et al.At least ten genes define the imprintedDlk1-Dio3 cluster on mouse chromosome 12qF1[J].PLoSOne,2009,4(2):e4352.
[7]LIU L,LUO G Z,YANG W,et al.Activation of the imprintedDlk1-Dio3 region correlates with pluripotency levels of mouse stem cells[J].JBiolChem,2010,285(25):19483-19490.
[8]STADTFELD M,APOSTOLOU E,AKUTSU H,et al.Aberrant silencing of imprinted genes on chromosome 12qF1 in mouse induced pluripotent stem cells[J].Nature,2010,465(7295):175-181.
[9]FENG W Z,ZENG T B,ZHENG B H,et al.Imprinting and expression analysis of a non-coding RNA gene in the mouseDlk1-Dio3 domain[J].JMolHistol,2011,42(4):333-339.
[10]HAN Z,LIU Q,HUANG Z,et al.Expression and imprinting analysis of AK044800,a transcript from theDlk1-Dio3 imprinted gene cluster during mouse embryogenesis[J].MolCell,2013,35(4):285-290.
[11]HOU X H,LI D J,SU H,et al.Molecular cloning,expression,and imprinting status of maternally expressed gene 8 (Meg8) in dairy cattle[J].RussJGenet,2011,47(8):994-998.
[12]ZHANG K,LI D,WANG M,et al.The differential expression of alternatively spliced transcripts and imprinting status ofMeg9 gene in cows[J].AnimGenet,2014,45(5):660-664.
[13]VERONA R I,MANN M R,BARTOLOMEI M S.Genomic imprinting:intricacies of epigenetic regulation in clusters[J].AnnuRevCellDevBiol,2003,19:237-259.
[14]AUTUORO J M,PIRNIE S P,CARMICHAEL G G.Long noncoding RNAs in imprinting and X chromosome inactivation[J].Biomolecules,2014,4(1):76-100.
[15]KANDURIC.Long noncoding RNAs:Lessons from genomic imprinting[J].BiochimBiophys,2016,1859(1):102-111.
[16]SCHMIDT J V,MATTESON P G,JONES B K,et al.TheDlk1 andGtl2 genes are linked and reciprocally imprinted[J].GenesDev,2000,14(16):1997-2002.
[17]TAKADA S,TEVENDALE M,BAKER J,et al.Delta-LikeandGtl2 are reciprocally expressed,differentially methylated linked imprinted genes on mouse chromosome 12[J].CurrBiol,2000,10(18):1135-1138.
[18]LIN S P,YOUNGSON?N,TAKADA S,et al.Asymmetric regulation of imprinting on the maternal and paternal chromosomes at theDlk1-Gtl2 imprinted cluster on mouse chromosome 12[J].NatGenet,2003,35(1):97-102.
[19]TAKAHASHI N,OKAMOTOA,KOBAYASHI R,et al.Deletion ofGtl2,imprinted non-coding RNA,its differentially methylated region with induces lethal parent-origin-dependent in mice[J].HumMolGenet,2009,18(10):1879-1888.
[20]ZHIPENG Q,ADELSON D L.Bovine ncRNAs are abundant,primarily intergenetic,conserved and associated with regulatory genes[J].PLoSOne,2012,7(8):e42638.
[21]PAULSEN M,TAKADA S,YOUNGSON N A,et al.Comparative sequence analysis of the imprintedDlk1-Gtl2 locus in three mammalian species reveals highly conserved genomic elements and refines comparison with theIgf2-H19 region[J].GenomeRes,2001,11(12):2085-2094.
[22]DA ROCHA S T,EDWARDS C A,ITO M,et al.Genomic imprinting at the mammalianDlk1-Dio3 domain[J].TrendsGenet,2008,24(6):306-316.
[23]SU H,LI D,HOU X,et al.Molecular structure of bovineGtl2 gene and DNA methylation status ofDlk1-Gtl2 imprinted domain in cloned bovines[J].AnimReprodSci,2011,127(1-2):23-30.
(編輯程金華)
Two Imprinted Long Non-coding RNAs Located in CattleDlk1-Dio3 Domain
YANG Wen-zhi1,ZHANG Ming-yue1,WANG Guan-nan1,ZHAO Yu-peng2,ZHANG Wei-wei1,LI Shi-jie1*
(1.CollegeofLifeScience,AgriculturalUniversityofHebei,Baoding071001,China;2.HebeiNorthUniversity,Zhangjiakou075000,China)
The objective of this study was to find novel imprinted long noncoding RNAs (lncRNAs) in cattleDlk1-Dio3 domain.Transcripts mapping to this region betweenMeg8 andMeg9 were under a systematic search and 2 novel lncRNAs were identified,which were named asLinc24062 andLinc24063 according to annotated bibliography of genecode.The expression patterns ofLinc24062 andLinc24063 in adult cattle tissues were characterized using reverse transcription polymerase chain reaction (RT-PCR).The results indicated thatLinc24062 andLinc24063 were expressed in all 8 tested tissues,including heart,liver,spleen,lung,kidney,subcutaneous fat,skeletal muscle and brain.The imprinting status ofLinc24062 andLinc24063 was assessed based on a polymorphism-based sequencing approach.The results showed thatLinc24062 andLinc24063 exhibited monoallelic expression in all examined cattle tissues by comparing sequence chromatograms between genomic DNA and cDNA levels at single nucleotide polymorphism (SNP) site,suggesting thatLinc24062 andLinc24063 were imprinted in cattle.
genomic imprinting;intergenic lncRNAs;Dlk1-Dio3 domain;SNP;cattle
10.11843/j.issn.0366-6964.2016.09.013
2016-04-05
國家自然科學基金項目(31372312;30972098);河北省自然科學基金項目(C2016204092)
楊文志(1991-),女,河北衡水人,碩士生,主要從事動物分子遺傳學研究,Tel:0312-7528270,E-mail:anshiyangwenzhi@163.com
李世杰,教授,博士生導師,Tel:0312-7528270,E-mail:lishijie20005@163.com
S823.2;S813.3
A
0366-6964(2016)09-1848-05