劉 宇,段曉燕
(1.河北北方學(xué)院 實(shí)驗(yàn)動物中心,河北 張家口 075000;2河北北方學(xué)院 教務(wù)處,河北 張家口 075000)
隨著測序技術(shù)的不斷發(fā)展,大量哺乳動物基因組已經(jīng)完成了測序并進(jìn)行了組裝。在哺乳動物基因組中,mRNA被認(rèn)為是最重要的元件,但是其僅占基因組或轉(zhuǎn)錄組的一小部分,其余為非蛋白編碼基因包括siRNAs、miRNAs、piRNAs以及l(fā)ncRNA等等,這些非編碼RNA也參與生命活動各個(gè)方面的調(diào)控過程[1-2]。
不同于小RNA分子,lncRNA是一種類似于mRNA長度大于200個(gè)堿基,在轉(zhuǎn)錄水平、轉(zhuǎn)錄后水平和染色體重塑等多種層面調(diào)控基因表達(dá)的的保守性較低的非蛋白編碼RNA分子[3-4]。非編碼RNA的作用包括且不僅限于X染色體失活、P53介導(dǎo)的細(xì)胞凋亡、癌細(xì)胞轉(zhuǎn)移、誘導(dǎo)干細(xì)胞的重編程以及其他的一些過程[5-6]。隨著第二代測序技術(shù)的發(fā)展以及l(fā)ncRNA數(shù)據(jù)庫的建立,為大規(guī)模篩選與性成熟調(diào)節(jié)過程相關(guān)的lncRNA提供了技術(shù)依據(jù)。
家禽的性成熟過程受到不同轉(zhuǎn)錄本構(gòu)建的分子調(diào)控網(wǎng)絡(luò)共同作用,而卵巢是一個(gè)獨(dú)特又重要的生殖器官和內(nèi)分泌腺,蛋雞的卵巢發(fā)育程度直接關(guān)系著其產(chǎn)蛋性能的優(yōu)劣,卵巢組織有關(guān)基因或非編碼RNA表達(dá)的差異類型及其表達(dá)量的變化在分子水平上影響蛋雞繁殖性能[7]。但相關(guān)研究,特別是關(guān)于lncRNA仍報(bào)道甚少。
本研究基于二代測序技術(shù)對不同產(chǎn)蛋階段蛋雞卵巢組織差異表達(dá)lncRNA進(jìn)行篩選與鑒定,進(jìn)一步挖掘影響蛋雞繁殖性能的關(guān)鍵調(diào)節(jié)基因以及功能元件,研究成果有助于研究人員更好的理解蛋雞性成熟過程中的分子調(diào)控機(jī)制,從而為蛋雞育種工作服務(wù)。
以張家口地區(qū)飼養(yǎng)的京紅蛋雞為研究對象。整個(gè)試驗(yàn)周期內(nèi),所有蛋雞均自由取食、飲水,執(zhí)行常規(guī)光照和免疫等程序。于20周齡、30周齡分別隨機(jī)選取產(chǎn)蛋雞,稱重后取最接近平均值的3羽產(chǎn)蛋雞,屠宰并取出卵巢組織,放入液氮中保存?zhèn)溆?20周齡:LH_5M,30周齡:LH_6M)。獲取的卵巢組織采用Trizol一步法提取總RNA,采用Bioanalyzer 2100及RNA 6000 Nano Lab Chip Kit RNA對RNA質(zhì)量與純度進(jìn)行檢測。采用Ribo-Zero Gold Kit對10μg總RNA進(jìn)行核糖體RNA去除,離子打斷法將總RNA裂解為小片段,逆轉(zhuǎn)錄法合成cDNA文庫,以PCR法檢測文庫大小及濃度,采用Illumina Hiseq 4000(杭州聯(lián)川)雙末端測序法上機(jī)測序。
對測序原始數(shù)據(jù)去除低質(zhì)量數(shù)據(jù),得到的有效數(shù)據(jù)(Valid Data)采用Bowtie2[8]和物種的參考基因組(Gallus_gallus_5.0)進(jìn)行比對,同時(shí)根據(jù)基因組注釋文件(gtf和gff)指定的基因位置信息分別進(jìn)行統(tǒng)計(jì)。對獲得的轉(zhuǎn)錄本去除已知的mRNA和小于200 bp的轉(zhuǎn)錄本,再對剩下的轉(zhuǎn)錄本進(jìn)行l(wèi)ncRNA預(yù)測。預(yù)測軟件為CPC(Coding Potential Calculator)和CNCI(Coding-Non-Coding Index)。
采用StringTie和Ballgown對測序獲得的轉(zhuǎn)錄本進(jìn)行表達(dá)水平計(jì)算,基因的表達(dá)水平主要采用每百萬測序堿基中每千個(gè)轉(zhuǎn)錄子測序堿基中所包含的測序片斷數(shù) FPKM度量基因表達(dá)的豐度值。差異表達(dá)lncRNA使用R語言的Ballgown包進(jìn)行差異分析,選擇閾值矯正P值Padj<0.05。
對篩查到的差異表達(dá)lncRNA進(jìn)行的功能富集分析依據(jù)其靶基因進(jìn)行。根據(jù)lncRNA位置確定lncRNA靶基因。篩選獲得的靶基因用于功能富集分析,包括Gene ontology和KEGG通路分析。采用David軟件進(jìn)行功能富集分析,ggplot2作散點(diǎn)圖展示。
對高通量測序結(jié)果篩查到的差異表達(dá)lncRNA,利用實(shí)時(shí)熒光定量驗(yàn)證表達(dá)量差異性。qRT-PCR引物由Primer 5.0軟件設(shè)計(jì)(表1)。以3-磷酸甘油醛脫氫酶基因(GAPDH)作為內(nèi)參。反應(yīng)體系包括95 ℃ 3 min、95 ℃15 s以及60 ℃和72 ℃各30 s,共計(jì)40循環(huán),熔解階段由95 ℃ 30 s和60 ℃ 1 min組成,運(yùn)用2-ΔΔCt法計(jì)算不同組別lncRNA的倍數(shù)變化,使用SPSS 26.0單因素方差分析進(jìn)行分析,設(shè)定P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
表1 引物信息Table 1 Primer information
各樣品測序數(shù)據(jù)產(chǎn)出如表2所示,共得到57.95 Gb Clean data,單個(gè)樣品Clean data大于8.29 Gb。GC 含量在48%~51%范圍內(nèi),Q30堿基百分比大于94.71%;說明測序數(shù)據(jù)獲取完整,可用于后續(xù)分析。參考基因組比對結(jié)果顯示檢測樣品的Reads與參考基因組的比對效率介于76.90%~79.61%之間,大部分轉(zhuǎn)錄本在參考基因組中均是唯一比對位置。
表2 轉(zhuǎn)錄組測序及序列比對結(jié)果Table 2 Result of RNA-seq and sequence align
對測序獲得的數(shù)據(jù),按照篩選依據(jù),在20周齡和30周齡京紅蛋雞卵巢組織篩選到1 283個(gè)lncRNA。對lncRNA的分類(圖1A)表明,篩選到的lncRNA多為未知或基因間轉(zhuǎn)錄本,其次為反義鏈外顯子重疊區(qū)域。對篩選獲得的lncRNA進(jìn)行基因組定位,結(jié)果見圖1B。對lncRNA與mRNA的結(jié)構(gòu)特征和表達(dá)模式分析發(fā)現(xiàn),lncRNA長度與mRNA類似,多數(shù)分布在>1 000 bp范圍(圖1C)。而表達(dá)量上,lncRNA要明顯低于蛋白質(zhì)編碼基因(圖1D),log10(FPKM)分布在0~1之間,同時(shí)數(shù)量也少于蛋白質(zhì)編碼基因。
圖1 lncRNA轉(zhuǎn)錄組特征A.lncRNA分類統(tǒng)計(jì);B.lncRNA染色體分布統(tǒng)計(jì);C.lncRNA長度統(tǒng)計(jì);D.lncRNA表達(dá)量與數(shù)量統(tǒng)計(jì)Fig.1 Transcriptom characteristics of lncRNAA. Classified statistic of lncRNA;B. Chormsome distribution of lncRNA;C. Statistic of lncRNA length;D. Expression level and amount of lncRNA
在本研究中,采用矯正P值≤0.05作為閾值,共篩選到10個(gè)差異表達(dá)lncRNA,其中7個(gè)在20周齡蛋雞卵巢組織中高表達(dá),3個(gè)在30周齡蛋雞卵巢組織中高表達(dá)(圖2A)?;鹕綀D展示了兩組間最具顯著性的差異基因(|log2FoldChange|≥1且Padj≤0.05)(圖2B),可以看到篩選到的10個(gè)差異表達(dá)lncRNA表達(dá)量均較低,符合lncRNA表達(dá)模式,但大量基因處于差異不顯著狀態(tài)。對篩選到的10個(gè)差異表達(dá)lncRNA的qRT-PCR結(jié)果顯示與轉(zhuǎn)錄組測序結(jié)果相同(圖2C)。
圖2 差異表達(dá)lncRNA分析A.差異表達(dá)lncRNA數(shù)量;B.火山圖;C.qRT-PCR結(jié)果Fig. 2 Analysis of differential expressed lncRNAsA. amount of differential expressed lncRNA;B. volcano map;C. qRT-PCR result
基于位置關(guān)系,1 283個(gè)lncRNA潛在的靶基因有2 960個(gè),結(jié)合表達(dá)模式分析,10個(gè)差異表達(dá)lncRNA中有2個(gè)lncRNA具有順式調(diào)控靶基因,分別為MSTRG.14606對應(yīng)的肌動蛋白γ2基因(actin gamma 2,ACTG2)和MSTRG.15311對應(yīng)的肌間線蛋白基因(desmin,DES),同時(shí)lncRNA與mRNA表達(dá)量存在負(fù)相關(guān)。對lncRNA的功能富集分析結(jié)果如圖3所示。由圖3可見,顯著富集的前5條GO通路包括:心率調(diào)節(jié)(GO:0086091)、結(jié)構(gòu)分子激活(GO:0005198)、蛋白激酶結(jié)合(GO:0019901)、離子通道結(jié)合(GO:0044325)以及基底外側(cè)質(zhì)膜(GO:0016323)。顯著富集的前5條KEGG通路包括:焦點(diǎn)粘連通路(4510)、mTOR 信號通路(4150)、孕酮介導(dǎo)的卵母細(xì)胞成熟(4914)、卵母細(xì)胞成熟(4114)以及p53 信號通路(4115)。
圖3 功能富集分析A.GO功能富集分析;rich factor表示位于該GO的差異基因個(gè)數(shù)/位于該GO的總基因數(shù);B.KEGG通路分析; rich factor表示位于該KEGG的差異基因個(gè)數(shù)/位于該KEGG的總基因數(shù)Fig.3 Functional enrichment analysisA. GO enrichment analysis; rich factor represents the DE gene number/total gene number in this GO term;B. KEGG pathway analysis; rich factor represents the DE gene number/total gene number in this KEGG pathway
高通量測序和組學(xué)技術(shù)研究方式的發(fā)展使得研究人員能夠?qū)Σ煌纳镞^程中的分子調(diào)控網(wǎng)絡(luò)進(jìn)行篩查,這已經(jīng)成為解析生物學(xué)過程的金標(biāo)準(zhǔn)[9]。本研究利用RNA-seq技術(shù)對不同生長發(fā)育階段的蛋雞卵巢組織的lncRNA進(jìn)行篩選與鑒定,在20周齡和30周齡京紅蛋雞卵巢組織中,共鑒定到1 283個(gè)lncRNA表達(dá),并對lncRNA進(jìn)行了轉(zhuǎn)錄組學(xué)特征分析,lncRNA在不同染色體分布不同,且表達(dá)量與mRNA存在較大差異,這與其他研究結(jié)果一致[10]。同時(shí)qRT-PCR技術(shù)也驗(yàn)證了RNA-seq的結(jié)果,提示RNA-seq在lncRNA研究中可以發(fā)揮重要作用。
20周齡為京紅蛋雞的產(chǎn)蛋初期,30周齡京紅蛋雞達(dá)到產(chǎn)蛋高峰期,這期間伴隨著蛋雞生長與繁殖過程,存在著復(fù)雜的分子調(diào)控網(wǎng)絡(luò),特別是基因表達(dá)的變化,往往會受到非編碼RNA的影響[11]。本研究在20周齡和30周齡京紅蛋雞卵巢組織中篩查到10個(gè)差異表達(dá)lncRNA,提示這兩個(gè)生長發(fā)育階段lncRNA表達(dá)譜差距較小,但在本研究中發(fā)現(xiàn)差異表達(dá)lncRNA MSTRG.14606和MSTRG.15311對ACTG2和DES可能存在順式調(diào)節(jié)作用機(jī)制,且lncRNA表達(dá)模式與mRNA存在負(fù)相關(guān)。Felicioni等[12]報(bào)道了ACTG2基因與豬繁殖性能有關(guān),MSTRG.14606是否能夠通過影響ACTG2表達(dá)量來影響蛋雞繁殖性能,MSTRG.14606和MSTRG.15311能否發(fā)揮分子海綿作用機(jī)制或是存在其他調(diào)控機(jī)制,仍有待于深入研究。
GO將采用lncRNA靶基因進(jìn)而對lncRNA功能進(jìn)行預(yù)測[13-14]。本研究發(fā)現(xiàn),lncRNA在心率調(diào)節(jié)、結(jié)構(gòu)分子激活、蛋白激酶結(jié)合、離子通道結(jié)合以及基底外側(cè)質(zhì)膜等通路中富集。蛋雞繁殖性能與多種因素有關(guān)。蛋白激酶激活通路中AMP激活的蛋白激酶與蛋雞生產(chǎn)性能、血液生化指標(biāo)等相關(guān)[15],提示被研究發(fā)現(xiàn)的差異表達(dá)lnRNA可能通過下丘腦軸調(diào)節(jié)性激素分泌從而影響蛋雞繁殖性能。細(xì)胞組分方面,基底外側(cè)質(zhì)膜位于前列,該成分與細(xì)胞代謝有關(guān),參與代謝物的轉(zhuǎn)運(yùn),對維持細(xì)胞穩(wěn)態(tài)發(fā)揮重要作用[16-17]。蛋雞繁殖過程中代謝活動旺盛,后續(xù)研究中,可圍繞lncRNA與蛋雞代謝過程的關(guān)系開展。KEGG通路側(cè)重分析基因產(chǎn)物及其在代謝途徑作用中的關(guān)系[18-19],本研究發(fā)現(xiàn)差異表達(dá)lncRNA的靶基因富集在與卵母細(xì)胞成熟有關(guān)的通路中。蛋雞性成熟過程中,卵黃前體物:極低密度脂蛋白VLDL和卵黃生成素VTG能夠經(jīng)由卵泡膜受體介導(dǎo)卵母細(xì)胞成熟[20]。這一過程受到多因素調(diào)節(jié),本研究發(fā)現(xiàn)的差異表達(dá)lncRNA可能通過調(diào)節(jié)相關(guān)基因表達(dá)參與到上述生物學(xué)過程中。兩種功能富集結(jié)果表明,lncRNA可能參與到蛋雞不同生長發(fā)育階段卵巢組織各種生物學(xué)途徑中,但是具體的作用機(jī)制仍有待于功能研究、體外試驗(yàn)等進(jìn)一步驗(yàn)證。
本研究表明,從20周齡和30周齡蛋雞卵巢組織篩選到了lncRNA,其轉(zhuǎn)錄組特征與mRNA存在差異,篩選獲得的差異表達(dá)lncRNA顯著富集在蛋雞繁殖性能相關(guān)的生物學(xué)過程,細(xì)胞組分,分子功能以及多種信號通路中。