李 雷, 王 悅, 李曉悅, 劉開平, 戴繼鴻, 李村院, 胡圣偉
(石河子大學生命科學學院,新疆石河子 832003)
綿羊由于其具有能夠為人們提供毛、皮、肉、奶等各類產(chǎn)品的優(yōu)勢,目前已成為我國乃至世界上具有重大經(jīng)濟價值的家畜動物之一[1]。同時,作為畜牧業(yè)大省,綿羊是新疆維吾爾自治區(qū)畜牧業(yè)發(fā)展的重要家畜之一,也是當?shù)啬撩竦闹饕杖雭碓碵2]。近些年,隨著經(jīng)濟的快速發(fā)展,人們對含有較高水平必需氨基酸和較低水平膽固醇的羊肉的需求愈來愈大。雖然我國是世界上最大的羊肉生產(chǎn)和消費大國,但與肉羊養(yǎng)殖業(yè)發(fā)達的國家相比,我國綿羊有羊肉品質(zhì)不高、產(chǎn)肉率低、生長速度慢等缺點,這均對我國綿羊養(yǎng)殖行業(yè)的可持續(xù)發(fā)展有著不可忽視的制約作用[3]。因此,選育出高產(chǎn)肉量和高肉質(zhì)性狀的肉羊品種是我國畜牧工作者不懈的追求。
骨骼肌是綿羊非常重要的器官,其良好的生長發(fā)育不僅保障了綿羊身體運動系統(tǒng)的正常運行,且是影響綿羊產(chǎn)肉量和產(chǎn)肉品質(zhì)的直接靶器官。因此,綿羊羊肉產(chǎn)量和品質(zhì)等經(jīng)濟性狀培育和改良研究的重點在于深入了解綿羊肌肉的發(fā)育過程。在肌肉發(fā)育過程中,骨骼肌細胞的增殖與分化起著近乎決定性的作用[4-5]。眾所周知,骨骼肌的發(fā)育和形成要經(jīng)過極其復雜的生物學過程,綿羊出生后肌肉的生長并不表現(xiàn)于肌纖維數(shù)量的增加,而在于肌纖維的變大、變粗[6]。簡單地理解,胎兒出生后,肌纖維的數(shù)量不會有凈增加,僅能在原有的基礎(chǔ)上使肌纖維變粗,所以胎兒期是骨骼肌發(fā)育的主要階段[7]。Scicchitano等研究表明,胰島素樣生長因子1在調(diào)節(jié)肌原細胞增殖,肌小管和肌纖維細胞的合成代謝和肌肉的再生中發(fā)揮著核心作用[8]。Youngson等研究表明,Pax3是肌肉早期發(fā)育過程中必須的調(diào)控因子,其表達可抑制肌肉的分化[9]。Cesana等報道了肌肉特異性長非編碼RNA linc-MD1在小鼠和人類成肌細胞中充當ceRNA來控制肌肉分化的時間,linc-MD1的下調(diào)會使肌肉分化程序延遲,而過表達與肌肉分化程序的預期相關(guān)[10],這些報道均為本次研究提供了重要的參考。
選取身處新疆高原牧場的哈薩克羊作為研究對象,該羊種具有耐低溫、產(chǎn)肉多、增膘快、體型大、耐粗飼等優(yōu)點,作為一種典型的肉脂兩用型綿羊在新疆被大量養(yǎng)殖。深入研究調(diào)控該綿羊骨骼肌發(fā)育過程中的調(diào)控基因有助于提高該羊的產(chǎn)肉量、改善肉質(zhì)。因此,本研究利用高通量測序結(jié)合生物信息學分析鑒定了哈薩克羊在胎兒期和成年期2個不同時期骨骼肌中差異表達的基因,旨在為深層次研究綿羊骨骼肌發(fā)育奠定基礎(chǔ)。
本項目于2021年10月在石河子大學生命科學學院完成,涉及動物的所有試驗程序均經(jīng)石河子大學動物衛(wèi)生委員會批準。本研究在石河子市屠宰場采集了3頭成年綿羊(母羊,2~3歲,體質(zhì)量50~55 kg)的背最長肌,同時,采集了3頭自然交配 110 d 后妊娠母羊的子宮,在無菌實驗室中解剖子宮取出胎兒。后快速在胴體的最后一個胸椎兩側(cè)取下約12 g背最長肌。所有樣品立即保存在不含RNA酶的超低溫保存管中,于液氮中迅速冷凍,之后保存于-80 ℃冰箱直至抽提RNA。
將冷凍的組織從-80 ℃冰箱中取出,于液氮預冷后的研缽中研磨,后將其置于新的不含RNA酶的凍存管中,使用Trizol抽提總RNA。提取的RNA純度和濃度使用RNA 6000 Nano kit進行檢測。每個樣品取等量的RNA制備材料,建庫時使用3個同一時期的樣本合并建庫[11]。接著使用Epicentre Ribo-zeroTMrRNA試劑盒去除樣本中的核糖體RNA。嚴格按照NEBNext UltraTM制備試劑盒說明書的步驟生成測序文庫。利用AMPure XP系統(tǒng)純化文庫片段,選擇長度為150~200 bp的cDNA片段。選擇后的cDNA使用USER酶處理長度,接著利用高保真DNA聚合酶、隨機引物進行PCR擴增。使用Agilent Bioanalyzer 2100系統(tǒng)進行文庫鑒定。最后使用Illumina Hiseq 2500平臺對制備好的文庫進行測序產(chǎn)生125 bp配對末端Reads用于后續(xù)分析。
為保證后續(xù)生物信息學分析的質(zhì)量,本研究使用FastQC軟件對下機的fastq格式的原始數(shù)據(jù)進行質(zhì)量控制。首先,去除包≥10%無法確定堿基信息的讀數(shù)、Phred評分<5%的讀數(shù)及含有接頭序列的讀數(shù),得到高質(zhì)量的清潔讀數(shù)用于后續(xù)分析。此外,利用FastQC軟件估測序列質(zhì)量的好壞(Q20值),對質(zhì)量進一步控制。使用Hisat2(v2.0.5)將清潔讀數(shù)比對到綿羊參考基因組,Cufflinks軟件將每個樣品比對上的讀數(shù)進行轉(zhuǎn)錄本的組裝來拼接轉(zhuǎn)錄物,使用Cuffmerge去除含有多條重復轉(zhuǎn)錄本的基因并選擇最長的一條轉(zhuǎn)錄本作為單基因簇,由此得到每個樣品的單基因簇集,并對其進行后期分析[12-14]。
轉(zhuǎn)錄本數(shù)據(jù)收集到后,使用Cuffdiff軟件進行定量并分析差異表達的基因,FPKM均一化處理測序深度和基因長度不同的碎片,對基因表達的信息進行量化[15]。使用DESeq2 R包(1.16.1)中的負二項分布模型計算差異表達的基因,且通過q值的閾值來調(diào)整P值,閾值控制在q<0.01和|log2(差異倍數(shù))|>1。
篩選出差異表達的基因后,使用GOseq R軟件包,利用超幾何檢驗P值,對這些基因進行GO富集分析,將其與GO數(shù)據(jù)庫中的各個類別進行映射,分析映射在生物學過程、細胞組分及分子功能的基因數(shù)目。P值經(jīng)過Bonferroni校正,校正后GO術(shù)語的P值<0.05,則認為是顯著富集[16]。Cluster Profiler R軟件包用于對差異表達的基因進行KEGG通路富集分析,同樣顯著富集的通路也通過超幾何檢驗,P<0.05被認為顯著富集。
為深入了解調(diào)控哈薩克羊骨骼肌發(fā)育的潛在主效基因,本研究使用轉(zhuǎn)錄組技術(shù)對胎兒期和成年期骨骼肌中的基因表達譜進行分析。使用Illumina HiSeq 2500對胎兒期和成年期哈薩克羊骨骼肌中基因的表達模式進行配對末端RNA測序??偟貋碚f,在本次轉(zhuǎn)錄組研究中,共獲得了206 390 670條原始序列。為保證生物信息學分析的準確性,使用FastQC對這些原始序列進行質(zhì)控,按照方法中所述的質(zhì)控流程處理后,用于后續(xù)分析的有199 001 830條清潔讀數(shù),數(shù)據(jù)有效率在96.4%以上。進一步對這些數(shù)據(jù)進行質(zhì)量評估,發(fā)現(xiàn)Phred數(shù)值>20的高質(zhì)量數(shù)據(jù)占總數(shù)的95.89%以上,GC含量占47.08%,結(jié)果表明測序質(zhì)量良好,可用于后續(xù)分析。
為計算每個基因的表達水平,本研究計算了參考序列的總讀數(shù)中清潔讀數(shù)映射的數(shù)量及其在清潔讀數(shù)中所占的百分比,包括多重映射和唯一映射的讀數(shù)。為消除基因長度和測序深度帶來的偏差,使用FPKM均一化mRNA的表達量。然后對胎兒期和成年期這2個不同時期樣本中基因的表達水平進行分析。由圖1-A可知,共有2 692個差異表達基因,其中,包含2 251個上調(diào)基因和441個下調(diào)基因。為從總體水平檢查2組樣品中基因表達的差異模式,使用2組樣本中差異表達的mRNA進行層次聚類分析,由圖1-B可知,雖未聚集在較明顯的大類上,但差異基因可粗略地分為8個小類。進一步分析2組中差異表達的基因,由表1可知,某些調(diào)控肌肉發(fā)育的基因在胎兒期高顯著表達。這些結(jié)果表明,肌肉中基因表達模式在胎兒期和成年期具有較大的差異,且兩者中差異最大的基因是調(diào)控肌肉發(fā)育的基因。
表1 哈薩克羊胎兒期和成年期骨骼肌中差異表達最顯著的前10個基因
為進一步理解差異表達基因的生物學功能,本研究使用GO和KEGG富集分析這些基因。GO注釋結(jié)果表明,差異表達的基因在360個GO術(shù)語中被顯著富集(P<0.05),其中,包含了275個生物過程、56個細胞成分和29個分子功能基因。其中,在前20個被顯著富集的術(shù)語中,有解剖結(jié)構(gòu)發(fā)育、發(fā)育過程、解剖結(jié)構(gòu)形態(tài)發(fā)生、細胞周期、微管細胞骨架組織等生物過程,也有綁定等分子功能;由圖2-A可知,蛋白質(zhì)細胞外基質(zhì)等細胞組分目錄被顯著富集(P<0.05)。結(jié)果表明,在綿羊骨骼肌發(fā)育的過程中可能涉及大量的細胞發(fā)育和細胞形態(tài)改變。
同時,本研究使用KEGG數(shù)據(jù)庫對這些差異基因進行富集分析其通過基因產(chǎn)物的功能及相互作用的網(wǎng)絡圖,以期進一步理解差異基因的生物學功能。由圖2-B可知,差異基因被顯著富集(P<0.05)的共有32個術(shù)語,其中,包含了ECM-受體相互作用、PI3K-Akt信號通路、細胞周期、p53信號通路、黏著斑、鈣信號通路、糖胺聚糖生物合成-硫酸肝素/肝素、間隙連接、PI3K-Akt信號通路、cGMP-PKG 信號通路和類固醇生物合成等能夠調(diào)控骨骼肌發(fā)育的信號途徑。
目前,隨著高通量測序技術(shù)的快速發(fā)展和成本的降低,該技術(shù)在家畜功能基因挖掘和優(yōu)良性狀遺傳基礎(chǔ)的研究中發(fā)揮著越來越多的作用。研究表明,利用轉(zhuǎn)錄組學手段可更加全面解析不同狀態(tài)或不同處理下差異性狀的調(diào)控基因,從而更容易揭示不同性狀背后的遺傳基礎(chǔ)[17]。J?ger等利用RNA-seq技術(shù)研究了骨折延遲愈合的羊模型,發(fā)現(xiàn)了調(diào)控羊骨愈合過程的關(guān)鍵基因,進一步減少了羊分子模型中基因序列限制的缺失[18]。Fan等通過研究與綿羊毛色相關(guān)的皮膚轉(zhuǎn)錄組特征,擴展本研究對羊皮膚生理學和黑色素生成的復雜分子機制的理解[19]。Kogelman等適應轉(zhuǎn)錄組學在綿羊中檢測到許多與肌肉和腸道寄生蟲抵抗相關(guān)的通路[20]。這些研究者使用轉(zhuǎn)錄組測序技術(shù)對綿羊不同性狀調(diào)控機制的解析豐富了本研究對這些性狀背后遺傳機制的認識,對綿羊的遺傳育種具有顯著的促進作用。然而,目前對于具有良好環(huán)境耐受性的哈薩克羊肌肉發(fā)育的分子調(diào)控機制仍不清楚。
作為哺乳動物最重要的器官,骨骼肌對動物的生理活動本身具有重要意義,同時這也是家畜動物優(yōu)質(zhì)蛋白質(zhì)的重要來源。骨骼肌的發(fā)育直接影響著家畜的產(chǎn)肉量和肉質(zhì),并且骨骼肌的發(fā)育主要是在胚胎期和胎兒期,因此,深入研究胎兒骨骼肌發(fā)育過程中的主效基因?qū)眠z傳育種的手段、選育優(yōu)質(zhì)高產(chǎn)的肉羊品種是必不可少的。本研究使用高通量測序技術(shù)在胎兒期和成年期哈薩克羊的骨骼肌中鑒定出了2 692個差異表達基因(P<0.05),結(jié)果也表明在胎兒期和成年期哈薩克羊骨骼肌中的基因表達模式有較大差異。進一步分析發(fā)現(xiàn),在這些差異表達的基因中骨膜蛋白、肌球蛋白輕鏈4、Rho GTPase激活蛋白36、支鏈氨基酸轉(zhuǎn)氨酶1、原纖蛋白2等在2組中的表達具有顯著差異,且均在差異最顯著的前10個基因中。進一步分析發(fā)現(xiàn),骨膜蛋白能夠支持肌生成和骨骼肌再生[21];肌球蛋白輕鏈4可結(jié)合鈣離子,促進肌肉發(fā)育并參與橫紋肌的收縮[22];Rho GTPase激活蛋白36是原性轉(zhuǎn)錄因子MyoG53的主要靶基因,在調(diào)控骨骼肌發(fā)育過程中發(fā)揮著重要的作用,并且該基因的表達受時間限制[23];支鏈氨基酸轉(zhuǎn)氨酶1能夠促進細胞增殖,并調(diào)控肌肉的發(fā)育和修復[24];原纖蛋白2缺失的小鼠中肌纖維的橫截面會降低,膠原蛋白的交聯(lián)水平也會降低[25]。此外,這5個基因均在胎兒期骨骼肌中高表達,表明這些基因在胎兒期綿羊骨骼肌中發(fā)揮了重要的調(diào)節(jié)作用。本研究結(jié)合這些基因的表達量和已知的功能推斷,這5個基因在調(diào)控哈薩克羊骨骼肌發(fā)育過程中發(fā)揮著主要的調(diào)節(jié)作用,盡管具體的機制還需要未來利用分子生物學手段進行進一步研究。
此外,利用GO注釋和KEGG富集分析的結(jié)果表明,大多數(shù)的基因涉及發(fā)育過程、微管發(fā)育、細胞周期等在發(fā)育過程中發(fā)揮重要調(diào)節(jié)作用的GO類別。同時,KEGG通路分析還顯示,差異表達的mRNA參與了與骨骼肌發(fā)育直接相關(guān)的信號通路,包括ECM-受體相互作用、PI3K-Akt信號通路、細胞周期、p53信號通路、黏著斑、鈣信號通路、糖胺聚糖生物合成-硫酸肝素/肝素、間隙連接、信號通路、cGMP-PKG信號通路和類固醇生物合成。ECM-受體相互作用信號通路參與了骨骼肌從胚胎階段到衰老的骨骼肌的發(fā)育,并且參與了骨骼肌祖細胞的成肌過程[26]。p53信號通路對于成肌細胞增殖和凋亡是必不可少的[27]。鈣信號通路控制肌肉發(fā)育,調(diào)控衛(wèi)星細胞對骨骼肌的貢獻[28]。骨骼肌中的cGMP-PKG信號通路和PI3K-Akt信號通路受營養(yǎng)調(diào)節(jié),有助于肌細胞的生長[29]。類固醇生物合成信號通路通過調(diào)節(jié)類固醇激素的生物合成,從而參與骨骼肌的生長、發(fā)育和成熟[30]。這些結(jié)論表明,綿羊骨骼肌的發(fā)育涉及多種生物途徑的共同調(diào)控。
總體來講,本研究利用RNA-Seq技術(shù)對哈薩克羊胎兒期和成年期骨骼肌進行了轉(zhuǎn)錄組測序,構(gòu)建了綿羊骨骼肌的表達譜,分析了胎兒期和成年期綿羊骨骼肌中差異表達的基因,其中,篩選到POSTN、MYL4、ARHGAP36、BCAT1、FBN25個基因潛在的調(diào)控哈薩克羊骨骼肌發(fā)育的主效基因。此外,這些差異基因主要集中在諸如ECM-受體相互作用、PI3K-Akt、鈣信號通路和類固醇生物合成等直接參與骨骼肌發(fā)育的信號通路中,這表明這些差異是調(diào)控綿羊骨骼肌發(fā)育的關(guān)鍵因素。此外,本研究仍存在局限性,未來可利用分子生物學方法揭示綿羊骨骼肌發(fā)育的分子機制、利用熒光定量PCR試驗驗證骨骼肌不同生長發(fā)育狀態(tài)下基因的表達量。